1.如何认识可视化? 图形总是比数据更加醒目.直观.解决统计回归问题,无论在分析问题的过程中,还是在结果的呈现和发表时,都需要可视化工具的帮助和支持. 需要指出的是,虽然不同绘图工具包的功能.效果会有差异,但在常用功能上相差并不是很大.与选择哪种绘图工具包相比,更重要的是针对不同的问题,需要思考选择什么方式.何种图形去展示分析过程和结果.换句话说,可视化只是手段和形式,手段要为目的服务,形式要为内容服务,这个关系一定不能颠倒了. 因此,可视化是伴随着分析问题.解决问题的过程而进行思考.设计和实现…
1.关于 StatsModels statsmodels(http://www.statsmodels.org)是一个Python库,用于拟合多种统计模型,执行统计测试以及数据探索和可视化. 2.文档 最新版本的文档位于: https://www.statsmodels.org/stable/ 欢迎关注 Youcans 原创系列,每周更新数模笔记 Python数模笔记-PuLP库 Python数模笔记-StatsModels统计回归 Python数模笔记-Sklearn Python数模笔记-N…
1.最优化问题建模 最优化问题的三要素是决策变量.目标函数和约束条件. (1)分析影响结果的因素是什么,确定决策变量 (2)决策变量与优化目标的关系是什么,确定目标函数 (3)决策变量所受的限制条件是什么,确定约束条件 最优化问题的建模,通常按照以下步骤进行: (1)问题定义,确定决策变量.目标函数和约束条件: (2)模型构建,由问题描述建立数学方程,并转化为标准形式的数学模型: (3)模型求解,用标准模型的优化算法对模型求解,得到优化结果: (4)模型检验,统计检验和灵敏度分析. 欢迎关注 Y…
1.什么是线性回归? 回归分析(Regression analysis)是一种统计分析方法,研究自变量和因变量之间的定量关系.回归分析不仅包括建立数学模型并估计模型参数,检验数学模型的可信度,也包括利用建立的模型和估计的模型参数进行预测或控制.按照输入输出变量关系的类型,回归分析可以分为线性回归和非线性回归. 线性回归(Linear regression) 假设样本数据集中的输出变量(y)与输入变量(X)存在线性关系,即输出变量是输入变量的线性组合.线性模型是最简单的模型,也是非常重要和应用广泛…
1.带有条件约束的最短路径问题 最短路径问题是图论中求两个顶点之间的最短路径问题,通常是求最短加权路径. 条件最短路径,指带有约束条件.限制条件的最短路径.例如,顶点约束,包括必经点或禁止点的限制:边的约束,包括必经路段或禁止路段:还包括无权路径长度的限制,即经过几步到达终点.进一步地,还有双目标限制的最短路径问题,求最短距离中花费最小的路线:交通限制条件下的最短路径问题,需要考虑转向限制和延误的约束. 求解带有限制条件的最短路径问题,总体来说可以分为两类基本方法:一类是基于不带限制条件的最短路…
1.SKlearn 是什么 Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包. Sklearn 主要用Python编写,建立在 Numpy.Scipy.Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能. Sklearn 包括六大功能模块: 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机).nearest neighbors(最近邻).random forest(…
1.背景知识 1.1 插值.拟合.回归和预测 插值.拟合.回归和预测,都是数学建模中经常提到的概念,而且经常会被混为一谈. 插值,是在离散数据的基础上补插连续函数,使得这条连续曲线通过全部给定的离散数据点. 插值是离散函数逼近的重要方法,利用它可通过函数在有限个点处的取值状况,估算出函数在其他点处的近似值. 拟合,是用一个连续函数(曲线)靠近给定的离散数据,使其与给定的数据相吻合. 因此,插值和拟合都是根据已知数据点求变化规律和特征相似的近似曲线的过程,但是插值要求近似曲线完全经过给定的数据点,…
1.读取数据文件 回归分析问题所用的数据都是保存在数据文件中的,首先就要从数据文件读取数据. 数据文件的格式很多,最常用的是 .csv,.xls 和 .txt 文件,以及 sql 数据库文件的读取 . 使用 pandas 从数据文件导入数据的程序最为简单,示例如下: (1)读取 .csv 文件: df = pd.read_csv("./example.csv", engine="python", encoding="utf_8_sig") # e…
1.NetworkX 图论与网络工具包 NetworkX 是基于 Python 语言的图论与复杂网络工具包,用于创建.操作和研究复杂网络的结构.动力学和功能. NetworkX 可以以标准和非标准的数据格式描述图与网络,生成图与网络,分析网络结构,构建网络模型,设计网络算法,绘制网络图形. NetworkX 提供了图形的类.对象.图形生成器.网络生成器.绘图工具,内置了常用的图论和网络分析算法,可以进行图和网络的建模.分析和仿真. NetworkX 的官网和文档 官网地址:https://net…
1.分类的分类 分类的分类?没错,分类也有不同的种类,而且在数学建模.机器学习领域常常被混淆. 首先我们谈谈有监督学习(Supervised learning)和无监督学习(Unsupervised learning),是指有没有老师,有没有纪委吗?差不多.有老师,就有正确解法,就有标准答案:有纪委,就会树学习榜样,还有反面教材. 有监督学习,是指样本数据已经给出了正确的分类,我们通过对正确分类的样本数据进行学习,从中总结规律,获取知识,付诸应用.所以,监督学习的样本数据,既提供了特征值又提供了…