【数学建模】预测模型 - 灰色模型
预测模型 - 灰色模型·
前言:
什么时候用灰度预测?
预测题目的套路
【数学建模】时间序列分析:指数平滑和ARIMA模型
时间序列分析
前言
很多人认为index{ARIMA-ETS equivalences}ARIMA模型相较于指数平滑模型(ETS)更为一般化,这其实是一个较为普遍的错误认识。虽然线性指数平滑模型其实都是 ARIMA 模型的特例,但是非线性的指数平滑模型在 ARIMA 模型中并没有对应的部分。另一方面,也有很多 ARIMA 模型不包含指数平滑的部分。二者还有一个重要区别:所有指数平滑模型都是非平稳的,而有些ARIMA模型是平稳的。
拥有季节性或者非衰减趋势的指数平滑模型拥有两个单位根(即它们需要进行两次差分来实现平稳),其他所有指数平滑模型只有一个单位根(它们需要一次差分来实现平稳)。
ARIMA模型提供了另一种时间序列预测的方法。指数平滑模型(exponential smoothing)和ARIMA模型是应用最为广泛的两种时间序列预测方法,基于对这两种预测方法的拓展,很多其他的预测方法得以诞生。与指数平滑模型针对于数据中的趋势(trend)和季节性(seasonality)不同,ARIMA模型旨在描绘数据的自回归性(autocorrelations)。
在引入ARIMA模型之前 ...
【数学建模】聚类模型 - DBSCAN
可视化网址
聚类可视化网址
DBSCAN
和其他算法的区别
K-means 和 系统算法是基于距离的
DBSCAN是基于密度的
优点
可以发现任意形状的簇
可以发现噪点
总结:
如果数据表现的很有形状就用DBSCAN
其他情况用系统聚类
K-means 论文上可以写的东西比较稀少
【数学建模】聚类模型 - K-means & 系统(层次)算法
聚类和分类的区别
聚类是不知道类别,自己分类
分类是已知类别的
聚类模型
K-means聚类
数据对象即样本
聚类中心即重心
PS:和我们初始化选择的中心有很大关系
如何写在论文里
因为算法步骤太长了,而且易被查重
因为算法太长了,放流程图:
优缺点:
改进 K-means++算法
K值这么定,量纲不一样怎么办?
不需要指定K的算法:系统(层次)算法
样本和样本直接的距离如何计算
样本和样本之间的距离
绝对值距离和欧式距离最常用
绝对值距离更多的用于网状数据
指标和指标之间的距离(不常用、用于指标分类)
类与类之间的距离
因为样本和样本被划分为不同的类,就被划分到不同的类了
组间、组内用的多
系统聚类的流程图
需要注意的问题:
有没有算法能帮助我们确定k的值:肘部法则
论文里如何解释?
【数学建模】分类模型
分类模型
线性概率模型LPM的问题
内生性问题
二点分布
求期望
值域为0~1的函数
一般用逻辑回归(因为简单
这里又是概率论的内容了,下面要求极大似然估计
预测结果很差怎么办?
因为是预测性回归,不是解释性回归
因此可以加入平方项、交互项
问题:过拟合
优化
机器学习
Fisher线性判别分析
不同超平面选取的差异
多分类问题:
多分类从1开始分类,二分类从0开始分类
以上两个方法均可以处理多分类问题
注意过拟合问题
【数学建模】数学规划模型 - 非线性规划 & 最大最小化问题
非线性规划
matlab 求解:
因为非线性规划对初始值很敏感
使用蒙特卡洛模拟方法(不是算法)获得初始值
写作技巧:
不同的算法有其名自的优缺点和适用情况,我们可以改变求解的算法来看求解的结量是否变好了。(这可以体现出稳健性,也是你的优点)
最大最小化问题
不就是二分吗?
PS:不是二分,因为这个函数可以是非线性函数,二分函数必须得单调
matlab求解
【数学建模】数学规划模型 - 线性规划 & 整数规划
数学规划模型
概述
线性规划问题求解(MATLAB):
代码:
不是所有线性规划都有唯一解
matlab 会返回其中的一个解
如果出现 > 和 < 怎么办
放松一下x≥0x \ge 0x≥0 变成 $ x > 0.0001$
整数规划
【数学建模】蒙特卡洛模拟
我的总结:
蒙特卡罗模型如果换一个名字就是计算机仿真,(计算机仿真现在的概念要大一点,可以理解为做大型工程的,两者不太一样,但在建模中类似)。
个人感觉也可以说蒙特卡洛模型是模拟退火、蚁群等算法的原型。
个人感觉这个经常放在论文的模型验证部分。
前言:
蒙特卡洛模拟实际上就是计算机仿真,它可以解决超级多的建模问题。
公众号:数学建模学习交流。
引例:布峰投针实验
蒙特卡洛概述:
蒙特卡洛是一个思想,而不是算法
建模里就不去别计算机仿真和蒙特卡洛模拟了
可以求规划问题
可能会陷入局部最优
应用:三门问题
模拟:排队论
【数学建模】多元线性回归模型 - 序
回归系数的解释:
什么时候取对数:
这个规定充满主观性,但是是专家给的,就专业了
四类模型回归系数解释:
特殊变量解释(定性变量):
定性变量 转化维 定量变量: 引入虚拟变量
多分类虚拟变量:
交互项:
例子:分析幼儿奶粉数据:
数据:
只有三个定量指标,其它都是定性指标
软件:
技巧:
比如商品量太多了,就不要做虚拟变量了
拟合度R2R^2R2很低怎么办?:
一般的时候我们更多的是解释性回归,不看重R2R^2R2了。预测性的我们用的别的模型(比如拟合来做)
标准化回归系数:
【数学建模】多元线性回归模型 - 一元线性回归
什么是回归分析?
相关性 ≠ 因果性
自变量Y:
自变量X:
回归分析的用处:
这里要注意,因为涉及到不同自变量的权重,所以一般要去量纲,不然没意义。
回归分析的分类:
多元线性回归:
不同数据的处理:
横截面数据:多元线性回归
时间序列数据:最常用的是ARMA
横截面数据:
时间序列数据:
面板数据:
数据的收集:
【简道云汇总】110+数据网站
虫部落数据搜索
【汇总】数据来源/大数据平台
大数据工具导航工具(http://hao.199it.com/)
数据平台
上面的数据多半都是宏观数据,微观数据市面上很少
大家可以在人大经济论坛搜索
一元线性回归:
一元线性回归和一元线性函数拟合区别:
定义不一样,本质是一样的
对线性的理解:
线性是对参数说的
回归系数的解释:
求系数很简单
这里的yiy_iyi的iii是对每个个体而言,也可以去掉,转换成对总体而言
内生性:
无偏性和一致性
uiu_iui是什么?
蒙特卡洛验证是否有内生性:
matlab:
降低内生性要求: