【数学建模】相关性分析 - 皮尔逊相关系数 & 斯皮尔曼相关系数
前言:
皮尔逊Person相关系 (要求数据满足正态分布
总体和样本
总体皮尔逊Person相关系数
一般说的相关系数就是皮尔逊相关系数
就是概率论的知识
消除量纲影响:
总体:
样本:
意义:
误区:
用于衡量线性
两个变量必须线性相关。
不是线性相关函数,不一样
总结:
例题:
MATLAB EXCEL SPSS都能做
MATLAB
SPSS
C(n,2) 的散点图可以用spss计算
假设检验:
概率论内容,考过的
对皮尔逊相关系数进行假设检验
条件:
第一步,第二步:
第三步:
第四步:
第五步:
更好用的方法:P值判断法
matlab:
spss
如何检验数据是不是正态分布:
正态分布JB检验(样本n>30)
matlab:
Shapiro-wikl检验:
Q-Q图(数据量非常大,不推荐用:
斯皮尔曼spearman相关系数(不要求正态分布
不要求是正态分布
第二种定义(matlab用的
MATLAB
斯皮尔曼 ...
【计算机组成原理】微命令 微操作 微指令 微程序
前言
复习机组的时候发现微命令、微指令、微操作、微程序、甚至控制信号这几个概念容易搞混。现在整理如下。
总结
微命令 -> 微指令 -> 微程序 A -> B表示由A组成B
控制部件通过控制线向执行部件发出各种控制命令,通常这种控制命令叫做微命令,是最小单位,组成微指令 。
在机器的一个CPU周期中,一组实现一定操作功能的微命令的组合,构成一条微指令
事实上一条机器指令的功能是由许多条微指令组成的序列来实现的。这个微指令序列通常叫做微程序。
微操作:指令执行时必须完成的基本操作。例如,PC→AR,PC+1→ PC,RAM→IR。
自己的理解
一条机器指令是由多个微指令组成的。这多个微指令序列又称作微程序。
一条微指令是由多个 微命令组成的。 微命令又称作控制信号, 微命令序列即控制信号序列。
微操作和微指令的区别(询问张瑞华老师得知):
一个微操作对应一条微指令,一条微指令可能有多个微命令。
微操作是动作,微指令是个编码。
微操作是微命令作用在硬件上的一个动作。课本上的微操作是在写指令流程时一条即一个箭头,这粒度比较粗。
...
【数学建模】拟合算法
前言:
拟合和插值的区别
插值要经过所有点
拟合不需要,只要这个曲线接近过所有点即可,只要保证误差足够小就可以。
最小二乘(老生常谈了
argargarg的意思是使我们函数最小的参数
如何评价拟合的好坏
选取多个函数求R2R^2R2
做一个取舍,不是次方越高越好,目的是让函数简单。
并不是所有的函数都有R2R^2R2,不是线性函数一般不能用。
什么是线性函数?(我们指的是对参数为线性,而不是对变量为线性)
计算R2R^2R2的代码
matlab 工具箱
点估计和区间估计
中心化
例题:
x=f(t)x=f(t)x=f(t)
这里R2R^2R2没有意义(不是线性函数
论文使用:
【数学建模】插值算法
前言
一维插值问题
最常见的就是分段插值
一般给n+1个点用n阶多项式
拉格朗日插值法:
缺陷:龙格现象
因此用分段插值
分段插值
拉格朗日插值、牛顿插值
牛顿插值和拉格朗日插值法都有龙格现象
埃尔米特插值法(重要)
最常用:分段三次埃尔米特插值和三次样条插值
分段三次埃尔米特插值
matlab 种 pchip 有现成函数
三次样条插值:
条件很苛刻
对比:
n维数据插值:
小技巧:可以预测
实例:
【数学建模】模糊综合评价模型
模糊综合评价模型
综合:多个指标,有多个权重
概述(引子
PS:量就是数字
模糊集合
经典集合:
特征函数?
模糊集合:
用隶属度来描述元素在不在集合里。
隶属函数充满随意性😁,没有约定俗成的方法,只要合理就可以了。
模糊集合的三种表示法(不重要
Zadeh 这里只是一种计发,数学意义不强。这样放便积分
第二种计法不方便表示无穷的集合
论域$\mho $可以是无限个元素
隶属函数的三种确定方法
虽然隶属函数充满随意性,但还是有三种方法的
模糊统计法(数模中用的很少
因为需要统计,所以数模不咋用。但是发论文就会用到了
借助已有的客观尺度
找到合适的指标
指派法(主观性强,但建模中80%都用这个)
用的比较多的是梯形分布
用的比较多的梯形分布
求出一个值在每一个等级的隶属度
应用:评价问题的概述
应用部分,符号发生了点变化,以这个为主。
因素集的nnn和评语集的mmm没有关系。
应用1:一级综合模糊评价模型:一个员工进行考核(隶属度采用:模糊统计法)
注意这个例子是对一个员工进行考核
一个员工有nnn ...
【数学建模】灰色关联分析
概述
进行系统分析和综合评价。
根据图形相似程度进行分析。(灰色系统是国内的人提出的,回归分析是国外人推荐的。)
步骤
步骤一:画统计图、进行一些简单的分析
用回归分析的多重共线性问题?
步骤二:确定分析序列
步骤三:对数据进行预处理(去量纲、简化计算)
步骤四:计算子序列和母序列的关联系数
注意分辨系数ρ\rhoρ
步骤五:计算灰色关联度
步骤六:看谁关联度最大
讨论:
灰色关联分析用于综合评价
AHP用于没有数据
TOPSIS用于有数据
灰色关联分析用于有数据
TOPSIS 确定熵权:
层次分析法(AHP
熵权法
灰色关联度(忽略掉,极少用)
步骤:
步骤二的预处理是灰色关联分析的预处理
matlab的技巧
归一化和标准化的区别
归一化:方便度量、方便分析
标准化:去掉量纲
【数学建模】熵权法
熵权法
问题的提出:层次分析法主观性太强
变异程度是方差(变化不大
如何衡量信息量的大小(为什么是方差?
信息熵:
熵权法的步骤
第一步:判断矩阵中是否有负数
第二部:计算概率(感觉有点问题,但大家都这样
第三步:计算信息熵,并归一化得到熵权
背后原理
熵权法和层次分析法
熵权法:
不一定太科学,值得商榷。
层次分析法:
专家赋权,太主观。
总结:
我觉得比赛可以俩都用,毕竟熵权法可以直接调用。
解决综合评价的 层次分析法和TOPSIS
熵权法可以用来给TOPSIS赋权
【数学建模】TOPSIS|优劣解距离法
TOPSIS
层次分析法的局限:
决策层不能太多
如果又数据已知,不能利用这些数据
问题的提出:
为什么要这样算:
为什么制表 要 max min
极大型(效益型)指标和极小型(成本型)指标:
统一指标类型
指标正向化(最常用)(PS:当然可以反过来
标准化(消去量纲):
如何计算:
看似麻烦,其实很简单。就是每取出每一列的最大值和最小值形成单独的向量Z+Z^+Z+ 和Z−Z^-Z−然后每一行去用欧式距离算量Di+D_i^+Di+ 和Di−D_i^-Di−
因此TOPSIS被称为优劣解距离法:
深入:TOPSIS
第一步:原始矩阵正向话
常见的四种指标
极小型到极大型
中间型到极大型
区间型到最大型
第二步:正向化标准矩阵(消除量纲影响
第三步:计算得分并归一化
为什么要归一化?
在基于梯度下降的算法中,使用特征归一化方法将特征统一量纲,能够提高模型收敛速度和最终的模型精度。
归一化目的就是将不同尺度上的评判结果统一到一个尺度上,从而可以作比较,作计算
矢量是归一化比较常见的使用场景。因为一般矢量只关心方 ...
【数学建模】排队论&层次分析法(AHP
排队论
这篇博客写的太好了,我就偷懒一点:
数学建模之排队论
排队论的一般模型:
这里要注意,分析清除排队论种的排队顾客具体是谁。19年国赛C的顾客就是汽车司机,不是乘客。
排队系统的组成和特征
一般的排队过程都由输入过程、排队规则、服务过程三部分组成
排队规则
排队规则指到达排队系统的顾客按怎样的规则排队等待,可分为损失制,等待制和 混合制三种.
损失制(消失制)。当顾客到达时,所有的服务台均被占用,顾客随即离去。
等待制。当顾客到达时,所有的服务台均被占用,顾客就排队等待,直到接 受完服务才离去。例如出故障的机器排队等待维修就是这种情况。
排队方式还分为单列、多列和循环队列。
服务过程
先到先服务 FCFS
后到先服务 LCFS (很少见)
排队模型的符号表示(直接复制了
排队模型用六个符号表示,在符号之间用斜线隔开,即 X/Y/Z/A/B/C 。第一 个符号 X 表示顾客到达流或顾客到达间隔时间的分布;第二个符号Y 表示服务时间的 分布;第三个符号Z 表示服务台数目;第四个符号 A是系统容量限制;第五个符号B 是 顾客源数目;第六个符号C 是服务规则, ...
【数学建模】2019国赛C
司守奎教授的讲解
核心:这题不应该往排队论和综合评价上靠,而应该进行机理分析,整个讲解过程没有用到高大上的模型,都是一步一步推到出来的。
第一问:
问题核心,考虑出租车的经济效益:
即考虑返回成本和等待时间
返回成本:
确定
等待成本:
排队等待的出租车数量
可能乘坐出租车的乘客数量
影响出租车效益的主要因素:
(1)空载成本 (2) 载客收益:
(3)乘客数:
**小tick:**这个 r(t)r(t)r(t) 是随意取得,经验函数。
N(t)N(t)N(t) 取什么也无所谓,80% 90% 100%都行,关键要有。
(4)出租车等待时间
可以考虑排队论,但注意是出租车在排队
如果想连续考虑,可以做个拟合,变成连续函数。也可以离散掉,以min为单位
做个假设,服务时间服从于负指数函数F(t)F(t)F(t)(小tick)
(基本的排队论模型是按照常数算的,效果差一点
这里的公式看似复杂,实则就是排队论的推到。而且式中大部分为常数,代入即可。
(5)等待成本
(6)空载的潜在损失
(7)决策准则
RRR 应该是基本成本(空载 ...