D题:operations research/network science 问题简介
今天我们首先介绍这道题常用的四种数学模型,分别是Programming数学规划、complex network复杂网络、Queuing排队论和Clustering聚类分析。
Programming 数学规划

2.需利用非线性刻画对限制条件或当前局势进行描述的优化问题
3.决策控制域离散且域中相邻两个元素间测度相等的优化问题
4.需在多个目标间进行权衡达到整体局势最优的优化问题
5.以时间划分阶段的动态过程的优化问题
建模步骤:
Step 1. 寻求决策,即回答什么?必须清楚,无歧义。
Step 2. 确定决策变量
第一来源:Step 1的结果,用变量固定需要回答的决策
第二来源:由决策导出的变量(具有派生结构)
其它来源:辅助变量(联合完成更清楚的回答)
Step 3. 确定优化目标
用决策变量表示的利润、成本等。
Step 4. 寻找约束条件
决策变量之间、决策变量与常量之间的联系。
第一来源:需求;
第二来源:供给;
其它来源:辅助以及常识。
Step 5. 构成数学模型
将目标以及约束放在一起,写成数学表达式。常见类型:
线性规划 (目标函数及约束条件均为线性函数)
非线性规划(目标函数或约束条件包含非线性函数)
整数规划 (决策变量部分或全部被限制为整数)
多目标规划 (具有多于一个的目标函数)
动态规划(把多阶段过程转化为一系列单阶段问题,逐个求解)
complex network 复杂网络
网络传播预测:流行病传播,金融风险传播,舆论传播;
网络关系渗透:节点之间的关系(三度影响);
关联交易分析及投融资黑洞:虚假交易,担保圈分析等。
基本概念
l节点、边
l关联与邻接
l度 k、平均度 <k>
l节点的度分布p(k)
l最短路径与平均路径长度(Dijkstra算法)
常用网络
ER模型:Erdös和Rényi (ER)最早提出随机网络模型并进行了深入研究,他们是用概率统计方法研究随机图统计特性的创始人。给定N个节点,没有边,以概率p用边连接任意一对节点,用这样的方法产生一随机网络。

当p等于1时,系统变为随机图。 <L>对数地随N增长而增长,且集聚系数随N减少而减少。
在p等于(0,1)区间任意值时,<L>约等于随机图的值,网络具有高度集聚性—小世界效应。
无标度(Scale-free)网络: 无标度模型由Albert-László Barabási和Réka Albert在1999年首先提出,现实网络的无标度特性源于众多网络所共有的两种生成机制:(ⅰ)网络通过增添新节点而连续扩张; (ⅱ)新节点择优连接到具有大量连接的节点上。
具有性质:度分布呈幂率分布、中枢节点出现、鲁棒性、脆弱性。
Queuing 排队论
主要流程
l 确定时间分布(到达时间和服务时间)
l 研究系统理论分布的概率特征
l 研究系统状态的概率
l 求解概率分布和特征数
l 指标优化与运营优化
排队模型
根据顾客到达和服务台数,排队过程可用下列模型表示:



Clustering 聚类分析
密度聚类 DBSCAN、OPTICS
网格聚类 STING
模型聚类 GMM
图聚类 Spectral Clustering(谱聚类)偏最小二乘回归
主要流程
1.对数据进行变换处理;(不是必须的,当数量级相差很大或指标变量具有不同单位时是必要的)
2.构造n个类,每个类只包含一个样本;
3.计算n个样本两两间的距离;
4.合并距离最近的两类为一新类;
5.计算新类与当前各类的距离,若类的个数等于1,转到6;否则回4;
6.画聚类图;
7.决定类的个数,从而得出分类结果。指标优化与运营优化
常见距离度量
