首页> 中文学位 >线性模型中自变量相对重要性的Shapley值估计与有偏估计
【6h】

线性模型中自变量相对重要性的Shapley值估计与有偏估计

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

引言

1应用对策理论建立线性回归模型中自变量相对重要性估计方法

1.1多元线性回归模型

1.2对策理论引入

1.3自变量序列重要性偏R2值计算

1.4基于对策理论的自变量相对重要性的估计

1.5实例分析

1.6讨论

2多重共线性条件下线性回归模型中自变量相对重要性估计有偏估计的探索研究

2.1多重共线性的情形及处理

2.2偏最小二乘回归(Partial Least Square Regression,简称PLS)

2.3偏最小二乘回归模型中自变量相对重要性的实例分析

2.4实例分析

2.5模拟探索乘积尺度在偏最小二乘回归中自变量相对重要性的估计

2.6模拟结果

2.7讨论

3结论

3.1本研究的创新之处

3.2本研究的不足之处

参考文献

附录A 综述

在学研究成果

致谢

展开▼

摘要

研究目的:本研究共有两个目的:第一,研究线性回归模型因变量总变异(R2)在各个自变量中的分割问题(相对重要性估计)与对策理论中求解Shapley值的同构性以及自变量相对重要性估计的前提条件(期望准则),根据对策理论 Shapley值对自变量所有组合中逐步引入自变量时模型的R2增加值的序列与平均值,从而建立基于 Shapley值法的自变量相对性估计方法,并与几种现存方法进行比较。第二,考虑到当自变量间存在多重共线性时,用普通最小二乘法建立的回归模型可能不稳定甚至是失真的,那么估计自变量相对重要性也是多余的。因此,本研究分别用实际例子及大量模拟数据探索分析乘积尺度、相对权重在偏最小二乘回归模型中自变量相对重要性估计的应用。
  研究方法:对于第一个研究目的,本研究采用Shapley在1953年提出的对策理论法求解 Shapley值法对自变量相对重要性进行估计。对第二个目的,本研究采用乘积尺度法和相对权重法的思路,模拟试验数据采用Monte Calro法进行模拟。所有的计算结果利用SAS9.2编程实现。
  研究结果:用对策理论建立的自变量相对重要性分析方法在实际数据中估计的结果和优势分析一致,估计结果结果均优于传统的估计方法。在用实际案例探索分析偏最小二乘回归中自变量相对重要性发现,优势分析和 Shapley值估计法不适合用于有偏估计中,采用相对权重利用自变量正交转化的思路求解的自变量相对重要性结果也不符合自变量重要性求解的前提条件,故探索乘积尺度在偏最小二乘回归中自变量相对重要性的应用。大量的模拟数据结果发现,虽然乘积尺度估计的自变量相对重要性值之和能够较好地贴近模型总变异 R2,但是估计的结果仍然存在负值,且出现负值的情况随自变量的个数增多也在急剧增加。
  研究结论:对策理论的Shapley值法可以作为估计自变量相对重要性的方法,相比于其他方法,Shapley值不是一个探索式的理论方法而是基于四个公理推导且已经作为一个公理使用的方法。另外,Shapley值法对更加复杂的问题提供了一个比较接近实际的模型,原因是它比较和平均了自变量所有可能的子集构成模型的总变异 R2。在自变量间存在较高相关性时,首先用偏最小二乘法对回归模型进行修正,再用乘积尺度法估计自变量相对重要性时,估计的结果值仍会出现负值的情况,说明这种方法的使用仍存在缺陷。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号