技术领域
本发明涉及一种基于时序全局主成分的区域创新能力评价方法及系统。
背景技术
优化区域创新资源效率,提升区域创新能力,对于全面贯彻创新发展战略意义重大,区域创新能力的评价十分有必要。指标的选取和赋权方法对于评价结果有直接影响。目前针对区域创新能力的多指标评价体系通常存在指标重复冗余、指标权重计算复杂等问题,在指标构建方面,本发明基于区域创新能力的内涵(一般认为是指一个区域依托于内外部的创新环境将创新投入转化为创新产出的能力),从创新投入、创新产出、创新环境三个维度构建区域创新能力指标评价体系。
在指标权重计算方面,传统方法对含有时间序列数据源通过逐年进行计算导致指标权重不同,无法对整个时序的数据进行比较和评价。为确保评价结果的统一性、整体性和可比性,本发明使用时序全局主成分方法,从时间、空间、指标三个维度对时序数据源进行分析,从而可以描绘出数据源总体水平随时间的变化趋势,有效避免了传统方法由于样本数据的短期波动引起的评价结果的偏差。
发明内容
本发明的目的在于提供一种基于时序全局主成分的区域创新能力评价方法及系统。
为解决上述问题,本发明提供一种基于时序全局主成分的区域创新能力评价方法,包括:
S1:获取含有时间序列的数据源;
S2:基于含有时间序列的数据源构建指标层,形成初始样本集,基于初始样本集构建时序立体数据表;
S3:针对所述时序立体数据表进行主成分分析,以实现降维目的,生成高效样本集;
S4:基于所述高效样本集计算区域创新能力综合得分,得出评估模型。
进一步的,在上述方法中,基于含有时间序列的数据源构建指标层,包括:
基于含有时间序列的数据源,并根据创新资源投入能力、创新产出能力和创新环境支撑能力,构建所述指标层。
进一步的,在上述方法中,所述创新资源投入能力包括:每万人R&D人员、每万人口在校大学生数、研究与试验发展(R&D)经费支出占GDP比重、教育经费支出占GDP比重、科技经费支出占地方财政支出比重和规模以上企业研究与试验发展(R&D)经费内部支出占GDP比重。
进一步的,在上述方法中,所述创新产出能力包括:每万人发明专利申请量、每万人发明专利授权数;所述创新环境支撑能力包括人均GDP、第三产业占GDP比重、互联网宽带接入用户数、移动电话用户数、每百人公共图书馆藏书量、人均实际使用外资金额和人均进出口总额。
进一步的,在上述方法中,获取含有时间序列的数据源包括:通过互联网采集的与创新相关的数据作为含有时间序列的数据源,将含有时间序列的数据源作为初始数据源。
进一步的,在上述方法中,基于含有时间序列的数据源构建指标层,形成初始样本集,基于初始样本集构建时序立体数据表,包括:
将所述指标层作为指标评价体系,将指标评价体系的层次结构划分为“目标层-准则层-指标层”;
将初始数据源按照所述指标评价体系进行排列;
在T个时间点上,对n个地区和p个指标进行观测,则生成T个数据表,将T个数据表连接,以得到一个T
进一步的,在上述方法中,所述使用主成分分析法对时序立体数据表进行分析,以实现压缩降维目的,生成高效样本集,包括:
(一)将数据表Z-score标准化,如公式(a)所示;
公式(a)中,X’
(二)求解主成分,具体包括以下步骤:
S11:求解时序立体数据表的协方差矩阵V;
S12:求协方差矩阵的前m个特征值λ
S13:计算第k个主成分F
S14:设定主成分选取规则。
进一步的,在上述方法中,基于所述高效样本集计算区域创新能力综合得分,得出评估模型,包括:
根据主成分选取规则得到F
则综合得分为:
根据本发明的另一方面,还提供一种基于时序全局主成分的区域创新能力评价系统,包括:
①数据源采集模块,用于数据源收集、数据源预清洗、数据源管理;
②构建模块,用于构建指标评价体系;
③运算模块,用于采用时序全局主成分方法求解主成分和权重值;
④综合评价模块,用于根据所述指标评价体系和求得的主成分及权重加权得到评价模型,并根据评价模型评价待分析区域的创新能力。
⑤区域创新能力对比模块,用于不同区域的创新能力对比,并将结果反馈至外部。
与现有技术相比,本发明提供的一种基于时序全局主成分的区域创新能力评价方法及系统,具有以下有益效果:
(1)本发明提供的方法规避了传统评价方法只能采用截面数据而导致评价指标权重不同的弊端,保证了整个数据源的统一性、整体性和可比性,能够从时间、空间、指标三个维度描绘出数据源总体水平随时间的变化趋势,实现了不同维度的数据对比,为区域创新能力评价提供一种更为科学合理的方法。
(2)本发明提供的系统包括数据源采集模块,指标构建模块,运算模块,综合评价模块,区域创新能力对比模块,保证了数据源的统一口径,同时综合评价结果在区域内具有可比性,能够从时间、空间、指标三个维度直观反映区域创新能力的变化情况。
附图说明
图1是基于时序全局主成分的区域创新能力评价方法的流程框图;
图2是基于时序全局主成分的区域创新能力评价系统的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明提供一种基于时序全局主成分的区域创新能力评价方法,包括:
S1:获取含有时间序列的数据源;
S2:基于含有时间序列的数据源构建指标层,形成初始样本集,基于初始样本集构建时序立体数据表;
S3:针对所述时序立体数据表进行主成分分析,以实现降维目的,生成高效样本集;
S4:基于所述高效样本集计算区域创新能力综合得分,得出评估模型。
在此,本发明以期为区域创新能力的评价提供一种更为科学合理的方法。本发明规避了传统评价方法只能采用截面数据而导致评价指标权重不同的弊端,保证了整个数据源的统一性、整体性和可比性,能够从时间、空间、指标三个维度描绘出数据源总体水平随时间的变化趋势,具体方案为:一种基于时序全局主成分的区域创新能力评价方法,具体步骤如下:获取含有时间序列的数据源;构建指标层,形成初始样本集;构建时序立体数据表;使用主成分分析法对时序立体数据表进行分析,实现压缩和降维目的,生成高效样本集;计算区域创新能力综合得分,得出评估模型。
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,基于含有时间序列的数据源构建指标层,包括:
基于含有时间序列的数据源,并根据创新资源投入能力、创新产出能力和创新环境支撑能力,构建所述指标层。
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,所述创新资源投入能力包括:每万人R&D人员、每万人口在校大学生数、研究与试验发展(R&D)经费支出占GDP比重、教育经费支出占GDP比重、科技经费支出占地方财政支出比重和规模以上企业研究与试验发展(R&D)经费内部支出占GDP比重;
所述创新产出能力包括:每万人发明专利申请量、每万人发明专利授权数;所述创新环境支撑能力包括人均GDP、第三产业占GDP比重、互联网宽带接入用户数、移动电话用户数、每百人公共图书馆藏书量、人均实际使用外资金额和人均进出口总额。
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,获取含有时间序列的数据源包括:通过互联网采集的与创新相关的数据作为含有时间序列的数据源,将含有时间序列的数据源作为初始数据源。
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,基于含有时间序列的数据源构建指标层,形成初始样本集,基于初始样本集构建时序立体数据表,包括:
将所述指标层作为指标评价体系,将指标评价体系的层次结构划分为“目标层-准则层-指标层”;
将初始数据源按照所述指标评价体系进行排列;
在T个时间点上,对n个地区和p个指标进行观测,则生成T个数据表,将T个数据表连接,以得到一个T
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,所述使用主成分分析法对时序立体数据表进行分析,以实现压缩降维目的,生成高效样本集,包括:
(一)将数据表Z-score标准化,如公式(a)所示;
公式(a)中,X’
(二)求解主成分,具体包括以下步骤:
S11:求解时序立体数据表的协方差矩阵V;
S12:求协方差矩阵的前m个特征值λ
S13:计算第k个主成分F
S14:设定主成分选取规则。
完成以上步骤以实现数据源表压缩降维的目的,得到高效样本集。
本发明的基于时序全局主成分的区域创新能力评价方法一实施例中,基于所述高效样本集计算区域创新能力综合得分,得出评估模型,包括:
根据主成分选取规则得到F
则综合得分为:
本发明还提供一种基于时序全局主成分的区域创新能力评价系统,包括:
①数据源采集模块,用于数据源收集、数据源预清洗、数据源管理;
②构建模块,用于构建指标评价体系;
③运算模块,用于采用时序全局主成分方法求解主成分和权重值;
④综合评价模块,用于根据所述指标评价体系和求得的主成分及权重加权得到评价模型,并根据评价模型评价待分析区域的创新能力。
⑤区域创新能力对比模块,用于不同区域的创新能力对比,并将结果反馈至外部。
具体的,参照图1,一种基于时序全局主成分的区域创新能力评价方法,包括以下步骤:
S1:获取含有时间序列的数据源,数据源采集模块,用于数据源收集、数据源预清洗、数据源管理;
S2:构建指标层,形成初始样本集,构建时序立体数据表,构建模块,用于构建指标评价体系;
S3:针对通过S2获取的时序立体数据表进行主成分分析,以实现降维目的,生成高效样本集,运算模块,用于采用时序全局主成分方法求解主成分和权重值;
S4:计算区域创新能力综合得分,得出评估模型,综合评价模块,用于根据所述指标评价体系和求得的主成分及权重加权得到评价模型,并根据评价模型评价待分析区域的创新能力。
S5:区域创新能力对比模块,用于不同区域的创新能力对比,并将结果反馈至外部。
根据创新资源投入能力、创新产出能力、创新环境支撑能力构建所属指标评价体系。
创新资源投入能力包括每万人R&D人员、每万人口在校大学生数、研究与试验发展(R&D)经费支出占GDP比重、教育经费支出占GDP比重、科技经费支出占地方财政支出比重、规模以上企业研究与试验发展(R&D)经费内部支出占GDP比重;所述创新产出能力包括每万人发明专利申请量、每万人发明专利授权数;所述创新环境支撑能力包括人均GDP、第三产业占GDP比重、互联网宽带接入用户数、移动电话用户数、每百人公共图书馆藏书量、人均实际使用外资金额、人均进出口总额。
获取含有时间序列的数据源包括:通过互联网采集的与创新相关的数据作为初始数据源;
构建指标层,形成初始样本集,构建时序立体数据表包括:
将所述指标评价体系的层次结构划分为“目标层-准则层-指标层”;
将初始数据源按照所述指标评价体系进行排列;
在T个时间点上,对n个地区和p个指标进行观测,则生成T个数据表。将T个数据表连接可得到一个T
使用主成分分析法对时序立体数据表进行分析,以实现压缩降维目的,生成高效样本集包括:
(一)将数据表Z-score标准化,如公式a所示;
指标的标准差;通过此方式将所有数据的值映射到0至1之间;
(二)求解主成分,具体包括以下步骤:
S1:求解时序立体数据表的协方差矩阵V;
S2:求协方差矩阵的前M个特征值λ
S3:计算第k个主成分F
S4:设定主成分选取规则。
完成以上步骤以实现数据源表压缩降维的目的,得到高效样本集。
所述计算区域创新能力综合得分,得出评估模型包括:
根据主成分选取规则可得到F
则综合得分为:
实施例1
如图1所示,本实施例提供一种基于时序全局主成分的区域创新能力评价的方法,包括以下步骤:
获取含有时间序列的数据源;
构建指标层,形成初始样本集,构建时序立体数据表;
针对时序立体数据表进行主成分分析,以实现降维目的,生成高效样本集;
计算区域创新能力综合得分,得出评估模型。
本实施例中,通过互联网采集与创新相关的数据作为初始数据源。
作为本实施例优选的实施方式,本实施例根据创新资源投入能力、创新产出能力、创新环境支撑能力构建所属指标评价体系。其中创新资源投入能力包括每万人R&D人员、每万人口在校大学生数、研究与试验发展(R&D)经费支出占GDP比重、教育经费支出占GDP比重、科技经费支出占地方财政支出比重、规模以上企业研究与试验发展(R&D)经费内部支出占GDP比重;创新产出能力包括每万人发明专利申请量、每万人发明专利授权数;创新环境支撑能力包括人均GDP、第三产业占GDP比重、互联网宽带接入用户数、移动电话用户数、每百人公共图书馆藏书量、人均实际使用外资金额、人均进出口总额。
本实施例中,构建指标层,形成初始样本集,构建时序立体数据表包括:
将所述指标评价体系的层次结构划分为“目标层-准则层-指标层”;将初始数据源按照所述指标评价体系进行排列;在T个时间点上,对n个地区和p个指标进行观测,则生成T个数据表。将T个数据表连接可得到一个T
公式a中X’
本实施例中,针对时序立体数据表进行主成分分析,以实现降维目的,生成高效样本集包括:
将数据表Z-score标准化:计算公式如下:
公式中X’
求解时序立体数据表的协方差矩阵V,如公式所示:
V=(S
式中S
求协方差矩阵V的前M个特征值λ
设第h主成分为F
其中
在应用中,选取k个主成分,使其累积方差贡献率达到一定阈值,保证主成分从样本集中提取的数特征足够多,则所选的k个主成分代表了原始变量的绝大部分信息,实现了数据的压缩和降维目的,形成高效样本集。
本实施例中,根据所述指标评价体系和求得的主成分及权重加权得到评价模型,计算公式为
式中Q
具体的,选取包括上海、江苏、浙江、安徽三省一市共27个城市构成的长三角城市群为研究区域,对2010-2019年包含27城市在内的长三角城市群进行区域创新能力评价。本实施例通过互联网资源、统计年鉴等数据平台获取数据源,构建区域创新能力指标评价体系,如表1所示。
本实施例研究对象为长三角城市群27个城市,时间尺度为2010-2019年,评价指标共计15个,故可构建27×10×15的时序立体数据表,首先,对原始数据进行标准化处理。其次,对时序立体数据表求解主成分,获得各主成分对应的特征值、特征向量、方差贡献率和累积方差贡献率。可提取到3个特征值大于1的主成分,累积方差贡献率达到了71.270%,表明3个主成分包含了原始数据的大部分信息,结果见表2:
表2:因子载荷值
由表4知,根据长三角城市群科技创新能力因子载荷值的大小,将3个主成分分别命名:F1在X
进一步的,根据主成分对应的累积方差贡献率得到权重,构建综合评价得分模型:
F=71.3%×F1+18.9%×F2+9.8%×F3
将线性组合后的F1,F2,F3代入综合评价得分模型,即可得到区域创新能力评价结果,如表3所示:
表3:区域创新能力评价结果
总体来看,2010-2019年间长三角城市群创新能力呈现上升态势,且2010-2015年间增幅较大,创新能力综合得分均值由2010年的0.343上升至2015年0.475,增加约38.59%,而2019-2015年间增幅较小,综合得分由2015年的0.475上升至2019年0.505,增加仅约6.23%,表明2015年后长三角城市群创新能力提升幅度总体上呈现放缓迹象。
实施例2
与上述方法实施例相对应的,本实施例提供一种基于时序全局主成分的区域创新能力评价系统,包括:
数据源采集模块,用于数据源收集、数据源预清洗、数据源管理;
指标构建模块,用于构建指标评价体系;
运算模块,用于采用时序全局主成分方法求解主成分和权重值;
综合评价模块,用于根据所述指标评价体系和求得的主成分及权重加权得到评价模型,并根据评价模型评价待分析区域的创新能力。
区域创新能力对比模块,用于不同区域的创新能力对比,并将结果反馈至外部。
上述各模块具体功能已在实施例1中详细描述,此处不再赘述。
综上所述,本发明提供的一种基于时序全局主成分的区域创新能力评价方法及系统,具有以下有益效果:
(1)本发明提供的方法规避了传统评价方法只能采用截面数据而导致评价指标权重不同的弊端,保证了整个数据源的统一性、整体性和可比性,能够从时间、空间、指标三个维度描绘出数据源总体水平随时间的变化趋势,实现了不同维度的数据对比,为区域创新能力评价提供一种更为科学合理的方法。
(2)本发明提供的系统包括数据源采集模块,指标构建模块,运算模块,综合评价模块,区域创新能力对比模块,保证了数据源的统一口径,同时综合评价结果在区域内具有可比性,能够从时间、空间、指标三个维度直观反映区域创新能力的变化情况。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。
机译: 基于对主成分的最小距离搜索的方向寻找系统和方法
机译: 基于对主成分的最小距离搜索的方向查找系统和方法
机译: 基于主成分最小距离搜索的测向系统及方法