技术领域
本发明属于出行行为建模领域,涉及一种基于最小二乘法的出行/活动行为选择模型参数标定方法。
背景技术
对居民的出行行为选择进行建模分析有助于精确估计城市不同时间不同区域的交通需求,为管理部门进行交通系统规划和交通系统管理提供理论依据。常用的行为选择模型可分为两类,一类是基于出行链的行为选择模型,代表方法为“四阶段”分析方法,以土地利用和交通系统相互作用关系为理论基础;另一类是基于活动的行为选择模型,该模型认为出行都是以活动为导向的,活动行为的价值影响了人的出行行为决策过程。进一步地,有研究人员提出了联合出行/活动行为选择模型,该模型可以更好地考虑出行者之间的联合决策对个人出行选择的影响。国内外的相关研究表明,联合出行/活动模型在数值上能够成功地模拟个体之间的联合出行/活动行为,在理论上可以证明该方法的有效性。但是,居民的出行行为选择模型的参数标定工作缺少标准的计算框架,在以往的工作中,模型的参数往往由经验丰富的工程师进行估计得到,这制约了不同出行行为选择模型的鲁棒性以及准确性,间接地影响了交通规划措施的实施效果。
最大似然估计是一种常用且有效的无偏估计方法,但是应用最大似然估计的前提是有足够数量的样本。而居民的出行/活动行为选择通常是由交通调查数据得到,受限于人力、物力,由交通调查所获得的数据量样本少,不支持最大似然估计方法。同时,由于交通网络的复杂性,即使有了足够数量的样本,采用普通计算机也无法在较短的时间内计算出最大似然估计的收敛值。综上所述,最大似然估计不适用于居民出行/活动行为选择模型的参数估计。为了填补研究空白,本发明提出了一种基于最小二乘的参数估计方法,并结合卡尔曼滤波技术,以最小化由采样误差引起的估计偏差,利用有限的样本值,高效地完成居民的出行/活动行为选择模型的参数标定工作。
发明内容
发明目的:为了克服现有研究的不足,本发明提供了一种基于最小二乘法的出行/活动行为选择模型参数标定方法。首先选择一种出行/活动行为选择模型对研究区域进行建模,通过问卷调查收集必备的研究数据。以观测值与模型计算值的离差平方和最小为优化目标,不断迭代搜索模型的参数取值,并融合卡尔曼滤波方法来削弱由于数据采样误差对模型精确度的影响。本发明提出的方法不仅可以快速有效的完成居民的出行/活动行为选择模型的参数标定工作,还可以进一步推广到其他模型的参数标定过程中。
技术方案:为实现本发明的目的,本发明所采用的技术方案是:本发明提供一种基于最小二乘法的出行/活动行为选择模型参数标定方法,该方法包括以下步骤:
(1)定义数据类型,进行预处理;
(2)以最小二乘法为核心,设计上层优化模型,求解出行/活动行为选择模型的参数最优估计;
(3)以交通分配为核心,设计下层优化模型,求解交通网络中的流量分布;
(4)采用模拟退火法求解该双层优化模型,得到参数的估计值;
(5)应用卡尔曼滤波器,对参数的估计值进行平滑,输出参数的最终标定值。
进一步的,所述步骤(1)定义数据类型,进行预处理的具体实施过程为:
11):定义参数标定模型的输入数据属性如下:
日期DATE:出行者的出行日期;
记录编号ID:唯一标识每一条数据;
出行者编号MSISDN:唯一标识每一位出行者;
出行者家庭成员编号HOUSEHOLD_MEM:标识出行者的家庭成员;
出行起点编号START_LOCATION:出行起点区域的编号;
出行终点编号END_LOCATION:出行终点区域的编号;
开始时间BEGIN_TIME:出行者出行的开始时间;
结束时间END_TIME:出行者出行的结束时间;
12):对数据进行预处理,提取居民的出行以及活动信息;
12.1):居民出行行为识别:用ind表示一位居民,IND表示所有居民的集合,在(11)所述的数据属性中,如果居民ind的某一次数据记录START_LOCATION!=END_LOCATION且BEGIN_TIME 12.2):居民活动行为识别:对于居民ind的出行记录集合Trip 13):居民的联合出行行为识别:如果居民ind的START_LOCATION和END_LOCATION与家庭成员mem的START_LOCATION和END_LOCATION相同,且abs(BEGIN_TIME 14):统计研究区域各路径的交通流量:一个出行起点与出行终点的组合称为出行路径,用符号p表示,研究区域中的所有路径集合记为P。指定日期内从某出行起点到出行终点的人数称为该路径的交通流量。将步骤12与步骤13中识别的出行行为与活动行为按照不同的出行路径p统计交通流量,研究区域内所有的交通流量总和为该区域的交通需求,用符号q表示。 进一步的,所述步骤(2)以最小二乘法为核心,设计上层优化模型,求解出行/活动行为选择模型的参数最优估计的具体过程为: 21):建立目标函数:记步骤(1)数据预处理后的研究区域的路网中路径p的交通流量为o
式中,min()为取最小值函数; 22):建立约束条件:目标函数中的变量f f o 进一步的,所述步骤(3)以交通分配为核心,设计下层优化模型,求解交通网络中的流量分布的具体实施过程为: 31):确定输入输出:下层优化模型的输入为待标定的出行/活动行为选择模型的参数X,研究区域的交通需求q;输出为研究区域交通网络中不同路径p的交通流量f 32):将步骤31中确定的交通出行需求q,利用出行/活动行为选择模型分配到研究区域路网中: 32.1):定义目标函数:假设所有居民均选择满意度最高的路径进行一次出行,居民选择路径p出行的满意度用符号
式中,
式中,a
式中,
该目标函数的物理意义为城市中所有的居民均选择满意度最高的路径进行出行或者活动; 33)定义约束条件,根据下层优化模型变量的物理意义,限制下层优化模型的约束条件为:
进一步的,所述步骤(4)采用模拟退火法求解该双层优化模型,得到参数的估计值的具体实施过程为: 41):上层优化模型求解; 41.0):算法初始化:设置算法退火温度T 41.1):下层优化模型求解,令计数器l=l+1,用公式
当G-value小于给定的阈值时,下层优化模型停止迭代,将此时的路网流量f 41.2):梅特罗波利斯准则: 41.21):如果△≤0,说明新的参数值X′可以使上层规划的目标函数值降低,令X=X′,m=m+1,转至步骤41.3,否则,转至步骤41.22; 41.22):令θ=exp(△/T 41.23):令m=m+1,N 41.3):退火:如果m 41.4):内循环终止判断:如果N 42):外循环终止判断:记RGAP为外循环的迭代误差,RGAP用下式计算:
如果RGAP<ε,ε为收敛精度,则外循环结束,输出此时的参数值X;否则转至步骤41.0。 进一步的,所述步骤(5)应用卡尔曼滤波器,对参数的估计值进行平滑,输出参数的最终标定值的具体实施过程为: 51):初始化:初始化步骤(4)计算得到的参数值X的观测误差W和系统误差V; 52):用误差更新待标定参数值:记i为迭代次数,将观测误差和系统误差纳入参数估计过程,用下式更新参数X的值: X X′ 式中,φ是状态转移矩阵,H是观测矩阵; 53):用协方差更新待标定参数值:记E E 54):计算待标定参数的卡尔曼增益:卡尔曼增益Kg的计算方法为: Kg 55):更新待标定参数的预测值:第i轮计算的参数值为X 有益效果:与现有技术相比,本发明的技术方案具有以下有益技术效果: (1)方法适用性强,可以应用于基于出行链的行为选择模型,基于活动的行为选择模型;联合出行/活动行为选择模型等; (2)考虑了最大似然估计方法的局限性,不需要大量的样本数据即可完成参数标定工作; (3)采用最小化计算流量与观测流量的离差平方和为目标函数,结合自定义约束条件,理论性强; (4)目标函数以及约束条件可以转化为标准的最小化问题形式,有通用的求解算法,执行效率高; (5)本方法与其他发明相比,涉及到的参数数量相对较少,鲁棒性好; (6)考虑了交通调查数据的采样误差问题,设计了一个卡尔曼滤波器来尽量削弱观测数据对模型准确度的影响。 附图说明 图1是本发明的方法流程示意图; 图2是本发明中研究区域的路网示意图; 图3是本发明中涉及的一种联合出行/活动行为模式示意图; 图4是本发明中涉及的一种联合出行/活动行为模式示意图; 图5是本发明中求解算法模拟退火法的内循环收敛情况图; 图6是本发明中求解算法模拟退火法的外循环收敛情况图; 图7是本发明中融合卡尔曼滤波后的参数估计效果图。 具体实施方式 附图仅用于示例性说明,不能理解为对本专利的限制。 对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。 下面结合实例和说明书附图对本发明作进一步的说明。 本发明提供一种基于最小二乘法的出行/活动行为选择模型参数标定方法,该方法包括以下步骤: (1)定义数据类型,进行预处理; (2)以最小二乘法为核心,设计上层优化模型,求解出行/活动行为选择模型的参数最优估计; (3)以交通分配为核心,设计下层优化模型,求解交通网络中的流量分布; (4)采用模拟退火法求解该双层优化模型,得到参数的估计值; (5)应用卡尔曼滤波器,对参数的估计值进行平滑,输出参数的最终标定值。 进一步的,所述步骤(1)定义数据类型,进行预处理的具体实施过程为: 11):定义参数标定模型的输入数据属性如下: 日期DATE:出行者的出行日期; 记录编号ID:唯一标识每一条数据; 出行者编号MSISDN:唯一标识每一位出行者; 出行者家庭成员编号HOUSEHOLD_MEM:标识出行者的家庭成员; 出行起点编号START_LOCATION:出行起点区域的编号; 出行终点编号END_LOCATION:出行终点区域的编号; 开始时间BEGIN_TIME:出行者出行的开始时间; 结束时间END_TIME:出行者出行的结束时间; 12):对数据进行预处理,提取居民的出行以及活动信息; 12.1):居民出行行为识别:用ind表示一位居民,IND表示所有居民的集合,在(11)所述的数据属性中,如果居民ind的某一次数据记录START_LOCATION!=END_LOCATION且BEGIN_TIME 12.2):居民活动行为识别:对于居民ind的出行记录集合Trip 13):居民的联合出行行为识别:如果居民ind的START_LOCATION和END_LOCATION与家庭成员mem的START_LOCATION和END_LOCATION相同,且abs(BEGIN_TIME 14):统计研究区域各路径的交通流量:一个出行起点与出行终点的组合称为出行路径,用符号p表示,研究区域中的所有路径集合记为P。指定日期内从某出行起点到出行终点的人数称为该路径的交通流量。将步骤12与步骤13中识别的出行行为与活动行为按照不同的出行路径p统计交通流量,研究区域内所有的交通流量总和为该区域的交通需求,用符号q表示。 进一步的,所述步骤(2)以最小二乘法为核心,设计上层优化模型,求解出行/活动行为选择模型的参数最优估计的具体过程为: 21):建立目标函数:记步骤(1)数据预处理后的研究区域的路网中路径p的交通流量为o
式中,min()为取最小值函数; 22):建立约束条件:目标函数中的变量f f o 进一步的,所述步骤(3)以交通分配为核心,设计下层优化模型,求解交通网络中的流量分布的具体实施过程为: 31):确定输入输出:下层优化模型的输入为待标定的出行/活动行为选择模型的参数X,研究区域的交通需求q;输出为研究区域交通网络中不同路径p的交通流量f 32):将步骤31中确定的交通出行需求q,利用出行/活动行为选择模型分配到研究区域路网中: 32.1):定义目标函数:假设所有居民均选择满意度最高的路径进行一次出行,居民选择路径p出行的满意度用符号
式中,
式中,a
式中,
该目标函数的物理意义为城市中所有的居民均选择满意度最高的路径进行出行或者活动; 33)定义约束条件,根据下层优化模型变量的物理意义,限制下层优化模型的约束条件为:
进一步的,所述步骤(4)采用模拟退火法求解该双层优化模型,得到参数的估计值的具体实施过程为: 41):上层优化模型求解; 41.0):算法初始化:设置算法退火温度T 41.1):下层优化模型求解,令计数器l=l+1,用公式
当G-value小于给定的阈值时,下层优化模型停止迭代,将此时的路网流量f 41.2):梅特罗波利斯准则: 41.21):如果△≤0,说明新的参数值X′可以使上层规划的目标函数值降低,令X=X′,m=m+1,转至步骤41.3,否则,转至步骤41.22; 41.22):令θ=exp(△/T 41.23):令m=m+1,N 41.3):退火:如果m 41.4):内循环终止判断:如果N 42):外循环终止判断:记RGAP为外循环的迭代误差,RGAP用下式计算:
如果RGAP<ε,ε为收敛精度,则外循环结束,输出此时的参数值X;否则转至步骤41.0。 进一步的,所述步骤(5)应用卡尔曼滤波器,对参数的估计值进行平滑,输出参数的最终标定值的具体实施过程为: 51):初始化:初始化步骤(4)计算得到的参数值X的观测误差W和系统误差V; 52):用误差更新待标定参数值:记i为迭代次数,将观测误差和系统误差纳入参数估计过程,用下式更新参数X的值: X X′ 式中,φ是状态转移矩阵,H是观测矩阵; 53):用协方差更新待标定参数值:记E E 54):计算待标定参数的卡尔曼增益:卡尔曼增益Kg的计算方法为: Kg 55):更新待标定参数的预测值:第i轮计算的参数值为X
机译: 根据历史交易活动进展预测消费者支出行为的系统和方法
机译: 根据历史交易活动进展预测消费者支出行为的系统和方法
机译: 一种基于移动通信活动的后备办公人员行为分析与确定的方法