首页> 中国专利> VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

VANET中利用演化博弈来激励停靠车辆合作转发进行分析建模的方法

摘要

本发明属于移动通信技术领域,实现了一种在VANET中利用路边停靠车辆进行庞大的多媒体服务的方法。其特征是利用了演化博弈理论构建解决了停靠车辆不合作的情况。首先本发明将系统模型分为两种。第一种是将停靠车辆看做单群体,即单群体演化博弈模型。第二种是将停靠车辆和即走车辆看做两个群体,即多群体演化博弈模型。然后通过演化博弈理论得出本发明的复制动态方程。最后通过改变相关参数证明本发明所提出的基于演化博弈的激励机制是成功的。本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是有效的,通过分析论证都可以得到复制动态方程,解得进化稳定策略,并且分析了影响ESS的因素。

著录项

  • 公开/公告号CN104408306A

    专利类型发明专利

  • 公开/公告日2015-03-11

    原文格式PDF

  • 申请/专利权人 大连理工大学;

    申请/专利号CN201410683430.8

  • 发明设计人 吴迪;赵鑫;

    申请日2014-11-24

  • 分类号G06F19/00(20110101);H04L29/08(20060101);

  • 代理机构21200 大连理工大学专利中心;

  • 代理人李宝元;梅洪玉

  • 地址 124221 辽宁省盘锦市辽东湾新区大工路2号

  • 入库时间 2023-12-17 04:31:51

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-05-24

    授权

    授权

  • 2015-04-08

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20141124

    实质审查的生效

  • 2015-03-11

    公开

    公开

说明书

技术领域

本发明属于移动通信技术领域,涉及到在VANET(vehicle Ad Hoc Network, 车联网)中利用演化博弈理论的激励机制对路边停靠车辆的合作转发进行分析建 模的方法。给出了两种不同场景下构建演化博弈模型的方法,能够通过对成本 和收益的分析论证,保证路边停靠车辆都积极合作转发,为其余车辆提供多媒 体服务。

背景技术

在VANET中,通过RSU(Road Side Units,路侧单元)的设置来进行多媒体 服务是一种流行的方式,但是RSU设置花费较大,还有在RSU稀疏的情况下, 延迟也是不容忽视的。为此,研究人员通过基于V2V(Vehicle To Vehicle,车到车) 的通信来进行多媒体服务,但是VANET的这种高度移动性,间断性连接等独有 的特点,使得这种方式也不稳定。因此利用路边停靠车辆进行庞大的多媒体服 务倍加引起重视,场景如图1所示。

现阶段在VANET中对停靠车辆的研究主要存在的问题是着重研究怎么利 用停靠车辆或者是怎么管理停靠车辆进行多媒体的服务,假设停靠车辆都是积 极合作的。而没有考虑停靠车辆提供服务和接受消息都是要花费能量,正是这 种花费可能导致车辆不合作。也就是忽略了停靠车辆的自私性。例如:(1)在 城市场景的VANET中,把停靠车辆看成是静止的节点接入VANET(Nianbo liu, Ming liu,“PVA in VANETs Stopped Cars Are Not Silent”,2011,INFOCOM.)。(2) 一种管理停靠车辆的集群方法(Nianbo liu,Ming liu,“The sharing at roadside  Vehicular content distribution using parked vehicles”,2012,INFOCOM.)。(3)路 边停靠车辆的一个应用,利用路边停靠车辆及时发现在拐角处,被障碍物挡住 的车辆,有效的防止交通事故的发生(Huibin Feng,Shunyi Zhang,Chao Liu, Junrong Yan,Ming Zhang,“P2P Incentive Model On Evolutionary Game  Theory”,2008,WiCOM.)。

发明内容

本发明要解决的问题是在城市允许停靠车辆的道路中,在服务不对称的情 况下,通过演化博弈的方法,提出激励机制,激励停靠车辆合作转发,从而实 现所有停靠车辆都提供多媒体服务。

本发明的技术方案如下:

通过对路边停靠车辆的场景分析,得出此场景符合演化博弈的基本特征: 第一停靠车辆并不固定,它是随着时间变化的一个群体。第二影响停靠车辆选 择合作的因素并不唯一,同时通过演化过程可以达到一定的规律性。第三是停 靠车辆的选择过程,具有一定的惯性,也就是说通过博弈,当多次选择合作的 时候,以后都会合作。所以这里我们采用演化博弈的方法,来分析影响合作因 素的激励机制。本专利将影响合作因素归为两大类,一为成本,包括电量消耗、 电瓶损耗等。二为收益,包括个人声誉值、出行满意度等。通过对成本收益的 演化分析来激励停靠车辆积极合作。

本发明的具体步骤如下:

分为两种情况:第一种是停靠的车辆在一定时间内是静止的,也就是把停 靠车辆看成是密集、廉价、少资源的类似RSU。第二种是有些停靠车辆是在一 定时间内静止不动的,但是还有一部分车辆是即走的。

在这两种情况下,对第一种情况我们利用单群体的演化博弈(SCEGT)激 励机制,来激励停靠车辆的合作;对第二种情况我们利用多种群的演化博弈, 其中停靠的车辆为一个种群,即走的车辆为另外一个种群,提出一种多群体的 演化博弈(MCEGT)激励机制,激励其合作。

模型描述:

A系统模型

在VANET中,常常研究的是V2V以及V2R(Vehicle To Rode Side Unit)这两 种通信方式。常把VANET看作是车辆集合的网络,每辆车辆配备有通信设备, 允许不同车辆间的基于802.11p协议的通信。本发明中主要考虑的是V2V的通 信。特别地,是在城市中,允许停车的道路的场景下,移动车辆和停靠在路边 的车辆之间的通信。有两种通信模型:

第一种情况:路边停靠车辆是在一定时间内一直停靠。当车辆Vs要传递 大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内,并且道路上也没有移动 的车辆可以作为中间节点传输。那么就利用道路旁边停靠的车辆协助多媒体服 务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7,如图2所示。然后当车 辆Vd通过这些拥有资源的停靠车辆时,就会从这些车辆上下载自己满意的多媒 体资源,如图3所示。

第二种情况:路边停靠的车辆有的是长时间停靠的,有的是即走的。如图2 所示,当车辆Vs要传递大的多媒体文件给车辆Vd。Vd不在Vs的传输范围内, 并且道路上也没有移动的车辆可以作为中间节点传输。那么就利用道路旁边停 靠的车辆协助多媒体服务。车辆Vs将多媒体资源分发给停靠的车辆3,4,5,6,7。 当车辆Vd正在下载车辆6上的资源时,有停靠的车辆3要离开停靠车辆团体, 那么它就会把Vs传递给自己的多媒体服务,移交给停靠的邻居车辆2,然后离 开,如图4所示。当车辆Vd往前行驶,在从车辆2上下载所有的多媒体资源, 如图5所示。

停靠的车辆,虽然速度为0,但是内置的无线设备是开放的,可以允许所有 路过车辆接入。并且有充足的电源,使得停靠的车辆能够跟所有经过他的车辆 进行通信。在城市场景的VANET中,大量的停靠车辆,使得车与车之间资源传 输的有效性和传输成功率大大提高。

B、演化博弈模型

Smith结合了博弈理论中分析的动态演化过程来研究复杂系统,并首次提出 了演化博弈,同时他提供了一个工具来解释个体的组织关系。定义G={I,S,π}是 基本的演化博弈模型,其中I表示参与者集合,S表示参与者策略集合,π表示 参与者效用函数集合。演化博弈理论关键的概念是ESS。如果y≠x∈S,存在 满足等式:

u[x,εy+(1-ε)x]>u[y,εy+(1-ε)x]

这里x就是这个模型的ESS。

演化博弈论的核心理论有两个:即演化稳定策略、复制者动态方程。演 化稳定策略强调一个动态演化系统达到稳定状态的过程,演化稳定策略x*需要 满足如下两个条件:第一,x'=Ω(x*)=0;第二,Ω'(x*)<06复制者动态方程描 述采取变异的频数关于时间t的一个动态微分方程。用xi'=[φ(xi,x)-φ(x,x)]xi来表 示复制者动态方程,其中xi(t)采取纯策略的人占总人数的比例,φ(xi,x)为策略i 的适应度,φ(x,x)为平均适应度(JW Weibull,“Evolutionary game theory,”MIT  press,1995.)。

下面介绍演化博弈理论的标准设置(Sandholm,W.H.Population Games and  Evolutionary Dynamics[M].Forthcoming,MIT Press,Cambridge,2008.):

(1)有一个用户的种群。种群中的用户数量很大。

(2)假设有有限的纯策略或行为。种群的每个成员从同一个策略集合 Α={1,2,...,I}中选择策略。

(3)设为纯策略集合I上的概率分布集合。M可以 解释为混合策略集合。事实上,假设从种群中随机选择出的用户:使用标 记策略的参与者遇到使用策略j的参与者的概率是yj。几个博弈过程以后, 对于使用j的参与者等价于面对使用混合策略(y1,...,yI)的参与者。

为了使演化博弈更好的适应我们提出的模型,除了以上的基本假设以外, 本发明模型假设:

(1)考虑随机选择的用户的数量是随机变量K,K∈{0,1,...}。

(2)每个参与者不知道会有多少参与者与之竞争。

(3)路边停靠车辆和即走车辆电量是充足的,但是也是消耗的。

(4)每辆车辆都装有无线接入设备,并且是开放的。

下面是单群体的演化博弈(SCEGT)激励机制分析

A.SCEGT模型

我们考虑在第一种情况下,酒店路边停靠的车辆是长时间不移动的。那所有 的停靠车辆是一个团体。在这个团体中,因为两个博弈参与者的演化分析,最 终就代表整个团体的稳定状态。所以在单团体中,我们不考虑博弈参与者的数 量。又因为车辆都是静止的,所以车辆之间的连接概率都是1。

假设该团体,在每个固定的slot中,他们随机选择配对,策略空间是{0,1}, 策略0表示停靠车辆会给需要资源的路过移动车辆或者停靠车辆提供服务,同 时从他们那下载自己感兴趣的资源;策略1表示停靠车辆只从其他车辆上下载 自己喜欢的资源,不服务路过车辆或者停靠车辆。每个节点下载和提供服务都 是需要消耗一定能量的。因为车辆在停靠的时候,无线设备等开放是靠电量支 持的。

假设每个节点提供一个单元的多媒体服务得到的车辆收益是P,成本是d; 而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要的成本是c。 其中,P>R,d>c。因为接收到其他车辆的资源可能是对自己有用的,但也可能 没有任何价值,只是做了一个载体,那么收益R也就是很微小的。在单团体中, 路边停靠的车辆没有迁移发生,那么我们就假设每个车辆都是接收一个单元资 源,也是提供一个单元的多媒体服务。根据演化博弈规则,参与者j的收益矩阵 如下:

  选择0 选择1 选择0 R+P-c-d,R+P-c-d P-d,R-c 选择1 R-c,P-d 0,0

我们定义γ0(t)表示团体中选择策略0的节点数目。γ1(t)表示团体中选择策略1的 节点数目。那么得到公式(1)。

γ(t)=γ0(t)+γ1(t)   (1)

定义表示团体中选择策略0的比例,那么团体中选择策略1的比 例就是1-x(t)。

根据博弈矩阵,选择策略0的期望收益如公式(2)所示:

U0(t)=x(t)*(R+P-c-d)+[1-x(t)]*(P-d)   (2)

=x(t)*(R-c)+P-d

选择策略1的期望收益如公式(3)所示:

U1(t)=x(t)*(R-c)+[1-x(t)]*0   (3)

=x(t)*(R-c)

整个团体的平均收益如公式(4)所示:

U(t)=x(t)*U0+[1-x(t)]*U1=x(t)*(R+P-c-d)---(4)

B.动态复制分析

下面的复制动态指出了演化是如何发生动态变化的,特别是可以使用复制子 动态来动态收敛到均衡解。复制子动态描述了一个具有多种策略的种群的演化 过程,在种群中每个个体遵从以下模仿规则:即每次学习后,个体选择以正比 于收益之差的概率选择任意能够获得比自身更多的收益的策略。最终的动态是, 策略的分组在种群中增长的速率与该策略的收益与种群的平均收益之差成比 例。在动态演化博弈中,种群中的单个个体,能够通过变异和选择过程复制自 己的个体称作复制子。这种情况下,有较高收益的复制子能够快速复制它本身。 重复此博弈,并且在博弈演化的每代中,参与者观察同一种群中其他参与者的 收益,那么在下一次演化中,参与者就会选择具有较高收益当然策略。

我们假设每个阶段博弈是从kt,k∈N开始,在(k+1)t,k∈N结束。节点的平均 收益是与博弈对手有关的。假设在一个很小的时间间隔ε中,只有ε部分参与博 弈。那么由(Huibin Feng,Shunyi Zhang,Chao Liu,Junrong Yan,Ming Zhang,“P2P  Incentive Model On Evolutionary Game Theory”,2008,WiCOM.)我们可得,在时 间t+ε时的复制动态方程如公式(9)所示:

dx(t)dt=x(t)[U0(t)-U(t)]---(9)

也就是得到复制动态方程,如公式(10)所示:

dx(t)dt=x(t)[U0(t)-U(t)]=x(t)*[1-x(t)](P-d)---(10)

由以上分析得到定理1:在SMEGT激励机制作用下,ESS是存在的,并且只有 一个进化稳定策略。

证明如下:

根据上面提到的ESS满足的第一个条件,我们令dx/dt=0,即:

x(t)*[1-x(t)](P-d)=0。由于P-d在上面定义是大于0的,那么解得的稳定状态、 不动点仅有两个,也就是x(t)1=0,x(t)2=1。动态微分方程的相位图如图6所示。

令根据ESS满足的第二个条件,我们知道,在ESS处F(x)满足 的条件是:

F(x*)=0F(x*)<0那么,有以下分析:

假设有η比例的博弈方偏离了策略0而选择了策略1,那么有:

U0(t)=(1-η)*(R+P-c-d)+η*(P-d)=(1-η)*(R-c)+P-d

U1(t)=(1-η)*(R-c)+η*0=(1-η)*(R-c)

U(t)=(1-η)*U0+η*U1=(1-η)*(R+P-c-d)

U0(t)=(1-η)*(R-c)+P-d>0

所以x(t)2=1是演化稳定策略ESS。

假设有η比例的博弈方选择策略0而偏离策略1,那么有:

U0(t)=η*(R+P-c-d)+(1-η)*(P-d)=η*(R-c)+P-d

U1(t)=η*(R-c)+(1-η)*0=η*(R-c)

U(t)=η*U0+(1-η)*U1=η*(R+P-c-d)

U0(t)=η*(R-c)+P-d>U1(t)

所以x(t)1=0不是演化稳定策略。

综上,本模型中存在ESS,x*(t)=1,并且是唯一的ESS。

证毕。

下面是多群体的演化博弈(MCEGT)激励机制

A.MCEGT模型

在多群体演化博弈激励机制中,也就是系统模型中的第二种情况,有些停 靠车辆是在一定时间内静止不动的,但是还有一部分车辆是随时开走的。我们 考虑利用两个种群的演弈,长时间停靠的车辆为一个种群,即走的车辆为一个 种群,都作为激励对象,提出MCEGT激励机制,激励他们合作。

因为车辆是移动的,那么两个车辆之间的连接时间服从指数分布,其参数 λ>0,那么在时间τ内,两个车辆连接的概率为1-Qτ,其中Qτ如公式(11)所 示(Rachid El-Azouzi,F.D.Pellegini and V.Kamble,“Evolutionary forwarding  games in Delay Tolerant Networks,”in the Proceeding of WiOpt,pp.76-84,29 May-5June,Avignon,2010.)。

Qτ=(1+λτ)e-λτ   (11)

这个博弈中的种群就是两个团体。每个团体的节点数量是未知的,两个团 体中的个体可能在某一时刻成为对方团体中的成员。为了建立方程式,我们假 设团体Pop1和团体Pop2的节点数量分别是m和n。考虑各个团体的车辆在平 面的分布都服从泊松分布,参数是γ>0(Rachid El-Azouzi,F.D.Pellegini and V. Kamble,“Evolutionary forwarding games in Delay Tolerant Networks,”in the  Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010.)。那么在一次演化 博弈过程中,存在n个车辆的概率如公式(12)所示:

P(K=n)=γn-1(n-1)!e-γ,n1---(12)

团体1(用pop1表示)中都是停靠的车辆,pop1的策略空间是p1∈{0,1}。因 为我们要考虑两个团体的博弈,那么演化博弈是在车辆离开时开始的。所以在 这里pop1要与单团体的时候策略有变化。策略0表示接受离开车辆移交的资源。 策略1,不接受离开车辆的移交资源。团体2(用pop2表示)包含的是即走的车 辆,pop2的策略空间是p2∈{0,1}。策略0代表离开时移交资源给相邻车辆。策略 1代表车辆离开,车辆自私,不把资源移交给相邻的车辆。每个节点下载和提供 服务都是需要成本的。因为车辆在停靠的时候,无线设备等开放是靠电量支持 的。假设每个离开节点移交一个单元的多媒体服务得到的收益是P,需要成本是 d;而每个节点接收其他车辆的每个单元多媒体资源的收益是R,需要成本c。 本发明假设每个车辆上携带一个单元的资源。

因为在两个团体中,两个团体之间不存在竞争。所以在pop1中,如果其中 的节点采取策略0,那么它得到收益的概率是如公式(13)所示(Rachid El-Azouzi, F.D.Pellegini and V.Kamble,“Evolutionary forwarding games in Delay Tolerant  Networks,”in the Proceeding of WiOpt,pp.76-84,29May-5June,Avignon,2010):

P1(x,y)=(1-(1-)m)mx---(13)

同理,在pop2中,节点采取策略0的收益概率如公式(14)所示:

P2(x,y)=(1-(1-)n)ny---(14)

其中α=1-Qτ

在pop1中每个博弈参与者选择策略0的概率是x,在pop2中博弈参与者选 择策略0的概率是y。表示团体n在选择策略s时的期望收益。那么在pop1 中选择策略0的个体的收益可以用公式(15)计算:

U10(x,y)=y[RΣm=1P(K=m)P1(x,y)-c]---(15)

同理,在pop2中选择策略0的个体期望收益计算如公式(16)所示:

U20(x,y)=x[PΣn=1P(K=n)P2(x,y)-d]---(16)

在两个团体中,个体选择策略1的收益定义为:

在pop1中,采用策略0的节点比例是x,采取策略1的节点比例是1-x,那 么团体的平均效用函数如公式(17)所示:

U1=xU10(x,y)+(1-x)U11(x,y)=xy[RΣm=1P(K=m)P1(x,y)-c]---(17)

同理,团体Pop2的平均效用函数如公式(18)所示:

U2=yU20(x,y)+(1-y)U21(x,y)=xy[PΣn=1P(K=n)P2(x,y)-d]---(18)

B.复制动态分析

根据Simple SCEGT Incentive Mechanism中关于复制动态方程的分析可知, 演化博弈的复制动态方程可以用公式(19)表示:

dx(t)dt=x(t)[U0(t)-U(t)]---(19)

【把代入】那么两个团体的复制动态方程为为公式(20):

dxdt=x(U10(x,y)-U1)=x(1-x)U10(x,y)dydt=y(U20(x,y)-U2)=y(1-y)U20(x,y)---(20)

把公式(15)(16)带入公式(20)整理可得公式(21):

dxdt=xy(1-x)[R(1-e-xγα)-c]dydt=xy(1-y)[P(1-e-yγα)-d]---(21)

定理2:在MCEGT激励机制作用下,并且经过一定时间演化两个团体稳定到各 自的ESS。

证明如下:

根据动态复制方程满足条件得公式(22):

dxdt=0dydt=0---(22)

也就是如公式(23)所示:

dxdt=xy(1-x)[R(1-e-xγα)-c]=0dydt=xy(1-y)[P(1-e-yγα)-d]=0---(23)

根据上式,我们可以得到pop1和pop2的不动点如公式(24)(25)所示:

x1=0x2=1x3=-LambertW(-cαR)γα---(24)y1=0y2=1y3=-LambertW(-dαP)γα---(25)

其中LambertW是超越函数的反函数。

根据公式(21)的基本成立条件可知,x,y不能为0。那么x2=1和 x3=-LambertW(-cαR)γα是在一定条件下的稳定的ESS。因为x3=-LambertW(-cαR)γα是 受参数影响的,那么调整参数变化,是可以得到x2=1的结果,也就是说 包含了x2=1稳定ESS。所以我们可以用一个 表示pop1的稳定演化策略ESS。

同理,在pop2中,我们用来表示pop2的稳定演化策略 ESS。

综上,在MCEGT激励机制中,两个团体都有一个稳定的ESS,如公式(26) 所示:

x*=-LambertW(-cαR)γαy*=-LambertW(-dαP)γα---(26)

证毕。

本发明的效果和益处是证明了对路边停靠车辆基于演化博弈的激励机制是 有效的,通过分析论证都可以得到复制动态方程,解得进化稳定策略,并且分 析了影响ESS的因素。通过设置合适范围的参数在就会激励所有节点都合作。

附图说明

附图1是路边停靠车辆的示意图。

附图2是路过车辆Vs向路边停靠车辆3,4,5,6,7下传多媒体资源示意图。

附图3是路过车辆Vd接受路边停靠车辆3,4,5,6,7上多媒体资源示意图。

附图4是即走车辆3将得到的多媒体资源移交给邻居车辆2的示意图。

附图5是路过车辆Vd从车辆2上下载所有的多媒体资源的示意图。

附图6是单群体演化博弈中复制动态微分方程的相位示意图。

附图7是单群体演化博弈激励机制有效性的示意图。

附图8是在单群体演化博弈激励机制下改变停靠车辆起始参与比例x后,收 益和成本差值p-d保持不变,收敛速度逐渐加快的示意图。

附图9是在单群体演化博弈激励机制下停靠车辆起始参与比例x不变,改 变收益和成本的差值p-d后,差值越大收敛速度越快的示意图。

附图10是多群体演化博弈激励机制下给定所有参数后说明多群体演化博弈 激励机制有效性的示意图。

附图11(a)是在多群体演化博弈激励机制下给定P、d、c后,y稳定在0.225 的情况下,R值越大停靠车辆参与合作比例收敛速度越快的示意图。

附图11(b)是在多群体演化博弈激励机制下给定P、d、R后,y稳定在0.225 的情况下,c越大停靠车辆参与合作比例收敛速度越慢的示意图。

附图12(a)是在多群体演化博弈激励机制下给定R、c、d后,x稳定在0.6 的情况下,P越大即走车辆参与合作比例收敛速度越大的示意图。

附图12(b)的是在多群体演化博弈激励机制下给定R、c、P后,x稳定在0.6 情况下,d越大即走车辆参与合作比例收敛速度越慢的示意图。

具体实施方式

以下结合技术方案和附图详细说明本发明的实施例。

通过实例说明在本发明的方法下,设置合适的收益和成本就可以保证所有 车辆都会积极的合作转发。在系统模型描述部分可知P>R,d>c。

第一:单群体演化博弈激励机制

对于路边停靠车辆,在SMEGT激励机制分析结果下给出不同参数。当路 边停靠车辆起初只有x等于10%的比例提供多媒体服务,成本与收益的差值p-d 等于3固定不变时,随着时间的推移,所以停靠车辆都会选择策略0,如图7所 示,图7说明本发明中单群体演化博弈激励机制是有效的。

当停靠车辆起初参与提供多媒体服务的比例x分别为10%,20%,30%,40%, 50%,60%,70%,80%,90%,收益和成本的差值p-d等于3固定不变的情况 下,停靠车辆选择策略0的收敛速度逐渐加快,如图8所示,说明选择策略0 的起始比例越大,所有停靠车辆全部选择策略0所需的时间越短。

当停靠车辆起初参与提供多媒体服务的比例x为10%保持不变,而改变收 益和成本的差值,即p-d分别等于2,3,4,5,6,7,8,9,10的时候,通过图9可以看出, 差值越大,参与提供多媒体服务的停靠车辆比例越容易稳定到100%。

第二:多群体演化博弈激励机制

对于路边停靠和即走车辆,据车辆即走场景下MCEGT激励机制分析,设置 不同参数得出结果说明本发明中多群体演化博弈激励机制也是有效的。首先以 下值固定,即时间τ取值为1;相应的结果α=0.8009λ=3,γ=3.3。x和y初 始值固定为10%保持不变。

(1)当P=10,d=3.R=5,c=2时,代入公式(26),得到图10所示结果, 说明对于路边停靠和即走车辆的多群体演化博弈激励机制是有效的。

(2)当P=10和d=3的值不改变的时候,y的稳定态是0.225。X=0.1的初 值保持不变,在这种情况下

(a)当R=3.4.5.6.7.8.9,c=2,得出的结果如图11a所示,说明在pop2中 y稳定,pop1中c一定的情况下,收益R值越大,收敛速度越快,多群体演化 博弈中停靠车辆全部选择策略0的收敛速度越快。

(b)当R=8,c=1.2.3.4.5.6.7.8得出的结果如图11b所示,说明在pop2中y 稳定,pop1中R一定的情况下,消耗c值越大,收敛速度越慢,越不稳定,当 达到8时,pop1中,无人选择策略0。

(3)当R=5,c=2的值不改变的时候,x的稳定态是0.6。Y=0.1的初值保 持不变,在这种情况下。

(a)d=3P=10.12.14.16.18.20.22时,得出的结果如图12a所示,说明在pop1 中x稳定,pop2中d一定的情况下,收益P值越大,收敛速度越快,说明在多 群体演化博弈中即走车辆全部选择策略0的收敛速度越快。

(b)P=22,d=2.3.4.5.6.7.8时,得出的结果如图12b所示,说明在pop1中x 稳定,pop2中P一定的情况下,成本d值越大越不稳定,当达到8时,在pop2 中无人选择策略0。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号