首页> 中国专利> 基于置信度水平和距离、响应于障碍物的自动驾驶车辆的延迟决策

基于置信度水平和距离、响应于障碍物的自动驾驶车辆的延迟决策

摘要

在一个实施例中,在控制自主驾驶车辆(ADV)期间执行过程。确定与感测到的障碍物相关联的置信度水平。如果置信度水平低于置信度阈值,以及ADV和与感测到的障碍物的潜在接触点之间的距离小于距离阈值,则延迟驾驶决策的执行。否则,执行驾驶决策以降低与感测到的障碍物接触的风险。

著录项

  • 公开/公告号CN112498365A

    专利类型发明专利

  • 公开/公告日2021-03-16

    原文格式PDF

  • 申请/专利权人 百度(美国)有限责任公司;

    申请/专利号CN202011205931.7

  • 申请日2020-11-02

  • 分类号B60W60/00(20200101);

  • 代理机构11201 北京清亦华知识产权代理事务所(普通合伙);

  • 代理人张润

  • 地址 美国加利福尼亚州桑尼维尔波尔多道1195

  • 入库时间 2023-06-19 10:18:07

说明书

技术领域

本公开的实施例总体上涉及操作自主车辆。更具体地,本公开的实施例涉及基于置信度水平和距离/响应于障碍物而做出延迟决策。

背景技术

以自主模式(例如,无人驾驶)操作的车辆可以减轻乘员(特别是驾驶员)免于某些与驾驶有关的责任。当以自主模式操作时,车辆可以使用车载传感器导航到各种位置,允许车辆在最少的人机交互、或者在某些情况下无需任何乘客的情况下行进。

在某些情况下,在自主驾驶车辆(ADV)的环境中感测障碍物(移动的或静止的),这可能需要ADV做出反应。例如,可以将诸如车辆的障碍物停在ADV前方或转弯进入与ADV相同的车道。ADV可以由于障碍物做出驾驶决策,诸如调整路径、减速或停车。然而,在某些情况下,不确定障碍物将移动到何处,或者障碍物是否确实存在。ADV可能受益于延迟此类反应,直到存在更多的确定性。

发明内容

在一个实施例中,本申请涉及一种操作自主驾驶车辆(ADV)的方法。该方法包括:响应于基于从一个或多个传感器获得的传感器数据检测到障碍物,确定障碍物的置信度分数,置信度分数表示关于障碍物的确定性的置信度水平;基于障碍物的潜在移动的预测,生成ADV的驾驶决策;响应于确定置信度分数低于预定置信度阈值以及ADV和障碍物之间的距离大于预定距离阈值,将执行驾驶决策延迟一段时间;以及响应于确定置信度分数不低于预设置信度阈值或者ADV和障碍物之间的距离不大于预定距离阈值,在没有延迟的情况下基于驾驶决策规划驾驶ADV的路径。

在另一个实施例中,本申请还涉及一种非暂时性机器可读介质,其中存储有指令。指令在由处理器执行时使处理器执行如上所述的操作自主驾驶车辆(ADV)的方法的操作。

在另一个实施例中,本申请还涉及一种数据处理系统。该系统包括:处理器;以及存储器,耦接到处理器以存储指令。指令在由处理器执行时使处理器执行如上所述的操作自主驾驶车辆(ADV)的方法的操作。

在另一个实施例中,本申请还涉及一种操作自主驾驶车辆(ADV)的设备。该设备包括:感知模块,用于响应于基于从一个或多个传感器获得的传感器数据检测到障碍物,确定障碍物的置信度分数,置信度分数表示关于障碍物的确定性的置信度水平;规划模块,用于基于障碍物的潜在移动的预测,生成ADV的驾驶决策;决策模块,用于响应于确定置信度分数低于预定置信度阈值以及ADV和障碍物之间的距离大于预定距离阈值,将执行驾驶决策延迟一段时间;以及响应于确定置信度分数不低于预设置信度阈值或者ADV和障碍物之间的距离不大于预定距离阈值,在没有延迟的情况下基于驾驶决策规划驾驶ADV的路径。

附图说明

在附图的图中以示例而非限制的方式示出本公开的实施例,在附图中,相似的附图标记指示相似的元件。

图1是示出根据一个实施例的联网系统的框图。

图2是示出根据一个实施例的自主车辆的示例的框图。

图3A-3B是示出根据一个实施例的与自主车辆一起使用的感知和规划系统的示例的框图。

图4示出根据一些实施例的用于延迟驾驶决策的执行的过程。

图5示出根据一些实施例的示出用于延迟驾驶决策的执行的过程的框图。

图6-7示出根据一些实施例的延迟驾驶决策的执行的示例。

具体实施方式

将参考下面讨论的细节来描述本公开的各种实施例和方面,并且附图将示出各种实施例。以下描述和附图是本公开的说明,并且不应被解释为限制本公开。许多具体细节被描述以提供对本公开的各种实施例的全面理解。然而,在某些情况下,为提供对本公开的实施例的简要讨论,没有描述公知的或常规的细节。

在说明书中对“一个实施例”或“实施例”的引用是指结合该实施例描述的特定特征、结构或特性可以被包含在本公开的至少一个实施例中。说明书中各个地方出现的短语“在一个实施例中”不一定都指相同的实施例。

从ADV的传感器生成描述障碍物的当前状态的数据,例如障碍物的速度、前进方向、加速度、位置或识别类型。可以针对障碍物(和/或相关联数据)计算置信度分数(也称为置信度水平),以对ADV在障碍物的预测路径中的置信度进行评分,和/或对感测障碍物的可靠度进行评分。

ADV可以响应于障碍物,使用一个或多个置信度分数来决定是否做出驾驶决策。例如,如果ADV具有障碍物将干扰ADV的路径的非常低的置信度,则ADV可能希望继续当前路径,而不是调整路径、减慢或停止,至少直到置信度较高。这可以避免不必要的延迟和对驾驶体验的干扰。然而,如果ADV由于低置信度分数而以随意的方式延迟对障碍物的响应,安全性可能成为问题。因此,期望解决由障碍物引起的安全问题,同时减少不必要的延迟和干扰驾驶体验。

根据一些实施例,可以在驾驶自主驾驶车辆期间执行确定与感测到的障碍物相关联的置信度分数的过程,感测到的障碍物诸如但不限于车辆(例如,汽车、卡车、摩托车或火车)、行人、杂物、树木、建筑物等。感测到的障碍物可能潜在地干扰ADV的当前路径。换句话说,ADV和障碍物之间存在潜在接触点。如果a)置信度分数低于置信度阈值,以及b)ADV和与感测到的障碍物的潜在接触点之间的距离低于距离阈值,则ADV可以延迟对障碍物的反应。否则,ADV可以对障碍物做出反应,例如,通过减慢、停止、超越障碍物或转向避开障碍物,以降低与感测到的障碍物接触的风险。

图1是示出根据本公开的一个实施例的自主车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地耦接到一个或多个服务器103-104的自主车辆101。尽管示出一个自主车辆,多个自主车辆可以彼此耦接和/或通过网络102耦接到服务器103-104。网络102可以是任何类型的网络,诸如局域网(LAN)、广域网(WAN)(诸如Internet、蜂窝网络、卫星网络的或其组合)、有线或无线的网络。服务器103-104可以是任何种类的服务器或服务器集群,诸如Web或云服务器、应用服务器、后端服务器或其组合。服务器103-104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器、或位置服务器等。

自主车辆是指可以被配置为处于自主模式的车辆,在自主模式下,车辆在很少或没有驾驶员的输入的情况下导航通过环境。这种自主车辆可以包括具有一个或多个传感器的传感器系统,一个或多个传感器被配置为检测关于车辆在其中操作的环境的信息。车辆及其相关联的(一个或多个)控制器使用检测的信息导航通过环境。自主车辆101可以在手动模式、完全自主模式或部分自主模式下操作。

在一个实施例中,自主车辆101包括但不限于感知和规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自主车辆101还可以包括包含在普通车辆中的某些通用组件,诸如引擎、车轮、方向盘、变速器等,其可以由车辆控制系统111和/或感知和规划系统110使用各种通信信号和/或命令来控制,诸如加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

组件110-115可以经由互连、总线、网络或其组合彼此通信地耦合。例如,组件110-115可以经由控制器局域网(CAN)总线彼此通信地耦合。CAN总线是一种车辆总线标准,其被设计为允许微控制器和设备在没有主机的应用中彼此通信。它是一种基于消息的协议,最初是为汽车内的多路电气布线设计的,但也用于许多其他情况。

现在参考图2,在一个实施例中,传感器系统115包括但不限于一个或多个相机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214、以及光检测和测距(LIDAR)单元215。GPS系统212可以包括收发器214,收发器214可操作以提供关于自主车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自主车辆的位置和朝向的改变。雷达单元214可以表示利用无线电信号感测在自主车辆的局部环境内的对象的系统。在一些实施例中,除了感测对象之外,雷达单元214可以附加地感测对象的速度和/或前进方向。LIDAR单元215可以使用激光感测自主车辆所处环境中的对象。LIDAR单元215可以包括一个或多个激光源、激光扫描仪以及一个或多个检测器、以及其他系统组件。相机211可以包括一个或多个设备以捕获自主车辆周围的环境的图像。相机211可以是静态相机和/或视频相机。相机可以例如通过将相机安装在旋转和/或倾斜的平台上是机械地可移动的。

传感器系统115还可以包括其他传感器,诸如声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器和音频传感器(例如,麦克风)。音频传感器可以被配置为从自主车辆周围的环境捕获声音。转向传感器可以被配置为感测方向盘的转向角、车辆车轮或其组合。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在某些情况下,油门传感器和制动传感器可以被集成为集成的油门/制动传感器。在一些实施例中,传感器系统的传感器(例如相机、扫描仪和/或检测器)的任何组合可以收集用于检测障碍物的数据。

在一个实施例中,车辆控制系统111包括但不限于转向单元201、油门单元202(也称为加速单元)和制动单元203。转向单元201用于调节车辆的方向或前进方向。油门单元202用于控制马达或引擎的速度,其又控制车辆的速度和加速度。制动单元203用于通过提供摩擦以减慢车辆的车轮或轮胎来使车辆减速。注意,图2中所示的组件可以以硬件、软件或其组合来实现。

再次参考图1,无线通信系统112用于允许自主车辆101与外部系统(诸如设备、传感器、其他车辆等)之间的通信。例如,无线通信系统112可以直接或者经由通信网络(诸如服务器103-104通过网络102)与一个或多个设备进行无线通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN),例如使用WiFi与另一个组件或系统进行通信。无线通信系统112可以例如使用红外链路、蓝牙等直接与设备(例如,乘客的移动设备、车辆101内的显示设备、扬声器)通信。用户接口系统113可以是在车辆101内实现的外围设备的一部分,包括例如键盘、触摸屏显示器、麦克风和扬声器等。

自主车辆101的某些或全部功能可以由感知和规划系统110控制或管理,特别是在以自主驾驶模式操作时。感知和规划系统110包括必要的硬件(例如(一个或多个)处理器、存储器、存储装置)和软件(例如,操作系统、规划和路线程序),以接收来自传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113的信息,处理接收到的信息,规划从起点到目的地点的路线或路径,然后基于规划和控制信息驾驶车辆101。可替换地,感知和规划系统110可以与车辆控制系统111集成在一起。

例如,作为乘客的用户可以例如经由用户接口指定行程的起始位置和目的地。感知和规划系统110获得行程有关的数据。例如,感知和规划系统110可以从MPOI服务器(其可以是服务器103-104的一部分)获得位置和路线信息。位置服务器提供位置服务,以及MPOI服务器提供某些位置的地图服务和POI。可替换地,这样的位置和MPOI信息可以本地缓存在感知和规划系统110的永久存储设备中。

当自主车辆101沿着路线移动时,感知和规划系统110还可以以从交通信息系统或服务器(TIS)获得实时交通信息。注意,服务器103-104可以由第三方实体操作。可替换地,服务器103-104的功能可以与感知和规划系统110集成在一起。基于由传感器系统115检测或感测的实时交通信息、MPOI信息和位置信息、以及实时本地环境数据(例如,障碍物、对象、附近车辆),感知和规划系统110可以规划最佳路线并且例如根据规划的路线经由控制系统111驾驶车辆101,以安全有效地到达指定目的地。

服务器103可以是为各种客户端执行数据分析服务的数据分析系统。在一个实施例中,数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各个车辆(自主车辆或由人类驾驶员驾驶的常规车辆)收集驾驶统计123。驾驶统计123包括指示发出的驾驶命令(例如,油门、制动、转向命令)以及由车辆的传感器在不同时间点捕获的车辆的响应(例如,速度、加速度、减速度、方向)的信息。驾驶统计123还可以包括描述不同时间点的驾驶环境的信息,诸如,例如路线(包括起点位置和目的地位置)、MPOI、道路状况、天气状况等。

基于驾驶统计123,机器学习引擎122出于各种目的生成或训练一组规则、算法和/或预测模型124。例如,算法124可以包括计算障碍物的当前状态的置信度分数、针对障碍物预测的轨迹以及轨迹的轨迹点的算法或功能,包括在某些情形下延迟某些决定,这将在下面进一步描述。然后可以将算法124上载到ADV上,以在自主驾驶期间实时使用。

图3A和图3B是示出根据一个实施例的与自主车辆一起使用的感知和规划系统的示例的框图。系统300可以被实现为图1的自主车辆101的一部分,包括但不限于感知和规划系统110、控制系统111和传感器系统115。参考图3A-3B,感知和规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306和路线模块307。

模块301-307中的一些或全部可以以软件、硬件或其组合来实现。例如,这些模块可以被安装在永久存储设备352中、被加载到存储器351中、并且由一个或多个处理器(未示出)执行。注意,这些模块中的一些或全部可以通信地耦合到图2的车辆控制系统111的一些或全部模块或与这些模块集成。模块301-307中的一些可以被集成在一起作为集成模块。

定位模块301确定自主车辆300的当前位置(例如,利用GPS单元212),并管理与用户的行程或路线有关的任何数据。定位模块301(也称为地图和路线模块)管理与用户的行程或路线有关的任何数据。用户可以例如经由用户接口登录并指定行程的开始位置和目的地。定位模块301与自主车辆300的其他组件通信,诸如地图和路线信息311,以获得与行程有关的数据。例如,定位模块301可以从位置服务器以及地图和POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务,并且MPOI服务器提供某些位置的地图服务和POI,其可以被缓存为地图和路线信息311的一部分。在自主车辆300沿路线移动时,定位模块301还可以从交通信息系统或服务器获取实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,由感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正在驾驶的车辆周围将会感知到的东西。感知可以包括车道配置、交通信号灯、另一车辆的相对位置、行人、建筑物、人行横道、或其他与交通有关的标志(例如,停车标志、让路标志)等,例如,以对象的形式。车道配置包括描述一个或多个车道的信息,诸如,例如车道的形状(例如,直线的或弯曲的)、车道的宽度、道路中有多少个车道、单向或双向车道、合并或拆分车道、出口车道等。

感知模块302可以包括计算机视觉系统或计算机视觉系统的功能,以处理和分析由一个或多个相机捕获的图像,以识别自主车辆的环境中的对象和/或特征。对象可以包括交通信号、道路边界、其他车辆、行人和/或其他障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪和其他计算机视觉技术。在一些实施例中,计算机视觉系统可以映射环境、跟踪对象并估算对象的速度等。感知模块302还可以基于由诸如雷达和/或LIDAR的其他传感器提供的其他传感器数据来检测对象。

对于每个对象,预测模块303预测在这种情形下对象将如何表现。根据一组地图/路线信息311和交通规则312,基于当时感知驾驶环境的感知数据进行预测。例如,如果对象是在相反方向的车辆并且当前驾驶环境包括交叉路口,则预测模块303将预测车辆将可能直行向前移动还是转弯。如果感知数据指示交叉路口没有交通灯,则预测模块303可以预测车辆可能必须在进入交叉路口之前完全停止。如果感知数据指示车辆当前位于只能向左转的车道或只能向右转的车道,则预测模块303可以分别预测车辆将更可能向左转或向右转。

在一些方面,预测模块至少在被认为与ADV的当前路径有关的区域中生成预测移动障碍物的路径的障碍物的预测轨迹。可以基于移动障碍物的当前状态(例如,移动障碍物的速度、位置、前进方向、加速度或类型)、地图数据和交通规则生成预测轨迹。

例如,ADV可以基于参考地图数据的障碍物的前进方向和位置将障碍物识别为被感测为在驾驶车道中行驶的车辆,地图数据包含车道位置和朝向,该车道位置和朝向基于障碍物的朝向和位置证实该障碍物似乎是在行驶车道上行驶。假设地图数据指示这是只能向右转的车道。根据交通规则(例如,在只能向右转的“车辆”类型的障碍物必须向右转),可以生成限定障碍物移动的轨迹。轨迹可以包含预测障碍物移动的线的坐标和/或数学表示。

在一些实施例中,当预测障碍物的移动轨迹时,预测系统或模块将障碍物的轨迹预测划分为两部分:1)纵向移动轨迹生成,以及2)横向移动轨迹生成。这些部分可以组合形成障碍物的预测轨迹。

在一些实施例中,生成横向移动轨迹(也简称为横向轨迹),包括使用第一多项式函数优化轨迹。生成纵向移动轨迹(也简称为纵向轨迹),包括使用第二多项式函数优化轨迹。基于a)障碍物的当前状态作为初始状态,以及b)障碍物的预测结束状态作为一组约束,执行优化以使轨迹至少与障碍物的当前前进方向平滑地对齐。根据预测障碍物在其上移动的车道的形状确定结束状态。一旦已经限定并生成了纵向移动轨迹和横向移动轨迹,就可以通过组合纵向移动轨迹和横向移动轨迹确定障碍物的最终预测轨迹。结果,基于障碍物的当前状态和车道的形状,障碍物的预测轨迹更加准确。

根据一些方面,基于感知数据预测障碍物从起点移动到终点,感知数据感知在车道内正在驾驶的ADV的周围驾驶环境。驾驶环境的边界取决于ADV各种传感器的范围,该范围可以变化。鉴于车道的形状,生成从起点到终点的纵向移动轨迹。生成从起点到终点的横向移动轨迹,包括使用第一多项式函数优化横向移动轨迹的形状。然后将纵向移动轨迹和横向移动轨迹组合形成预测障碍物如何移动的最终预测轨迹。生成路径以控制ADV根据障碍物的预测轨迹而移动,例如以避免与障碍物发生碰撞。

根据障碍物的当前前进方向,优化纵向移动轨迹和横向移动轨迹以生成平滑的轨迹。第一多项式函数包括五次多项式函数。在一个实施例中,在优化横向移动轨迹中,基于障碍物的当前状态(例如,位置、速度、前进方向)确定与障碍物相关联的一组初始横向状态(也称为横向初始状态)。还基于障碍物的当前状态确定一组结束横向状态(也称为横向结束状态)。初始横向状态和结束横向状态被用作待由第一多项式函数满足的一组约束,以优化横向移动轨迹。

根据一些方面,在优化纵向移动轨迹中,利用第二多项式函数,诸如四次多项式函数。基于障碍物的当前状态确定一组初始纵向状态和结束纵向状态(也称为纵向初始状态和纵向结束状态)。初始纵向状态和结束纵向状态被用作一组约束的一部分,用于使用第二多项式函数进行优化。

对于每个对象,决策模块304做出关于如何处理对象的决策。例如,对于特定的对象(例如,在交叉路线中的另一辆车)以及描述该对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何遇见该对象(例如,超车、让车、停止、经过)。决策模块304可以根据可以存储在永久存储设备352中的一组规则(诸如交通规则或驾驶规则312)做出这样的决策。

路线模块307被配置为提供从起点到目的地点的一条或多条路线或路径。对于例如从用户接收的从起始位置到目的地位置的给定行程,路线模块307获得路线和地图信息311,并且确定从起始位置到达目的地位置的所有可能的路线或路径。路线模块307可以为每条路线(其确定从起始位置到达目的地位置)生成地形图式的参考线。参考线是指一条理想的路线或路径,不受诸如其他车辆、障碍物或交通状况的其他因素的干扰。即如果道路上没有其他车辆、行人或障碍物,则ADV应该准确或密切跟随参考线。然后地形图被提供给决策模块304和/或规划模块305。根据由其他模块提供的其他数据(诸如来自定位模块301的交通状况、由感知模块302感知的驾驶环境以及由预测模块303预测的交通状况),决策模块304和/或规划模块305检查所有可能的路线以选择和修改最佳路线中的一条。用于控制ADV的实际路径或路线可能与由路线模块307提供的参考线接近或不同,这取决于当时的特定驾驶环境。

基于对感知到的每个对象的决策,规划模块305使用由路线模块307提供的参考线作为基础,为自主车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。即对于给定的对象,决策模块304决定如何处理该对象,而规划模块305确定如何进行该处理。例如,对于给定的对象,决策模块304可以决定经过该对象,而规划模块305可以确定是在该对象的左侧还是在右侧经过。规划和控制数据由规划模块305生成,规划和控制数据包括描述车辆300在下一移动周期(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米,然后以25mph的速度改变到右车道。

基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径,通过向车辆控制系统111发送适当的命令或信号,控制和驾驶自主车辆。规划和控制数据包括驾驶车辆沿路径或路线在不同时间点使用适当的车辆设置或驾驶参数(例如,油门、制动、转向命令)从路线或路径的第一点到第二点的足够的信息。

在一个实施例中,在数个规划周期(也称为驾驶周期)中执行规划阶段,诸如,例如以每100毫秒(ms)的时间间隔。对于每个规划周期或驾驶周期,将基于规划和控制数据发出一个或多个控制命令。即每100ms,规划模块305规划下一路线段或路径段(例如包括目标位置和ADV到达目标位置所需的时间)。可替换地,规划模块305还可以指定特定的速度、方向和/或转向角等。在一个实施例中,规划模块305为下一预定时间段(诸如5秒)规划路线段或路径段。对于每个规划周期,规划模块305基于在前一个周期中规划的目标位置,为当前周期(例如,接下来的5秒)规划目标位置。然后,控制模块306基于当前周期的规划和控制数据产生一个或多个控制命令(例如,油门、制动、转向控制命令)。

注意,决策模块304和规划模块305可以被集成为集成模块。决策模块304/规划模块305可以包括导航系统或导航系统的功能,以为自主车辆确定行驶路径。例如,导航系统可以确定一系列速度和定向的前进方向,以影响自主车辆沿着基本上避开感知到的障碍物的路径的移动,同时通常使自主车辆沿着通往最终目的地的基于道路的路径前进。可以根据经由用户接口系统113的用户输入来设置目的地。导航系统可以在操作自主车辆时动态地更新行驶路径。导航系统可以合并来自GPS系统的数据和一个或多个地图,以便确定自主车辆的行驶路径。

参考图4,示出在自主驾驶车辆(ADV)的驾驶期间执行的过程400。通过安全地延迟ADV对具有低置信度分数的障碍物的反应,这样的过程可以改善规划决策。在框402处,基于从一个或多个传感器(诸如上述的那些传感器)获得的传感器数据检测障碍物。检测可以由ADV的感知模块302和传感器系统115执行。障碍物可以包括诸如不限于其他车辆、行人、杂物、建筑物和骑自行车者等的对象。障碍物可以是静止或静态的障碍物(例如,停止的)或移动或动态的障碍物。

在框404处,过程包括确定与感测到的障碍物相关联的置信度分数。置信度分数可以是表示ADV对障碍物的感测的置信度的值,和/或在移动的障碍物的情况下,ADV对障碍物将移动到何处的置信度的值。该值可以是数字、百分比、符号、类别(例如,低、中、高)等。

对于静止的障碍物,置信度分数可以与障碍物的当前状态相关联。当前状态可以包括速度、前进方向、位置、加速度和/或类型(例如,车辆、行人、骑自行车者、树木、杂物等)。对于移动的障碍物,置信度分数可以与障碍物的预测轨迹相关联。预测轨迹的置信度分数表示ADV对障碍物将采用该特定轨迹的置信度。置信度分数可以基于其他部分中讨论的一个或多个因素确定。

在框406处,过程包括确定障碍物的置信度分数是否低于置信度阈值。如果障碍物的置信度分数低于阈值,其表明a)对障碍物的感测没有足够的置信度,或者b)对障碍物的预测轨迹没有足够的置信度,则该过程可以进行到框408。如果置信度分数满足置信度阈值,这向ADV表明障碍物可能会干扰ADV存在足够的置信度,在这种情况下,过程进行到框410。

在框408处,该过程包括确定ADV和与感测到的障碍物的潜在接触点之间的距离是否低于距离阈值(例如10米、15米、20米等)。距离和距离阈值可以是沿着在ADV和与障碍物的潜在接触点之间的ADV的路径的长度的量度。

对于移动的障碍物,可以基于障碍物轨迹和ADV的路径交点(或彼此接近的阈值内)的位置确定潜在接触点。对于静止的障碍物,潜在接触点是感测到的障碍物所在的位置。可以通过常规测试、模拟和/或实验确定距离阈值以降低接触风险(例如,基于ADV的减速、转向和制动能力)。在一些实施例中,如在其他部分中所讨论的,距离可以基于诸如ADV的速度和/或移动的障碍物的类型的不同因素而变化。换句话说,基于不同情形,可以应用不同的距离阈值。

如果距离低于距离阈值,则过程进行到框412。如果否,则过程进行到框410。因此,框408在延迟驾驶决策的执行时提供安全性。例如,即使当ADV对感测到的障碍物将干扰ADV具有低置信度(例如,低于置信度阈值)时,ADV仅直到与感测到的障碍物相距距离阈值或在预期接触区域内,延迟驾驶决策。在这点上,即使置信度低,偏于谨慎,ADV可以做出驾驶决策(例如让路、停止、转向避开或超车)。

在框410处,过程包括执行驾驶决策以降低与感测到的障碍物接触的风险。例如,ADV可以让路(例如,减速和/或制动)以允许移动的障碍物经过ADV,从而降低ADV与障碍物之间接触的风险。在某些情况下,例如,当接触的风险紧近ADV时(例如0-10米),和/或当ADV无法安全调整其自己的路径时,ADV可能会停止(例如制动、或减速并刹车)。在其他情况下,驾驶决策可以包括通过使ADV转向避开障碍物调整ADV的路径。例如,ADV可以通过改变车道或略微转向偏离车道但保持在同一车道中以避开障碍物,来调整其当前路径。在一些其他情况下,ADV可以决定超越移动的障碍物。这可能涉及加速,使得ADV在障碍物到达之前安全地经过潜在接触区域,从而避免接触的风险。

在框412处,系统将延迟驾驶决策的执行,而不是执行决策。系统可以延迟决策的执行直到随后的驾驶周期。在随后的驾驶周期中,该过程可以通过在框402处感测障碍物、在框404处确定感测到的障碍物的新置信度分数等进行重复。换句话说,该过程可以周期性地重复(例如,每个驾驶周期或每几个驾驶周期)。

在某些情况下,如果障碍物的置信度分数低,过程可以在将来的驾驶周期中确定障碍物确实不存在,这可能是由阻塞和/或错误识别引起的。在这种情况下,将不需要驾驶决策。

在其他情况下,随着ADV沿其路径移动得更远,障碍物的置信度分数可能增加,例如,感测到的数据可能会更加肯定地识别障碍物。在移动的障碍物的情况下,例如由于前进方向、速度、障碍物的加速度和/或障碍物的类型,障碍物的轨迹在随后的驾驶周期中可以变得更加明显。一旦置信度分数满足置信度阈值,ADV可以执行驾驶决策。然后由发生多少个a)置信度分数低于置信度阈值,以及b)ADV与感测到的障碍物之间的距离低于距离阈值的驾驶周期来决定从初始感测到障碍物的总时间延迟。

应当理解的是,框406和408不必以这种顺序执行,例如,框408可以在框406之前或同时执行。在如果a)置信度分数低于置信度阈值,以及b)ADV和与感测到的障碍物的潜在接触点之间的距离低于距离阈值的任一情况下,则过程延迟驾驶决策的执行(在框412处)。否则,如果满足任一阈值,则过程执行驾驶决策以降低与感测到的障碍物接触的风险(在框410处)。

现在参考图5,示出描述一些实施例中(图4的)过程400的特征的流程图。在感知模块302处,由传感器系统115感测障碍物501。置信度分数与该障碍物相关联。

在一些实施例中,与障碍物相关联的置信度分数是当前状态置信度分数,其指示被称为障碍物的“当前状态”的数据集合的置信度分数。当前状态可以包括移动障碍物的速度、位置、前进方向、加速度和/或类型(在这种情况下为车辆),基于传感器数据和解释传感器数据的算法生成该数据。可以基于多种因素确定与当前状态相关联的置信度分数。在一些实施例中,基于ADV和移动的障碍物之间的距离确定当前状态的置信度分数,该距离由传感器系统确定。障碍物越远,对障碍物感测的置信度越少。因此,尽管传感器系统115的传感器可能似乎感测到障碍物,当障碍物相对较远(例如30-50米)时,距离因素可能会降低当前状态的置信度分数。随着障碍物和ADV之间的距离缩小,障碍物的置信度分数可以增加,因为传感器离障碍物较近,并且因此感测到的数据可能更可靠。

在一些实施例中,基于对象识别精度确定与障碍物(例如,障碍物的当前状态)相关联的置信度分数。例如,对象识别块502可以利用计算机视觉和机器学习算法(诸如已经用数据集训练的已训练神经网络),以识别不同类型的障碍物,诸如车辆、行人、骑自行车者、建筑物、树木或杂物。例如,可以在对象识别块502处处理由传感器系统115感测到的图像,以识别图像中的移动的障碍物,诸如车辆(汽车、摩托车、卡车等)、行人或骑自行车者。然而,对象识别并不完美。取决于图像的清晰度或基于过去的训练数据集如何识别障碍物的形状,对象识别块可以确定在那些图像中对象的识别有多可信或多可靠的分数。分数可以帮助确定对象的识别是真肯定还是假肯定。可以利用神经网络API(例如Tensorflow对象检测API)提供各种表示对象识别的可信度的可靠性指标(例如PASCAL VOC 2010检测指标、加权PASCAL VOC检测指标、PASCAL VOC 2010实例分段指标、COCO检测指标、COCO掩码指标、开放性图像V2检测指标等)。

在一些实施例中,基于ADV的一个或多个传感器与感测到的障碍物之间的视线是否被至少部分遮挡确定置信度分数。例如,图6示出沿路径行驶的ADV 602。对象(例如,树木、建筑物、其他车辆、邮箱、杂物等)可以部分地遮挡障碍物604。移动的障碍物的遮挡可以影响对象识别指标。作为对象识别指标的补充或替代,如果被至少部分地遮挡,对象识别块702可以将惩罚添加到与移动的障碍物相关联的置信度分数。取决于遮挡的量可以增加或减少惩罚(例如,遮挡越多,惩罚越高)。因此,随着遮挡增加,当前状态的置信度分数减小,反之,随着遮挡减小,当前状态的置信度分数增加。

在一些方面,与障碍物相关联的置信度分数进一步基于移动的障碍物的类型确定,例如,车辆、行人或骑自行车者。基于不同类型的障碍物,可以认为当前状态信息的感测更加可靠。例如,由于车辆和行人或骑自行车者的尺寸、可检测表面和速度差异,感测车辆的前进方向、速度和位置的传感器信息可以被认为比感测行人或骑自行车者的前进方向、速度和位置的传感器信息更准确。ADV可能需要多个帧确定前进方向、速度和/或加速度。车辆可能趋于从一帧到下一帧具有更恒定的前进方向、速度和加速度,因此使前进方向信息比行人的前进方向信息更可靠。

应该理解的是,在整个本公开中,上述因素(例如,ADV与障碍物之间的距离、对象识别指标、遮挡、或障碍物的类型)可以增加或减少与移动或静止的障碍物相关联的置信度分数。可以通过例如加、减、乘和/或除的算术应用这些因素以增加或减少置信度分数。如所讨论的,当前状态和相关联的置信度分数可以逐帧改变(从一个驾驶周期到另一个驾驶周期)。

在框504处,可以基于讨论的因素中的一个或多个以及与障碍物相关联确定置信度分数508。如果障碍物是静止的障碍物,则过程可以进行到决策模块304和规划模块305。然而,如果障碍物是移动的障碍物,则过程可以进行到预测障碍物将如何移动的预测模块303。

在框509处,生成预测障碍物的移动的障碍物轨迹。基于地图和路线信息311、交通规则312和障碍物的当前状态生成轨迹。例如,可以参考交通规则来预测障碍物将相对于地图数据(道路、交叉路口、人行道等)如何移动。如果障碍物是车辆,则可以为车辆确定预测车辆将行驶到何处的一个或多个轨迹。如图5中的示例所示,地图数据可能指示障碍物501前面的交叉路口。交通规则可以指示在障碍物的检测车道中,允许障碍物笔直行驶或向右转。如果障碍物笔直移动,这可能会干扰ADV516。然而如果轨迹向右转,则不会干扰ADV。以这种方式,可以生成预测障碍物的移动的一个或多个轨迹710。置信度分数512可以在框507处生成并且与车辆的每个轨迹相关联。置信度分数描述ADV系统在障碍物采用相应轨迹时具有的置信度。

在一些实施例中,仅针对存在接触风险的轨迹执行该过程。在图5的示例中,例如,潜在接触点515仅与障碍物501的笔直轨迹相关联。因此,可以忽略障碍物向右转的轨迹(例如,关于此轨迹不做出驾驶决策或延迟驾驶决策)。

在框507处,可以基于包括以下因素的组合确定障碍物的轨迹的置信度分数:a)当前状态数据(例如,速度、位置、前进方向、加速度、类型),b)(在框504处确定)与感测到的障碍物的当前状态相关联的当前状态置信度分数,c)地图数据,和/或d)交通规则。例如,如果障碍物当前状态的置信度分数为80%,这可以作为基线轨迹置信度分数继续下去。当前状态、障碍物轨迹以及地图和交通规则可以是确定轨迹的置信度分数的因素。在其他部分中进一步描述了关于轨迹生成的附加细节。

参考图5所示的障碍物501,如果障碍物的速度高,和/或没有检测到减速,则这可以表明障碍物意图继续在道路上直行,而不是在即将到来的交叉路口处向右转。在这种情况下,与直线轨迹相关联的置信度分数可以高于与向右转轨迹相关联的置信度分数。如所指示的,在一些实施例中,基于地图数据(例如,知道何处是人行道、交叉路口、道路和/或车道)和交通规则(知道给定道路或交叉路口上每种障碍物允许的内容)以及当前状态和障碍物类型确定轨迹置信度分数,所有这些因素一起考虑时可能会表明障碍物意图如何移动。

在另一示例中,如果感测到的障碍物是被检测为正在沿着人行道行走的行人,地图数据可以指定人行道将在何处结束。可以基于参考交通规则确定行人的许多轨迹。例如,可以生成第一轨迹,使得行人被预测为在第一方向上跨人行道移动,可以确定第二轨迹,其中行人在第二方向上跨人行道移动,并且可以确定第三轨迹,其中行人绕过人行道的拐角并继续在人行道上行走。

在一些实施例中,进一步基于机器学习确定轨迹置信度分数。例如,可以基于多个训练数据训练神经网络,该训练数据指示诸如车辆、行人和/或骑自行车者以给定方向、速度和加速度接近交叉路口的不同情况。其他训练数据可以基于前进方向、速度和/或加速度的变化指示障碍物何时可以改变车道或改变方向。基于这些已训练的神经网络,可以在框509处处理障碍物的当前状态数据以确定障碍物轨迹的置信度分数。轨迹和轨迹置信度可以由决策模块304和规划模块305处理。

在延迟逻辑518处,如果a)与感测到的障碍物相关联的置信度分数低于置信度阈值,以及b)在ADV和与障碍物的潜在接触点之间的距离低于距离阈值,则过程可以延迟做出驾驶决策。如果障碍物是静止的障碍物,则置信度分数是障碍物的当前状态的置信度的度量。换句话说,置信度分数表示障碍物当前状态有多可靠。如果障碍物正在移动,则置信度分数与障碍物的轨迹相关联,并且可以描述为障碍物将采用该特定轨迹的概率。

在框517处,可以基于诸如ADV的速度、障碍物速度或障碍物类型的不同因素调整距离阈值。例如,参考图6,如果ADV 602前进得非常快,则可以减小距离阈值606(移动得更接近ADV),以允许ADV更多空间来减速或在认为必要时停止。如果障碍物604被感测为正在倒车,可以进一步减小距离阈值。此外,如果障碍物的类型是车辆,可以进一步减小距离阈值,因为车辆可能潜在地以更高的速度移动。因此,在车辆604加速(倒车)的不太可能的情况下,ADV由于减小的距离阈值将相应地做出反应。另一方面,如果障碍物是骑自行车者或比车辆慢的其他障碍物,则针对这种类型的障碍物,由于车辆的潜在的高速度,距离阈值调整将不会像在车辆情况下那样减小那么多。

决策模块304和规划模块305与控制模块306和控制系统111协同执行驾驶决策,以减少ADV与障碍物之间接触的风险。例如,决策和规划可以调整ADV的路径,或决定让路、停止或超过对象,从而产生规划和控制数据。控制模块306使用规划和控制数据生成控制指令,例如转向、加速和/或制动。这些控制命令由控制系统111使用以生成ADV的移动。

如所示,同一障碍物(例如,障碍物501)可以具有多于一个的预测轨迹510(例如,笔直或转弯)。因此,可以针对预测感测到的障碍物的不同移动的每个轨迹重复所示的过程。此外,应当理解的是,可以同时处理多个障碍物。生成每个障碍物的一个或多个轨迹,每个轨迹表示障碍物可能采用的预测路径,如图7所示。

在图7中,第一障碍物704具有预测第一障碍物将向右转到右车道中的轨迹A,以及预测第一障碍物将向右转到左车道中的轨迹A'。轨迹A不干扰ADV 702的路径701,因为ADV在左车道中,然而轨迹A'将会将第一个障碍物放置在与ADV相同的车道中,从而在产生在接触点707处的接触的风险。如果与轨迹A'相关联的置信度低于置信度阈值,则ADV可以延迟做出驾驶决策(例如,加速、减速、制动或改变车道)。如果在ADV达到距离阈值A'时置信度仍低于阈值,则ADV将执行驾驶决策。

同时,第二障碍物706可以具有预测障碍物将保持笔直的轨迹B以及预测障碍物将转向到左车道中的轨迹B'(不同于轨迹B)。轨迹B不干扰ADV,然而轨迹B'产生第二障碍物和ADV之间的点705处的接触的风险。如果与轨迹B'相关联的置信度分数低于置信度阈值,则ADV可以延迟对第二障碍物做出反应(例如,做出驾驶决策),至少直到ADV达到距离阈值B'。在距离阈值B'处,ADV可以执行驾驶决策(例如,减速或停止),而与置信度分数是否保持较低无关。然而应注意的是,在某些情况下,当ADV延迟时,可以移除轨迹。例如,如果第二障碍物改变前进方向以指示它将保持笔直,或者如果第二障碍物完全停止,则可以丢弃轨迹B'。在这种情况下,ADV将不再对第二障碍物做出反应。

应该理解的是,图6-7中讨论的示例仅是示例性的,而不是限制性的。可以描述具有不同类型的障碍物、道路和交叉路口的多种场景,这些场景可能会造成ADV和感测到的障碍物之间发生接触的风险,所有这些无法在实践中说明。

注意,上面示出和描述的一些或全部组件可以以软件、硬件或其组合来实现。例如,这样的组件可以被实现为安装并存储在永久存储设备中的软件,软件可以由处理器(未示出)加载并在存储器中执行以实施整个本申请描述的过程或操作。可替换地,这样的组件可以被实现为被编程或嵌入到诸如集成电路(例如,专用IC或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA)的专用硬件中的可执行代码,其可以经由相应驱动器和/或操作系统从应用程序进行访问。此外,作为软件组件经由一个或多个特定指令可访问的指令集的部分,这样的组件可以被实现为处理器或处理器核心中的特定硬件逻辑。

根据对计算机存储器内的数据位的操作的算法和符号表示已经呈现前面详细描述的某些部分。这些算法描述和表示是数据处理领域的技术人员用来最有效地向本领域其他技术人员传达其工作实质的方式。算法在这里并且通常被认为是导致期望结果的自相容操作序列。这些操作是需要对物理量进行物理操纵的那些操作。

然而,应当牢记的是,所有这些和类似术语均应与适当的物理量相关联,并且仅仅是应用于这些量的方便的标记。除非从上述讨论中另外明确指出,应理解的是,在整个说明书中,利用诸如所附权利要求书中阐述的术语的讨论是指计算机系统或类似电子计算设备的动作和过程,该计算机系统或类似电子计算设备将计算机系统寄存器和存储器内表示为物理(电子)量的数据操纵和转换为计算机系统存储器或寄存器或其他这样的信息存储、发送或显示设备内的类似地表示为物理量的其他数据。

本公开的实施例还涉及用于执行本文中的操作的装置。这种计算机程序存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机制。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存设备)。

在前述附图中描绘的过程或方法可以由包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者组合的处理逻辑来执行。尽管以上根据一些顺序操作描述了过程或方法,应当理解的是,可以以不同的顺序执行所描述的一些操作。此外,一些操作可以并行地执行而不是顺序地执行。

本公开的实施例不是参考任何特别编程语言描述的。将理解的是,可以使用各种编程语言来实现如本文描述的本公开的实施例的教示。

在前述说明书中,已经参考本公开的具体示例性实施例描述了本公开的实施例。显然,在不背离如所附权利要求书中阐述的本公开的更宽精神和范围的情况下,可以对其进行各种修改。因此,说明书和附图应被认为是说明性的而不是限制性的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号