todo:
(raw) 环卫机器人在人行横道或人行道作业时,经常遇到因对向及同向的行人过多,导致通行效率低下而通行效率低下或无法通行。在公开道路通行时,不仅影响作业效率,同时对于公共交通也造成了一定的干扰。在这种环境下通行,效率和安全是两个非常重要的约束。在追求效率时,我们不能忽视安全,尤其是在公开道路上面进行作业的机器人。我们追求的是一个在社会生活中人机和谐相处的环境,基于这个动机,我们利用社会力模型进行行人的未来行为预测,同时利用 cbf 的安全性来确保机器人在运行过程中的安全。
近年,面向人行道与街区等开放道路的环卫机器人逐渐从示范走向规模化部署。与封闭园区不同,开放道路存在以下两大挑战:一是高密度、强随机的人群流动易造成自车卡顿或停障,严重拖慢作业效率;二是公开道路情况复杂,机器人极易在复杂交互中侵犯行人安全区,引发碰撞风险。因此,“效率—安全”矛盾已成为公开道路环卫机器人落地的核心瓶颈。
(近年,环卫机器人正从封闭园区逐步扩展到人行道与街区等开放道路场景。然而,开放道路的运行条件远比封闭区域复杂,主要表现在两方面:(1) 高密度且强随机的人群流动使机器人频繁陷入“减速—等待—重新规划”循环,作业效率大幅下降;(2) 车辆、骑行者与行人构成的多主体混行环境放大了对安全距离的侵入风险,轻则引发通行骚扰,重则导致实质碰撞。由此产生的“效率—安全”二元悖论,已成为公开道路环卫机器人规模化落地的核心瓶颈。)
针对动态拥挤环境中的机器人导航,主流思路是模型-规则解析范式,通过解析几何、物理或拓扑模型显式构造安全约束与代价函数(如速度障碍/ORCA、社会力模型、控制屏障函数等),以实现形式化安全可证的导航。该方法具备计算开销小、可解释性强及安全性保证的优势,但其局限性同样显著:首先,由于模型依赖显式规则与简化假设,在高密度动态场景中容易过于保守或“冻结”,无法灵活适应复杂的人群交互;其次,解析方法通常缺乏对多模态社交行为的表达能力,导致生成轨迹不够自然。
(针对动态拥挤环境,最早得到工业部署的是模型-规则解析范式。该范式依托解析几何、物理或拓扑模型,显式构造安全约束与代价函数——典型方法包括速度障碍/ORCA、势场化的社会力模型以及具有不变集证明的控制屏障函数(CBF)。解析算法通常可在毫秒级求解,具备良好的可解释性与形式化安全保证。然而,其对障碍物运动形态与交互模式的假设过于理想化:在高密度场景中不得不扩大安全裕度,进而出现“冻结”或蛇形绕行;同时,规则模型难以表达多模态社交礼仪,生成轨迹常显僵硬,不符行人预期。)
另一种思路是数据驱动预测-控制范式。该方法通过深度网络(如 RNN、Transformer、扩散模型等)学习人群运动的多模态分布,并将预测结果嵌入 MPC、采样优化或端到端策略中,以生成平滑自然的轨迹。此类方法能够捕捉潜在社交礼仪与复杂人机交互,在复杂场景中表现出较强的适应性。然而,该范式存在显著缺陷:首先,基于采样或优化的策略,最终生成轨迹生成缺乏多样性,难以适应多模态社交行为;其次,方法对预测模型的准确性依赖性强,当障碍物运动存在不确定性或预测误差时,导航性能会显著下降;此外,其迭代优化过程计算复杂度较高,实时性难以保证。综上,两种范式分别受制于“安全-效率-泛化”三难命题:前者缺乏强安全保证与鲁棒性,后者缺乏社交效率与泛化弹性。
(为了提升行为自然性与交互多样性,数据驱动预测-控制范式应运而生。该思路利用 RNN、Transformer 或扩散模型学习人群运动的多模态分布,再将预测注入 MPC、采样优化或端到端策略中,从而显式捕捉隐含社交礼仪,在复杂场景下展现出优异的适应性。但其局限亦十分突出:(1) 导航性能与预测精度耦合紧密,感知噪声或分布偏移会导致安全裕度骤降;(2) 受限于单一最优解或有限采样规模,生成轨迹多样性不足,难以覆盖复杂社交模式;(3) 迭代优化带来可观计算负担,实时性难以满足工业级 10 Hz 以上的控制周期。安全、效率与泛化能力因此陷入新的三难困境。)
针对上述痛点,本文提出一种“条件扩散规划-CBF 同步引导”框架:将轨迹规划建模为条件扩散过程,从高斯噪声到控制序列的逐步去噪生成中,于每一反向步实时评估候选控制对机器人-行人系统的状态演化,并利用控制屏障函数给出梯度引导,按最小干预投影使中间及最终轨迹始终处于安全可行集;同时结合社会力-LSTM 预测器提供行人短时轨迹约束,实现规划与安全的深度耦合,在生成阶段即“内生化”安全机制,兼顾高效率与严格安全。
(本文工作的出发点是一个关键实地观察:当机器人的运动轨迹符合周围行人的行为预期时,行人无需让步即可维持自身规划,群体流场扰动最小,整体通行效率达到最优。社会力模型恰以显式势场刻画这种“预期一致性”。基于此,我们提出“条件扩散规划-CBF 同步引导”框架。具体而言:(i) 将轨迹规划建模为条件扩散过程,从高斯噪声逐步去噪生成多样化控制序列;(ii) 在每一反向步实时评估候选控制对机器人-行人系统状态的演化,利用高阶 CBF 计算安全梯度,并以最小干预投影至不变安全集;(iii) 将 SFM-LSTM 预测器嵌入同一推理回路,对行人短时动力学施加行为一致性约束,使“可证安全”与“社交预期”在生成阶段即深度耦合、内生化。该框架同时继承了扩散模型的多样性、SFM 的社交一致性和 CBF 的严格安全保证,解决了解析方法保守冻结与学习方法安全失衡的双重难题,为动态拥挤开放道路中的无人环卫作业提供了一条高效、自然且可证安全的新路径。)
(human-like movement)