中文
English

从交互理解到多机位一致性,奥比中光3D视觉技术频现IROS 2025研究成果

  • 2025.10.21
  • orbbec

全球机器人领域最具影响力的学术会议IROS 2025于10月19日至25日在杭州国际博览中心举行。大会收录的多篇论文的研究成果采用了奥比中光的3D视觉技术,涵盖自动化扫描、空间建模、人机交互等前沿方向,彰显了奥比中光在全球机器人与AI视觉研究领域的底层支撑地位。



顶级学术会议见证技术实力


在本届IROS收录的论文中,韩国梨花女子大学团队的“Scanning Bot: Efficient Scan Planning using Panoramic Cameras”提出的“Scanning Bot”系统采用奥比中光Astra相机模组(集成于Matterport Pro2全景摄像系统)进行高精度室内3D扫描与重建,显著提升了扫描效率与纹理质量[1]


上海交通大学团队的论文“Zero-Shot Temporal Interaction Localization for Egocentric Videos”提出了一种可泛化的零样本模型“EgoLoc”,通过第一视角视频时序交互定位方法研究人机协作与模仿学习,利用RGB-D视觉理解人类动作与物体交互。奥比中光的Femto Bolt相机通过采集训练数据,为模型的三维理解能力提供关键支撑[2]

image.png

图片来源:Lee, E., Han, K. M., & Kim, Y. J. (2025). Scanning Bot: Efficient Scan Planning using Panoramic Cameras. 


奥比中光相机具备开放的SDK生态、可调参的深度质量控制、稳定的多机位时间同步能力,以及对弱光、低纹理、反光材质等复杂场景的鲁棒性——这些特性让科研成果具备更高的可复现性和落地潜力。



具身智能成为IROS 2025核心趋势


本届大会特别关注具身智能(Embodied AI)的发展,强调机器人感知、认知与行动的深度融合。大会聚焦无人机、自动驾驶、大语言模型、灵巧手以及具身智能等关键领域,多个工作坊专注于多模态感知——包括触觉、视觉和语言模型——在复杂环境中实现灵巧、适应性的机器人行为。


在这一背景下,这两篇用到奥比中光相机的论文正好映射出前沿路线的两个端点:

  • 在交互理解方向,EgoLoc将深度与动力学先验(如手部三维速度、接触/分离瞬时特征)显式并入模型,以期在零样本或小样本条件下稳定定位“什么时候交互”。

  • 在扫描与重建方向,Scanning Bot则以 “可见性约束 → 视点集最小化 → 路径可行性 → 总时长最优” 为设计框架,追求覆盖率>99%的高效端到端扫描流程。

从这些具体研究可以进一步观察到,IROS 2025凝聚出以下几条机器人技术演进的共识:

  • 多机位一致性成为刚需:要维持时序理解与全景拼接性能,外参稳定、时间戳准确、低抖动触发是基础保障。

  • 本地化开放生态优于黑盒式集成:ROS 2、Unity/UE 支持、可插拔数据流程与深度质量调优能力,正在成为评判视觉设备架构设计的关键要素。

  • 场景鲁棒性与一致性评测成为研究指标:弱光、低纹理、反射材质环境下深度稳定性不可弱化;覆盖率、重叠度与总时长等任务级KPI被纳入评测协议和方法目标。

在这些趋势之中,3D视觉正逐步从“感知工具”跃升为机器人系统中承接物理世界与 AI 决策层的关键桥梁。



持续赋能全球学术与产业创新


被誉为“机器人研究奥林匹克盛会”的IEEE/RSJ国际智能机器人与系统会议(IROS),是全球机器人领域最具影响力的学术会议之一,自1988年创办以来一直推动着机器人技术的前沿发展。今年大会汇聚了超过7000名来自全球的专家、学者和业界专业人士,展示最前沿的学术成果和技术趋势。


作为“机器人与AI视觉中台”,奥比中光对结构光、iToF、双目、dToF、激光雷达、工业三维测量等技术路线进行了全领域布局,已服务全球超过3000家客户。公司持续支持产学研协作,连续多年参与中国三维视觉大会(China3DV)和CVPR等国际学术会议。奥比中光为全球科研与产业创新提供底层支撑,共同推动3D视觉技术在机器人、自动化与人机协作领域的融合创新。


[1] Lee, E., Han, K. M., & Kim, Y. J. (2025). Scanning Bot: Efficient Scan Planning using Panoramic Cameras.

[2] Ma, J., Zhang, E., Zheng, Y. D., Xie, Y., Zhou, Y., & Wang, H. (2025). Zero-Shot Temporal Interaction Localization for Egocentric Videos