物体跟踪与运动跟踪结合

本篇介绍如何将 3D 物体跟踪与设备运动跟踪功能相融合，以提升复杂场景下的跟踪稳定性和用户体验。内容包括核心原理、预期效果及潜在问题分析。

基本原理

运动融合（Motion Fusion） 结合 3D 物体跟踪的位姿数据和设备运动跟踪的位姿数据，实现更鲁棒的位姿估计。以下是其核心流程：

视觉跟踪：通过图像特征点匹配计算当前帧的位姿（位置+旋转），但易受遮挡、模糊或快速移动影响。
运动跟踪：利用 IMU 传感器高频输出以及视觉图像的输出获得设备运动数据，但存在累积飘移误差。
融合机制：
- 将视觉跟踪的位姿与设备运动跟踪的位姿进行坐标系对齐。
- 当目标物体清晰可见、稳定运动时：以视觉跟踪为主。不断地将视觉跟踪位姿送入融合模块进行修正，以减少整个系统的累积漂移。
- 当目标物体丢失或者在画面中占比过小、快速运动时：此时视觉跟踪失效，以运动跟踪为主。根据当前的运动跟踪位姿进行融合位姿预测。

运动融合并不适合所有场景下的使用。有以下情形之一的将 不适用 运动融合功能：

除此之外的场景，使用运动融合将极大的提升 3D 物体跟踪的用户体验，包括但不限于以下使用情景：

在场景适用的前提下，使用运动融合将比单纯的使用 3D 物体跟踪带来更稳定、平滑的用户体验。

使用支持的设备在真实场景中测试：

运动融合显著提升了 3D 物体跟踪在许多场景下的鲁棒性，但需要设备的硬件支持且性能足够。开发者应根据目标用户设备选择性启用该功能，并在低性能设备上提供降级方案。

实时打开/关闭运动融合功能的 API 参考：