MOT中滤波论文总结

📚 滤波相关论文总结 目录表格 简称 发表信息 核心贡献描述 具体信息 其他 Dynanet TNNLS2021 kalman引入神经网络 查看 - Kalmannet TSP2022 构建了kalmannet,用来估计KG,噪声未知,模型可以不准确 查看 - bayesian kalmannet TSP2025 从bayesian角度看待DNN辅助的卡尔曼滤波 查看 - DLBRMOT TITS2024 Bi-LSTM来构建运动模型 查看 - ODR ICRA2021 - 查看 不确定 ESER IROS2023 - 查看 不确定 DynaNet: Neural Kalman Dynamical Model for Motion Estimation and Prediction 🌟 基本信息 开源地址:不开源,但是通过关系要到源码了 发表信息:IEEE Transactions on Neural Networks and Learning Systems ( Volume: 32, Issue: 12, December 2021) 🎯 核心内容 将卡尔曼滤波扩展到神经网络,一方面有效果,还有一定的理论依据。 💡 学习收获 😃 其他 陈老师直接给了源码😋,但是一直没复现被批好几回😭 KalmanNet: Neural Network Aided Kalman Filtering for Partially Known Dynamics 🌟 基本信息 开源地址:https://github.com/KalmanNet/KalmanNet_TSP 发表信息:IEEE Transactions on Signal Processing Bayesian KalmanNet: Quantifying Uncertainty in Deep Learning Augmented Kalman Filter 🌟 基本信息 开源地址:未开源 发表信息:IEEE Transactions on Signal Processing 2025 Deep Learning-Based Robust Multi-Object Tracking via Fusion of mmWave Radar and Camera Sensors 🌟 基本信息 开源地址:未开源 发表信息:IEEE Transactions on Intelligent Transportation Systems 2024 🎯 核心内容 融合了mmWave雷达和摄像头,通过深度学习来实现MOT 采用了一个基于Bi-LSTM的运动模型 Out-of-Distribution Robustness with Deep Recursive Filters 🌟 基本信息 开源地址:未开源 发表信息:2021 IEEE International Conference on Robotics and Automation (ICRA) Enhancing State Estimation in Robots: A Data-Driven Approach with Differentiable Ensemble Kalman Filters 🌟 基本信息 开源地址:https://github.com/ir-lab/DEnKF 发表信息:2023 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)

January 9, 2026 · 1 min

MOT新论文总结

新出论文总结 本文档主要记录新出的论文(包括大量ArXiv预印本),主要是学习思路和方法,其具体水平还有待时间检验。 目录 简称 发表信息 核心贡献描述 具体信息 传感器 其他 RobMOT+ ArXiv 2025.5 提出动态调整运动模型的思路 查看 3D+2D DIMM ArXiv 2025.5 IMM改进,强化学习计算转换矩阵,各个方向进行拆分 查看 3D(未提到传感器) 论文详情 TOWARDS ACCURATE STATE ESTIMATION: KALMAN FILTER INCORPORATING MOTION DYNAMICS FOR 3D MULTI-OBJECT TRACKING {#RobMOT+} 发表信息: ArXiv 2025.5 未开源 核心贡献描述 说是动态模型,不如说是动态调整模型的参数。作者首先使用一个基座运动模型:Jerk模型(一直建模到加加速度)。然后给速度,加速度,加加速度一个权重,通过调整权重来实现模型的动态调整。 而权重的获得,理想情况下是通过目标真实运动状态的差分(及高级差分)获得的。但是真实状态不可得,作者使用去噪的观测值来近似真实状态,从而计算出差分。此外,并非简单差分就是权重,还设置了一个高斯分布,以及归一化来获得权重。 学习收获 作者的运动模型,实质上就是CV,CA,JERK。但是没有考虑到转向模型。不过思路可以借鉴学习,也就是通过后续的真值来动态调整运动模型。 对比作者的上一篇工作,提升真的不高。 DIMM: Decoupled Multi-hierarchy Kalman Filter for 3D Object Tracking 发表信息: ArXiv 2025.5 未开源 核心贡献描述 主要提出了两个大的创新点。首先作者的baseline是IMM(交互多模型滤波器)。它指出IMM存在的两个大问题:首先是3维各个方向的运动状态可能是不相同的,而IMM是把各个方向的状态耦合在一起的。其次,IMM在更新模型概率时,是用的观测的值作为真值来计算误差,从而更新概率,这里就引入了观测噪声的问题。 针对第一个问题,作者提出了将3维各个方向的状态进行拆分。每个维度上分别做CV,CA,CK模型的IMM。作者提到这样做扩大了解的空间。但是我认为这个说法有一定的问题。假如说三个模型的状态向量不存在平行,那么他们就是三维空间的一组基向量,一样是可以表示任意的三维状态的。而拆分成基坐标系,就相当于把基向量换成了标准正交基而已。但是,我也同意作者的部分观点:这样确实扩大了解的空间:由于固定模型,所以状态向量的变化范围是受限的,而拆分后,每个维度的状态向量可以独立变化,从而扩大了状态向量的变化范围。这个部分我觉得还可以更进一步,沿着作者的思路走:各个方向上的运动是不一样的。 针对第二个问题,作者提出了使用强化学习的方法来学习生成概率矩阵。 其中值得借鉴的是奖励的设置。不同于将和真值的误差作为奖励,作者将“模型的误差”和”普通IMM的误差“之间的差值作为奖励。这样缓解了观测噪声的问题。当学习模型比传统方法好的时候,奖励为正,否则为负。 学习收获 各个方向运动不同。拆分的方法可以试试效果先。 学习奖励的设计。 模板 发表信息: 未开源 核心贡献描述 学习收获

January 9, 2026 · 1 min

MOT机器人上实际部署相关论文总结

📚 移动机器人上的多目标追踪论文总结 问题描述:移动机器人限定了后续算法不能依赖深度神经网络,而是采用一些传统建模/滤波的方法。多目标追踪旨在将多个目标(可能是障碍物)进行更好的状态。 目录表格 简称 发表信息 核心贡献描述 具体信息 传感器 其他 Onboard IRCA2024 小型机器人上的目标感知 查看 camera - Onboard Dynamic-Object Detection and Tracking for Autonomous Robot Navigation With RGB-D Camera 🌟 基本信息 开源地址:https://github.com/Zhefan-Xu/onboard_detector 发表信息:IEEE Robotics and Automation Letters 2024-01 🎯 核心内容 首先,文章声明自己方法的适用场景是基于深度相机的小型移动机器人,因此不适用于需要深度学习的方法。 其次,作者提出这样场景下存在的问题:1.算力不足。2.FOV有限,近处的目标和远处的目标都较难识别。3.检测的噪声的影响非常大。 针对上述问题,文章给出了解决方案。1.两个简单的检测方法同时进行(UDepth,DBSCAN),附带一个可选的简单神经网络模型。2.采用了新的基于特征的数据关联方法进行卡尔曼滤波的追踪。这个特征其实只是添加了目标的尺度这些信息。3.提出了如何分辨动静目标的方法。

January 9, 2026 · 1 min

MOT相关论文总结1

📚 多目标追踪论文总结 目录表格 简称 发表信息 核心贡献描述 具体信息 传感器 其他 SORT ICIP2016 TBD框架的开创论文 查看 camera - DeepSORT ICIP2017 首个引入外貌特征的MOT 查看 camera - AB3DMOT IROS2020 将TBD带入3D追踪邻域 查看 LiDAR 待细看 CenterTrack ECCV2020 转换为跟踪点 查看 camera - JDE ECCV2020 JDE开创论文 查看 camera - FairMOT IJCV2021 JDE改进 查看 camera - EagerMOT IRCA2021 首个将相机激光雷达融合的TBD框架 查看 LiDAR+camera - JMODT IROS2021 联合检测框架 查看 LiDAR+camera - GIAOTrack ICCVW2021 NSA KF, EMA Bank 查看 camera Visdrone,offline DeepFusionMOT RAL2022 提出4阶段的数据关联 查看 LiDAR+camera - ys_tracker TITS2022 为激光引入检测置信度,添加激光特特征 查看 LiDAR - simpletrack ECCV2022 全面总结TBD的问题 查看 LiDAR - ByteTrack ECCV2022 引入二阶段的数据关联 查看 camera - MOTR ECCV2022 首个E2EMOT 查看 camera - TrackFormer CVPR2022 基于Transformer的E2EMOT 查看 camera - StrongSORT TM2023 Deepsort现代版,两个新机制 查看 camera - DFRFast ICRA2023 C++又快又好 查看 LiDAR+camera - POLY-MOT IROS2023 不同类目标采用不同运动模型 查看 LiDAR - MOTRv2 CVPR2023 E2E+TBD,改进了E2E效果 查看 camera - OC-SORT CVPR2023 利用观测值来固定滤波误差 查看 camera - ImprAsso CVPR2023 改进的关联,匹配函数,遮挡初始化 查看 camera - Fusiontrack IROS2024 融合方法+提点模块 查看 LiDAR+camera - DiffMOT CVPR2024 采用扩散模型来进行非线性运动预测 查看 camera - FastPOLY RAL2024 仔细考虑运动模型的构建CTRV,引入旋亲和度- 查看 LiDAR - FastTrack IJCV2024 并行卡尔曼滤波- 查看 camera - STT ICRA2024 Transformer取代更多模块 查看 LiDAR - Co-MOT-tits TITS2025 提出改进的GNN进行运动建模-。未开源 查看 LiDAR - MMTracker AAAI2025 ? 查看 camera - MambaTrack ACMMM2025 引入Mamba模型取代KF 查看 camera - MCTrack Arxiv2025 效果最好的开源追踪器 查看 LiDAR+camera - ERMOT TII2025 一种更新策略,未开源 查看 camera - MMFJDT RAL2025 检测追踪融合框架,效果似乎不太好 查看 LiDAR+camera - sambamotr ICLR2025 mamba结构的E2EMOT 查看 camera - DINOMOT RAL2025 引入DINOv2特征提取模块 查看 camera - HybridTrack RAL 2025 kf+数据驱动 查看 LiDAR - RobMOT TITS2025 针对检测器的kf+新的生命机制 查看 LiDAR - TrackTrack CVPR2025 以轨迹为核心进行管理 查看 camera - LA-MORT CVPR2025 E2E,解决检测与关联竞争 查看 camera - Simple online and realtime tracking 🌟 基本信息 开源地址:https://github.com/abewley/sort 发表信息:2016 IEEE international conference on image processing (ICIP) 🎯 核心内容 提出了“基于检测的追踪”框架,在准确度和实时性上都比传统方法更好,是后面工作的基础。 💡 学习收获 使用的是kalman滤波进行状态估计,匈牙利算法进行匹配,距离函数使用的是IOU。 Simple online and realtime tracking with a deep association metric 🌟 基本信息 开源地址:https://github.com/HowieMa/DeepSORT_YOLOv5_Pytorch 发表信息:2017 IEEE international conference on image processing (ICIP) 🎯 核心内容 在SORT的基础上,增加了外貌特征网络,准确性得到了大大的提高。 3d multi-object tracking: A baseline and new evaluation metrics 🌟 基本信息 开源地址:https://github.com/xinshuoweng/AB3DMOT 发表信息:2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS) 🎯 核心内容 将TBD框架应用到LiDAR的MOT任务上。 Tracking Objects as Points 🌟 基本信息 开源地址:https://github.com/xingyizhou/CenterTrack 发表信息:2020 European conference on computer vision (ECCV) 🎯 核心内容 核心思想:把跟踪简化为“跟踪中心点”的问题。把每个目标表示为一个 2D 中心点(object center),并在两帧间预测中心位移(offset)来进行关联。 输入:当前帧 + 前一帧 + 上一帧跟踪中心点热力图(heatmap) 基于 CenterNet 的检测头:中心点热力图 + 尺寸回归 + 偏移回归 Offset-based 简单贪心关联(Tracking-by-Offset) Towards Real-Time Multi-Object Tracking 🌟 基本信息 开源地址:https://github.com/Zhongdao/Towards-Realtime-MOT 发表信息:2020 European conference on computer vision (ECCV) 🎯 核心内容 提出了首个联合检测和嵌入(REID)的框架,将检测和特征提取集成到一个网络中,提高了多目标追踪的实时性。 单模型多任务学习:检测 + Embedding 同时输出 多任务损失 + 自动损失权重学习 Embedding 学习采用 Cross-Entropy 而非 Triplet Loss FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking 🌟 基本信息 开源地址:https://github.com/ifzhang/FairMOT 发表信息:2021 International journal of computer vision (IJCV) 🎯 核心内容 作者指出,虽然单模型(one-shot)联合检测 + re-ID 的 MOT 框架在速度上有优势,但现有方法往往存在 “不公平性(unfairness)” —— 即检测任务被优先优化,而 re-ID 任务处在明显劣势,导致整体跟踪性能显著下降。 ...

January 9, 2026 · 6 min

相关公式总结

✒️ 论文公式总结 GIoU $GIoU = IoU_{3d} - \frac{V_c - U}{V_c}$ 其中,$V_c$代表能够包含两个框的最小立方体体积。$U$代表两个检测框的交集体积。 L2 distance L2距离是简单的欧几里得距离。 $D_{\text{L2}}(\mathbf{x}, \mathbf{y}) = \sqrt{\sum_{i=1}^n (x_i - y_i)^2}$ Kalman Filter Kalman滤波器是一种用于预测和估计动态系统的状态的滤波方法。下面是它在MOT中的常见形式。(CV/CA模型) $$ \begin{align*} x_{\text{pre}} &= A \cdot x \\ P_{\text{pre}} &= A \cdot P \cdot A^T + Q \\ K_k &= P_{\text{pre}} \cdot H^T / (H \cdot P_{\text{pre}} \cdot H^T + R) \\ x &= x_{\text{pre}} + K_k \cdot (z - H \cdot x_{\text{pre}}) \\ P &= (I - K_k \cdot H) \cdot P_{\text{pre}} \end{align*} $$ 注意,filterpy库中的实现是略有不同的。对于最后一个公式,它进行了一定的修正。 ...

January 9, 2026 · 2 min