Kalman
卡尔曼滤波在目标跟踪中的作用大致可以分为两个部分:预测和最优估计。 数学原理 状态预测方程:$$\mathbf{\hat{x}}{k|k-1} = \mathbf{A} \mathbf{\hat{x}}{k-1|k-1} + \mathbf{B} \mathbf{u}{k-1}$$其中,$\mathbf{\hat{x}}{k|k-1}$ 是状态预测值,$\mathbf{A}$ 是状态转移矩阵,$\mathbf{B}$ 是控制矩阵,$\mathbf{u}_{k-1}$ 是控制输入。 预测误差协方差方程:$$\mathbf{P}{k|k-1} = \mathbf{A} \mathbf{P}{k-1|k-1} \mathbf{A}^T + \mathbf{Q}$$其中,$\mathbf{P}_{k|k-1}$ 是预测误差协方差矩阵,$\mathbf{Q}$ 是过程噪声协方差矩阵。 卡尔曼增益方程:$$\mathbf{K}k = \mathbf{P}{k|k-1} \mathbf{H}^T (\mathbf{H} \mathbf{P}_{k|k-1} \...
Lidar
简要介绍激光雷达的原理 基本原理测距原理激光反射,根据飞行时间ToF来计算目标物体的距离。x = ct/2 扫描原理大致分为两个大类:机械旋转、固态扫描(光学相控阵,微机电系统)无人机常用的mid360采用的是光学相控阵,原理是光栅衍射。 点云预处理重采样:包括增加数据和减少数据。上采样一般方法有:插值。常常用作填充缺失的点。下采样:统计滤波,高斯滤波:高斯函数进行加权平滑数据,深度学习。常常用来降噪。 目标检测Centerpoint摘自:centerpoint 1.输入:点云数据P2.经过3D编码器(如VoxelNet或者PointPillars),生成俯视图特征图M3.进入检测头,首先是一个可学习的3x3卷积层、BN层、ReLU激活函数4.分支到两个头:(1) 中心点heatmap头:进行几个卷积生成K个热力图,表示K类目标的中心点置信度(2) 回归头:进行几个卷积,生成所有类别共享的回归目标,包括坐标回归、尺寸回归、高度回归、旋转回归等5.对heatmap进行非极大抑制,找到峰值点作为检测到的目标中心6.在每个目标中心的位置,从回归头结果中提取出坐标、尺...
Hungarian
匈牙利算法是多目标追踪算法中最基础的数据关联方法。 基本思路在追踪问题当中,我们的目标是将“当前时刻的检测目标”和“过去(上一时刻)已经存在的目标轨迹”进行一一对应。经过过去学者的研究,将这个问题转换为一个分配问题,从而可以用匈牙利算法进行求解。 数学表达分配问题对于 $( n \times n )$ 的代价矩阵 $( C )$,需要求得最小的总代价:$$\min \sum_{i=1}^n \sum_{j=1}^n c_{ij} x_{ij}$$并且满足以下约束条件: 每个人只能完成一个任务且必须做一个任务:$$\sum_{i=1}^n x_{ij} = 1 \quad \forall j = 1, 2, \ldots, n$$ 每个任务只能由一个人完成且必须完成:$$\sum_{j=1}^n x_{ij} = 1 \quad \forall i = 1, 2, \ldots, n$$ $( x_{ij} )$ 是二进制变量:$$x_{ij} \in {0, 1} \quad \forall i...
Common Nerual Network
本文介绍图像中经典的网络结构 卷积神经网络(CNN)LeNet最早期的卷积神经网络之一,由Yann LeCun等人在1998年提出,主要用于手写数字识别,奠定了CNN的基础 AlexNet2012年ImageNet竞赛的冠军模型,首次引入ReLU激活函数、Dropout等技术,标志着深度学习在计算机视觉领域的崛起 VGGNet使用小尺寸卷积核和更深的网络结构,显著提高了性能,但计算量较大 生成对抗网络(GAN)GAN由生成器和判别器组成,用于生成新的图像数据 DCGAN深度卷积生成对抗网络,基于卷积神经网络的GAN,提高了图像生成质量 目标检测网络R-CNN系列包括R-CNN、Fast R-CNN、Faster R-CNN等,基于区域提议的两阶段检测算法 YOLO系列单阶段检测算法,速度快,实时性好 SSD多尺度特征图检测,兼顾速度和精度 Vision Transformer(ViT)将Transformer结构应用于图像分类,取得了优异效果
