智算多多联系我们


关注我们

公众号

视频号
隐私协议用户协议
◎ 2025 北京智算多多科技有限公司版权所有京ICP备 2025150592号-1
在nuScenes数据集中,每个sample_annotation记录都包含一个完整的3D边界框描述,这些信息共同构成了对现实世界中物体的精确数字化表达。让我们拆解这些字段,理解它们如何协同工作。
center字段定义了物体在全局坐标系中的三维坐标(x,y,z),这是边界框的几何中心。值得注意的是,这里的z值代表物体底部中心的高度,而非整个框的中心高度。这种设计更符合自动驾驶场景中对地面物体感知的实际需求。
size字段包含三个关键维度:
这三个值共同决定了边界框的物理尺寸。在实际应用中,正确的尺寸理解对于碰撞检测、路径规划等下游任务至关重要。
orientation字段采用四元数(Quaternion)表示物体的旋转状态,相比欧拉角能避免万向节锁问题。四元数的四个分量(qw,qx,qy,qz)编码了物体相对于全局坐标系的方向。理解这个字段需要掌握一些关键点:
velocity字段则描述了物体中心点的运动速度,包含x,y,z三个方向的分量。这个信息对于预测物体未来位置、判断碰撞风险具有重要价值。值得注意的是,速度值是相对于全局坐标系的,在实际应用中可能需要转换到自车坐标系。
每个边界框都附带丰富的语义信息:
这些字段共同构成了对场景中物体的完整描述,为感知算法提供了丰富的监督信号。
理解nuScenes中的坐标系系统是正确使用3D标注数据的前提。数据集涉及多个坐标系,它们之间的转换关系构成了数据使用的技术基础。