智算多多联系我们


关注我们

公众号

视频号
隐私协议用户协议
◎ 2025 北京智算多多科技有限公司版权所有京ICP备 2025150592号-1
在评估行人轨迹预测数据集时,开发者需要从多个技术维度进行考量:
| 数据集 | 场景类型 | 行人数量 | 标注频率(Hz) | 附加信息 | 适用阶段 |
|---|---|---|---|---|---|
| ETH | 校园/酒店 | 750 | 2.5 | 交互标签 | 算法验证 |
| UCY | 商业街/广场 | 780 | 2.5 | 目的地预测 | 多模态研究 |
| WildTrack | 城市广场 | 400+ | 2.0 | 多视角同步 | 三维重建 |
| L-CAS | 室内环境 | 900 | 10.0 | LiDAR点云 | 传感器融合 |
| CFF | 交通枢纽 | 42M | 5.0 | 跨摄像头关联 | 大规模预训练 |
这对经典数据集常被用作benchmark,但实际应用中存在显著差异:
ETH数据集包含两个子场景:
UCY数据集则包含三个商业场景:
1. # 典型数据加载示例
2. import numpy as np
4. def load_eth_data(scene='univ'):
5. data = np.loadtxt(f'eth_{scene}.txt')
6. # 格式: [frame_id, ped_id, x, y]
7. return data.reshape(-1, 4)
一键获取完整项目代码python
注意:两个数据集均使用单应性矩阵将图像坐标转换为世界坐标系,但UCY的标注原点设在像素中心,而ETH采用地面投影参考点。
通过运动模式分析发现:
原始数据往往需要经过精心处理才能用于模型训练:
1. # 使用Homography矩阵转换示例
2. wget http://www.vision.ee.ethz.ch/datasets/H_matrix.zip
3. unzip H_matrix.zip
4. python transform_coordinates.py --input raw_data --output processed_data
一键获取完整项目代码bash
针对不同预测任务需要采用不同采样方式:
当基础数据集不足时,可以考虑以下增强方案:
我们实验发现:
当前领域正呈现三个明显的发展方向:
在实际项目中,我们团队发现将ETH数据中的酒店场景与UCY的Zara场景组合训练,能显著提升模型在商业区的表现。特别是在处理突然驻足场景时,融合两个数据集特征的模型比单数据集训练的版本误报率降低40%。