
文章探讨了在GPU算力(如H100)迅猛发展的背景下,结构化数据建模是否应从传统树模型(如XGBoost)转向基于深度学习的预训练范式。浙大与蚂蚁AIforData团队通过千亿级样本的实践表明:1)预训练模型在工业级表格数据上显著优于传统树模型;2)表格数据和用户行为序列均展现出明显的Scaling Law;3)通过KMLP架构和FOUND框架,结合数据压缩等技术,可有效突破算力与数据规模瓶颈。研究指出,随着算力天平倾斜,结构化数据建模的“平衡点”正被重新定义,或将迎来自己的“大模型时刻”。
查看详情











京公网安备11010602202532号