智算多多联系我们

官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部
关注我们

公众号

视频号
◎2025 北京智算多多科技有限公司版权所有 京ICP备 2025150592号-1
京公网安备11010602202532号
京公网安备11010602202532号 参数高效性:LoRA仅训练两个低秩矩阵A和B,而非全参数矩阵W。例如,在GPT-3 175B模型中,LoRA将检查点大小从350GB减少至35MB,减少约10,000倍。
训练速度提升:由于仅更新少量参数,LoRA的训练速度比全参数微调提高25%。
无推理延迟:LoRA采用线性设计,可合并可训练矩阵(A和B)与固定参数矩阵W,推理过程与原始模型完全一致。
超参数灵活性:低秩矩阵的秩r可远小于原始权重矩阵的维度。实验表明,即使r=1,LoRA仍能保持良好性能,意味着A和B可以是简单的行或列矩阵。
LoRA通过修改权重矩阵的更新量ΔW实现微调,公式为:ΔW = A × B其中:
通过这种分解,LoRA将可训练参数数量从d×k减少至r×(d+k),显著降低计算开销。
LoRA通过低秩分解和参数初始化策略,实现了大模型的高效微调。其核心优势包括:
LoRA的初始化策略(A高斯分布、B零初始化)确保了训练的稳定性和有效性,使其成为大模型微调的革命性技术。
