智算多多



异构计算资源:GPU(A100/H800/H20)与 NPU 集群的选型与拓扑。
分布式训练架构:数据并行 (DP)、模型并行 (MP)、流水线并行 (PP) 与 ZeRO 技术。
高性能存储方案:RDMA 网络、并行文件系统(Lustre/GPFS)在 AI 训练中的应用。
推理引擎深度对比:vLLM, Text Generation Inference (TGI), NVIDIA Triton。
高并发推理优化:连续批处理 (Continuous Batching)、PagedAttention 技术。
量化与加速:FP8/INT8/AWQ 量化原理,算子融合与显存优化。
RAG 架构深度拆解:多级检索、重排序 (Rerank) 与混合搜索。
智能体 (Agent) 架构:ReAct、Plan-and-Execute 模式,工具调用 (Tool Call) 的闭环设计。
自动化 Pipeline:从数据标注、微调、评估到部署的 CI/CD。
模型监控与反馈:Token 消耗监控、响应延迟分析、人类反馈循环 (RLHF) 系统搭建。
预训练、指令微调 (SFT) 与偏好对齐 (DPO/PPO) 的逻辑关系。
参数高效微调 (PEFT) 详解:LoRA, QLoRA, Adapter, Prefix Tuning。
指令工程:如何将业务文档转化为高质量的 Q&A 指令对。
数据清洗与合成:利用 LLM 自动生成与清洗训练数据(Self-Instruct 框架)。
多轮对话与长文本训练数据的格式处理。
主流框架使用:LLaMA-Factory, DeepSpeed, Hugging Face PEFT 实战。
超参数调参指南:学习率、Rank 值、Alpha 值、Epochs 对模型收敛的影响。
微调过程中的显存管理:如何利用分布式技术在有限显存下微调千亿参数模型。
客观指标测试:基准测试 (Benchmarks) 与业务准确率测评。
主观评估:构建企业内部的 Elo Rating 模型评估系统。
灾难性遗忘的预防与缓解策略。
自动特征工程 (AutoFE) 与深度特征生成。
处理高维稀疏数据、缺失值与非平衡样本的进阶技巧。
集成学习进阶:XGBoost, LightGBM, CatBoost 的参数调优与特征贡献度分析。
时间序列预测:从传统 ARIMA 到基于 Transformer 的预测模型(如 Informer)。
Text-to-SQL 架构设计:Schema 链接、SQL 纠错与复杂多表关联优化。
利用 LLM 进行自动化探索性数据分析 (EDA) 与可视化图表生成。
结构化数据与非结构化数据的融合分析路径。
从相关性到因果性:A/B Test 设计、倾向评分匹配 (PSM)。
归因分析:多渠道触达模型与贡献度度量。
数据湖仓一体化架构:Iceberg/Hudi 在 AI 训练数据存储中的应用。
向量数据库管理:索引算法选择、元数据过滤与大规模向量扩缩容。
数据标准化:多源异构数据的 ETL 规范与一致性检查。
数据血缘分析:追踪 AI 模型输入源头,实现问题回溯与变更评估。
数据清洗自动化:利用 AI 自动识别与纠正脏数据、冗余数据。
数据脱敏与匿名化技术:差分隐私 (DP) 在 AI 训练中的应用。
联邦学习 (Federated Learning):如何在数据不出域的情况下进行联合建模。
AI 模型输入输出的合规性审计与护栏 (Guardrails) 建设。
特征平台 (Feature Store) 建设:实现特征的复用、共享与低延迟在线服务。
数据目录与元数据管理:让 AI 研究员快速发现业务价值数据。