首页
产品服务
模型广场
Token工厂
算力市场算力商情行业资讯
注册

浪潮软件申请多智能体协同构建档案大模型微调数据集专利,作为大模型微调数据集使用

发布日期:2026-04-12 来源:新浪网作者:新浪网浏览:2

专利摘要显示,本发明公开一种多智能体协同的档案大模型微调数据集构建方法及系统,涉及档案处理技术领域。针对档案文档中图像模糊、手写体识别困难、OCR误差高等问题,采用方案包括:获取不同类型档案文档的文本信息,经清洗与校验后输出,随后基于语义结构完成自然段落划分,将未超出字数阈值的段落作为一个字块,将超出字数阈值的段落按标点规则与字数阈值策略裁剪为多个子块。

针对每个子块,先通过问题生成智能体生成多个覆盖知识点的问题,再由答案搜索智能体基于原始文本信息,为生成的问题匹配语义一致的答案,形成问答对;对问答对进行匹配验证和质量评估,通过后,将问答对输出保存至数据集,并整理成标准格式,作为大模型微调数据集使用。

本文转载自新浪网, 作者:新浪网, 原文标题:《 浪潮软件申请多智能体协同构建档案大模型微调数据集专利,作为大模型微调数据集使用 》, 原文链接: http://k.sina.com.cn/article_7857201856_1d45362c0019048dsg.html。 本平台仅做分享和推荐,不涉及任何商业用途。文章版权归原作者所有。如涉及作品内容、版权和其它问题,请与我们联系,我们将在第一时间删除内容!
本文相关推荐
暂无相关推荐
点击立即订阅