科大讯飞
多模态
RAG
问答系统优化方案 本文介绍了科大讯飞AI夏令营
多模态
RAG方向的优化方案。针对财报PDF解析任务,原baseline使用PyMuPDF仅能提取纯文本,丢失了关键的
多模态信息。优化方案提出:1) Agent 智能体 采用MinerU工具
实现高保真文档解析,提取表格、图片等结构化内容;2) 构建”粗召回+精召回”的检索策略,先通过向量检索召回候选集,再用BGE-ReRanker模型进行重排序;3) 建议对Embedding模型和LLM进行微调,提升金融领域理解能力。此外还介绍了多路召回融合等
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。
发布者:Ai探索者,转载请注明出处:https://javaforall.net/283527.html原文链接:https://javaforall.net
