核心技术是检索增强生成(Retrieval-Augmented Generation, RAG),流程为:
检索:用户提问时,先将问题转为向量,在知识库中检索最相关的知识片段;
增强:将检索到的知识与用户问题拼接,作为“增强prompt”输入大模型;
生成:大模型基于“问题+知识片段”生成回答,确保内容源于权威知识库,减少幻觉。
此外,微调(Fine-tuning)(将知识库知识注入模型参数)也是补充方式,但RAG更灵活、易更新,是当前主流方案。
核心技术是检索增强生成(Retrieval-Augmented Generation, RAG),流程为:
检索:用户提问时,先将问题转为向量,在知识库中检索最相关的知识片段;
增强:将检索到的知识与用户问题拼接,作为“增强prompt”输入大模型;
生成:大模型基于“问题+知识片段”生成回答,确保内容源于权威知识库,减少幻觉。
此外,微调(Fine-tuning)(将知识库知识注入模型参数)也是补充方式,但RAG更灵活、易更新,是当前主流方案。
相关阅读