按数据结构可分为三类:
结构化知识库:以表格、数据库、知识图谱(如“疾病-症状-药物”三元组)存储,检索精准、逻辑性强,适合需要严格推理的场景(如医疗诊断、金融风控);
半结构化知识库:含标签的文本(如带标题的FAQ、Markdown文档),兼顾可读性与检索效率,适合企业客服、产品说明等场景;
非结构化知识库:纯文本(如PDF、网页、聊天记录),需通过Embedding模型转为向量检索,灵活性高,但检索精度依赖模型能力,适合海量文档的快速筛选。
按数据结构可分为三类:
结构化知识库:以表格、数据库、知识图谱(如“疾病-症状-药物”三元组)存储,检索精准、逻辑性强,适合需要严格推理的场景(如医疗诊断、金融风控);
半结构化知识库:含标签的文本(如带标题的FAQ、Markdown文档),兼顾可读性与检索效率,适合企业客服、产品说明等场景;
非结构化知识库:纯文本(如PDF、网页、聊天记录),需通过Embedding模型转为向量检索,灵活性高,但检索精度依赖模型能力,适合海量文档的快速筛选。
相关阅读