需结合业务需求评估:
向量数据库:小规模(百万级向量)可选Chroma、Weaviate(轻量易部署);大规模(亿级向量)选Milvus、Pinecone(分布式、高并发);需支持混合检索(向量+关键词)可选Elasticsearch(内置向量插件);
Embedding模型:通用场景用开源模型(如BGE、text-embedding-ada-002);领域场景选微调后的专用模型(如医疗用BioBERT Embedding、法律用Law-Embedding),提升语义匹配精度;
知识图谱工具:复杂关系推理场景(如“供应链上下游分析”)选Neo4j、NebulaGraph,支持图遍历和关联查询。
相关阅读