核心架构
系统采用 向量语义搜索 + BM25 关键词匹配 的双路召回策略,通过 RRF(Reciprocal Rank Fusion) 融合排序返回最优结果。技术选型
| 组件 | 技术 | 说明 |
|---|---|---|
| 向量存储 | PostgreSQL pgvector(langchain-postgres PGVector) | 向量 + 元数据过滤,支持余弦相似度 |
| Embedding | OpenAI text-embedding-3-small(默认) | 支持用户自定义 Embedding 模型 |
| 关键词检索 | BM25(rank-bm25 + jieba 中文分词) | 三层缓存(内存 → Redis → PostgreSQL),懒加载 |
| 文档解析 | LangChain Document Loaders + SmartChunker | 多格式支持 + 语义感知分块 |
| 元数据存储 | Next.js API(Drizzle ORM + PostgreSQL) | 知识库/文档 CRUD |
| Agent 框架 | DeepAgents(LangGraph) | Agentic RAG 工具集成 |
数据流总览
文档处理
多格式上传、SmartChunker 智能分块、处理管线
向量存储
pgvector 存储、用户级 Embedding 配置
检索策略
双路召回、RRF 融合、BM25 三层缓存
API 参考
知识库 / 文档管理 API、Agent 工具