核心架构
系统采用 向量语义搜索 + BM25 关键词匹配 的双路召回策略,通过 RRF(Reciprocal Rank Fusion) 融合排序返回最优结果。技术选型
| 组件 | 技术 | 说明 |
|---|---|---|
| 向量存储 | PostgreSQL pgvector(langchain-postgres PGVector) | 向量 + 元数据过滤,支持余弦相似度 |
| Embedding | OpenAI text-embedding-3-small(默认) | 支持用户自定义 Embedding 模型 |
| 关键词检索 | BM25(rank-bm25 + jieba 中文分词) | 三层缓存(内存 → Redis → PostgreSQL),懒加载 |
| 文档解析 | LangChain Document Loaders + SmartChunker | 多格式支持 + 语义感知分块 |
| 元数据存储 | Next.js API(Drizzle ORM + PostgreSQL) | 知识库/文档 CRUD |
| Agent 框架 | DeepAgents(LangGraph) | Agentic RAG 工具集成 |