Personal Knowledge Base with RAG - 个人知识库 RAG
把任何 URL 丢进 Telegram,自动摄入内容并建立可搜索的知识库,用自然语言查询你保存过的任何内容。
openclawai-agentsknowledge-baseragresearch
Personal Knowledge Base with RAG
把任何 URL 丢进 Telegram 或 Slack,自动摄入内容并建立可搜索的知识库。
解决什么问题
你每天阅读文章、推文、观看视频,但永远找不到上周看到的那一条。书签堆积成山变得毫无用处。
功能特点
- 自动摄入:把 URL 丢进 Telegram Topic,自动抓取内容
- 语义搜索:搜索你保存过的任何内容,如”我保存过关于 agent memory 的什么?”
- 工作流集成:其他工作流可以查询知识库获取相关内容
RAG 实现说明
向量存储方案
| 方案 | 特点 | 适用场景 |
|---|---|---|
| Chroma | 轻量级,易上手 | 个人知识库 |
| Pinecone | 云端托管,可扩展 | 团队知识库 |
| Qdrant | 自托管,向量搜索强 | 需要私有部署 |
嵌入模型
| 模型 | 维度 | 说明 |
|---|---|---|
| text-embedding-3-small | 1536 | OpenAI 新版,更便宜 |
| bge-large-zh | 1024 | 中文优化 |
如何设置
第一步:安装 knowledge-base skill
npx clawhub@latest install knowledge-base
第二步:配置 Agent
When I drop a URL in the "knowledge-base" topic:
1. Fetch the content (article, tweet, YouTube transcript, PDF)
2. Split into chunks (500 tokens each)
3. Generate embeddings and store in Chroma
4. Reply with confirmation
When I ask a question:
1. Generate embedding for the query
2. Search Chroma for top 5 similar chunks
3. Return results with sources
成本估算
| 组件 | 成本 |
|---|---|
| Chroma(本地) | 免费 |
| 向量存储(云端) | $5-20/月 |
| OpenAI Embedding API | $0.0001/1K tokens |