Other Beginner Markdown

Personal Knowledge Base with RAG - 个人知识库 RAG

把任何 URL 丢进 Telegram,自动摄入内容并建立可搜索的知识库,用自然语言查询你保存过的任何内容。

openclawai-agentsknowledge-baseragresearch

Personal Knowledge Base with RAG

把任何 URL 丢进 Telegram 或 Slack,自动摄入内容并建立可搜索的知识库。

解决什么问题

你每天阅读文章、推文、观看视频,但永远找不到上周看到的那一条。书签堆积成山变得毫无用处。

功能特点

  • 自动摄入:把 URL 丢进 Telegram Topic,自动抓取内容
  • 语义搜索:搜索你保存过的任何内容,如”我保存过关于 agent memory 的什么?”
  • 工作流集成:其他工作流可以查询知识库获取相关内容

RAG 实现说明

向量存储方案

方案特点适用场景
Chroma轻量级,易上手个人知识库
Pinecone云端托管,可扩展团队知识库
Qdrant自托管,向量搜索强需要私有部署

嵌入模型

模型维度说明
text-embedding-3-small1536OpenAI 新版,更便宜
bge-large-zh1024中文优化

如何设置

第一步:安装 knowledge-base skill

npx clawhub@latest install knowledge-base

第二步:配置 Agent

When I drop a URL in the "knowledge-base" topic:
1. Fetch the content (article, tweet, YouTube transcript, PDF)
2. Split into chunks (500 tokens each)
3. Generate embeddings and store in Chroma
4. Reply with confirmation

When I ask a question:
1. Generate embedding for the query
2. Search Chroma for top 5 similar chunks
3. Return results with sources

成本估算

组件成本
Chroma(本地)免费
向量存储(云端)$5-20/月
OpenAI Embedding API$0.0001/1K tokens

相关链接