首頁  /  部落格  /  Claude Code

5 分鐘建好 AI 知識庫,token 用量少 95%

你有沒有這種感覺——跟 AI 聊了一小時,隔天開新對話,它什麼都不記得了。

Andrej Karpathy 提出了一個解法:不需要 RAG,不需要 vector database,就只是一個資料夾,讓 Claude Code 幫你自動整理成可查詢的 AI 知識庫。


為什麼 token 用量少 95%

傳統 RAG 的流程是:把所有文件向量化,查詢時搜尋相似度,把相關段落塞進 context 窗口。這個過程本身就需要大量運算和 tokens。

LLM Wiki 的方式完全不同:你讓 AI 事先把知識整理成結構化的 markdown 檔案,查詢時只讀相關的幾個文件。context 窗口裡放的是已經整理好的摘要,不是原始文件。少了向量搜尋、少了大量原始文字,token 用量自然下降了 95%。

四層架構

LLM Wiki 的結構很簡單,四個層次:

這個設計的邏輯很清楚:raw 是事實,wiki 是理解,index 是地圖,log 是歷史

LLM Wiki Prompt 怎麼運作

「LLM Wiki Prompt」不是一個 prompt,是一份給 AI 的工作說明書。它定義了 AI 處理知識庫的三個操作:

Ingest 是這個系統的核心。每次 ingest 一份新資料,知識庫就長大一張網——新頁面和舊頁面之間建立連結,整個知識庫越來越立體。

五個你可以馬上開始建的知識庫

LLM Wiki vs RAG:怎麼選

這兩個不是競爭關係,是不同問題的不同解法。

如果你的問題是「AI 不記得我的背景知識」,用 LLM Wiki。
如果你的問題是「我有幾千份文件需要語意搜尋」,用 RAG。

LLM Wiki 適合中等規模、結構清楚的知識——幾十到幾百份來源。超過這個規模,或者需要精確的語意匹配,RAG 才是對的工具。

用 CLAUDE.md 把知識庫接進專案

建好 LLM Wiki 之後,在你的專案 CLAUDE.md 裡加一條規則:告訴 Claude Code 在哪裡找知識庫、什麼時候要去查。這樣每次開新對話,AI 都知道它有這個知識庫可以用,不需要你每次重新解釋背景。

一個主題建一個獨立 vault,不要把所有知識混在一起。主題清楚,index 才有意義,AI 找起來才準確。


完整的設定流程和實際操作示範,都在上面的影片裡。

← 返回部落格

想把 AI 導入你的工作?

預約免費的 30 分鐘 Discovery Call,了解 AI 自動化如何適合你的情況。

預約免費諮詢 →