你有沒有這種感覺——跟 AI 聊了一小時,隔天開新對話,它什麼都不記得了。
Andrej Karpathy 提出了一個解法:不需要 RAG,不需要 vector database,就只是一個資料夾,讓 Claude Code 幫你自動整理成可查詢的 AI 知識庫。
為什麼 token 用量少 95%
傳統 RAG 的流程是:把所有文件向量化,查詢時搜尋相似度,把相關段落塞進 context 窗口。這個過程本身就需要大量運算和 tokens。
LLM Wiki 的方式完全不同:你讓 AI 事先把知識整理成結構化的 markdown 檔案,查詢時只讀相關的幾個文件。context 窗口裡放的是已經整理好的摘要,不是原始文件。少了向量搜尋、少了大量原始文字,token 用量自然下降了 95%。
四層架構
LLM Wiki 的結構很簡單,四個層次:
- raw/:原始來源,不動。你的逐字稿、會議記錄、研究文章都放這裡。
- wiki/:整理過的知識頁面,按主題分類。AI 讀這裡,不讀 raw。
- index.md:導覽地圖。列出所有 wiki 頁面和一行摘要,讓 AI 知道去哪裡找什麼。
- log.md:活動記錄,追加式。每次 ingest 或查詢都記一筆。
這個設計的邏輯很清楚:raw 是事實,wiki 是理解,index 是地圖,log 是歷史。
LLM Wiki Prompt 怎麼運作
「LLM Wiki Prompt」不是一個 prompt,是一份給 AI 的工作說明書。它定義了 AI 處理知識庫的三個操作:
- Ingest:讀一份新來源,整理成 wiki 頁面,更新 index 和 log
- Query:根據問題,讀 index → 找相關頁面 → 給出有來源引用的回答
- Lint:掃描整個 wiki,找出孤立頁面、矛盾內容、缺失的連結
Ingest 是這個系統的核心。每次 ingest 一份新資料,知識庫就長大一張網——新頁面和舊頁面之間建立連結,整個知識庫越來越立體。
五個你可以馬上開始建的知識庫
- YouTube 逐字稿庫:每支影片 ingest 一次,建立主題索引和跨影片連結
- 會議記錄庫:把每次會議的重點整理成可查詢的決策記錄
- AI 工具研究庫:追蹤你試過的工具、優缺點、和使用情境
- 客戶溝通庫:把客戶反饋、需求變更、重要討論結構化
- 個人學習庫:書、文章、課程的重點摘要,按主題連結
LLM Wiki vs RAG:怎麼選
這兩個不是競爭關係,是不同問題的不同解法。
如果你的問題是「AI 不記得我的背景知識」,用 LLM Wiki。
如果你的問題是「我有幾千份文件需要語意搜尋」,用 RAG。
LLM Wiki 適合中等規模、結構清楚的知識——幾十到幾百份來源。超過這個規模,或者需要精確的語意匹配,RAG 才是對的工具。
用 CLAUDE.md 把知識庫接進專案
建好 LLM Wiki 之後,在你的專案 CLAUDE.md 裡加一條規則:告訴 Claude Code 在哪裡找知識庫、什麼時候要去查。這樣每次開新對話,AI 都知道它有這個知識庫可以用,不需要你每次重新解釋背景。
一個主題建一個獨立 vault,不要把所有知識混在一起。主題清楚,index 才有意義,AI 找起來才準確。
完整的設定流程和實際操作示範,都在上面的影片裡。