一句話總結: 從日常搜尋體驗出發,理解 Google 三步機制和 AI 三層檢索,掌握「可提取性」這個在 AI 搜尋時代最關鍵的新概念。
關於本系列的虛擬案例:「風塵揚咖啡」是一個虛擬的手沖咖啡教學網站,專門用來示範 SEO 操作。所有數據與情境皆為教學用途。
你打開 Google,輸入手沖咖啡怎麼沖,按下 Enter。不到一秒,畫面上出現了十個結果。
你再打開 ChatGPT,問一樣的問題。它直接給你一段完整的步驟說明,還附上了幾個參考來源。
這兩個場景,你每天都在經歷。但你有沒有想過,這些結果,是怎麼決定的?
不是隨機的。不是誰付錢給 Google 就排第一(那是廣告,搜尋結果是另一回事)。
也不是 ChatGPT 憑感覺推薦的。背後有一套運作機制。理解這套機制,是學 SEO 的第一步。
1. 搜尋引擎只做三件事
把複雜的系統化繁為簡,搜尋引擎其實只做三件事:
① 爬取,發現你的存在
Google 有一群叫爬蟲的自動程式,24 小時不停地在網路上爬行,從一個網頁的連結跳到另一個網頁。
每發現一個新頁面,就把內容記錄下來帶回伺服器。
如果你的網頁沒有任何其他網站連結到它,爬蟲就找不到它,就像一座沒有路通向的孤島。
② 索引,理解你在講什麼
爬蟲帶回內容後,Google 要理解這個網頁在講什麼,這個過程叫索引。
它會分析標題、內文、圖片、連結,然後分類存檔,就像圖書館員把新書依主題上架。
如果 Google 看不懂你的網頁(比如內容全靠 JavaScript 動態載入、沒有文字),就無法正確分類,搜尋時就找不到你。
③ 排名,決定你排第幾
當有人搜尋手沖咖啡怎麼沖,Google 從索引庫裡找到所有相關頁面,可能有幾十萬個,然後選出最好的十個按順序排列。
Google 有超過 200 個排名因素,但最核心的邏輯只有兩條:
- 相關性:你的內容和使用者搜尋的東西有多匹配
- 權威性:有多少其他網站透過連結「推薦」你
📌 爬取 = 發現你的存在。索引 = 理解你是誰。排名 = 決定你排第幾。三步缺一不可。
2. 風塵揚咖啡的例子
假設你有一個手沖咖啡教學網站風塵揚咖啡,你剛寫了一篇手沖咖啡入門:從選豆到沖煮的完整步驟,發佈到 WordPress 上。
爬取階段: Google 爬蟲大概在 1 到 7 天內會發現這篇文章(有提交 Sitemap 會更快)。但如果是全新網站、沒有其他網站連結,爬蟲可能要幾週才來。
索引階段: 爬蟲讀了你的文章,發現標題是手沖咖啡入門,內文討論了 V60、水溫、研磨度、粉水比例,Google 把它歸類到手沖咖啡,咖啡教學等類別下。
排名階段: 當有人搜尋手沖咖啡怎麼沖,Google 找到你的文章和其他幾萬篇同主題文章。新站大概率排在第五頁以後,幾乎沒人看到,這就是 SEO 要解決的問題:怎麼讓你的網頁排名往前進。
3. ChatGPT 出現之後,規則變了
2024 年以前,搜尋就是 Google 的遊戲,目標很簡單:排名越高越好。
然後 ChatGPT 加入了搜尋功能,Perplexity 快速崛起,Google 自己也在搜尋結果頂端加入了 AI 生成的回答。
| 以前 | 現在 |
|---|---|
| 輸入關鍵字 → 看十個連結 → 逐一點開 → 自己找答案 | 問一個問題 → AI 直接給完整回答 → 順便附上來源網站 |
這不只是多了一個管道,它改變了遊戲規則。
在 Google 的世界裡,排第 11 名和第 10 名,差距是 95% 的流量。
在 AI 搜尋的世界裡,一項涵蓋 55,936 個查詢的研究發現:37% 被 AI 引用的網站,根本不在 Google 前十名。
這對新網站來說,是 25 年來第一次出現的破局機會,你不需要先在 Google 爬到前十,AI 有可能直接引用你。
4. AI 搜尋是怎麼運作的三層機制
Google 搜尋的三步你已經懂了:爬取→索引→排名。AI 搜尋也有自己的三步。
第一層:預訓練知識
ChatGPT 上線之前,已經讀過了網路上海量的文字,維基百科、新聞網站、論壇、學術論文。
如果你的內容在這些地方被頻繁提到,ChatGPT 在訓練階段就記住了你。
這一層很難短期改變,是過去的積累。
第二層:實時搜尋
當 ChatGPT 開啟搜尋功能回答問題時,它實際上先用搜尋引擎(Bing)搜了一遍,拿到排名靠前的結果。
Perplexity 用的是 Google,Gemini 也用 Google。
這意味著:傳統搜尋排名仍然是 AI 獲取資訊的主要通道。
如果你在 Google 排不進去,大多數 AI 也搜不到你。
這就是為什麼 SEO 仍然重要,它是 AI 搜尋的入場券。
第三層:選擇過濾,AI 決定引用誰
AI 從搜尋結果拿到 10 到 20 個候選頁面,然後決定:引用哪幾個?從每個頁面提取哪段話?
這一層是 AI 搜尋獨有的。
Google 只排名不提取;AI 要從你的頁面裡挖出一段話,直接放進回答裡。
這就引出了一個在 AI 搜尋時代最重要的新概念:可提取性(Extractability)。
5. 可提取性:AI 時代最關鍵的新概念
你的文章能不能被 AI 引用,不只取決於排名,還取決於你的內容有沒有辦法被提取出來獨立使用。
看兩個例子:
低可提取性: 考量到以上各種因素,這款咖啡壺整體來說表現不錯,詳細分析請見前文。
這段話脫離了上下文,什麼都沒說,AI 不會引用它。
高可提取性: Hario V60 02 在 SCA 標準測試中,以 93°C 水溫、研磨度刻度 4、粉水比 1:15 沖煮,萃取率穩定落在 18 到 22% 的黃金區間。
這段話完全獨立,有數據、有來源、有具體條件。
AI 可以直接把它放進回答裡。
Princeton 大學的研究發現,內容加入統計數據後,AI 引用率提升 86%,而關鍵字堆砌不只對 AI 無效,引用率反而下降 22%。
可提取性的五個基本原則:
- 每個核心觀點配一個具體數據
- 結論前置,不要讓讀者自己推理
- 避免「如前所述」「詳見上文」這類需要上下文的說法
- 用 FAQ 格式呈現常見問題(這個格式和 AI 的問答邏輯最匹配)
- 每段話單獨拿出來,要能讓沒看過全文的人也看得懂
這五條原則,會在後面每一篇都用到。
這篇講了什麼
- 搜尋引擎三步: 爬取→索引→排名,每一步都可能讓你的內容消失
- AI 搜尋三層: 預訓練→實時搜尋→選擇過濾,SEO 仍然是入場券
- 可提取性: 不只要排名,還要讓 AI 能直接引用你的內容
- 破局機會: 37% 被 AI 引用的內容不在 Google 前十——對新網站是真實的機會