一句話總結: 從日常搜尋體驗出發,理解 Google 三步機制和 AI 三層檢索,掌握「可提取性」這個在 AI 搜尋時代最關鍵的新概念。 

關於本系列的虛擬案例:「風塵揚咖啡」是一個虛擬的手沖咖啡教學網站,專門用來示範 SEO 操作。所有數據與情境皆為教學用途。


你打開 Google,輸入手沖咖啡怎麼沖,按下 Enter。不到一秒,畫面上出現了十個結果。

你再打開 ChatGPT,問一樣的問題。它直接給你一段完整的步驟說明,還附上了幾個參考來源。

這兩個場景,你每天都在經歷。但你有沒有想過,這些結果,是怎麼決定的?

不是隨機的。不是誰付錢給 Google 就排第一(那是廣告,搜尋結果是另一回事)。

也不是 ChatGPT 憑感覺推薦的。背後有一套運作機制。理解這套機制,是學 SEO 的第一步。

1. 搜尋引擎只做三件事

把複雜的系統化繁為簡,搜尋引擎其實只做三件事:

① 爬取,發現你的存在

Google 有一群叫爬蟲的自動程式,24 小時不停地在網路上爬行,從一個網頁的連結跳到另一個網頁。

每發現一個新頁面,就把內容記錄下來帶回伺服器。

如果你的網頁沒有任何其他網站連結到它,爬蟲就找不到它,就像一座沒有路通向的孤島。

② 索引,理解你在講什麼

爬蟲帶回內容後,Google 要理解這個網頁在講什麼,這個過程叫索引。

它會分析標題、內文、圖片、連結,然後分類存檔,就像圖書館員把新書依主題上架。

如果 Google 看不懂你的網頁(比如內容全靠 JavaScript 動態載入、沒有文字),就無法正確分類,搜尋時就找不到你。

③ 排名,決定你排第幾

當有人搜尋手沖咖啡怎麼沖,Google 從索引庫裡找到所有相關頁面,可能有幾十萬個,然後選出最好的十個按順序排列。

Google 有超過 200 個排名因素,但最核心的邏輯只有兩條:

  • 相關性:你的內容和使用者搜尋的東西有多匹配
  • 權威性:有多少其他網站透過連結「推薦」你

📌 爬取 = 發現你的存在。索引 = 理解你是誰。排名 = 決定你排第幾。三步缺一不可。

2. 風塵揚咖啡的例子

假設你有一個手沖咖啡教學網站風塵揚咖啡,你剛寫了一篇手沖咖啡入門:從選豆到沖煮的完整步驟,發佈到 WordPress 上。

爬取階段: Google 爬蟲大概在 1 到 7 天內會發現這篇文章(有提交 Sitemap 會更快)。但如果是全新網站、沒有其他網站連結,爬蟲可能要幾週才來。

索引階段: 爬蟲讀了你的文章,發現標題是手沖咖啡入門,內文討論了 V60、水溫、研磨度、粉水比例,Google 把它歸類到手沖咖啡,咖啡教學等類別下。

排名階段: 當有人搜尋手沖咖啡怎麼沖,Google 找到你的文章和其他幾萬篇同主題文章。新站大概率排在第五頁以後,幾乎沒人看到,這就是 SEO 要解決的問題:怎麼讓你的網頁排名往前進。

3. ChatGPT 出現之後,規則變了

2024 年以前,搜尋就是 Google 的遊戲,目標很簡單:排名越高越好。

然後 ChatGPT 加入了搜尋功能,Perplexity 快速崛起,Google 自己也在搜尋結果頂端加入了 AI 生成的回答。

以前 現在
輸入關鍵字 → 看十個連結 → 逐一點開 → 自己找答案 問一個問題 → AI 直接給完整回答 → 順便附上來源網站

這不只是多了一個管道,它改變了遊戲規則。

在 Google 的世界裡,排第 11 名和第 10 名,差距是 95% 的流量。

在 AI 搜尋的世界裡,一項涵蓋 55,936 個查詢的研究發現:37% 被 AI 引用的網站,根本不在 Google 前十名。

這對新網站來說,是 25 年來第一次出現的破局機會,你不需要先在 Google 爬到前十,AI 有可能直接引用你。

4. AI 搜尋是怎麼運作的三層機制

Google 搜尋的三步你已經懂了:爬取→索引→排名。AI 搜尋也有自己的三步。

第一層:預訓練知識

ChatGPT 上線之前,已經讀過了網路上海量的文字,維基百科、新聞網站、論壇、學術論文。

如果你的內容在這些地方被頻繁提到,ChatGPT 在訓練階段就記住了你。

這一層很難短期改變,是過去的積累。

第二層:實時搜尋

當 ChatGPT 開啟搜尋功能回答問題時,它實際上先用搜尋引擎(Bing)搜了一遍,拿到排名靠前的結果。

Perplexity 用的是 Google,Gemini 也用 Google。

這意味著:傳統搜尋排名仍然是 AI 獲取資訊的主要通道。

如果你在 Google 排不進去,大多數 AI 也搜不到你。

這就是為什麼 SEO 仍然重要,它是 AI 搜尋的入場券。

第三層:選擇過濾,AI 決定引用誰

AI 從搜尋結果拿到 10 到 20 個候選頁面,然後決定:引用哪幾個?從每個頁面提取哪段話?

這一層是 AI 搜尋獨有的。

Google 只排名不提取;AI 要從你的頁面裡挖出一段話,直接放進回答裡。

這就引出了一個在 AI 搜尋時代最重要的新概念:可提取性(Extractability)

5. 可提取性:AI 時代最關鍵的新概念

你的文章能不能被 AI 引用,不只取決於排名,還取決於你的內容有沒有辦法被提取出來獨立使用。

看兩個例子:

低可提取性: 考量到以上各種因素,這款咖啡壺整體來說表現不錯,詳細分析請見前文。

這段話脫離了上下文,什麼都沒說,AI 不會引用它。

高可提取性: Hario V60 02 在 SCA 標準測試中,以 93°C 水溫、研磨度刻度 4、粉水比 1:15 沖煮,萃取率穩定落在 18 到 22% 的黃金區間。

這段話完全獨立,有數據、有來源、有具體條件。

AI 可以直接把它放進回答裡。

Princeton 大學的研究發現,內容加入統計數據後,AI 引用率提升 86%,而關鍵字堆砌不只對 AI 無效,引用率反而下降 22%。

可提取性的五個基本原則:

  1. 每個核心觀點配一個具體數據
  2. 結論前置,不要讓讀者自己推理
  3. 避免「如前所述」「詳見上文」這類需要上下文的說法
  4. 用 FAQ 格式呈現常見問題(這個格式和 AI 的問答邏輯最匹配)
  5. 每段話單獨拿出來,要能讓沒看過全文的人也看得懂

這五條原則,會在後面每一篇都用到。

這篇講了什麼

  • 搜尋引擎三步: 爬取→索引→排名,每一步都可能讓你的內容消失
  • AI 搜尋三層: 預訓練→實時搜尋→選擇過濾,SEO 仍然是入場券
  • 可提取性: 不只要排名,還要讓 AI 能直接引用你的內容
  • 破局機會: 37% 被 AI 引用的內容不在 Google 前十——對新網站是真實的機會