← GEO Tutorial Series
FoundationsP1-03

AI搜索引擎是怎么工作的:Perplexity、ChatGPT、Google AI Overviews 机制全拆解

2026-03-28·26 min read

AI搜索引擎是怎么工作的:Perplexity、ChatGPT、Google AI Overviews 机制全拆解

所有主流AI搜索引擎的底层,都跑着同一套架构:RAG(检索增强生成)。 但架构相同,不代表行为相同。Perplexity 对 Reddit 上的新鲜内容情有独钟;ChatGPT Search 最爱引用维基百科;Google AI Overviews 则是先跑传统自然搜索再合成答案。同一篇文章,在这三个平台的引用概率可以天差地别。

想做 GEO,先得搞清楚这些系统在底层到底做了什么。把机制搞清楚,优化策略才有根基,不然就是在瞎蒙。关于 GEO 的基本概念,可以先看《GEO 是什么》

先把核心结论列出来:

  1. RAG是目前所有大语言模型的共同骨架 — 几个主流AI平台都经历「检索 → 重排序 → 生成」这三步,但每步的权重配置完全不同
  2. 90%的ChatGPT引用来自Google自然排名20名之外 — 自然排名高不等于被AI引用,两件事的评分逻辑完全独立
  3. Perplexity基本不引用6个月以上的内容 — 内容时效性在 Perplexity 是硬门槛,不是软加分
  4. Reddit是几个平台最重要的第三方来源 — Perplexity 引用里 Reddit 占 46.7%,Google AI Overviews 占 21%
  5. 只有11%的被引用域名跨平台出现 — 针对不同 AI 平台的优化策略必须差异化,没有一套通用打法

所有AI搜索引擎的共同底座:RAG机制

在拆解每个 AI 平台之前,先把共同框架讲清楚。

RAG,全称 Retrieval-Augmented Generation(检索增强生成)。它解决的核心问题是:大语言模型的训练数据有截止日期,参数知识是静态的——但用户的问题是实时的,需要最新信息。RAG 的做法是:先去外部检索相关内容,再把检索到的内容交给 LLM 生成回答。

具体流程分四步:

第一步:查询处理(Query Processing) 用户的输入不会直接丢进搜索。AI 系统会先理解查询意图,判断这个问题需不需要实时检索、属于哪个知识领域、用户期待的答案形式是什么(一句话、列表、还是详细解释)。

第二步:语义检索(Semantic Retrieval) 系统把查询转化成向量(一个几百维的数字数组),然后在预先建立好的内容向量数据库里找语义最相近的内容块。这不是关键词匹配——它比较的是语义距离。你的内容被事先切成约 500 token(约 350–400 个汉字)的分块,每块独立编码成向量。

第三步:重排序(Re-ranking) 初检通常会返回几十到几百个候选内容块。重排序阶段用精度更高的 cross-encoder 模型逐一评估每个候选块和查询的相关性,最终筛选出进入生成阶段的高质量内容。这一步是很多人忽略的关键环节——如果你的段落第一句是背景铺垫而不是结论,cross-encoder 给它的分数会系统性偏低。

第四步:生成(Generation) LLM 以检索到的内容为依据生成回答,并在回答里标注引用来源。不同平台在这一步的处理方式差异很大:有的平台把每个声明都归源到具体 URL(Perplexity),有的平台更多调用参数知识、只在需要时才引用(ChatGPT)。

这四步的细节,我在《RAG 系统详解》里有更完整的拆解。这里重点是:理解了 RAG,你就理解了为什么「首 chunk 原则」「命题式陈述」「FAQ 结构」这些 GEO 技巧有效——因为它们各自对应了 RAG 流程里具体的评分节点。


Google AI Overviews:传统自然搜索的AI延伸

Google AI Overviews 是目前覆盖范围最广的 AI 搜索功能。从 2025 年初的 6.49% 覆盖率,到年末已超过 18–20%,并在 200 个国家覆盖超过 20 亿月活用户。

它的工作流程是这样的:

  1. Google 首先判断这个查询是否适合生成 Overview——99.2% 的触发场景是信息类或比较类查询,如「什么是 X」「X 和 Y 有什么区别」「如何做 Y」。事务性查询(「买票」「登录」)几乎不会触发。
  2. 触发后,Google 先跑一次传统搜索,获取有机结果。
  3. 系统从排名靠前的页面中提取关键事实段落,同时也会扩大检索范围——被引用的页面并不一定就是自然排名最靠前的。
  4. LLM 整合多个来源,生成一段标注了来源的综合回答,并将引用文字映射回具体 URL。

引用偏好上,Google AI Overviews 明显偏爱社区和平台内容:Reddit 占引用来源的 21%,YouTube 占 18.8%,还有大量 Quora、LinkedIn 内容被引用。这个分布说明了一个重要现实:Google AI 信任的不只是你自己网站上写的内容,而是第三方平台上关于你的内容。

CTR 影响:当 AI Overviews 出现时,自然搜索第一名的点击率下降 61%,只有 8% 的用户还会点传统结果(Seer Interactive, 2025)。但如果你的品牌被 AI Overview 引用,你的点击率反而比未被引用的竞争对手高 35%。所以这不是「AI 搜索杀死自然搜索」的故事,而是「被引用的人吃到了双份流量,没被引用的人才是真正输家」。

关于如何针对这个平台优化,可以参考《如何优化 Google AI Overviews(SGE)》


Google AI Mode:另一套更激进的检索逻辑

很多人把 AI Overviews 和 AI Mode 混为一谈,但它们是完全不同的两个产品。

AI Mode 是 Google 在 google.com/aimode 提供的独立产品,不是嵌入在普通搜索结果页的 Overview banner。两者的核心区别在于检索方式:

AI OverviewsAI Mode
检索次数单轮合成(single-pass synthesis)多轮迭代检索(multi-turn iterative retrieval)
深度宽而快,覆盖多个来源深而精,可在一个主题内多次迭代
与有机排名重叠较高(先跑传统搜索)与有机结果重叠低于50%,URL重叠通常不到30%
内容深度偏好简洁、可提取的答案全面、深入的内容

AI Mode 的多轮迭代检索意味着什么?系统可以先检索一个主问题,读完内容后发现需要补充一个子问题,再检索一次,直到能给出完整回答。这对内容的要求不一样——AI Mode 更偏爱在一个主题上真正深入的内容,能支撑多轮问答的内容,而不只是能回答一个直接问题的短答案。

关于 Google AI Mode,最值得关注的一点是:AI Mode 中的结果跟自然搜索的结果只有 50% 重叠。传统 SEO 优化在 AI Mode 里的迁移率极低,需要单独针对和优化。


ChatGPT Search:最爱维基百科

ChatGPT Search(前身为 SearchGPT)是 OpenAI 在 GPT 生态中整合的实时搜索功能。每天处理约 25 亿次查询,周活跃用户超过 8 亿。

引用来源分布上,ChatGPT Search 有个非常清晰的偏好:Wikipedia 占引用来源的 47.9%,Reddit 仅占 1.8%,Forbes 占 1.1%。它追求的是百科全书式的权威性,而不是社区讨论的真实性。

最反直觉的数据:90% 的 ChatGPT 引用来自 Google 自然排名前 20 之外的页面Search Engine Land, 2025)。

这意味着什么?ChatGPT Search 在索引和评估内容时,走的是一套完全独立于 Google 的路径。你的 Google 排名对 ChatGPT 的引用决策几乎没有直接影响。

ChatGPT 还有一个跟其他平台不同的特点:参数知识与实时检索的混合架构。对于训练数据里已经覆盖的常识性内容,ChatGPT 倾向于直接从参数知识回答,不触发外部引用。触发实时引用的条件通常是:内容包含具体数字、当前时效性信息、或训练数据截止后发生的事实。

所以针对 ChatGPT 的优化策略很明确:专注于提供参数知识里没有的东西——原创数据、最新统计、你自己测试的结论,而不是泛泛的解释性内容。

关于ChatGPT Search 的具体优化策略,详见《如何优化 ChatGPT Search 和 SearchGPT》


Perplexity AI:最爱实时检索

Perplexity 在所有主流 AI 搜索平台里,是最「检索优先」的一个。它的核心设计哲学是:几乎所有回答都基于实时检索,不依赖参数知识。

关键数据:

  • 每次回答平均引用 21.87个来源(所有平台中最高)
  • Reddit 占引用来源的 46.7%(这个数字代表了 Perplexity 对「真实用户经验」的系统性偏好)
  • 月活用户4500万,月查询量7.8亿
  • 基本不会引用6个月以上的老内容——发布180天后,内容引用率降至37%

最后这一条是硬限制。如果你上次更新内容是 8 个月前,Perplexity 基本上已经把你踢出候选池了。

Perplexity 的另一个特点是按声明归源(per-claim citation):它不是在回答末尾列几个参考链接,而是每个具体声明都对应一个来源角标。这个设计倒逼了它的内容偏好——它倾向于引用那些每个段落都有具体、可独立提取的事实陈述的内容。

GoEast 网站在修复 robots.txt 放行 PerplexityBot 之后,六周内 Perplexity 的引用量出现了明显增长。在这之前,SEO 完全正常,只是在 Perplexity 里隐形——原因就是过激的爬虫屏蔽规则把 PerplexityBot 挡在门外了。这是成本最低的 GEO 修复,也是最容易被忽略的问题。

关于 Perplexity 的深度优化策略,参考《如何优化 Perplexity AI 引用》


Microsoft Copilot:依靠Bing排名

Microsoft Copilot(原 Bing Chat)直接建立在 Bing 搜索索引上。这意味着它跟其他 AI 平台有一个根本性的不同:如果你的页面没有在 Bing 上获得良好的排名,Copilot 基本上不会引用你

Copilot 的内容处理逻辑相对直接:

  1. 先通过 Bing 排名确定候选内容池
  2. 在候选内容里寻找可以直接提取的文本块
  3. 生成回答时优先选择结构清晰、每段只讲一个点的内容

Bing 在 2026 年 2 月 9 日发布了 Webmaster Tools AI Performance Report,这是目前所有 AI 平台里唯一一个官方提供引用追踪数据的工具。如果你在用 Microsoft 生态,这个工具是目前最直接的 GEO 效果反馈渠道——可以追踪 Grounding Queries(触发引用的查询)、引用曝光次数、从 AI 回答里的点击率。

同时建议通过 IndexNow 协议向 Bing 提交内容更新,速度比等待自然爬取快很多。

关于 Copilot 和其他小平台的优化,参考《如何优化 Bing Copilot、Claude Search 等 AI 助手》


Claude Search:最政治正确,最强调「中立与诚实」的平台

Claude 在搜索引用上,深受其 Constitutional AI(CAI,宪法式 AI)框架的影响。这套框架的核心原则是:帮助性、无害性、诚实性。这三个原则直接影响 Claude 倾向引用什么内容。

几个Claude特有的引用偏好:

偏爱权威中立语气:Claude 系统性回避营销味浓的内容。同样是介绍一个工具,写「这个工具帮助你 xxx,是市场上最 xxx 的选择」和写「这个工具的核心功能是 xxx,适合 xxx 场景,局限是 xxx」,后者被引用的概率高得多。

承认局限性反而加分:Claude 倾向引用那些在内容里明确说明「我们不确定的点」或「这个结论的适用边界是 xxx」的页面。表现出认知诚实的内容,被 Claude 引用的概率提升约 1.7 倍

事实密度优先:Claude 偏好引用精确数字 + 来源的内容,回避大量主观判断堆砌的内容。

这跟其他平台的一个根本区别在于:对 Claude 的内容优化,不是让内容「看起来更权威」,而是让内容「表现得更诚实」


AI如何选择引用来源:跨平台对比

把五个平台放在一起看,几个规律变得清晰:

平台最大引用来源新鲜度要求参数知识比重每次回答引用数
Google AI OverviewsReddit(21%)、YouTube(19%)中等3–7个
ChatGPT SearchWikipedia(48%)中等2–5个
PerplexityReddit(47%)极高(6个月硬限)极低21.87个
Copilot依赖Bing排名中等3–8个
Claude多元,偏学术中等2–6个

三个跨平台结论:

1. 只有 11% 的被引用网站在多个平台都出现(Knowledge Base 数据)。这意味着在一个平台上被引用,不能保证在另一个平台上也被引用。你需要了解每个平台的独特逻辑,而不是假设「做好内容就能通吃」。

2. Reddit 是跨平台最重要的第三方信号。Perplexity 里占 47%,Google AI Overviews 里占 21%,在所有被引用域名中,Reddit 占 22.9%——这是单一来源里最高的。有没有在相关 subreddit 里的真实用户讨论,是决定这两个平台引用你的关键因素之一。

3. 排名高不等于被引用。Google AI Overviews 会优先从传统搜索结果里提取,但 ChatGPT 和 Perplexity 的索引完全独立。针对 AI 引用的优化,需要独立于 SEO 排名优化来考量。

这也是《GEO vs SEO》里讲的核心矛盾:两套系统共用同一批内容,但评分逻辑完全不同。


你的内容策略需要调整什么

理解了每个平台的工作机制,有几件实际的事可以立刻做:

首先检查技术准入:你的 robots.txt 有没有屏蔽 OAI-SearchBot、PerplexityBot、ClaudeBot?这是最低成本的检查项。很多网站在使用安全插件或 CDN 时,会用过激的规则把所有非 Googlebot 的爬虫全部屏蔽。SEO 正常,AI 搜索里完全隐形。

然后看内容结构:每个 H2 节的第一句是背景铺垫还是直接结论?如果是前者,在 re-ranking 阶段你会系统性丢分。把主要段落改成「结论先行」的结构,是命中率最高的单项 GEO 改造。

最后考虑平台差异化:如果你最想被 Perplexity 引用,核心抓手是「新鲜度 + Reddit 存在感」;如果最想被 ChatGPT 引用,抓手是「原创数据 + 维基百科级百科深度」;如果最想被 Google AI Overviews 引用,抓手是「传统 SEO 排名 + FAQ 结构」。

这三个平台的优化路径,在各自的深度指南里有具体操作步骤。


常见问题

所有AI搜索引擎用的是同一套机制吗?

骨架相同(都是 RAG:检索 → 重排序 → 生成),但配置完全不同。Perplexity 几乎所有回答都实时检索;ChatGPT 会大量调用参数知识;Google AI Overviews 先跑传统搜索再合成。同一篇内容在三个平台里的表现可以完全不同。

排名高的页面会自动被AI引用吗?

不会自动。Google AI Overviews 因为先跑传统搜索,和有机排名的重叠度较高;但 ChatGPT Search 有 90% 的引用来自 Google 有机排名前 20 之外的页面。排名和被引用是两套独立的评分逻辑。

我应该先优化哪个平台?

取决于你的受众在哪里使用哪个平台。中国市场以外,Perplexity 的用户意图最精准(研究类查询为主);Google AI Overviews 覆盖面最广;ChatGPT 转化率最高(ChatGPT 带来的流量虽然只占总量的 0.5%,但带来的注册转化占 12.1%)。先修好共同基础(robots.txt、内容结构、首句法则),再针对主要目标平台做专项优化。

为什么我的内容Google排名很好但AI不引用?

最常见的三个原因:一是 robots.txt 屏蔽了 AI 爬虫;二是内容结构不适合 RAG 提取(段落太长、没有自包含结论、没有 FAQ);三是内容时效性不够(特别是 Perplexity,6 个月以上基本不引用)。

RAG检索和传统关键词搜索的本质区别是什么?

传统搜索做的是关键词匹配——你的页面里有没有这个词。RAG 做的是语义匹配——你的内容块和用户查询的意图相不相近。同义词、换一种问法、用词不同但意思相同的查询,在语义检索里都可以命中;在传统关键词搜索里则可能完全找不到。这也是为什么针对 AI 引用的写法,强调「把意思说清楚」而不是「把关键词塞够」。