← 返回文章列表

GEO AI 引用追踪:我如何衡量内容在 AI 搜索里的可见度

2026-04-20·11 min read

2023 年底,我开始认真想一个问题:如果用户不再点击搜索结果,而是直接从 AI 的回答里获取信息,GoEast 的内容还能被找到吗?

那时候 ChatGPT 刚刚普及不到一年,Perplexity 还在早期,Google AI Overviews 还没有正式推出。大多数人还在讨论「AI 会不会取代搜索引擎」,而不是「我的内容怎么在 AI 搜索里出现」。

我不知道答案,但我知道等答案明确了再动手就晚了。

GEO——Generative Engine Optimization——就是从那时候开始在 GoEast 落地的。


AI 怎么决定引用什么

做优化之前,得先搞清楚 AI 搜索引擎跟传统搜索引擎到底有什么本质不同。

传统 Google 搜索排名的核心逻辑是:相关性 + 权威性 + 用户体验。你的页面得出现在搜索结果页,然后用户点进来。

AI 搜索(ChatGPT、Perplexity、Google AI Overviews)的逻辑不一样。它的底层是 RAG(Retrieval-Augmented Generation):先从索引里检索相关文档,再用 LLM 生成回答,同时引用来源。

所以两件事很关键:被检索到的前提还是内容被收录、有一定权威信号;被引用的关键是内容结构是否匹配 LLM 的提取逻辑——清晰的命题式表述、有深度的信息密度、能被独立引用的段落。

传统 SEO 的很多东西依然有效(高质量内容、外链、技术健康),但有几个维度需要额外关注。


GoEast 的 GEO 内容架构

我为 GoEast 搭了一套专门针对 AI 引用优化的内容架构:60 篇文章,覆盖中文学习的核心话题;11 个内容支柱(发音与声调、汉字学习、语法基础、口语表达、词汇积累、HSK 备考、商务中文、儿童中文、文化背景、学习方法论、工具与资源);大约 199,000 词的总内容量。

这套架构跟 SEO 的 topic map 是一体的——同一套内容,既服务传统搜索排名,也服务 AI 引用。两者的选题逻辑高度重合,但写法上有一些 GEO 特有的要求。

关于 topic map 的整体结构,详见:GoEast 中文学习 topic map:从零搭建内容增长地图


GEO 写作的几个核心原则

这些原则不是我发明的,是我从大量测试和观察里归纳出来的。

每段的第一句话必须是命题式表述

AI 在提取内容时,倾向于抓取能独立成立的信息单元。一段话如果第一句是铺垫或过渡,AI 可能不会引用这段。

不好的写法:

关于普通话的四个声调,很多初学者都觉得很难……

好的写法:

普通话有四个声调,每个声调对应不同的音调曲线:第一声平调(阴平)、第二声升调(阳平)、第三声降升调(上声)、第四声降调(去声)。

第二种写法可以被 AI 直接引用为一个完整的信息单元,第一种不行。

包含可被独立引用的「事实密度」

AI 更倾向于引用包含具体信息的内容,而不是泛泛的观点。数字、定义、步骤、对比——这些都是「可引用性」高的内容形式。

一篇讲 HSK 考试的文章,如果只说「HSK 是中国的汉语水平考试,对外国人很重要」,AI 不太会引用。但如果写「HSK 分为 6 个等级,HSK 4 级要求掌握约 1,200 个词汇,通过后可以申请大多数中国高校的本科入学」,这个信息就有被引用的价值。

FAQ 结构

Perplexity 等 AI 搜索引擎高度偏好直接回答问题的内容。文章末尾加一个 FAQ 模块,针对目标话题的常见问题给出简洁、直接的回答,是提高 AI 引用率的有效手段。

避免「AI 腔」

这一条有点反直觉,但很重要:如果一篇文章读起来像是 AI 写的,它被 AI 引用的概率反而更低。AI 搜索引擎在训练和检索过程中,对「高质量、有人味的人类写作」有更高的信任度。

具体来说:不用"总而言之""值得注意的是""不可否认"这类典型的 AI 输出套语;句式有变化;有具体的例子和第一人称的判断,而不只是中立的陈述。


追踪 AI 引用:没有官方工具,我用的笨办法

这是 GEO 和传统 SEO 最大的差异之一——传统 SEO 有 GSC 看排名和点击,GEO 没有现成的官方工具。

我用了几种方法组合追踪。

方法一:GA4 referral 来源监测

ChatGPT、Perplexity 等 AI 工具引导用户点击来源链接时,referral traffic 会出现在 GA4 里。在 GA4 的"流量获取"报告里,能看到来自 perplexity.aichat.openai.com 等域名的 session 数量。

这个方法只能追踪"AI 引用后用户点了链接"的情况,追踪不到"AI 引用了但用户没点"的情况。但它是最可靠的量化指标——有点击就代表有真实的可见度。

方法二:手动抽查

定期在 ChatGPT、Perplexity、Gemini 里搜 GoEast 目标覆盖的话题,看回答里有没有引用 GoEast 的内容,引用的是哪篇的哪段。

这个方法效率低,但信息量高。通过手动抽查,我能看到:

  • 哪类话题 GoEast 的内容已经进入 AI 的答案
  • 哪类话题还没有,需要补充或优化
  • AI 引用的具体是哪段话——这个反馈能指导写法的迭代

方法三:品牌词监测

在 ChatGPT 和 Perplexity 里直接搜"GoEast Mandarin",看 AI 对品牌的描述准不准、有没有引用官网内容、有没有推荐 GoEast 作为选项之一。

这个维度更接近"品牌在 AI 心智里的位置",不只是单篇文章的可见度。


目前的结果和判断

GoEast 的 GEO 工作从 2023 年底开始,到我离开时(2026 年 5 月)积累了大约两年半。

GA4 里,来自 Perplexity 的 referral traffic 从无到有,持续增长。ChatGPT 的 referral 追踪比较难(很多用户通过 app 访问,不留下 referral 来源),但手动抽查能看到 GoEast 的内容在多个话题下被引用。

更重要的是,GEO 的投入和传统 SEO 的投入高度重叠——同一套内容,既优化了 Google 排名,也提升了 AI 引用率。这不是两个独立的工作,是一套工作在两个渠道上的收益。

这一点让 GEO 的 ROI 比很多人想象的要高。


为什么现在做还不晚

写这篇文章的时候(2026 年),AI 搜索已经不是"未来趋势"了,它是现实。但绝大多数品牌——尤其是中小规模的、没有专职 SEO 团队的——仍然没在认真对待 GEO。

这意味着现在进入的门槛还比较低。不需要特别大的内容体量,不需要特别高的域名权重,只需要在内容质量和结构上做对一些关键的事。

在中文学习这个垂类里,GoEast 是比较早认真做这件事的。这个先发优势是真实的——AI 的训练数据有时滞,早期被大量引用的内容,在后续的模型版本里往往也有更高的权重。


这篇文章是 GoEast Mandarin 全案复盘 的一部分。

GoEast 整体 SEO 增长的策略:GoEast SEO 增长:从 10K 到 30K+ 自然点击

支撑 GEO 内容的 analytics 体系:GA4 + Looker Studio 仪表盘:怎么让数据真正可用

GEO 内容架构依赖一套完整的 topic map,详见:GoEast 中文学习 topic map:从零搭建内容增长地图

词汇测试工具本身也是一个 GEO 资产——它的页面结构和信息密度天然适合被 AI 引用:中文词汇测试系统:三天,1,500+ 封邮箱