GEO AI 引用追踪：我如何衡量内容在 AI 搜索里的可见度

2023 年底，我开始认真想一个问题：如果用户不再点击搜索结果，而是直接从 AI 的回答里获取信息，GoEast 的内容还能被找到吗？

那时候 ChatGPT 刚刚普及不到一年，Perplexity 还在早期，Google AI Overviews 还没有正式推出。大多数人还在讨论「AI 会不会取代搜索引擎」，而不是「我的内容怎么在 AI 搜索里出现」。

我不知道答案，但我知道等答案明确了再动手就晚了。

GEO——Generative Engine Optimization——就是从那时候开始在 GoEast 落地的。

AI 怎么决定引用什么

做优化之前，得先搞清楚 AI 搜索引擎跟传统搜索引擎到底有什么本质不同。

传统 Google 搜索排名的核心逻辑是：相关性 + 权威性 + 用户体验。你的页面得出现在搜索结果页，然后用户点进来。

AI 搜索（ChatGPT、Perplexity、Google AI Overviews）的逻辑不一样。它的底层是 RAG（Retrieval-Augmented Generation）：先从索引里检索相关文档，再用 LLM 生成回答，同时引用来源。

所以两件事很关键：被检索到的前提还是内容被收录、有一定权威信号；被引用的关键是内容结构是否匹配 LLM 的提取逻辑——清晰的命题式表述、有深度的信息密度、能被独立引用的段落。

传统 SEO 的很多东西依然有效（高质量内容、外链、技术健康），但有几个维度需要额外关注。

GoEast 的 GEO 内容架构

我为 GoEast 搭了一套专门针对 AI 引用优化的内容架构：60 篇文章，覆盖中文学习的核心话题；11 个内容支柱（发音与声调、汉字学习、语法基础、口语表达、词汇积累、HSK 备考、商务中文、儿童中文、文化背景、学习方法论、工具与资源）；大约 199,000 词的总内容量。

这套架构跟 SEO 的 topic map 是一体的——同一套内容，既服务传统搜索排名，也服务 AI 引用。两者的选题逻辑高度重合，但写法上有一些 GEO 特有的要求。

关于 topic map 的整体结构，详见：GoEast 中文学习 topic map：从零搭建内容增长地图。

GEO 写作的几个核心原则

这些原则不是我发明的，是我从大量测试和观察里归纳出来的。

每段的第一句话必须是命题式表述

AI 在提取内容时，倾向于抓取能独立成立的信息单元。一段话如果第一句是铺垫或过渡，AI 可能不会引用这段。

不好的写法：

关于普通话的四个声调，很多初学者都觉得很难……

好的写法：

普通话有四个声调，每个声调对应不同的音调曲线：第一声平调（阴平）、第二声升调（阳平）、第三声降升调（上声）、第四声降调（去声）。

第二种写法可以被 AI 直接引用为一个完整的信息单元，第一种不行。

包含可被独立引用的「事实密度」

AI 更倾向于引用包含具体信息的内容，而不是泛泛的观点。数字、定义、步骤、对比——这些都是「可引用性」高的内容形式。

一篇讲 HSK 考试的文章，如果只说「HSK 是中国的汉语水平考试，对外国人很重要」，AI 不太会引用。但如果写「HSK 分为 6 个等级，HSK 4 级要求掌握约 1,200 个词汇，通过后可以申请大多数中国高校的本科入学」，这个信息就有被引用的价值。

FAQ 结构

Perplexity 等 AI 搜索引擎高度偏好直接回答问题的内容。文章末尾加一个 FAQ 模块，针对目标话题的常见问题给出简洁、直接的回答，是提高 AI 引用率的有效手段。

避免「AI 腔」

这一条有点反直觉，但很重要：如果一篇文章读起来像是 AI 写的，它被 AI 引用的概率反而更低。AI 搜索引擎在训练和检索过程中，对「高质量、有人味的人类写作」有更高的信任度。

具体来说：不用"总而言之""值得注意的是""不可否认"这类典型的 AI 输出套语；句式有变化；有具体的例子和第一人称的判断，而不只是中立的陈述。

追踪 AI 引用：没有官方工具，我用的笨办法

这是 GEO 和传统 SEO 最大的差异之一——传统 SEO 有 GSC 看排名和点击，GEO 没有现成的官方工具。

我用了几种方法组合追踪。

方法一：GA4 referral 来源监测

ChatGPT、Perplexity 等 AI 工具引导用户点击来源链接时，referral traffic 会出现在 GA4 里。在 GA4 的"流量获取"报告里，能看到来自 perplexity.ai、chat.openai.com 等域名的 session 数量。

这个方法只能追踪"AI 引用后用户点了链接"的情况，追踪不到"AI 引用了但用户没点"的情况。但它是最可靠的量化指标——有点击就代表有真实的可见度。

方法二：手动抽查

定期在 ChatGPT、Perplexity、Gemini 里搜 GoEast 目标覆盖的话题，看回答里有没有引用 GoEast 的内容，引用的是哪篇的哪段。

这个方法效率低，但信息量高。通过手动抽查，我能看到：

哪类话题 GoEast 的内容已经进入 AI 的答案
哪类话题还没有，需要补充或优化
AI 引用的具体是哪段话——这个反馈能指导写法的迭代

方法三：品牌词监测

在 ChatGPT 和 Perplexity 里直接搜"GoEast Mandarin"，看 AI 对品牌的描述准不准、有没有引用官网内容、有没有推荐 GoEast 作为选项之一。

这个维度更接近"品牌在 AI 心智里的位置"，不只是单篇文章的可见度。

目前的结果和判断

GoEast 的 GEO 工作从 2023 年底开始，到我离开时（2026 年 5 月）积累了大约两年半。

GA4 里，来自 Perplexity 的 referral traffic 从无到有，持续增长。ChatGPT 的 referral 追踪比较难（很多用户通过 app 访问，不留下 referral 来源），但手动抽查能看到 GoEast 的内容在多个话题下被引用。

更重要的是，GEO 的投入和传统 SEO 的投入高度重叠——同一套内容，既优化了 Google 排名，也提升了 AI 引用率。这不是两个独立的工作，是一套工作在两个渠道上的收益。

这一点让 GEO 的 ROI 比很多人想象的要高。

为什么现在做还不晚

写这篇文章的时候（2026 年），AI 搜索已经不是"未来趋势"了，它是现实。但绝大多数品牌——尤其是中小规模的、没有专职 SEO 团队的——仍然没在认真对待 GEO。

这意味着现在进入的门槛还比较低。不需要特别大的内容体量，不需要特别高的域名权重，只需要在内容质量和结构上做对一些关键的事。

在中文学习这个垂类里，GoEast 是比较早认真做这件事的。这个先发优势是真实的——AI 的训练数据有时滞，早期被大量引用的内容，在后续的模型版本里往往也有更高的权重。

这篇文章是 GoEast Mandarin 全案复盘的一部分。

GoEast 整体 SEO 增长的策略：GoEast SEO 增长：从 10K 到 30K+ 自然点击。

支撑 GEO 内容的 analytics 体系：GA4 + Looker Studio 仪表盘：怎么让数据真正可用。

GEO 内容架构依赖一套完整的 topic map，详见：GoEast 中文学习 topic map：从零搭建内容增长地图。

词汇测试工具本身也是一个 GEO 资产——它的页面结构和信息密度天然适合被 AI 引用：中文词汇测试系统：三天，1,500+ 封邮箱。