GEO 查询研究:怎么找到用户在 AI 搜索里问的问题
传统 SEO 的关键词研究你大概已经很熟悉了:打开 Ahrefs 或 Semrush,输入种子词,看搜索量和竞争度,选词,做内容。这套流程在 Google 搜索的十蓝链接时代没问题。
但 AI 搜索的游戏规则变了。
用户在 Perplexity 里不会输入"HSK3 备考"这样的碎片词组——他们会说"HSK3 阅读部分怎么提高分数,有什么具体的时间分配技巧"。用户在 ChatGPT 里不会搜"硅胶胸贴 推荐"——他们会问"硅胶胸贴和布质胸贴哪个更适合夏天穿低胸连衣裙,可以重复用多少次"。
AI 查询更长、更具体、意图更明确。 传统的关键词列表不能直接拿来用——你需要一套新的查询研究方法。
这篇在GEO 内容策略框架的"阶段三"基础上展开,给完整的查询研究操作方法。
AI 查询 vs 传统搜索关键词——本质区别在哪
先搞清楚区别,才能用对方法。
| 维度 | 传统搜索关键词 | AI 查询 |
|---|---|---|
| 格式 | 短语、碎片化 | 完整句子、对话式 |
| 长度 | 通常 2–5 个词 | 通常 10–40 个词 |
| 意图表达 | 隐含的(需要推断) | 显式的(直接说出来) |
| 上下文 | 几乎没有 | 经常包含背景信息和约束条件 |
| 连续性 | 每次搜索独立 | 经常是多轮追问 |
| 示例 | "上海学中文" | "在上海找线下中文课程,一周上两次课,半年能到 HSK3 吗" |
这个差异的底层原因很简单:在搜索框里,用户被训练成输入关键词;在 AI 对话框里,用户按自然语言说话。 AI 搜索引擎理解自然语言的能力让用户不再需要把问题"翻译"成关键词。
对 GEO 的含义:你的内容得能回答这些长、具体、带上下文的完整问题——不只是覆盖关键词。
六种查询研究方法
方法一:AI 平台直接观察
最直接的方法:打开 AI 搜索引擎,看用户在问什么。
Perplexity Discover 页面:Perplexity 的 Discover 功能展示热门话题和相关问题。这些是真实用户在 Perplexity 上频繁搜索的内容。打开 Discover,找到你行业相关的话题,记录 Perplexity 推荐的相关问题。
ChatGPT 追问模式:在 ChatGPT 里输入一个宽泛的话题(比如"GEO 优化"),它通常会从多个角度展开。这些角度就是用户可能追问的方向。更有价值的是:看 ChatGPT 在回答末尾推荐的"你可能还想问"——这些推荐问题直接反映了用户的关联需求。
Google AI Overviews 的"相关搜索":当 Google 展示 AI Overviews 时,下方通常会有相关搜索建议。这些建议结合了传统搜索数据和 AI 理解的用户意图,是不错的查询候选。
我在 GoEast 的做法:每周花 30 分钟在 Perplexity 里输入核心话题("学中文""HSK 备考""上海中文学校"),记录它生成的回答里提到了哪些子话题、引用了谁、以及推荐的追问问题。这 30 分钟产出的查询列表,比花 3 小时在 Ahrefs 里挖关键词更有 GEO 价值。
方法二:从现有 SEO 数据推导
你的 Google Search Console 里已经有不少有价值的数据。
长尾问句查询:在 GSC 的"效果"报告里,筛选包含"怎么""如何""什么""为什么""哪个"等问句词的查询。这些问句格式的搜索词跟 AI 查询最接近。
点击率低但展示量高的查询:这类查询说明用户在搜,但你的当前内容不够吸引他们点击。在 AI 搜索场景下,这些查询可能正好是用户转向 AI 搜索引擎的原因——他们在 Google 上没找到满意的答案,所以去问 AI。
推导方法:把短关键词扩展成 AI 用户会问的完整问题。
SEO 关键词 → AI 查询推导
"HSK3 备考"
→ "HSK3 阅读部分的时间分配建议是什么"
→ "零基础到 HSK3 一般需要多少个月"
→ "HSK3 和 HSK4 的难度差距大吗"
"硅胶胸贴"
→ "硅胶胸贴可以重复使用多少次"
→ "夏天出汗多硅胶胸贴会掉吗"
→ "婚纱场景用硅胶还是布质胸贴更好"
"GEO 优化"
→ "GEO 和 SEO 有什么区别,需要同时做吗"
→ "小企业没有专业团队能做 GEO 吗"
→ "做了 GEO 多久能看到效果"
方法三:竞品 AI 引用逆向工程
在 Perplexity 里搜你的核心话题,仔细看它的回答:
- 引用了哪些竞品——这些竞品做了什么让 AI 选择引用他们?
- 引用的是哪个页面的哪段内容——这段内容回答了什么问题?
- 回答的结构是什么——AI 是怎么组织这个话题的子问题的?
每一个被引用的竞品页面都暗含着一个 AI 认为重要的查询。把这些查询记下来——如果竞品能因为回答这个问题而被引用,你也应该能。
方法四:社区和论坛挖掘
Reddit 和知乎是 GEO 查询研究的金矿。原因很直接:用户在这些平台上提问的方式跟在 AI 搜索里提问几乎一样——都是完整的、带上下文的自然语言问题。
而且,Reddit 在 AI 引用里的权重极高:它占 Perplexity 引用来源的 6.6%,远高于大多数品牌网站。也就是说,Reddit 上的热门问题就是 AI 搜索引擎认为重要的问题。
具体操作:在 Reddit/知乎里搜你的行业关键词,找到讨论量大的帖子,记录用户的具体问题。重点关注那些得到了详细回答和大量互动的问题——这些是真实的高需求查询。
方法五:客户/用户直接反馈
你的销售团队、客服团队、社区管理每天都在回答客户的问题。这些问题可能是最有价值的 GEO 查询来源——因为它们直接来自你的目标用户。
在 GoEast,我会定期查看客服收到的常见问题。"你们的课程一周上几次""老师是中国人还是外国人""可以先试听吗"——这些是真实用户的真实问题,AI 搜索里大概率也有人在问同样的事。
方法六:AI 查询研究工具
专门的 GEO 工具正在快速发展:
| 工具 | 功能 | 适用场景 |
|---|---|---|
| Semrush AI Toolkit | 追踪跨平台 AI 可见性和查询 | 系统性监测 |
| Otterly.AI | 监控 AI 引用和品牌提及 | 品牌级追踪 |
| AlsoAsked | 发现 People Also Ask 问题网络 | 问句查询挖掘 |
| AnswerThePublic | 可视化查询图谱 | 头脑风暴阶段 |
关于 GEO 工具的完整评测,见《GEO 工具指南》。
⚠️ 注意:目前没有任何工具能像 Ahrefs 追踪 Google 排名那样精确追踪 AI 引用。手动验证仍然是必要的补充。
查询分类:四种 AI 查询类型
找到查询之后,需要分类。不同类型的查询需要不同的内容策略。
| 查询类型 | 特征 | 内容策略 | AI 引用占比 |
|---|---|---|---|
| 探索型 | "什么是 X""X 怎么工作" | 定义式内容、概念解释 | 24.3% |
| 对比型 | "X 和 Y 哪个好""X vs Y" | 对比表格、优缺点分析 | 27.7% |
| 决策型 | "我应该选 X 还是 Y""X 值得买吗" | 决策框架、推荐指南 | 21.3% |
| 操作型 | "怎么做 X""X 的步骤" | 步骤教程、How-to 指南 | 较强 |
对比型查询的引用占比最高(27.7%),如果用 listicle 格式呈现更高达 32.5%。"X vs Y"类的内容是 AI 最喜欢引用的格式之一。 如果你的查询列表里有对比型需求,优先创建这类内容。
关于每种查询类型的深度分析和对应的内容策略,见《AI 查询意图分析》。关于不同内容格式的 AI 引用数据,见《AI 偏好引用的内容格式》。
构建 GEO 查询地图
查询收集和分类完成后,最后一步是把它们组织成一张可执行的"查询地图"。
查询地图的结构
核心话题(Pillar)
├── 子话题 A
│ ├── 探索型查询:"X 是什么"
│ ├── 对比型查询:"X vs Y"
│ └── 操作型查询:"怎么做 X"
├── 子话题 B
│ ├── 探索型查询
│ ├── 决策型查询:"应该选哪个"
│ └── 操作型查询
└── 子话题 C
└── ...
每个查询映射到一篇具体的内容(已有或待创建)。这张地图就是你的 GEO 内容规划蓝图。
从查询地图到内容计划
实操建议:
- 标记现有覆盖:哪些查询你的现有内容已经能回答?标记为"优化"(改写首句、加数据、加 FAQ)
- 标记完全缺口:哪些查询没有对应内容?标记为"新建"
- 标记竞争强度:每个查询,当前 AI 引用的竞品内容质量如何?高质量竞品 = 硬仗,低质量竞品 = 机会
- 排优先级:高频 × 高价值 × 低竞争 = 最先做
以 GoEast 为例,我的查询地图大概是这样的:
| 查询 | 类型 | 当前状态 | 优先级 |
|---|---|---|---|
| "零基础学中文多久能到 HSK3" | 决策型 | 有内容但不够具体 | 优化 |
| "上海线下中文课程对比" | 对比型 | 完全缺口 | 新建(最高) |
| "HSK3 阅读部分时间分配" | 操作型 | 有内容且已优化 | 维护 |
| "在线学中文 vs 线下学中文" | 对比型 | 完全缺口 | 新建(高) |
| "企业中文培训怎么选" | 决策型 | 有内容但缺数据 | 优化 |
这张表就是我接下来 2–3 个月的 GEO 内容工作清单。
常见问题
AI 查询有"搜索量"数据吗?
目前没有。Perplexity 和 ChatGPT 都不公开查询量数据,也没有第三方工具能提供精确的 AI 查询搜索量。你能参考的是:Google 的相关搜索量(作为需求的代理指标)、Reddit/知乎上相关问题的讨论热度、以及你自己手动测试时 AI 回答的质量和引用密度(如果 AI 的回答很详细且引用了多个来源,说明这个查询有不少用户在问)。
我应该用中文还是英文做查询研究?
取决于你的目标受众。如果你的内容是中文的、面向中文用户,就用中文做查询研究。需要注意的是:同一个话题,中文用户和英文用户的提问方式和关注点可能不同。比如"学中文"这个话题,英文用户更关注"how long does it take",中文用户更关注"哪个学校/app 好"。
查询地图多久更新一次?
建议每季度做一次完整的查询研究更新。AI 搜索的用户行为在快速演变——新的查询模式会不断出现,旧的查询可能不再热门。每季度更新能确保你的内容规划跟得上用户需求的变化。