搜索引擎很智能,但并不完美。它们可以读取你的内容,却难以像人类一样理解其含义。缺乏技术层面的指引时,搜索引擎只能靠猜,而猜测无法带来真正的结果。
Schema 标记有助于搜索引擎和 AI 系统更好地理解你的内容,从而提高获得富结果、AI 引用以及在现代搜索体验中曝光的机会。
而且,针对 AI Overviews、ChatGPT 和 Perplexity 等 AI 系统的 schema 标记,有助于它们从结构化数据层中提取信息来生成答案。换句话说,那些能“说机器语言”说得很流利的网站,才是被引用的对象。事实上,研究表明,大约 65% 被 AI Mode 引用的页面,以及 71% 被 ChatGPT 引用的页面都包含结构化数据。
阅读本架构标记指南,了解它是什么、为什么对传统 SEO 和 AI 搜索很重要、最关键的架构类型有哪些、如何在不抓狂的情况下实施它,以及更多相关内容。
什么是架构标记?
Schema 标记 是添加到你网站 HTML 中的代码,使用 Schema.org 词汇表为搜索引擎和 AI 系统明确标注你的内容。与其让爬虫仅从上下文推断内容含义,schema 标记会直接告诉它们你的内容是什么,从而将原始内容转换为结构化的、机器可读的数据。
网站 schema 标记使用 Schema.org 词汇表,这是由 Google、Bing、Yahoo 和 Yandex 创建的共享框架。它用于描述实体(例如:人物、产品、事件、菜谱)、它们的属性(例如:价格、日期、作者)以及它们与其他实体之间的关系。
关于 schema 标记最常见的类比之一,就是把它想象成给文件柜贴标签。没有标签时,搜索引擎就得翻遍每个抽屉,才能弄清里面有什么;有了 schema 标记,标签就清清楚楚地贴在那儿,每次都能一下子打开正确的抽屉。
Schema 标记与结构化数据:有什么区别?
听起来很相似,对吧?其实并不是。它们的区别在于:
- 结构化数据是指任何有组织、可被机器读取的数据格式这一更广泛的概念。例如,电子表格就是结构化数据。
- Schema 标记 是在网页上实现 Schema.org 词汇,以向搜索引擎传达结构化数据的具体做法。
可以这样更简单地理解:所有的 schema 标记都是结构化数据,但并不是所有的结构化数据都是 schema 标记。
架构标记对 SEO 和 AI 搜索的优势
先把一件事说清楚:schema 标记并不是一个直接的排名因素。Google 已经证实了这一点。但如果因为这个技术细节就忽视它,就好比因为沙拉酱“不是主要食材”而不放沙拉酱一样。它会彻底改变这道菜的表现。
那么,为什么模式标记对营销人员来说很重要、值得了解呢?除了有利于AEO 和 GEO之外,以下只是模式标记的一些主要好处:
丰富结果与搜索结果页可见性
为网页添加结构化数据标记(schema markup)可以让你的页面有资格获得富结果,也就是那些在搜索结果中带有星级评分、价格、活动日期、菜谱详情等视觉增强信息的结果。而且这种影响是真实可见的。
Google 自己记录在案的案例研究讲述了一个相当有说服力的故事:
- 雀巢发现,带有丰富结果的页面点击率比不带丰富结果的页面高出 82%
- Rotten Tomatoes 在为 100,000 个页面添加结构化数据后,点击率提高了 25%
- The Food Network 将其 80% 的页面转换为支持富结果,并因此获得了 35% 的访问量增长
丰富结果占据更多的页面可视空间,在用户点击之前就传达出价值,而且——当你的竞争对手还没有这些结果时——它们会让你在拥挤的搜索结果页中成为显而易见的首选。
更好的语义理解
Schema 可以消除歧义。当 Googlebot 读取你的产品页面并看到带有 `"price"` 属性的 `"@type": "Product"` 时,它就完全知道自己在看什么(即使你自己也不太确定)。这有助于你的页面在更相关的搜索查询中获得排名,并在恰当的时机展示出来。
Schema 标记本身并不会让搜索引擎给你更高排名,但它能帮助搜索引擎更好地理解你,而更好的理解会在一段时间内带来更好的展示位置。
AI 搜索可见性
像 Google AI Overviews、Bing Copilot 和 Perplexity 这样的 AI 系统并不是凭空生成答案的。它们依赖已索引、结构化的来源。微软已经明确确认,结构化数据有助于搜索引擎和 AI 系统理解你的内容。
模式标注与 AI 引用之间的直接关联仍在研究之中——但其逻辑是站得住脚的。拥有丰富模式标注的页面会被更准确地归类,而被准确归类的页面更有可能与 AI 系统试图回答的查询相匹配。如果你在意提升自己在 AI 搜索中的可见度(你确实应该在意),那么模式标注就是能够帮助你实现这一点的基础设施的一部分。
Schema 标记的技术工作原理
当 Googlebot 抓取你的页面时,它会从上到下读取 HTML,包括嵌入在 `<script type="application/ld+json">` 标签中的任何结构化数据。该标签中包含的是 JSON-LD:JavaScript Object Notation for Linked Data。通俗地说,这是一种在完全不影响可见内容的前提下,把带有标签、可被机器读取的数据嵌入到页面中的方式。
让我们以这篇文章作为 schema 标记的示例:
```json
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "BlogPosting",
"headline": "营销人员的 Schema 标记 SEO 与 AI 搜索指南",
"author": {
"@type": "Person",
"name": "Terra Team"
},
"datePublished": "2026-06-04T08:00:00+00:00",
"dateModified": "2026-06-04T08:00:00+00:00",
"publisher": {
"@type": "Organization",
"name": "Terra",
"logo": {
"@type": "ImageObject",
"url": "https://terrahq.com/logo.png"
}
}
}
</script>
```
爬虫会读取这些内容,将其映射到 Schema.org 词汇表,然后就能理解:这是一篇博客,由我们撰写,由这个组织在这个日期发布。不再需要猜测或做任何假设。
Schema 还可以描述实体之间的关系——而不仅仅是单个项目的属性。这正是它之所以成为知识图谱基础的原因:你的内容会变成一个由相互关联、可被机器读取的数据构成的网络。
三种 Schema 标记格式
Google 支持三种结构化数据格式。下面是一个快速概览,以及为什么你选择哪一种很重要:
| 格式 | 它所在的位置 | 易用性 | Google 的看法 |
|---|---|---|---|
JSON-LD | `<script>` 标签位于 `<head>` 或 `<body>` 中 | 最简单的 | ✅ 推荐 |
微数据 | 嵌套在 HTML 元素内部 | 复杂的 | 已支持 |
RDFa | HTML 标签属性,`<head>` 和 `<body>` | 复杂的 | 已支持 |
JSON-LD 在大多数使用场景中都是当之无愧的首选。它与可见的 HTML 完全分离,因此设计更改不会意外破坏结构化数据。它也可以通过 JavaScript 动态注入,从而便于通过 CMS 在大规模环境中部署。Google 推荐使用它——我们也是。
Microdata 通过在 HTML 中直接使用标签属性来编织标记。这听起来不错,但当你意识到每次开发人员修改模板时,你的 schema 都可能出问题时,就没那么美好了。这简直是维护噩梦。
RDFa遵循 W3C 规范,工作方式与 Microdata 类似。你主要会在较老的网站或特定出版环境中遇到它。它本身没问题,只是并不是阻力最小、最省事的做法。
摘要: 除非有非常特殊的理由,否则请坚持使用 JSON-LD。
最重要的架构标记类型
有数百种架构类型,但这里是你真正需要的那些:
- Organization — 定义你的品牌:名称、标志、地址、社交账号、联系方式。在 Google 搜索中为知识面板提供支持,并在各类 AI 系统中建立实体识别。
- LocalBusiness — 对于任何有实体地点的企业都至关重要。它驱动你的 Google Business Profile 数据、地图集成以及本地搜索结果。始终使用最具体的子类型(例如 `Restaurant`、`Dentist`、`AutoRepair`),而不是只用 `LocalBusiness`。在我们的本地 SEO 指南中了解更多。
- 产品 / 商家列表 — 适用于用户可以进行购买的电商页面。在搜索结果中解锁价格、库存情况、配送、退货政策和折扣等详细信息。正是这个标记让你的产品列表真正脱颖而出。
- 产品摘要 — 适用于没有购买行为、仅对产品进行评测或编辑内容的页面。显示星级评分、优缺点概览以及评测者详情。(联盟网站和编辑评测平台,这一项就是为你们准备的。)
- Article / NewsArticle / BlogPosting — 为 Google 标记编辑内容,使其有资格出现在热门新闻和 Google 新闻中。请使用最具体的子类型:
- 用于新闻的 `NewsArticle`
- 用于博客内容的 `BlogPosting`
- 适用于常青编辑内容的 `Article`
- Review / AggregateRating — 将星级评分显示在搜索结果中。适用于产品、本地商家、菜谱、书籍、电影和应用等多种类型。这是目前点击率最高的富结果类型之一。
- 活动 — 适用于音乐会、网络研讨会、会议以及任何有时间限制的事件。在搜索结果中直接显示活动名称、日期、地点和票务信息。
- 食谱 — 可以在搜索结果中展示食材、烹饪时间、卡路里、评分,甚至视频。如果你做的是美食内容却没有使用它,那就等于白白流失了点击量。
- 视频 — 适用于以视频为主要内容的页面。在 Google 搜索中启用视频轮播和关键时刻功能。
- 面包屑导航 — 使用不足且不受重视。它会在搜索结果中用干净清晰的面包屑路径替换冗长的 URL,从而提升可用性并强化网站结构信号。
- 常见问题解答(FAQ) — Google 已在 2026 年 5 月完全弃用 FAQ 富结果,这意味着 FAQPage 结构化数据不再为任何网站在搜索结果中生成可视化下拉列表。尽管如此,仍然值得实现 FAQPage 结构化数据,因为 AI 系统在生成答案时会利用它来识别直接的问答内容。
- SpeakableSpecification — 将内容中最重要的部分标记为适合语音搜索和 AI 音频摘要。随着 AI 搜索从纯文本扩展到更多形式,这一项未来可能会变得至关重要。
- Person — 用于作者页面和思想领导力内容。将具名个人建立为公认实体,直接强化你的 E-E-A-T 信号。
额外提示:相同 sameAs 属性在技术上并不是一个 schema 类型,但却是提升在 AI 搜索中可见度的关键部分。将 `sameAs` 添加到你的 Organization 和 Person 实体中,把它们链接到权威的外部来源,如 Wikipedia、Wikidata、LinkedIn 和官方社交媒体账号。这会向搜索引擎和 AI 系统明确说明你究竟是哪一位 “John Smith”,从而避免任何混淆。
如何向你的网站添加架构标记:4 种方法
那么,实际该如何着手实现 schema 标记呢?下面是向网站添加 schema 标记的 4 种方法:
方法一:使用 Google 的结构化数据标记助手手动操作
这是一种无需编写代码即可实现架构标记的方法,非常适合从某个特定页面入手。
- 前往Google 的结构化数据标记助手并选择你的架构类型
- 输入你的页面 URL,然后点击“Start Tagging”
- 在页面上高亮显示元素(标题、作者、日期等),并将它们分配到相应的数据项中
- 点击“Create HTML”来生成你的 JSON-LD
- 将生成的 `<script>` 代码块粘贴到页面的 `<head>` 部分
- 使用 Google 富结果测试 进行验证
这种方法适用于一次性页面,但不适合在大型站点中进行扩展。
方法二:CMS 插件(适合非开发人员)
如果你使用的是 WordPress、Shopify 或 Wix,那么就有适合你的插件:
- WordPress:Yoast SEO、Rank Math,以及SchemaPro都会根据你的页面类型和设置自动生成并部署 schema
- Shopify 和 Wix: 内置的结构化数据应用可以处理基础需求,第三方应用则能实现更高级的功能
插件在处理常见的 schema 标记类型(Article、LocalBusiness、Product)方面表现不错,但在自定义或高级标记上缺乏灵活性。如果你需要嵌套实体或小众的 schema 类型,就会遇到瓶颈。
方法三:AI 辅助生成
你完全可以使用 ChatGPT、Claude 或 Gemini 来生成 JSON-LD。下面是一个示例提示:
"为一个 [schema type] 页面生成 JSON-LD schema 标记。该页面的主题是:[brief description]。请包含以下详细信息:[list of properties and values]。将其格式化为适用于 Google Search 的正确格式。"
输出通常相当不错,只是千万不要在未经验证的情况下直接部署由 AI 生成的 schema。常见错误包括无效的 datetime 格式(缺少时区偏移)、缺少 `dateModified` 属性,以及偶尔会出现根本不存在的幻觉式 schema 属性。只要通过一次 Schema Markup Validator 或 Rich Results Test,就能在问题出现之前把这些全部揪出来。
如果你还在构建更广泛的 AI 工作流程,这里有一篇文章介绍如何在数字营销策略中使用 AI。
方法四:Schema 标记平台(推荐给企业级用户)
如果你有成千上万的页面,手动实施 schema 标记将是一场噩梦。像 Schema App 这样的企业级平台可以让你构建 schema 模板,以编程方式部署到整个网站,在大规模下管理更新,并在一个地方监控性能。
对于大型电商网站、新闻出版商或多地点业务,您也可以与一家企业级 SEO 代理机构合作,帮助您部署 schema。
如何验证你的架构标记
部署未经验证的架构就是在自找麻烦。我之前已经提到过它们好几次了,但它们实在太重要了,我们再来回顾一下。你需要的三个工具是:
- Google 富结果测试 — 任何实现完成后的第一站。粘贴一个 URL 或原始 schema 代码,它会告诉你标记是否有效,以及你有资格获得哪些富结果。错误会完全阻止富结果显示,而警告则不是致命问题,但仍然值得处理。
- Schema.org 验证器 — 根据完整的 Schema.org 规范进行验证,而不仅仅是 Google 的子集。可用于发现可能影响 Bing、Yahoo 或使用更广泛词汇表的 AI 系统的问题。
- Search Console 富结果报告 — 在实现 schema 标记后,这是你持续监控的工具。前往 Search Console → Enhancements → 选择一种富结果类型。它会将你的页面分类为“有效”、“有效但有警告”或“错误”。它还能在规模层面标记问题,而不仅仅是单个页面上的问题。
给你一点建议:务必把这三种工具都运行一遍,因为每个工具能发现的问题都不一样。
如何衡量架构标记的影响
那么,在你投入了所有这些努力之后,如何评估你辛勤工作的成果?(以及如何向领导层呈现这些成果。)下面是几种简单评估影响力的方法:
- A/B 方法— 在 Search Console 中提取一组流量稳定且尚未添加 schema 的页面。给其中一半添加 schema。60–90 天后,使用按 URL 过滤的 Performance 报告,对比两组之间的 CTR 和展示次数。虽然并不完美,但可以给你一个大致的参考。
- “搜索展示方式”筛选器 — 在 Search Console 的“效果”报告中,通过“搜索展示方式”进行筛选并查找富结果类型。获得富结果的页面,在相同查询下的点击率(CTR)会高于仅以普通链接形式展示的页面。
影响取决于无数不同的因素。产品页面、本地商家页面和菜谱页面往往能获得最大的收益。Article schema 值得实施,但通常只会带来较为温和的搜索结果页提升。先设定切合实际的预期,然后让数据来说明剩下的故事。
Schema 标记最佳实践
要正确设置 schema 标记的关键在于花时间把它做好。具体方法如下:
- 只为页面上实际存在的内容添加标记。 如果内容对用户不可见,就不应该出现在你的 schema 中。为不可见内容添加标记会违反 Google 的指南,并可能导致人工惩罚。
- 使用可用的最具体的子类型。`Restaurant` 优先于 `LocalBusiness`。`NewsArticle` 优先于 `Article`。更高的具体性有助于搜索引擎更快、更准确地为你归类。
- 填写推荐的属性,而不仅仅是必填项。更完整的架构 = 更完整的富结果 = 更高的点击率。不要停留在最低要求。
- 保持 schema 最新。在你的 schema 中,过期的价格、陈旧的营业时间以及已下架的产品都会造成信任问题(无论是对用户还是对 Google)。
- 在各个平台保持一致。你的架构细节、Google 商家资料以及社交媒体列表都应彼此一致。
- 充分使用 `sameAs`。将你的 Organization 和 Person 实体链接到 Wikipedia、Wikidata、LinkedIn 以及你已验证的社交媒体个人资料。这是 AI 系统确认你身份的方式。
- 在每次部署前后都进行测试。模板更改和网站重新设计悄无声息地破坏架构的情况,比你想象的要常见。
如何审查您现有的架构标记
不确定你现在的 schema 处于什么状态?以下是检查你的 schema 标记的方法:
方法一:Search Console
- 打开 Google Search Console,并在左侧侧边栏中导航到“增强功能”部分
- 你将看到你的网站已实现的每种富结果类型(Article、Product、LocalBusiness 等)。
- 点击进入每一项,以查看有效页面、有警告的页面和有错误的页面
- 优先先修复错误——这些页面虽然包含 schema,但目前不符合展示富结果的条件
方法二:Google 富结果测试(抽查)
- 提取你流量最高的页面,并将每个 URL 粘贴到Rich Results Test
- 查看检测到的架构,检查是否存在错误或警告,并修复所有被标记的问题
- 首先专注于交易型页面(例如产品页面、服务页面、本地着陆页)
方法三:SEO 爬虫工具
- 使用 Semrush Site Audit、Screaming Frog 或 Ahrefs 对整个站点进行全面抓取
- 筛选结构化数据问题——这些工具会显示无效的 schema、缺少必需属性,以及页面上与可见内容不一致的 schema
- 导出列表,按流量优先级排序,从上到下依次修复
对于大型网站,使用抓取工具是获得整体情况的唯一可行方式。Search Console 会告诉你已知的问题,而抓取则会揭示其他所有问题。
使用 Terra 掌握你的架构标记
Schema 标记一直都是为了让内容能够被机器读取。但随着 AI 系统在决定哪些内容会被展示、引用和点击方面扮演越来越重要的角色,让内容对机器可读已经成为必需。
如果你已经准备好实施结构化数据策略,我们是一家领先的SEO代理机构,专为当今搜索运作方式而打造。欢迎立即联系我们!
架构标记常见问题
问:在 SEO 中,什么是 schema 标记?
网站 schema 标记是添加到你网站 HTML 中的代码,它使用 Schema.org 词汇表,向搜索引擎和 AI 系统明确标注你的内容。它描述你的内容是什么(例如产品、菜谱、本地商家、评论),这样爬虫就不必仅从上下文来推断含义。Schema 标记可以让你的页面有资格在 Google 搜索中展示丰富结果,提升语义理解能力,并且越来越多地支持在 AI 生成的答案中获得曝光。
问:结构化数据标记会直接提升 Google 的排名吗?
A:不,schema 标记本身不是直接的排名因素,Google 已经确认了这一点。它的作用是帮助搜索引擎更准确地理解你的内容,从而通过减少误判,间接支持排名。更可衡量、也更直接的好处体现在点击率上:富结果(由 schema 启用)在点击率和被引用次数方面通常都优于普通的蓝色链接。
问:JSON-LD、Microdata 和 RDFa 之间有什么区别?
A:这三种都是实现结构化数据的有效格式。JSON-LD 放在与你 HTML 分离的 `<script>` 标签中,并且因为最容易实现、维护和更新且不会破坏页面布局,所以被 Google 推荐。Microdata 和 RDFa 则是把标记直接嵌入到 HTML 元素内部,这样也能工作,但更难维护——任何模板的改动都可能破坏你的结构化数据。如果拿不准,用 JSON-LD。
问:我如何知道我的 schema 标记是否正常工作?
最快的检查方式是Google 的富结果测试。粘贴你的 URL 或原始 schema 代码,它会告诉你标记是否有效,以及你有资格获得哪些富结果类型。对于持续监控,使用 Search Console 的“增强功能”部分来跟踪整个站点的有效页面、警告和错误。要衡量实际影响,可在 Search Console 的“效果”报告中按“搜索展示形式”进行筛选,对比带有富结果的页面与不带富结果但可比页面的点击率(CTR)。
问:我应该优先考虑哪几种类型的 schema 标记?
A:从与你最重要页面最匹配的内容开始。电商网站应优先在产品页面实现 Merchant Listing 结构化数据。当地商家应实现 LocalBusiness(使用可用的最具体子类型),并配合完整的 Google Business Profile。内容发布方应在所有编辑类页面使用 Article 结构化数据。所有网站都能从带有 `sameAs` 链接的 Organization 结构化数据中获益,因为它能为传统搜索和 AI 系统建立实体身份。不要试图一次性实现所有内容——先从影响最大的地方开始,验证无误后,再逐步扩展。
问:如果我的 schema 标记有错误会怎样?
A:你的结构化数据中存在错误,会导致你的页面无法获得富结果资格,而且该特定的 schema 类型在这个页面上根本不会生成富结果。在更严重的情况下,如果 Google 认定你的 schema 存在故意误导行为(比如标记页面上并不存在的内容、虚假评论、夸大的评分),就可能对你采取结构化数据的人工处理措施。这不会影响你的核心排名,但会移除你的富结果资格,直到你解决问题并在 Search Console 中提交复审请求。警告则没那么严重——它们不会直接阻止富结果展示,但仍然值得修复,因为它们表明你的标记不完整或不够精确。