了解网页结构化数据

什么是结构化数据

网页的内容是人类可读的，机器很难从中提取有用的信息。对于机器来说，虽然 HTML 标签具有一部分的语义功能，但是不是所有有用的信息都可以找到特定的标签来表达。为了帮助搜索引擎理解网页的内容，需要在页面中加入结构化数据，这种数据就是机器可读的页面内容。

词汇表

词汇表是定义了人类世界中大部分可描述的事物的类库。schema.org 词汇表中可以查看已定义的类。

每个类都有自己的属性，属性可以是基本类，或则是其他定义的类。比如人 Person，有属性 name，表示名字，这个属性是 Text 类，属于基本类；还有属性 Parent，表示这个人的父母，这个属性是 Person 类，属于定义类。

结构化数据的三种格式

在页面中使用结构化数据其实就是将 词汇表 中的类和对应的值用某种方式在 HTML 中出现。

谷歌搜索支持三种格式的结构化数据。下面以一个人为例子，列举每种格式的语法。

JSON-LD

<script type="application/json+ld">
{
  "@context": "http://schema.org",
  "@type": "Person",
  "name": "Manu Sporny",
  "telephone": "1-800-555-0199",
  "url": "http://manu.sporny.org/"
}
</script>

Microdata

<p itemscope itemtype="http://schema.org/Person">
   My name is
   <span itemprop="name">Manu Sporny</span>
   and you can give me a ring via
   <span itemprop="telephone">1-800-555-0199</span>
   or visit 
   <a itemprop="url" href="http://manu.sporny.org/">my homepage</a>.
</p>

RDFa

<p vocab="http://schema.org/" typeof="Person">
   My name is
   <span property="name">Manu Sporny</span>
   and you can give me a ring via
   <span property="telephone">1-800-555-0199</span>
   or visit 
   <a property="url" href="http://manu.sporny.org/">my homepage</a>.
</p>

利用结构化数据改善搜索结果中的表现

在谷歌开发者文档中可以查阅到详细的方法与步骤。