了解网页结构化数据

什么是结构化数据

网页的内容是人类可读的,机器很难从中提取有用的信息。对于机器来说,虽然 HTML 标签具有一部分的语义功能,但是不是所有有用的信息都可以找到特定的标签来表达。为了帮助搜索引擎理解网页的内容,需要在页面中加入结构化数据,这种数据就是机器可读的页面内容。

词汇表

词汇表是定义了人类世界中大部分可描述的事物的类库。schema.org 词汇表中可以查看已定义的类。

每个类都有自己的属性,属性可以是基本类,或则是其他定义的类。比如人 Person,有属性 name,表示名字,这个属性是 Text 类,属于基本类;还有属性 Parent,表示这个人的父母,这个属性是 Person 类,属于定义类。

结构化数据的三种格式

在页面中使用结构化数据其实就是将 词汇表 中的类和对应的值用某种方式在 HTML 中出现。

谷歌搜索支持三种格式的结构化数据。下面以一个人为例子,列举每种格式的语法。

JSON-LD

<script type="application/json+ld">
{
  "@context": "http://schema.org",
  "@type": "Person",
  "name": "Manu Sporny",
  "telephone": "1-800-555-0199",
  "url": "http://manu.sporny.org/"
}
</script>

Microdata

<p itemscope itemtype="http://schema.org/Person">
   My name is
   <span itemprop="name">Manu Sporny</span>
   and you can give me a ring via
   <span itemprop="telephone">1-800-555-0199</span>
   or visit 
   <a itemprop="url" href="http://manu.sporny.org/">my homepage</a>.
</p>

RDFa

<p vocab="http://schema.org/" typeof="Person">
   My name is
   <span property="name">Manu Sporny</span>
   and you can give me a ring via
   <span property="telephone">1-800-555-0199</span>
   or visit 
   <a property="url" href="http://manu.sporny.org/">my homepage</a>.
</p>

利用结构化数据改善搜索结果中的表现

谷歌开发者文档中可以查阅到详细的方法与步骤。


更多参考

2019-2020 shens3