Home > 自然语言 > Google步入结构化WEB

Google步入结构化WEB

原文链接:http://www.techcrunch.com/2009/05/12/google-takes-steps-towards-a-more-structured-web/

今天早些时候,Google 宣布 将提供一个让WEB开发者融合结构化元数据进入网站框架,为 RDFa提供有限的支持。对大部分人来说,这听起来没什么值得特别兴奋的,但是它是一个标志着搜索巨人将拥抱WEB结构化数据的重要步骤——一个它曾经退避三舍的领域。

我不会介绍RDFa标准的细节 (如果你希望看到一个详细的介绍点击 这里这里)。 但是从一些简单的例子中就可以看出语义标记带来的好处。如果我写了一个提到“总统”的帖子,但是没有提到他的名字,Google不可能知道我在谈论奥巴马 总统——它可能会认为我在说另外的总统,甚至可能以为在谈论公司的主席。 但是使用RDFa后,我对“总统”这个词标记 “Barack Obama”。这个标记能够被网络蜘蛛看见,并被索引(由此得到更聪明的搜索结果),但不会在帖子中显示出来。实际上,它是一个只告知搜索引擎而不会对读 者暴露无关信息的途径。

RDFa标记允许搜索引擎从网页中识别结构化数据,并展示在搜索结果中 (Google用它来产生 rich snippets),而且浏览器也许能够读到这些数据,并将它展示在图中或者网页外的其他元素中。

Mark Birbeck, 第一个提出这个标准的人,将在今年六月份的一个语义WEB会议中 演讲 中谈及Google的这个一大进步。他解释说,Google一直试图使用它的算法从网页内容中获得上下文信息。大部分时候,这些算法运转良好,但是正如我们前面 提到 的例子,有些东西算法还不能很好的识别(至少现在不能)。

可 能需要一段时间,我们才能看到从Google实现的RDFa中获得实际的好处。搜索引擎开始只会将它使用在有限的方面, 现在还不清楚需要多长时间Google才会开始将它融合进其他方面。 但是这个标准已经准备在没有Google帮助下进行扩张了——Yahoo支持 RDFa,并且许多网站包括  英国政府 也正在实施这个标准。当然,赢得统治搜索市场的Google的支持,对于RDFa的普及将是一个巨大的支持,而且我们可能将开始看到更多的服务遵守这个标准(例如,Drupal 7默认支持)。

但是,并不是所有人都对Google 使用这个标准感到高兴。一些人抱怨 Google 使用了一个RDFa的 跛脚实现,忽略了一些 公约,很多网站已经使用这些公约来标记他们的数据 。Birbeck 承认Google可能会更好的实现RDFa,但是他说“他们的问题是google是否使用了正确的词典,提出这样的问题的唯一原因是他们也正在使用RDFa,那是一个巨大的问题”。

Categories: 自然语言 Tags: , ,
  1. No comments yet.
  1. No trackbacks yet.
注意: 评论者可以使用 '@User ' 的形式将评论发邮件给想要回复的人。如果评论者 ABC 在帖子上留言了,就可以用 '@ABC '(不包括 ') 自动将您的回复发送邮件给 ABC。使用'@all ' 将您的评论发送邮件给所有以前留言的评论者。请确保用户名正确(区分大小写)。