Archive

Posts Tagged ‘语义网络’

Google步入结构化WEB

June 15th, 2009 fpc No comments

原文链接:http://www.techcrunch.com/2009/05/12/google-takes-steps-towards-a-more-structured-web/

今天早些时候,Google 宣布 将提供一个让WEB开发者融合结构化元数据进入网站框架,为 RDFa提供有限的支持。对大部分人来说,这听起来没什么值得特别兴奋的,但是它是一个标志着搜索巨人将拥抱WEB结构化数据的重要步骤——一个它曾经退避三舍的领域。

我不会介绍RDFa标准的细节 (如果你希望看到一个详细的介绍点击 这里这里)。 但是从一些简单的例子中就可以看出语义标记带来的好处。如果我写了一个提到“总统”的帖子,但是没有提到他的名字,Google不可能知道我在谈论奥巴马 总统——它可能会认为我在说另外的总统,甚至可能以为在谈论公司的主席。 但是使用RDFa后,我对“总统”这个词标记 “Barack Obama”。这个标记能够被网络蜘蛛看见,并被索引(由此得到更聪明的搜索结果),但不会在帖子中显示出来。实际上,它是一个只告知搜索引擎而不会对读 者暴露无关信息的途径。

RDFa标记允许搜索引擎从网页中识别结构化数据,并展示在搜索结果中 (Google用它来产生 rich snippets),而且浏览器也许能够读到这些数据,并将它展示在图中或者网页外的其他元素中。

Mark Birbeck, 第一个提出这个标准的人,将在今年六月份的一个语义WEB会议中 演讲 中谈及Google的这个一大进步。他解释说,Google一直试图使用它的算法从网页内容中获得上下文信息。大部分时候,这些算法运转良好,但是正如我们前面 提到 的例子,有些东西算法还不能很好的识别(至少现在不能)。

Read more…

Categories: 自然语言 Tags: , ,