
计算机可能善于计算,但是能否知道感觉呢?博客和社交网络的上升,带动了挖掘个人观点的牛市,包括评论、打分、推荐和其他的在线形式。对于计算机科学家来说,急速增长的数据打开了一扇收集网友感受的大门。
一个名叫“情感分析”的新兴领域逐渐成形,这是计算机世界的一个尚未开发的前沿:将各种人类情感转化成实实在在的数据。
这不仅仅是一个网络开发演习,对于许多企业来说,在线观点更像虚拟货币,能够造就或者毁灭一个产品。
现在,在对产品如潮水般涌来的网络批评或赞扬中,许多公司处理不及,陷入漩涡中。随着情感分析工具的形成,它们不但能够改善企业的生命线,还能够给在线搜索带来转变。
几家情感分析公司正试图满足企业们的对在线言论的商业兴趣。“社会化媒体曾经被认为只是25岁顾问眼中的可爱项目” 旧金山的Scout Labs副总裁Margaret Francis说道,“现在顶极执行官都已经认识到,对于商业智能来说,这是一个不可思议的富矿。”
风险投资青睐的Scout Labs公司,由CNet创始人Halsey Minor创建,最近介绍了一种订阅服务,能够帮助客户监测博客、新闻、论坛和社会化网络网站,以识别对产品、服务或新闻主题的言论动态。在五月早些时候,StubHub票务公司使用Scout Labs的监测工具,监测到一场因雨延迟的Yankees对Red Sox比赛所带来的突然上升的负面博客情绪。
Read more…

纽约时报前不久对自动情感分析进行了报道(这篇报道将在下一个帖子中翻译,敬请期待),一家公司对这个领域的比喻很有趣:
“情感分析工具就像是煤矿中的金丝雀”, StubHub的客户总监John Whelan说。
我对自动情感分析的立场是:它目前还是一个不够好用的工具,至少还需要许多年才能挖掘出它的全部能力。
我并不整体否定情感分析——显然70% 的准确率比0%要好,但是我注意到一些公司对自动情感分析的可靠性具有错误的观念。打个比方,如果一只鸟,有30%的几率会误报瓦斯的危险水平,你愿意跟随这只鸟下到煤矿里去吗?我肯定不愿意。
问题是,大部分情感分析算法依赖于我们是使用简单的句子表达对一个产品或服务的情感。如果就如识别 “I love BestBuy” 或者 “I hate the iPhone” 那样简单,那么我们就可以建一个关键词数据库,情感分析就可以达到100% 的准确率了。很可惜,任何一种语言都不会那么简单。 Read more…

原文链接:http://www.intelligententerprise.com/blog/archives/2009/06/summer_reading.html
夏天缓慢的节奏让我们可以通过阅读度过平静的一天。你的阅读计划是什么呢?我的阅读计划包括各种论文和对信息搜索、情感分析和可视化的长期工作。在我的列表上的都是技术性的和入门级的(也不能算容易),任何从事分析工作并有潜在兴趣的人都可以阅读。我已经记录下来而且计划进行深入阅读。TechWeb读者可能会觉得它们至少值得阅读一下。
Read more…
原文链接:http://datamining.typepad.com/data_mining/2009/05/a-unifying-framework-for-social-media-research.html
现在我们可以从 ICWSM 得到各种社会媒体研究的最新进展,包括:文本挖掘,人工智能(偏向NLP/CompLing),心理学,图算法,社会网络理论,数据可视化/UI设计和数 据挖掘。这个会议的主要目的是将这些领域的研究成果融合以建立更好的模型, 支持和使用社会化媒体。为了完成这个目标,我们需要明确基于什么来融合。当然,可以将这些研究领域的联系画一张全连通图,但在那之前我们至少要识别一些关 键的联系。
心理学和文本挖掘
文本挖掘的大部分工作聚焦于文档,而现在我们主要关心社会化媒体——个体在社会化上下文中制造的文本。个体和社区在哪里呢? 理解观点需要建立是观点是什么的模型、观点的心理过程(我们怎么改变观点?)等。文档没有观点,人有观点。
文本挖掘和社会网络
Read more…
最新评论