Word'fursts'可能会揭示在线趋势

日期:2019-02-08 07:14:03 作者:蹇馒 阅读:

一位美国计算机科学家表示,使用特定词语搜索突然的“爆发”可以用来快速识别新趋势并更有效地对信息进行分类纽约康奈尔大学的Jon Kleinberg开发了计算机算法,用于识别文档中的单词使用突发虽然其他流行的搜索技术只计算文档中的单词或短语的数量,但Kleinberg的方法还考虑了单词使用率增加的速率 Kleinberg建议该方法可以应用于网络日志以跟踪新的社交趋势例如,识别现在网上数十万个个人日记中的单词突发可以帮助广告商快速发现新兴的热潮加州大学伯克利分校的Christos Papadimitriou说,用于识别这些突发爆发的算法相对简单,但功能非常强大 “关键是要发现词语出现频率的意外变化,”他告诉“新科学家”杂志 Papadimitriou同意这种方法在搜索网络日志的新趋势时可能很有价值该方法也可用于筛选其他类型的信息识别发送到公司客户支持地址的电子邮件中的单词突发可能有助于维护人员发现一个重大的新问题世界上使用最广泛的互联网搜索引擎谷歌的研究人员已经证明,识别搜索词中的峰值可以用来跟踪全球新闻和谣言的传播运行Google自动新闻聚合服务的算法仍然保密,但不难想象单词突发可以或确实具有有用的作用在对该技术的简单历史测试中,Kleinberg分析了自1790年以来美国总统提供的所有年度国情咨文他发现,特定词语“爆发”确实可以与发表演讲时的重要事件联系起来例如,在美国独立战争之后的几年中,人们发现了使用诸如“民兵”,“英国人”和“野蛮人”等词语的突然爆发从1930年到1937年,人们看到了“抑郁症”一词的使用激增从1949年到1959年,“原子”是具有最大“突发性”的词在20世纪后期,诸如“越南”,“苏维埃”,