爱吧机器人网 » 专题 > 应用 > 正文

MIT人工智能实验室:AI系统不仅可以识别假新闻还能辨别个人偏见

互联网时代,假新闻铺天盖地,而且极具迷惑性,Facebook 一度深陷虚假新闻的泥淖,不但被控影响了美国总统大选结果,甚至引发了德国政府的巨额罚金。

甚至连以公信力著称的 BBC 也难以幸免,比如 BBC 北安普顿分站的推特账号就曾发过这样一条消息:Breaking News: President Trump is injured in arm by gunfire #Inauguration.(劲爆消息:特朗普总统在就职典礼后遭遇枪击,手臂受伤。)




MIT人工智能实验室:AI系统不仅可以识别假新闻还能辨别个人偏见
至于国内的假新闻,也是花样百出,甚至微信对话也能伪造,PS 技术出神入化,比如一度引爆互联网圈的这个截图:

MIT人工智能实验室:AI系统不仅可以识别假新闻还能辨别个人偏见
雷锋网注:此截图被证实为经过 PS 伪造

AI 系统:建立多维度向量进行数据检测

10 月 4 日,麻省理工学院计算机科学与人工智能实验室(CSAIL)在其官网发布了一则新闻,宣称该实验室与卡塔尔计算研究所(Qatar Computing Research Institute)的研究人员合作,已经研究出一种可以鉴别信息来源准确性和个人政治偏见的 AI 系统,该研究成果将于本月底在比利时布鲁塞尔召开的 2018 自然语言处理经验方法会议(EMNLP)上正式公布。

研究人员用这个 AI 系统创建了一个包含 1000 多个新闻源的开源数据集,这些新闻源被标注了“真实性”和“偏见”分数。据称,这是类似数据集中收录新闻源数量最多的数据集。

研究人员写道:“打击‘假新闻’的一种(有希望的)方法是关注消息来源。”“虽然‘假新闻’(帖子)主要在社交媒体上传播,但他们仍然有最初来源,即某个网站,因此,如果一个网站曾经发布过假新闻,很有可能未来还会发布。”

AI 系统的新颖之处在于它对所评估的媒介有广泛的语境理解,没有单独从新闻文章中提取特征值(机器学习模型所训练的变量),而是兼顾了维基百科、社交媒体,甚至根据 url 和 web 流量数据的结构来确定可信度。

该系统支持向量(SVM)训练来评估事实性和偏差,真实性分为:低、中、高;政治倾向分为:极左、左、中偏左、中偏右、右、极右。

根据该团队所述,系统只需检测 150 篇文章就可以确定一个新的源代码是否可靠。它在检测一个新闻来源是否具有高、低或中等程度的“真实性”方面的准确率为 65%,在检测其政治倾向是左倾、右倾还是中立方面的准确率为 70%。

MIT人工智能实验室:AI系统不仅可以识别假新闻还能辨别个人偏见
雷锋网注:AI 系统分析示例

在上图显示的文章中,AI 系统对文章的文案和标题进行了六个维度的测试,不仅分析了文章的结构、情感、参与度(在本例中,分析了股票数量、反应和 Facebook 上的评论),还分析了主题、复杂性、偏见和道德观念,并计算了每个特征值的得分,然后对一组文章的得分进行平均。

MIT人工智能实验室:AI系统不仅可以识别假新闻还能辨别个人偏见
雷锋网注:“真实性-偏见”预测模型图

维基百科和 Twitter 也被加入了 AI 系统的预测模型。正如研究者们所言,维基百科页面的缺失也许说明了一个网站是不可信的,或者网页上可能会提到这个问题的政治倾向是讽刺的或者明显是左倾的。此外,他们还指出,没有经过验证的 Twitter 账户,或者使用新创建的没有明确标注的账户发布的消息,不太可能是真的。

该模型的最后两个向量是 URL 结构和 web 流量,可以检测试图模仿可信新闻来源的 url (例如,“foxnews.co”),参考的是一个网站的 Alexa 排名,该排名根据网站总浏览量进行计算。

该团队在 MBFC(Media Bias/Fact Check )网站的 1066 个新闻源上对此 AI 系统进行了训练。他们用收集的准确性和偏见数据手工标注网站信息,为了生成上述数据库,研究人员在每个网站上发布了 10-100 篇文章(总计 94,814 篇)。

正如研究人员在他们的报告中煞费苦心的介绍所示,并不是每一个特征值都能有效预测事实准确性或政治偏见。例如,一些没有维基百科页面或建立 Twitter 档案的网站有可能发布的信息是公正可信的,在 Alexa 排名靠前的新闻来源并不总是比流量较少的新闻源更公正或更真实。

研究人员有一个有趣的发现:来自虚假新闻网站的文章更有可能使用夸张和情绪化的语言,左倾媒体更有可能提到“公平”和“互惠”。与此同时,拥有较长的维基百科页面的出版物通常更可信,那些包含少量特殊字符和复杂子目录的 url 也是如此。

未来,该团队打算探索该 AI 系统是否能适应其他语言(它目前只接受过英语训练),以及是否能被训练来检测特定区域的偏见。他们还计划推出一款 App,可以通过“跨越政治光谱”的文章自动回复新闻。

该论文的第一作者、博士后助理拉米·巴利(Ramy Baly)表示:“如果一个网站以前发布过假新闻,他们很可能会再次发布。”“通过自动抓取这些网站的数据,我们希望我们的系统能够帮助找出哪些网站可能首先这么做。”

当然,他们并不是唯一试图通过人工智能打击假新闻传播的机构。

总部位于新德里的初创公司 MetaFact 利用 NLP 算法来标记新闻报道和社交媒体帖子中的错误信息和偏见;SAAS 平台 AdVerify.ai 于去年推出 beta 版,可以分析错误信息、恶意软件和其他有问题的内容,并可以交叉引用一个定期更新的数据库,其中包含数千条虚假和合法的新闻。

前文中也提到过,Facebook 一度深陷假新闻的泥淖,已经开始尝试使用“识别虚假新闻”的人工智能工具,并于近期收购了总部位于伦敦的初创公司 Bloomsbury AI,以帮助其鉴别消除假新闻。

假新闻会被消除吗?

然而,一些专家并不相信人工智能可以胜任这项任务。卡内基梅隆大学机器人研究所(Carnegie Mellon University Robotics Institute)的科学家迪恩波默洛(Dean Pomerleau)在接受外媒 the Verge 采访时表示,人工智能缺乏对语言的微妙理解,而这种理解是识别谎言和虚假陈述所必需的。

“我们最初的目标是建立一个系统来回答‘这是假新闻,是或不是?’”他说,“但我们很快意识到,机器学习无法胜任这项任务。”

但是,人类事实核查者做的不一定比 AI 更好。今年,谷歌暂停了“事实核查”(Fact Check)这一标签,该标签曾位于谷歌新闻报道栏,此前保守派媒体也曾指责谷歌对他们表现出了偏见。

不过,无论最终鉴别假新闻和个人偏见的解决方案是 AI 系统还是人工,抑或两者兼而有之,假新闻被彻底消除的那一天都不会立刻到来。

据咨询公司 Gartner 预测,到 2022 年,如果目前的趋势不变,大多数发达国家的人看到的虚假信息将会多于真实信息。


上一篇:人工智能批改作业 促进智能教育发展
下一篇:AI已经开始追踪我们的面部表情以投放视频广告!
精选推荐
基于生物启发的机器人很容易适应丢失附属器官
基于生物启发的机器人很容易适应丢失附属器官

[2017-12-17]  很多机器人被设计应用在危险环境,如灾难现场。在这些地方,他们的运动系统完全有可能被损坏。那这样会吓跑这些机器人吗?也许不是,如果它们像日本的东北和北海道大学创造的......

人工智能准确预测患者一年内的死亡风险,原理却无法解释
人工智能准确预测患者一年内的死亡风险,原理却无法解释

[2019-11-13]  图片来自BURGER PHANIE SCIENCE PHOTO LIBRARY美国最新研究显示,人工智能通过查看心脏测试结果,以高达85%以上的准确率预测了一个人在一 ...

比利时研发出可以自我愈合伤口的软体机器人
比利时研发出可以自我愈合伤口的软体机器人

[2017-09-03]  软体机器人是机器人技术的新兴领域; 他们“可以与人类相互作用,而不会杀死他们,并拿起像西红柿这样柔软的物体。” 从长远来看,布鲁塞尔大学队伍正在努力创建一个类似的材......

研究人员融合人类与AI的创造力 显著提高了深度学习的表现
研究人员融合人类与AI的创造力 显著提高了深度学习的表现

[2019-10-12]  由加拿大人工智能领域研究主席、滑铁卢大学系统设计工程教授Alexander Wong领导的一个团队开发了一种新型紧凑型神经网络家族,可以在智能 ...

国外眼科手术机器人为视网膜静脉阻塞患者带来希望
国外眼科手术机器人为视网膜静脉阻塞患者带来希望

[2017-03-20]  视网膜静脉阻塞,简称RVO,对患者来说是一种严重的疾病。该病病因为视网膜静脉中存在血液凝块,这可能导致视力严重下降,在某些情况下,病 ...

可编辑神经网络,有望简化深度学习?
可编辑神经网络,有望简化深度学习?

[2019-10-04]  深度学习是一个计算繁重的过程。 降低成本一直是 Data curation 的一大挑战。 关于深度学习神经网络大功耗的训练过程,已经有研究人员 ...

机器人从工业走向家庭  库卡KUKA目标是引领中国市场
机器人从工业走向家庭 库卡KUKA目标是引领中国市场

[2017-12-08]  机器人正在改变着人们的生活方式,而库卡KUKA想要在中国这个大蛋糕中占有一块大份额,库卡公司正在引领市场...

2017年:AI渗入云端
2017年:AI渗入云端

[2017-12-29]  云中的人工智能不仅仅是科技巨头的权力游戏,它也可能是人工智能领域的下一个飞跃。加利福尼亚州的Rigetti Computing公司刚刚使用其原型量子芯片之一在其云平台上运行机器学......

本周栏目热点

[2017-08-29]    8月25日,在日本木更津,狼型机器人超级怪兽狼站在稻田边,威慑可能危害庄稼的野生动物。当野生动物接近庄稼地,装有红外感应器的机器 ...

[2016-07-12]     昨天,记者从在津召开的全国第三届食管癌南北论坛上获悉,微创手术现已成为食管癌治疗的主要发展方向,超过六成的患者可接受包括达芬奇 ...

雾计算应用案例分析:无人机领域快递的应用

[2016-09-01]      导读: 无人机,是典型的物联网相关应用。传统的快递行业,面临着巨大的人员开销,设备成本,安全问题。然而,无人机快递,却可以精 ...

以品质立足世界,纳斯达克大屏上的Airwheel平衡车

[2015-12-23]     摘要:12月15日,Airwheel在美国证券交易所纳斯达克广告屏上对旗下的产品以及所推崇的出行理念进行宣传投放。在12月12日亚马逊全线封禁 ...

揭秘!越来越多编辑部开始自动化办公,AI会取代编辑吗?

[2018-05-22]  有人说,机器人和人工智能是下一场工业革命,它们会比以往的工业革命——蒸汽、电、计算机更具颠覆性,因为它们不仅仅会取代常规,还会取代 ...