江海洋阅读
扫描关注网站建设微信公众账号

扫一扫微信二维码

机器人记者,像人一样内容创作

砍柴网2015-04-08行业新闻 2609

本文来源纽约时报,作者SHELLEY PODOLNY,由机器之心独家翻译出品,参与成员:电子羊、青泽萌。

让我猜猜看,你认为你阅览的内容出自真人之手。也许你是对的,也许并不是那回事。或许你得问问我,当你填鸭式地将那些抽象艺术般的字母和数字键入那个烦人的小盒子时,你电脑如何行事。

因为,现如今,计算机算法而非人类创造的阅读内容数量之巨令人震惊。我们也许该怀疑一下,7天24小时不间断向我们袭来的信息不可能全都来自伏在笔记本电脑前的人类。

这不难理解。众多数字渠道催生的内容需求已非人力所及。这种需求,配上前所未有的复杂技术,催生了「自动化故事生产」(automated narrative generation)行业。

从事这桩生意的公司旨在借助算法和自然语言生成器创建文字内容从而将人类从写作过程的负担中解脱出来。为平台提供一些数据——比如财务收入数据,嗖的一声,几秒钟内,故事就写好了,要什么样的故事就给你什么样的故事。

这些机器作家可不仅仅是机械地复述数据,它们创作出听上去像是人类写的故事,有求必应——古板的、时髦的,符合目标群体的口味,甚至可以因人而异,就那么机智炫酷。当你阅读这些成果时,你永远也猜不到作者根本没有心跳。

来看看两则体育报道:

「已经落后两场的洛杉矶道奇队在第九场中似乎无力回天了,但多亏 Vladimir Guerrero的关键一击,洛杉矶反败为胜,最终在周日芬威公园的比赛中以7比6的比分战胜了波士顿红袜队。」

「密歇根大学棒球队在第五局得四分,拯救了连续三个周末的最后一场比赛,4月24日,星期六下午,他们在Wilpon 棒球场(历史上的Ray Fisher 体育场) 以7比5的比分战胜了爱荷华大学。」

如果你猜不出来哪个是出自人手,你不在少数。根据瑞典卡尔斯塔德大学Christer Clerwall 发表在《新闻实践》上的研究,当和类似的体育报道混在一起时,受试者根本看不出区别。(顺便说一句,在以上的例子里,第一段是机器写的,第二段是人写的。)

算法和自然语言生成器出现有一段时间了,随着需求与日俱增,刺激了投资和创新,它们做得更快更好了。我们产生的大数据陡增的体量和复杂程度已经超出单纯人力处理的范围,要从其中汲取意义必须要人工智能而非人类智能。

这些新的软件平台运用先进的指标来识别模式、趋势和数据异常,使得金矿的价值大放异彩,尤其是在数据丰富的诸如金融、体育和商业领域。然后它们迅速渗入解释性报道,作为机器记者介入进来,以取代人类。

美联社每季度借助Automated Insights的Wordsmith平台创作的金融报道达到3000多篇。苹果公司发布会数分钟内,它就发表了关于破纪录收入的报道。与此类似,福布斯则使用Narrative Science的Quill 平台,并将Narrative Science作为亲密的合作伙伴。

还有 Quakebot,洛杉矶时报用以分析地质数据的算法。去年南加州发生了4.7级地震,它是首篇新闻报道的作者,事件发生几分钟后,洛杉矶时报网站上就发布了该报道。洛杉矶时报还借助算法来改善凶杀案报道。

但我们略可放心。毕竟对我们而言,这些软件的处理过程近乎黑箱,它们可能偏向一些前提规范,或者包含一些我们无法辨别的偏见。更何况,在处理相同信息时,一个好奇的、想象力丰富的人类可能夹带一些私人洞见,这些可能会被遗漏。

这些颂歌无非是在宣扬老一套的「解放」主题:机器记者会使人类从数据处理工作中解脱出来,而进行更多报道。

这很好,但是Narrative Science的联合创始人Kristian Hammond估计,到本世纪20年代,90%的新闻将由算法写成,大部分甚至不需要人为干预。如果这一预测足够准确,将引发连锁效应。

现在主要是机器记者,但并不会就此止步。随着软件逐步取代我们成为传播者,算法内容正迅速渗透到我们文化的各个角落,从公共事务到足球,再到你下双鞋的评论。

Automated Insights 称,它们旗下的软件去年创作了十亿个故事,大部分没有人为干预,在它和Narrative Science的主页上,它们客户的我们众所周知:三星、康卡斯特、美联社、Edmunds.com和雅虎。你或许没有注意到,但你绝对不可能没有阅读过它们生产的内容。

书也能由机器写就。看看欧洲工商管理学院管理科学教授Philip M. Parker:他的算法系统已经获得专利,这套系统生产了100多万本书,其中10万本以上都在亚马逊上出售。他说,给他一个技术方面的或者深奥的主题,他的系统会挖掘数据并写成一本书或一份报告,模仿一个就此主题展开写作的人的思维过程。

Narrative Science则表示,它能创作出「无法区分出作者是人还是机器的故事」。Automated Insights 表示,它擅长像人类一样写作。但正是这些让我迟疑了。「像人一样」这个短语事实上成为了插入语,不仅是内容创造,当我们谈及大多数技术时都会这么讲。

我们的手机会像人一样和我们说话,我们的家具会像人一样服从命令,我们的汽车会像人一样自驾。那「人」到底意味着什么?

随着技术的发展,进化的下一步似乎总是合乎逻辑的,而那正是危险所在。在一次次的诱惑下,我们一点点地放弃了自我的一部分。我们很少退一步思考,最终我们是否得不偿失。再说,谁有时间去考虑哪些,毕竟每天要吸收那么多信息,而我们终究是只普通人。

文章关键词
创作
内容