我们说新闻写作现在也是一个初步的阶段,美联社Wordsmith的平台写作,主要是写财经方面和体育方面的报道。第二个是自动提取关键信息,对它进行一些过滤,然后设定报道选题,到底做哪个方面的报道。现在写作基本上还是详细的、简单的,或者用各种风格的模块来填一些内容,主要是填数据,加上一些简单的语义加工,还有一些所谓的风格,最后就是编辑过目后再发布,最大的优势就是写作速度非常快。
从我们跟新华社新华网的合作,主要的亮点就是传感信号,真实记录了用户的体验。在各种数据的整合下,进行语义分析识别。比如《战马》上半场、下半场时间段的对应。然后是新闻模块的写作和人机交互。在这个过程当中应用很多,比如数据的可视化等等。
我们总结,模块+数据+语义+智力分析+其他信源。第一段通过传感器的数据来填充模块,要有一些语义分析的成分在里面。通过这些东西再加上一些线上内容的组合,来产生一些报道。
我们也可以做这种成人、儿童观看《战马》的不一样感受,比如老年人、男人、女人,通过数据做各种对比。
其次,像腾讯也基本上是这样,有模块填充数据,然后从网上采访多个信息源来补充。
这是生成的页面,各种对比的数据,包括可以选择的东西。这种做法可以跟新闻记者,或者写作的人提供更客观、更真实的观剧的反应和数字,而不是调查采访,可以从多个角度、各种比例得出统计数据。
另外,写完新闻之后新闻发布还是有规则的。比如洛杉矶时报关于地震的自动报道,6.0级以上就是自动报道。3.0级至6.0级则会将报道发送至编辑,由其决定是否值得追踪报道。3.0级以下则不会收到消息,因为多数情况下,这意味着不值得大惊小怪。机器人写作的步骤通过高质量数据采集、新闻的计算、人机交互。首先是大数据的分析,数据的采集,你是来自于哪个方面,上升怎么样,有几个波峰波谷,流入流出,有数字特征的信息就比较好。高质量数据的采集,线上、线下,特别是一些传感技术,还有新闻的计算,数据的新闻价值判断,选择故事的“角度”。
当下写作主要是基于统计的数据比较多。未来,我们觉得生物传感技术这些东西也比较重要,能抓到兴奋程度、注意力、人体生物体征的东西。这种东西掩饰不了,可以应用于观剧、观看电影、广告的投放,人的真实反应和课堂学习的反馈,还有人群健康状况的监测。这是将来很重要的一个方面。
新闻的计算,新闻价值的判断,数据异常检测适用范围,如何核实异常数据数据为新闻?如何引入人工智能进行综合建模?机器学习方法需要的数据从哪里来?辅助记者选择新闻的角度,如何面向不同领域的记者,辅助整理报道逻辑和路径?如何为记者检索甚至量身定制恰当的叙事模块。
人机交互,数据可视化,基本图表的生成,复杂数据的可视化。自然语言的生成,匹配相应的语义信息的句子模块,串联融合各句子的篇章结构模块,文字的“风格”建模,如用词习惯等。
<上一页 1 2 3 下一页>












