【热点导读】:新闻娱乐化现象试析 传媒业发展回顾及展望 默多克传媒消费主义研究(下)
论媒体的发展现状的研究
文章来源
3edu.net
一、大数据的产生与发展
早在1980年,着名未来学家阿尔文托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。不过,大约从2009年开始,“大数据”才成为互联网信息技术行业的流行词汇[1]。
随着移动通讯技术、云计算、物联网等技术的发展,数据的积累已经达到前所未有的地步。大数据的发展基于以云计算为代表的大存储量的基础之上,计算机存储单位已从G、T发展到P (1P=1024T)。可以说,没有云计算的迅速发展,不会有大数据时代的到来。业界通常将大数据的特点归纳为四个“V”,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value)。IBM网站关于大数据四个特点的界定中,则用真实性(Veracity)替代了“价值”[2]。
大数据的出现首先对商业产生了重大影响,触感敏锐的商家逐渐舍弃被动的销售模式,转而通过分析客户以往的消费习惯,主动为其推荐“可能需要的产品”,如卓越、当当等网站会推荐“可能感兴趣的书”,在“淘宝”网站上进行购物时会出现“浏览过此宝贝的人还浏览过……”等信息。我们不难发现,商界已经先于其他领域,牢牢抓住大数据的契机,通过对客户消费习惯的分析,总结出客户选择的偏好,从而制定个性化的推荐服务。
二、媒体大数据发展现状
随着商界充分挖掘大数据潜藏的巨大价值,传统媒体、网络媒体、社交媒体等也逐渐意识到大数据可能带来的巨大变革,开始摸索着向大数据时代前进。
纸质媒体依靠纸质平台很难用客观的数据对新闻报道的好坏进行分析(好坏是指单篇报道的受欢迎程度),因此目前其主要借助网络媒体、社交媒体的平台,通过分析这些平台上所转载新闻的点击率、转发率等数据进行分析。据《中国微博元年市场白皮书》的统计数据显示,截止2010年8月,全国共有466家主流新闻机构开通了“新浪微博”,其中包括118家报纸、243家杂志、36家电视台和69家电台[3]。借助“微博”平台,编辑可以根据“微博”评论量和转发率来判断一条新闻的好坏,适当调整新闻采编的方向。解放日报报业集团社长尹明华曾说:“一篇稿子好不好,不能光凭主观判断,而是要有数据分析。这些数据可能有一部分来自内部专业人士,更多的则来自社会。[4]”
此外,纸质媒体也通过与网络媒体联手的方式拥抱数据时代。2012年7月,解放日报报业集团和深圳腾讯公司联手打造了“大申网”,上海网络用户只要登录QQ,就会获得最即时的定向推介。此次合作对解放集团有两大益处,其一,借用腾讯网平台可以实现新闻的实时报道,弥补了纸质媒体在时效性方面的天然缺陷;其二,腾讯网可以通过分析用户浏览新闻的习惯,定向推介特定的新闻,增强了新闻报道的影响力。
其次,有少量传媒集团着手与专业调查机构合作,深入开发大数据的潜在功能。如浙江报业集团去年开始投资数据分析项目,将目光放在了未来社交网络数据的深度挖掘上[1];2012年2月,佛山传媒集团与尼尔森公司合作,佛山传媒集团希望借助尼尔森大数据分析的平台,通过对数据的整合、分析、管理,为他们的转型发展提供战略性的策略依据[5]。
在大数据时代的发展背景下,电视媒体主要通过依靠数字技术收集受众信息以及与网站合作的方式参与其中。目前,数字电视收视率可以通过数字机顶盒实时记录电视家庭户的频道及广告收视、电视互动服务使用的情况,从而形成了实时的海量数据流,通过回传通道传给位于前端的汇总服务器。
走在大数据前列的大型网站,已经意识到大数据时代的核心在于海量数据及其存储分析能力,正在这两方面寻求突破。如优酷土豆股份有限公司的搜索平台拟挖掘和推算出4亿多视频用户的浏览行为数据;搜狐网站正着手搭建基于云计算的大数据平台,将旗下数据资产全面打通整合,获取每月9亿多人次的用户数据资产[1]。
可以说,无论传统媒体还是新媒体,都已经意识到大数据将带来的巨大变革,但是大数据究竟会对其产生什么样的影响、带来哪些变革,尚处于摸索阶段。
三、大数据可推动媒体预测性报道的兴起
大数据究竟会给媒体带来什么变革?笔者认为,第一个方面体现在对传统新闻时效性定义的颠覆上。
目前我国学界较认同的新闻的定义为:新近发生的事实的报道[6]。但在大数据时代的背景下,新闻报道如果仅仅满足于“对新近事实的报道”是远远不够的。大数据的核心就是预测[7]。为了牢牢把握住受众的眼球,媒体有必要借助新的大数据技术、凭借自身庞大的数据库资源,做到一些高准确率的、预测性的报道。
事实上,在美国已经出现利用计算机分析撰写报道的先例。Narrative是一家拥有大约30名员工的美国公司,它运用Narrative Science算法,大约每30秒就能够撰写出一篇新闻报道。2011年该软件通过收集相关信息写出了大约40万则关于少年棒球联盟的新闻报道。2012年这一数字预计将达到150万[2]。
但是由于社会环境的复杂性,以及计算机本身计算能力的限制,这种预测性新闻并不适合所有的领域。计算机相对人脑而言不够灵活,需要人工对其进行重复训练才可以达到自行分析、编写新闻的目的,具体而言就是要提供给计算机很多不同的新闻数据,然后根据一定的准则将这些数据分割,通过固定的计算机算法,计算机会学习到一定的概率信息,以后碰到相似问题,计算机就可以按照之前给出的新闻模板生产新闻。但通过这种方式制作的新闻会显得过于千篇一律。并且,由于计算机需要在一遍遍重复训练后才可以变得准确度更高,因此,对于数据量过小的新闻领域而言,其错误率显得过高,目前只在体育新闻及金融新闻可行性较大。
因此,在新闻报道中,仅仅将大数据的预测功能作为一种辅助功能,即仅作为提示记者下一个关注点的一种工具,具体采写过程应该由记者自己完成。
四、大数据可改变新闻采编方式
从上述论证来看,要挖掘大数据的预测功能尚有很长的路需要探索,并且给我们提出一种警示,在媒体发展过程中想最大限度地发挥大数据的优势,势必采取人机合作的方式,这种合作方式首先应该体现在对传统新闻采编方式的改变上。目前,记者的新闻编写工作主要通过电脑输入来完成,虽然较之以往的手写方式便捷许多,但由于记者工作性质的特殊性,需要四处移动,有时无法在截稿时间节点前完成稿件的输送。
记者可以在专业的数据采集平台录入音频或者图片数据,而后通过后台完成数据的抓取以及新闻编写工作,当然这仅仅指可以套用模版的小稿件。具体操作模式为:记者只要在采访过程中随时录下所需的音频数据,并且在音频数据末尾输入特殊的“符号”,其后通过专业的数据抓取平台提取相关数据并加以分析,由计算机后台按照一定的编写模式撰写稿件,在得到记者确认后提交稿件库。比如,在“新浪微博”的博文中添加“@爱马克”的信息后,“爱马克”软件自动为读者收藏“微博”中的网页,从而提取读者感兴趣的网页、文字等数据。笔者认为,可以开发一个类似“爱马克”的软件,记者只需在数据录入过程中添加一个数据提取的道口就可以利用大数据分析后台进行新闻的编写工作。
根据现状来看,大数据时代对于音频、图片等方面数据的分析并非不可能。在IBM发布的一份名为《分析: 大数据在现实世界中的使用》的报告中显示,组织在大数据工作中主要利用的内部数据源有38%来自音频数据、34%来自静态图片或音频。而在大数据分析能力方面,25%的受访者报告正在利用语音来分析大数据[8]。
如果这种新的采编方式得以实现,那么将大大加快媒体的发稿率。
五、媒体应充分利用媒介社区资源
此外,在大数据时代,数据本身的价值远远大于其技术革新的价值,数据本身是大数据时代的最重要的部分。媒体若要在大数据时代处于行业领先地位,就必须在现有数据库资源基础上拓展数据库规模。
目前,新闻记者获取新闻源主要通过三种方式:第一,条线记者会定期收到来自条线通讯员提供的信源;第二,从报社的爆料平台获取信源;第三,从网络上获取信源。前两种方式虽然在一定程度上保证信源的可靠性,但戈夫曼曾在《日常生活中的一种自我呈现》中指出,当个体处于他人面前时,常常会在他的行动中注入各种各样的符号,这些符号戏剧性地突出并生动勾画出了若干原本含混不清的事实[9],即通讯员可能出于对自己利益保护的原因,刻意隐瞒某些事实,致使报道存在片面性的缺陷,并且信源的渠道有限。第三种获取信源的方式虽然扩大了信源的数量及规模,但逐一浏览网页、辨别信源真伪耗费记者大量精力。
笔者认为,在大数据时代下,可以充分利用媒介社区资源,扩大信源采集量。对于媒介社区的概念在学界尚存在争议,争论的焦点主要集中在对社区概念的认定上。目前对社区概念的理解主要有三种,一种说法认为社区是“社会共同体”,是人组成的“群体”;另一种说法认为社区是“地理区域”,或者是指定的“物理空间”;第三种观点认为,社区概念是上述两派的合集[10]。
本文涉及的媒介社区主要指第三种,即“社会共同体”和“地理区域”的集合体。所谓“社会共同体”简而言之就是具有相同兴趣爱好、宗教信仰、共同话题等群体,而“地理区域”主要涉及生活环境、血缘关系等方面。
自15世纪古登堡发明印刷机以来,媒介社区逐步开始形成,首先出现的是以读书会的形式存在的媒介社区,在以广播为代表的电子媒体出现之后,形成了以广播节目的“粉丝”为主的媒介社区,在网络时代,又形成了以虚拟社区为主的媒介社区,所谓虚拟社区就是拥有共同兴趣爱好的群体在网络上形成的小社会。本文所指的媒介社区主要涉及以网络为主的虚拟社区,但这些虚拟社区既有“社会共同体”特性,又具有“地理区域”特性。
从“社会共同体”这一定义出发分析媒介社区发展现状,目前主要通过形成大量专业型网站、“讨论组”、“讨论群”、“贴吧”等方式来实现,比如以吸引汽车爱好者为主的“汽车之家论坛”、以