内容摘要:大数据技术正在对今天的新闻业形成冲击,它在一定程度上将对现有的新闻生产的模式与机制产生影响,这主要体现在:大数据技术渗透到新闻生产的核心环节,大数据技术重树新闻质量标杆,大数据技术进一步提升受众反馈的价值,大数据技术拓展用户分析广度与深度。在大数据技术等因素的推动下,新闻业务将实现一些方向性调整,如趋势预测性新闻和数据驱动型深度报道分量的增加,数据呈现、分析与解读能力的提高,新闻生产中跨界合作的增强。
关键词:大数据;信息图表;计算机辅助报道;数据驱动型新闻
作者简介:
【英文标题】The Era of "Big Data": New Shocks Facing by Journalism
【作者简介】彭兰,中国人民大学新闻学院,中国人民大学“新闻与社会发展研究中心”研究员
【内容提要】大数据技术正在对今天的新闻业形成冲击,它在一定程度上将对现有的新闻生产的模式与机制产生影响,这主要体现在:大数据技术渗透到新闻生产的核心环节,大数据技术重树新闻质量标杆,大数据技术进一步提升受众反馈的价值,大数据技术拓展用户分析广度与深度。在大数据技术等因素的推动下,新闻业务将实现一些方向性调整,如趋势预测性新闻和数据驱动型深度报道分量的增加,数据呈现、分析与解读能力的提高,新闻生产中跨界合作的增强。
【关 键 词】大数据 信息图表 计算机辅助报道 数据驱动型新闻
今天的新闻业正在受到前所未有的挑战。一方面,社会化媒体的兴起使得公民新闻在一定程度上侵蚀着过去专业媒体的领地;另一方面,在大数据技术等的支持下,计算机这样一种“机器”,也在对媒体人形成直接的冲击。关于社会化媒体的影响,学界和业界已有很多关注,但对于大数据时代技术对媒体的影响,我们的关注还远远不够。而在未来,它的影响将超乎我们的想象。
一、从“计算机辅助报道”到大数据时代
计算机数据分析技术与新闻报道的结缘并非新鲜事。20世纪50年代,美国就有媒体记者利用大型计算机对政府提供的数据库中的信息进行分析,以发现和调查新闻事实。[1]之后,在西方,计算机辅助报道(Computer Aided Reporting,简称CAR)逐渐兴起,在这样一个新的领域内,人们不断探讨着以数据为基础挖掘新闻、解释新闻的方法。那些或公开或隐蔽的数据,成为记者发现新闻选题、拓展新闻深度的重要资源。
但在计算机辅助报道技术启动之初,媒体能利用的资源是有限的,来源主要是政府机构、企业等发布的数据。而互联网、手机等新媒体的发展,使得计算机辅助报道能获得的数据日益丰富。
今天的时代已经被称为“大数据”时代。“大数据”(Big Data)这一概念,首先是指信息或数据量的巨大。数据的单位,已经从G和T发展到P、E、Z、Y等为计量单位。计算机中存储信息的基本单位是字节(Byte)。一个西文字符用一个字节存储,一个汉字需要两个字节存储。其他单位及其相互间的关系分别为:1K =1024Byte,1M =1024K,1G =1024M,1T =1024G,1P =1024T,1E=1024P,1Z=1024E,1Y=1024Z。有资料称,2011年全球的数据量达到1.8Z。[2]
大数据时代的出现,与很多因素相关,除了政府机构、媒体、企业等提供了更多的数据外,用户数据、社会化媒体平台上的UGC、移动终端的地理信息、物联网技术的发展等,也使信息的数量急剧增长,而后者是大数据时代更重要的数据来源。
这样的新环境,对大型数据的挖掘、处理、分析、分享等能力提出了全新的要求,此外,“大数据”时代也意味着不同行业、不同领域的数据之间的交换和相互利用也变得十分频繁。大数据时代,强调的是对大规模数据的综合处理能力。
提到大数据特点,业界通常会将其归纳为四个“V”,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value)。IBM网站关于大数据四个特点的界定中,则用真实性(Veracity)替代了“价值”。(参见http://www-01.ibm.com/software/data/bigdata/)总体来看,大数据意味着多样化的数据来源、巨大的数据量、快速的处理。而对于大数据的价值,人们的解释角度不尽相同。虽然对大数据进行有效加工会产生巨大的价值,但大数据本身却有着价值密度低的特点,也就是说单位数据的价值并不高,要在大量的数据中发现有价值的数据或者将低价值的微小数据集聚成有价值的大数据,也是大数据技术要解决的一个主要问题。
目前,“大数据”的概念及其价值更多的是被IT业和企业营销领域所关注,但事实上,传媒业也将是受到大数据时代冲击的主要行业之一。







