首页 新闻热点文章正文

数据新闻演进路径、研究热点和前沿述评

新闻热点 2025年09月11日 19:23 2 aaron

  数据新闻作为大数据时代传统报道形态的“加分项目”,近几年来猛然化身成为各大媒体竞相追逐的“香饽饽”,并迅速在学术界掀起一股研究热潮。本文系统探讨了数据新闻的演进路径,梳理了当前国内外数据新闻研究的热点动向,并基于现有研究成果和不足提出了未来研究的新趋向,以期为学界理论研究和 *** 突破提供借镜。

  数据新闻(datajournali *** ),或称数据驱动新闻(data-drivenjournali *** ),滥觞于大数据时代的新闻实践领域,因具备深度、广度、厚度、美度等优势特征而备受西方主流媒体青睐。数据新闻虽是新生概念,但媒体对数据的运用却可追溯至19世纪。早在1821年,《卫报》就 *** 了一张关于曼彻斯特和索尔福德两座城市学生人数和人均年度消费的表格,揭示出错误数据对扶贫政策制定造成的危害。另外,该报在2013年还推出了27张历史上的数据图表,展示了新闻工作者在电脑产生前的黑白打印图片时期是如何运作数据可视化的。

  进入21世纪第二个10年,随着大数据价值被重视程度、各国数据开放程度以及数据技术发展程度的提升,真正意义上的数据新闻实践开始大放异彩。2012年,在谷歌公司的支持下,全球编辑 *** (GlobalEditorNetwork)组织发起“数据新闻奖”(DataJournali *** Awards),专门对呈现“井喷”态势的数据新闻进行评优颁奖。短短4年光景,参评作品数以千计,地域遍布五大洲。BBC的《EveryDeathonEveryRoadinGreatBritain》、《卫报》的《RiotRumours》、ProPublica的《DollarsforDoctors》等经典力作早已深入人心并成为业界模范。

  国外如此,境内亦然。无论是新兴媒体还是传统媒体,都希冀在数据新闻场域崭露头角以奋力追赶时代潮流。如新华网的“数据新闻”、新浪网的“图解天下”、财新网的“数字说”、南方都市报的“数读”等,均是数据新闻的“源流”。诸如《郭美美究竟曝出了多少关系?》《三公消费龙虎榜》《“据”说春节》等作品无疑让人耳目一新,为人津津乐道。那么何谓数据新闻?其理论渊源何来?当下关于数据新闻研究存在的问题是什么?本文试图作出简要分析。

  学界比较一致地认为,数据新闻最早的相关表述是由EveryBlock的创始人阿德里安·哈罗瓦提(AdrianHolovaty)提出的,他在一篇演讲稿《报纸网站变革的一个根本路径》(Afundamentalwaynewspapersitesneedtochange)中表示,“报纸应该结束以故事为中心的世界观”,记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”。这就为数据新闻的发端划设了一条大致的分界线。然而,数据新闻并非无源之水,它实际上是20世纪之后,伴随新闻界对新闻客观真实性的不断追求而产生的必然结果,是对新闻学其他领域的一种庚续和传承,其中最主要地体现为精确新闻、计算机辅助新闻和数据库新闻。

  精确新闻报道(PrecisionJournali *** )出现于20世纪60年代的美国,最早由学者菲利普·迈耶提出,是指在新闻实践中运用社会科学研究 *** ,通过科学抽样收集资料,对之进行分析,并用数据来验证事实的报道 *** 。实践的标志是1967年菲利普·迈耶对437位参与底特律骚乱的黑人的抽样调查结果进行分析,破除了当时在媒体盛行的“参加骚乱者是底层人士”“南部黑人比北部黑人多”等错误论调。精确新闻报道把社会科学研究 *** 引入新闻学,其显著特点是用数据说明做新闻,从而使得新闻报道更具精确度。数据新闻尽管是相隔半世纪的概念,且媒介生态已经发生了翻天覆地的变化,但其本身所固有的“数据”属性某种程度上与精确新闻报道有着天然联系。

  计算机辅助新闻报道(ComputerAssistedJournali *** )起源于20世纪50年代的美国。实践的标志是1952年美国大选期间,哥伦比亚广播公司根据选举前期所返回的票数成功预测到艾森豪威尔会取得胜利。正是由于计算机新闻报道的兴起,记者开始不断尝试运用科学的调查统计 *** ,从公共数据库寻找需要的数据信息来完成调查性报道,履行监察 *** 、服务公众的使命。它不仅能够辅助精确新闻报道,还能辅助其他类型报道。因此,即使是今天的数据新闻也照样离不开计算机辅助新闻报道。

  数据库新闻报道是20世纪90年代西方新闻界继计算机辅助新闻报道提出的又一新闻概念,是距离数据新闻最近的一种新闻报道形式。它的出现主要是源于记者开始尝试从 *** 或者自己已有的数据库中寻觅数据集并从中挖掘新闻。但早期的数据库新闻只是对数据的基本整合,并未包含深度分析,也没有真正的挖掘,因而和数据新闻存在很大区别,只能算是一种增补和注脚。

  学术研究成果按性质一般分为基础理论研究、应用研究和发展研究三大类,梳理文献,笔者发现目前国内外学术界对数据新闻的研究可总结为“三位一体”。

  目前,虽然相关文献层出不穷,但在数据新闻定义方面仍然聚讼纷纭、莫衷一是。关于数据新闻概念的研究主要有以下几个立足点。

  一是立足于数据新闻的比较优势。保罗·布拉德肖(PaulBradshaw)认为,数据新闻简而言之就是“用数据处理的新闻”,与其他新闻不同之处在于,“它为将传统的‘新闻鼻’、讲引人注目的故事的能力与现在大规模可用的数据相结合开创了新闻的可能性”。①国内以喻国明等为代表,强调数据新闻是基于数据挖掘与分析思维的新闻报道,也是数据驱动型的调查性报道或深度报道。②

  二是立足于数据新闻的叙事创新。阿隆·菲尔霍夫(AronPilhofer)提出,“数据新闻是一个概括性术语,它涵盖了一套正在不断发展的用于讲故事的工具、技术和 *** ,包括了从计算机辅助报道(使用数据作为‘信源’)到最前沿的数据可视化和新闻应用的一切叙事方式”。③国内学者以郭晓科为代表,他认为数据新闻是“在多学科的技术手段下,应用丰富的、交互性的可视化效果展示新闻事实,把数据与社会、数据与个人之间的复杂关系用可视化手段向公众展示,以客观、易于理解的报道方式激发公众对公共议题的关注与参与”。④

  三是立足于数据新闻的产制流程。米尔科·劳伦兹(MirkoLorenz)在之一届国际数据新闻圆桌会议(theConferenceofData-DrivenJournali *** AmsterdamRound-table)演讲中指出,“数据新闻是包含以下基本环节的一种工作流程:通过反复抓取、筛选和重组以挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事”。⑤国内以方洁为代表,她认为“数据新闻是基于数据信息的采集、分析和呈现的新闻工作方式”。⑥

  由此可见,专家学者对数据新闻概念的界定呈现出一种弥散性特征,从不同角度出发具有不同的解释。笔者试图归纳其共同特点,进而对数据新闻这一概念作一个较为全面的阐释:从广义上看,数据新闻是指一切与新闻报道、编辑或通往新闻末端紧密相连的,依凭数据进行处理的活动。从狭义上看,数据新闻特指大数据时代产生的,将数据思维贯穿于新闻采集、 *** 、发布和传播整个过程的新型新闻报道方式。

  约翰·梅尔(JohnMair)和理查德·兰斯·基伯尔(RichardLancekeble)在其共同编纂的《数据新闻:映射未来》(DataJournali *** :MappingtheFuture)一书中把数据新闻特点概括为四点:交互性、统计性、多模块和受众参与。⑦

  方洁提出数据新闻四个特征:以服务公众益为目的;以开放的数据为基础;以数据处理分配的结果作为驱动;以数据处理分析的结果作为驱动报道逻辑的核心;以可视化方式呈现新闻。丁迈认为数据新闻涵括五个特征:以数据为新闻素材;以数据挖掘技术为依托;以用户为导向;以新闻价值为核心;以团队为工作模式。凌霞也认为数据新闻有五大特性:表现形式的形象化、可视化;信息来源的多样化;逻辑关系的相关性;情感行为的可判断性;生产方式的互动性。

  综合上述学者对数据新闻特点的归纳,经过“合并同类项”或可进行如下提炼:一是数据新闻来源的多样性;二是数据新闻挖掘的深度性;三是数据新闻呈现的可视性;四是数据新闻服务的大众性。数据的这些特性为数据新闻在叙事方面的特征阐述开拓了思路。

  近几年来,数据新闻之所以备受学界和业界关注,主要就是缘于其独特的魅力和张力。杰里?维曼(JerryVermanen)认为,数据新闻有两个好处,即寻找独特的故事(而不是从通讯社获得)和执行看门狗的功能。⑧亨克·范艾斯(VanEss)认为数据新闻使记者能够通过发现、 *** 、呈现大量数据,展现原本工作流程未曾报道过的新闻故事,发现新的报道角度。⑨

  国内学者如喻国明等强调数据新闻具备四大功能,即重构沉寂的历史数据的唤醒功能、连接当下的事实主体的关联功能、把握未来的信息走向的预测功能、展现数据可视化之美的“悦读”功能。陈力丹等通过对国内外代表性媒体的大数据新闻实践进行研究,也总结出大数据新闻的四个功能,即新闻叙事、事实判断、预测走向和信息定制。

  数据新闻实践的发迹远远早于其理论的开端,故常常体现在专家学者的文章和讲演之中。总的来看,国内外研究数据新闻实践多以个案为主,但采用的 *** 略有不同。

  凯瑟琳?芬克(KatherineFink)使用一种半结构化的采访 *** 对美国的数据新闻予以描述。根据不同的教育背景、技能、工具和目标,他们采访到诸多类型数据记者,发现许多人面临着相似问题,如试图确定他们在其组织中的角色。⑩埃斯特尔(EsterAppelgren)采用行动研究 *** ,提供了七家瑞典传统媒体公司数据新闻实践的概况。其内容主要基于一项对记者的在线调查,以及对参与公司的编辑们的深度访谈。结果表明,在瑞典数据新闻仍然是相当少见的;今天数据新闻工作 *** 面临的主要挑战是缺乏时间和需要的培训和发展数据新闻专业技能。斯特凡·韦拉奇(StefanWeinacht)着眼于数据新闻在新闻学院越来越多地得到实践和教授的现实,通过结构化采访35位有经验数据基础的数据记者,试图描述经验数据新闻在德国的基本情况。

  此外,爱德华·西格(Edwardseel)的研究也颇具代表性。作者对近60个交互图表进行考察,分析了不同图表的各自特点,以寻求构建叙事流的传播者与发现故事的读者之间的关系。作者依靠从新闻媒体到可视化的案例研究,确定了7种不同体裁的可视化叙事方式,包括:杂志版式、引语、分区海报、流程图、漫画条、幻灯片、影像视频。玛杰·鲁泽(MarineRoose)采用比较研究法对《》与《卫报》的互动图表进行考究,认为二者在使用工具、可视化风格、数据来源等方面均存在不同。

  与国外的数据新闻实践研究不同,国内相关研究主要由两部分构成:一是对国外数据新闻实践的研究,二是对数据新闻本土化的研究。笔者通过梳理相关文献,试图管窥大致研究脉络。

  一是以国外媒体个案为对象。美英媒体作为数据新闻实践的先行者,在诸多方面可圈可点,故而相关研究主要集中于此。如一些学者以英国《卫报》“数据博客”中《伊拉克战争日志》《伦敦骚乱中的谣言》《 *** 各部门开支》等可视化作品为例,详细解读了数据地图、时间线、交互图表三种可视化形式在数据新闻中的运用。一些学者通过研究《》的专题报道“租房还是买房”推导出数据驱动的个性化新闻如何发挥功能性和服务性。还有学者以《》的地图新闻为研究样本,指出其核心是用数据挖掘的手段获取各种结构化的信息,并以数据化地图的形式呈现。

  二是以数据新闻奖作品为对象。全球数据新闻奖是国际上之一个表彰数据新闻领域优秀工作的专业奖项,研究获奖作品可窥见当前数据新闻的基本标准和专业水准。目前,之一届数据新闻奖作品均有学者进行深入研究,重点阐述调查性新闻、可视化叙事、新闻应用、预测性报道等业已成为数据新闻的创新维度。程宁璟则较为系统地研究了2012-2014年的所有提名作品,分析了当代数据新闻作品的特征和类型。

  三是以国外数据新闻教学为对象。以美国为首的国外大学新闻院系均开设了数据新闻教学,不少学者对此予以关注。如舒媛对哥大新闻学院开设大数据和编程课程的基本情况进了介绍,认为数据和算法正在改变着各个行业,讲故事也该靠数据。许向东对密苏里新闻学院的数据新闻教学进行了考察,认为在课程设置和实践模式方面对我国的数据新闻教育具有参考价值。祝建华介绍了密歇根州立大学(MSU)、加州大学圣地亚哥分校、乔治敦大学、犹太州大学、华盛顿州大学等美国大学新闻院系的数据新闻教学情况,并对数据化传媒学生的基本技能和相关师资的来源进行了讨论。

  一是对报纸媒体数据新闻的研究。当下,愈来愈多的中央和地方纸媒开设了数据新闻专栏,定期刊登各具特色的新闻报道,成为众多学者的研究对象。如习楠等分别对《北京晚报》《无锡日报》《柳州日报》《温岭日报》《京华时报》《南方都市报》《华西都市报》《温州都市报》等地方党报、都市报的数据新闻实践进行个案分析,介绍了“数读温岭”“华西数据”“我有数”“数据表情”等各个数据新闻专栏、专版在报道过程中的特点规律。但朱萍等在对这些报道进行宏观维度分析之后也遗憾地指出,国内大部分纸媒“数据新闻”不是真正意义上以大数据为支撑的数据新闻。

  二是对广播媒体数据新闻的研究。石勒认为,广播做好数据新闻应该在以下三方面下工夫:增强跨界合作,借助大数据研究,紧跟热点问题,加入人性化解读,增强传播效果;适时成立数据新闻团队,利用数据新闻来增强与广播受众的互动,并将互动内容及互动数据循环利用;加强人才储备及员工培训,提高记者的数据素养,培养适应大数据时代的新闻人才。目前,学界对广播数据新闻的研究相对较少,笔者以为,造成这种现象的主要原因在于媒体自身条件所限。

  三是对电视媒体数据新闻的研究。目前,学界关注点主要停留于以央视为代表的主流媒体,不少学者以2014年央视“‘据’说春运”“‘据’说春节”“两会大数据”“‘据’说两会”节目为研究对象,认为电视时政报道运用数据新闻应着力解决提出专业数据搜索请求能力不足、对大数据分析解读和关联能力不足、整合民间“大数据”与官方数据能力不足等问题。也有学者采用比较研究法,重点揭示出央视自2013年 *** 数据以来所取得的发展和进步,主要表现为内容更丰富、播报风格更贴近百姓生活、数据挖掘意识和能力提升、数据可视化元素增多。

  四是对 *** 媒体数据新闻的研究。 *** 媒体在数据新闻操作上具有较大的平台优势,因而在报道数据量上也远超其他媒体,是学界关注的重点。如韩巍等主要考察了财新传媒的可视化数据新闻实践,指出财新的数据可视化表现为用互动图表讲故事、数据挖掘、辅助理解三种形式。马轶群等对新华网、澎湃的数据新闻实践进行了探讨,对相关特点、驱动、作用给予了说明。周善等则从更为宏观的视角对网易、新浪、搜狐、腾讯四大门户网站的数据栏目进了综合与对比研究,从内容选择、内容结构及表达形式等方面分析了目前其数据新闻之现状及不足。

  相比个案研究,学者在宏观面向上的探寻可谓着墨颇多,主要集纳了数据新闻的影响、反思、问题、策略和前景。

  综观当前学界研究成果可以确证,数据新闻的关键问题不在于是否有影响,而在于究竟影响到哪些领域。对此,不同学者有不同的观察角度,如彭兰从宏观视角出发,指出大数据技术正对新闻业的冲击主要体现在:大数据技术渗透到新闻生产的核心环节;大数据技术重树新闻质量标杆;大数据技术进一步提升受众反馈的价值;大数据技术拓展用户分析广度与深度。曾庆香等从新闻专业主义出发,认为大数据时代诞生的数据新闻去除了固定采访线路作为主要新闻来源的功能,消解了社会精英在新闻中所拥有的话语权,数据新闻使新闻业更符合新闻实践的专业主义。王光艳从新闻特性出发,认为大数据技术对传统的新闻理论造成了冲击,新闻的某些特性正在发生着变化,主要体现在新闻的真实性、新鲜性、及时性三个方面。朱述超等从受众视角出发,认为数据新闻的传播应与受众的认知逻辑相符,并积极帮助受众建构相应的认知结构,具体作用有:增加新闻受众的知识贮备;激活新闻受众的感觉通道;协助受众建构认知策略。

  面对学界对数据新闻普遍追捧的热潮,部分学者开始了批判性分析,并且集中于数据采集和使用中的伦理道德研究。约书亚·费尔菲尔德(JoshuaFairfield)采用由W.D.Ross提出的道德理论框架,探讨了利用大数据技术进行伦理研究出现的新问题。法恩(Fahn,J.)认为,在技术的支撑下,个人和组织可以更密切地监测我们的私人生活,但也会引发道德、安全、法律等方面的问题。安德鲁.西曼(AndrewSeaman)认为 *** 和社交媒体上的相当一部分数据难以核实且缺乏准确性,容易将不上网、不使用社交媒体的群体排除在外,这不符合社会道德规范中让发声的原则。国内吴洪霞等认为数据新闻伦理问题主要表现为:脱离新闻本质、违背新闻专业理念、缺乏人文关怀、泄露隐私、信息保护与数据残缺、 *** 狂欢与数据污染、版权保护与数据窃取。

  富·凯恩(RichKane)分析了Swarmize(收集用户数据并把它转化为读者能够轻易理解的信息的过程,认为数据新闻 *** 关键要简单,比如编辑可以很快建立简单的投票,并将它们嵌入到网页中。明迪(MindyCharski)强调要加强对数据的运用,指出能够使用联邦调查局的数据意味着记者没必要仅仅依靠轶闻和专家意见。钟瑛等通过梳理数据新闻的发展现状,指出数据新闻发展的瓶颈主要是人才短缺、数据资源获取受限、盈利模式不清晰、学界研究前瞻性不足、理论对话失衡等,并提出要拓展数据新闻人才培养路径、尊重各国数据新闻发展现实、完善信息法规保障数据获取、发掘数据价值、加强前瞻性研究指导。王维明等认为大数据时代,记者传统的采编技能已经落伍,记者应当在软件操作力、数据收集力、数据挖掘力、数据可视化呈现力等四种能力上下工夫。

  尽管近年来国内外数据新闻研究围绕一些重大性、紧迫性、显著性问题进行了深入的探讨,但与飞速发展的数据新闻实践相比,理论研究依然难以望其项背。通过对相关研究的学术梳理,笔者以为今后的研究应着重在以下几个面向下工夫。

  从数据新闻相关实践研究的综述来看,无论是在国外还是国内,数据新闻案例研究都存在主题相对集中、内容高度同质的现象,比方说对国内电视数据新闻实践的研究,基本上都以央视的“两会”“春运”为例,而对国外数据新闻实践的研究则基本上都以英国《卫报》为例,并且选取的具体分析文本都比较相似,譬如《解读骚乱》《伊拉克战争日志》等。而与之形成强烈反差的是,关于广播数据新闻实践的研究则是屈指可数,关于杂志数据新闻实践的分析也不多见。内容研究之所以出现“两极分化”,很大程度上是由于学者和学者之间、学界和业界之间的交流沟通缺失缺位,导致学术资源整合度不够。自2009年数据新闻被系统推行以来,世界各国新闻媒体都在努力抢抓机遇,生产了大量优质数据新闻,研究者宜加强沟通合作,拓宽研究视野,主动寻求具有创新性的实践范例,以避免实践研究产生千人一面、千篇一律怪象。

  对比国内外研究可见,国外对数据新闻实践的研究多采用内容分析的定量研究 *** 和调查研究 *** ,而国内相关研究则侧重于文本分析、比较研究和少量的问卷调查,却鲜有控制实验 *** 的展开研究。此外,数据新闻作为新兴的交叉领域,势必关涉多学科、多专业,比如视觉文化、视觉传播、美学、伦理学等。因此,应该尽可能引入跨学科的研究 *** 和研究框架,这也是提增数据新闻研究创新性的重要途径。然而,目前的研究更多是单纯以传媒业角度为切入点的,跨学科研究尚处阙如状态。

  很多研究的重点都过度集中于对现实问题的考量,以及对实践经验的归纳总结,理论的升华和突破则力有未逮,导致数据新闻并未形成清晰的理论体系。而即便是解决现实问题的研究,也存在办法简单化、机械化的问题,甚至存在“问题直通办法”的现象,如指出问题是“数据开放程度不够”,便立马提出对策是“要加强数据开放程度”,至于为何开放、如何开放等问题则少有提及。就目前而言,关于数据新闻传播效果的考察是较为匮乏的。评判数据新闻内容优劣大多以销售量、收视率、点击率的高低为参照,更有甚者依靠业内人士的经验推测。受众才是权衡传播效果的关键一环,少之则必不能成为科学研究。对此,可通过一些大型的受众调查予以填补。

  ②喻国明、李彪、杨雅、李慧娟:《新闻传播的大数据时代》,中国人民大学出版社2014版,第25页。

  文卫华、李冰:《大数据时代的数据新闻报道——以英国卫报为例》,《现代传播》2013年5期。

  王之月、俞哲旻、彭兰:《数据驱动的个性化新闻——以的专题“租房还是买房”为例》,《新闻界》2015年第7期。

  陈昌凤:《数据新闻及其结构化:构建图式信息以的地图新闻为例》,《新闻与写作》2013年第8期。

  程宁璟:《当代数据新闻作品特征研究——以全球数据新闻奖2012-2014年提名作品为样本》,山东师范大学硕士论文,2015年4月。

  祝建华:《大数据时代的新闻与传播学教育:专业设置、学生技能、师资来源》,《新闻大学》2013年第4期。

  马轶群:《当新闻先生遇上数据 *** ——新华网的数据新闻探索》,《中国传媒科技》2014第12期。

  周善:《数据新闻:网站专业生产内容(PGC)的可循之途——四大门户网站的数据新闻实践》,《编辑之友》2014年第8期。

  数据新闻作为大数据时代传统报道形态的“加分项目”,近几年来猛然化身成为各大媒体竞相追逐的“香饽饽”,并迅速在学术界掀起一股研究热潮。本文系统探讨了数据新闻的演进路径,梳理了当前国内外数据新闻研究的热点动向,并基于现有研究成果和不足提出了未来研究的新趋向,以期为学界理论研究和 *** 突破提供借镜。

  数据新闻(datajournali *** ),或称数据驱动新闻(data-drivenjournali *** ),滥觞于大数据时代的新闻实践领域,因具备深度、广度、厚度、美度等优势特征而备受西方主流媒体青睐。数据新闻虽是新生概念,但媒体对数据的运用却可追溯至19世纪。早在1821年,《卫报》就 *** 了一张关于曼彻斯特和索尔福德两座城市学生人数和人均年度消费的表格,揭示出错误数据对扶贫政策制定造成的危害。另外,该报在2013年还推出了27张历史上的数据图表,展示了新闻工作者在电脑产生前的黑白打印图片时期是如何运作数据可视化的。

  进入21世纪第二个10年,随着大数据价值被重视程度、各国数据开放程度以及数据技术发展程度的提升,真正意义上的数据新闻实践开始大放异彩。2012年,在谷歌公司的支持下,全球编辑 *** (GlobalEditorNetwork)组织发起“数据新闻奖”(DataJournali *** Awards),专门对呈现“井喷”态势的数据新闻进行评优颁奖。短短4年光景,参评作品数以千计,地域遍布五大洲。BBC的《EveryDeathonEveryRoadinGreatBritain》、《卫报》的《RiotRumours》、ProPublica的《DollarsforDoctors》等经典力作早已深入人心并成为业界模范。

  国外如此,境内亦然。无论是新兴媒体还是传统媒体,都希冀在数据新闻场域崭露头角以奋力追赶时代潮流。如新华网的“数据新闻”、新浪网的“图解天下”、财新网的“数字说”、南方都市报的“数读”等,均是数据新闻的“源流”。诸如《郭美美究竟曝出了多少关系?》《三公消费龙虎榜》《“据”说春节》等作品无疑让人耳目一新,为人津津乐道。那么何谓数据新闻?其理论渊源何来?当下关于数据新闻研究存在的问题是什么?本文试图作出简要分析。

  学界比较一致地认为,数据新闻最早的相关表述是由EveryBlock的创始人阿德里安·哈罗瓦提(AdrianHolovaty)提出的,他在一篇演讲稿《报纸网站变革的一个根本路径》(Afundamentalwaynewspapersitesneedtochange)中表示,“报纸应该结束以故事为中心的世界观”,记者应公布结构化的、机器可读的数据,而抛开传统的“大量文字”。这就为数据新闻的发端划设了一条大致的分界线。然而,数据新闻并非无源之水,它实际上是20世纪之后,伴随新闻界对新闻客观真实性的不断追求而产生的必然结果,是对新闻学其他领域的一种庚续和传承,其中最主要地体现为精确新闻、计算机辅助新闻和数据库新闻。

  精确新闻报道(PrecisionJournali *** )出现于20世纪60年代的美国,最早由学者菲利普·迈耶提出,是指在新闻实践中运用社会科学研究 *** ,通过科学抽样收集资料,对之进行分析,并用数据来验证事实的报道 *** 。实践的标志是1967年菲利普·迈耶对437位参与底特律骚乱的黑人的抽样调查结果进行分析,破除了当时在媒体盛行的“参加骚乱者是底层人士”“南部黑人比北部黑人多”等错误论调。精确新闻报道把社会科学研究 *** 引入新闻学,其显著特点是用数据说明做新闻,从而使得新闻报道更具精确度。数据新闻尽管是相隔半世纪的概念,且媒介生态已经发生了翻天覆地的变化,但其本身所固有的“数据”属性某种程度上与精确新闻报道有着天然联系。

  计算机辅助新闻报道(ComputerAssistedJournali *** )起源于20世纪50年代的美国。实践的标志是1952年美国大选期间,哥伦比亚广播公司根据选举前期所返回的票数成功预测到艾森豪威尔会取得胜利。正是由于计算机新闻报道的兴起,记者开始不断尝试运用科学的调查统计 *** ,从公共数据库寻找需要的数据信息来完成调查性报道,履行监察 *** 、服务公众的使命。它不仅能够辅助精确新闻报道,还能辅助其他类型报道。因此,即使是今天的数据新闻也照样离不开计算机辅助新闻报道。

  数据库新闻报道是20世纪90年代西方新闻界继计算机辅助新闻报道提出的又一新闻概念,是距离数据新闻最近的一种新闻报道形式。它的出现主要是源于记者开始尝试从 *** 或者自己已有的数据库中寻觅数据集并从中挖掘新闻。但早期的数据库新闻只是对数据的基本整合,并未包含深度分析,也没有真正的挖掘,因而和数据新闻存在很大区别,只能算是一种增补和注脚。

  学术研究成果按性质一般分为基础理论研究、应用研究和发展研究三大类,梳理文献,笔者发现目前国内外学术界对数据新闻的研究可总结为“三位一体”。

  目前,虽然相关文献层出不穷,但在数据新闻定义方面仍然聚讼纷纭、莫衷一是。关于数据新闻概念的研究主要有以下几个立足点。

  一是立足于数据新闻的比较优势。保罗·布拉德肖(PaulBradshaw)认为,数据新闻简而言之就是“用数据处理的新闻”,与其他新闻不同之处在于,“它为将传统的‘新闻鼻’、讲引人注目的故事的能力与现在大规模可用的数据相结合开创了新闻的可能性”。①国内以喻国明等为代表,强调数据新闻是基于数据挖掘与分析思维的新闻报道,也是数据驱动型的调查性报道或深度报道。②

  二是立足于数据新闻的叙事创新。阿隆·菲尔霍夫(AronPilhofer)提出,“数据新闻是一个概括性术语,它涵盖了一套正在不断发展的用于讲故事的工具、技术和 *** ,包括了从计算机辅助报道(使用数据作为‘信源’)到最前沿的数据可视化和新闻应用的一切叙事方式”。③国内学者以郭晓科为代表,他认为数据新闻是“在多学科的技术手段下,应用丰富的、交互性的可视化效果展示新闻事实,把数据与社会、数据与个人之间的复杂关系用可视化手段向公众展示,以客观、易于理解的报道方式激发公众对公共议题的关注与参与”。④

  三是立足于数据新闻的产制流程。米尔科·劳伦兹(MirkoLorenz)在之一届国际数据新闻圆桌会议(theConferenceofData-DrivenJournali *** AmsterdamRound-table)演讲中指出,“数据新闻是包含以下基本环节的一种工作流程:通过反复抓取、筛选和重组以挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事”。⑤国内以方洁为代表,她认为“数据新闻是基于数据信息的采集、分析和呈现的新闻工作方式”。⑥

  由此可见,专家学者对数据新闻概念的界定呈现出一种弥散性特征,从不同角度出发具有不同的解释。笔者试图归纳其共同特点,进而对数据新闻这一概念作一个较为全面的阐释:从广义上看,数据新闻是指一切与新闻报道、编辑或通往新闻末端紧密相连的,依凭数据进行处理的活动。从狭义上看,数据新闻特指大数据时代产生的,将数据思维贯穿于新闻采集、 *** 、发布和传播整个过程的新型新闻报道方式。

  约翰·梅尔(JohnMair)和理查德·兰斯·基伯尔(RichardLancekeble)在其共同编纂的《数据新闻:映射未来》(DataJournali *** :MappingtheFuture)一书中把数据新闻特点概括为四点:交互性、统计性、多模块和受众参与。⑦

  方洁提出数据新闻四个特征:以服务公众益为目的;以开放的数据为基础;以数据处理分配的结果作为驱动;以数据处理分析的结果作为驱动报道逻辑的核心;以可视化方式呈现新闻。丁迈认为数据新闻涵括五个特征:以数据为新闻素材;以数据挖掘技术为依托;以用户为导向;以新闻价值为核心;以团队为工作模式。凌霞也认为数据新闻有五大特性:表现形式的形象化、可视化;信息来源的多样化;逻辑关系的相关性;情感行为的可判断性;生产方式的互动性。

  综合上述学者对数据新闻特点的归纳,经过“合并同类项”或可进行如下提炼:一是数据新闻来源的多样性;二是数据新闻挖掘的深度性;三是数据新闻呈现的可视性;四是数据新闻服务的大众性。数据的这些特性为数据新闻在叙事方面的特征阐述开拓了思路。

  近几年来,数据新闻之所以备受学界和业界关注,主要就是缘于其独特的魅力和张力。杰里?维曼(JerryVermanen)认为,数据新闻有两个好处,即寻找独特的故事(而不是从通讯社获得)和执行看门狗的功能。⑧亨克·范艾斯(VanEss)认为数据新闻使记者能够通过发现、 *** 、呈现大量数据,展现原本工作流程未曾报道过的新闻故事,发现新的报道角度。⑨

  国内学者如喻国明等强调数据新闻具备四大功能,即重构沉寂的历史数据的唤醒功能、连接当下的事实主体的关联功能、把握未来的信息走向的预测功能、展现数据可视化之美的“悦读”功能。陈力丹等通过对国内外代表性媒体的大数据新闻实践进行研究,也总结出大数据新闻的四个功能,即新闻叙事、事实判断、预测走向和信息定制。

  数据新闻实践的发迹远远早于其理论的开端,故常常体现在专家学者的文章和讲演之中。总的来看,国内外研究数据新闻实践多以个案为主,但采用的 *** 略有不同。

  凯瑟琳?芬克(KatherineFink)使用一种半结构化的采访 *** 对美国的数据新闻予以描述。根据不同的教育背景、技能、工具和目标,他们采访到诸多类型数据记者,发现许多人面临着相似问题,如试图确定他们在其组织中的角色。⑩埃斯特尔(EsterAppelgren)采用行动研究 *** ,提供了七家瑞典传统媒体公司数据新闻实践的概况。其内容主要基于一项对记者的在线调查,以及对参与公司的编辑们的深度访谈。结果表明,在瑞典数据新闻仍然是相当少见的;今天数据新闻工作 *** 面临的主要挑战是缺乏时间和需要的培训和发展数据新闻专业技能。斯特凡·韦拉奇(StefanWeinacht)着眼于数据新闻在新闻学院越来越多地得到实践和教授的现实,通过结构化采访35位有经验数据基础的数据记者,试图描述经验数据新闻在德国的基本情况。

  此外,爱德华·西格(Edwardseel)的研究也颇具代表性。作者对近60个交互图表进行考察,分析了不同图表的各自特点,以寻求构建叙事流的传播者与发现故事的读者之间的关系。作者依靠从新闻媒体到可视化的案例研究,确定了7种不同体裁的可视化叙事方式,包括:杂志版式、引语、分区海报、流程图、漫画条、幻灯片、影像视频。玛杰·鲁泽(MarineRoose)采用比较研究法对《》与《卫报》的互动图表进行考究,认为二者在使用工具、可视化风格、数据来源等方面均存在不同。

  与国外的数据新闻实践研究不同,国内相关研究主要由两部分构成:一是对国外数据新闻实践的研究,二是对数据新闻本土化的研究。笔者通过梳理相关文献,试图管窥大致研究脉络。

  一是以国外媒体个案为对象。美英媒体作为数据新闻实践的先行者,在诸多方面可圈可点,故而相关研究主要集中于此。如一些学者以英国《卫报》“数据博客”中《伊拉克战争日志》《伦敦骚乱中的谣言》《 *** 各部门开支》等可视化作品为例,详细解读了数据地图、时间线、交互图表三种可视化形式在数据新闻中的运用。一些学者通过研究《》的专题报道“租房还是买房”推导出数据驱动的个性化新闻如何发挥功能性和服务性。还有学者以《》的地图新闻为研究样本,指出其核心是用数据挖掘的手段获取各种结构化的信息,并以数据化地图的形式呈现。

  二是以数据新闻奖作品为对象。全球数据新闻奖是国际上之一个表彰数据新闻领域优秀工作的专业奖项,研究获奖作品可窥见当前数据新闻的基本标准和专业水准。目前,之一届数据新闻奖作品均有学者进行深入研究,重点阐述调查性新闻、可视化叙事、新闻应用、预测性报道等业已成为数据新闻的创新维度。程宁璟则较为系统地研究了2012-2014年的所有提名作品,分析了当代数据新闻作品的特征和类型。

  三是以国外数据新闻教学为对象。以美国为首的国外大学新闻院系均开设了数据新闻教学,不少学者对此予以关注。如舒媛对哥大新闻学院开设大数据和编程课程的基本情况进了介绍,认为数据和算法正在改变着各个行业,讲故事也该靠数据。许向东对密苏里新闻学院的数据新闻教学进行了考察,认为在课程设置和实践模式方面对我国的数据新闻教育具有参考价值。祝建华介绍了密歇根州立大学(MSU)、加州大学圣地亚哥分校、乔治敦大学、犹太州大学、华盛顿州大学等美国大学新闻院系的数据新闻教学情况,并对数据化传媒学生的基本技能和相关师资的来源进行了讨论。

  一是对报纸媒体数据新闻的研究。当下,愈来愈多的中央和地方纸媒开设了数据新闻专栏,定期刊登各具特色的新闻报道,成为众多学者的研究对象。如习楠等分别对《北京晚报》《无锡日报》《柳州日报》《温岭日报》《京华时报》《南方都市报》《华西都市报》《温州都市报》等地方党报、都市报的数据新闻实践进行个案分析,介绍了“数读温岭”“华西数据”“我有数”“数据表情”等各个数据新闻专栏、专版在报道过程中的特点规律。但朱萍等在对这些报道进行宏观维度分析之后也遗憾地指出,国内大部分纸媒“数据新闻”不是真正意义上以大数据为支撑的数据新闻。

  二是对广播媒体数据新闻的研究。石勒认为,广播做好数据新闻应该在以下三方面下工夫:增强跨界合作,借助大数据研究,紧跟热点问题,加入人性化解读,增强传播效果;适时成立数据新闻团队,利用数据新闻来增强与广播受众的互动,并将互动内容及互动数据循环利用;加强人才储备及员工培训,提高记者的数据素养,培养适应大数据时代的新闻人才。目前,学界对广播数据新闻的研究相对较少,笔者以为,造成这种现象的主要原因在于媒体自身条件所限。

  三是对电视媒体数据新闻的研究。目前,学界关注点主要停留于以央视为代表的主流媒体,不少学者以2014年央视“‘据’说春运”“‘据’说春节”“两会大数据”“‘据’说两会”节目为研究对象,认为电视时政报道运用数据新闻应着力解决提出专业数据搜索请求能力不足、对大数据分析解读和关联能力不足、整合民间“大数据”与官方数据能力不足等问题。也有学者采用比较研究法,重点揭示出央视自2013年 *** 数据以来所取得的发展和进步,主要表现为内容更丰富、播报风格更贴近百姓生活、数据挖掘意识和能力提升、数据可视化元素增多。

  四是对 *** 媒体数据新闻的研究。 *** 媒体在数据新闻操作上具有较大的平台优势,因而在报道数据量上也远超其他媒体,是学界关注的重点。如韩巍等主要考察了财新传媒的可视化数据新闻实践,指出财新的数据可视化表现为用互动图表讲故事、数据挖掘、辅助理解三种形式。马轶群等对新华网、澎湃的数据新闻实践进行了探讨,对相关特点、驱动、作用给予了说明。周善等则从更为宏观的视角对网易、新浪、搜狐、腾讯四大门户网站的数据栏目进了综合与对比研究,从内容选择、内容结构及表达形式等方面分析了目前其数据新闻之现状及不足。

  相比个案研究,学者在宏观面向上的探寻可谓着墨颇多,主要集纳了数据新闻的影响、反思、问题、策略和前景。

  综观当前学界研究成果可以确证,数据新闻的关键问题不在于是否有影响,而在于究竟影响到哪些领域。对此,不同学者有不同的观察角度,如彭兰从宏观视角出发,指出大数据技术正对新闻业的冲击主要体现在:大数据技术渗透到新闻生产的核心环节;大数据技术重树新闻质量标杆;大数据技术进一步提升受众反馈的价值;大数据技术拓展用户分析广度与深度。曾庆香等从新闻专业主义出发,认为大数据时代诞生的数据新闻去除了固定采访线路作为主要新闻来源的功能,消解了社会精英在新闻中所拥有的话语权,数据新闻使新闻业更符合新闻实践的专业主义。王光艳从新闻特性出发,认为大数据技术对传统的新闻理论造成了冲击,新闻的某些特性正在发生着变化,主要体现在新闻的真实性、新鲜性、及时性三个方面。朱述超等从受众视角出发,认为数据新闻的传播应与受众的认知逻辑相符,并积极帮助受众建构相应的认知结构,具体作用有:增加新闻受众的知识贮备;激活新闻受众的感觉通道;协助受众建构认知策略。

  面对学界对数据新闻普遍追捧的热潮,部分学者开始了批判性分析,并且集中于数据采集和使用中的伦理道德研究。约书亚·费尔菲尔德(JoshuaFairfield)采用由W.D.Ross提出的道德理论框架,探讨了利用大数据技术进行伦理研究出现的新问题。法恩(Fahn,J.)认为,在技术的支撑下,个人和组织可以更密切地监测我们的私人生活,但也会引发道德、安全、法律等方面的问题。安德鲁.西曼(AndrewSeaman)认为 *** 和社交媒体上的相当一部分数据难以核实且缺乏准确性,容易将不上网、不使用社交媒体的群体排除在外,这不符合社会道德规范中让发声的原则。国内吴洪霞等认为数据新闻伦理问题主要表现为:脱离新闻本质、违背新闻专业理念、缺乏人文关怀、泄露隐私、信息保护与数据残缺、 *** 狂欢与数据污染、版权保护与数据窃取。

  富·凯恩(RichKane)分析了Swarmize()收集用户数据并把它转化为读者能够轻易理解的信息的过程,认为数据新闻 *** 关键要简单,比如编辑可以很快建立简单的投票,并将它们嵌入到网页中。明迪(MindyCharski)强调要加强对数据的运用,指出能够使用联邦调查局的数据意味着记者没必要仅仅依靠轶闻和专家意见。钟瑛等通过梳理数据新闻的发展现状,指出数据新闻发展的瓶颈主要是人才短缺、数据资源获取受限、盈利模式不清晰、学界研究前瞻性不足、理论对话失衡等,并提出要拓展数据新闻人才培养路径、尊重各国数据新闻发展现实、完善信息法规保障数据获取、发掘数据价值、加强前瞻性研究指导。王维明等认为大数据时代,记者传统的采编技能已经落伍,记者应当在软件操作力、数据收集力、数据挖掘力、数据可视化呈现力等四种能力上下工夫。

  尽管近年来国内外数据新闻研究围绕一些重大性、紧迫性、显著性问题进行了深入的探讨,但与飞速发展的数据新闻实践相比,理论研究依然难以望其项背。通过对相关研究的学术梳理,笔者以为今后的研究应着重在以下几个面向下工夫。

  从数据新闻相关实践研究的综述来看,无论是在国外还是国内,数据新闻案例研究都存在主题相对集中、内容高度同质的现象,比方说对国内电视数据新闻实践的研究,基本上都以央视的“两会”“春运”为例,而对国外数据新闻实践的研究则基本上都以英国《卫报》为例,并且选取的具体分析文本都比较相似,譬如《解读骚乱》《伊拉克战争日志》等。而与之形成强烈反差的是,关于广播数据新闻实践的研究则是屈指可数,关于杂志数据新闻实践的分析也不多见。内容研究之所以出现“两极分化”,很大程度上是由于学者和学者之间、学界和业界之间的交流沟通缺失缺位,导致学术资源整合度不够。自2009年数据新闻被系统推行以来,世界各国新闻媒体都在努力抢抓机遇,生产了大量优质数据新闻,研究者宜加强沟通合作,拓宽研究视野,主动寻求具有创新性的实践范例,以避免实践研究产生千人一面、千篇一律怪象。

  对比国内外研究可见,国外对数据新闻实践的研究多采用内容分析的定量研究 *** 和调查研究 *** ,而国内相关研究则侧重于文本分析、比较研究和少量的问卷调查,却鲜有控制实验 *** 的展开研究。此外,数据新闻作为新兴的交叉领域,势必关涉多学科、多专业,比如视觉文化、视觉传播、美学、伦理学等。因此,应该尽可能引入跨学科的研究 *** 和研究框架,这也是提增数据新闻研究创新性的重要途径。然而,目前的研究更多是单纯以传媒业角度为切入点的,跨学科研究尚处阙如状态。

  很多研究的重点都过度集中于对现实问题的考量,以及对实践经验的归纳总结,理论的升华和突破则力有未逮,导致数据新闻并未形成清晰的理论体系。而即便是解决现实问题的研究,也存在办法简单化、机械化的问题,甚至存在“问题直通办法”的现象,如指出问题是“数据开放程度不够”,便立马提出对策是“要加强数据开放程度”,至于为何开放、如何开放等问题则少有提及。就目前而言,关于数据新闻传播效果的考察是较为匮乏的。评判数据新闻内容优劣大多以销售量、收视率、点击率的高低为参照,更有甚者依靠业内人士的经验推测。受众才是权衡传播效果的关键一环,少之则必不能成为科学研究。对此,可通过一些大型的受众调查予以填补。

  ②喻国明、李彪、杨雅、李慧娟:《新闻传播的大数据时代》,中国人民大学出版社2014版,第25页。

  文卫华、李冰:《大数据时代的数据新闻报道——以英国卫报为例》,《现代传播》2013年5期。

  王之月、俞哲旻、彭兰:《数据驱动的个性化新闻——以的专题“租房还是买房”为例》,《新闻界》2015年第7期。

  陈昌凤:《数据新闻及其结构化:构建图式信息以的地图新闻为例》,《新闻与写作》2013年第8期。

  程宁璟:《当代数据新闻作品特征研究——以全球数据新闻奖2012-2014年提名作品为样本》,山东师范大学硕士论文,2015年4月。

  祝建华:《大数据时代的新闻与传播学教育:专业设置、学生技能、师资来源》,《新闻大学》2013年第4期。

  马轶群:《当新闻先生遇上数据 *** ——新华网的数据新闻探索》,《中国传媒科技》2014第12期。

  周善:《数据新闻:网站专业生产内容(PGC)的可循之途——四大门户网站的数据新闻实践》,《编辑之友》2014年第8期。

标签: 新闻热点寻找

发表评论

智杖百科 备案号:皖ICP备2023023635号 智杖百科 xml | txt