女主胡曼黎(孙俪饰)被丈夫出轨之后,她不仅面临家庭崩塌、事业失业的双重打击,还上演了一出典型的“狗血”剧情——为了挽回丈夫,带着第三者...
2025-07-13 1 情感分析不用情感词典
本文来源:徐艺玮 牟 璇 饶高琦:晚清至当代国际中文教育事业形象演变的定量分析[J].全球中文发展研究,上海:华东师范大学出版社
提要:洋务运动至今,中国社会经历全方位巨变,新闻报纸对社会发展变化、新信息的反映迅速且直接,是探索国际中文教育事业形象演变的重要窗口。文章使用语料库的研究方法,通过抽样调查、统计等对语料中抽取的一批中心词进行定性分析,基于此补充并丰富我国近代汉语作为第二语言教学的历史。文章使用情感分析技术,发现近现代国际中文教育事业一直以积极形象为主,不同时期积极强度略有变化。国际中文教育事业发展与政策的变化、社会历史环境等密切相关。
语言作为人类最重要的交际工具,在全球沟通交融中发挥着十分重要的作用。19世纪末到21世纪初,从被迫打开国门与世界交流,到全面开放融入世界、参与制定国际秩序,中国社会经历全方位的变革。作为第二语言的学习者的教育,国际中文教育事业经历了由“教外国人(洋人)学汉语”到“对外汉语”再到“汉语国际教育”的复杂演变过程。这项事业的形象演变也受到国内外社会变迁的影响。我国的汉语第二语言教学历史源远流长,今天学界所关注的国际中文教育事业历史大致可以追溯到20世纪50年代,近代到中华人民共和国成立前对国际中文教育的历史发展关注较少,也缺乏梳理。
本文旨在基于数字人文领域中的“远读”(distant reading)观念,尝试以关键词及其间的相互关系勾勒国际中文教育事业的形象,描述国际中文教育事业自晚清以来的发展变迁,将有助于今天的我们更好地在百年的历史尺度中把握事业发展的趋势和目标。这对面对百年未有之大变局的国际中文教育事业具有特别的意义。
国际中文教育事业的形象和社会对其的认知,不可避免地受到社会发展以及社会思潮变化的影响。语言是社会变迁的一面镜子,这种变迁也在历时语料中留下线索。新闻报纸作为定期向公众发行的传递信息的出版物,对社会发展变化、新信息及重大历史事件的反映迅速且直接。本文选择《申报》和《人民日报》这两份主流报纸作为数据来源,主要有以下三个原因。
一是典型性及不可替代性:《申报》作为近代中文报刊的典型代表,其性质是城市生活报纸;《人民日报》作为现代中文报刊的典型代表,是中央党报,属于政治性媒体。两份报纸虽然性质不同,但具有其他报纸不可比拟的优越性。近代报刊主要有《申报》《大公报》《新民报》等,其中《申报》发行年份最早、社会影响最广泛,是体现新闻自由的典范,也是中国现代报纸开端的标志,其报道的深度和广度都是同时期其他报纸无法企及的。且《申报》虽然是一份城市生活报纸其刊登内容却覆盖国内外重要新闻、通讯、著名人士文章、宣言等,因此,《申报》是当时思想启蒙、政治宣传和社会改革的重要平台,为中国的现代化进程、社会变革和思想启蒙发挥了积极作用。中华人民共和国成立以来《人民日报》作为我国第一大报,承担着宣传党的主张、宣扬社会思潮等责任,以其独立性、进步性和思想性为人所称赞,为中国的现代化进程、社会变革和思想启蒙发挥了积极作用。
二是受众群体的广泛性:《申报》及《人民日报》作为近现代中文新闻报刊的典型代表,可以为本研究提供充分且稳定的语料,其受众涉及知识分子、民众、商人、精英人士等社会各界人士,且能够较为全面地反映各个社会群体的观点态度,是从语言上观察国际中文教育事业变迁的重要窗口。
三是记录社会的连续性:本文所使用的语料资源基于《申报》《人民日报》1872年到2015年,共144年跨度的典型中文报纸语料库,盖晚清时期、北洋政府时期、南京国民政府十年、全面抗战时期、解放战争时期以及中华人民共和国成立至当代(2015)的时期。其中《申报》语料共有约9亿1000万词(包括汉语词语、标点符号、数字、字母词等,下同),时间跨度为78年(1872-1949);《人民日报》语料规模约为7亿,时间跨度为66年(1950-2015),另有4年(1946-1949)与《申报》发行年份重合,两份报纸在时间上接续起来,满足词语历时研究对于大规模、长时间跨度语料的需求。
因此,本文选择《申报》和《人民日报》这两份主流报纸作为数据来源,基于1872年到2015年,共144年跨度的中文报纸语料库,对国际中文教育事业的形象、内容、发展动因、情感评价等方面进行剖析,以期探索国际中文教育事业自晚清以来的形象演变。
李宇明曾在《重视汉语国际传播的历史研究》中提出:“促进汉语的国际传播,应重视对已有的相关实践进行经验总结,鉴往而明今。”岳岚、张西平在《汉语作为第二语言教学史研究三十年概观》中,总结了近年来对汉语作为第二语言的教学史研究情况,提出了教学史研究中原始文献比较匮乏的问题。吴丽君在《世界汉语教学史研究综述》中也总结归纳了海内外研究汉语教学史的各类研究成果,尤其是综述了国别汉语教育史研究成果,也提出了应对第一手文献进行发掘、翻译和整理。结合目前所有汉语传播和世界汉语教学史研究来看,对清末民初以来,中华人民共和国成立之前的汉语教学史的发掘较少,基本简而概之。同时,此时期相关史料也较少,缺乏系统性、长跨度的史料研究。结合以上特点,基于《申报》及《人民日报》共144年跨度的中文报纸语料库,对国际中文教育事业进行研究是很有必要的。
近代,受社会内忧外患、政局动乱以及国际地位低下等诸多方面的影响,汉语在国际上的传播学习事业受到了沉重打击,近乎停滞不前。然而,本文通过调查发现,虽然国际中文教育事业在中华人民共和国成立以后才逐渐发展壮大起来,但在近代严峻的时局下,仍呈现出在跌宕中缓慢发展的态势。
国际中文教育自诞生之日起就肩负着对来华留学生进行中国语言文字和中国文化的教育,培养知华友华人士和中外语言文化交流的使者的使命。中华人民共和国成立以来,“汉语作为外语或第二语言的教学”正式成为一门学科,并且经过了漫长的发展历程。对于学科的定名,学界历来讨论众多,学科的名称主要经历了“对外汉语教学”“汉语国际教育”以及现在学界较为广泛认可的“国际中文教育”三个阶段。但是在正式定名之前,尤其是晚清到中华人民共和国成立以前漫长的70余年里,在以《申报》为代表的近代报纸语料中,当时的中国人和外国人都没有给“教西方人汉语”一个专门的称谓。因此探究晚清至当代国际中文教育事业的发展,在近代汉语语料中寻找切口是我们首先需要解决的问题。
本文通过研读《申报》语料发现,在以《申报》为代表的近代报纸语料中,汉语教学及其相关事件在当时主要与“华语”“华文”“汉文”“汉语”等词语有关。因此,我们以上述关键词为中心在《申报》中抽取上下文语料,调查上述关键词在语料中所处的语义环境,经过分层抽样以及人工筛选,抽取了一批与国际中文教育相关的表述方式、教材、学习词典以及教学学习机构等,形成了近现代国际中文教育相关词词表作为后续研究的切入点。近现代国际中文教育相关词词表举例如表1所示。从表1举例中不难看出,近代国际中文教育相关的表述方式及教学机构、教材、词典等较之现代要多。因为相较于现代已成科学系统的国际中文教育体系,近代大多数的国际中文教育工作者还处于探索阶段,所以近代的国际中文教育,不管是研究者和工作者的活动及成果还是教学场所、对象等都十分分散且不成体系。因此,近代国际中文教育的相关表述例数与学科事业的发展情况呈现反方向发展的状态。
为了更好地把握国际中文教育事业在不同历史时期的发展脉络,减少个别年份数据波动对结果的影响,本文按照《申报》及《人民日报》的发表时间,根据重大历史事件及社会政体变化将144年语料分为7组,分别是1872-1911年晚清时期、1912-1927年北洋政府时期、1928-1937年南京国民政府十年、1938-1945年全面抗战时期、1946-1949年解放战争时期、1950-1978年中华人民共和国成立初期至改革开放前夕、1979-2015年改革开放以来至今。各历史时期国际中文教育相关词使用频率如图1所示。
可以看到,与国际中文教育相关的中心词的频率总体上呈上升趋势。近代各历史时期与国际中文教育相关的中心词占比都在0.0010%以下,晚清时期到南京国民政府十年,《申报》中与国际中文教育相关的词的频率一直处于上升状态,直到抗日战争及解放战争时期,受战争影响有所下落,全面抗战时期更是跌到了0.0005%以下,到解放战争时期才略有回升。直至中华人民共和国成立,中心词频率成倍增长,主要由于此时期的外交政策和对国际中文教育新的认识。而到了改革开放时期,数据明显回落,难以与中华人民共和国成立以来的快速发展相接续,也与现阶段的普遍共识不符。本文对此部分数据和语料进行了复核,还对此阶段的历史进行了深入研究,发现在1985年7月1日《人民日报》(海外版)创刊。其内容主要为传达中央的政策,报道改革开放和现代化建设事业,关注社会热点、难点问题,介绍国际政治、经济、科技、教育、文化,提供国内外各种信息。本文认为,海外版的《人民日报》分担了一部分关于国际中文教育的报道,从而导致了《人民日报》主报的数据出现了回落。总之,此时期的数据仍然能印证本阶段是国际中文教育发展的关键时期,同时本文也将提升数据鲁棒性,更好地展现国际中文教育的事业形象。
近代及现代与国际中文教育事业相关的中心词词云图如图2、图3所示近代与国际中文教育有关的内容多集中在华侨教育及其教学机构。到了现代由国家支持的孔子学院以相当高的频次取代其他教学机构,其他与国际中文教育事业相关的如“汉学”等也出现在词云图中。
综合上文中的历史分期和图1国际中文教育相关词频率可以看出,晚清至解放战争时期相关词频率尽管稍有起伏,但都处于较低水平(0.0010%)。结合几段时期内较为相同的社会环境和历史背景,本文将此几段时期一同论述民国之前,在中西文化交流史上先后出现过两次西方人汉语学习高潮。第一次高潮源于明清之际天主教来华传教。1807年英国传教士马礼逊(Robert Morrison)来华,揭开了近代基督教新教来华传教的序幕。与世界其他地区的传教活动一样,当时的传教士来华面临的首要问题就是语言障碍问题,因此外国传教士不得不致力于汉语学习,成为这一时期汉语学习以及组织汉语学习的主要群体之一。而在战争之前,清政府实际上实行的是严厉禁止传教的政策。此政策不仅禁止宣扬基督教,还禁止中国人教授外国人华语、禁止外国人购买华文书籍。张笑婷认为张西平在《西方人早期汉语学习史简述--兼论对外汉语教学史的研究》中最突出的地方是区分了“西方人早期汉语学习”与“晚清时期中国对西方人的汉语教学”,并指出这一时期中国并未自觉主动地去教西方人学习汉语,而来华传教士、外国来华官员等对汉语学习的强烈需求,使得他们对汉语作为第二语言的教学与学习是自觉与主动的。
第二次战争后,受《北京条约》等不平等条约的影响,晚清社会被迫进入了宽容传教时期,这一政策除了在义和团时期有所变动,此外几乎没有变动。随着社会环境和政策的调整,传教士自第二次战争之后拥有了更为广阔的空间。据《申报》记载,自清朝禁止外国人到中国沿海通商和中国人到海外经商的禁令放开以来,西方传教士深入中国内地,甚至去过很多地方商人都未曾踏足的地方,并将其开辟为商埠;当时的传教士多通晓中国语言文字,熟悉山川道里的风土人情,并著书记载。先行的传教士为了使后续前往中国的西方人更快地学习汉语,还编纂了许多字典辞书,形成了一批英汉对应资源。除此之外,部分有见识的传教士还开始用拉丁文字来表达汉语,如著名的威妥玛式拼音,这一举动开启了汉语拉丁化进程。
社会环境和政策的改变,以及“先遣军”传教士长期的语言知识积累,吸引了更多的社会群体来华发展。1842年清朝被迫开放第一批通商口岸,无数外商趁着风口顺势而来。而民族间的商业贸易依赖于共同的语言工具,要想在华进行商业贸易就不得不与华人进行交流。因此受利益、金钱、市场等的驱使,加之受限于通商口岸的报关制度等,外商也加入到学习汉语的队伍中来。
外商的汉语学习主体可以细分为两类:一是大型商团;二是小型个体。《申报》中,大型商团通常指各地侨商团体、银行财团及各国贸易团等。成熟的大型商团通常分工协作,以达到资本快速积累和扩张的目的。由此,商团会培养一批利于跨国贸易的专业人才,这就包括专业的语言翻译,同时外国政府为了保护商团,还会出台政策迫使一些从事在华业务的职员、高管等学习或提前具备相应语言能力以便通商。例如1913年德国政府的要求是“故北京六国银行团之解散殊属不幸,德政府之意,在华德商均须学习华语及用能操华语之德人经营商业,德国在华之学校行将扩充,本年豫算案中此项经费已较上年增多三千马克”(《申报》1913年4月8日),并在东京商业会议所中招请东亚同文会主干阿部氏到所每日招集会员研究华语两小时。小型个体主要是指个人公司或个体商户,他们往往将目光放在开设各类商铺及大型营业场所上。受商业制度影响和交际需要,这一类商人也会学习汉语。由此可见,商会或个体营业者推动了更多人学习华语,甚至是推动了华语教学机构的发展。
辛亥革命进一步促进了全国人民的意识大觉醒。晚清时期是中国近代史的开端,也是中国半殖民地半封建社会的形成时期,国家内忧外患,不少仁人志士觉醒,自然注意到了汉语教育的重要性。瞿绍衡曾在《申报》上发表《产科教育之方法》,文中提到了产科人才之稀缺,而究其稀缺原因之一,又在于国文难以顺畅,其原文如下:
(1)……绍衡以为一切可以不问,只求国文通顺而能记能述者足矣。愚观东西各国学校,从未见有舍本国文字而用外国语言教授者,独我国有轻视本国文字,而以不谙外国文字者,谓孺子无可教者,抑亦奇矣。(《申报》1929年3月11日)
上文体现了晚清时期在清政府的腐败专制统治以及帝国主义的压迫下,大多数人在技术学习中,丢掉了本国的语言阵地。基于此种情境,少数仁人志士发出呐喊,率先走上了救亡图存的道路,其中“语言救亡”就是仁人志士救亡图存的一个方面。
除了提出优化国文、加强国文学习,少数志士还观察到列强推行本国文字给他国是为了方便殖民和驯化他国,如法炮制,也提出推广周边国家的华语学习有助于维护领土安全,同时加强其他民族对中国的臣服,如:
(2)自庚子乱后、俄兵南下………近更多设学堂,广传本国语言文字,俾附近蒙民习而化之……大抵外人来华往往密探风土人情,教习语言文字,为收拾人民之计,中国之弱其原皆由于此,今俄人亦以此法施之蒙古……若俄领事如此办法,恐蒙民臣服中国数百年而未化于华者,得俄人教习推广数十年而反化于俄也,苟为俄所化,将来蒙民未有不外附者,蒙藩一失则中国何堪设想,为今之计宜设法使蒙民均习华文学华语,则尚可以冀永隶版图(《申报》1902年9月30日)
民国政府的成立是近代中国体制改造的第一次尝试,北洋政府是中国历史上继清朝灭亡后第一个被国际承认的中国政府,一直到南京国民政府,中国的政治外交摆脱了清政府的束缚,开始了新的探索。而此时期《申报》报道中的汉语学习主体也发生了转变,不再是传教士等,而是外交类职员和机关职员。
外交类职员主要包括各国领事、驻华大使等,外交类职员与前文所提到的传教士实际上是殊途同归,部分外交官甚至还由传教士充当。传教士主要从事民间工作,在各地进行传教游说,通常以平常百姓为主要交流对象,进行意识形态输出。而外交官则主要从事政府工作,包括开展在华业务,为资本家的发展扫清障碍,以及培养各类话事人,达到控制中国政府的目的。两者同样都是为了帮助列强在华谋取利益。早期来华外交官通常从本土中选出,缺乏在华经历,因此有自己的随身翻译,但无一例外都对汉语表现出巨大的学习兴趣。随后,部分传教士因在华出众的能力,被聘用为外交官。除了处理政府相关事务,为了配合谋求在华利益的行动,外交官们还利用自身影响力用华语在群众中进行游说、宣讲,以此来达到侵略等目的,此举与早期的传教士活动大同小异。外交官一职逐渐开始在有长期在中国居住或调查学习的经历的人群中选拔,这部分人通常能说华语甚至能写华文,足以满足了解当地国情、掌握当地重大变化的外交需求,例如驻宁美国领事丁嘉立君:
(3)丁嘉立君已于日前由沪来宁莅任,按丁君在中国已三十年,任教师及在北洋办理学务多年,并在驻京美国使馆中任职数载,近年国代表对比国款之文译为华文,盖丁君华文华语皆能通晓也。(《申报》1912年4月19日)
机关职员则是另一汉语学习主体。机关职员主要是指洋人充当的日伪政府机关职员、北洋政府各局职员等。此类群体主要存在于洋人广泛聚集之处,例如上海租界、其他被迫开放港口城市以及日伪政府。洋人在华机关工作或者是开办与华人接洽的组织机构,其目的都是保护洋商洋人在华特权。组织机构则会加以要求华语作为职员必备技能,由此大批洋人职员不得不学习华语。例如溥仪对日伪政府的要求:
(4)溥仪令东北各机关职员学日语,日职员学华语。(二十八日专电)(《申报》1932年6月9日)
除了要求学习华语,部分机关甚至会以定期考核的方式遴选人才。由此促使洋人政府聘请华语教师帮助本国人学习华语,而这项举措早在晚清时期就已经具备并有一套较为完备的考核流程,例如由清政府工部局及租界工部局等组织汉语考核,从教学到考试都有较为规范的流程。
(5)云工部局考试西人华语,本埠英美租界工部局及捕房上等西人向由工部局出费请华教习,专教中国言语,每年春秋二季由局聘请精通中国言文之西人到局主考。此次秋季考试为牧师台惟司君及华教习叶镜如君主政,计取列最优者。(《申报》1907年11月24日)
政界尚且以考核方式要求职员学习华语,而军队力量作为在华特权的武力保障,则更早开展学习华语的行动。清末民初,列强常在本国设置“华文学堂”以此培养服务于侵华的后备武力。例如:
(6)俄国武升旧有学习东方语言之议,今伯亦省统领驻防军营某君量加推广,即在该省设立华文学堂。(《申报》1897年6月20日)
这种军事学堂与商业学堂等存在差异。服务于商业的学堂常在华创办,而在本土创办的学堂则通常是依附于相应的大学开设,例如日本通常会在大学另设华文学科,除此之外仅在重要省份开设华文学堂。而军队开设的学堂常常依附于军队所驻扎之处--通常为国家交界省份,例如俄国通常靠近东三省设立学堂,由此直接输送人才开展在华业务。
知识分子是民国时期推动国际中文教育事业发展的另一主力军。知识分子是指接受过相关教育,有一定知识储备的人。本文将《申报》中的知识分子分为两类。第一类是指各国政府、商会通过教学机构造就的知识群体,这种教学机构又可以按照机构所处的位置进一步划分,一是在华机构,二是各国本土机构。各国本土机构又与列强早期殖动的准备工作息息相关,如日本侵华战争前各校早已将华文作为主要的外国语之一,并派出大量学生来华游学。总之,这一类知识分子群体与目前的脱产式学习无较大差别,但部分学校存在“契约”,其造就的人才主要服务于各类商会、教会、政府外交机构等。如:
(7)华俄夜校招生宗旨:沟通中俄文化,造就华俄必需之人材为宗旨(《申报》1936年2月22日)
另一类群体主要是寻找合适的家庭教师进行一对一学习。清末以来,常有来华外国知识分子刊登“征求”广告,以这种方式寻找有共同语言且能教授方言或官话的教师或朋友。如:
(8)交换智识,某西人美国籍略通沪粤及北方方言,兹愿从中华女士学习上海话或官话,以教导英文或跳舞为交换。凡有意者请投函申报第一二○号信箱接治可也。(《申报》1936年2月6日)
由上两则广告可知,主动学习汉语的个体通常用语言知识或是其他社交技能来获取所需之物,相比上一类学校统一学习或现在的私人教学,这种学习模式并不付出额外的报酬。此外,指定“华文”“上海话”“官话”为学习目标,会使得个体的学习更具个性化,还能快速适应当前社会的需要。总之,这种学习模式更具经济性、针对性和主动性,常常为各类游学之士或准备求职之士所青睐。
总之,中华人民共和国成立以前主要是少部分西方国家的传教士、外交官商人以及知识分子等学习汉语,与租界国密切相关,学习动因主要是通商、传教外交和干涉中国事务等实用交际,并且主要由外国人主持推进,国际中文教育事业处于被动状态。
中华人民共和国成立以来,与国际中文教育相关的中心词所占频率大幅上升,均高于0.0015%,中华人民共和国成立初期至改革开放前夕更是在0.0020%以上。这段时期,受稳定的政治局面和社会环境以及学科发展需求的影响,汉语作为第二语言的教学逐渐发展起来,并在20世纪80年代成为一门独立的学科,蓬勃发展起来。不同于近代的军事动因、宗教动因等,现当代国际中文教育事业发展动因是多方面的,总体来看主要是文化动因和经济动因。
从外国人学习汉语的数量看,最多的是韩国人、日本人和华裔华侨子弟。文化动因是中华人民共和国成立初期至改革开放前夕国际中文教育发展的主要动因之一。华侨学校在这段时期是海外汉语学习与文化交流的主要承担者;2004年开始孔子学院在海外如雨后春笋广泛设立,承担起海外汉语教学与研究的任务。
海外华侨学校里的学生除了要学习中国的语言和文化,还要学习当地的语言和文化,目的是“使华侨子弟更好地为华侨群众服务,为侨居国人民服务”,推动文化合作。如:
(9)国家积极鼓励华侨在侨居国集资办学,就地解决子女教育问题,希望华侨多办中、小学和华侨业余教育,在有条件的地方也可以办大学。(《人民日报》1957年8月13日)
早期的华侨学校发展并不顺利。以泰国为例:“九月二十六日,泰国銮披汶反动政府查封了华侨在曼谷设立的越坑平民学校,使四百多华侨学生被迫失学……一九四八年五月和一九五〇年五月,銮披汶反动政府两次非法查封华侨学校近四百所,使二十一万多华侨学生和近四千教师被迫失学失业。”(《人民日报》1951年10月13日)而銮披汶反动政府残越坑平民学校的理由是该校部分表格未译成泰文,利用课余时间授课与“传播政治思想”,并准备以同样理由迫害其他华侨学校。又如马来亚英殖民政府强征华侨学生服兵役,多数学生不愿当英帝国主义炮灰,纷纷退学出走。可见国际中文教育初创阶段在海外遭受过不少打击。反观现在的泰国中文教育,泰国政府从提高国家竞争力的战略高度认识汉语教学,积极推广汉语并接纳中国文化,这与政治、文化等因素密切相关。
(10)捷克斯洛伐克人民之所以学习中文,是有着各种不同的理由的。有许多人是想把通晓中国的文化和历史当作自己的终身职业……(《人民日报》1957年3月24日)
随着我国国际地位的提高,世界上有越来越多的人愿意了解中国,愿意学习中国的经验,文化交流、互学互通,要求学习汉语。
(11)不少埃及同学正是怀着对中国人民的友好情感来学习中文的。“我们热爱中国,喜欢学中文”;“为了发展两国人民的友谊,为了两个文明古国的文化交流,我们应该学好中文。”(《人民日报》1980年7月7日)
中华人民共和国成立以来,经济逐渐发展起来,也更加积极主动地加入国际市场。在与中国的商业贸易中,越来越多的国家和外国人意识到学习汉语的经济价值,经济动因成为这段时期尤其是改革开放以来的最主要动因。如:
(12)匈牙利某工厂一个工人的任务,是专门在运往中国的货品箱上刷印中国字。他对这项工作很感兴趣,但始终不了解印的那排大字的意义。他认定他们和我国之间的贸易会日益发展,就想要求厂长请人教中文……今天,抱着和这个同样的目的或为了更多地了解新中国而学中文的人,在东欧已经不是稀有的了。(《人民日报》1951年9月27日)
近代较为系统的国际中文教育工作主要在海外并主要由外国人主持。20世纪50年代,以清华大学、北京大学为代表的一批国内高校开始接收各个国家的留学生来华学汉语,作为国际中文教育事业的初创期,这一阶段的教育教学规模较小且尚不稳定。20世纪60年代,以北京语言学院的成立为标志,国际中文教育事业呈现良好发展的势头。国际中文教育事业的兴衰与国内外形势密切相关,60年代后半期,由于历史局限,学科事业受到一定打击。70年代以来,先后受到我国恢复在联合国的合法席位以及改革开放等的影响,国际国内形势的好转使得国际中文教育事业在此后的几十年间朝着越来越完整、系统、多样化的方向迅速发展。2004年开始,政府统一督促、中外合办“孔子学院”,为推动国际中文教育发展发挥了重要作用。2005年随着首届世界汉语大会在京召开,国际中文教育事业迎来春天。
李宇明认为,当前汉语国际传播最主要的动因是经济。从图4中不难看出,国际中文教育相关词的频率在21世纪10年代呈现出猛增的趋势。中华人民共和国成立以来,尤其是改革开放以来至今,国际中文教育事业迅速发展起来,呈现出良好的发展势头,来华学习人数逐年增加,20世纪80年代正式成为一门独立的学科,学科建设、师资队伍建设、对外汉语教材以及教学大纲等朝着越来越系统完备的方向发展,国际中文教育“请进来”和“走出去”并重,汉语在国际上推广迎来了更加积极主动的新形势。
共现词是在语料中以较高频共同出现、经常放在一起搭配的词。关键词共现可以有效地反映学科领域的研究热点,可以在一定程度上了解与国际中文教育有关的词所处的语义环境。文本情感分析是指通过计算技术对文本的主客观性、观点、情绪、积极性的挖掘和分析,对文本的情感倾向做出分类判断,有利于了解学科形象、发展或社会情绪。李然等指出情绪分析对于快速掌握大众情绪的走向、预测热点事件甚至是民众的需求都有很重要的作用。
本文将《申报》及《人民日报》以历史时期为单位的7组文本作为语料来源以第二节中提到的与国际中文教育事业相关的中心词(以下简称为“中心词”)使用Python代码在各历史时期语料中进行高频共现词抽取,其中将频次大于10的共现词视为高频共现词,为了避免纳入难以探求信息的词,本研究剔除了无意义的介词、连词、代词等语法功能词,保留高频实义词。由于《申报》语料自1906年才开始出现句读符号,因此本文按照篇幅长度,以中心词为中心,以中心词前后10个词为窗口,抽取高频共现词。我们以出现频次高、较为典型的“学中文”和“学华语”为例,观察国际中文教育在近现代所处的语义环境,各历史时期出现频次最高的前10个共现词见表2、表3。
近代,除了与教育有关的“学堂”“师范”“学校”,“上海”是共现次数最多的地名,且不同时期几乎都有日本、法国以及相关的“英文”与国际中文教育相关词高频共现。上海解放前部分地区是英租界、法租界、日租界和美租界等,根据第二节已经描述过的国际中文教育事业概况,虽然租界是外国人的聚集地,但是仍然存在不小的语言障碍,大批外国人来到中国之后出于种种交际需求仍然有汉语学习的需要,学习并利用中文进行实用交际是这一时期学中文的主要目的。《申报》是一份城市生活报纸,广告是其收入的主要来源,占据不小的篇幅,一部分外国知识分子、商人、官员等精英人士会在《申报》上刊登广告寻求汉语教师,汉语教学机构、学校等会刊登招生广告,出版商也会刊登广告出售《华英词典》等汉语学习资料。近代,国际中文教育多出现在租界国、教育以及商业的语义环境中是近代国际中文教育事业的一大特色,这是由上海商业贸易、对外贸易发达所带来的特点,也是由《申报》是一份城市生活商业报纸所带来的特点。
到中华人民共和国成立以后,国际中文教育事业实现转型发展。《人民日报》作为中国中央委员会机关报,不具备商业性质,且承担着宣传党的主张、宣传社会思潮等责任,因此这一时期与国际中文教育事业相关的高频共现词更多关注自身,主要集中于教育教学领域,除了“学生”“中文”“学习”“教授”“学员”等常见的教育领域的词,“北京大学”“北京师范大学”的高频共现体现了这一时期一批国内高校开始接收各个国家的留学生来华学汉语。作为国际中文教育事业初创期的主力军,这些高校为国际中文教育事业的未来发展打下了坚实的基础。此外这一时期“文学”“文艺”以及“毛主席”“工农兵”“革命”等词也加人高频共现的行列,这是因为中华人民共和国成立以后确立了以工农联盟为基础的人民民主专政的社会主义的国家性质,国际中文教育与文学、文艺、意识形态等诸多领域紧密联系,与国际范围内的运动相结合,国际中文教育开始肩负更为重要的责任。
“学华语”仅在近代5个时期的《申报》语料中有高频共现词,在中华人民共和国成立以后的《人民日报》中几乎很少出现,没有抽取到共现频次大于10的高频共现词。近代,与国际中文教育相关词高频共现的主要与官职、官僚机构、商业以及外国有关。北洋政府时期还出现了与“体育”“中学”有关的词,主要是由于这一时期汉语教学与学习集中于各中学。北洋政府时期是我国社会现代化的早期阶段,这一时期体育教育也得到了一定的发展。当时存在两个具有实际效力的教育宗旨,第一个是1912年9月2日由教育部颁布的军国民教育宗旨,第二个是1919年由教育调查会提出的健全人格教育宗旨。解放战争时期,与荷兰及华侨相关的词占据大部分,主要是由于这一时期荷印政府以及学校,民间有注重中文的倾向,且荷兰及荷属东印度华侨众多,但华侨中颇多不识中文者又无机会学习中国历史与文化。此外,这一时期除了实用交际,对于中国及汉语汉学的学术研究也是学习汉语的目的之一,如1947年荷印政府筹备成立中国学术研究所作为东印度研究中国学术与文化之中心,巴达维亚大学之文学部科目中也有中国学一门。如:
(13)印荷政府,近感中国为世界五强之一,华文列入为国际语。且荷印华侨众多,关系密切,目下巴城印尼大学汉学院……其他各校亦有印尼学生就读,足见荷兰印尼人士已有注重华文之倾向。(《申报》1948年3月12日)
本文使用SnowNLP进行国际中文教育事业情感分析,从特定的情感视角反映各个历史时期国际中文教育事业形象的演化趋势。SnowNLP是受到TextBlob启发面开发的针对中文处理的Python文本分析库,SnowNLP情感分类的基本模型是贝叶斯模型,基于情感词典,主要原理是计算出的情感分数表示语文积极的概率,将处理好的样本文本库输人训练过的模型中,利用贝叶斯模型预测某一文本情感阔值尸的值。计算公式简化版如下:
将情感分值在[0,1]进行66段切分,当P∈[0,0.33)时,表明该文本为消极倾向,当P∈[0.33,0.66)时,该文本为中性倾向,当P∈[0.66,1]时,该文本为积极倾向。其中,随机事件c1表示样本为c类的情感正负概率,wn表示测试样本中某一特征词w出现的概率。在计算每个语句情感正负时,用计算出的先验概率分别乘以它的每个属性特征词的条件概率而得出情感概率值,并取其中正负情感值较大者作为此语句的情感倾向。本文重点使用其中的情感分析(sentiment analysis),对文本数据进行简要的情感分析及可视化,旨在了解不同时期的国际中文教育事业整体形象。
本文情感分析的数据来源于中心词,使用Python代码在各历史时期语料中进行例句抽取,由于《申报》在1906年以后才出现了标点符号,因此本文以中心词为中心、抽取中心词前后40个语言单位,得到各时期的例句数据。各时期积极与消极例句数如表4所示。
SnowNLP情感分析基于情感词典,将文本分为积极和消极两类,返回值为情绪的概率,接近1为积极,接近0为消极。以晚清时期、北洋政府时期和改革开放以来至今为例。
晚清时期,与国际中文教育有关的例句共抽取196条,北洋政府时期共抽取2142条,改革开放以来至今共抽取15269条,例数量的显著差异与国际中文教育在不同时期的发展程度相契合。一个学科在不同的历史时期发展状况不同,学科形象自然也会随之变化。图5的饼图是积极情感例句与消极情感例句在不同时期的比重变化,晚清时期以后积极情感所占比重一直遥遥领先于消极情感所占比重,且总体呈平稳趋势。
晚清时期,情感(emotion)平均值为0.61,中位数为0.82,25%分位数为0.09,可见25%的极低情感分数据造成了晚清时期整体emotion均值的较大下移,由图6的直方图可见,晚清时期例句内容两极分化较为严重。如例句“迩年来,中外声气渐通,群疑稍释,遇事不甚隔膜者,其故又何哉、亦由西人攻习华言文字者日渐增多耳,以来华之洋人计之,则十人中几及二人,而华人之习西文者仍与曩日相加无几”,该句emotion值为0.11;又如“英国朝廷现在拟设大书院一所,专习中国语言文字,盖因见法京巴黎前此创有中国学堂二所,现在法人又欲再建二所,一在拉宴为产丝之区,一在摩瑙”,该句emotion值为0.99。
北洋政府时期及改革开放以来至今,emotion平均值都在0.8以上。北洋政府时期,emotion平均值为0.85,中位数为0.99;改革开放以来至今,emotion平均值为0.82,中位数为0.98。各项数值差别不大,以积极情感为强势主导通过以上情感分析可以初步得出,近现代我国新闻媒体对国际中文教育事业的塑造重心倾向于积极形象,这与国家发展要求密不可分。
值得讨论的是,《人民日报》是作为中国的中央机关报,承担宣传责任,然而在数据统计中出现部分负面情感。本文以改革开放以来至今的数据为例进行探究并分析解释。改革开放以来至今与国际中文教育有关的例句及其情感分如表5所示,
前面本文曾提到,SnowNLP基于情感词典,主要原理是计算出的情感分数表示语义积极的概率,而例句是以表1中提到的与国际中文教育有关的中心词为中心抽取的,因此通过表5例句我们可以看到,每个例句的整体情感都是倾向负面的,这反映的不是国际中文教育事业在此时期语境中是负面形象,只是与之有关的相关事件或语义环境所折射出来的情感倾向属于消极状态,对国际中文教育事业形象整体没有太大影响,积极形象仍然以绝对优势占据主导。
总之,《申报》是旧中国影响力最大的一份报纸,被称为中国近代史的“百科全书”,不只反映国家政府宣扬的思想,更体现新闻自由,因此其记载的内容在一定程度上摆脱了政府的“思想管控”,能较为全面地反映历史事件。结合国际中文教育事业情感评价的这种趋势来看,尽管由于时局震荡,政府在汉语教育方面并不积极,但社会各界人士都持有“救亡图存”一个共识,汉语教育对“救亡图存百利无一害,因此在以《申报》为代表的近代语料中,国际中文教育事业形象被赋予一种连续性的积极形象,学科事业发展也一直没有中断。中华人民共和国成立以来,受文化、经济、政治等多方面因素的影响,对国际中文教育事业的需求增大,尤其是20世纪80年代以来,汉语开始大规模地向世界传播。随着我国综合国力以及国际地位的提高,在经济全球化、文化多元化的国际背景下,发展国际中文教育事业也越来越受到国内国际的重视。
本文尝试采用计量的方法,以关键词及其关系勾勒国际中文教育事业的形象及其自晚清以来的发展变迁,以期丰富我国近代的汉语第二语言教学历史从研究对象上说,经历了从近代的少部分帝国主义侵略国家的传教士、外交官、商人以及精英人士学习汉语,到中华人民共和国成立初期至改革开放前夕少部分专家学者致力于国际中文教育事业,再到设立了专门的专业硕士学位培养国际中文教育研究人才,越来越多的社会各界人士加入国际中文教育的行列。
从社会作用上说,从近代的“语言救亡”,出于商业贸易、传教、外交和政治原因等学习汉语,到中国与各国的经济、文化等方面的交流合作不断加强,海外学习汉语的需求不断增加,再到形成了一定程度的“汉语热”,国际中文教育在全球政治经济文化交流中发挥着重大作用,国际范围内的汉语学习经济动因、文化动因占比增多。汉语教学也逐渐由被动变为主动,更多集中于中文教育本身以及中华文化,国际中文教育事业朝着系统化、专业化、国际化的方向蓬勃发展,与国际范围内的运动相结合,国际中文教育开始肩负更为重要的责任。国际中文教育自近代发展到成为一门独立的学科,历史已有百余年,学科发展已经具有了崭新的面貌。从被迫打开国门与世界交流,到全面开放融入世界、参与制定国际秩序,语言在全球政治经济文化交流中仍然发挥着重大作用。当今已是信息化时代,数字技术正以惊人的速度发展,面对百年未有之大变局回顾国际中文教育的70余年发展历史,李泉指出在国际语言文字生活早已发生重大变化的背景下,应该更新观念,积极探索汉语教学的新理念、新模式和新方法。近年来,国际中文教育的信息化建设已经取得一定成效,诸如北京语言大学酝酿建设的国际中文教育智慧平台等国际中文智慧教育工程是这一时期实现教学、学习智慧化的必然要求。在这样的背景下,国际中文教育将会朝着可喜的方向发展,国际中文教育工作者们任重而道远。
另外值得讨论的是,新文化运动期间,汉字改革运动如火如荼,在近代甚至有“汉字不亡,中华不兴”以及“汉字不灭,中国必亡”等口号,在整个新文化运动中,胡适与鲁迅等人所倡导的白话文与汉字改革也是其中一项极为重要的内容。然而近代这种对汉字予以抑制的方案在本文的计量统计中却没有体现。本文认为主要有两方面的原因:一是白话文与汉字改革主要在自己的学术阵地上呐喊,如《语丝》和《新青年》;二是对汉字和汉语的争议并不影响国际中文教育的发展与形象,这是两个层面的问题。
本文选择《申报》和《人民日报》这两份主流报纸作为数据来源,结合语料库研究方法,基于1872年到2015年,共144年跨度的中文报纸语料库,对国际中文教育事业的形象、动因、内容、情感评价等方面进行剖析,探索国际中文教育自晚清以来形象与传播的发展变化。
研究发现,中华人民共和国成立以前主要是少部分帝国主义侵略国家的传教士、外交官、商人以及精英人士学习汉语,与租界国密切相关,学习动因主要是通商、传教、外交和干涉中国事务等;中华人民共和国成立以来,国际中文教育的教学对象不断扩大,且随着中国在全球的地位越来越高,对中国文化感兴趣的人也越来越多,经济动因、文化动因占比增多。同时,汉语教学也逐渐由被动变为主动,国际中文教育事业实现转型发展。
此外,本文通过抽样调查,从语料中抽取了一批与国际中文教育事业密切相关的中心词,深人调查了几类中心词在语料库中的频率分布并形成可视化图表,加以分析的同时不断丰富词典以及相关事件,尽可能充分地展示现代国际中文教育的形象。本文使用情感分析技术进行近代国际中文教育事业情感分析,从特定的情感视角反映各个历史时期国际中文教育事业形象的演化趋势。最终发现,国际中文教育事业发展与政策的变化、社会历史环境以及文化发展密切相关;国际中文教育事业形象在近现代一直以积极形象为主,在不同时期强度有变化。国际中文教育事业形象的变化反映不同时期的社会环境、意识形态变化,也是对不同时期教育工作者工作的肯定。国际中文教育事业既是体现中国风格、中国气派的国际性事业,也是中国作为母语国对中文这种国际公共文化产品的支持,有利于构建人类命运共同体。
**徐艺玮,北京语言大学国际中文教育研究院硕士研究生。牟璇,北京语言大学国际中文教育研究院硕士研究生。饶高琦,通信作者,北京语言大学副教授,文学博士。
标签: 情感分析不用情感词典
相关文章
女主胡曼黎(孙俪饰)被丈夫出轨之后,她不仅面临家庭崩塌、事业失业的双重打击,还上演了一出典型的“狗血”剧情——为了挽回丈夫,带着第三者...
2025-07-13 1 情感分析不用情感词典
青春期恋爱是心理发育的正常现象,强硬禁止可能激发逆反心理。家长可通过每周固定谈心时间,以朋友身份倾听女儿的情感困惑,避免评判性语言。分...
2025-07-13 1 情感分析不用情感词典
在影视界中,短剧以其紧凑的剧情、鲜明的人物性格和深刻的主题赢得了广大观众的喜爱。其中,短剧《唯有深情不可负》以其感人至深的故事情节和丰...
2025-07-12 1 情感分析不用情感词典
给予者人格的职业尊严主要体现在无条件付出与自我价值实现的平衡,核心要素包括专业边界维护、情感劳动回报、社会认同获取、职业发展可持续性以...
2025-07-12 1 情感分析不用情感词典
金融界2025年4月17日消息,国家知识产权局信息显示,浙江浙石油综合能源销售有限公司申请一项名为“一种基于加油站顾客评价的情感分析方...
2025-07-10 2 情感分析不用情感词典
发表评论