打印

计算机时代的“田野调查”

本帖已经被作者加入个人空间

计算机时代的“田野调查”

语料库语言学研究:计算机时代的“田野调查”



2011年07月05日 17:23 来源:中国社会科学报



  编者按:语言学研究向来关注具体问题,方法问题可谓具体研究之良具,因此,本版将陆续推出关于语言学研究的方法和方法论的文章。栏目名中“旨归”之意取自《温病合编·自序》:“其于卷帙浩繁者,必要旨归,琳琅珠璧,无美不搜……”希冀将语言学方法论之美文尽收于本版。

  随着语料库及分析工具的出现,同时观察千万条语言实例已成为现实。一些语料库工具还能对分析结果自动归类,并直观呈现出来。因而,基于语料库的语言研究变得颇受欢迎。
  语料库语言学重描写和分析
  语料库语言学的基本特征之一是对大量语言数据采取“频率优先”原则,即高频语言现象会被突出表现出来。比如,依据词频高低自动生成的2011年《政府工作报告》的“词云”(如图),便能充分反映报告的总体内涵。
  透过语料库可以看到,“词云”中的发展、建设、经济、社会等构成了政府的主要任务;还可以看到一些具体工作重点。例如“三农”(农村、农民、农业)问题是政府工作的首要关切。而作为今年《政府工作报告》的突出特点,价格、住房、就业、城乡、保障等成为首要关切之外的热门话题。可见,语料库方法可根据观察需要的不同获得宏观或微观的认识。但语料库语言学,不同于其他多数语言学研究视角,它更强调对语言事实宏观的、趋势性的描写和分析。
  语料库语言学优于“单兵作战”的语言学
  在语言研究中,通过大量语料研究新词新语、语言演变、地域变体、跨语言对比等都不乏成功的例子。例如,基于北京语言大学的“动态流通语料库”可以观察新流行语的产生。如英国兰卡斯特大学的Geoffrey Leech等人通过对70年间英语书面语语料的分析,发现了当代英语情态动词弱化的趋势,其中较为突出的是must、should这类强势情态动词使用越来越少,取而代之的是have to、need to、be supposed to这些语气较缓和的情态表达法,体现了英语书面语词语变化的口语化和通俗化。从地域变体来看,香港教育学院创建的LIVAC汉语共时变体语料库,容纳了北京、上海、广州、深圳、香港、澳门、台湾地区和新加坡等8个汉语言语社团的大量语料,有利于不同汉语地域变体的社会语言学对比研究。又如美国加州圣巴巴拉大学的Wallace Chafe等人发起的“梨子故事”的课题,积累了数十种语言或语言变体的同题叙事语料,特别适合开展跨语言比较或类型学研究。
  总之,借助语料库,研究者可以突破语言材料在数量方面的限制,研究视野可以超越时空界限,可以开展跨语言、多文化的综合比较,验证或推翻一些已有的语言学论断,还可能发现一些以往不曾注意到的语言事实和规律。这些往往是单兵作战的语言研究者所望尘莫及的。
  计算机时代的田野调查者
  语料库语言学因利用量化数据、主张语法的动态浮现而赢得了广泛的认同,然而,语料库方法强于形式描写、弱于理论阐释,因此,有必要向其他语言学流派甚至其他学科虚心求教,以求臻于完善。
  在语料库研究成果的应用上,西方学者在语法书的编写、词典编纂、教育教学等方面都有诸多经典案例。国内语言学界利用语料库者对相关理念、方法的把握也不落后于西方,只是有影响的应用成果仍不多见,还需不断精进。语料库语言学者,究其本质,是计算机时代的田野调查者。
  许家金(作者单位:北京外国语大学中国外语教育研究中心)

TOP