从口语研究看口语中介语语料库建设
刘运同
内容提要 本文从语言研究与语料库建设之间的关系出发来探讨口语中介语语料库的建设。语料库研究者提出的“偏误标注 基础标注”的标注模式为语言研究者和中介语研究者指明了研究的方向。本文评述的两个个案表明,口语本身以及学习者的口语中介语的研究虽然已经有了可喜的开始,恐怕都还不能很好地满足语料库建设的需要。语料库建设对此要有清醒的认识。
关键词 口语中介语语料库;口语研究;中介语研究
一、引言
中国的中介语语料库建设经过多年的发展,已经积累了丰富的经验,并开始从理论上进行提炼总结。例如关于中介语语料的标注,研究者提出了“偏误标注 基础标注”的标注模式(张宝林,2013)。这一标注模式的提出,不仅为中介语语料库建设提供了可行的标注方案,并且也为中介语研究指明了探索的路径。一方面中介语的研究需要汲取本体研究的成果,采用能为大家接受的理论和描写作为基础标注的基础;另一方面中介语的研究需要对学习者中介语的使用有充分的了解,才能在语料标注时对学习者的偏误做出准确和恰当的描述和概括。
从这个角度来观察汉语口语中介语语料库建设,我们认为,虽然近年来口语中介语语料库建设逐渐成为热点,但是人们对建设口语中介语语料库的困难仍然估计不足。口语中介语语料库建设的困难不仅在于口语语料收集和转写的难度,而且还在于学界对口语本身的研究不充分,而且研究者对汉语中介语的研究也是刚刚起步。也就是说,相对于书面语语料库建设,口语语料库建设的可资利用的理论和基础研究远远逊色于书面语语料库建设。本文将利用两个个案来说明,对口语本身的研究及学习者口语中介语的研究如何深刻影响语料的分析和标注。
二、个案一:易位句
所谓易位句,就是句子成分倒装以后形成的语句。如例(1)来自2002—2003年度CBA总决赛第二场比赛后记者对广东宏远队队员朱芳雨的赛后采访,我们关注的**是“也看到了今天也有实力去赢我们在东莞这个我们的主场这里”。这句话的主语是前面提到的山东队,不管我们如何分析这个句子,在说出“赢我们”之后,这个句子本来就可以结束了,但发话人却加上“在东莞这个我们的主场这里”这个介词短语。朱芳雨补充出主场这个信息,是为了强调说明山东队也很有实力,因此广东队应该认真应对。
(1)但是他们也有希望,也有就是也看到了今天也有实力去赢我们在东莞这个我们的主场这里。[体育直播,2013/03/24]
自从陆俭明(1980/1993)提出易位句的概念,研究者对这一现象及相关的句法现象进行了深入的研究,提出了各种各样的解释,如追加(陈健民,1984)、追补(史有为,1985)、主位后置(张伯江、方梅,1994、1996)、延伸句(陆镜光,2005)、添加(李剑锋,2000)等。其中特别需要关注的是陆镜光“延伸句”的观点。
2000年,陆镜光发表《句子成分的后置与话轮交替机制中的话轮后续手段》一文,次指出,“话轮后置成分可以部分地归结于替换机制”,“句子后置成分在话轮交替相关处起到一种话轮延续的作用”。(2000:303)在此基础上,陆镜光提出了“延伸句”的概念。陆镜光提出“延伸句”的概念,也是为了统一处理和解释诸如易位、追补、重复等多种语言现象。他认为,“,从会话的结构来看,后续语的基本作用是把句子延长,这样可以给听话人更充分的时间做好接话轮的工作,使话轮的转换进行得更顺畅……第二,信息的传递是在时间轴上进行的,在传递一连串的信息的时候,不可避免地要面对信息排序的问题。在一定的言语交际环境中,说话人可以通过倒装、重复、追补等手段,首先交代较重要的信息,然后补充或者扩充前面的信息。”(2005:44)
在理论建设方面,我们认为“延伸句”的提出有两点重要的贡献:是把以前研究者所谓的倒装、易位和重复等现象跟句子的弹性特点联系起来,用动态的方法来研究这种句式的形成机制;第二是利用会话分析的理论和方法,采用真实可靠的语料来支撑自己的论述。不过,这种解释也存在一些不完善的地方。在上述引述的两点重要论述中,第二点是信息排序。陆镜光认为,延伸句可以让交际者“首先交代较重要的信息,然后补充或者扩充前面的信息”,这样的解释似乎有回到了“主位后置”说的老路上了。同时,这样的解释也无法说明一些研究者提及的后置部分表示语义**、新信息的事实。信息的排列可能只是导致出现延伸句的一个原因。在另一篇论文中,陆镜光(2004:6)也说,“延伸句子的理由很多,除了上文提到的再话题化(re-topicalization)、小范围内话题的重新确认(local topic re-instatement)之外,句子延伸还能起到确认或强调当前话题、改换说法、补充相关信息、方便话轮交替等作用。”
至于点,陆镜光(2005:44)认为,“后续语的基本作用是把句子延长,这样可以给听话人更充分的时间做好接话轮的工作,使话轮的转换进行得更顺畅。”我们认为,这种论述是不准确的,对后续语在会话中的作用挖掘不深。根据我们的研究,交际者在一个话轮结束的地方进行补充、延伸,往往是为了使自己的话语更**,更好地传达自己的交际意图,因而可以更好地引起听话人的反应。也就是说,延伸话轮不仅仅是为了延长时间,方便听话人接过话轮,而是为了弥补先行话语的不足,从而更有利于听话人做出适当的反应(刘运同,2015:7-13)。
如果从口语生成的角度来看问题,我们认为,易位句的形成跟口语表达时的信息加工特点有关。在口头交流时,受到人类认知加工能力的局限(特别是在线加工时),会话者一次能产出的信息量有限度,因此会话者会通过降低加工难度的方法来增加加工速度。易位句可以看作是会话者化整为零的一种加工策略,通过先行部分和后续部分两次加工来更好地完成交流任务。这也就是为什么有些后续成分[如例(1)]可以充当语义**、可以重读的原因。可以说,会话者通过这样的方式扩展了句法的可能性,使用有限的手段来表达丰富的内容。
从口语语法的标准来衡量和分析,所谓的易位句是口语中很正常的表达手段。如果有的研究者固守书面语的语法标准,把如例(1)这样口语中正常的表达分析为(标注为)偏误,那就从根本上歪曲了交际者的语言表现和语言能力。对此类口语语法现象,在进行基础标注时采用研究者提出的分类(如延伸句)来进行标注,也许就是一个不错的选择。