维普资讯
2008年 4月 龙 岩 学 院 学 报 April 2008
第26卷 第2期 JOURNAL 0F IJ0NGYAN UNIVERSITY V01.26 No.2
解析 《中国学生英语13笔语语料库》
许智坚
(龙岩学院外国语学院 福建龙岩 364000)
摘要:近年来,国内外英语学习者语料库建设方兴未艾,我 国英语学习者语料库研究取得 了重
大的进展并受到了国外同行的认可。 “中国学生英语 1:7笔语语料库”的建成,为我国的第二语言习
得研究。特别是英语专业教学研究有着十分重要的意义。文章介绍了国内外英语学习者语料库的
基本情况,尤其是 “中国学生英语 1:7笔语语料库”的基本 内容 、主要特点 以及该语料库对外语教
学的启示。
关键词 :英语 ;学习者语料库;语料库建设;过渡语
中图分类号 :H319 文献标识码:A 文章编号:1673—4629(2008)02—0069—06
1 引言 学习者 (书面语 )语料库 JPU JanusPannnius
随着计算机处理速度的飞速增长以及存储能 University)、波兰 Lodz大学英语系和英 国兰卡斯特
力的扩大,语料库建设呈现多元化发展和增殖趋 大学合作创建的容量 50万词的波兰英语学习者
势。在 20世纪90年代,各种专 门语料库纷纷建成 (书面语)语料库 PELCRA、瑞典 Uppsala大学建立
或在建,用于学习者语言运用分析的学习者语料库 的容量 100万词的英语学习者 (书面语)语料库
的建设及其相关研究也方兴未艾 。学习者语料库与 USE(UppsalaStudentEnglish)、日本明海大学 Yukio
一 般语料库不同,它是指经过计算机处理的外语学 Tono教授建立的容量为50万词的英语学习者 (书
习者的语言产 出的文本数据库 l1『。记录的是学习者 面语)语料库 JEFLL、比利时 Louvain大学 的 s.
的过渡语 (interlanguage)。学习者语料库通过收集 Granger教授负责建立的包括中国在内多国参加的
语言学习者各种书面语和口语的自然语料 ,按照一 容量为 100万词的多母语国际英语过渡语 口语语
定的设计标准和原则通过科学抽样方法采集、编制 料 库 LINSEI (Louvain InternationalDataba
seof
建立起来 ,这种数据库也称机读学习者语料库 SpokenEnglishInterlanguage),以及英国的商业性容
(ComputerLearnerCorpus)。借助于计算机硕大的 量为 1000万词的多母语学习者 (书面语)语料库
存储空间和强大快速的处理能力和计算机赋码、标 CLC(CambridgeLearnerCoprus)和容量大于 2亿词
注工具 ,语料库可以在对语料进行 自动词性赋码、 的多母语学习者语料库 LLC(I~ngmanLearners’
错误赋码 、语义赋码 、话语赋码和句法标注,不仅能 Coprus)等 ,而 由比利时 Louvain大学的Granger教
为深入研究学习者的语音、词汇、语法、语篇、语用、 授及其 同事建成的涵盖 20余个国家英语学习者语
交际能力的发展提供充分的数据 ,而且还能为研究 料的ICLE(InternationalCoprusofLearnersEnglish),
学习过程 、自主性学习以及教材编写、测试提供重 则 “标志着学习者语料库建设和研究的一个重要里