从两岸三地教材词汇差异看海外华语教育 - national...

13
1 从两岸三地教材词汇差异看海外华语教育 王惠 新加坡国立大学中文系 [email protected] 本文在全球华语(World Chinese)背景下,利用当前的语料库语言学理论,对世界 主要华语区域——中国大陆、台湾,新加坡等地的华文教材做了系统全面的定量分析, 真实地展现出两岸三地词汇在静态地域分布与动态使用频率上的共性与差异。由此,进 一步探讨海外华语教育特点,认为它既不同于中国大陆与台湾的基础母语教育,也不同 于面向非母语者的对外汉语教学,而是恰恰介于二者之间,即第二语言的母语教学关键词: 华语教材语料库 海外华语教育 词汇统计 A Quantitative Analysis on the Chinese Words Distribution in Chinese Mainland, Taiwan, and Singapore Wang Hui National University of Singapore [email protected] Abstract This research has carried out a full-scale corpus analysis on Chinese words in Primary Schools’ level in Chinese Mainland, Taiwan, and Singapore. The resulting analysis provides a scientific and empirically based Chinese word list for curriculum development. There are also implications of partition of “World Chinese”. Increasing globalization has caused significant overlap in the most frequently-used Chinese words in different countries or territories. The small differences are due to the specific cultures and societies. Oversea Chinese Language education, different from the native Chinese Language teaching and Chinese teaching as a foreign language, should strike a balance between the learning of common words as well as preserve local flavour. Keywords: Oversea Chinese language education, Chinese textbook corpus, Corpus-based vocabulary analysis 本研究受到新加坡教育部资助,课题名称“新加坡常用字词调查研究”(No. R-102-000-037-121)。

Upload: others

Post on 02-Jan-2020

44 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

1

从两岸三地教材词汇差异看海外华语教育

王惠

新加坡国立大学中文系

[email protected]

摘 要

本文在全球华语(World Chinese)背景下,利用当前的语料库语言学理论,对世界

主要华语区域——中国大陆、台湾,新加坡等地的华文教材做了系统全面的定量分析,

真实地展现出两岸三地词汇在静态地域分布与动态使用频率上的共性与差异。由此,进

一步探讨海外华语教育特点,认为它既不同于中国大陆与台湾的基础母语教育,也不同

于面向非母语者的对外汉语教学,而是恰恰介于二者之间,即“第二语言的母语教学”。

关键词: 华语教材语料库 海外华语教育 词汇统计

A Quantitative Analysis on the Chinese Words Distribution

in Chinese Mainland, Taiwan, and Singapore

Wang Hui

National University of Singapore

[email protected]

Abstract

This research has carried out a full-scale corpus analysis on Chinese words in Primary

Schools’ level in Chinese Mainland, Taiwan, and Singapore. The resulting analysis provides a

scientific and empirically based Chinese word list for curriculum development. There are also

implications of partition of “World Chinese”. Increasing globalization has caused significant

overlap in the most frequently-used Chinese words in different countries or territories. The

small differences are due to the specific cultures and societies. Oversea Chinese Language

education, different from the native Chinese Language teaching and Chinese teaching as a

foreign language, should strike a balance between the learning of common words as well as

preserve local flavour.

Keywords: Oversea Chinese language education, Chinese textbook corpus, Corpus-based

vocabulary analysis

本研究受到新加坡教育部资助,课题名称“新加坡常用字词调查研究”(No. R-102-000-037-121)。

Page 2: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

2

一、全球华语圈

华语(中国大陆称“普通话”,台湾称“国语”),是全球华人的共同语。由于社会文

化环境差异,语言地位各有不同,加上华语与当地通行的方言以及外族语言的融合等因

素,富于各种地方色彩的华语变体自然产生。

与世界英语(World English)类似,全世界的华语也可以依据扩散的种类、在使用

地的社会语言功能域、语言习得类型等因素,划分为三大同心圈:内圈、中圈、外圈

(Kachru 1984,1989;Gramley 2001;Lu, Yuanwen 2002;吴英成 2003;周清海 2006)。

内圈主要指中国大陆与台湾、港澳,华语是母语,同时也是该国家或地区的第一语

言。

中圈主要指以华语作为共通语(lingua franca)的海外华人移民地区。华语是华人的母

语,但只是多语社会中日常使用的语言之一,不是第一语言。比如,马来西亚小学与中

学阶段需要学习三种语言(马来语、华语、英语)。在新加坡,华语是四大官方语言之一

(英语、华语、马来语、淡米尔语)。

外圈是指以华语作为外语学习的非华人国家或地区,华语既不是母语,也不是第一

语言,如日韩、欧美非洲等地(图 1)。

图 1 全球华语三大同心圈

笔者认为,三个圈的华语地位不同,语言学习需求不同,因而,华语教育也相应地

分为三类:

a. 母语语文教育:内圈

b. 海外华语教育:中圈

c. 对外汉语教育:外圈

海外华语教育既不同于中国大陆和台湾的母语语文教育,也不等于一般意义上的对

外汉语教学(李方,1998;郭熙,2004,2006)。比如,新加坡和马来西亚是海外华人

比例最高的两个国家,二者都是多语社会,官方工作语言主要是英语和马来语。华语作

为华人的母语,学生在入学之前,已经可以流利地进行口语交流,因而学校教学的首要

任务是训练、提高学生的阅读、写作等书面语能力。

Page 3: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

3

海外华语教育究竟应该如何定位?如何根据其内在的特点编写教材,提高教学效

果?诸如此类的研究尚处于刚刚起步阶段,目前尚缺乏系统的理论研究与细致的事实描

写(郭熙,2006)。此外,郭文也一针见血地指出该领域研究中目前普遍存在的问题:

在研究理论问题的时候,空洞的争论多,事实研究少;一般教育或教学的研究多,

具体的语言教学和学习规律的研究少。以媒介语问题为例。如前所说,新加坡争论最厉

害的莫过于该不该用英语教华语了。遗憾的是,无论是哪一方,都没有用大量的研究来

证实。过去的研究中的一个重要现象是说“应该”或“要”的多,而事实“怎么样”、和“为什

么如此”做得少。

正是基于上述认识,本文将从具体的数据调查入手,利用当前的语料库语言学理论

技术 (Ooi 1998, Schmitt 2000, McEnery 2001 ),对中国大陆、台湾、新加坡(简称“两岸

三地”)的华语教材进行计量分析,提取三地小学教学词表,比较其在地域分布与频率

上的共性与差异。由此,进一步探讨海外华语教育的特点,然后提出一个标准明确的汉

语词汇分级方案。

二、“两岸三地”华语教材语料库

本文的分析数据主要来自“东南亚当代华语语料库”。这是新加坡教育部2005年设立

的一个专项研究计划,由笔者作为课题负责人,新加坡国立大学中文系开发完成的一个

大规模华语平衡语料库。目前,已完成第一阶段任务,收录了2000-2006年在新加坡、

马来西亚正式出版的图书、杂志、报纸、教材、影视剧本,以及网络媒体,共6000万字,

其中2000万字已完成词语切分与词性标注。

由于教材语言规范,可作为各地标准华语的代表,因而,我们专门开发了一个教材

语料库,作为整个语料库的一个子集,内容包括新加坡、马来西亚、台湾、香港以及中

国大陆等地的中小学各科教材。

就我们所知,华语虽然遍布世界各地,但把华语作为中小学校必修课程的,目前只

有中国大陆(包括港澳)、台湾、新加坡这三个国家与地区。

中国大陆与台湾,是华语使用最集中的区域,华语既是母语,又是第一语言,普遍

用于社会、政治、经济、文化的各个层面。在这里,中小学阶段的语文课都属于典型的

基础母语教育,二者不同的仅在于文字,大陆使用简体字,台湾使用繁体字。

新加坡是世界上唯一的以华人为主的海外国家,300 多万人口中,华人占 77%,马

来人占 14%,印度人占 7.6%,其它种族占 1.4%。新加坡的官方语言共有 4 种: 英语、

华语、马来语、淡米尔语。其中,英语是第一语言,使用最为广泛,也是学校中的主要

教学语言。华语虽是华人的母语,但只是第二语言,学校里只有华文课上才用华语教学。

因此,它是海外华语教育的典型代表。(王惠,2006)

把中国大陆、台湾、新加坡三地通行范围广泛的小学语文课本汇集在一起,就组成

一个了专题语料库——两岸三地华语教材语料库。语料内容包括:

人民教育出版社小学语文室编,《九年义务教育六年制小学教科书(语文)》(1-12

册),北京:人民教育出版社,1998 版。

国立编译馆国民小学国语科教科用书编审委员会编,《国民小学国语课本》(正式本

初版)。台湾:国立编译馆,2002 版。

新加坡教育部课程规划与发展署编,《小学华文》(1-12 册),新加坡:EPB 教育出

版社,2005①。

① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

Page 4: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

4

这三套教材发行面较广,能够代表当前三地小学华语教育水准。该语料共计包含

492,507字次, 3,612个不同的汉字,18,030个词语。(见图1)。

18030

1124110065

4596

0

5000

10000

15000

20000

总量 大陆 台湾 新加坡

图 1 两岸三地语文教材词汇量

图1显示,中国大陆小学语文课本词汇量最大,达到11,241个;台湾次之,共计10,086

个词,转换为简体字以后只有10,065个(以下21对词,汉字简化以后,成为21个词):

隻-只、牠們-它们、裏-里、於-于、麵-面、獲-获、反復-反复、沖-冲、乾-干、睏-困、

歷-历、佈景-布景、鬆-松、捆-捆、迴旋-回旋、遊-游、誌-志、痠-酸、穀-谷、錘-

锤、

嚮-向

新加坡教材的词汇量最少,只有4596个,不及大陆和台湾的一半。

三、词汇地域分布的不平衡性

从教材用词上看,两岸三地的华语词汇是彼此交叉重叠的,既有共同使用的基本词

汇,也存在着只在某一特定区域内流行的词语。如图 2 所示:

图 2 词汇交叉示意图

(A、B、C 分别代表中国大陆、台湾、新加坡)

秀学生才能修读;绝大部分学生读的是后者。为了客观地反映新加坡汉字教育的真实水平,本文所选的

教材是“普通华文”课本。

Page 5: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

5

统计数据表明,共同使用的词汇占少数。其中,在三地中均出现的词语,只有 2235

个,占小学教材词汇总词量(18030 个)的 12.4%; 在任何两个区域中的词语也只有

3352 个,占 18.6%。绝大多数(12443 个,占 69.0%)仅出现一个区域教材中(见图 3)。

2235

3352

12443

0

2000

4000

6000

8000

10000

12000

14000

三区共用 二区共用 单区独用

图 3 小学语文教材词语的地域分布

(1) 三区共用词

在三地教材中均有出现的词语,数量虽然不多,仅占 12.4%(2249 个,)但却是华

语圈的共同核心词汇,大都属于基本词范畴。其中最高频的 50 个词是:

的、一、了、我、是、他、在、说、有、着、不、个、你、这、就、上、我们、

到、小、也、里、要、来、都、人、去、把、又、看、很、地、和、得、好、

大、那、天、还、它、妈妈、会、他们、从、什么、她、走、时候、想、吃、

爸爸

(2) 双区共用词

通用于两个区域的词语,共计 3352 个,其中(1)大陆、台湾通用词最多,占 64%;

(2)大陆、新加坡通用词次之,占 21%;(3)台湾、新加坡通用词最少,仅有 15%。

(见图 5)

Page 6: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

6

大陆-新加坡,

713, 占21%

台湾-新加坡,

518, 占15% 大陆-台湾,

2143, 占64%

图 4 双区共用词语的地域分布

中国大陆与台湾通用词举例(最高频 50 个):

山、句子、绿、组、主席、不会、真是、毛、美、层、城、台湾、咱们、作

文、假使、名字、整、雪、嗡、大自然、例如、举、浪花、湖、花生、榕树、

乌鸦、竹子、建筑、燕子、挤、革命、讲演、屋子、中间、黄河、夏天、铁

路、风筝、文字、小孩子、一点、内容、表现、部、蓝、脖子、一齐、仍然、

同伴、影子、搭、画家、云

中国大陆与新加坡通用词举例(最高频 50 个):

这样、这个、有的、这里、那个、为了、心里、似的、那里、这些、伯父、送

给、哪里、那些、只要、姐姐、很多、家里、接着、越来越、这时、村子、那

样、群、大虫、这种、有人、别的、只有、每天、咬、鸡蛋、夜里、老奶奶、

巫婆、眼前、股、好多、天上、外祖父、田里、不时、有点、刮、松鼠、冻、

那时、村长、随着

台湾与新加坡通用词举例(最高频 50 个):

头脑、国君、进步、求学、爱心、引导、短文、特地、游玩、拿出、对话、成

语、孝顺、阅读、出兵、大哥、表弟、应用、太太、辛勤、懒惰、侄女、百、

救火、生动、最近、生意、响起、山洞、思考、红绿灯、遮住、失望、压岁钱、

高手、电话、大学、竹林、花猫、林、力、耕种、外套、怀念、开口、学业、

开学、香肠、大意、角色、杯子

(3)单区独用词

仅出现在一个区域中的词语,共计 12,443 个,占教材词汇总量的 69%。其中,中

国大陆的独用词最多, 6145 个;台湾次之,为 5156 字;新加坡最少,只有 1160 个。

(见表 1)

Page 7: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

7

分布区域 词数

中国大陆 6140

台湾 5155

新加坡 1148

总计 12443

表 1 单区独用词

中国大陆(举例,最高频 50 个):

雨来、战士、列宁、武松、总理、周围、北京、碰、劳动、企鹅、火柴、桑娜、

铺、指导员、青石、军官、红军、鬼子、警卫员、部队、槐树、哗、爬山虎、奴

隶、群众、灰雀、乡亲、老爷爷、庄稼、柚子、咕、地道、座位、高粱、露、店

家、鸭子、红领巾、斧子、高尔基、斯巴达克、爱尔莎、战斗、目光、农民、跟

前、之间、胸脯、蹦

台湾(举例,最高频 50 个):

单元、璧玉、字典、相如、部首、农人、描写、除、某、姊姊、李国安、张良、

词性、纪录、小美、竹、笔记、侍卫、小英、短语、小宝、名词、史怀哲、恐龙、

不肯、舅妈、记叙文、张劭、诗歌、英英、下列、妹、粽子、弟、便条、兄、晴、

民国、注音符号、幽王、抹布、妈祖、马偕、嫦娥、拜年、爸、壁报、香包、姑

丈、林大年、范素珠、纣王、鞭炮、岳纳珊、城池、明月、生字、甘罗、褒姒、

吕淑兰

新加坡(举例,最高频 50 个):

新加坡、苏武、叙利亚、国亮、河神、胡姬花、戚继光、文具盒、高斯、郑和、

民德、胡亚基、哥伦布、雷文、水珠儿、巴刹、皮尔、二郎神、东郭先生、大灰

狼、海瑞、铁英、贝贝、大圣、处罚、乌南迪、地铁、屋里、威尔逊、神农、道

勇、民华、国才、电邮、卜式、白鹤、真的、小叔、丁梦、颜永成、商汤、亚答

屋、戴叔伦、顾客、陈金声、徐阶、哈里森、蜂鸟、小人、家宝、王子

(4)流通度

三区共用词,大多都属于华语基本词汇范畴。从词类上看,动词最多,其次是名词、

形容词等等(见图 5):

Page 8: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

8

833

650

199

0

100

200

300

400

500

600

700

800

900

词类

v

n

a

d

q

t

r

f

m

c

s

i

p

nr

z

l

y

图 5 三区共用词语的词类分布

双区共用词,基本上属于通用领域的一般词汇。其中,名词最多,1236 个;动词次

之,1034 个。与三区共用词相比,成语数量明显增多,达到 79 个,仅次于名词、动词、

形容词和副词,名列第 5。如:

天寒地冻、全心全意、画蛇添足、发扬光大、尽忠报国、大街小巷、一举一动、

东张西望、呼风唤雨、为非作歹、游山玩水、七嘴八舌、一视同仁、以身作则、

万紫千红、大显身手、谈天说地、口是心非、同甘共苦、害群之马、出神入化

单区独用词有两个较为显著特点:一是词的长度增加,专有名词、成语、熟语所占

比例提高。以新加坡为例,人名、地名、机构名、商标名、事件名共计 130 个,成语 91

个,惯用语 65 个。占该区独用词总量(1148 个)的 25%。如:

人名: 苏武、叙利亚、国亮、戚继光、高斯、郑和、民德、胡亚基、雷文、海瑞、皮尔、

哥伦布、二郎神、铁英、贝贝、乌南迪、国才、卜式、丁梦、道勇、神农、威尔逊、

民华、陈金声、颜永成、王僧儒、徐阶、戴叔伦、哈里森、江革、项羽、狄仁杰

地名:新加坡、西班牙、新加坡河、马来、马六甲、圣淘沙、花果山、黄村、白店、卫国、

宋国、外黄城、潮州、巴西、东陵、海滨公园、墨西哥、太行山、亚洲、西街、布

拉格、法兰西、北美洲、民盛路、柏林、南山、印尼、加里曼丹岛、东海

成语: 大公无私、饮水思源、乘风破浪、道听途说、哭哭啼啼、刻苦耐劳、装聋作哑、

一网打尽、摇身一变、路不拾遗、司空见惯、齐心合力、奉公守法、无微不至、

指手画脚、胡作非为、青红皂白、老马识途、半途而废、良药苦口、离乡背井

惯用语:保家卫国、不理不睬、长久以来、定时炸弹、发大财、发高烧、猴子猴孙、

忽明忽暗、花园城市、学到老,活到老、没问题、你一言,我一语、上气不接下气、

社会名流、守本分、要不得、一时糊涂、硬骨头、填海工程、相亲相爱、笑而不答

这是教材本身的特殊性所决定的,新加坡的华文教育并不仅仅是单纯的语言教学,

Page 9: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

9

而且同时也负载了中华民族传统历史文化、价值观念的教育,因而很多课文是典故、传

说、故事,叙述方式以书面语为主。这一点,与大陆、台湾很相似,是母语教育的内在

要求,与对外汉语教学迥异。

单区独用词的另一大特点是,存在较多仅在某一特定区域里使用或流行的词语,即

“区域特有词”。这是不同区域华语之间差异在教材用词上的自然体现。如:

大陆: 战士、红军、鬼子、红领巾、火力点、首长、民警、民兵、老乡、钱塘潮、上级、

老农、竹篓、炊事员、脸盆、、饭费、清洁工人、垛子、勤务员、特区、社会主义、

石钟乳、洋槐、秤杆、防空洞、冬麦、电子计算机、姥姥、军阀、客商、旧社会、

公安局、臂章、四合院、手提包、政治犯、酥油茶、通讯稿、诊费、堂屋、淘气包

台湾:民国、注音符号、妈祖、壁报、范式、萝卜糕、计画、手提袋、示例、寒浞、义大利、

园游会、邻长、游水、橡皮擦、塑胶袋、载客、姊丈、孝道、幼童、躲猫猫、国小、

疲敝、菁华、书码、明耻教战、搧熄、米糕、光复节、爆裂、豆糜、当差、乐捐、

举手礼、客馆、护佑、机匠、缉获、饮宴、影像式电话、嘉言、饭具、肇源

新加坡:胡姬花、巴刹、电邮、亚答屋、组屋、华文、清道夫、庆典、华语、小贩、蓄水池、

巴士、华校、鱼尾狮、唱机、巴士转换站、海景、飞虫、电脑科、店屋、告示牌、

访客、书局、屋主、入门票、青蛙们、睡房、熟食中心、摊位、烟客、月薪、住家、

衣橱、学府、营帐、黄梨、脚踏车、佣人、监牢、榴莲

由此可见,词汇地域分布的差异,实际上反映了其在不同区域的流通度大小。使用

的区域越多,流通度越高,反之亦然。同时,伴随着流通度的从高到低的变化,词的自

由度也越来越小。两岸三地的华语词汇的流通度从高到低形成了一个连续序列:

三区共用词 > 二区共用词 > 单区独用词

流通度高 流通度低

基本词汇 通用性一般词汇 专有名词/区域特有词汇

四、词汇频率分布的不平衡性

流通度与常用度是密切相关的。流通度高的词汇,在实际语言中也是经常出现的常

用词。两岸三地教材语料的统计数据(表 2)清楚地了显示这一点。

分布区域 词数 频次 覆盖率

(累积频率)

三区共用 2235,占 12.4% 161895 76.3%

双区共用 3352,占 18.6% 23121 10.9%

单区独用 12443,占 69.0% 27090 12.8%

总计 18030,占 100.0% 212106 100.0%

表 2 单区独用词

由表 2 中可以看出,三区共用词,虽然数量最少,仅占总词量的 12.4%,但它们在

整个语料库中的出现频次却最多,达到 161895 次,平均每个词出现 72.4 次,覆盖率(累

积频率)更是高达 76.3%。这就是说,掌握 2235 个三区共用词,就能读懂两岸三地小

Page 10: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

10

学语文教材的 76.3%。

双区共用词,比三区共用词多出 1118,但其出现频次仅为 23121,平均每个词出现

6.7 次,不及三区共用词的 10 分之一。覆盖率为 10.9%。

单区独用词数量最大,12443 个,占总词量的 69.0%,但在语料中共计出现 27090

次,平均每个词的出现频次仅为 2.2,覆盖率只有有 12.8%。

由此可见,华语词汇的流通区域与使用频次之间存在明显的正相关关系,流通区域

越广泛,频次越高;流通区域越窄,频次越低。(见图 5)

0

10

20

30

40

50

60

70

80

三区共用 双区共用 单区独用

词量%

平均频次

图 5 词汇区域流通量与使用频率

五、华语教材词汇分级

从静态的地域分布上看,中国大陆、台湾、新加坡的小学语文教材词汇差别很大,

只有 12.4%的词(2235 个)在三地教材中均出现;即使是出现在其中任何两个区域中的

词也只有 18.6%(3352 个)。69.0%的词(12443 个)仅出现于一个区域的教材中。

但如果考察词语在语料库中实际应用情况,就会发现三地之间的词汇差异远远没有

这样大,三区共用词的覆盖率达到 76.3%,双区共用词的覆盖率为 10.9%,二者相加,

共用词的覆盖率达到 87.2%。这意味着,只要掌握 5587 个词(=2235+3352),能读懂两

岸三地小学语文教材的 87.2%。

词汇在地域与频率上的这种分布不均衡性,使我们看到,不同词语的效用不同的。

流通区域越广,词频越高,词的效用越大。图 6 显示,掌握了三区共用词(2235 个),

能读懂两岸三地小学语文教材的 76.3%;若再多学习 3353 个二区共用词,词汇量达到

5587 个,可以读懂教材的 87.2%。但若要全部读懂教材,则需要学习 18030 个词语。这

也就是说,掌握 12443 个单区独用词,只能提高课文理解率的 12.8%。由此可见,三区

共用词的平均效用最大,双区共用词次之,单区独用词最小。

Page 11: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

11

2235

5587

18030

0

2000

4000

6000

8000

10000

12000

14000

16000

18000

20000

76.30% 87.20% 100%

词量

图 6 教材词汇的词量与覆盖率

综合考虑上述地域分布、使用频次,以及效用差异,我们把小学华语教材词汇分为

三级(见表 3):

等级 分布区

词量 所占比例 覆盖率

一级 三区 2235 12.4% 76.3%

二级 双区 3352 18.6% 10.9%

三级 单区 12443 69.0% 12.8%

表 3 小学教材词汇分级

一级词,2235 个,三区共用,占总词数的 12.4%,却覆盖了全部教材的 76.3%。这

是沟通海内外华人社会的基本词汇,应作为各地小学词汇教学的核心内容。

二级词,3352 个,双区共用,占总字数的 18.6%,覆盖率为 10.9%。大部分(64%)

分布于中国大陆与台湾,可看作一级词的高阶延伸与补充。

三级词,12443 个,单区独用,占教材用字总量的 69%,但覆盖率仅占 12.8%。这

主要包括了大量专有名词、成语与不同区域的特有词汇,建议根据当地的语言应用情况

慎选使用。

通过词汇分级,我们看到,世界不同华语区域的词汇其实是“大同小异”的。所谓“同”,

即是各地共用词语,数量少,频率高;所谓“异”,即是各地独用词,数量大,频率低。

正为如此,只要掌握为数不多的共用词语(5000 左右),不同区域即可进行较为顺畅的

交流。

通过词汇分级,我们也看到,全球华语三大同心圈的华语教育各具特色。比如,处

于内圈的中国大陆与台湾,华语是母语,又是第一语言,小学阶段的汉语教育属于基础

母语教育,因而,教学任务最重,词汇量要达到 10000 词,涵盖了全部的一级字、二级

字,以及本地使用的三级字。

与此相反,外圈中的华语教育是典型的对外汉语教学,对于初级水平而言,能够掌

握一级词与当地特有高频词汇,就已相当不易。

介于内圈与外圈之间的中圈, 情况则比较特殊。在这里,华语教育既不同于把华语

作为第一语言的母语教育,也不同于面向母语非汉语者的对外汉语教学,而是恰恰介于

二者之间,即“第二语言的母语教学”。因而,其教学词汇量定为 6000 个较为适宜。其

Page 12: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

12

中,一级词要求必须全部掌握,二级词和三级词则要根据当地的语言使用实际情况加以

筛选取舍。比如,某些二级词在整个教材语料库中虽然是高频词,如“主席”,在大陆教

材中出现 54 次,台湾课本中出现 5 次,但在新加坡很少用,课本中一次也未出现;相

反,三级词“胡姬花(10 次)”、“巴刹(9 次)”在整个语料库中属于低频词,但在新加

坡却是高频词,分别名列第 10 和第 20 位。这样,新加坡的课文编写就应该把它们吸收

进来。

六、结语

本文对世界上主要华语区域——中国大陆、台湾、新加坡的现行小学语文教材词汇

作了定量分析与比较,结果发现:

(1) 各地教材词汇在流通地域与使用频率上都是极不均衡的,但二者之间存在着正

相关性。流通地域宽广的字,使用频率也更高。

(2) 三地教材词汇各有差异,“共用词”虽然数量不多,仅占词汇总量的 31%,但覆

盖率占绝对优势,高达 87%以上。

(3) 根据词汇的地域与频度差异,教材词汇可以分为三级,分别对应于全球华语三

大同心圈的不同位置。世界不同区域的华语教育既要“趋大同”,又要允许“存小

异”。

类型 全球华语 区域 汉语

是母语

汉语

是第一语言

词汇量 汉字

等级

母 语 语

文教学

内圈 中国大陆、

台湾

+ + 10000 一级词

二级词

三级词

(本地通用)

海 外 华

语教学

中圈 海外华人区 + - 6000

一级词

二级词

(本地通用)

三级词

(本地通用)

对 外 汉

语教学

外圈 非华人地区 ― ― 3000 一级词

三级词

(本地通用)

表 4 全球华语三大同心圈与华语教育

参考文献:

Gramley, Stephan, The vocabulary of world English. London: Arnold, 2001.

Kachru, B.B. (1984) World Englishes and the taching of English to non-native speakers,

contexts, attitudes, and concerns. TESOL Newsletter 18: 25-6.

_____(1989) Teaching World Englishes. Indian Journal of Applied Linguistics 15: 85-95.

Lu, Yuanwen. A corpus-based study of lexical behaviour in Chinese learner English. Thesis

(Ph.D.)--Dept. of English Language & Literature, National University of Singapore,

Page 13: 从两岸三地教材词汇差异看海外华语教育 - National …ap4.fas.nus.edu.sg/fass/chswh/Quantitative Analysis on...① 新加坡小学华语课本分作两类:(1)高级华文;(2)普通华文。前者是培养华文精英的,只有极少数优

13

2002.

McEnery, Tony, Corpus Linguistics An Introduction. Edinburgh: Edinburgh University Press,

2001

Ooi, Vincent Beng Yeow. Computer corpus lexicography. Edinburgh: Edinburgh University

Press, 1998.

Schmitt, Norbert. Vocabulary in language teaching. New York: Cambridge University Press,

2000.

郭熙,“海外华语教学研究的现状与展望”,《世界汉语教学》(北京)2006 年第 1 期

郭熙,“海外华人社会中汉语(华语)教学的若干问题:以新加坡为例”,《世界汉语教学》,

2004 年第 3 期

李方,“含有母语基因的非母语教学——海外华文教育管见”,《语言文字应用》(北京),

1998 年第 3 期

王惠. “新加坡华文教育的焦点之一:汉字”.《汉语教学学刊》,第 2 辑,北京大学出版社,2006: 242-255.

吴英成,“全球华语的崛起与挑战”,《语文建设通讯》(香港)2003 年 2 月第 73 期

周清海,“新加坡华语和普通话的差异与处理差异的对策”,《联合早报》(新加坡)2006

年 3 月 24 日