本
文
摘
要
微信号:fish_craft 转载已获许可 原标题:语言的进化 一、单词的由来 语言并不神秘。它的本质就是事件与发音之间的对应关系。在人类开口说话之前,各种各样的动物语言早就已经无处不在了。 假如有一只鸟,在面临危险时总是发出“咕咕”声,在发现食物时总是发出“啾啾”声,而在求偶时总是发出“喳喳”声。只要这种对应关系是确定的,那么在广义上,我们就可以说这是鸟儿的语言。 可能有人不同意这个定义。历来有一种观点,认为人类与动物之间存在着一条语言鸿沟。人类拥有发达的语言系统,而动物则一点儿也没有。 在这些人看来,鸟类在不同情况下的鸣叫,只是与瞳孔放大或口水分泌一样的自然发应。所以要承认它是语言,必须还要证明它有主动地把信息传递给同伴的作用。 研究证明,非洲的长尾黑鄂猴,至少可以用固定的10种声音来表达10种意思。科学家用重播录音的方法证明来其有效性。播放“鹰来了”,猴子们会下树。播放“豹来了”,猴子们会上树。播放“高级成员”,猴王及其亲属会往喇叭方向看。播放“低级成员”,其它的猴子会向喇叭方向看。 这样看来,即使按照狭义的标准,我们也不得不承认长尾黑鄂猴拥有语言。不过动物语言的发展水平到此为止。后续的发展就必须建立在人类的智慧水平上了。 现在我们可以设想一下,如果用长尾黑鄂猴的语言来表达更多的信息,其结果大致是这样的: 老虎来了,发A声。 老虎走了,发B声。 狮子来了,发C声。 狮子走了,发D声。 豹子来了,发E声。 豹子走了,发F声…… 如果猛兽的种类和行为再多一些,很快发音就不够用了。当然,发音“不够用”是一个相对问题。理论上只要增加音节,发音总量是可以无限增加的。“啊呀”,“啊呀啊”,“啊啊啊呀”,“呀呀啊啊啊”…… 但是,使用更长音节的代价是,语言的构造和学习更加困难,表达效率也更低下。可能你一大段话还没喊完,老虎已经扑到面前了。所以语言进化的历史,就是人类千方百计,不断提升发音表达效率的历史。 那么,现在的问题就变成了要怎样去节约发音。人类的智慧高于其它动物,所以他们能够分析这些事件的内涵联系。 他们发现“老虎来了”和“老虎走了”有一个共同点,说的都是“老虎”在做动作。而“狮子来了”和“豹子来了”也有一个共同点,说的都是一种猛兽“来了”。 把这些事件的内涵共同点提取出来,就成了单词。前一个就是名词“老虎”,后一个就是动词“来了”。 单词的发明是人类语言脱离动物语言的一大飞跃。只要命名了N种动物,以及这些动物的M种行为,就可以用N+M种发音来对应N*M种事件。 比如在上面那个例子当中,一共有“老虎”、“狮子”、“豹子”3种动物,N=3,每种动物有“来了”和“走了”2种行为,M=2,那么只需要N+M=5个单词,就可以表达N*M=6种情况,5比6节约了17%的发音。 不要小看这17%,需要表达的内容越多,使用单词带来的效率提升就越大。如果N=100,M=20,N+M=120,N*M=2000,那么单词系统对发音的节约就达到了94%。这个数字已经很惊人了吧。实际上,人类语言所能表达的事物又何止千万呢。 反过来说,如果没有那么多东西需要表达,那么N和M的数值就都很小。这时候使用单词带来的效率提高就不是很明显,也许单词系统就不会产生。 原始爱斯基摩语就是一种没有单词系统的语言。所有意思都是直接用一组超长音节来表示的。比如“我们走”就是pisuktugut,“带着狗走”就是qinmiqtuqtuq,诸如此类。 估计是北极的环境过于单调,需要表达的意思太少。所以以前的爱斯基摩人宁可直接运用复杂但是现成的句子,也不愿意去区分什么单词组合。 在语言学上,像这类没有单词系统的语言被称为“抱合语”。 二、单词的屈折 如果把语言的进化比作万里长征,那么单词的出现只是迈出了第一步。接下来的演绎又将如何呢?我们现在来看这样2个事件: A:武松杀死了老虎。 B:武松被老虎杀死了。 首先,还是按照单词由来的逻辑,把这几个事件的内涵共同点提取出来。那么很 *** 个单词就出现了:“武松”、“老虎”、“死了”。 但是这里存在一个很大的问题。你想象一下,如果有一个原始人,他可不懂什么语法,就在那儿变着法儿呼喊着这3个单词: X:“老虎”“死了”“武松”。 Y:“武松”“老虎”“死了”。 Z:“死了”“老虎”“武松”。 …… 你会怎么理解?到底是武松打虎,还是虎打武松?鬼才知道。 这时候,最简单的办法就是告诉这个原始人,谁活着,谁就是“牛B”,谁死了谁就是“弱B”。然后原始人就重新开始喊了: X:“弱B老虎”“死了”“牛B武松”。 Y:“牛B武松”“弱B老虎”“死了”。 Z:“死了”“弱B老虎”“牛B武松”。 …… 这一回我们终于懂了。虽然听起来还是有点儿费力,但是意思很明确,肯定是武松打死了老虎,而不可能是反过来。 总结起来,我们就是在“武松”和“老虎”这两个单词上附加一些变化。当它处于主动地位时,就附加上“牛B”的发音。当它处于被动地位时,就附加上“弱B”的发音。前者就叫做名词的“主格”,后者就叫做名词的“宾格”。 当然,除了名词可以有格的变化,其它单词也可以有各种形态变化。在语言学上,单词的形态变化被称为“屈折”。进化到屈折这一步的语言,被称为“屈折语”。 “屈折语”家族比“抱合语”大得多。拉丁语是其中比较典型的一种。我们来看一个拉丁语的例子(灰字可略过)。 在拉丁语中,父亲实施动作时称为pater(主格),父亲接受动作时称为patrem(宾格),儿子实施动作时称为filius(主格),儿子接受动作时称为filium(宾格),动词我们这里只举一个例子amat,意思是爱。 如果把父亲的“主格”和儿子的“宾格”放在一起,3个单词任意排列组合,得到的6句话都是一个意思,即父亲爱儿子。 如果把儿子的“主格”和父亲的“宾格”放在一起,得到的6句话就都是儿子爱父亲(灰字可略过)。 父亲爱儿子 儿子爱父亲 Pater amat filium. Filius patrem amat. Pater filium amat. Filius amat patrem. Filium amat pater. Patrem amat filius. Filium pater amat. Patrem filius amat. Amat pater filium. Amat patrem filius. Amat filium pater. Amat filius patrem. 在拉丁语中,所有的信息都通过词汇的屈折来表达。句式结构不传递任何信息。但是很明显,每个句子中的主宾结构都是对应的,父亲为“主格”等于已经说明儿子为“宾格”,反之亦然。 所以2个单词同时进行屈折的结果是,要么屈折相互匹配,则总有1条信息是冗余的,要么屈折不能相互匹配,则全句的意思无法理解。 拉丁语的这种特性是比较原始的,但也不无好处。因为拉丁语的使用环境比较混乱,前承波斯语、希腊语,后启罗曼语、日耳曼语。各种语言相互借词,拼读极易混乱。 这时候,多处屈折可以相互验证,冗余信息起到复查的作用。一旦发现屈折不匹配,读者就可以警觉起来,回头去考证这句话到底哪里出了问题,而不会轻易地误解误信。 凯撒大帝那句著名的口号“Veni!Vidi!Vici!”,意思是“我来了!我看见了!我征服了!”。 这3个单词,从外形上看极为简洁,但内涵其实相当繁复,因为每个词都采用相同的屈折,等于是把“直陈语气+主动语态+第一人称单数+过去时态……”的信息重复了3遍。 为什么这样说?请看后续的分析。 三、从屈折到黏着 人类对事件进行分析,发明了单词。人们又对单词进行分析,发明了屈折。下一步,很自然地是对屈折进行分析了。 拉丁语的屈折是极其丰富的,它有6种时态,6种人称,3种语气和3种语态。比如上面提到过的amat,它是表达“爱”这个意思的现在时形态+第三人称单数+直陈语气+主动语态。 区区4个字母,表达出这么多层意思,好像很简洁。但是这种简洁是有代价的。 我们把amat的屈折不完全列表如下(灰字可略过): 直陈式主动语态 现在时 过去进行时 将来时 现在完成时 过去完成时 将来完成时 第一人称单数 amō amabam amabō amī ameram amerō 第二人称单数 amas amabās amabis amistī amerās ameris 第三人称单数 amat amabat amabit amit amerat amerit 第一人称复数 amamus amabāmus amabimus amimus amerāmus amerimus 第二人称复数 amatis amabātis amabitis amaistis amerātis ameritis 第三人称复数 amant amabant amabunt amērunt amerant amerint 还有: 直陈式被动语态 现在时 过去进行时 将来时 现在完成时 过去完成时 将来完成时 第一人称单数 amar amabar amabor amatus amatus amatus 第二人称单数 amaris amabāris amaberis amatus amatus amatus 第三人称单数 amatur amabātur amatus amatus amatus 第一人称复数 amur amabāmur amabimur amavī amavī amavī 第二人称复数 amaminī amabāminī amabiminī amavī amavī amavī 第三人称复数 amantur amabantur amabuntur amavī amavī amavī 还有……算了。 以上洋洋洒洒,竟然还只是1个动词的变化。是不是很有点触目惊心的感觉?难怪在中世纪欧洲,凡是能够掌握拉丁语的都可以算是大学问家。拉丁语如此,其它“屈折语”也都有类似的问题。 不过一门语言存在的意义,绝不能仅仅是供少数精英秀智商之用。一方面,人类语言需要表达的意思确实越来越复杂,要求越来越精细。另一方面,人类的记忆力极限又要求词汇屈折的复杂度又不能无限增加。在这种情况下,“屈折语”已经走进了死胡同,人类语言的进化必须得另辟蹊径。 如何另辟蹊径?我们还是举一个例子来说明。为方便起见,我们只看3种时态:现在时,过去时和将来时,以及2种语态:主动和被动。 拉丁语相关的语法规则如下(灰字可略过): 规则1:动词-t结尾改为-erat结尾,表示过去时态。 规则2:动词附加后缀ur,表示被动语态。 规则3:动词-t结尾改为-bit结尾,表示将来时态。 规则4:动词附加后缀us,表示过去时+被动语态。 规则5:动词-t结尾改为-bitur结尾,表示将来时+被动语态。 结果如下表: 现在时 过去时 将来时 主动 amat amerat amabit 被动 amatur amatus amabitur 对应6种不同的情况,拉丁语就指定了6种屈折,形态各自完全不同。上面那些庞大的表格就是这样产生的。作为对照,我们再来看英语是怎么处理这些时态语态的(灰字可略过): 规则1:动词附加后缀ed,表示过去时态,其中was是be的过去式。 规则2:动词之前增加will,表示将来时。 规则3:动词之前增加be动词,表示被动语态。 这样处理的结果就是: 现在时 过去时 将来时 主动 love loved will love 被动 be loved was loved will be loved 英语的规则和结果都明显比拉丁语简洁。这里面关键的一点,就是英语用前后缀的方法,实现了屈折的“可叠加”。 英语的规则1和规则3的叠加,代替了拉丁语中的规则4。英语的规则2和规则3叠加,代替了拉丁语中的规则5。 在这里,N+M式的节约效应再一次出现。对应3种时态和2种语态,拉丁语设置了2*3=6种屈折。英语则设置了3种时态前后缀和2种语态前后缀。 因为前后缀之间可以相互叠加,所以这2+3=5种前后缀就可以把拉丁语的6种屈折全都表达出来。而且正如前面已经指出过的,N和M的数字越大,节约效应就越强。 把屈折的规律提取出来,设置为前后缀,运用时就像是黏着在词根上一样,还可以相互叠加。采用这种语法的语言称为“黏着语”。 用“前后缀组合”的方式表达屈折,相比于对应每一种情况分别设定,显然大大提高了效率,更有条理,从而也更容易理解。 人类语言的进化,至此又进一步。 四、英语的分析化 相比于拉丁语,英语实现了大量的黏着化,提高了效率。但是英语也保留了许多特殊的屈折方式,并没有完全进化成“黏着语”。 比如所有名词都没有主、宾格了,就剩下“你、我、他”3个代词还有。所有的动词都没有人称变化了,偏偏第三人称单数还有。 倒是像日本、土耳其这样的新兴民族国家,借着近代化的浪潮改革语言。一步到位实现了完全的黏着化。其实这也容易理解,城市里最光鲜的建筑一定是新造的,百年老店再怎么改建也不可能脱胎换骨。 我们在前面已经阐明,语言进化的动力来自N+M的节约效应。屈折形式越多,N和M的数值越大,节约效果就越明显。 拉丁语的屈折多如牛毛,实行黏着化的潜在收益很大。但是英语的名词已经基本没有格,语态只剩下2种,时态也基本黏着化了。所以英语进一步实行完全黏着化的收益并不明显。 如果英语不去朝着黏着化去发展,难道就在原地踏步吗?不太可能。近代以来,英语承载着最沉重也最精密的人类思想交流,它当然在发展。只不过它不再是利用“黏着化”来提高效率,而是走上了“分析化”的道路。 我们先来看几个英语“分析化”的例子。 还记得拉丁语那6句话1个意思的“父亲爱儿子”么?在英语里,它只有:father loves son这一种说法。谓语loves前面的就是主语,后面的就是宾语。把语句的顺序定死,主格和宾格的屈折直接就省掉了,连黏着化也用不着。 再来看猫的尾巴,古典的表达应该是cats tail,但是在实践中直接称cat tail即可。因为只能是猫有尾巴,不可能是尾巴有猫,名词直接当形容词用,在这里属格也省了。 同理,size of the shoe,通常只说shoe size就可以了,肯定没人会理解错。 不仅英语单词的屈折可以变化,连句子成份也可以参与变化。比如let it go是个句子,但如果把it省略变成let go,就可以当动词使用。 再比如2个介词应该不能连续使用,但是go on这个词组通常被视为一个单词,于是go on to do也能够成立了。 这样的例子还能举出很多很多。甚至汉语中的“好久不见”,也被借入到英语,成了long time no see,完全无语法可言,但是简洁又形象。 我们之前所说的语言进化,都是从单词到屈折,再从屈折到黏着。而所谓“分析化”,说白了,就是跳出这条进化路径。 既不要黏着,也不要屈折,直接把单词“拼接”在一起。不讲究什么语法逻辑。只要大家都认,就行。 英语的“分析化”,其实是英国国势变迁的一个结果。随着英国成为日不落帝国,英语成为了国际通用语言,越来越多的外国人,在世界的各个角落里,使用着带有他们母语风格的或者干脆是临时创造的英语。 这个过程极大地丰富了英语的表达方法。而这些“创造”中能够留存下来,得到大家公认的,通常就是那些最简洁的表达。 所以“分析化”的本质就是用经验代替规则。而它的根本追求就是一条:更高的效率。 在印欧语系的各种语言中,英语的“分析化”程度是最高的,语法特例也是最多的。曾经有一个语言学的笑话,说的是欧洲大陆的各国语言群起而挖苦英语。 西班牙语嘲笑英语读音乱。因为西语的发音与拼写一一对应,单词本身就是音标。德语嘲笑英语拼写乱。因为德语的拼写非常规则,每个音节都很清楚。法语嘲笑英语语法乱,因为法语的语法既精确又严密,绝不允许擅越雷池半步。 不过,无论欧陆语言笑得多么开心。稳坐世界通用语宝座的语言始终是英语,而不是它们。 因为英语“分析化”背后的思路就是允许习惯大于语法,依赖实践经验而不是顶层设计。只要不影响理解,又可以提高效率,任何改进都可以接受。也只有这样,才能够达到“兼收并蓄,海纳百川”的境界。也只有这样,才能与它世界通用语的地位相匹配。 在宏观上,“分析化”的思路与英美法系的判例法思想是相通的。英语国家自下而上地积累判例,欧陆国家自上而下地推行法典。 前者处在科技、社会、文化的领先位置,最优先的追求是灵活和创造。后者始终处在追赶者的位置,有机会去总结和学习,因而可以追求逻辑上的精美。 五、大道至简 “黏着化”,从屈折发展而来,自上而下,逻辑一脉相承,就是有点儿“不接地气”。 “分析化”,建立在使用者的经验和共识之上,自上而上,简洁有效率,但是又显得缺乏章法。 这两者到底哪一种才是人类语言进化的最终方向?千百年来,语言学的研究汗牛充栋,却没争出个所以然来。下面我们换个视角,看看IT技术的发展能不能给我们一点儿启发。 现代科学家们曾经长期致力于机器翻译领域,希望能够让电脑“读懂”人类语言。一开始他们尝试以单词为砖头,语法为图纸,像建造大楼一样,一砖一瓦地去建立理解。但是很快他们发现这种运算的复杂度接近无穷大。 因为语言的理解,首先是建立在对现实世界的理解上的。就像前面那个“猫有尾巴”还是“尾巴有猫”的例子。用不着在语法里作相关规定,作者在说话的时候,已经假设读者具备关于现实世界的基本常识。 其次,理解也是建立在语篇和语境上的。比如一长段话最后来一句“怎么样”,跟先来一句“怎么样”后面接一长段话,完全是两个效果。也可能某句话单独拿出来的话,缺主语缺谓语,完全不能理解。但是跟其它句子放在一起就又能理解了。 最后,理解还是建立阅读者的体验上的。同样的一个“好”字,只说1遍是这个意思,但是连续重复3遍可能就成了另一个意思了。 一大群世界顶尖的科学家们前前后后努力了几十年,最后终于认输投降,承认从语法出发,“顶层设计”一套机器翻译算法是不可能的。那么后来他们是怎么解决问题的呢? 他们运用统计方法。或者直白地说,用“猜”的办法。先收集海量已经翻译好的文本,比如文件、记录、书籍,等等。然后让电脑做统计分析。 比如某一句话,在过去出现过的2000次翻译中,有1200次被翻译成A,只有300次被翻译成B,500次翻译成其它各种内容。那么电脑就会把它翻译成A。 事实证明,人类的语言太过丰富,试图用一套语法规则去构建它,无异于用水斗测量大海。倒是根据经验“猜”意思的办法,反而更接近人类语言的真相。 凭借经验,突破规则,直接把意思拼接在一起,只要能理解就好。这些不正是“分析化”的特征吗? 那么,是否存在一种语言,完全没有语法,纯粹凭借经验,彻底地“分析化”呢? 当今世界,完全没有语法的语言恐怕没有。不过倒真有一种语言,曾经被20世纪初的某些欧洲语言学家断言为 “没有语法”。那就是我们的汉语。 把任何一篇用汉语写成的文章拿出来,只要瞥一眼那些方块字,就知道汉语不包含任何单词的屈折。再仔细一看,汉语简直是语法特例大全。 英语的“it is raining”,汉语说“下雨了”,主语被省掉了。英语的“today is Monday”,汉语说“今天星期一”,谓语被省掉了。英语的“regard it as”,汉语说“视为”,宾语被省掉了。其它如“唯马首是瞻”、“大胜敌军,大败敌军”之类的奇葩表达,更是层出不穷。 在语言学分类上,爱斯基摩语被称为“抱合语”。拉丁语被称为“屈折语”。土耳其语被称为“黏着语”。英语介于“屈折语”和“黏着语”之间,并且有一定“分析化”。而汉语则被称为“分析语”。 要评判一门语言的优劣很难,因为涉及太多主观因素。但要是说简洁,那么汉语可谓当仁不让。 联合国的标准文件,汉译本总是最薄的。国际会议的多语同声传译,汉语总是最先结束的。就连背诵九九乘法表,中国儿童也占尽优势。 现代IT技术采用统一的数学算法,对语言文本进行压缩。结果发现在世界主要语言中,汉语的压缩效果是最差的。 最难压缩,换句话说,就是冗余最少。如果以“熵”来表示压缩的难度,法语大约是3.98,西班牙语4.01,英语4.03,而中文高达9.65。 六、输入法 在前智能机时代,中国人对手机短信的酷爱是出了名的。2002年,美国全国手机用户发送短信息的总数为81亿条。2004年中国的手机保有量与美国2002年的数字相去不远。但是仅在当年春节7天长假期间,中国人就发送了70亿条短信。 关于中国人爱发短信的解释有很多,从技术到文化,不一而足。我们在这里暂且不做深究。但是在1980到90年代,“汉语无法进入电脑时代”的断言曾经一度甚嚣尘上。这是怎么回事呢? 电脑键盘是为英语设计的,理论上其它任何语言要输入电脑,都需要输入法。但是对于大多数的字母语言来说,这不是难事。只要把自己的字母和英语字母对应起来就行。 近代以来,每个汉字都有了对应的拼音。拼音可以很方便地输入电脑。考虑到汉语原本就简洁,所以即使每个汉字用一串2-6个字符来表示,其效率也还可以接受。 汉语输入法的真正困难,在于处理大量的同音异义字。输入完一串拼音字符,还要再从几个甚至十几个备选字中挑出那个你想要的。多出来的这一步工作,既费时,又费眼,还打断思路。这个困难对当时的汉语输入法来说,简直是泰山压顶。各种悲观绝望的论调,大多由此而来。 汉语输入法的最终破局,还是依赖于前文提到过的统计方法,也就是用历史经验“猜”内容的“联想”输入技术。 编写输入法软件的程序员首先收集海量的文本,然后统计出某一个发音对应哪个字是最常见的,某几个发音对应哪个词组是最常见的,甚至一个词汇输入之后,后面最可能跟上的是哪个词。然后程序员就根据这些统计结果,去设定“联想输入”的规则。越是常见的字或词,在选择界面里的排名就越靠前。 大家可能都有这样的经验。在输入不常见的人名或者地名,或者其它任何不能“联想”的内容时,汉语输入效率非常低。但如果输入的是常见内容,那就可以利用“联想”功能,按词、按词组输入,于是效率大大提高。而如果输入的是成语、歇后语和常用对话定式时,几个字符就能“联想”出一长段文字,简直是吐字如飞。 其实字母语言的输入法,也有一些已经具备了“联想输入”的功能。但是这些语言的运用,不是把意思直接“拼接”在一起就可以了,而是要受到许多语法“条条框框”的约束。 比如英语里,在句子起首输入一个单词it,那么按照“经验”,后面紧跟一个be动词的可能性极大。但是软件不知道你这句话是什么时态,于是得把is,was,will be全都列出来供你选择,这无疑就降低了效率。 与30年前相比,汉语输入效率的提高,简直像火箭发射一般迅速。而字母语言的输入效率,基本上还在原地踏步。今天,或许只有在输入个别单词时,字母语言还能占到一些优势。一旦进行词组、整句的输入,恐怕没有一种语言的输入效率能够望汉语之项背。 从过去30年汉语输入法的发展历程,我们或许可以窥视一个典型的语言进化过程。 为什么当年汉语输入法的效率那么低?因为汉语没有语法的约束,好像一个字后面跟任何一个字都是可以的。什么都有可能,什么可能性都要考虑,效率自然下来了。 为什么汉语输入法的效率能够提高?凭借“经验”。所有的“经验”,包括上下文、现实约束、习惯、语境等一切要素,都可以帮助排除冗余的可能性,提高效率。而且直到今天,汉语的输入效率还在持续不断的提高当中。 为什么汉语输入法的效率今天已经能够超过字母语言?原因可能有不少,但是至少有一条。因为没有语法的约束,所以“联想”功能可以独当大局,让“经验”的威力可以不受限制地充分发挥。 对于“屈折-黏着”语来说,在语言发展的低级阶段,语法可以起到规范和支撑语言发展的作用。但是在语言发展的高级阶段,语法又会成为提高表达效率的障碍。可谓成也语法,败也语法。 但是对于“分析语”来说,正因为从一开始就不依赖语法,自然后来也会不为其所缚。《道德经》有云:“大象无形,大音希声”,莫不与此意暗合? 七、得失相依 在语法不断进化的同时,词汇也在进化。 人类喉咙的构造决定了,发音是一种有限的资源,尤其是简短和响亮的发音。前者方便使用,后者方便识别。 为了保持语言的效率,优质的发音必须被用来表达那些重要的内容。所以词汇的进化,实际上就是对发音资源的优化分配。 近代以来,人类语言中的大量新生内容都产自英语。我们就先来看看它是怎样平衡发音资源的。 比如board这个发音,它的原意是甲板,使用频率不算高,但它又被引申为董事会,成了一个重要的当代词汇。 再比如tank这个发音,它的原意是水槽,比较生僻,但它的另一个意思:坦克,则是个热门词汇。 以上两个例子,一个是潜移默化,一个是有意为之。但结果都是一样的,优质发音被赋予了新的含义,从而延续了它的活力。 随着科技文化的爆炸式发展,词汇的进化也有加速的趋势,比如web(渔网、网络),hedge(篱笆、对冲),cloud(云彩、计算云)等等。这些发音都很简短响亮,但也正因为如此,它们早早就被原意“占用”了。 可以设想,如果没有一种腾笼换鸟式的进化,只是按部就班地去构词。那么这些人类文化中的“后来者”,它们的发音要么很长,要么很怪,肯定无法与它们的重要性相匹配。 旧词新用虽然提高了效率,但是单词的新旧意思之间就有可能出现冲突。到底是哪个意思,必须结合上下文去理解。 这时如果能有一套表意符号,标示这个是科技新词,那个是金融新词,但是又不影响发音,是不是更加完美呢? 截止目前,英语里还没有出现这种情形。不过汉语里的形声字早已存在几千年了。 在汉语中,词汇的进化特别充分。汉字中80%都是形声字,几乎每一个发音资源都被反复使用,极度“榨取”其价值。因此同音异义字的情况极为普遍。说到这里,奇文《施氏食狮史》不得不提,请看如下: 石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮。食时,始识是十狮,实十石狮尸。试释是事。 虽然不好读,但是这样的文章能写出来。放眼世界,唯有汉语。不过这种奇文也只是特例,还算不得汉语特征的真正代表。要说对发音运用的最高境界,应该是那数以十万计的古典诗词。 这里我们不讨论情感优美,描写细腻之类的主观感受。只需要看一下古典诗词最基本的格式要求。 五言绝句必须是4句,每句5个音节。七言律诗必须是8句,每句7个音节。多1个音节少1个音节都不行。能用这样严格的格式来表达大量复杂的意思,又是汉语一项独步全球的“绝技”。 不过,这一切并非没有成本。充分“压榨”发音资源的背后,是汉语把一个发音掰成4瓣用。这使得汉语语意的理解,极其依赖声调。声调一变,意思就会完全不同。 在日常对话中,保证声调标准还不算一件难事。但是在歌曲中,为了配合曲调,声调有时不得不变。比如在中国国歌中,“前进,前进”就必须唱成“浅金,浅金”。在流行歌曲中,耳熟能详却不解其意的例子就更多了。 古代中国人很早就意识到了这个问题。所以当时的歌曲都是与词牌相对应的。每个词牌都对字数和声调有严格的规定。只有这样,才能既配合整首曲调,又配合每个字的声调。结果就是古代歌曲填词的难度,远高于现代歌曲作词。两者就像苏东坡和周杰伦之间的区别。 汉语的现代诗词和现代歌曲,体裁格式都是从欧洲语言那里学来的。从汉语本身来看,从古典诗词到现代诗词,做诗和读诗的难度都下降了。但是从词牌歌曲到现代歌曲,作词的难度下降了,理解歌词的难度却提高了。 诗词的发达,是汉语的一得。歌曲的逊色,是汉语的一失。得失相依,安知非福?