SISU文研 | 藏品博览系列十七:小儿锦—用阿拉伯系字母书写的汉语

发布者:发布时间:2023-03-20浏览次数:103

编者按

上海外国语大学世界语言博物馆自2019年12月开馆以来,一直秉持“语汇世界,言聚全球”(Words, Worlds)的立馆理念,致力于彰显世界语言多样性,汇聚全球知识。为全面开展人文交流、科普教育和学术研究,本栏目推出“藏品博览”专题,陆续推送以世界语言多样性为主题的科普介绍,展陈世界语言多元面貌,讲述世界语言文字故事。


图片

坐标:上外世界语言博物馆第二展厅“记,书写世界”


图片

(题图从上到下依次为汉字、阿拉伯文、小儿锦)


小儿锦,又称“小经”、“小儿经”等,是以回族为代表的我国西北穆斯林群体所使用的一种书写系统,由阿拉伯-波斯字母改良而成,但记录的却是汉语兰银官话和中原官话。由于其特殊的组合,时常和中亚的东干文(用西里尔字母记录的兰银/中原官话)同时提及,作为“汉语未必要用汉字来写”的两种典例,即语言和文字没有绝对的绑定关系,用阿拉伯字母(Arabic scripts)同样也可记录汉语——阅读者只要事先熟悉所用文字的正字法系统,便可基于其直接理解文本,而不需要新学一门语言的语法和词汇。

而所谓“阿拉伯字母”,是对“阿拉伯字母”(Arabic abjad)及其所有衍生系统的统称,具体可见以下推送。尤其要注意的是,最原初的阿拉伯字母是一种辅音音位文字(abjad),一般只记录辅音字母,或用半元音字母协助表示部分元音(可称为māter lēctiōnis“阅读之母”或“元音助记字母”),但多数元音倾向于不书写;而因为汉语的元音占比更高,小儿锦要求必须写出所有元音符,所以更加接近于完整记录辅音和元音的全音位文字(alphabet)。

这只是小儿锦特征的冰山一角,可以说小儿锦是阿拉伯系中最复杂的一套形式,胜过上面推送中介绍的全部文字,因此非常有必要单独用一篇文章来详细介绍。不过由于小儿锦不存在统一的正字法,基于各地的口音而定,且书写习惯也有很大差距,本文主要基于刘迎胜《小儿锦研究》一书来介绍一些较常见的情况。


 基于元音分布的书写

谈小儿锦时不可避免地要先做一些关于阿拉伯语的铺垫。阿拉伯字母里元音的表示方式比较匮乏,受限于标准阿语只有/a, i, u/的三重音值对立(另外分长短),最基本的元音符号也只有三种,小儿锦必须充分利用这三类符号,并通过组合来扩充元音标记。与此同时,又因为阿拉伯字母所表示的辅音多于汉语,也需要对部分汉语无法区分发音的阿拉伯字母作拆分,规定作为声母时只能搭配特定韵母,在分工明确后就相当于用冗余的辅音字母来弥补欠缺的元音表达方式。

(一)声母

下面具体来说明。虽然严格来说小儿锦记录的是兰银官话或中原官话,不过因为和普通话的差异不大,所以简便起见本文通常基于普通话音系,辅音如下:

图片

(字位符号⟨ ⟩内的表示拼音)

而标准阿语的音系如下,以下所有的“阿语”均默认为标准阿语,因为小儿锦属于阿拉伯系字母下的波斯一支,而波斯语带有一定的两河阿语方言特征,之后会略有涉及。可以看出,阿语的辅音和普通话差异非常大,就算把清浊对立调整成普通话的送气对立后,仍然相去甚远。这时就要充分利用下图中红框和蓝框内的字母,前者为咽化齿/龈音,后者为咽擦音,可以说去掉之后对记录普通话毫无影响,那就应该将功能延伸到协助元音上来。

图片

注:下文中⟨ ⟩表示小儿锦及其完全按字面对应的拉丁转写,不带⟨ ⟩的则是汉语拼音。

在上图中,红框中的⟨ط⟩, ⟨ص⟩, ⟨ظ⟩(阿语/tˤ, sˤ, ðˤ/)倾向于作为声母t-、s-、z-在接合口呼(即开头元音为-u-的韵母)时所用(但⟨ض⟩/dˤ/不使用,因为波斯语里和⟨ظ⟩合并,这是两河阿语特征,本文不展开),且此时小儿锦可以不标记介音⟨u⟩或⟨w⟩,如⟨صًا⟩⟨ṣan⟩(下带点指咽化音)对应拼音suan,但“u”没有书写出,完全靠声母⟨ص⟩来表示。

这是因为咽化带来的舌根后缩”效果和[u]或[w]自带的“圆唇+舌根后缩”特点类似,所以听起来会有些像[u]或[w]。至于阿语中非咽化的/t, s, z/⟨ت⟩, ⟨س⟩, ⟨ز⟩则没有搭配韵母的限制,也自然不会内含介音,像⟨سًا⟩⟨san⟩对应拼音san,若要表suan则理论上要记作⟨سُوًا⟩⟨suwan⟩。

同时,⟨ح⟩, ⟨ع⟩(阿语/ħ, ʕ/)是h-和零声母搭配e-开头韵母时的常见情况,同样地/ħ, ʕ/与普通话/ɤ/也有舌根后缩特征。除此之外,一般的h-则记作⟨خ⟩(阿语/x/)或⟨ه⟩ /h/,一般的零声母为⟨ا⟩或⟨ء⟩(阿语中都是/ʔ/)。

另外还有些辅音字母特征需要说明。⟨پ⟩p-、⟨چ⟩ch-、⟨ک⟩k-(U+06A9)、⟨ی⟩y-(U+06CC)是波斯一支特有的字母,其中尤其要注意后两个:阿语中的⟨ك⟩/k/(U+0643)连写形式为ككك,只有在词首和词中会变成كـ,而词尾和单写时中间又内嵌套了闪电状“ک”的形态“ك”在波斯字母中没有,小儿锦也同样没有。并且,波斯一支的⟨ی⟩连写形式为ییی,在词首和词中时下面会加两点,词尾和单写时则没有;阿语的⟨ي⟩(U+064A)则始终带两点,是辅音/j/,另有一个始终不带点的⟨ى⟩(U+0649)较少用到,仅在特定的词尾表长元音/aː/。

以及,⟨ق⟩在标准阿语中为小舌音/q/,但因为标准阿语缺乏/ɡ/,所以⟨ق⟩就被小儿锦挪用为表示声母g-,以下转写时也简单记作⟨g⟩。而至于阿语和波斯语中均没有的新增字母,最常见的是⟨ڞ⟩表c-/tsʰ/,来自阿语⟨ص⟩/sˤ/上加三个点;但篇幅有限,因各地正字法有差异而出现的其它罕见字母变体便不再提及了。

(二)元音

因为阿语里只有/a, i, u/三个元音(普通话“si”的韵母/ɿ/和“shi”的韵母/ʅ/可按拼音归入/i/),像-ai、-ia、-ua、-ao、-iao(-ao就是“-au”)等韵母可以基于阿拉伯系一般规则直接推导出写法,分别为⟨ـَیْ⟩⟨ay⟩、⟨ـِیَا⟩⟨iyā⟩、⟨ـُوَا⟩⟨uwā⟩、⟨ـَوْ⟩⟨aw⟩、⟨ـِیَوْ⟩⟨iyaw⟩(横杠在阿拉伯系里表示任意辅音字母)。

而如果纯粹按听感来考虑,普通话还至少存在/e, y, ə, o, ɚ/五个音位(宽式记音,可以不区分-e、-eng的[ɤ]和-en的[ə]),如何为它们制定书写方法是小儿锦的重点——但因为体系实在较为复杂,本节的信息密度会很高

1. /y/:涉及-ü、-üe、-ün、-üan等,其实也没有什么好办法,只能同时用⟨ى⟩⟨y⟩+⟨و⟩⟨w⟩来辅助,即写作“声母带i、⟨ى⟩⟨y⟩带u、⟨و⟩⟨w⟩带i”的复杂形式⟨ـِیُوِ⟩⟨iyuwi⟩,如“绿”是⟨لِیُوِ⟩,虽然看起来像是⟨liyuwi⟩,但规定其就是lü。另外偶尔可见用⟨و⟩⟨w⟩加三点构成的新字母⟨ۋ⟩表ü。

2. /e/:涉及-ie、-üe、-ui、-ei四个韵母,后三者都能用⟨و⟩⟨w⟩或⟨ى⟩⟨j⟩辅助表示。

a) -üe其实写成了⟨-iyuwa⟩ ⟨ـِیُوَ⟩,毕竟普通话没有韵母“-üa”,从而绕过/e/的书写,如xue写作⟨ثِيُوَ⟩⟨ṯiyuwa⟩。

b) -ui处理成⟨-uwi⟩ ⟨ـُوِ⟩即可,这里又把/e/当作了/i/,如dui写作⟨دُوِ⟩⟨duwi⟩。

c) -ei略复杂一些,对于有些不能和-i-相拼的声母(如f-),因为不存在“fi”,所以用⟨فِ⟩ ⟨fi⟩表示的实则是fei。而对于能和-i-相拼的声母,则可能也用和上面相同的⟨-uwi⟩,如⟨بُوِ⟩ ⟨buwi⟩是bei。

d) 至于-ie,实在没有可绕过的方式了,于是用了类似维吾尔语的形式,把/h/在词尾的形式⟨ـه⟩视作是/e/。

这一做法要追溯到阿语阴性标志⟨ـة⟩ -at的弱化-ah,一般听上去类似于[e~ɛ],该形式进入其它阿拉伯系语言(如波斯语)时,⟨ـة⟩上的两点去掉成为⟨ـه⟩,正好和/h/的词尾形式,于是有了用辅音/h/“对应”前元音/e/或/ɛ/的传统。就像是中古英语里音节尾的/-h/⟨-gh⟩脱落后,/ih/⟨igh⟩里/i/代偿性延长为/iː/,而后变为双元音/aɪ/,于是⟨igh⟩从规则的/ih/“变成”了表/aɪ/的字母组合。

而本身在阿语里,ه的连写形式为ههه(U+0647),词尾和单写ه是个圈,词首和词中类似“8”。维吾尔文里将其拆成了两个字母,词首和词中的“8”表示辅音/h/(连写ھھھ,单写ھ,U+06BE),词尾和单写的圈则是元音/ɛ/(单写ە,只能和前面连写ـە,U+06D5)。小儿锦也利用了这种词尾形式,将-ie写作形如⟨-iyah⟩的⟨ـِيَه⟩,如⟨تِيَه⟩⟨tiyah⟩表拼音tie。

3. /ə, o, ɚ/(涉及-e、-en、-eng、-(u)o、-er五个韵母):

a) 当零声母时,发生了一种很少在其它阿拉伯系文字中见到的情况:⟨ع⟩/ʕ/和⟨غ⟩/ɣ/可协助表示元音,尤其是⟨ع⟩在多数阿拉伯系文字中仅用于照搬阿语借词的拼写,实际读音并入⟨ا⟩/ʔ/。——而在小儿锦里,⟨ع⟩也可用于表示上述五个韵母的零声母,如⟨عِی⟩⟨ʕī⟩为er。

至于⟨غ⟩,有时会和⟨ع⟩混淆,功能相同;另一些时候则还可协助表示一些带/e/或/a/的双元音韵母,如⟨زْغِ⟩⟨zġi⟩是zei,由于使用得较为系统,在《小儿锦研究》不判定为是误写,而是确实能协助表元音。

b) 而当前接声母时,本节先考虑无鼻韵尾的情况。-(u)o可用⟨و⟩⟨w⟩辅助,写作⟨-uwa⟩,如⟨قُوَ⟩ ⟨guwa⟩为guo。接-e时则情况较多样,可以在辅音上标“静符”(形如一个圈,在阿语里表示辅音不带元音),比如⟨دْ⟩⟨d⟩表de,看起来就是“没有元音”;也能标⟨a⟩(而普通话的-a要用长⟨ā⟩ ⟨ـا⟩表示),可对比⟨جَ⟩⟨ǧa⟩ zhe和⟨جَا⟩⟨ǧā⟩ zha。

(三)鼻韵尾

上面先介绍了无鼻韵尾的情况,在正式进入鼻韵尾部分之前,需要先说明一点,阿语里本身支持an, in, un三种鼻音符,分别写作⟨ـًا⟩(一般根据阿语正字法加个⟨ا⟩,但单纯的⟨ـً⟩也会用)、⟨ـٍ⟩、⟨ـٌ⟩,其实是把a, i, u短元音符⟨ـَ⟩、⟨ـِ⟩、⟨ـُ⟩写了两遍构成,后面的-n是名词的泛指后缀,只能出现在名词词尾。

铺垫完毕,如果按照普通话的韵母体系来看,就会发生一个问题——阿拉伯系字母不支持区分前后鼻音,似乎需要额外再增设一套鼻韵尾表示系统。不过根据《汉语方言地图集》,尤其在兰州和西宁一带的方言里发生了-n和-ŋ尾的合并,比如“小儿锦”这个名字本身就是“小”的变体,所以反而通常并不需要区分两组鼻韵尾。

如果一定要区分,后鼻音可以像阿语习惯一样在结尾带⟨غ⟩/ɣ/(毕竟标准阿语没有/ɡ/,这是和/ŋ/最接近的发音,且⟨غ⟩在上文提到协助表元音以外出现了第二项特殊功),或是借用维吾尔语的⟨ڭ⟩/ŋ/。《小儿锦研究》中指出,根据发现的明朝中期文献,在当时基本都会区分后鼻音,只是后来一般会合并,但一些有重要学术地位的阿訇在书写时仍会标记后鼻音。而-an和-ang有另一种方式区分,-an写作正常的鼻音⟨ـًا⟩,而-ang写成长音⟨ـا⟩ ⟨ā⟩加⟨نْ⟩ ⟨n⟩,如⟨بًا⟩ ban与⟨بَانْ⟩ bang不同。

另外值得一提的是-en(g),因为其元音/ə/在阿语中不存在,所以并入已有鼻音符/in, un/中的哪一种是个问题。不过好在除了b, p, m三个唇音声母以外,其它声母要不接-in、要不接-en,分布上是互补的,把-en也用阿拉伯系的⟨in⟩来记即可,如⟨قٍ⟩ ⟨gin⟩就是gen。至于b, p, m,则-in用⟨in⟩、-en用⟨un⟩,因为唇音不接-u-,那么有⟨بٍ⟩ ⟨bin⟩ bin和⟨بٌ⟩ ⟨bun⟩ ben。同理,-eng也是一般并入-ing(但t, d, n, l声母后同时可接-ing或-eng,这时就无法区分),唇音声母后则可能并入-ong。

总而言之,其实写了那么多,一个关键点在于掌握音节组配的分布规律有不少声母和韵母是不能搭配在一起的,所以就充分利用这些规律,避免新增太多元音符。然而缺点也很明显——拼读规则实在是太复杂,掌握难度很大。


 启用同音字母

在上文介绍⟨ع⟩/ʕ/增加协助表元音的功能时,就提到了这个字母在其它多数阿拉伯系语言中,仅用于“照搬阿语借词的拼写”,实际就读作/ʔ/,和⟨ا⟩相同。这一章在开始介绍小儿锦之前,以巴基斯坦的官方语言乌尔都语为例做一点详细的铺垫。

乌尔都语属于印欧语系印度语群,辅音数量较多,但和阿语丰富的辅音音位却是错开的(简洁起见仅截取字母表的一部分):阿语能区分的咽化齿/龈音、齿擦音、咽擦音等在乌尔都语里并不能分(红框),仅用于照搬拼写,毕竟用阿语书写的伊斯兰教经典是阿拉伯系字母传播的基石,需要尽量保留借词的原本形式。而相对地,乌尔都语里卷舌音等在阿语里也不存在(蓝框),且由于蓝框字母众多,导致乌尔都字母表非常庞大——似乎可以适当赋予那些红框字母新的功能,这就是小儿锦的思路。

图片

小儿锦做了一些微调——比如阿语/θ/⟨ث⟩,波斯语里和/s/⟨س⟩在语音形式上合并,只区分拼写;而小儿锦则将⟨ث⟩改造为表示拼音x /ɕ/,之前用到xue ⟨ثِيُوَ⟩的例子便是如此。另外因为各地小儿锦的正字法有出入,也有移用/tˤ/⟨ط⟩表/t͡s/(拼音z)等。

其实类比一下传播最广泛的拉丁系字母,因为存在c, q, x三个“角色多余”的字母,于是在各语言中经常会用这三者来表示和拉丁语本身相去甚远的音,这就意外地增强了拉丁系字母的兼容能力。尤其是⟨x⟩,许多拉丁系字母语言会用⟨x⟩表示前部擦音/s, ɕ, ʃ/或后部擦音/x, χ/(和西班牙语、葡萄牙语等伊比利亚罗曼语的语音史相关,常见于伊比利亚和前西/葡殖民地),甚至还有奥罗莫语(埃塞俄比亚)的挤喉音/tʼ/、南部班图语(非洲南部)的边搭嘴音/ǁ/、皮拉罕语(巴西)的喉塞音/ʔ/等等。

可以设想一下,如果阿拉伯系真的突破了和伊斯兰教的绑定,成为了一种像拉丁字母一样普适的通用文字,那或许上面那些“照搬拼写”的红框字母也将发挥出更加丰富的作用。


 汉字补充阿拉伯系

从这里开始,汉语的特点在小儿锦上反映得更加强烈。在阿拉伯系字母传播的过程中,绝大多数新造字母都是在原有“底座”的基础之上按一定规律附加新的成分(一般是加点),如波斯语的⟨چ⟩/t͡ʃ/来自阿语⟨ج⟩/d͡ʒ/加两个点构成,乌尔都语的卷舌⟨ڈ⟩/ɖ/由⟨د⟩/d/上加四个点后连写构成。在阿语基础版字母以外,新的底座基本只有⟨ے⟩(乌尔都语等的/e(ː)/)和⟨ڪ⟩(巴基斯坦信德语/k/)两个,然而事实上还有第三个——小儿锦中来自汉字的⟨七⟩,表示拼音q /t͡ɕʰ/,如⟨يَآن七⟩“墙”,比起之前提到的⟨ڞ⟩ c-是更加独特的创新。按照《小儿锦研究》中的记法,可以把阿拉伯系的⟨七⟩拉丁化为⟨ɋ⟩(U+024B),那么前面的“墙”就转写为⟨ɋyān⟩。

不过在书中也承认,这一做法只能追溯到李殿君一位的资料,但因为使用频率相当高,作者推测必有师承,可能曾经在某些地区也是一种流行的做法。而除此以外,一般来说声母q-和k-同用⟨ک⟩,若要区分,则在表k-的⟨ک⟩上再加静符的圈,如下所示:

图片


 叠音符表重复音节

“叠音符”(تشديد,tašdīd)是下图中圈出来的波浪线。原本在阿语里,辅音存在长短之别,但长辅音并不是把一个字母写两遍,而是只靠上面的叠音符来表示。

但是在小儿锦里,叠音符重复的却不单单是一个辅音,而是整个音节,非常类似于汉字的省字号“々”。比如这句“人人生而自由”里,“人”只写了一遍,靠上面的叠音符来表示重复。

图片


 训   读

在本文最后,来到小儿锦在阿拉伯系里最特殊的一点——训读,或许只有和汉语这种长期使用意音文字的语言交融时才会产生。训读指的是用一种语言的书面形式记录,但其语音形式却是一种语言,只是两者同义。这在日语里很常见,比如用汉字“山”去记录本土词やまyama,两者同义,但语音形式截然不同

在小儿锦这里,比如تمام“全”由阿语借入波斯语再传到小儿锦,但不应该按阿语/波斯语的读法tamām,而是就读成quán。这种训读词可以和纯记音的“音读词”混合出现,比如⟨چِغ تمام⟩“成全”,前一个是音读⟨či(n)ġ⟩,后一个则是训读。

不仅如此,训读可以只发生在一个音节的一部分里,而剩余部分还是音读,比如ماه māh是波斯语“月”,而当小儿锦要表示“靴”时,因为“靴”的韵母是“月”,所以韵母部分沿用训读⟨ماه⟩,而声母部分再套⟨هِ⟩/hi-/上去,于是⟨هِ ماه⟩成了“靴”。

甚至,训读不仅仅发生在同义语素中,与其只是恰巧同音的语素也可能会训读。继续用上面提到的“全”,因为和“泉”同音,那么“泉”也会用⟨تمام⟩来表示;同样也能见到音读+训读的组合,比如⟨خُوآن تمام⟩“黄泉”,前者是音读⟨ḫuwān⟩,后者是用“全”表示的“泉”。

类似的现象其实在汉语周边其它语言的借词里也会发生,因为以前的识字率并没有那么高,通常只是根据语音来判断构成一个词的语素,比如可能会把“洪水”误认为是“红水”,在借入时就会用自身语言的“红”+“水”去仿制(calque)出一个复合词。不过另外也可能导致读白字,比如把“臀”误认为“殿”,然后小儿锦就基于diàn来写了。


 关于未标识的声调

可以发现,上文中的汉语拼音多数没有标声调,这正是因为小儿锦没有表示声调的手段。根据《汉语方言地图集》的调查,的确小儿锦所使用地区的汉语方言里声调较为简单,普遍只有3个调,但即便如此不写声调仍然容易造成一些误会。

事实上在阿拉伯系字母中存在声调符号的考量,Unicode就收录了罗兴亚语(孟加拉国东南部)的6个声调符号,位于U+08EA到U+08EF:

图片

不过实际效果看起来却相当复杂。因为罗兴亚语的阿拉伯系正字法要求声调符号必须书写(阿拉伯系向撒哈拉以南传播时也遇到了很多声调语言,但并不强制),这就导致字母点、元音符、声调符三者叠在一起,会给识别造成一定的难度。下图中圈了一些例子:

图片

所以,阿拉伯系从底层架构来看似乎就不太适合再加一层新的符号,目前将阿拉伯系作为第一书面文字的地区也较少有声调语言,本文只是对小儿锦的现有情况与特点作简要介绍,不涉及更多的设想。


总而言之,小儿锦作为我国西北地区珍贵的文化遗产,是当地汉文化与伊斯兰文化交融互通的见证者,但因为目前的使用者已寥寥无几,而研究者也必须掌握阿拉伯语和波斯语,这些都使得小儿锦已处于灭绝的边缘。本文只是基于《小儿锦研究》的成果,从阿拉伯系字母的整体视角对小儿锦做了简要的文字学说明,没有涉及到实际研读文本的语文学(philology)工作,希望能通过这篇介绍让读者大致了解小儿锦这种独特的文字系统,鼓励更多人投身到小儿锦的保护与研究任务中,让“冷门绝学”“热”起来。

图片

小儿锦:شً قً نٍ شٍ یوُ خایْ ثیًا  خُوِ مٍ زِ جِ جٍ فُ

拉丁转写:šan gan nin šin yū ḫāy ṯiyan ḫuwi min zi ǧi ǧin fu

拼音:shan gan nin sheng yu hai xian hui min zi zhi zhen fu

汉字:陕甘宁省豫海县回民自治政府


参考资

1.刘迎胜. 小儿锦研究. 兰州:兰州大学出版社,2013.

2.曹志耘主编. 汉语方言地图集:语音卷,北京:商务印书馆,2008.

3.周有光. 世界文字发展史. 上海:上海教育出版社,2011.

4.Watson, Janet. The Phonology and Morphology of Arabic. Oxford: Oxford University Press, 2002.

5.Priest, Lorna ; Hosken, Martin. Proposal to add Arabic script characters for African and Asian languages.2010. http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3882.pdf.

6.https://www.omniglot.com/writing/urdu.htm