純拉丁化漢語拚音文字方案
(2005-07-15 14:47:56)
下一個
純拉丁化漢語拚音文字方案
第1節 簡介
這個拚音文字方案是一個試圖隻用26個英文字母,不用聲調符號,不用帶帽字母來拚寫漢語中文的漢字(詞素),漢詞以及句子文章的文字方案,因此是一種純拉丁化拚音文字方案。這個方案是一種采用一維線性書寫形式的拚寫式拚音拚意文字方案,是一種能夠拚寫出傳統方塊漢字的聲,韻,調,意四種信息的方案。這個方案是一種能夠拚寫出所有傳統方塊漢字,並且可以與傳統方塊漢字一一對應的方案。這個方案也是一種采用了分詞連寫方式,以字組詞,字詞雙本位的方案。
這個方案試圖隻用26個英文字母來拚寫漢語拚音文字,用異拚來區分聲調和獨體字,用意符來區分形聲字。
第2節 拚音的修改
既然是一個純拉方案,就必須對原漢語拚音方案的戴帽字母和聲調符號進行改造。最常用的辦法,一個是用“v”代替“ü”,一個是用“eu”代替“ü”。考慮到“v”在中國方言中會作為聲母出現,以後的拚音文字會吸收方言詞匯,所以在我的方案裏不使用“v”來代替“ü”。“eu” 在下文將要論述的異拚方法中是“ou”的異拚拚式,考慮到異拚拚式的一致性,也不使用“eu”來代替“ü”,而是采用了台灣的通用拚音的做法。
修改現行的漢語拚音方案,去掉不屬於英文26個字母的韻母“ü”,改用“iu”來代替。同時,原來的“iu”用“iou”代替。
第3節 異拚
什麽是異拚?用不同的字母組合代表相同的語音單位,這樣一種手段叫做異拚手段,簡稱異拚。不同的字母組合叫做異拚拚式或者異拚拚形。相同的語音單位叫做異拚音素。如果異拚的語音單位比音節小,那麽這樣的異拚叫做狹義異拚;否則,叫做廣義異拚。
異拚可以分兩種。一種是仍然符合拚音原理的異拚,另一種是整體認讀。符合拚音原理的異拚,它的字母組合所代表的語音單位的語音就等於組成它的各個字母的發音的組合。例如,“ung=u+ng=o+ng=ong”,“uen=u+en=u+n=un”,“ba=b+a=b+u+a=bua”等等。整體認讀則不然,它的各個字母的發音的組合與這個字母組合所代表的語音單位的語音並不相同。例如“ee=i”,“oo=u”,“right=write”,“eye=i”等等。
按照定義,廣義的異拚包括了意綴,變讀和編碼。為了區分開異拚與意綴,變讀,編碼的區別,在我的這個方案裏,異拚僅僅指的是狹義異拚。實際上,我的方案隻使用了韻母的異拚。
第4節 異拚的來源
2.1 漢語拚音方案
漢語拚音方案本身在當初定型的時候,就有一些不同的拚寫形式。這些不同的拚寫形式就可以成為我們拚音文字的合理的異拚。例如,“an, en, in, un”和“ang, eng, ing, ong”應該一一對應才是,對應“un”的應該是“ung”,可是在方案中卻是“ong”。所以規定 “ung”和“ong”互為異拚是合理的。反過來,“on=un”也應該可以互為異拚。進一步推論,“oan=uan”, “uen=oen”等等似乎也可行。同時,因為“un”是“uen”的縮寫,所以他們兩個也應該能夠看做互為異拚拚式。這樣,我們可以得到兩條異拚規則:
第1異拚規則:
*o*=*u*: on=un, ung=ong, oan=uan, oai=uai, oei=uei, ui=oi, ...
第2異拚規則:
*ien=*in; *ieng=*ing; *uen=*un; *ueng=*ung=*ong; *uei=*ui;
另外,似乎“au”和“eu”,比“ao”和“ou”更接近漢語的發音,所以他們也可以互為異拚拚式。
第3異拚規則:
“au=ao”,“eu=ou=eo”。
2.2 通用拚音方案
台灣的通用拚音方案與大陸的漢語拚音方案非常類似,不同的的地方就可以成為我們異拚的來源。比如說,漢語拚音方案“翁=weng”,通用拚音方案則寫作“翁=wong”;漢語拚音方案“風=feng”,通用拚音方案則寫作“風=fong”;漢語拚音方案“女=nü”,通用拚音方案則寫作“女=nyu”。這給我們兩點提示。第1點,“fong=fung=fueng=feng”說明了在“f”和“eng”之間加入“u”,並不影響發音。第2點,“i”可以用“y”代替,“u”可以用“w”代替。由此,我們又可以得到兩個異拚規則:
第4異拚規則:
(b, p, m, f)+* = (b, p, m, f)+u+* = (b, p, m, f)+o+*:
ben=bon=bun, feng=fong=fung, …, ba=bua=boa, pan=puan=poan,…; pian=piuan, min=miun=mien=mion, …(分別隻能應用於b,p,m,f)
第5異拚規則:
*y* = *i*, *w*=*u*:
bye = bie, ly = li, dyan = dian, luan = lwan, ..., ay = ai; ey = ei; aw = au = ao; eu = ew = ou = ow;
2.3 介母的擴展
我們知道,“i”和“u”在音節當中有時候被叫做介母。在拚聲音的時候,他們先與韻母相拚,形成介韻合母,然後再與聲母相拚,就可以得到我們所要的聲音了。例如,“duan=d+(u+an)”,“mian=m+(i+an)”等等。如果我們把這種聲介韻三拚方式擴展運用到其他音節上去,並且拚出來的聲音與聲韻雙拚方式拚出來的聲音相同,或者非常接近,那麽我們就可以把這種三拚字母串看做雙拚字母串的異拚拚式。例如,“zhian = zh + (i + an) = zh + an = zhan”,“jian = j + (i + an) = j + an = jan”,“bua = b + (u + a) = b + a = ba”,“choan = ch + (o + an) = ch + (u + an) = chuan”等等。由此我們可以得到如下三個異拚規則:
第6異拚規則:
ji*=j*:
jie = je, jia = ja, qiang = qang, xing = xeng, …(分別隻可應用於j, q, x)
第7異拚規則:
zi*=z*:
zian = zan, zin = zen, cin = cen, siang = sang, …(分別隻可應用於z, c, s, zh, ch, sh, r)
又一次推導出第4異拚規則:
(b, p, m, f)+* = (b, p, m, f)+u+* = (b, p, m, f)+o+*:
ba = bua = boa, pan = puan = poan,…; ben = bon = bun, feng = fong = fung, pian = piuan, min = miun = mien = mion, …(分別隻可應用於b,p,m,f)
如果我們把“e”和“o”也看做介母,那麽我們就得到了另外兩條異拚規則:
第8異拚規則:
聲母+e+韻母 = 聲母+韻母:
zhean = zh+(e+an) = zh + an = zhan, dean= d+ (e+an) = d + an = dan, bein = b + (e + in) = b+ en = ben, …
ain = a + in = an, aen = a + en = an;
第9異拚規則:
聲母+o+韻母 = 聲母+ue+韻母:
ue = u + e = o = o + e = oe = u + o = uo, oen = o + en = un = uen = on, ...
如果我們允許兩個介母同時存在,那麽我們還能夠擴展異拚規則。
第10異拚規則:
聲母 + e + 介母 + 韻母 = 聲母 + 介母 + 韻母;
聲母 + 介母 + e+ 韻母 = 聲母 + 介母 + 韻母;
聲母 +i + u+ 韻母 = 聲母 +ü + 韻母;
例如,
diean = d+(i+(e+an))=dian
deuan=d+(e+(u+an))=duan
jiuan = j+(i+(u+an))= jüan = juan
2.4 英文的異拚
在英文中,“ee”和“ea”都是“i”的異拚,“oo”是“u”的異拚,我們可以借鑒這一作法。
第11異拚規則:
ee = ea = i;
oo = u;
為什麽不用“ee”作為“e”的異拚, “ea”作為“a” , “oo”作為“o”的異拚呢?這是因為韻母“i”,“u”所在的音節同音字非常多,例如音節“fu”,“li”,“ji”,“qi”,“xi”,“zhi”,“shi”,“yu”,“wu”都擁有超過30個同音字,所以這兩個韻母一定要分配足夠多的異拚拚式才能應付使用。
2.5 國語羅馬字方案
借鑒使用國語羅馬字方案的雙寫元音字母的方法,來產生異拚。這裏我們進一步擴展,不但元音字母可以雙寫,韻母中的輔音字母也可以雙寫。例如,shaan = shann = shan, yun = yuun = yunn, ...。
第12異拚規則:
雙寫元音字母或者輔音字母,不改變發音。
借鑒國語羅馬字方案的表調方法,用附加字母“h”和“l”來作為音節的異拚拚式。但是在我的這個方案裏,這條異拚規則隻使用於“a”和“e”兩個單元音,因為這兩個單元音用其他方法產生的異拚拚式太少,不敷使用。
第13異拚規則:
el=eh=e;
al=ah=a;
2.6 其他
可能引起爭論的一些不是非常合理的異拚。例如,比照“jian=jan”,“xiuan=xuan”,“zhian=zhan”,“shiuan=shuan”,規定“gian = gan”,“hiuang = huang”等等。
第14異拚規則:
(g, k, h)+* = (g, k, h)+i+*:
gie = ge, kan = kian, hiun = hun, giai = gai, kiao = kao, ....
第5節 異拚的總結和應用
根據上一節異拚的規則,我們就可以得到每一個韻母所有的異拚拚式。下麵我把每一個韻母可能的異拚拚式盡量多的列舉出來。
a = ae = aa =ah;
ai = aii = aai = ay = aiy = aay;
au = ao = aoo = auu = aao = aau = aw = aow = auw = aaw;
an = aen = ann = aan =ain;
ang = aeng = angg = aang = aing;
e = el = he(ehh) = eh;
ei = eii = eei = ey = eiy;
eu = ou = eo = ouu = euu = oou = eeu = eeo = ow = ew = oow = eew;
en = enn = een = ein;
eng = engg = eeng = eing;
ia = iae = iia = iaa = ya = iah = yia = yae = yah = yaa;
iau = ieau = iao = ieao = iaoo = iauu = iaao = iaau = iaw = yao = yau = yaw = iaow = iauw = ieaw = yeao = yeau =yeaw = yaow = yauw = iaaw = yaao = yaoo = yaau = yauu = yaaw;
ian = iean = iaen = iian = iann = iaan = yan = iain = yian = yean = yain = yaen = yaan = yann;
iang = ieang = iaeng = iiang = iangg= iaang = yang = iaing = yiang = yeang = yaing = yaeng = yaang = yangg;
ie = iel = iie = iee = ye = ieh = yie
// = yer = yiie = yiee;
ieu = iou = ieo = ioou = ieeu = ieeo = iow = iew = you = yeu = yeo = yow = yew
// = yiou = yieu = yiow = yiew= ioow = ieew = yeeo;
in = ien = iein = inn = iien = ienn = iin = ieen = yn = yin = yen = ynn
// = yeen = yein = yenn = yien = yinn = yiin;
ing = ieng = ieing = ingg =iieng = iengg = iing = ieeng = yng = ying = yeng = yngg
//= yeeng = yeing = yengg = yieng = yingg = yiing;
ua = oa = uoa = uua = ooa = uaa = oaa = wa = wua = woa = wae = waa
// = uah = oah = wah;
uai = ueai = euai = oai = uoai = ouai = oeai = eoai = uuai = uaii= ooai = oaii = uaai = oaai = wai = uay= oay = way = wuai = weai = woai = ueay= euay = uoay = ouay = oeay = eoay = wuay = weay = woay = waai = waii = uaay = oaay = uuay = ooay = waay;
uan = uean = euan = oan = uoan = ouan = oean = eoan = uuan = ooan = uann = oann = uaan = oaan = wan = wuan = wean = woan = waan = wann;
uang = ueang = euang = oang = uoang = ouang = oeang = eoang = uuang = ooang = uangg = oangg = uaang = oaang = wang = wuang = weang = woang = waang = wangg;
o = ue = uo = uuo = uue = oe = uoe = wo = we = wuo = wue = woe;
ui = uei = eui = oi = uoi = oui = oei = eoi = uui = ooi = uii = oii = wi = uy = oy = wy = wui = wei = woi = uiy = uey = uoy = ouy = euy = oiy = oey = eoy = wiy = wuy = wey = woy = wii;
un = uen = eun = on = uon = oun = oen = eon = unn = onn = uun = oon = wn = wun = wen = won = wnn;
ung = ueng = eung = ong = uong = oung = oeng = eong = ongg = ungg = oong = uung = wng = wong = wung = weng = wngg;
i = yi = ee = yee = ii =yii = y = ea = iy = yea = yiy;
u = wu = oo = woo = uu = wuu = w = uw = wuw;
iu = yu = iiu = yiu = ioo = yoo = iuu = yuu = iw = yw = yiw = yuw = ywu = iiw
// = yuoo = ywoo = ywuu;
io = iue = iuo = ioe = yo = yue = yuo = yoe = ywe = ywo
// = yuue = yuoe = ywuo = ywoe = ywue = yuuo;
從以上列表可以看出,異拚拚式的分布很不均勻。韻母“e”和“a”的異拚拚式最少,“ui”和“uai”的異拚拚式最多。一般來說,單韻母的異拚拚式比較少,複合韻母的異拚拚式比較多;不含介母的韻母異拚拚式比較少,含有介母的韻母異拚拚式比較多。
盡管存在這麽多的異拚拚式,但是,除了第13異拚規則所產生的拚式屬於整體認讀之外,其他都仍然遵循拚音原理,拚式所代表的語音能夠根據組成拚式的各個字母的發音拚讀出來,不需要死記硬背。
我們已經發掘出如此多的異拚拚式,這些異拚拚式在拚音文字當中都能夠起些什麽作用呢?他們能夠用來表調,用來區分同音字,用來表示獨體字(非形聲字),用來表示漢字的詞性等等。在我的這個方案中,我隻用他們來表調和區分最常用的同音字。在力所能及的情況下,也用來表示某些獨體字(不是全部)。其他不常用的同音字則用意符來區分。
第6節 異拚表調規則
標示聲調問題。聲調是漢語語音中不可缺少的、有區別意義功能的組成部分。拚音文字的優勢本來在於見形知音; 如果不標調, 就等於見形隻知近似音, 而不知準確音。漢字學習起來困難, 但是當學會5000個左右漢字之後, 閱讀的時候就能知道準確的讀音, 隻有少數多音字須要結合前後的字 (語境) 確定讀音。不標調的漢語拚音文字必須整詞死記它們的聲調。其中幾千個常用的熟悉的詞, 如 renmin (人民)、guojia (國家)、xuexi (學習) 等, 記住這些詞的聲調也許問題不大, 但是對幾萬個 (三四萬以上) 不常用不熟悉的詞, 就得下功夫死記。例如, 要記住 gongchu 讀 gongchu4 (公畜), gongding 讀 gong3ding3 (拱頂), gongzhuo 讀 gong4zhuo (供桌)。死記大量的詞的聲調要花費相當多的時間和精力, 這大大降低了拚音文字易學的優越性。如果不去死記, 許多詞就得根據上下文確定準確讀音, 這勢必降低閱讀的速度, 有時還確定不了讀音。所以, 與標調的漢語拚音文字相比, 不標調的漢語拚音文字從形式上看比較簡單, 從習得、辨認等方麵看更複雜了。
首先,我們來對付非單韻母(複合韻母)。
4聲(去聲):
所有包含“y”或者“w”作為韻母的全部或者一部分的異拚拚式,都是4聲。以 “ein”,”eing”,“ain”,”aing” 作為韻母的全部,而不是一部分的,都是4聲。例如:
ai: ay; ao: aw, aaw; an: ean, ain; ang: aing;
ei: ey; ou: ew, ow; en: ein; eng: eing;
ia: ya, yia; iao: yau, yaw, iaw; ian: yan, yian, iain; iang: yang, yiang;
ie: ye, yie; iou: yeu, iew, you, yow, yew, iow; in: yn, yen, yin; ing: yeng, yng, ying;
ua: wa, wua; uai: uay, wai, way, wuai, wuay; uan: wan, wuan, wain; uang; wang, wuang, woang, waing;
ui: wi, uy, uei, uey, wei, wey, wui, wuy, uoy, woi, woy; un: wen, wun, won; ong: weng, wung, wong;
ein, ain是4聲,而 iein, iain, uein, uain 不是。
3聲(上聲):
所有不是4聲,雙寫主要元音字母的異拚拚式都屬於3聲。例如,
ai: aai; ao: aau, aao; an: aan; ang: aang, eaang
ei: eei; ou: eeu; en: een, eein; eng: eeng
ia: iaa; iao: iaau, iaao; ian: iaan; iang: iaang
ie: iee; iou: iouu, ieuu; in: iin, ieen; ing: iing, ieeng
ua: uaa, oaa; uai: uaai, oaai; uan: uaan, oaan; uang: uaang, oaang
ui: uii; un: uun, ueen; ong: uung, oong, ueeng, uoong
如何確定主要元音字母:
主要元音字母是原漢語拚音方案的規定。原漢語拚音方案規定隻能在主要元音字母上頭添加聲調符號,而不能在次要元音字母上頭添加聲調符號。
如何確定一個字符串中哪個字母是主要元音字母呢?原則是,隻要有a,a就是主要元音字母;沒有a,有e,e就是主要元音字母。既沒有a,也沒有e,隻有o,i,u,那麽哪個字母在後,哪個字母就是主要元音字母。其中“ou”是個例外,“ou”的主要元音字母是“o”,而不是“u”。
2聲(陽平):
所有不是4聲,也不是3聲,包含“o”作為韻母的一部分,或者雙寫次要元音, 雙寫“n”或者“g”的異拚拚式,都屬於2聲。以 “ae” 作為韻母的全部或者一部分的,都是4聲。例如:
ai: aii; ao: ao, aoo, auu; an: ann, aen; ang: angg, aeng
ei: eii; ou: euu, ouu; en: enn; eng: engg
ia: iia; iao: iao, iiao, iiau, iauu, iaoo; ian: iian, iann; iang: iiang, iangg
ie: iie; iou: iiou, iouu, iieu, ieuu; in: inn; ing: ingg
ua: oa, uua, ooa; uai: oai, uaii, oaii, uuai, ooai; uan: oan, uann, uuan, oann, ooan; uang: oang, uuang, uangg, oangg, ooang ;
ui: oi, uoi, oei, uui, ooi, ueii; un: on, unn, onn, uon, oen, oon; ong: ong, ungg, ongg, uong, oeng, oong ;
1聲(陰平)和輕聲:
其他異拚拚式全部都屬於1聲或者輕聲。這些拚式大部分都是漢語拚音方案的原形。例如:
ai: ai; ao: au; an: an; ang: ang
ei: ei; ou: eu; en: en; eng: engg
ia: ia, eia; iao: iau, ieau, eiau; ian: ian, iean, eian; iang: iang
ie: ie; iou: ieu; in: in, ien; ing: ing, ieng
ua: ua; uai: uai, ueai, euai; uan: uan, uean, euan; uang: uang, ueang, euang
ui: ui, uei; un: un, uen; ong: ung, ueng
單韻母的異拚拚式特殊規定如下:
原形: 1聲或者輕聲;2聲;3聲;4聲
a:a; ae; aa; ah
e:e; el; he(ehh); eh
er:ir;err;eer;er
o:o, ue; uo, uuo; oe, uoe; wo,we, wue, wuo, woe
i:i, yi; ee, yee; ii, yii; y, iy, ea, yea, iiy, yiy
u:u, wu;oo, woo; uu, wuu;w, uw, ww, uuw, wuw
ü:iu, yu;iiu, yiu; iuu, yuu;iw, yw, yuw, iiw, yiw, iuw
üe: io, iue; iuo; ioe;yo, yue, yuo, yoe, ywe, ywo
注釋1: 當“e”位於聲母之後的時候,3聲的拚式為“he”, 例如“葛”拚寫成“ghe”;當“e”單獨存在的時候, 3聲的拚式為“ehh”,例如“惡心”拚寫成“ehhxen”。為了“he”不會與“zhe”,“che”和“she”相混淆,我查看了一下,發現在 “ze3”,“ce3”和“se3”這三個音節上沒有漢字存在。這就保證了不需要用“zhe”表示平舌音“ze3”,不會與卷舌音的拚式相混淆。
注釋2:我們可以把“o”看做是“ue”的縮寫,因此,“o; uo; oe”就相當於“ue; uue; uee”,“io; iuo; ioe”就相當於“iue; iuue; iuee”,也是符合複韻母表調規則的。同理,把“ee” “oo”看做是雙寫次要元音字母,那麽“i”,“u”兩個單韻母也符合複韻母表調規則。這樣做,可以幫助我們記憶表調規則,不會感覺到有那麽多的例外。
根據異拚表調規則,我們可以計算出每一個帶調音節各有多少個異拚可用。下麵的統計隻限於字母數量最多比漢語拚音原拚式多一個字母的異拚拚式,並且這裏的統計隻是取最少可能的異拚數量,某些音節的異拚數量遠多於這些。
b,p,m,f + 韻母:1聲:2個;2聲:2個;3聲:1個;4聲:2個。
d,t,n,l + 韻母:1聲:1個;2聲:1個;3聲:1個;4聲:1個。
j,q,x + 韻母:1聲:3個;2聲:3個;3聲:3個;4聲:6個。
g,k,h,z,c,s,zh,ch,sh,r + 韻母:1聲:2個;2聲:1個;3聲:1個;4聲:2個。
看起來許多人不喜歡字母上帶帽子,又沒有其他好辦法區分聲調,所以在用漢語拚音方案書寫句子的時候,幹脆不表達聲調信息。比如,人民幣上,以及許多城市的街道名稱等等。在書店裏,許多書的封麵上標出了書名的漢語拚音,可是有多少是附加著聲調符號的呢?在網上,使用拚音進行聊天通信的人當中,又有多少人是使用了聲調的呢(不管是使用聲調符號,還是使用數目字來區分聲調)?我覺得這也沒什麽不好,也就是說我可以接受,但是如何說服其他人,就是個問題。因為聲調在漢語裏是很重要的,沒有聲調的拚音文字,如果沒有經過長時間的學習,熟悉每一個拚式隱含的調號,念出來是陰陽怪氣的,也是聽不懂,看不明白的。不能算是完全的,或者說是完備的“拚音”文字,隻能算是瘸腿拚音文字。英語的重音是有規律的,大部分是在倒數第二音節,隻有很少的單詞是不規則的,所以英美的一年級小學生在掌握了拚讀規則之後,讀出來的英語是大致正確的,不會有太大偏差。沒有聲調的方案,在小學生掌握了拚讀規則之後,是否都能念對呢?既然是規則,就不可能有太多條,不能夠每一個漢字的聲調都有一條規則。那樣的話,隻好象學習原方塊漢字那樣,對於每一個漢字的聲調,沒有任何規律可循,都需要花時間死記硬背。規則簡單,這也是拚音文字比方塊漢字優勝的地方。
異拚表調方案的一個優點就是給原漢語拚音方案中的拚音摘了帽。隻需要使用26個純英文字母,不需要額外的其他字母。隻需要英文鍵盤,不需要任何字庫和編碼,就能夠上網打字,比法文,德文,俄文等等其他西方文字還要容易,更比日文,韓文,越南文等等東方文字容易許多。既然要搞文字改革,幹脆搞的徹底一些。當然了,如果技術上確實沒有辦法搞的徹底,我們也沒有脾氣。可是如果我們在技術上能夠做得到,又何樂而不為呢?
在我的這個方案裏,異拚的第一用處是起表調作用。除此之外,還可以表達非形聲字或者獨體字。 也就是說,在每個同調音節(音同, 調也同),一般還能存在2-3個不同的異拚形式,最多能區分2-3個同音同調漢字。因為同音同調的獨體字差不多也就是2-3個,所以異拚除了能夠提示我們聲調之外,還可以區分這些獨體字。對於大量的形聲字,仍然需要使用意符。我們必須明白,離開意符,是不可能區分大量同音字的,因為異拚的拚式畢竟有限,不可能達到80多個。即便有80多個異拚,我們也很難使他們有理化,容易記憶。
異拚表調其實是字母表調的一種。我的這個方案與國羅和王力的方案比起來,最大的好處就是不需要額外的字母跟在拚音的屁股後麵(含有e和a這2個單韻母的音節除外,而這些音節的設計不會與意符相混淆),從而為添加意符騰出了位置。國羅和王力的方案作為注音方案是沒有問題的,但是作為文字,要區分大量的的同音字,就需要添加意符,隻靠異拚或者標調是做不到的。
聲調一律標原調,不標變調。但在誦讀的時候,可以按照變調誦讀。
第7節 異拚表調舉例
與聲母相拚舉例說明:
a:答=da;達=dae;打=daa;大=dah
ai:拍=pai;排=poai;迫=paai;派=pay
ao:凹=ao;熬=aw;襖=aao;奧=au
an:貪=tann;談=tean;坦=taan;探=tan
ang:湯=tangg;堂=teang;躺=taang;趟=tang
e:哥=gel;閣=geh;葛=ger;個=ge
ei:勒=leii;雷=ley;壘=leei;類=lei
ou:州=zhou;軸=zhow;走=zhoou;宙=zheu
en:琛=chenn;沉=chein;磣=cheen;襯=chen
eng:稱=chengg;成=cheing;逞=cheeng;秤=cheng
ia:家=jiia;甲=jya;假=jiaa;價=jia,架=ja
iao:挑=tiao;條=tiaw;眺=tiaao;跳=tiau
ian:拈=niian;年=nyan;攆=niaan;念=nian
iang:槍=qeang;強=qyang;搶=qiaang;嗆=qiang
ie:歇=xiie;斜=xye;寫=xiee;械=xie
iu:妞=niou;牛=niw;扭=niuu;拗=niu
in:拚=pinn;貧=pien;品=piin;聘=pin
ing:星=xingg;行=xieng;醒=xiing;性=xing,幸=xeng
ua:瓜=goa;華=hwa;刮=guaa;掛=gua
uai:摔=shoai;懷=hwai;甩=shuaai;帥=shuai
uan:歡=hoan;環=hwan;緩=huaan;換=huan
uang:框=koang;狂=kwang;夼=kuaang;況=kuang
ue:郭=gue;國=guo;果=goe;過=go
ui:虧=koi;奎=kwi;傀=kuii;愧=kui
un:村=con;存=cuen;忖=cuun;寸=cun
ong:通=tong;同=tueng;統=toong;痛=tung
i:機=jee;即=jea;幾=jii;技=ji
u:突=too;圖=tuw;土=tuu;兔=tu
ü:(1聲無字);驢=lyuw;旅=lyuu,女=nyuu;率=lyu
üe:(1至3聲無字);略=lio,虐=nio
er:(1聲無字);而=err;耳=eer;二=er
yi:醫=yee;異=yea;以=yii;意=yi
wu:汙=woo;無=wuw;五=wuu;務=wu
yu:籲=yoo;於=yuw;語=yuu;育=yu
對於那些隻有一個聲調有漢字的音節,可以使用1聲的拚式來表示任何一個聲調。隻有一個聲調有漢字的音節列舉如下:
ce4冊;chua1欻;ceu4湊;
den4扽;dia3嗲;dieu1丟;
eng1鞥嗯;
fo2佛;feu3否;
gei3給;
kei1剋;ko4擴;
lia3倆;lio4略;
me0麽;
nieu4謬;neng2能;nin2您;neu4耨;nuan3暖;nun2黁;nio4虐;
ri4日;run4潤;
se4色;sen1森;seng1僧;
te4特;
zhei4這;
第8節 意符
英文26個字母去掉作為韻母成分的9個字母,還剩下17個字母可以用來作為後綴意符:26 - a, o, e, i, u, y, w, n, g = 17。
17個意符可以分別代表17個意類:
h = 火,l = (liquid) 流(水),t = 土,r = (rock) 石,j = 金
c = 草,m = 木,d = 動(物),b = 病,p = (people) 人
s = 手,z = 足,k = 口,v = 肉,x = 心
f = 服(裝),q = 器(皿) 與 建築
意符使用17個,代表17個不同的意類,與漢字的偏旁部首相對應,一個意符對應多個偏旁部首,可以用來區分開具有不同部首的形聲字。這些意符與傳統方塊字的部首的對應關係如下:
h: 火,灬, 光, 日, 氣, 風
l: 水,氵, 冫,雨,川,巛
t: 土,山,阜(左阝),至,鹵,穴,穀,田,裏
r: 石,玉,王,貝
j: 金,钅,刀,斤,戈,弓,矢,殳,矛
c: 艸,禾,米,瓜,豆
m: 木,林,生,竹,片,冊
d: 蟲, 魚,黽,辰,甲,鳥,隹,龍,飛,犬,犭,豸,虎,虍,豕,象,馬,鼠,兔,牜,羊,鹿
b: 疒,鬼,卜,巫,示,礻,辛
p: 亻,氏,女,子,父,母
s: 扌,手,攵,又,寸,爪,廾,聿,力,工,克
z: 走,辶,足,?,立,登,彳,止,旡,舟,車
k: 口,言,訁,欠,音,甘,舌,食,酉
v: 肉,月,歹,耳,血,屍,骨,頁,齒,身,自,麵,革,羽,髟,毛,角,韋,皮
x: 心,忄,目,見,黑,白,臣,文,赤,青
包括空間(囗,大,匚,亼,尤,勹,高,小,冒,長,函,廴,申)
時間和數量(十,一,鬥,幾,爿,個,尺,非,老,少,夕)
f: 絲,糸,係,衣,黹,巾,方
q: 皿,且,瓦,缶,勺,幾,豆,臼,匕,鬲,咼,網,耒
宀,門,廣,戶,廠,冖,邑(右阝)
記憶口訣:
火流(水)土石金,
草木動(物)病人,
手足口肉心,
服裝建器皿。
每一個帶調音節中,最常用的一個甚至幾個漢字不帶意符,而是用異拚區分開來。次常用的帶一個意符。意符的確定按照意符與原漢字部首的對應規則來決定。例如,原漢字“鄲”的部首是“阝”(右耳=邑),它所對應的意符是“q”,所以這個漢字所對應的拚音文字的意符就是“q”。實際上,這個漢字所對應的拚音文字寫為“danq”。
當兩個同音同調的漢字也屬於同樣的意類的時候,可以用異拚加一個意符來區分。例如,“濺 = jeanl”,“澗 = jyanl”;“誼 = yyk”,“譯 = yeak”,“囈 = yiyk”等等。
漢語中存在許多同音同調,偏旁部首也相同的漢字,例如“漸,濺,澗”,“芙,茯,菔,苻”,“園,圓”等等。漢字是如何區分這些同音同調同偏旁部首的形聲字的呢?那就是使用不同的聲旁,也就是說,是使用了表聲成分。異拚拚式就是一種表聲成分,所以使用不同的異拚拚式來區分同音同調同偏旁的漢字是非常恰當的,與原方塊漢字的做法非常一致。意符+異拚是區分同音同調同意類漢字的最佳方法。
當一個意符加上所有的異拚拚式仍然無法區分同音同調同部首的所有漢字的時候,就需要考慮增加一個意符了。我的做法是,新增加的意符在原漢字去掉第1個部首之後的剩餘部分當中確定,確定方法與第1個意符的確定方法相同。例如“澗”字去掉第1個部首“氵”就是“間”,“間”的部首是“門”,所以第二個意符就是“門”這個部首所對應的“q”。這樣,“澗”字如果需要兩個意符的話,那麽他所對應的拚音文字的拚式應該寫為“jyanlq”。同理,“濺”字去掉第1個部首“氵”就是“賤”,“賤”的部首是“貝”,所以第二個意符就是“貝”這個部首所對應的“r”。“濺”字如果需要兩個意符的話,那麽他所對應的拚音文字的拚式應該寫為“jyanlr”。再如,“幅 = foof”,“紼 = foofx”,“襆 = foofm”等等也使用了兩個意符。
音節後麵附加的意符的個數最好是一個,最多兩個就足夠了。拚音的後麵跟著太多的不發音字母既看起來累贅,又與英語差別太大(當然與法文倒有些相似了),讀起來需要跳動,影響閱讀速度。所以,能省則省。異拚表調把調號揉和進拚音當中去,可以減少一個後加字母。
這樣一來,隻用最多兩個意符和所有的異拚,就能夠區分至少289(289 = 17 * 17, 假設用17個不同的意符)個同音同調漢字,而這足以區分開古往今來的所有漢字(隻是猜測,需要專家證實),不單單隻是6763個常用的。雖然在我的這個方案裏,暫時隻是定型6763個常用漢字,但是我所論述的意符加異拚的方法的表現能力遠遠不止如此。
還有一個問題需要解決。由於異拚中用到了字母“h”和“l”,意符也使用了這兩個字母,所以必須有辦法來區分這兩個字母在什麽情況下是異拚,什麽情況下是意符,保證意符與異拚不會混淆不清才行。規定,在韻母不是“a”和“e”的時候,這兩個字母都是作為意符使用的。在韻母是“a”和“e”的時候,這兩個字母都是作為異拚使用的。如何能夠確定在韻母是“a”和“e”的情況下,不需要這兩個字母作為意符使用呢?這隻要保證音節“*ā”裏不存在以“h”為意符的漢字,音節“*ē”裏不存在以“h”和“l”為意符的漢字就行了。檢查可知,隻有“湝”是屬於以“l”為意符的漢字,但是它可以用“jiē”而不是“jē”作為它的拚音拚式。
總結起來,異拚既能夠區分聲調,又能夠區分同音同調的獨體字,甚至所有的非形聲字,還能夠區分部分相同偏旁部首的同音同調同意類的形聲字;意符既可以用來區分形聲字,也可以用來區分部分會意字,指事字和象形字。異拚加意符,既能夠把聲調信息表達出來,又能夠區分開所有的同音字,是一個完備的非純拚漢語拚音文字方案所需要的,區分大量同音字詞的非常有效的手段。
第9節 單字詞定型規則
先來分辨一下我所使用的概念:“音節”和“帶調音節”。當2個漢字的聲音相同,聲調也相同的時候,我們說這2個漢字屬於同一個帶調音節。當2個漢字的聲音相同,但是聲調不同的時候,我們說這2個漢字屬於同一個“音節”,但是不屬於同一個“帶調音節”。
上一節我們利用異拚表調規則,可以根據異拚拚式的不同區分開不同的帶調音節的漢字。這一節進一步研究如何區分屬於同一個帶調音節的不同漢字,也就是漢字定型問題。
有的人主張多用意符,有的人主張多用異拚。主張用意符的人認為意符能夠幫助記憶,是1種有條理的能夠提示漢字含義的方法。這裏我要強調一點,並不是異拚用的越少,越有利於記憶,而是有一個異拚拚形個數的使用下限。超過了這個下限,並不會減少記憶量。因為在同音同調的漢字集合中,還存在著同部首,同意類的漢字。對於這些漢字,隻靠意符是沒有辦法區分開的。區分他們有兩個辦法,一個是使用不同的異拚拚式,另一個是再增加一個意符。但是這第2個意符並不能提示我們什麽含義,隻是在字形上幫助我們區分同音同調同意類的漢字,所以這個意符被叫做形符更合適。形符由於不能提示含義,隻能死記硬背,所以並不能幫助我們記憶,或者減少記憶工作量。因此,使用形符和使用異拚,在需要的記憶負擔方麵沒有任何區別。既然如此,使用形符就不如使用異拚拚式,因為異拚至少還能表音,而形符隻是一種不發音的後綴,看上去,讀起來都不舒服,與英文的書寫方式也不如異拚接近。
在一個同音同調的漢字集合中,如果存在N個同一意類的漢字,那麽至少需要N/2個異拚拚式才能把他們區分開來。舉個例子可能更有利於理解。在帶調音節jian4中,存在3個屬於意類“l=水”的漢字:漸,濺,澗。因此至少需要3/2=2(注意4舍5入)個異拚拚式才能區分開他們,比如用拚式“jain”和“jyan”:
漸=jain;濺=jyan;澗=jainl
如果隻用1個異拚拚式,那麽就隻好用形符來區分:
漸=jain;濺=jainl;澗=jainlq
注意,這裏第1個意符“l=水”,第2個意符也就是形符“q=門”。如果異拚拚形需要死記硬背,那麽形符也一樣需要死記硬背。對於沒有學習過方塊字的新人來說,“q”究竟有何含義?即使對於原方塊漢字,想想我們是如何區分“漸,濺,澗”這3個字的?雖然偏旁部首能夠幫助我們理解含義,但是我們仍然需要記住每個漢字的另一半字形,而且隻能死記硬背:“逐漸”的“漸”是用“斬”做聲旁的“漸”,而不是用“間”做聲旁的“澗”。“漸”與“澗”的含義不同,但是他們的含義與“斬” 和“間” 沒有任何關係。
考慮到還有其他的意類也存在多個漢字,比如:“鍵,劍,鑒,鐧”;“健,僭”;“踐,踺”,他們也需要異拚來區分相同意類的漢字,所以1個帶調音節所需要的異拚拚式的最少個數不是那麽簡單就能確定出來的。另外還要考慮到,越是常用的漢字越要用異拚,所以實際的對異拚拚式的分配需要綜合全麵的考慮。
從以上的分析可以看出,使用異拚拚式是不可避免的;異拚拚式使用的最少數量是有一個下限的;使用少於下限的異拚數量是並不能減少死記硬背的工作量的。因此,使用多少個異拚比較合適,就是一個值得認真研究的問題。存在3種做法。第1種,盡量多的使用異拚,在用光所有可能的異拚之後,才使用意符。這樣做的好處是,用拚音文字所寫成的文章中,小尾巴(不發音的意符)最少,跳讀次數最少。第2種做法,常用漢字用異拚,不常用的漢字用意符。比如說,以3000個漢字為界限,3000以內的盡量用異拚,3000以外的不管還有沒有異拚存在,一律要加意符。當然了,一個意符無法區分的,仍然要借助於異拚,而不是增加形符。第3種做法是,用盡可能少的異拚拚式區分同音同調同意類的漢字,以及跨意類的獨體字,非形聲字,其他的漢字,尤其是形聲字全都加意符。
在我的這個方案中,采用了第2種做法,來定型6763個漢字。主要是先做出來讓大家看看效果如何。用這個方案寫出來的文章中,意符占的比例不是太大(我粗略的統計了一下,在實際文章中,大約15個漢字中有1個需要加意符。如果使用第3種做法,大約5個漢字中就要有1個加意符),而且對於初學者來說,需要死記硬背的漢字定型數量也比較適中(大約2500個完全使用異拚的漢字),所以我個人感覺是一個比較好的方案。當然了,如果許多人反對,我們仍然可以改進。
漢字(單字詞)定型規則如下:
(1)隻用字母個數最多比原拚式多一個(個別情況下多2個)的異拚拚式,不用拚式太長的。
(2)常用優先。先定型常用漢字,後定型不常用漢字。常用漢字盡量用異拚,異拚不夠用,才使用意符。不常用(3000以後的)漢字盡量用意符。越常用的漢字,其對應的異拚拚式越短。
(3)跨意類及有爭議的,隻用異拚,不用意符,不管是不是常用。特別是獨體字和非形聲字。異拚不夠用的時候,某些可以用來做部首的漢字允許加意符,因為部首與意符的對應關係是確定的,不會引發爭議。
(4)先用異拚加一個意符區分同音同調同部首漢字,在仍然區分不開的情況下,再使用第2個意符,也就是形符。
(5)異拚中,拚式短的異拚優先使用。
(6)同樣長短的異拚中,沒有雙寫字母的異拚優先使用。個人感覺,雙寫字母看上去比較幼稚,不太象文字,所以盡量少出現為好。
(7)同樣長短的異拚中,在不違背前幾條原則的情況下,不帶“y”,“w”的異拚優先使用。在沒有辦法不用這2個字母的情況下,包含他們越少的異拚拚式越被優先使用。這是因為這2個字母即可以當聲母,又可以當韻母,還可以當介母,而且用於同音字比較多的4聲的音節當中,在定型表中出現的機會太多,為了減少他們在實際文章中出現的機會,常用的漢字盡量不用含有這些字母的異拚定型。
(8)在不違背前幾條原則的情況下,與原漢語拚音方案的拚式越接近,越優先使用。
更精確的做法
(1) 按照異拚規則,把某一韻母所有可能的異拚拚式列出來。去掉那些長度大於該韻母原漢語拚音方案原形韻母長度+1的所有異拚拚式。剩下的異拚稱為合格異拚拚式。例如,“ui = uei = eui = oi = uoi = oui = oei = eoi= uii = oii = uui = ooi = wi = uy = oy = wy = wui = wei = woi = uiy = oiy = uey = euy = uoy = ouy= oey = eoy = wuy = wey = woy = wiy = wii”,不包括“wuei = uuei = ueei = ueiy”等等。
(2) 按照異拚規則,把每一個音節(不區分聲調)的所有可能的異拚拚式列出來。去掉那些拚式的韻母部分不合格的(在第1步中確定的)。注意,音節的異拚拚式與韻母的異拚拚式是2個不同的概念。韻母異拚拚式隻是音節異拚拚式的一部分。例如,“dui = duei = deui = doi = duoi = doui = doei = deoi= duii = doii = duui = dooi = dwi = duy = doy = dwy = dwui = dwei = dwoi = duiy = doiy = duey = deuy = duoy = douy= doey = deoy = dwuy = dwey = dwoy = dwiy = dwii”。
(3) 按照異拚表調規則,把每一個音節的所有異拚拚式分成4個集合,分別對應4個聲調。例如,{dui = duei = deui}, {doi = duoi = doui = doei = deoi= duii = doii}, {duui = dooi}, {dwi = duy = doy = dwy = dwui = dwei = dwoi = duiy = doiy = duey = deuy = duoy = douy= doey = deoy = dwuy = dwey = dwoy = dwiy = dwii}。
(4) 在每一個集合當中,按照拚式的長度分成不同的組。對組進行排序。長度短的異拚組排在前麵。例如,{dui /duei = deui}, {doi/duoi = doui = doei = deoi= duii = doii}, {duui = dooi}, {dwi = duy = doy = dwy/dwui = dwei = dwoi = duiy = doiy = duey = deuy = duoy = douy= doey = deoy = dwuy = dwey = dwoy = dwiy = dwii}。
(5) 在每一個集合當中,最短的拚式的長度被叫做這個集合的異拚拚式標準長度。比標準長度+1還長的拚式扔掉不用(個別音節如yi,wu除外)。
(6) 在各個組當中(實際最多隻有兩個組,1個是標準長度組,1個是標準長度+1的組),按照拚式當中有沒有雙寫字母,進一步分組。沒有雙寫字母的異拚組排在前麵。例如,{dui /duei = deui}, {doi/duoi = doui = doei = deoi/duii = doii}, {duui = dooi}, {dwi = duy = doy = dwy/dwui = dwei = dwoi = duiy = doiy = duey = deuy = duoy = douy= doey = deoy = dwuy = dwey = dwoy = dwiy/dwii}。
(7) 在各個組當中,按照拚式當中字母“w”的數量+“y”的數量,進一步分組。數量少的異拚組排在前麵。例如,{dui /duei = deui}, {doi/duoi = doui = doei = deoi/duii = doii}, {duui = dooi}, {dwi = duy = doy = /dwy/dwui = dwei = dwoi = duiy = doiy = duey = deuy = duoy = douy= doey = deoy / dwuy = dwey = dwoy = dwiy/dwii}。
(8) 在各個組當中,按照拚式當中字母“y”的數量,進一步分組。數量少的異拚組排在前麵。注意,上1次是2個字母數量之和,這1次隻是1個字母數量。例如,{dui /duei = deui}, {doi/duoi = doui = doei = deoi/duii = doii}, {duui = dooi}, {dwi/duy = doy = /dwy/dwui = dwei = dwoi/duiy = doiy = duey = deuy = duoy = douy= doey = deoy / dwuy = dwey = dwoy = dwiy/dwii}。
(9) 在各個組當中,按照與原漢語拚音方案的接近程度,進一步分組。接近的異拚組排在前麵。例如,{dui /duei = deui}, {doi/duoi = doui/doei = deoi/duii/doii}, {duui/dooi}, {dwi/duy/doy /dwy/dwui/ dwei = dwoi/duiy/doiy = duey = deuy = duoy = douy/doey = deoy / dwuy = dwiy/dwey = dwoy/dwii}。
(10) 在各個組當中,按照存在不存在原漢語拚音方案中韻母部分,進一步分組。存在的排在前麵。例如,{dui /duei = deui}, {doi/duoi = doui/doei/deoi/duii/doii}, {duui/dooi}, {dwi/duy/doy /dwy/dwui/ dwei/dwoi/duiy/duey = duoy = douy/deuy=doiy/doey = deoy / dwuy/dwiy/ dwoy/dwey/dwii}。
(11) 在各個組當中,按照輔音優先,次要元音其次,主要元音再其次,介母最後的次序,檢查這幾個成分在拚式當中是否出現,進一步分組。例如,{yah/yae/yia},再如,{yaoo/yaao},{yauu/yaau}。
(12) 在各個組當中,按照“ea > ua > oa > ai > ae > au> ao>ia, ue > uo > oi > oe > ou > eu > eo; a > e > i > u > o”的次序,檢查這些成分在拚式當中是否出現,進一步分組。這裏,“>”的意思是“優先於”。當然,這些細則太具體了,可以不用太計較。例如,{dui /duei /deui}, {doi/duoi/doui/doei/deoi/duii/doii}, {duui/dooi}, {dwi/duy/doy /dwy/dwui/ dwei/dwoi/duiy/duey/duoy/douy/deuy/doiy/doey/deoy / dwuy/dwiy/ dwoy/dwey/dwii}。
(13) 按照以上步驟,就可以對同一集合中的所有異拚拚式完全排序。排在最前麵的異拚拚式被叫做這個帶調音節的標準拚式。
(14) 對於那些純粹表音的漢字,例如,“秘=bi4”的時候隻用於“秘魯”一詞,“龜茲=qiu1ci2”的時候隻用於表示這個國家,等等,用異拚的標準拚式來定型。
(15) 對於那些專用名詞,用異拚的標準拚式定型並且首字母大寫。例如,“兗=Yaan”,“灞=Bwa”,“秦=Qinn”,“陝=Shaan”,等等。
(16) 對於新造的(指近代)的化學名詞,用異拚的標準拚式定型並且首字母大寫。例如,“羥=Qaang”,“羧=So”,“羰=Tang”,等等。
(17) 對於剩下的原漢字,按照帶調音節分成不同的集合。屬於同一帶調音節集合的所有原漢字,按照使用頻率進行排序。這樣,屬於同一個帶調音節的原漢字和異拚拚式兩個集合中的元素各自進行了排序,按照這種排序,兩個集合中的元素可以建立一種一一對應關係。按照這種關係,就可以給每一個漢字在新漢語拚音文字中定型。如果原漢字個數多於異拚個數,那麽就需要去掉那麽多出來的,不常用的,能夠確定意類的漢字,直到剩下來的漢字個數與異拚拚式個數一樣多。
(18) 對於那些上一步中去掉的漢字,使用意符進行定型。如果存在多個屬於同一意類的漢字,仍然按照異拚拚式的持續和這些漢字的排序,進行意義對應。如果異拚拚式個數不夠用,那麽按照“意符”一節所述原則添加第2個意符(形符)。至此,所有的漢字應該已經被全部定型,而且不應該有任何兩個漢字的拚式相同。
按照以上規則定型之後,用定型的漢字轉寫網上的文章,我做了一些拚寫實驗。初步統計,字母“y”的出現頻率相當高,大於1/3的漢字都包含這個字母,略微高於字母“e”的出現頻率。雙寫字母的出現頻率也很高,介於1/3到1/4之間。意符的出現頻率是1/16,也就是16個漢字中出現一次,還可以忍受。後麵附上漢字定型表以及一些拚寫實驗,供大家參考。
第10節 兒化音的表達
在不會出現音節混淆的情況下,直接在拚音後麵添加“er”,否則,添加“’er”。例如,“花兒=hua’er”,“小米兒=xaao mii’er”,“小雞兒=xaao jid’er”等等。
第11節 正詞法
總的原則是,對於傳統的漢詞,以字為本,以字組詞。對於外來詞匯,以詞為本,音譯為主,意譯為輔,不提倡直接使用原外文的拚寫形式,也就是不提倡英文所使用的“名從主人”的原則。
區別同音詞問題。漢語中有大量的同音詞。雖然古代漢語中有些單音節詞在現代漢語中不單獨成詞, 減少了單音節詞中的同音詞數量, 但是雙音節詞中的同音詞數量仍然很多。據作者對《漢語拚音詞匯》1989年重編本 (語文出版社) 的統計, 在大約60000條詞中, 聲韻調相同的同音詞有6514條, 占總詞數的10.9%, 其中單音節詞1487條, 多音節詞5027條, 每組同音詞最多8條; 隻計聲韻不計聲調的同音詞有21472條, 占總詞數的35.8%, 其中單音節詞1936條, 多音節詞19536條, 每組同音詞最多23條。如此大量的同音詞如果在書麵上不加區別, 隻靠上下文來確定意義, 就不能成為一種嚴密表達意義的文字。其他拚音文字也有同形異義的同音詞, 可是數量少, 不影響文字的使用, 不可與漢語拚音文字類比。我們所要的漢語拚音文字, 應該是能夠脫離漢字獨立使用的文字, 是詞能夠孤立存在 (如在標題、詞典、語文著作中所出現的) 的文字, 是能用來書寫複雜的文學作品、嚴密的科學論文、精密的法律和公文的文字, 而不僅僅是漢字的拐棍或隻能書寫通俗讀物的文字。不區別大量的同音詞, 是達不到這個目的的。
區別同音語素問題。這是漢語拚音文字成敗的關鍵問題。漢語合成詞有比較強的理據性。詞義不等於語素義的簡單相加, 但是在多數情況下語素義對詞義有較強的提示作用。從語素入手學習合成詞可以事半功倍, 脫離語素學習合成詞等於不管它的理據性, 必然事倍功半。也許有人說, 語素本來是語言中的成分, 人們學習詞本來是先在語言中掌握, 然後才學習文字的, 所以文字能不能區分同音語素無關緊要。事實不是這樣。中等以上文化水平的人所掌握的詞匯, 少部分是在識字以前通過語言學會的, 大部分是在識字以後通過文字學會的。我們憑觀察就能知道, 一般的說, 一個人文化程度越高, 掌握的詞匯越多, 成年文盲掌握的詞匯大大少於同齡有文化的人掌握的詞匯。通過漢字或區別同音語素的漢語拚音文字學習合成詞, 可以充分利用它的理據性, 隻要掌握了相應的字或代表詞素的字母串, 學習合成詞就沒有多大困難 (這裏說的學習、掌握詞, 是從一般意義講的, 並不是說能夠像詞典一樣對詞作出全麵準確的解釋)。如果漢語拚音文字不區別同音語素, 就意味著基本上不表示語素, 通過這樣的文字學習新的合成詞, 要麽是囫圇吞棗, 不分析語素, 把合成詞當作聯綿詞學習, 把有理據的詞當作無理據的詞死記硬背; 要麽是在文字之外講解合成詞的理據, 某個詞由某些語素構成, 如 dian4deng (電燈) 的 dian4 是電子、電流的電, deng 是照明用的燈, dian4ru3 (玷辱) 的 dian4 是玷汙的玷, ru3 是汙辱的辱, 等等, 學習者要一一記住這些講解, 學生還要考試這些內容。不論用這兩種辦法中的哪一種來學習幾萬個合成詞, 都是不可思議的、行不通的。可見, 雖然不標調、不區分語素的漢語拚音文字的詞形簡單, 但是在詞形以外有沉重的學習和記憶負擔。
10.1 以字組詞規則
以字組詞是漢語造詞的一個特點,也是一個優點。我們繼承這一做法。由於大部分的常用漢字是用異拚來表示的,當用這些漢字來組詞的時候,直接把異拚拚式連寫在一起就可以了。例如,“車輛”寫做“chelyang”,“成就”寫做“chenggjow”,“團員”寫做“toanyuoan”,“團圓”寫做“toanyoann”,等等。對於那些使用了意符的漢字,當用這些漢字來組詞的時候,需要把每個漢字的意符集中起來,寫在整個漢詞的最後,也就是先連寫漢詞中所有漢字的拚音部分(包括異拚),然後再連寫意符部分。例如,“榕樹”寫做“rongshwwm”,“茯苓”寫做“foolinggcc”,等等。注意,漢詞中每一個漢字的聲調已經融合在異拚的拚形當中了,所以不管有沒有意符,從漢詞的拚音部分就完全可以知道每個漢字的聲調。
為了區分同音同調漢詞,規定,如果兩個同音同調的漢詞詞形相同,那麽可以采用以下方法加以區分:
當組成漢詞的某一個漢字沒有攜帶意符的時候,可以用“’”來表示零意符。例如,“危急”的“危”沒有意符,那麽這個漢詞可以寫做“wueijee’x”,這裏意符“x”是“急”字的意符,“’”代表“危”字的零意符。
當組成漢詞的最後一個漢字沒有攜帶意符的時候,不需要添加“’”。所以,“榕樹”對應的拚音文字詞形“rongshwwm”裏不需要添加“’”。這裏,“m”是“榕”字的意符,“樹”字沒有意符。如果組成漢詞的最後幾個漢字都沒有攜帶意符,那麽這些漢字都不需要添加“’”。
當組成漢詞的所有漢字或者最後幾個漢字的意符相同的時候,隻需要寫一次這個意符,然後在意符之後添加一個“’”就可以了。也就是說,如果詞形的最後出現“’”,說明了組成漢詞的所有漢字,或者最後幾個漢字的意符是相同的。
10.2 漢詞的逐級簡化
第1次簡化:
如果一個漢字攜帶了兩個意符,那麽當這個漢字組詞的時候,他的第2個意符可以省略,隻要這種省略不會造成同音同調的漢詞產生同形。
第2次簡化:
組成一個漢詞的任何一個漢字的意符都可以省略,隻要這種省略不會造成同音同調的漢詞產生同形。
第3次簡化:
在每一個帶調音節的多個異拚拚式之中,規定某一個拚式為基本拚式。組成一個漢詞的任何一個漢字的異拚拚式都可以用基本拚式加以代替,隻要這種代替不會造成同音同調的漢詞產生同形。這種異拚拚式的替換為字本位向詞本位轉化,為區分同音字的拚音文字向純拚音文字的轉化開啟了一道方便之門。
這3級簡化不光應用於多字詞,也適用於單字詞,也就是漢字。
為了照顧初學者,可以規定,即使任何一級簡化造成了多個同音同調漢詞的同形現象,在實際應用當中,仍然允許廣大的學習使用者進行這種簡化。並且規定這樣做不是寫錯白字,而是寫一種合理合法的簡化字。初學者,例如1,2年級的學生,學習漢語的老外,在開始學習的時候,可以隻需要學習由基本拚式所組成的漢詞,然後在以後有時間的情況下,學習其他異拚拚式和意符。這樣可以使得漢語拚音文字學習的難度是逐漸增加的,而不是象原漢字那樣,初始門檻過高,給許多人(古代廣大的下層民眾,現代大量的老外)造成難以逾越的障礙。同時,因為異拚表調規則的簡單性,初學者很容易在短暫的培訓之後,就能夠根據拚讀規則,讀出所有的拚音文字,雖然不一定會寫,不一定懂得含義,但是能夠讀出來。就像東南亞某些國家的華人在學習漢字的時候要求能夠認識繁體字,寫出簡體字,叫做“識繁寫簡”一樣,漢語拚音文字的初學者,在初學階段,就能夠做到“識難寫簡”。
一方麵,在異拚和意符的幫助之下,漢語拚音文字是一個全麵,完備,精確,嚴密的文字係統。另一方麵,在逐級簡化的輔助之下,漢語拚音文字同時也是一個簡單,易學,包容,開放,多元的文字係統。從而,漢語拚音文字做到了精確與簡單兼顧。
10.3 分詞連寫規則
在我的漢語拚音文字方案中,存在三種漢詞:單字詞,多字緊致漢詞和多字鬆散漢詞。由單個漢字組成的漢詞叫做單字詞。由多個漢字組成的漢詞,漢字之間沒有任何附加符號,漢字直接連寫在一起的,叫做緊致漢詞,簡稱緊詞。緊詞內漢字的連寫有時候叫做全連寫。由多個漢字組成,漢字之間使用了符號“-”的漢詞,叫做鬆散漢詞,簡稱散詞。散詞內漢字的連寫有時候叫做半連寫。在書寫文章句子的時候,漢詞之間需要用空格分開,組成同一個漢詞的漢字之間則不需要。
一個字組,既可能是多個單字詞組成的詞組,也可能是多個漢字組成的一個緊致漢詞,還可能是多個漢字組成的一個鬆散漢詞。分詞連寫規則就是用來區分一個字組是一個詞組,一個緊致漢詞還是一個鬆散漢詞的文字書寫規則。
如何確定一組漢字是一個緊詞,一個散詞,還是多個單字詞呢?
規則1(句子成分規則):
當兩個漢字或者多個漢字在句子裏屬於不同的句子成分的時候,這些漢字應該屬於不同的漢詞。例如“現在開會了”這句話中的“開會”兩個字,應該屬於兩個詞,因為“開”是謂語,“會”是賓語。
規則2(散詞偏愛規則):
可分可合的,或者很難確定的,建議當作散詞處理。
規則3(雙字詞,三字詞偏愛規則):
原則上說,凡是口語中結合緊密的單位都要全連寫或半連寫成一個詞,因為文字最基本的功能是讓人去讀:讀起來合乎自然節奏,順口,意思就自然容易理解了。反過來,能夠讀得節奏正確,也說明讀者是基本理解了文章的內容。古人把正確掌握句逗看作理解文章字麵意義的主要標準,道理也是如此。總之,文字的連寫形式應該同口語節奏盡量一致,這樣才能使文字處理的視覺過程和聽話的聽覺過程這兩個語言信息處理通道的結構取得一致。
除了成語,漢詞不應該由多於3個音節所組成。因為漢語講究節奏和韻律,雙字詞和三字詞,不管是緊致的,還是鬆散的,能夠帶給我們一種節奏均勻舒緩的感覺。音節太多,一口氣讀下來,會給我們一種急迫感或者喘不上氣的感覺。我們平時在寫文章的時候,也是偏愛使用雙字詞和三字詞。
因此,當句子的某一成分包含許多音節(漢字)的時候,我們就必須把他們看成是多個漢詞。
另一方麵,在分詞的時候,盡量把單字詞連合在一起,形成雙字散詞,三字散詞,甚至是雙字緊詞,三字緊詞。比如,“開會是一種交流方式”這句話中,“開會”是主語,是一個句子成分。因此既可以把“開會” 看做是一個雙字散詞,也可以看做是兩個單字詞。按照雙字詞,三字詞偏愛規則和散詞偏愛規則,把它看做一個雙字散詞比較好。在長期的使用之後,人們就會厭煩散詞中間的連接符號“-”,逐漸省略掉它,從而散詞就會演變成緊詞。這種情況在英語中就常常發生。當然,在非常確定的情況下,也可以不用等待很長的使用時間,而直接把他們看做是一個雙字緊詞。雙字詞和三字詞比起單字詞來,另一個優點是,雙字詞和三字詞的同音同調詞非常少,在口語交流的時候不容易因為同音字詞而造成誤會。
規則4(含義轉化規則):
當一個字組的含義偏離了組成這個字組的各個單字的含義的組合或者疊加的時候,這個字組應該看做是一個緊致漢詞。例如句子“一切反動派都是紙老虎”中的“一切”的含義並不是“一”的含義加上“切”的含義,也就是“切一下”的意思,所以“一切”應該看做是一個雙字緊詞,而不是一個雙字散詞或者兩個單字詞。而在句子“你用刀一切,它就會分裂開了”這句話裏,“一切”就應該看做是兩個單字詞。在句子“我們這個動物園裏養了水牛,奶牛,野牛,北美野牛和黃牛”中,“北美野牛”和“黃牛”都是漢詞,因為他們都是代表一個物種,而從組成他們的單個漢字的含義中是看不出“物種”這一信息的。而在句子“白牛,黑牛,黃牛,花牛滿山遍野”中,“黃牛”就不應該是一個緊致漢詞,隻能看做是一個散詞或者兩個單字詞。按照雙字詞,三字詞偏愛規則和散詞偏愛規則,把它看做一個雙字散詞比較好。同時,把“白牛”,“黑牛”,“花牛”也看做是雙字散詞,把“滿山遍野”看做是成語,讀起來就非常有韻律感。同理,“河馬”,“海馬”,“斑馬”應該是緊詞,“白馬”,“黑馬”,“棕紅馬”應該是散詞。
規則5(外來語引入規則):
當一個字組是外來語某一個單詞翻譯而來的時候,不管是音譯還是意譯,都應該看做是一個緊詞。例如“民主”,“民族”,“自由”,“布什”,“沙發”,“雷射”,“激光”,“互聯網”,“萬維網”,“硬件”,“軟體”等等。
規則6(翻譯一致規則):
利用英語的詞匯來確定漢語拚音文字的分詞準則。也就是說,如果一個字組在翻譯成英語的時候能夠翻譯成一個英語單詞,那麽這個字組在漢語拚音文字中也應該被當作一個緊詞來看待,不管這個漢詞是不是外來語。例如“生物學家”的英文說法是“biologist”,是一個單詞,所以“生物學家”在漢語拚音文字裏就應該是一個緊詞。
以上是幾個分詞連寫大的原則。從這些原則中可以看出,分詞是與漢詞的含義和來源,以及組成漢詞的漢字的含義和來源有著密不可分的關係的。或者說,分詞的依據就是漢詞的含義或者來源。按照這些原則,下麵我們給出劃分句子為單詞的具體步驟。分詞應該是以句子為環境的,脫離開環境來談論分詞是沒有意義的。這是因為漢語文字是一個嚴重依賴上下文的文字。漢詞的含義,漢字的含義,許多都是必須利用上下文才能夠確定下來。
分詞步驟
第1步,劃分句子成分。
句子成分包括主語,謂語,賓語,補語和句子狀語。定語隻是主語,賓語或者補語的子成分,而不是句子一級的組成成分,所以與其他成分不在一個級別上,不能夠與其他成分平起平坐。同理,謂語狀語隻是謂語的組成子成分。
按照分詞第1規則,漢詞不可能跨越句子成分。也就是說,句子的不同成分必然是由不同的漢詞所組成。根據句子成分的劃分,可以把組成句子的所有漢字劃分為幾個不同的字組。在字組之間加入空格,這就是分詞的第1步。
一個句子可能由幾個並列從句組成。這種情況下,應該首先把句子劃分為從句,在從句,以及連接從句的連接詞之間加入空格。然後每個從句再劃分為主語,謂語,賓語,補語和句子狀語。由幾個並列從句組成的句子叫做複合句,否則叫做簡單句。由於對複合句的從句的分詞步驟與對單個簡單句的做法完全一樣,所以以下的討論都隻針對簡單句。
第2步,劃分句子成分的子成分。
主語,賓語或者補語都是由中心成分與修飾成分組成的。中心成分由一個或者幾個並列的名詞組成。修飾成分則由一個或者幾個定語(包括形容詞從句,形容詞短語,或者形容詞)組成。
謂語也是由中心成分與修飾成分組成。中心成分由一個或者幾個並列的動詞組成。修飾成分則由一個或者幾個謂語狀語(包括副詞從句,副詞短語或者副詞)組成。
句子狀語也包括副詞從句,副詞短語或者副詞,是修飾整個句子的。在第1步,句子狀語已經與主語,謂語,賓語等其他成分劃分開來。由於它與謂語狀語的組成方法完全一樣,所以這裏就不單獨討論了。對它的進一步劃分,可以參照以下對謂語狀語的進一步劃分的方法。
2.1步:在除了名詞(包括代詞,數詞,量詞),動詞,形容詞和副詞之外的其他虛詞(包括連詞,介詞,感歎詞,擬聲詞,語氣助詞,不包括結構助詞)的前後添加空格,把所有的虛詞與其他成分區分開來。剩下的都是由名詞及其定語組成的字組,或者動詞及其狀語組成的字組。這些字組仍然是由中心成分(名詞,動詞)與修飾成分(定語,狀語)組成。
如果一個修飾成分所修飾的中心成分已經被虛詞所分開,那麽該修飾成分也應該與其所修飾的中心成分用空格分開。例如,如果“病牛和羊被處理掉了”這句話中,“病”所修飾的是“牛”和“羊”,而不隻是“牛”,那麽它就應該與“牛”分開,寫做“病 牛 和 羊 被 處理 掉 了”;否則,如果“病”隻修飾“牛”,那麽就不一定需要分開,寫做“病-牛 和 羊 被 處理 掉 了”,或者“病牛 和 羊 被 處理 掉 了”。
對於結構助詞“的”,“地”,“得”和“之”,分兩種情況處理。如果這些助詞前麵的修飾成分不止一個,或者修飾成分的字數大於3,那麽這些助詞的前後都要加空格;否則,隻需要在這些助詞的後麵加空格。例如,“受傷的 牛”,“受傷 和 死掉 的 牛”;“緊張地 比賽著”,“極其緊張 地 比賽著”,“壞得 很”,“卑鄙 無恥 下流 得 很”,等等。
虛詞內部的漢字之間全連寫。
2.2步:在用虛詞分開之後的任何一個部分當中,如果至少存在3個成分(可以是修飾成分或者中心成分),並且其中至少有1個成分的字數超過2個,那麽成分與成分之間應該添加空格加以分開,也就是把每一個成分看做是由不同的漢詞組成。
2.3步:如果隻存在2個中心成分,並且其中至少1個中心成分的字數超過3個,那麽這2個成分之間也要加入空格,劃分成不同的漢詞。
剩下的情況包括,(1)隻存在2個成分,1個是修飾成分,1個是中心成分,成分的字數沒有限製;(2)隻存在2個成分,而且都是中心成分,但是每個成分的字數都不超過3個;(3)存在至少3個成分,但是每1個成分的字數都不超過2個。這3種情況是最難於分詞的情況。以下的規定是我個人的看法,有很多值得商討的地方,寫出來共大家討論。
2.4步:規定,(1)如果這個字組(盡管是由幾個成分組成的)是某一個外來詞的音譯或者意譯,那麽直接連寫,例如“馬克思主義”,“共和國”,“考古學家”;(2)如果這個字組在翻譯成外語,尤其是英語的時候,能夠翻譯成一個詞,那麽直接連寫,例如,“公牛”,“牛奶”, “楊樹”,“柳樹”;(3)如果這個字組的含義偏離了各個成分的含義的組合或者疊加,那麽直接連寫,例如,“黃牛”,“老黃牛”,“馬上”,“海外”;(4)對於其他情況,包括無法確定,或者不知道是不是外來語,能不能翻譯成單個外語單詞,含義有沒有轉化的情況,規定,如果所有成分的字數加起來大於4,那麽分寫各個成分。成分之內,按照下一步所述方法進行連寫或者分寫。如果所有成分的字數加起來不大於3,那麽各成分之間,以及成分之內漢字之間用“-”連寫,或者按照國家發布的漢語拚音正詞法規則連寫或者分寫。
第3步:劃分修飾成分的子成分。
修飾成分包括定語(形容詞從句,形容詞短語,形容詞),狀語(副詞從句,副詞短語,副詞)。狀語又分為謂語狀語和句子狀語。
修飾成分可以嵌套。也就是說,修飾成分本身還可以進一步劃分為修飾子成分和中心子成分。例如“古生物學家”這個字組,“古生物學”是修飾成分,“家”是中心成分。“古生物學”本身又可以劃分為“古生物”這個修飾子成分和“學”這個中心子成分。“古生物”還可以進一步劃分為“古”這個修飾子成分和“生物”這個中心子成分。“生物”又可以劃分為“生”這個修飾子成分和“物”這個中心子成分。一個多層嵌套的修飾成分和多個同級並列的修飾成分是不一樣的。一個多層嵌套的修飾成分在我們上麵的討論中,仍然隻是被看做一個修飾成分,而不是多個。
既然修飾成分本身可以進一步劃分為修飾子成分和中心子成分,那麽對修飾成分的劃分方法就完全可以模仿第2步的方法,並且這一方法可以一直應用到各個嵌套的子成分中去,直到子成分是由一個漢字所組成。
第12節 其他考慮
11.1 特殊拚寫
一=i,的=d,了=l,個=g,和=h,子=z
隻有作為單音節詞的時候才允許這樣特殊拚寫。
11.2 隔音符號
原漢語拚音方案中的隔音符號是為了用來區分音節的。主要用於當第2個音節是零聲母音節的時候。在我的這個拚音文字方案中,擴展使用隔音符號。在前後兩個音節容易混淆的任何情況下,都可以使用隔音符號。例如,當第1個音節最後一個字母是“n”或者“g”,第2個音節的第1個字母是“y”或者“w”的時候,為了避免把“ny”,“nw”,“gw”看做屬於同一個音節,需要在他們之間加入隔音符號。例如,“禁煙=jyn’yan”,而不是“jynyan(=紀念)”。
繼承漢語拚音方案的規定,當不存在隔音符號的時候,拚式中間的輔音字母盡量與後麵的元音字母相拚,而不是與前麵的元音字母相拚。例如,“jynyan =jy’nyan = 紀念”,而不是“jyn’yan( 禁煙)”。
11.3 數目字的表示
漢語現在所用的數字係統是四位一進的“萬進製”,多數外語采用的是三位一進的“千進製”。因此,大數目翻譯實際上需要一個在千進製和萬進製之間的換算過程,而不僅僅是一個單純的翻譯過程。四位一逗的寫法隻解決了閱讀方便的問題,而沒有解決翻譯麻煩的問題。考慮到數量信息在國際交往中的頻繁性,考慮到大多數國家的習慣,也考慮到國際度量衡一千克進到一噸以及三維度量等等的三位進製常規,從長遠看,漢語最好也改為千進製,取消“億、萬”,向國際化靠攏,與阿拉伯數字書寫接軌,啟用漢語已有的另一套千進製:千、兆、吉,分別對應thousand,million,billion。“170千”就是“170 thousand”,寫做“170,000”。“13兆”就是“13 million”,寫做“13,000,000”。
我的這個漢語拚音文字方案決定采用“千進製”,與國際接軌。
11.4 人名地名拚寫法
句子開頭的字母和詩歌每行開頭的字母大寫。人名,地名等等專用名詞,第1個字母大寫,與英文的做法完全一樣。
11.5 外來詞拚寫法
外來詞采用以音譯為主,以意譯為輔的做法。由於意譯的難度比較大,用漢語傳統的以字組詞的方法,來創造出一個與原文單詞含義相同或者接近的漢詞的可能性非常小,所以,大部分外來詞,使用音譯。這樣做可以非常快捷方便的吸收外語詞匯,為我所用。在突飛猛進的現代化麵前,不會因為翻譯不了而延誤學習時間,翻譯不準而造成理解錯誤。
不提倡象英語那樣直接使用外來語的原形拚式。因為外語的拚音規則與漢語的拚音規則不可能完全相同,如果使用了外來語的原形拚式,沒有學習過外語的廣大的中下層群眾,很可能讀不出來。而且,時間一長,外語的拚音規則就會破壞漢語的拚音規則的簡單一致好學的特點,造成象英語那樣拚讀規則複雜,例外極多,因而逐漸演變成為一種不能夠準確地拚音的拚音文字。我們應該學習法語,德語,俄語的做法,按照外來語本來的發音,用自己的拚音規則重新拚寫外來語單詞的詞形,使得外來語詞匯成為能夠與本國語詞匯完全融合的漢語詞匯的一部分。
當然也不排除某些外來語詞匯直接使用原拚式,隻要這些原拚式符合我們自己的拚音規則,或者能夠用我們自己的拚音規則讀出來。
音譯的時候,所有音節使用異拚基本拚式拚寫。重音音節用4聲(去聲)或者1聲(陰平)的基本拚式拚寫,其他音節用輕聲的基本拚式拚寫,輔音也用輕聲的基本拚式拚寫。由於1聲與輕聲的基本拚式相同,所以單從拚式上是看不出來哪一個音節是1聲,哪一個音節是輕聲的。因此規定,在所有音節都是1聲或者輕聲的時候,規定倒數第2音節讀1聲,其他全部讀輕聲;在有1個音節是4聲的時候,其他音節全部讀輕聲。例如,“Bush”應該拚寫為“Bwshi”;“Clinton”應該拚寫為“Kelinten”。
11.6 縮略語拚寫法
第1,可以象原中文那樣,取每一個漢詞的第一個音節,把幾個漢詞縮略成一個漢詞。例如“人大= 人民代表大會”,“國標=國家標準”等等。
第2,可以象英語那樣,取每一個單詞的第1個字母,拚寫在一起,作為縮略語,把幾個單詞縮略成一個單詞。例如,“dzjsj = dyanzii jyswanji = 電子計算機”。
第3,可以象古文那樣,取第1個音節的聲母,第2個音節的韻母,拚寫在一起,把兩個音節縮略成一個音節。這種方法叫做反切法。例如“甭= bwng = bu ywng = 不用”,“byaw = bu yaw = 不要”,“zyangzi = zheh yeang zi = 這樣子” (網上現在用“醬紫 =這樣子”),等等。
11.7 移行規則
與英文的移行規則相同。屬於同一音節的字母必須書寫在同一行內。屬於同一單詞的不同音節寫在不同行內的時候,前一行最後一個音節的後麵要附加“-”。
11.8 標點符號使用法
使用英文的標點符號來標示漢語拚音文字,而不是使用原中文所使用的標點符號。