一、引言
“语言”是“民族”认同的要素之一。“汉语”的形成机制,无疑是“汉民族”起源的关键问题。它的方言分布,为这个问题提供了洞察性的信息。以“北方官话”和“西南官话”所代表的“北方汉语”语音的统一性,表明它是一种传播和融合性的语言;相反,在种类繁多的“东南方言”间,却非常缺乏互懂性,这又显示它们可能都是较孤立的原生性语言。有人认为,汉语方言之间的差异性,可与欧洲语言的多样性相比拟[1]。
然而,“北方汉语”却又有着并不亚于“美洲英语”的统一性。
后者产生于欧洲诸国大量移民的近三百年间;而“北方汉语”的出现,则至少可以追溯到四千年前。这种“大一统”现象,使我们猜测:“北方汉语”不可能形成于人类之初,它必定是在一个漫长时期里,由许多不同部落的原始语言融合而成的。那时候,在黄河流域一定发生过大规模的民族迁徙和融合活动。
现代语言学是将“汉语”归属于“汉-藏缅语系”的,这种极具学术说服力的理论,使人们开始积极地注意“藏缅语”与“汉语”间的关系;但同时又使人们忽视了其他语言在“汉语”形成过程中的重要作用。其实,在“古代中原汉语”形成前的时代,黄河流域的许多历史、语言、人类的问题,都是值得我们去深入研究的。首先,“中原居民”与北方“戎狄诸族”直接相邻,他们之间不可避免地会有血缘上的联系;其次,基于对地缘和人口的考量,似乎不应是“藏民族”本身,而是其他“藏缅式语言”的载体部落参与了“中原汉语”的形成。然而,“北方诸族语言”与“藏缅式语言”,又有着截然不同的语系分野。因此,辨明中原地区各古代民族来去的方向,及其语言的“先后”、“主客”和“转换”关系,将是认识“古代中原汉语”形成的先决条件。
有许多证据可以表明,所谓“北方诸族”是在远古时期从中原地区出走的。这些“北狄”部落在草原地带,因改营游牧而获得了巨大迁徙能力;所谓“西戎”民族,也就是沿河套通道转徙陕甘宁青,尔后再经河西走廊扩散至中亚、南亚、东欧地区的“北狄”部落[2]。正因此,“北狄”和“西戎”的许多部落名,乃至“西域”的族国名,都可以在古代中原部落的历史中追溯到它们的始源;反之,“华夏民族”民族的许多语言信息,亦可以在欧亚草原上去寻觅它们的去踪。“北狄”、“西戎”与“中原部落”间的这种同源关系,正是现世所谓“通古斯”、“蒙古”、“突厥”语的成分,在“汉语”中有着举足轻重分量的根本原因。
事实上,一些传统观念,非但无助于这些问题的认知,反而堵塞了人们的思路。首先,在没有搞清亚洲东部人类的来去始末的情况下,就将“黄河流域”当作是“中华民族的摇篮”,而且一味地强调“汉民族”及其语言自北向南的扩散过程;从而完全抹煞了他们远祖是来自南方,而且还不断受到后续而来的南方民族和语言的影响的事实。二十世纪七十年代以来,浙江的“河姆渡文化”和湖南的“城头山遗址”等考古发现,震撼了世界各国学术界,这些七千至九千年前的古代农耕文明的出土,有力地表明:长江流域有着更早的人类社会活动。其次,以现代基因科学为基础的人类学的研究,也发现亚洲东部人类男性Y-染色体种类,自南向北渐趋单纯的瓶颈现象[3]。这些考古学、基因─人类学的研究成果,重现了古代人类迁徙活动,这也为“汉民族”和“汉语言”的形成机制提供了线索。
然而,“语言”本身就是人类历史的一种“化石”。例如,“族名”作为血缘的语音标识,可能产生于人类语言的早期发展阶段。而“族名”(亦即“姓氏”)又往往会转化为“人名”和“地名”。一个很有说服力的例子是,白令海峡两侧的地名或原住民的族名:“爱斯基摩”(Eskimo)、“楚克奇”(Chukchi)、“阿留申”(Aleutian)等,很像“通古斯”族名“兀者”、“沮渠”、“挹娄”。甚至在“阿拉斯加”一侧的“尤比克语”(Yup'ik)中,还保留了为数不少的“通古斯语”的基本词汇;但是,尤比克语中的“基数词”不仅与通古斯语完全不同,而且还具有“五进位制”的特征[4]。这表明:可能是在“通古斯语”的“数词系统”产生之前,这些“爱斯基摩”人的祖先,就带着他们的“族名”,离开了东北亚地区的“通古斯民族”部落群体。
不少人企图从“地名”去为“民族”寻根。例如,在满、蒙地区就可以找到许多个“鲜卑山”,我们能否就认为它们都是“鲜卑民族”的发源地了呢?事实上,上古人类是不可能先为山川河流,而后为自身血缘命名的;这些山水地名不过是“鲜卑部落”迁徙活动的遗迹而已。同样,人们寻找“族名”的语义,也往往是徒劳的。像“爱新”(通古斯语“金”)、“阿巴嘎”(通古斯语“天”)、“叱奴”(蒙古语“狼”),这样一些保有语义的族名,是为数不多的。“语种”的湮灭在历史上从未休止过;然而,人们却并不因为语言的更替,而轻易放弃自己的“族名”或“姓氏”。在古代部落及其语言的兴亡融合中,大量的“族名”早已丧失了它们曾经有过的含义;那些探索“突厥”、“蒙古”、“女真”,乃至“华夏”这样的族名的语义的努力,还不是统统都归于失败了吗?
由原始“族名”发展而来的“地名”和“姓氏”,无疑是人类语言最深层的沉淀;由于它们大部分没有语义内涵,因此也不再迁就语言的游移变幻,从而成为语言中较稳定的语音成分。
因此,揭示“地名”、“姓氏”,乃至“人名”的族属、语属信息,是历史语言学的最基本的研究内容或方法。而中国历史又恰恰在这些方面为后人提供了丰富的记载。
例如,《逸周书?王会解》,就是一部较准确地记载异族族名的先秦古藉。在该书的“伊尹朝献篇”中,记载了:“正北空同、大夏、莎车、姑他、旦略、貌胡、戎翟、匈奴、楼烦、月氏、纤犁、其龙、东胡,……”等族名,其中“大夏”、“东胡”、“匈奴”、“月氏”等,皆世人熟知的北方大族;而“貌胡”、“莎车”、“旦略”、“戎翟”、“楼烦”、“纤犁”和“其龙”等,则是屡见于史载的族名“□”、“狄”、“同罗”、“如甲”、“术和”、“敕勒”的异写。惟“空同”(khong-thong)和“姑他”(kha-tho),似不显见于后史记载。
其实,“空同”和“姑他”,很可能是两个同源的族名。《晋书》的“乌谭种”[5];《魏书》的“渴单氏”[6],和“柔然”初附之“纥突邻”[7]部;辽代“五国部”的“越里笃”[8],可能都是它们的变音。《汉书》记载的“塞种”部落“捐毒”或“尉头”[9],则可能是它们远涉中亚的同源族类。“于阗”或“和阗”,又是这些部落在西域聚居而形成的族国名。是《史记》最早记载了“于阗”[10],《大唐西域记》和《新唐书》也都提到过它[11],《秘史》将其作“兀丹”[12],《元史》则作“斡端”或“忽炭”[13]。实际上,中原地名“邯郸”、“洪洞”、“滹沱”,都是它们最恰当的对音。从这两个族名的语音解析,我们或许可以瞥见源自中原的古代人类部落,在整个欧亚大陆上的流动状态。
“中原地名”与“北方族名”之间的关联,是相当普遍的现象。
《史记》的“昔唐人都河东,殷人都河内,周人都河南”[14]的“三河”地区,必是“华夏民族”的根本之地。春秋时,那里有“北虢”、“东虢”、“大卤”、“曲沃”、“令狐”、“羁马”、“狐厨”、“篪祈”等地名[15],它们显然与“仆骨”、“东胡”、“同罗”、“昭武”、“术和”、“且末”、“兀者”、“赤狄”等族名相对应。又如,中原“戎”名“扬拒”、“伊雒”、“陆浑”、“瞒”、“皋落”等[16],又与“按出”、“挹娄”、“术和”、“悉万”、“斛律”对应。这些关联现象,不仅是北方诸族出自中原的证据,也是确认中原古代居民族属的判据。
应该说,一些与先秦人名相关的语言-族属信息,也一直没有为人们所重视。例如,“舜”的生母之名“握登”[17],是否就是蒙古语中的“夫人”-“合敦”一字呢?又如,“商王朝”的直系后裔,“宋国”的末代诸侯“景公”名“头曼”[18];一个匈奴单于[19]之号,亦为中原王公之名,莫非远在漠北的某些“匈奴部落”,与世居中原的“商部落”是同源的吗?再如,在与“北方诸族”打了数千年的交道后,我们或许会联想:“东郭”、“东方朔”、“孟尝君”、“扶苏”、“胡亥”、“伍子胥”、“无忌”这样的一些古代人名,可能就是由“屠各”、“东胡”、“□”、“密须”、“回纥”、“兀者”这样的族名转化而来的。而《史记秦本纪》所记载的:“大费”、“蜚廉”、“太几”、“大骆”、“奄息”、“到满”、“乌获”、“孟说”、“白起”、“恶来革”、“百里奚”、“里疾”等人名,则无一不是“胡名”、“胡姓”[20]。
当然,对“族名”、“地名”、“人名”的研究,必然会涉及汉语古代语音问题。清代以来的中外文字语言学者们对先秦语音的研究,基本是在中古《切韵》系统上从事反推。一些学者客观地指出,作为规范汉语语音的一种努力,《切韵》等书也把许多“古音”抹煞掉了[21]。要重现这些“古音”,选取一些非汉语的对照系统是至关重要的。例如,梵语和汉语的译音比较,曾对认识唐代语音起过有益的作用。又如,藏语和汉语间的比较,则划时代地推动了汉-藏缅语系在发生学意义上的研究。而近百年来,西方历史-语言学者对古代西域地名、族名、人名,怀有极大的学术兴趣。例如,蒲立本(E.Pulleyblank)在他的《上古汉语的辅音系统》一书中,就以相当的篇幅讨论了“和阗”、“焉耆”、“龟兹”、“且末”、“蒲类”、“拘弥”、“贵霜”、“奄蔡”、“乌弋山离”[22]、“丘就却”这样一些译名的音值;西方人很精明地看到,从中可以发现上古汉语的一些语音线索。
事实上,对先秦文献记载的中原人名、地名,与历代北方族名、人名的比较,不仅具有“语音学”的研究价值;我们还可以从“人类学”的角度,去更深刻地去解析“汉民族”极其语言的融合成分。
二、春秋时期齐鲁地区住民的族属分析
相对于“夏”、“商”、“西周”三朝来说,“春秋”是一个仕农工商全面发展,文化教育长足进步时代。而春秋时代的“齐鲁”地区,又是中原农业文明的中心,《史记》是这样地描写那里的经济文化的状况的[23]:
泰山之阳则鲁,其阴则齐。
齐带山海,膏壤千里,宜桑麻,人民多文采布帛鱼盐。临淄亦海岱间一都会也。其俗宽缓阔达,而足智,好议论,地重,难动摇,怯于众斗,勇于持刺,故多劫人者,大国之风也。其中有五民。
而邹、鲁滨洙、泗,犹有周公遗风,俗好儒,备于礼,故其民龊龊[24]。颇有桑麻之业,无林泽之饶。地小人众,俭吝,畏罪远邪。及其衰,好贾趋利,甚于周人。
像孔子这样的一位“专业”的“思想家”、“教育家”出现在鲁国地方,是齐鲁地区的经济发展,带动文化教育事业的必然结果。
西周的“宋”、“卫”、“鲁”三国,是“商王朝”的故地,其居民自然多是“殷之余民”[25]。孔子的家乡“曲阜”,是周公的封邑,鲁国的都城。史载说:“鲁国,古奄国”。而“鲁国”亦称“商奄”,那是因为商王“南庚”和“阳甲”两代都“奄”的缘故[26]。“南庚”与女真姓氏“粘葛”[27],“阳甲”与族名“弘吉[剌]”很接近;学界一般也认为“商族”与“东夷系”(通古斯系)民族的渊缘较深。研究“商部落”族源有着特殊重要的意义,因为正是他们创制了“甲骨文字”,这于“汉民族”及其语言的形成来说,是个至关重要的里程碑。
《史记仲尼弟子列传》所记载的孔子的七十七个平民学生[28],都是出自“商奄”周边诸国,他们的姓名则为我们检索的“商族”居民的族属,提供了一套可靠的姓氏标本。孔子的这些弟子的姓氏,与后世汉族“张、王、李、赵”式的姓氏大异其趣,它们无疑都是一些古代中原的部落-氏族名;而这些姓氏与北方诸族族名的相似性,则又揭示了中原古代居民与中国北方民族同源的事实。
本文的姓氏研究始于孔子学生中的含“公”诸姓。基于这些姓氏与北方诸族族名的比较,我们归纳和推测了古代姓氏中“公”字的音值。在各种科学方法中,“猜想”(conjecture)是一种重要的“假设”手段,它不一定能为“推理”(deduction)的方法所求证,但却为无数的事实所肯定[29]。现代语言学者关于汉语古代语音的诸多“构拟”,即是使用这种方法的。
“公”姓诸生
在孔子的七十七个弟子中,含“公”字的姓氏有九种、人数则达十一人之多:“公冶长,齐人,字子长”;“公皙哀字季次”;“公伯缭字子周”;“公西赤子华”;“公孙龙字子石”;“公祖句兹字子之”;“公良孺字子正”;“公夏首字乘”;“公肩定字子中”;“公西舆如字子上”;“公西箴字子上”。此外,《史记》还说:“黄帝者,……姓公孙”[30]。因此判定这些含“公”姓氏的族源,对于中原古族的研究是至关重要的。
汉字“公”,有“祖父”、“男士”、“雄性”,和文化层面的“公正”、“无私”等意义;古代姓氏中的“公”,看来与这些语义是无关的。有人说,“公孙”是“公之孙”,“公伯”是“公之伯”,“公祖”乃是“公之祖”,这大概都是些无稽之谈。我们可能还是应该从语音上来寻找它们的族名之源。
从字形上来看,“公”与“瓜”有相像之处;但是“公”和“瓜”究竟是否相关?或究竟如何相关?从文字考据的角度来说,是颇难求证的。然而,“瓜”可以衍生出“孤”和“狐”等字;我们也若将“公”作“乌”、“兀”、“斛”、“纥”读,所有含“公”姓氏[31]与北方诸大族族名的关联,倒是一目了然的了:
“兀者”:公祖、公肩、公车、公仇、公畴、公季、公甲、公建、公坚、公期、公旗、公綦、公之、公朱、公仲、公子、公族、公左;
“回纥”:公夏、公甫、公房、公父、公翰、公何、公户、公扈、公华、公为、公巫、公务、公右、公玉、公阅;
“乌孙”:公孙、公山、公上、公申、公慎、公胜、公献、公襄、公行、公宣;
“纥奚”:公西、公皙、公师、公施、公石、公士、公思、公息、公析、公绪;
“曷萨”:公沙、公若、公帅、公索、公叔、公休、公输;
“斛律”:公良、公林、公刘、公留、公旅、公牛;
“纥突”:公涛、公佗、公德、公都、公堵;
“巫马”:公孟、公明、公罔、公文;
“呼延”:公冶、公言、公羊;
“阿巴嘎”:公伯、公宾。
据此,“公”的读音为“乌”或“兀”,不失是个普适的归纳和成功的猜想。对传统的观念,它或许也会形成某种挑战,例如“黄帝”既姓“公孙”,也必是“乌孙氏”;而“乌孙氏”很可能就是“爱新氏”[32]。这无疑揭示了“中原民族”与“通古斯系”是有着深度渊缘的。至于那种“乌孙”是“印欧人种”的说法,则本来就是没有什么根据的。
“□”氏诸生
孔子弟子有五人的姓氏含“□”字:“耕字伯牛”,“雍字仲弓”,“求字子有”,“孺字子鲁”,“季字子产”。一般认为“□”字即是“冉”字。其实,它是“内”或“南”的别写;这个说法可能较少质疑,因为“楠”字,亦是作“□”写的。“□”从“泥母n”,读“纳”、“奴”、“粘”、“囊”皆可。“耕”、“雍”、“求”、“季”等,可能与女真姓氏“粘葛”、“纳合”、“纳吉”相关。而“孺”则可能是蒙古语的“太阳”nar,或naran(“纳兰”)一字。
除上述含“□”诸姓氏外,诸弟子中还有“南宫括字子容”和“壤驷赤字子徒”者,另如商王“南庚”,“卫灵公有宠姬曰南子”者。 这些“南宫”、“南庚”、“壤驷”、“南子”,以及古代姓氏“淖盖”和“淖齿”,当然都是“耕”和“季”等的变音或异写。传说中Nakuz(“耕”?)是蒙古民族祖源氏族之一[33];而Nagy(“季”?)又是现代匈牙利头号大姓。
“颜”、“燕”、“原”氏诸生
在《同源字典》中,王力先生曾就“安”、“焉”、“恶”、“乌”四字的同源性,进行过充分的论证[34]。“安”、“焉”(an),与“恶”、“乌”(a、ak、al)间的音转,本与n和l间的谐变有关;这种谐变出现在字首,就有“南”和“兰”之通;发生在字尾,则是“安”和“乌”之转。《魏书》人名“张焉豆伐”[35],《北史》记作“张乌豆伐”[36],就说明“焉”和“乌”是音通的;这也是我猜测“焉耆”即“兀者”,“安息”即“乌孙”的依据。an和al间的变换,在北方诸族语言中表现得更明显,“金”字在通古斯语既作“按出”(an-chu),亦作“阿勒楚”(al-chu);反之,山名“阿尔泰”(al-tai),亦作“按台”(an-tai)。
“颜”(ian)与“焉”音同,常作“安”(an)读;基于上述的音转讨论,它当然也可以转读作“乌”或“兀”(al)。因此,孔子的五名“颜”姓弟子的姓氏:“颜回”、“颜无”、“颜高”、“颜哙”、“颜何”,可能就是族名“乌护”、“护骨”、“回纥”的转音,而“回”、“无”、“高”、“哙”、“何”,则是“东胡-鲜卑系”氏族名后缀“古”、“骨”、“纥”、“胡”等。
孔子的另外四名学生:“颜幸字子柳”,“颜祖字襄”,“颜之仆字叔”,“燕字思”的姓氏“颜幸”、“颜祖”、“颜之”、“燕”等,显然就是通古斯族名“爱新”、“按出”、“奄蔡”、“安息”。另一名“原宪字子思”之姓“原宪”当是“元宪”或“兀宪”[37],或即“乌孙”之异写。
按此分析,孔子的“颜”(含“燕”、“原”等)姓诸生,可以分成“东胡-回纥”和“东夷-爱新”两系,而这些学生又多为“鲁”、“卫”人士。称“鲁国”及周边地区为“奄地”,或许与诸多“颜”姓部落聚居在那里有关。
“高柴”、“后处”
仲尼弟子中有“高柴字子羔”者。“高”字可能不是读作gao或kao,而应该是读作ghao、khao、hao或ao的;事实上,由“高”字衍生出来的“蒿”、“镐”、“毫”、“豪”等字,也都是读hao的。如是读来,“高柴”和另一名学生“后处字子里”之姓“后处”,都应当是“兀者氏”无疑了。
求得“高”字的读音,也识得了先秦文献中的“高辛氏”的族源,它显然就是通古斯系的“爱新氏”或“乌孙氏”。今商丘南二十余公里处,还遗有地名“高辛镇”[38],从种种方面来看,“高辛氏”都是“商族”的核心部落。在《左传昭公元年》,有这样一段记载:
晋侯有疾,郑伯使公孙侨如晋聘,且问疾,叔向问焉,曰:“寡君之疾病,卜人曰:‘实沉、台骀为祟!’史莫之知。敢问此何神也?”子产曰:“昔高辛氏有二子,伯曰阏伯,季曰实沉,居于旷林,不相能也,日寻干戈,以相征讨。后帝不臧,迁阏伯于商丘,主辰,商人是因,……迁实沉于大夏,主参,唐人是因……。昔金天氏有裔子曰昧,为玄冥师,生允格、台骀”。
此中,“金天氏”当是“爱新-阿巴嘎氏”;“阏伯”即是“阿巴嘎”;“实沉”就是“息慎”;“允格”和“台骀”则分别是通古斯-满语的“哥哥”和“弟弟”;“玄”字意“黑”,它可能是通古斯语“黑”字“萨哈连”的缩音,“玄冥师”可能就是古已有之的“萨满”巫师。
“子产”姓“季”(“纳吉”),是个通古斯系的姓氏。他对先世的传闻掌故颇有了解,一段短短的答辩,竟包容了通古斯民族的丰富信息。从这些对话也可发现,春秋时代的中原诸国民众,除少数知识分子外,都已不通祖语了。
“任不齐”、“宓不齐”、“罕父黑”
这三个姓氏可能与族名“阿巴嘎”,和变自“阿巴嘎”的人名“阿保机”[39]等有关。波斯文献《史集》在谈及元蒙时代的“钦察”部落时说[40]:
……乌古思称他为“钦察”(q(i)bjaq)。这个词由“合不黑”(q(a)buq)一词派生来。“合不黑”为突厥语“空心树”之意。所有的钦察人都出自这个幼儿……
q(a)buq就是“阿巴嘎”,《金国语解》中亦作“呵不哈”,余大均先生将其译作了“合不黑”;如将q(i)bjaq译作“阿巴察”或“阿保机”,可能要更准确些,而蒙古人将其译作了“钦察”。这段记载告诉了我们,“阿保机”的确是“阿巴嘎”的变音;元蒙时代的“钦察”部落是说突厥语的,他们甚至连“阿巴嘎”的“天”意都不知道了。这个音变也可能在北方诸族的自中原出走前就发生了,先秦历史中有很多中原人士名“伯齐”或“不齐”者,它们大概都是“阿保机”的缩音。
“任不齐”就是“阿保机”,“罕父黑”则是“合不黑”;而“宓不齐”可能是“宓羲阿保机”之缩音。
“卜商”、“伯虔”、“步叔乘”、“邦巽”
“卜商字子夏”,“伯虔字子析”,“步叔乘字子车”,“邦巽字子敛”四人的姓氏,可能与出现于不同时代的“白羊”、“拔野古”、“伯岳吾”、“巴牙兀惕”等北方部落名有关。
韩儒林先生说“伯岳吾”出自“伯颜”[41],即满、蒙两语中的“富人”一字;然而,这个言之有理的说法也有可质疑之处:族名产生于远古社会,难道那时的人们已经穷富贵贱有别了吗?《史集》是将“巴牙兀惕”列在“迭儿列勤蒙古诸部落”中的,我以为“迭儿列勤”就是“朱里真”(即“女真”)之异译,它们的先祖应是“通古斯系”民族[42]。
这个氏族后来在欧亚草原上播散得很辽远。据八-九世纪的西方记载,南俄地区出现过一个凶悍部落名Pechenegs(“伯虔”?),匈牙利人称其为Bes(h)enyo(“卜商”、“步叔乘”、“邦巽”?),阿拉伯文献则记之为Bajanak(“伯颜”?),它们可能就是后来的“钦察伯岳吾”部。从这些欧亚草原上的“流”,我们可以回溯它们出自黄河流域的“源”。
“漆雕”
孔子有三名姓“漆雕”的弟子:“漆雕开字子开”、“漆雕哆字子敛”、“漆雕徒父”。《说文》说:“雕,琢也”;又说:“琢,雕也”。因此“漆雕”的读音应该是chi-tiu或chi-teok,即“赤狄”(chi-ti)之音。
不少人是用对颜色的崇尚,来解释“赤狄”和“白狄”这些部落名的,而不多有人去正视它们的音源。其实,“高车”又名“赤狄”[43],女真人也有“赤盏氏”[44],匈牙利有Csarszar氏,中亚则有地名Chirchiq;而蒙古氏名“博尔济吉”,西域族国名“薄知”、“白题”、“跋提”等[45],又与族名“白狄”可相比照。这些远离汉地的相关族名、姓氏、地名的存在,都否定了那些用“赤”、“白”之义,去猜测这些部落“尚红”或“尚白”的说法。
“施之常”,“石作蜀”
“狄”是个重要的氏族,北齐名人“狄干”是被称作“鲜卑老公”的[46]。唐代漠北“思结”部,元蒙时的“失吉”氏,入主近东的“塞尔柱人”,可能都是“狄”之裔。古代西域的“瑟底痕”[47],现代中亚的Sazagan、Shazhagay、Shizhaga等地名,想必都是“狄”部落徙居之遗存。
孔子弟子“施之常”和“石作蜀”的姓氏“施之”和“石作”,大概就是“狄”。有趣的是,据公元491年安提俄克城“约翰”的记载,有一个名叫Sigizan的Hun人,曾服役于拜占庭的军队[48],Sigizan显然就是“施之常”。
“仲由”,“宰予”
“仲由”和“宰予”,可能与族名“昭武”有关。
从北魏、隋唐起,西域河中诸邦王族皆属“昭武九姓”,据传它们都是来自河西“昭武”地方[49]。唐末敦煌西有“仲云”部落,据说是“小月氏”的遗族[50]。“昭武”和“仲云”可能都是“西戎”之裔。
今南俄地区的“楚瓦什人”(Chuwa-sh),是Hun人的后代;楚瓦什学者认为Chuwa是从Savir、Suvar、Suwar等字演变来的[51];而“楚瓦什语”又表现出许多不同于“突厥语”,而类同于“鲜卑-蒙古语”的特征。这提示了我们:“楚瓦”与“昭武”、“渠武”、“仲云”等,都可能是族名“室韦”之转音。
“司马耕”
仲尼有弟子“司马耕字子牛”者。
一般以为“司马”是从官衔转化来的。司马迁在《自序》中,却从未说过因祖上当过“司马”官,而袭了这个“司马”姓。在他的先人的名字中,除“错”、“靳”、“昌”、“宪”、“谈”等外;还有“蒯聩”、“昭豫”、“无泽”等,它们显然是“护骨”、“昭武”、“兀者”转化成的人名,太史公的家族,看来也是有着“戎狄”的血统。
人名“司马耕”、“司马迁”、“司马靳”、“司马昌”、“司马谈”,与族名“悉万斤”、“悉万丹”、“悉泯健”[52]、Sarmatae[53](“萨尔马泰”),地名Samarkand(“撒麻耳干”)等如此音似。
我想,汉姓“司马”、“西门”,胡姓“泣伏”、“乞伏”、“石抹”,匈牙利姓氏Szima等,可能都是族名“悉万”之变译。
“原亢籍”、“孔忠”
“原亢籍”、“孔忠”是两个弟子的姓氏;孔子本人也叫“孔丘”,与“孔忠”很相似。“原亢籍”可作“元亢籍”或“兀亢籍”,急读即是“王籍”或“弘吉”;我想“孔忠”和“孔丘”同样也是“弘吉”的转音。这个后世著名的蒙古氏族名“弘吉剌”,竟也是先秦中原人名。《夏本纪》记载:“帝不降之子孔甲”。“不降”当是“伯颜”,而“孔甲”自是“弘吉”。
“曾参”、“曾虔”、“颛孙”、“曹恤”、“左人郢”
“曾参”即“曾子”,是孔子最亲信的弟子。
“曾参”、“曾虔”、“颛孙”、“曹恤”和“左人郢”,很可能就是远古时代的“颛顼氏”,或后魏的北族“长孙氏”[54]。唐朝在西域所设置的府州之名,若干竟与它们惊人地相似,例如:“迟散”、“乞施献”、“骑失”、“奇沙”、“据瑟”、“遮瑟”等。迁徙中亚的东北亚族名,应是这些地名的源音[55]。
“巫马施”
与“巫马”同源的“胡名”、“胡姓”随处可见。《魏书》所记载的人名“务目尘”[56],氏族名“侯莫陈”[57];《新唐书》记载于阗王“姓尉迟氏,名屋密”[58];宋代西夏民族则有“嵬名”、“讹命”等姓氏;《辽史兵卫志》则记载了“属国军”名“乌马(山奚)”和“胡母思(山蕃)”
。这些人名-氏族名,和中原地名“侯马”、“高密”,新疆地名“哈密”(维吾尔语读“库密”),西域古国名“胡蜜丹”等,可能都源自北方族名“库莫奚”一字。我猜测后世的“宇文氏”,可能就是这个氏族。
“澹台访鹈鳌”
“澹台”当是“拓特”,即“鞑靼”之源名。蒙古人通称黑龙江、松花江、乌苏里江流域的女真部落为“水达达”,亦可见“拓特”是个通古斯系姓氏。
“灭明”,北方诸族中没有这个族名的显性记载;但西域却有“迷密国”,它是“昭武九姓”之一的“米国”,《新唐书》说:“米,或曰弥末,曰弭秣贺”[59]。“澹台访鹈鳌”。
“闵损”、“樊须”
“闵损字子骞”之姓“闵损”,应即是“宓羲”;“樊须字子迟”之姓“樊须”,可能是“伏羲”。“宓羲”和“伏羲”,应同为族名“□”、“羯”、“密须”之转音。
“句井”
“句井疆”者无字。“句井”应同“沮渠”,即“女真”或“朱里真”之异字。
“郑国”
“郑国字子徒”。“郑国”,可能是女真语中的“申科岸”,亦即“鹰鹘”[60]一字。满、蒙两族男子以此字为名者甚多。
“秦”
“秦字开”。“秦”当是后世鲜卑系民族部落名“叱奴”、“丑奴”或“叱那”,即蒙古语之“狼”字。
其他如:“单”就是“契丹”;“廉”和“荣旗”应是“如者”;“有若”是“斛律”;“梁澶”即“落坦”;“乐咳”则是“术和”。
上述的分析表明:在“中原汉语”已经形成的“春秋时代”,曾为“商族”聚居的“豫东北”和“鲁西南”及周边地区的居民,仍然保留了“夷”、“狄”民族的姓氏特征,这显示他们的确与后世远居北方的“通古斯语族”、“蒙古语族”乃至“突厥语族”有着同源的关系。他们一定是在经历过了外来部落及其“藏缅式语言”的长期影响,才转化成使用“汉语”的“中原汉族”的。
春秋时代中原地区的语言可能还相当复杂,各部落语言的“汉化”过程也并不是同步进行的,有些部落仍然在使用“戎狄”语言,《左传鲁襄公十四年》(前559年)记载了一则有趣的相关故事。吴国被楚国战败,而告于盟主晋国,各诸侯在一个叫“向”的地方聚会,主盟的晋大夫“范宣子”,逮捕了私通楚国的莒国公子“务娄”;他又怀疑“姜戎氏”泄密,而指责来会的戎子“驹支”;后者则作了一番颇长的辩解,其中言及:
我诸戎饮食衣服不与华同,贽币不通,言语不达,何恶之能为?
这无疑说明,虽然那时“汉语”已经形成通用已久,而且中原“诸戎”部落也积极参与了各诸侯国之间的政治、军事活动,但是它们所使用的语言,与中原诸国的主流语言仍然是不同的。当然,像“范宣”、“务娄”、“驹支”这样的人名的出源也都可以是我们研究的对象。
一、春秋前后“齐”、“鲁”及其周边地区的地名
尽管,许多中原部落在远古时代就逐个地离析出走了,有些则融合消蚀了,但它们仍然在黄河流域的留下了痕迹。在那些自“春秋”保留至今的中原地名中,许多就是“华夏民族”的祖先部落名。对于中原地区地名的研究,也是追溯古代中原居民族属的又一重要手段。
引言中对黄河中游“三河地区”的“地名”和“戎名”的讨论,使我们了解到那里的古代部落,与“北方诸族”有着亲缘关系。而《汉书地理志》所记载的黄河上游的“西戎”
之地,即今天的甘肃庆阳、宁夏固原、陕北延安一带的汉代地名,亦与“北狄”族名有着鲜明的可比特征。例如:
“乌氏”、“郁郅”、“月氏”即“兀者”,“木禾”即“□”,“安俾”即“阿巴嘎”,“龟兹”即“厥机”、“沮渠”,“复累”即“覆罗”,“直路”即“敕勒”、“叱勒”,“回获”即“回纥”,“朝那”即“叱奴”,“独乐”即“吐如纥”、“同罗”,如果在“齐鲁地名”与“北方诸族族名”之间,也可以发现同样的可比性,那将使整个黄河流域古代居民与“北方诸族”的同源关系,得以全面展现。而这种比较也并不是难以实现的。
《中国历史地图集》,是在二十世纪中完成的一项重大学术工程。对照该书的各代舆图,不难发现自“春秋”始,中原地名的记载数量有一个“飞跃性”的增长。它们中的大部分无疑是承继于前代的,其中还有不少一直延续使用到现代社会。这显然表明:从“春秋”起,中原社会的经济和文化形态已趋稳定。下文用于比较的“齐鲁”及周边地名都摘自《中国历史地图集》。为了弥补疏漏,我们添以若干战国和秦汉时代地名,以及个别西域族国名,来强化这个对比。如:
春秋、战国、秦、汉时代齐、鲁及周边地名北方诸族部落名
公丘、冤句、魏其、郁秩、夏丘、兀者、兀惹、(焉耆),尉氏、雍丘、于余丘东阿、东牟、东垣、东昏、单父、东胡、屠何,达斡尔,堂阜、堂邑祝其、赘其、垂葭、曲池、曲成、沮渠、厥机、主儿扯、楚丘、渠丘朱里真,女直,颛臾、丘舆、钟吾、龟阴、壮武、昭武、仲云,曲阜、曲沃取虑、昌虑、訾娄、邹卢、陈留、敕勒、叱勒,钜鹿牧丘、马泾、蔓葭、麦丘、羯、勿吉,咸丘、安丘按出虎、安车骨、(奄蔡),鲜虞、鲜牟、豕韦、司吾室韦、失韦,外黄、五吾、高鱼、武垣、滑乌护、回纥,无娄、袁娄、缘陵、胡陆斛律、乌洛侯,廪丘、闾丘、梁丘、犁丘如甲,蒲姑、平阴、符合(符离)仆骨、婆莴,符离(符合)、浮来(包来)钵利曷、步六孤、(蒲类),高唐、狐骀、邯郸乌谭、(和田),菟裘、陶丘、桃丘突厥、泰赤兀,石门、瞒悉万、乞伏、(悉万斤),须句、石狄、失吉,高密、姑幕库莫奚、(哈密),重馆、长葛镇国,逼阳、平阳白羊、伯岳吾,京兹、长勺(精绝)、(金积),即墨、葭密、羁马吉里迷、(且末),夫钟(夫重)覆钟,夫余扶余,祝柯术虎,胡阳呼延,舞阳兀颜,不其白狄,夹谷夹谷,
通过上述的比较,我们可以发现若干现象,并得到一些结论:其一,后世北方诸族部落名“兀者”、“东胡”、“沮渠”、“昭武”、“敕勒”、“室韦”、“回纥”、“斛律”等,对应着为数众多的中原古地名,因此这些后来的北方大族,也必定曾是上古时代的中原大族。
其二,被认为是“通古斯系”的部落名“兀者”、“沮渠”、“按出”,与“东胡-鲜卑系”的“东胡”、“室韦”、“昭武”、“敕勒”、“回纥”、“斛律”等部落名转化成的地名,呈交错分布。因此,它们的血缘和原始语言究竟如何区别?将是值得深入探讨的重要问题。
其三,地名“桑丘”在多处出现,它们与“襄丘”或“商丘”一样,显然都曾是“商部落”的聚居地;鲁国的“曲阜”,晋国的多个“曲沃”,可能都是源于族名“昭武”的地名;山东半岛尽头的“即墨”(应该读作“即密”),与远在晋西南的“羁马”,相隔千里。这些同源地名四处分布的现象,说明在远早于“春秋”的时代,黄河流域曾经有过大规模的民族-部落的迁徙和融合活动。
其四,“中原地名”与“北方诸族族名”间的全面对应表明:后世所谓“通古斯”、“蒙古”、“突厥”诸族,都是“古代中原民族”出走北方的胞裔。而“中原汉语”与现世“北方诸族语言”间的截然不同,则又表明:使用“藏缅式语言”的后来部落的不断注入,是这种“古代汉语”形成的根本原因;而“北方诸族”先祖的出走,则一定是远早于“中原汉语”形成的年代的。
二、语言比较的证据
上述“姓氏”和“地名”研究表明,演变成”汉族“的中原古代居民,与“北方诸族”有着血缘上的联系。如果我们能从“中原汉语”中发现“北方诸族语言”的成分,也将是这种联系的重要证据。经过数千年的渗透和融合,北方诸族仍然使用着相当不同的语言,这些区别也必然是承继于上古时代中原语言的多元性。因此,将“中原古代汉语”与“北方诸族语言”逐一比较,不仅是对“汉语”的“语谱分析”,也是解析“汉民族”内涵成分的有效手段。
现代语言学并没有注意到上述的现象,西方语言学界是将“汉语”和“藏缅语”视为亲缘语言的。所谓“汉-藏缅语系”诸语言,大部具有单音节词根和每个音节都有固定音调的特征。尽管,这个理论几乎完全忽略了“汉语”与“北方诸族语言”的关系,但它仍是一个具有坚实基础的理论体系。
“汉语”和“藏语”间的大量的基本语词间的语音对应现象,构成了这个理论合理的内核,如:
汉语变通字吴音藏语[61]我吾、俺ng nga五ng nga鱼ng/nyu nya二贰nyi nyii太阳日nye nyime耳朵nyidu
nyendjoo一dji三sum四shi死xi/shi shi有yoo不莫、没mee作做chee候huu结束卒tsha名ming谁suu氏族ruu鸟雀dja鼠dji狐woomo
尽管这个表列的容量有限,但已经足以洞察“汉语”和“藏语”间的亲缘关系。特别是汉语的“南方方言”与“藏语”,在“我、五、鱼”,“贰、日、耳”,“四、死”,“雀、鼠”这些无关语词间的语音“同构对应”现象,看来“藏语”与“南方汉语”的关系,要比与“北方汉语”的关系更为根本。
然而,一重亲缘关系的存在,并不能排斥另一重亲缘关系。
在“音节”和“词序”形态上,貌似截然不同的“汉语”和“北方诸族语言”间,或许有着不亚于“汉语”和“藏缅语”间的关联。如,从基本语汇来看,汉语中的“阳”和“水”字,可能就是突厥语的hun和su,“岭”字则是源自通古斯语的alin;而“泥淖”的“淖”,则是来自蒙古语的“湖泊”一字nuur。
“汉字系统”是从“象形字”发展出来的。基本象形字既以“象形”和“喻义”为本,也理当可为任何人理解和使用;日本、朝鲜、越南诸国将“汉字”使用了上千年,都是按他们自己的语言去“训读”的。因此,如果我们能确定一些基本“象形字”的原始音训,不仅可以追溯古代汉语的语源基因,还可以去判定汉字初造者们的族属和语属。
以“马”、“木”二字为例。它们不仅是两个基本的“象形字”,而且是两个重要的基本“声符”,由“马”衍生出的“妈”、“吗”、“蚂”、“骂”,和从“木”衍生的“米”、“末”、“沐”等字,均从“明母m”。我们可以有把握地说,在造字之初,“马”、“木”二字就是读作ma、mu、mo的。为了确证这两个具有声符意义的汉字的语源,下面谨作一个范围稍广的比较:
藏语满语蒙语突厥语匈牙利语楚瓦什语[62]马ta morin morin/at at lo lasha木shiin mo mod agach
fa javas
从这个比较不难看出:突厥语和藏语与这两个汉字是无关的;藏语的shiin,可能是“薪”字的音源;匈牙利语的lo,大概与“驴”字同出;楚瓦什语的lasha,则与满语的“骡”laosa有关;而只有满语和蒙语中的对应字,才与汉语中的“马”、“木”二字有本质的关联。尽管,我认为蒙古语的morin和mod,是借自通古斯语的;但是在这里没有必要去纠缠一个或许会引起争议的个人见解。
中国古藉为“古代汉语”和“北方诸语”的关联现象,也作了若干相当有意思的隐性记载。例如,《尔雅?释草》说:
卉,草。华,荣。
作为一个象形字,“卉”表现了茂盛的丛草。“草”字在藏语中是tsa;在满语中是or-ho(“斡儿和”);而在匈牙利语中为fu。不难看出,汉语的“草”,与藏语的tsa有着渊缘;而“卉”则or-ho和fu间有着接近或相同的音值;匈牙利语的fu,也应该就是从满语的or-ho转化来的。
《尔雅》又说:“华”,义“荣”,即“花”。我们不难识别“华”、“华”都是“花”的不同的写法而已;而独树一帜的“□”(可能读“伊”或“依”),则可能是满语的“花”-“依尔嘎(哈)”(ilga/ilha)的缩音。我不想再讨论“花”是否就是“哈”的转音,但我必须指出上述诸字与藏语是绝对无缘的,藏语的“花”字是metoo。
《尔雅释天》还说:
载,岁也。夏曰岁,商曰祀,周曰年,唐虞曰载。
传统文字学的解释是,它们是上古各代“年岁”一词的演变;“唐虞”则解作“唐尧虞舜的时代”。事实上,“夏”、“商”、“周”本是中原地区的领袖部落之名转化成的朝代之名,“唐虞”是“尧舜”所出的部落,它可能就是春秋秦汉族名“东胡”,或宋辽金元时代族名“唐兀”[63]之异译。与其说这几个同义词是发生在各个时代,还不如说它们是古代诸部落语言在中原汉语中的沉淀。
“年”字,蒙古语作ziil,即是“唐虞曰载”之“载”;而满语作anen,又正是“周曰年”之“年”;满语的“岁”字ser,恰似“商曰祀”之“祀”;“夏曰岁”之“岁”,则是“楚瓦什语”之sul,。看来,“夏”和“唐虞”似为“蒙古语族”,而“商”和“周”则似“通古斯语族”。“唐虞”是“东胡”,而不是“尧舜”,但愿不会被认为是个“离经叛道”的说法。
西方语言学者的丰富想像力予我们很多启发;但时而也有走得太远之嫌。例如,高本汉(Bernhard Karigren)推定了汉字“卒”与藏字sdud-pa(读tsha,义为“收集,聚集,聚结起来”)同源后;又进而推论其“士卒”之义,是来自“受强制劳动的男人群体”的意思。对此,就连包拟古(NicholasC。Bodman)也有“离题太远”的感慨[64]。
藏语的“士兵”是mermi,它与汉字“卒”是没有什么关系的。蒙古语的“士兵”作tsereg,“健壮”作cheereg;而匈牙利语的sereg一字,又意转为“军队”。历史上有安禄山“养……曳落河八千人”[65]的记载。tsereg、cheereg、sereg、“曳落河”等当同鲜卑语“车鹿会”一字,“壮士”之谓也,在原始社会里“壮士”就是“战士”,它们大概就是汉语中的“士卒”之“卒”字的来源。
除“太阳”(hun)和“水”(su)外,若干“突厥语”的词汇,也遗存在“汉语”中。“土”(toprak)、“车”(hoca)这两个基本象形字,就与突厥语相关。“藏语”的chuu与“水”字也比较相近;“藏语”的“土”字saa,则是“沙”字的影子。但是,如果我们过分执着地要从“藏语”去寻找一切“汉字”源泉,不仅会舍近求远,而且也会有失公允。
根据“车”和它的衍生字“载”的现代读音,可以推测“车”的源音应该是在cha和chi之间,而“车”字在突厥语中为hoca,在匈牙利语中则为kocsi,它们的读音都恰似“高车”,亦几同欧洲语言中的coach。有匈牙利学者认为,这是匈牙利语汇对西方语言不多的贡献之一。如果这种说法是可靠的话,或许我们已经寻得了coach一字远在东方的“中原古代语言”的根。
上述的讨论,对专门家来说失之疏略;于浏览者来说则嫌之艰涩。一个简明的表列,或许能弥足双方的要求:
汉语变通字藏语满语蒙语突厥语匈牙利语万chi tuman花metoo ilga/ilha木薪shiin mo草卉tsa or-ho
fu铁dja temer河gukdju gol folyo火me gal气lung hii水chuu su土(沙)saa toprak车kolo
hoca kocsi马ta morin lo驴pung-gu牛特long ihen tehen羊luu jamaa兔rekoon tuula头元、兀[66]go
uju da、咄臂胳膊lang-aa gala gar gol年载lo anen ziil天nam tengri山岳ri uul山脉岭ribo
alin峰(丘)ridse colhon云drimpa uul雨cher huur父爹papa etseg atya母娘ama anyen
anya兄昆djudju ahun弟仲oma deote duu兵卒mermi tsereg
最后,我们不妨注意一下一个很有趣味的地理-语言现象:长江以南“河流”多以“江”为名;而长江以北则多以“水”或“河”为名。前者如:“珠江”、“湘江”、“赣江”、“黄浦江”等,后者如:“泾水”、“渭水”、“妫水”、“淝水”、“汉水”、“漳水”,或“黄河”、“淮河”、“汾河”、“桑干河”、“滹沱河”等等。其实,“河”是蒙古语gol字之转,而“水”则是突厥语su之本音。今甘肃临夏地方旧名“河州”,当地使用蒙古语的“东乡族”民众,则以谐音称之为“各州”。而今之哈萨克斯坦卡拉干达地区有河名Sara-su,实即突厥语之“黄水”也。五十年前,上海郊区土话中的“江”字(读gong)作形容词时,可作大小“河流”解;例如,将“河鱼”叫作“江鱼”(读gong-ng),把“河蟹”说成“江蟹”(读gong-kha),还把“船”叫做“江船”。其时年幼,初入其地,莫明其妙;如今方知“江”、“河”、“水”,乃不同语言之裔字也。
一、结论和思考
经过上述姓氏、地名、语词的比较,我们应该会注意到若干重要的现象,同时也会进一步思考一些基本的问题。
首先,“声调”的确是弥补“单音节”词汇的表义困难的一种手段,但也很难设想一种能够表义的原始语言的基本词汇系统,与生而来就是具有“单音节-声调”特征的。事实上,不少藏语和古汉语的词汇,也是“多音节”的;由于“多音节词汇”的表义精度增加,自然也就可以免除对“声调”的管制。当然,也有些学者极有见地地认为,人类语言的词汇音节数量可能是由简到繁的;还有学者认为“辅音丛”或“复辅音”的分化,是“多音节”词汇形成的原因之一。
上古汉语是否具有“复辅音”的特征?我想这种人类语音中的常发现象,是不必否定的;但是也不宜将其“扩大化”。
例如,不少学者认为宋景公之名“头曼”,就是一个“复辅音”字t。rmog;但察明了“商部落”与“北方民族”有着同源的关系后,“头曼”是通古斯语的“万”字tuman,也就不奇怪了。事实上,孔子诸多弟子的姓氏,也都是无法用“复辅音”现象来解释的。许多单音节汉字是“北方诸族语言”多音节字的简缩,“万”来自tuman,“马”出自morin,即是两个例字。这种转化的原因:既可能是来自所谓“藏缅式语言”的影响;也可能是“象形文字”的反作用。总之,“中原汉语”多见的“一字一义一音”的特征,不少是“后天获得性”的非自然现象。
其次,藏语作为一种较纯的“汉-藏缅式语言”,它与南方汉语方言有比较接近的关系;加上“壮”、“侗”、“苗”、“瑶”等同属语言,也都居于中国南方的地缘分布,使我们可以判断(猜测):它们的共有语词和“单音节-声调”的特征,可能是在中国南方地区发育成形的。而所谓“藏缅语”诸族,大概也是从长江以南地区朝西扩散出去的。中国南方古代居民向北方的迁徙活动,则是改变黄河流域古代部落语言特征的根本原因。
黄河流域古代居民及其语言,与“北方诸族”及其语言间的关联,显示“北方诸族”与“中原古族”是同源的。离开黄河流域的古代部落,保留了他们的祖先从中原地区带出去的,具有较纯粹形态的各种“原语”。这些迁徙活动,可能在现代人类的祖先到达东亚地区后,就没有间断停顿过。“爱斯基摩”人脱离“通古斯”部落群体,可能是发生在“数词系统”产生之前,即是一个例证。最近发现的“红山文化”早期遗址,可定在五千至七千年前,或许这也是“中原部落”进入“东北亚地区”的时代坐标之一。
“汉-藏缅”式中原语言,即“汉语”的形成和确立的时代,至少应该是发生在四千年以前的“史前期”,因为中国最早的历史记载,就已经是用具有这种语言特征的文字写成的。包拟古说[67]:
这种先藏语(按:指“汉-藏缅式原语”)的影响到底发生在什么时候呢?公元前1027年周灭商的时间比它要晚,因为许多跟藏语有关的上古汉语词在公元前13世纪的商代甲骨文中就已经出现了。
周族跟这个影响汉语的先藏语部族可能属于同一支,或者是有某种亲属关系的另一支,不过入侵中原的时间要晚一些。
再者,商代的汉语至少在句法和词汇上跟周代好象并无根本的不同,而后者的语言已经见诸彝器铭文的许多材料,而且很早就用来书写古典作品了。所以这个影响的年代不会迟于商代初,也许还要更早些。
鉴于藏缅语中许多语言的差异很大,我们只得把共同语的时间定在非常遥远的年代。但是由于现在假设一大部分汉语和藏语的共同词汇是借用的结果,这就容许我们把(按:应指上古中原语言自“汉-藏缅式原语”借词的)年代定得比较近一些,也许大约在公元前2000年的前后几个世纪之间,对于解释这两种语言的相似和差异来说,这是一个相当合理的时间深度。
他在这里说出了一些重要的道理。如“汉-藏缅式原语”,即所谓“先藏语”对于古代“中原语言”来说是外来的。而“汉语”,即“汉-藏缅式的中原语言”中的与“藏语”共有的语词,大部是“借用”的,而不是“同源”的。
但是,作为“借方”的各中原部落的语言,在受到“贷方”语言-“先藏语”的冲击前,例如“商部落”的祖语,究竟又是一些什么样的语言呢?他是没有把握来回答的。在上述的引文中,他还曾猜测“周族”可能是一支“先藏语部族”。其实,种种迹象表明,远古时代的“夏”、“商”、“周”、“秦”等部落,非但不是什么“汉-藏缅式原语”的载体,而是与“北方诸族”同源的部落。
那末,“汉-藏缅式原语”的冲击,又是来自什么方向的呢?包拟古在一条注解[68]中说,这种“先藏语”影响主要是来自西方的。这大概是从古今藏族一直居住在中国西部的现象,引发出来的一种地缘性的结论。其实,“藏民族”只不过是使用“藏缅式原语”的古代诸族中,因为走得最远而保留了较纯净的语言形态的一支人群-部落而已。那种具有“单音节-音调”特征的古代语言,对“中原古代语言”的冲击,更可能是直接来自长江以南的“南蛮”诸族。这种语言的运动取向,与亚洲东部古代人类的由南朝北的迁徙态势也是一致的。
我们明知“汉语”的“多源性”,却只说“汉语”和“藏缅语”有着共同的祖语,当然是不全面的;而将如此庞杂的“汉-藏缅语系”的共同祖语(如果存在的话),又仅仅说成是“先藏语”,则更是欠妥的;然而,使用“先藏语”这样一个名词,只是用现存表象去逼近(approach)历史真实的一种“无奈”。我也勉为其难地造了一个“汉-藏缅式原语”(Proto
Sino-Tibetan/Burmic-Like Languages)这样的替代名词,但仍然无法摆脱那种“缘木求鱼”式的方法。
对于“前汉语”时代的中原语言的定名,也有若干的困难。
中原地区古代部落的“夷”、“狄”、“戎”、“胡”属性,都表明他们与后世“通古斯”、“蒙古”、“突厥”诸族同源。这些出自黄河流域的“北方诸族”的语言,已被西方语言学者归属为“阿尔泰语系”。然而,经过数千年的兼并融合,在这三种北方语言中,不仅连基本数词都不一致,而且它们的许多“共有词”也几乎都是互借的结果;可见远古时代中原地区的语言情况,还要大大地复杂得多,因此也很难设想它们只有一种共同的祖语。虽然“阿尔泰语系”理论的基础是如此地脆弱,它的影响却又是如此的巨大;我有时也想就干脆把“北方诸族语言”的中原祖语,称为“阿尔泰式诸原语”(Proto
Altaic-Like Languages)算了。
由于汉字系统非表音的特殊性征,我们今天最明白的也只能是包括各种方言在内的“现代汉语语音层”,其次才是那些“韵书”所记载的所谓“中古音”。人们对上古时代汉语语音的探索,只是基于中古汉语语音,参照某些对比系统的“反推”或“猜想”。“诗韵”和“藏语”,大概是中外语言学者们用得最多的两种对照系。作者在欣赏这些研究成果的同时,还想以本文的结论指出:“中国北方诸族语言”是“汉语”的另一面重要的“镜子”。
我不是个“理论语言学家,而只是像个“实验工作者”,从“通古斯─满语”、“蒙古语”、“突厥语”、“匈牙利语”、“楚瓦什语”等,诸多与“北方诸族”相关的民族语言中,采集了一些与“汉语”的“可比数据”。亦如同“棱镜”能将“洁白透明”的“白光”,分解成“红”、“橙”、“黄”、“绿”诸色一样;我们也在“纯洁无瑕”的“汉语”中,析出了“戎”、“狄”、“夷”、“蛮”语言的可比成分。如果能作一个定量的统计,或许可以发现“汉语”中的“北方诸族语言”的内涵,并不一定亚于“藏缅语”的分量。
现代“汉-藏缅语系”理论的创导者们,有着不同凡响的洞察力和不可磨灭的功绩,但是他们完全忽视了“中原古代居民”及其语言,与“中国北方诸族”及其语言之间的亲缘关系。他们的这种“色盲症”,也许限制他们的某些结论的“准确性”或“正确性”。
无论是语言资料“不足”,或“过剩”的情况,都会给历史─语言学的研究带来困难或困扰,前者令人无从着手,后者却又使人熟视无睹;中国学界所面临的自然是后一种问题。
在无与伦比的丰富的史料中,必有大量的语言信息;可是我们却未能在这个满盈的信息海洋中,自由自信地航行。传统的陈规陋习使我们失去了远航的胆量;而西学方法的突飞猛进,又往往使我们感到失落无措。令人可喜的是,中国学术界已经开始注意到他们所拥有的巨大的资源优势,和方法上的暂时落后局面。无疑,这都将是中国历史-语言学新的探索时代的开始。
中山大学历史系蔡鸿生教授、林悟殊教授和他们的研究生们,与作者对本课题进行了深入而有趣的讨论;西北民族学院郝苏民教授所领导的多民族的青年历史─语言─人类学者们,对这个课题也表现出了极大的学术兴趣,于振江教授还校正了我的若干藏字的拉丁化拼写;在黑龙江省博物馆刘哓东教授,和东北师范大学刘厚生教授组织的两个讨论会上,学者和研究生们表现出的学术讨论的巨大热情,都给我极大的激励。上海的潘悟云教授、徐文堪教授、芮传明教授,南京的刘迎胜教授的卓越学识也令人敬佩。美国德州大学休斯顿分校金力教授和宿兵博士的人类基因学的最新研究结果,则是我认知本文结论的重要支柱。各地学者许多有益的意见,促使我对本文进行了许多重要的修改。谨此,向所有曾经帮助和指教过我的学者们表示衷心的感谢。
________________________
参考文献
[1]S.C.Egerod,Sino-Tibetan Languages,in The NewEncyclopaedia Britannica,1990,Vol。22,pp。723。
[2]朱学渊“西域族国名与东北亚族名之关联”,待发表于《西北民族研究》,2000年,第二期。
[3]Bing Su(宿兵),Junhua Xiao,Peter Underhill,RanjanDeka,Weiling Zhang,Joshua
Akey,Wei Huang,Di Shen,Daru Lu,Jingchun Luo,Jiayou Chu,Jiazhen Tan,PeidongShen,Ron
Davis,Luca Cavalli-Sforza,Ranajit Chakraborty,Momiao Xiong,Ruofu Du,Peter
Oefner,Zhu Chen,and LiJin(金力)(1999)Y-Chromosome Evidence for a NorthwardMigration
of Modern Humans into Eastern Asia during the Last IceAge,Am。J。Hum。Genet。65:1718-1724。
[4]A Dictionary of the St。Lawrence Island/Siberian Yup'ik EskimoLanguage,Edited
by Steven A。Jacobson,Fairbanks,University of Alaska,1987。
尤比克语满语尤比克语满语大ghpak amba,小ghhaq ajige,乳房mamaq mermer,耳朵sigun san,眼睛iya
yashi,嘴巴qaneq anqa,鼻子qengaq song-giqa,手iigga gala,胃suflitaq orfun,地方na
na,水muq muke,冰siku juhe,一ataasiq,六aghvinlek,二maalghuk,七maaghraghvinlek,三pingayut,八pingayuneng,四estamat,九estamaneng,五tallimat,十qula
[5]《晋书》卷九十七,《北狄匈奴传》,标点重印本,中华书局,页2549-2550。
曰:“北狄以部落为类,其入居塞者屠各种、鲜支种、寇头种、乌谭种、赤勒种、捍蛭种、黑狼种、赤沙种、郁裨种、萎莎种、秃童种、勃蔑种、羌渠种、贺赖种、钟歧种、大楼种、雍屈种、真树种、力羯种,凡十九种,皆有部落,不相杂错。屠各最豪贵,故得为单于,统领诸种”。
[6]《魏书》卷一百一十三,《官氏志》,标点重印本,中华书局,页3011。曰:“渴单氏,后改为单氏”。
[7]《魏书》卷一百三,《蠕蠕传》,标点重印本,中华书局,页2289。
[8]《辽史》卷三十三,《营卫志下五国部》,标点重印本,中华书局,页392。曰:“五国部。剖阿里国、盆奴里国、奥里米国、越里笃国、越里吉国”。
[9]《汉书》卷九十六,《西域传》,标点重印本,中华书局,页3884。曰:“昔匈奴破大月氏,大月氏西君大夏,而塞王南君宾。塞种分散,往往为数国,自疏勒以西北,休循、捐毒之属,皆故塞种也”。
[10]《史记》卷一百二十三,《大宛列传》,标点重印本,中华书局,页3169。按:《魏书西域传》说:“自高昌以西,诸国人等深目高鼻,唯此(于阗)一国,貌不甚胡,颇类华夏”。这无疑是说于阗地方蒙古人种的血缘含量是很高的。
[11]《大唐西域记》卷十二,《二十二国》,台北,三民书局,1998,页627-647;《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6235。曰:“于阗,或曰瞿萨旦那,亦曰涣那,曰屈丹,北狄曰于遁,诸胡曰溪旦”。
[12]《蒙古秘史》第263节,策达木丁苏隆编译,谢再善译,中华书局,1957,页260。
[13]《元史》卷六十三,《地理志六西北地附录》,标点重印本,中华书局,页1568。
[14]《史记》卷一百二十九,《货殖列传》,标点重印本,中华书局,页3262。
[15]谭其骧主编《中国历史地图集》第一册,地图出版社,1987,页22-23。
[16]谭其骧主编《中国历史地图集》第五册,地图出版社,1987,页22-23。
[17]《史记》卷一,《五帝本纪》,标点重印本,中华书局,页32。
注曰:“索隐”皇甫谧云:舜母名握登,生舜于姚墟,因姓姚氏也“。
[18]《史记》卷三十八,标点重印本,中华书局,页1630。
[19]《史记》卷一百十,标点重印本,中华书局,页2887。曰:“当是之时,东胡疆而月氏盛,匈奴单于曰头曼,头曼不胜秦,北徙”。
[20]按:这些人名皆可与北方诸族族名、人名对应:“大费”:“屠何”,“蜚廉”:“费连”、“覆罗”,“太几”:“突厥”、“泰赤兀”,“大骆”:“吐如”、“同罗”,“奄息”:“爱新”,“到满”:“头曼”、“土门”,“乌获”:“乌护”、“回纥”,“孟说”:“密须”、“白起”:“白狄”、“博尔济吉”,“百里奚”:“蔑里乞”,“恶来革”、“里疾”:“乌洛侯”。
[21]施向东《汉语和藏语同源体系的比较研究》,北京,华语教学出版社,2000,页168。
[22]《后汉书》卷八十八,《西域传》,标点重印本,中华书局,页2917。曰:“自皮山西南经乌,涉涉悬度,历宾,六十余日行至乌弋山离国”。按:现代学界普遍认同“乌弋山离”即Alexandria。
[23]《史记》卷一百二十九,《货殖列传》,标点重印本,中华书局,页3265。
[24]按:“龊龊”可能是“楚楚”之音。指鲁人“衣冠楚楚”和“文质彬彬”。
[25]《史记》卷六十七,《管蔡世家》,标点重印本,中华书局,页1564-5。曰:“……分殷余民为二,其一封微子启于宋,以续殷祀;其一封康叔为卫君,是为卫康叔”。
[26]顾颉刚“奄语蒲姑的南迁”,载《文史》第三十一辑,北京,中华书局,1988,页1-16。
[27]《金史》卷五十五,《百官志一》,标点重印本,中华书局,页1230。按:“粘割”是一个重要的通古斯-女真族姓氏,《金史agyar人的远东祖源》)。女真民族以“粘葛”、“粘合”、“粘哥”、“纳合”为姓氏者极多,如金朝将领“粘合满柱”,元初女真族名臣“粘合重山”等。辽代契丹民族姓氏“聂赫”,人名“涅鲁古”、“捏儿古”;蒙古高原各部人名“南家歹”、“囊加歹”、“聂古台”;以及蒙古民族的祖源部落名Nakuz(“捏古思”),钦察小汗国名Nogai(“那海”),古Magyar人部落Nyek,巴什基尔氏族Nagman,显然都是“粘葛”之异写。而柔然人名“那盖”,“回纥”人名“那颉”,匈牙利姓氏Nagy(纳吉)等;则都是与“粘割”可转之音(见:朱学渊《七至十二世纪欧亚草原上的通古斯人》)。至于,满语为何称“汉人”为“粘汉”?其原因不明。
[28]《史记》卷三十五,《仲尼弟子列传》,标点重印本,中华书局,页2185-2226。按:仲尼弟子共七十七人,“颜回者……字子渊”,“闵损字子骞”,“耕字伯牛”,“雍字仲弓”,“求字子有”,“仲由字子路(季路)”,“宰予字子我”,“端沐赐……字子贡”,“言偃……字子游”,“卜商字子夏”,“颛孙师……字子张”,“曾参……字子舆”,“澹台灭明……字子羽”,“宓不齐字子贱”,“原宪字子思”,“公冶长,齐人,字子长”,“南宫括字子容”,“公皙哀(克)字季次”,“曾虔字皙”,“颜无繇字路。……回父”,“商瞿……字子木”,“高柴字子羔”,“漆雕开字子开”,“公伯缭字子周”,“司马耕字子牛”,“樊须字子迟”,“有若(字子有)”,“公西赤子华”,“巫马施字子旗”,“梁澶字叔鱼”,“颜幸字子柳”,“孺字子鲁”,“曹恤字子循”,“伯虔字子析”,“公孙龙字子石”,“季字子产”,“公祖句兹字子之”,“秦祖字子南”,“漆雕哆字子敛”,“颜高字子骄”,“漆雕徒父”,“壤驷赤字子徒”,“商泽(字子季)”,“石作蜀字子明”,“任不齐字选”,“公良孺字子正”,“后处字子里”,“秦字开”,“公夏首字乘”,“奚容箴字子皙”,“公肩定字子中”,“颜祖字襄”,“单字子家”,“句井疆”,“罕父黑字子索”,“秦商字子丕”,“申党字周”,“颜之仆字叔”,“荣旗字子祈”,“县成字子祺”,“左人郢字行”,“燕字思”,“郑国字子徒”,“秦非字子之”,“施之常字子恒”,“颜哙字子声”,“步叔乘字子车”,“原亢籍”,“乐咳字子声”,“廉字庸”,“叔仲会字子期”,“颜何字”,“狄黑字皙”,“邦巽字子敛”,“孔忠(字子蔑)”,“公西舆如字子上”,“公西箴字子上”。
[29]按:经典数论之“哥德巴赫猜想”即是无数科学的猜想之一例。目前虽然没有有效的手段对该猜测实行“演绎”或“归纳”的证明;然而,任何一个“反例”都可以推翻一个“猜想”。至今,关于其有倾向性的结论,尚未被任何的“假设性判决”(hypothesis
test)所否定。
[30]《史记》卷一,《五帝本纪》,标点重印本,中华书局,页1。
[31]陈明远、汪宗虎《中国姓氏大全》,北京,北京出版社,1987,页99-107。
[32]蒲立本《上古汉语的辅音系统》,潘悟云、徐文堪译,北京,中华书局,1999,页144;朱学渊《西域族国名与东北亚族名之关联》,待发表于《西北民族研究》,2000年,第二期。按:“乌孙”是否即是通古斯族名“爱新”?不只是这两个族名语音是否关联的问题;关于这个部落的人种、语属还有根本的争议。“乌孙”是《汉书?西域传》中叙述最为详尽的一个中亚部落,其中记载了大量的“乌孙”酋领的人名,而它们大多与“北方诸族”族名相关联。如:“大禄强”:“大啡缯折”“猎骄靡”:“如者访摇”“翁归靡”、“元贵靡”:“护骨访摇保”“雌栗靡”:“敕勒访摇”“伊称靡”:“乙旃访摇”“乌就屠”:“兀术愤汀”“姑莫匿”:“库莫奚”,“难栖”:“芮奚”,“乌日”:“兀术”,“末振”:“□”,“细沈”:“息慎”,“若呼”:“术虎”因此,本作者认为“乌孙”至少是蒙古人种。然而,蒲立本却认为:“‘靡’mie≦moo经常出现在乌孙国王称号的最后一个字。有充分的理由证明乌孙说的是一种吐火罗语,所以这里的‘靡’可能与吐火罗语A的wal,或吐火罗语B的walo有关”。既然“吐火罗语”是一种印欧语言,那末“乌孙”也该是个印欧人种的部落了。这种“一字定邦”的说法是否正确,最好由读者们自己来发现结论。
[33]拉施特主编《史集》第一卷第一分册,余大钧译,商务印书馆,1986,页128。
[34]王力《同源字典》,北京,商务印书馆,1982,页120,277。
[35]《魏书》卷一百,《失韦传》,标点重印本,中华书局,页2221。
[36]《北史》卷九十四,《室韦传》,标点重印本,中华书局,页3129。
[37]陆宗达、王宁《训诂与训诂学》,太原,山西教育出版社,1994,页65。按:作者说明了“元”、“兀”为同根异字,古时同音;古文献中“元”训“首”,杜预曾注:“元,首也”。而“原”又为“元”的引申,训“高平之野”。
[38]张文生主编《中国地图集》,北京,高等教育出版社,1990,页92。
[39]最著名的“阿保机”者当为辽朝契丹族国君“耶律─阿保机”者。十八世纪率众回归的土尔扈特部落酋长之名“渥巴锡”,清太宗皇太极(“阿巴嘎”)第四子之名“叶布舒”,七世纪时“可萨汗国”确立犹太教信仰的领袖之名Obadiah,以及“阿伏至罗”、“兀洼思”等,应该都是与“阿保机”相关的人名。语音上与“阿保机”关联的族名除“钦察”外,还有“右沛叔”、“乙弗”、“悦般”、“阿伏于”、“阿布思”、“阿勿嘀”、“兀合思”、“可弗叉”等。
[40]拉施特主编《史集》第一卷第一分册,余大钧译,商务印书馆,1986,页137。
[41]韩儒林《穹庐集》,上海人民出版社,1982,页80。
[42]拉施特主编《史集》,第一卷,第一分册,余大钧译,商务印书馆,1986,页249,287。按:“迭儿列勤”波斯文作drikin,译文猜写作d(a)ri(a)kin。所谓的“迭儿列勤─蒙古诸部落”包括“兀良合惕”、“弘吉剌惕”、“许慎”、“巴牙兀惕”等部。《史集》说这些部落都是“从阿勒坛忽都合(qiduqeh),即金器生出,与弘吉剌惕人和亦乞剌思人同出于一个根源,……”。又按:其中“巴牙兀惕”显即“伯岳吾”,而“许慎”必是“肃慎”。“忽都合”为通古斯语之“柳叶”一字,即生殖崇拜“女阴”之谓。通古斯人又常自称“金”族,“阿勒坛─忽都合”当即“通古斯人祖阴”之意。据此,我认为“肃慎”、“弘吉剌”、“伯岳吾”、“兀良合”等皆形成于母系社会的通古斯民族的同源部落。
[43]《魏书》卷一百三,《高车传》,标点重印本,中华书局,页2307。曰:“高车,盖古赤狄之余种也,初号为狄历,北方以为敕勒,诸夏以为高车、丁零,其语略与匈奴同而时有小异,或云其先匈奴之甥也。其种有狄氏、袁纥氏、斛律氏、解批氏、护骨氏、异奇斤氏”。
[44]《金史》卷八十,《赤盏晖传》,标点重印本,中华书局,页1805。按:“赤盏氏”有多种不同的译法。《金史百官志》亦作“石盏”;陶宗仪《南村辍耕录?卷一》则作“赤乞”、“察里吉”、“拙儿察”等。
[45]《魏书》卷一百二,《西域传》,标点重印本,中华书局,页2273。
[46]《北齐书》卷一、二,《帝纪神武》,标点重印本,中华书局,页24。曰:“狄干鲜卑老公,斛律金敕勒老公,并性犹直,终不负汝”。
[47]《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6245。曰:“西曹者,隋时曹也,南接史及波览,治瑟底痕城”。
[48]O.Maenchen-Helfen,The World of The Huns,Berkeley,University of
California Press,1973,p.420。
[49]《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6243。曰:“康者,……君姓温,本月氏人。始居祈连北昭武城,为突厥所破,稍南依葱岭,即有其地。枝庶分王,……世为九姓,皆曰昭武”。
[50]《新五代史》卷七十四,《四夷附录》,标点重印本,中华书局,页918。曰:“沙州西曰仲云,其牙帐居胡庐碛。云仲云者,小月支之遗种也。其人勇而好战,瓜、沙之人皆惮之”。
[51]V。Shnirelman,Who Gets the Past?,Washinton D。C。,Woodrow Wilson,1996,p。32。[52]《大唐西域记》卷一,《三十四国》,台北,三民书局,1998,页32。曰:“纥露悉泯健国,周千余里。国大都城周十四五里。西北至忽懔国”。
[53]塔西佗《阿古利可拉传》,1997,页53,63,77,79。
[54]《魏书》卷一百一十三,《官氏志》,标点重印本,中华书局,页3006。曰:“次兄为拓跋氏,后改为长孙氏”。
[55]朱学渊“哒、高车与吐火罗斯坦诸族”,载《西北民族研究》,2000年,第一期,页173-191。
[56]《魏书》卷一百三,《徒河段就六眷传》,标点重印本,中华书局,页2305。曰:“日陆眷死,弟乞珍代立。乞珍死,子务目尘代立,即就六眷父也”。
[57]《魏书》卷一百一十三,《官氏志》,标点重印本,中华书局,页3012。曰:“侯莫陈氏,后改为陈氏”。
[58]《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6235。
[59]《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6247。曰:“米,或曰弥末,曰弥秣贺。北百里距康。其君治钵息德城”。
[60]和希格“女真馆杂字?来文研究”,《内蒙古大学学报增刊?女真译语研究》,1983,页285。贾敬颜、朱风《女真译语?蒙古译语汇编》,天津古籍出版社,1990,页277。拉施特主编《史集》,第一卷,第二分册,余大钧译,商务印书馆,1986,页371,注8。
[61]English-Tibetan Dictionary of Modern Tibetan,Compiled by M。C。Goldstein,Berkeley,The
Regent of University of California,1984。
[62]J。R。Krueger,Chuvash Manual,Bloomington,Indiana University,1961。
[63]《新唐书》卷二百二十一,《西域传》,标点重印本,中华书局,页6214;《新五代史》卷七十四,《四夷附录》,标点重印本,中华书局,页912;《宋史》卷四百八十五,《夏国传》,标点重印本,中华书局,页13981。按:上述诸史皆以“党项”记该族,《新唐书》和《新五代史》中记载的“党项”姓氏,不少可与北方诸族姓氏相比。如:“往利氏”:“斛律”,“房当氏”:“乌谭”,“野辞氏”:“兀者”,“米禽氏”:“蔑里乞”,“拓拔氏”:“拓跋”,“野利氏”:“耶律”、“挹娄”。然《蒙古秘史》记“党项”为“唐兀”;《鲁布鲁克东行纪》记之为Tangut。
[64]包拟古《原始汉语与汉藏语》,潘悟云、冯蒸译,北京,中华书局,1995,页15。
[65]《新唐书》卷二百二十五,《安禄山传》,标点重印本,中华书局,页6414。曰:“养同罗、降奚、契丹曳落河八千人为假子…”
[66]同注[37]。
[67]包拟古《原始汉语与汉藏语》,潘悟云、冯蒸译,北京,中华书局,1995,页53。
[68]包拟古《原始汉语与汉藏语》,潘悟云、冯蒸译,北京,中华书局,1995,页222。注8曰:“中国的西北部在有史年代是操藏缅语的居民跟汉人发生接触的地域,在更早的时候也可能如此。张光直断定黄河下游的冲积平原是商族的早期领土,但是在征服夏族以后,他们的活动中心就向西移动了。……我们所假设的先藏语的影响也许就是来自河南西边和山西西边的夏族”。
本文初稿完成于二零零零年八月十三日,修改稿完成于同年十月四日。