出土于哈拉帕遗址的公牛印章
古印度印章,其上的动物有犀牛、大象、公牛,字符有矩形、轮形、鱼形、马蹄铁形等等,也有的不知为何物。
好几天没有更新博客了。整理、汇总研究室网站上甲骨缀合成果花了很多时间,旧站上有些文章不能显示图片了,费劲迁移一部分到新站,想到这些都是同行们的辛苦发现的成果,感到付出还是值得的。终于把旧站所有缀合成果汇总好,略感轻松。一直想好好读古书,但甲骨方面的研究,却要占太多时间,呵呵。
前几天看到一个印度裔的美国人工智能专家,用计算机研究古印度印章文字的文章,觉得他及其同事的工作还是挺有趣的。他们最终没有破译出这种古老文字,但是通过计算机的帮助,发现其字符排列的规律与自然语言近似。他们把研究成果发表在5月份的《科学》杂志上,引起媒体的关注。《科学》杂志上理科研究领域是最牛的期刊之一,一般大陆学者能发一篇文章,有机会上新闻联播。 ![]()
古印度文明遗址分布图,其中心城市是哈拉帕和摩亨佐·达罗
印章是印度河流域古典文明的独特产物。古印度文明在公元前三千纪繁荣一时,它以今天的印巴边界为中心,辐射50万平方英里(约128平方公里)。残留今日印度河流域的遗址北至喜马拉雅山脉,南至孟买。古印度文明是南亚次大陆最早的城市文明,其中心城市是北部的哈拉帕和南部摩亨佐·达罗。虽然其范围很大,延续时间长,但考古学家经过近一个世纪的探索后,对古印度文明仍知之甚少。相关的考古工作开始于1920年代,一直进行到今天。在考古学家发掘出来的标本中,有印章、护身符和小牌,上面有一种类似文字的刻符,它们到底是什么意思,成为困扰学者的难题。
破解古印度印章字符的最大难题在于,没有任何可资借鉴的材料,即无线索可循。中国学者,无论宋人、清人还是今人,都能破译(考释)商周金文(当然也有今胜于古的发展过程),1899年殷墟甲骨文发现后,刘鹗和孙诒让等学者也很快破译出部分文字,借助的是小篆(《说文》)这一桥梁。1799年,商博良破译古埃及文,是借助了罗塞塔石碑,上面的埃及文和希腊文。1950年代,苏联学者尤里·克诺罗佐夫,借助当代玛雅语,使玛雅象形文字的研究获得飞跃发展。但古印度印章字符,靠什么线索来破解呢?
学者的相关研究,结论多不一致,有的认为印章刻符属于闪族语系,有的认为是达罗毗荼语,有的甚至认为是复活节岛的语言(太能猜啦)!学者聚讼不清,说明古印度印章刻符是古代文明研究中最具挑战性的难题!也有学者从印章的功能来做研究,这种印章大多出土于城市的门房,故有学者推测它们与商品贸易有关,可能是衡量货物质量的标志,或是货物纳税的凭证。在2004年,有几位学者发表一篇颇具争议的文章,他们觉得印章刻符根本和语言无关,可能是政治或宗教图案,并进而指出古印度文明是没有文字的文明。甫论一出,从前的研究似乎要付之东流。
难道印章文字真的无从破解吗?一位印裔美国计算机科学家拉杰什·饶(Rajesh Rao) 及其同事独辟蹊径,想出了一个办法:即利用计算机比较印章字符和自然语言之间字符排列规律的相似性,以判断它到底是不是一种文字。拉杰什·饶现在任教于美国塞特市的华盛顿大学,是个计算机科学家,研究人工智能和机器人。他出生于印度海德拉巴,在8年级时,在历史书上看到印章刻符,立刻着了迷。虽然日后走上了另一条学术道路,他却从未放弃破解印章刻符的梦想。他自己搜集相关的研究论著,建立了“小图书馆”,对相关研究进展也是相当熟悉。
拉杰什·饶在工作中,他好像用的是Dell的大厚本
这些应该是拉杰什根据资料自己复制的东东
拉杰什·饶知道印章刻符,都是在象巧克力块一样的小块印章上,每个印章上也只有几个字符而已,考古学家从未发现过类似石碑那样刻满字符的东西;而且他自己及其同事都是搞计算机科学的,不具备破译象形文字的语言学知识。因此,他和同事们的想法是,利用“条件熵”这一信息论的理论,从判断印章刻符是否语言文字入手研究。
条件熵,真是个高深的术语呀。不过,理解起来也不难。它是计量一个序列中随机性程度的方法。比如在英文中,q后面常跟着u,t后面总跟着r或e而不是n或b。拉杰什·饶和他的同事(包括一个计算机专家、一个天体物理学家和一个数学家),设计了一个计算机程序来求出印章刻符的条件熵,同时他们还计算了一些语言(闪族语、泰米尔语、梵语和英语)、计算机语言(Fortran)、非语言的人类基因组序列、细菌蛋白质序列,此外还有人为设计的高和低两个条件熵的极端数据。比较结果显示,印章字符的条件熵与自然语言接近,很可能是一种语言的文字。研究本身并未搞清楚,印章字符是哪种语言,但也指出其条件熵与泰米尔语的接近。
这项研究成果发表在最近(5月)的Science杂志上,没想到引起了政治上的非议。印度南部说泰米尔语的民族认为印章字符是原始的达罗毗荼语,因为泰米尔语由达罗毗荼语演变而来。而说印地语的民族则想把印章字符看成是原始梵语,他们批评拉杰什·饶是达罗毗荼民族主义者。拉杰什·饶没想到他们的研究会遭到如此激烈的批评,但他并不气馁,除了从事人工智能和机器人研究之外,他拿出三分之一的时间,和同事们进一步研究更长的字符串,希望找到眉目,来进一步确定印章文字的语族归属。
不管怎么看,拉杰什·饶及其同事的用计算机来研究古印度字符,是古典印度文明研究领域内值得大书特书的一件事,应该说,是极大地促进了人们对印章字符的认识。
**************************************************
以上是据英文文章编译的。我觉得,拉杰什·饶是个有梦理、有能力的人。破译古代文明的文字,一般不是用他这种方法,没有介于古代文字和今天文字之间桥梁和线索是很难解决问题的。我对于他的研究有一点疑问:是否世界上所有民族的语言,其“条件熵”都是类似的?难道地球上哪个地方的人,只要是人,在创造语言方面有着相同的思维方式?拉杰什是否要做更多的研究,先验证这一点?
而且,古代语言和现代语言的“条件熵”也类似么?这是否也要做进一步的研究才能证实呢?
如果按拉杰什的理论,这很可能是一种拼音文字。我是一点不懂,按照中国人的思维,还是往象形上考虑。看到其中有三至四道“竖划”的刻符,有点像数字,三十、四十?呵呵。另外,有一个刻符象人扛着棍子,约近于“何”(荷负之荷)字。车轮佳节又重阳大家也都看得出来。这只是乱猜。因此,我是很希望,印章文字早日破解出来。
【参考文章】
http://www.cs.washington.edu/homes/rao/
http://www.smithsonianmag.com/history-archaeology/51140197.html





