首页 > 古典文学 > 自指引擎 > 13.Japanese

13.Japanese(1/2)

目录

总计超过120亿字。

这还是粗略估算。

这些日本文字应当分为若干范畴,关于这一点,众人的意见是一致的。汉字、汉汉字、汉汉汉字、平假名、平平假名、片假名、平片假名、片平假名,这些类别的存在大致都被认可。但是关于平平平假名的存在,还处于争论中,平汉字、片汉字分类的必要性也不时被提出。

解读作业基本上没有任何进展。

发现的文本,大部分都是十万到百万字的大块文章。而给解读带来障碍的是,那些大块文字中,基本上没有重复的文字。这些文章被称为日本文书,其中出现的重复文字非常少,就连重复度最高的“ぴ”字,也只出现了7000次。而且有人坚持认为,并不是“ぴ”出现了7000次,而是“ひ。”和“ぴ”等异体字构成的文字族。

在解读未知文字时,常用的有效手段是识别数词符号,然而就连这个也还没有确定。“一”“二”“三”大约是数字,这一点可以从它们的形态上识别出来,但“三”以后的数词应该是什么符号,则众说纷纭。有人认为“口”“木”等符号应该被视为“四”,但举不出强有力的旁证。

一般认为,运算符比数词的解读准确度更高,然而这依然没有超出推测阶段。“十”可能是加号,“二”可能是等号。“廿”“土”“王”有的说是数词,有的说是运算符,总之意见都不一致。

文书中频繁出现计算内容,这一点谁都能看出来,但对解读并没有什么帮助。不知为什么,在这种计算式的写法中,似乎并不存在进位。因为如果存在进位,那么不管采取哪种进制,总会重复出现同样的符号。所以大致可以推测采用的是无限进制。但即便如此,重复的符号也太少了,所以有人认为在这种写法中,符号每次出现的时候可能都会变换形态。也就是说,第一次出现的1,和第二次出现的1,会用不同符号加以表示。这个假说似乎解释了什么,然而又似乎什么都没解释。

文章是自上而下纵向从右往左,或是从左往右横向自上而下书写的。这一点可以从笔法和书记的痕迹中辨别出来。然而即便是在这一点上,日本文书也有特殊之处,表现在相邻的行或列之间存在着可以称之为相互作用的标记。在纵向书写中,时常会有某些文字的横线水平贯穿若干列。那线并不是在重合的文字上新画的,而是极其自然地构成其他文字的一部分。横向书写的时候当然也会出现纵向贯穿若干行的线条。大体而言,纵向与横向的纵横写法看起来没有显著差异。至少,似乎不管纵向书写还是横向书写,都不会影响含义。虽然也有见解认为纵向与横向的意义不同,但并没有什么实际的根据,当然认为意义相同也举不出什么特别的根据。

有些人认为这样的技艺只能预先巧妙组合出文章,然后再做誊写。但实际上,大部分文章都呈现出草稿的模样。话虽如此,也看不出预先留出空白以便填入贯穿横线的征兆,只是像极为平常的草稿一样的写法,而写出的文章就是这个被称为日本文书的文字群。

从这一高度的设计性推测,有假说认为,日本文书也许仅在外观上展现出文字的模样,实际上只是没有任何意义的线条排列而已。但如此看来,这篇文章却又展现出令人感觉到蕴藏着意义的外观。大量产生没有意义的涂鸦行为本身,很难说没有任何意义。就像前世纪末叶搅乱世界的伪狄奥尼修斯文书之类的文件中也能看到的那样,仅仅是大量古文书的发现本身,就有着称为一个事件的性质。伪狄奥尼修斯文书,通过发现生成那一文书的算法,而被广泛承认为伪书,但伪造者的失败之处也可以说在于各个文字能够确定为各个文字。如今,对于有限组的符号串,基于机械运算的推测,具有压倒性的力量。日本文字的困难性,原本也是在于很难判断这里所使用的符号数量是有限还是无限的。

对这种设计性,还有一个很难说有魅力的假说。

日本文书,是由这数万字的文字集合而成的、一个巨大的文字。

如果采纳这个假说,将整体视为巨大的文字,那就会产生这样的疑问:构成要素为什么这么像一个个的文字?如果要书写巨大的复杂文字,只要创造出巨大的文字就好,有什么必要特意采用这样的文字体系,将小的文字纳入到网络状结构中呢?而且在这种情况下,页面排版也会成为问题的吧。

既然前提是假设,那么拥护也好,反对也好,争论也只能成为假设的产物。既然是人写的东西,那么在设计某种程度的巨大物体时自然需要先分割再整合的看法,大脑构造强迫要求这种构成的看法,从表音文字到语义单位的二重分节化的再高一层的三重乃至多重分节化等等,有着各种各样的意见。

有人提出一个很现实的问题:超过120亿个文字的语言,谁能学得会?

但正如一切意见都有反对意见存在一样,对于这一问题,也有相应的回答。答曰,这些符号串是基于少数规则不断变形的符号队列,只要学会了那些规则,就没有必要去记这120亿个文字。120亿这个数,在组合上并不能算巨大。

如果能解析出那些规则,说服力自然会增加,然而赞成这一说法的人们,也没办法展示出那些规则,所以这一假说依然停留在假说的范畴里。

关于如何称呼日本文书中出现的文字,有各种各样的提议。一开始出现的是有点古怪的“概念文字”,最近称之为“神经文字”的情况越来越多。

文字或多或少都伴随着概念化,比如“椅子”这个文字指的就不是个别的椅子,而是指代一般的椅子。如果是为了记述事物而经过了概念化的文字,120亿未免太多了。所以,这种语言会不会尚未经过概念化呢?从这种意见出发,确定了“概念文字”这种名称。

而神经生理学家们认为,这种文字与其说经过神经网络的处理,不如说它更像是神经网络本身。这一假说和其他无数假说一样,对解读毫无帮助,但毕竟给了人一种仿佛解释了什么的感觉,因而多少获得了一些人气,占据了一定的优势。

顺便说一下,对于这个意见也有异议。

正如“20扇门”的游戏所展示的那样 [31] ,作为人类对事物加以分类的结果,不管什么东西,大抵都可以通过20次的yes/no的提问加以确定。而要逐一指定选择过程,需要220个符号。相比之下,120亿这个数不得不说十分保守。如果对于已有的分类组合,文字数量都不够,那么在以之为基础的组合性记述中,文字数量岂不是更会出现压倒性的不足吗?

神经语言提倡派对这个问题无力反驳,但马上又转入了反击:现在所知的120亿个日本文字,只不过是目前发现了这么多资料而已。事实上,那些文字的重复度异常之低,如果资料的数量翻倍,文字数也会翻倍,三倍资料就会是三倍文字。

只要没掌握文字的全貌,这种反驳确实很容易。不过已经120亿的文字都只是部分,那它的全貌会是什么样子,委实让研究者无从推测。

假说的数量已经非常庞大了,而在每次发生反驳之际,问题都会以极快的速度增大,这一现象是日本文字解读中频繁发生的事态。可以说,在其中某个阶段,研究者们停止思考,或者遭遇了检验的实质上的不可能性,乃是阻碍解读的最大原因。这可以说是由于资料的不足,也可以说是资料太多且过于混沌的缘故。有传言说,调查队在旧日本列岛发现了新的资料,但又将之销毁了。从当下的学术圈氛围考虑,这一传言也许包含了某种程度的真实感,让人觉得说不定正是真相。

关于第12次旧日本列岛调查团的全灭,有诸多假说。对于正式报告所称的受到凶猛本土生物袭击,很多人表示怀疑。报纸上刊登了结着大银杏发型 [32] 的力士队袭击调查团的讽刺画,而众所周知现在的旧日本列岛上不存在超过大型犬体型的生物。所谓本土日本人的幸存被视为毫无可能,复兴的希望更是无迹可寻。

旧日本列岛调查团的足迹在旧东京市八王子区消失。现场发生了什么情况,至今都只有推测。口粮、燃料等装备都以通常行动的形态保留下来,没有显示出任何异常。也没有发现争斗的痕迹。发现的日志也只是按照规定平淡地记录着调查的进展,没有任何能够窥见之后失踪的线索。

从日志中可以确定调查团在八王子区得到了大量的日本文字构成的文书。日志中记载了在13/20位置获得了总计超过20吨的纸质资料,但那位置无法确定。最后的宿营地是在被废弃高楼包围的公园里,但并没有带走20吨资料的痕迹。搜索周围也没发现资料、运输20吨资料的重型设备,以及连使用过重型设备的痕迹都找不到。

本章未完,点击下一页继续阅读。

书页 目录
返回顶部