破译文字远比解析科技要简单得多,而如果这份文件就是某个科技的详细报告的话,那破译这份文件等于获得了一个科技。
“我心心念的启灵装置啊!”苏御又感叹到,启灵装置关乎他能否再度进化,可他却迟迟没发现关于启灵装置的情报。
苏御给自己倒了杯咖啡,随后立刻开始了破译工作。
这份文件里的文字全都是用【、O、】、〖〗、Ш、╁、□之类的框框和线组成的,像极了Word里进行加密的乱码文字。
但苏御立刻找到了规律,他发现“【”“(”这样的符号非常常见,那说明这类是语言的基本词汇量、常用词、常用固定搭配等等。
比如中文里的“的地得”、“这”、“那”、“是”、“不”“你我他”。
比如英文里的“is”、“the”、“to”
比如日文里的“の”“て”
理解这一点,那就比较好办了,文件中但凡是这类的文字全部都可以先用这几种常用词汇套入。
随后是断句,苏御发现有些方块字直接由一个空格将其隔开,因此将不同的字区分成不同的区域,每一个区域便可以理解成一句话。
然后是标注,作为一份报告,肯定是有标注,有特别说明,比如中文论文里的“注1”“注2”,或者()。
而这些文件内也有类似这样的标注,有了这些标注后,再去破解原文,难度就会降低许多。
而随后,就是纷繁复杂的统计学工作,将文件中所有的文字全部提取出来,提取出所有的常用文字,提取出偶尔使用的文字,提取出只是用过一次的文字。
从而再进行统计学分析,和目前人类已知的文字进行对照,寻找语法相似的文字。
众所周知,中文和英文互为倒装句。
简单来说,中文是:今天你吃了吗?