登陆注册
78496200000424

第424章 幻当程序员小白用自然语言编程时会怎样?

=数据卡尺=

如何用统计学的知识,来应用在数据上呢?

-第一步-

要弄明白统计学和数据之间的共性和非共性。

统计学:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而统计学本身就有意和无意的忽略了各个数值的先后排列。

数据:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而数据本身很注重各个数值的先后排列。

比如:ABRACADABRA

用统计学来表示,就是A出现了5次,B出现了2次,C出现了1次,D出现了1次,R出现了2次。

用数据来表示,就是ABRACADABRA。

那么如何把数据快速的解压缩出来呢?可以使用分段压缩方式,比如把一个大文件,分割成一个个片段,例如:

ABRACADABRA THE FOX JUMP.张三和李四一起去喝酒。

那么,就可以根据前面的数据,本身就是采用英文的方式,也就是最多是52进制(区分大小写),而后面的中文可就麻烦了,毕竟中文本身进制相当大,那么就需要进行大进制处理。

用统计学的方法,就是把数据平均分,然后分割成可以互相对齐的数据个体,然后统计这些数据个体各出现了多少次。

然后进行统计,把统计数据记录下去。

也就是说,把大英百科全书的纯文本内容用统计学的方式记录下来,就能对应到大小写英文字母+符号+空格+换行+换页……

那么就能够统计出各英文字母出现过多少次,这导致的就是数据能够很好把所有元素给还原出来,只是这些元素之间的排列组合,就随着数据长度的变大而趋向更高运算量。

最简单的方法,就是用三种统计方法:

如字母矩阵:

A C A E F H I O P Q R T T Y T

A S D K F J A S L K F D J L A

S K J F D A S D F S A D F A S

D F A S F A S D F A S F D A S

F D J H L K J H L K J H L K J H

为了快速得知每个数字的排列方式,可以进行统计校验

每一行的第一列中出现A的次数为2次

每一行的第二列中出现A的次数为0次

第一行中出现A的次数为2次

第二行中出现A的次数为3次

A在整个文本中出现过12次

以此类推,就能使用数独的方式,逆推出去掉了很多排列组合的有限数量的排列组合方式,然后这些排列组合就能通过其他校验方式,比如MD5,比如SHA128和其他校验方式快速找出正确的排列组合。

这种方式,就是使用小公式重复使用的方式,快速生成数据的片段,然后只需要把数据片段进行拼图一样的整理就行了,就能还原出源文件。

之前说的,只应用到阶乘,N次方,无理数,都只适合于超级计算机的压缩方式,而这次介绍的,则是相对来说,更适合个人计算机,以及单片机使用,本身就是以硬件上限有限时,如何获得最高压缩率,以及最快解压缩。

同样的,把数据进行片段化,然后使用特定进制的方式来进行统计,同样可以统计出,然而还有一种特殊的进制转换对齐校验方式。

比如二进制的101010111010110111010001001101110010。

转换为4进制(00=A)(01=B)(10=C)(11=D):CCCDCCDBDBABADBDAC

转换为十进制:46,084,723,570

转换为16进制:A BADD 1372

然后进行统计,比如,在4进制中,ABCD各出现过多少次;在二进制中0和1各出现过多少次;在十进制中0123456789各出现过多少次;在十六进制中0123456789ABCDEF各出现过多少次。

当然了,为了进制校验的准确性,一般都是采用素数进制的方式来进行校验(比如2进制,3进制,5进制,7进制,11进制,13进制……以此类推),然后通过进制之间的差异,来统计。

当然了,因为是为了给单片机使用的,所以本身就不会采用过高进制,比如高达亿进制。

也就是把每一个数据片段,都除以各个进制数,然后得出余数。

→喷子兼或破壁人:所以分解质因数都出现了是吧?你还能更敷衍一点么?

→喷子兼或破壁人:直到现在,你都没有给出使用多处理器来进行大数据压缩和解压缩的代码实现,你在这给程序员用自然语言编程呢?

同类推荐
  • 我很凶猛

    我很凶猛

    求求你们,快跑吧,当我用出第二只手的时候,我自己都控制不住我自己啊!这是一个主角和他那禽兽左手怎么冲出地球,走向宇宙的故事!(本书又名:《我的双手跨时代》《我的左手有禽兽》《再不跑来不及了》《看书领鸡腿》) 鸡腿群号:785789803
  • 宇宙黑洞之重回太空

    宇宙黑洞之重回太空

    宇宙中,两个超级文明:中星人和海盗星人发生了战争,地球很不幸被卷入战争。海盗星系的人用黑洞武器让中星人只能逃命,而中星人使用白洞让海盗星人逃都逃不了。时光号和战友与海盗展开了无尽的战争,在最后的时刻,时光号在战友的协助下闯入海盗星系大本营,一举毁灭了整个海盗星系,让海盗星人再没有实力与中星人对抗。这个时候,地球退出战争,时光号飞船也回归到黑洞里。十年后,时光号飞船再度出现,又有什么大事发生?
  • 重启之黑暗末世

    重启之黑暗末世

    末日的降临,是大自然对人类的报复!废土之下,文明重启!
  • 末世之召唤二次元

    末世之召唤二次元

    秦洛:“我碌碌无为了十六年始终坚信着总有一天我会拯救世界的。”龙之基因丧尸爆发,纯天然濒危宅男秦洛化身嘉文四世高喊着德玛西亚打丧尸,大喊真男人化为蛮王顶丧尸,变身战斗暴龙兽灭妖魔,甚至是开启邪王真眼灭丧尸。总而言之,中二病也是人,中二病可以召唤二次元生物,中二病一样拯救世界。新书【抓鬼学院】求推荐支持
  • 星落尘间幻成爱

    星落尘间幻成爱

    御星尘在某一天发现了一条奇异的小巷,碰到了一位和蔼的老奶奶,得到了老奶奶送给她的书,奇幻之旅开始了。。。。
热门推荐
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 毛泽东生平全纪录

    毛泽东生平全纪录

    尊敬的书友,本书选载最精华部分供您阅读。留足悬念,同样精彩!《毛泽东生平全纪录》一书(上、下)为国内权威党史专家精心编撰,全方位、多视角诠释伟人的光辉的一生。此书是国内迄今最完整、最全面的图说世纪伟人——毛泽东的图书版本,部分照片系首度于国内外公开发表。本书由“红墙摄影师”吕厚民、杜修贤鼎力加盟,千余幅珍贵历史照片真实再现领袖们影像瞬间。
  • 此风有泪彼岸流

    此风有泪彼岸流

    带着模糊的记忆,苏醒在神秘的桃花之林,为找回丢失的记忆,找回记忆中的她,少年毅然前行,进入这个种族争霸的洪荒世界,一个可以修炼能量的世界。修炼之路,艰难坎坷,带着一朵玄奇的曼珠沙,在修炼被废之后,另辟蹊径,探索禁忌的领域,一路披荆斩棘,弑神诛仙,只为找回消失的她,只为回到最初的世界。
  • 天骄战纪

    天骄战纪

    大千世界中,一个名叫林寻的少年,独自从矿山牢狱中走出,掌御灵纹,心通万古,踏上了一条古今未有的传奇之路。
  • 遇你与我陌上桑

    遇你与我陌上桑

    如果十年前我没有离开,你是不是可以退去一身冷漠;如果樱花依旧留不住你,我是不是只能与你擦肩而过;我答应你,下次再相遇的时候我们就好好在一起..
  • 弃后良膳

    弃后良膳

    一朝进宫,成为当朝弃妃,姨娘不爱,姐妹不疼,她毫不畏惧,独自在冷宫过的风生水起。美食美酒坐起来,农田小菜煮起来,冷宫日子一样逍遥。忽然有一天,来了个闻香而来的小皇帝,一切都变了个模样...
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 青春年少,最美不过是你

    青春年少,最美不过是你

    一场意外,让她穿到另一个人身上,拥有花季年龄,娇好的容貌,惊人的家世背景和高智商。他是人们口中的国民校草,商界奇才,有雄厚的家世。两位高智商的人会擦出怎样的火花……(开启虐狗模式)
  • 这些与我无关

    这些与我无关

    品学兼优的苏晴儿被自己的妹妹苏灵儿顶了自己的学位,而自己却得留在老家,突然来了一位总裁……
  • 京城大杂烩

    京城大杂烩

    故事起因为沈应和老崔是多年的老朋友,二人最喜欢一起坐在天台喝酒……