=数据卡尺=
如何用统计学的知识,来应用在数据上呢?
-第一步-
要弄明白统计学和数据之间的共性和非共性。
统计学:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而统计学本身就有意和无意的忽略了各个数值的先后排列。
数据:每一个数据无论其数值是多少,其本身就作为一个数值独占的存在体,然而数据本身很注重各个数值的先后排列。
比如:abracadabra
用统计学来表示,就是a出现了5次,b出现了2次,c出现了1次,d出现了1次,r出现了2次。
用数据来表示,就是abracadabra。
那么如何把数据快速的解压缩出来呢?可以使用分段压缩方式,比如把一个大文件,分割成一个个片段,例如:
abracadabra
the
fox
jucdccdbdbabadbdac
转换为十进制:46,084,723,570
转换为16进制:a
badd
1372
然后进行统计,比如,在4进制中,abcd各出现过多少次;在二进制中0和1各出现过多少次;在十进制中0123456789各出现过多少次;在十六进制中0123456789abcdef各出现过多少次。
当然了,为了进制校验的准确性,一般都是采用素数进制的方式来进行校验(比如2进制,3进制,5进制,7进制,11进制,13进制……以此类推),然后通过进制之间的差异,来统计。
当然了,因为是为了给单片机使用的,所以本身就不会采用过高进制,比如高达亿进制。
也就是把每一个数据片段,都除以各个进制数,然后得出余数。
→喷子兼或破壁人:所以分解质因数都出现了是吧?你还能更敷衍一点么?
→喷子兼或破壁人:直到现在,你都没有给出使用多处理器来进行大数据压缩和解压缩的代码实现,你在这给程序员用自然语言编程呢?
作者现在在自学c++语言,感觉可能用得上。
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
相邻推荐:蓝未未 穿越到东京的日子 碎碎薄情 山村调教 继父(禁忌h) 藏于盛夏 白月光(亲兄妹 sc) 风*的女儿 黏度最佳恋人 李凉小说矛盾天师 潮热夏雨 少庄主的小皇帝 苗床孕育中心 隐婚天后:帝少,别撩我 诱捕妖精的正确方法(娇气包美人攻/互攻/攻生子/产乳) 浅夏至暖 福气包的七零小日子 软腰(NP) 与智能人相恋 [综]明光