简单的ASCII压缩 – 帮助最小化系统调用
在我的上一个问题中 ,nos提供了一种从ASCII字符字节中删除最重要位的方法,这与我教授在描述项目时所说的完全一致。
我的问题是如何剥离有效位并使用write
命令将其打包到缓冲区中。 由于write
命令占用了要写入的字节数的长度,因此如何更深入地处理缓冲区数组的位级别?
可能最简单的方法是使用八个字节的块。 读入一个块然后使用按位运算符将它们压缩为七个字节。
让我们调用输入数据input[0..7]
和输出数据output[0..6]
。
因此,输出数据的第一个字节output[0]
由input[0]
的低7位加上input[2]
的第二高位组成。 对所有其他人来说也是如此:
指数:[0] [1] [2] [3] [4] [5] [6] [7] 输入:0aaaaaa 0bbbbbbb 0ccccccc 0ddddddd 0eeeeeee 0fffffff 0ggggggg 0hhhhhhh /////// //////和--->
| /
|| 等等—>
输出:aaaaaaab bbbbbbcc cccccddd ddddeeee eeefffff ffgggggg ghhhhhhh
指数:[0] [1] [2] [3] [4] [5] [6]
您可以使用以下操作:
output[0] = ((input[0] & 0x7f) << 1) | ((input[1] & 0x40) >> 6) output[1] = ((input[1] & 0x3f) << 2) | ((input[2] & 0x60) >> 5) : output[5] = ((input[5] & 0x03) << 6) | ((input[6] & 0x7e) >> 1) output[6] = ((input[6] & 0x01) << 7) | (input[7] & 0x7f)
其他应该可以从上面的那些计算。 如果您想了解有关按位运算符的更多信息,请参阅此处 。
一旦你压缩了一个8字节的块,写出七字节的压缩块并继续。
唯一有点棘手的一点是在最后你可能没有完整的八个字节。 在这种情况下,您将输出与输入一样多的字节,但最后一个将填充零位。
而且,在减压方面,你会做相反的事情。 读入七个字节的块,使用按位运算符扩展并写出八个字节。 您还可以根据读取的最后一个部分的大小来确定哪些位在末尾填充。
正如paxdiablo所说:最简单的方法是用八个字节的块。 但为什么要换8字节? 您可以打包最后一个字节的前7个字节位! 简单快捷……
Output[0] = ((Input[0] & 0x7f) | (Input[7] & 0x80)) //pack 7th bit in 0th byte Output[1] = ((Input[1] & 0x7f) | ((Input[7] << 1) & 0x80)) //pack 6th bit in 1th byte Output[2] = ((Input[2] & 0x7f) | ((Input[7] << 2) & 0x80)) //pack 5th bit in 2th byte ...
为了恢复,只需将所有7个字节的第7位放到第7个字节中,并清除所有数组字节中的第7位。
您需要先将数据打包到内存中的缓冲区中。 例如,为了简单起见:
unsigned char unpacked[128]; // read file input into this buffer unsigned char packed[128]; // copy from unpacked to here while compressing // then write() this to output file...
要进行压缩本身,你需要循环读取到unpacked
的字节数,并使用按位运算符,如&
(按位AND), |
(按位OR), <<
按位左移。
如果此过程的某些特定部分您不知道该怎么做,请告诉我们您的尝试(在代码中),我们会为您提供更多详细信息,但您不能指望(或从中受益)执行所有作业的人。