简单的ASCII压缩 – 帮助最小化系统调用

在我的上一个问题中 ,nos提供了一种从ASCII字符字节中删除最重要位的方法,这与我教授在描述项目时所说的完全一致。

我的问题是如何剥离有效位并使用write命令将其打包到缓冲区中。 由于write命令占用了要写入的字节数的长度,因此如何更深入地处理缓冲区数组的位级别?

可能最简单的方法是使用八个字节的块。 读入一个块然后使用按位运算符将它们压缩为七个字节。

让我们调用输入数据input[0..7]和输出数据output[0..6]

因此,输出数据的第一个字节output[0]input[0]的低7位加上input[2]的第二高位组成。 对所有其他人来说也是如此:

    指数:[0] [1] [2] [3] [4] [5] [6] [7]
    输入:0aaaaaa 0bbbbbbb 0ccccccc 0ddddddd 0eeeeeee 0fffffff 0ggggggg 0hhhhhhh
             /////// //////和--->
             

| /

|| 等等—>
输出:aaaaaaab bbbbbbcc cccccddd ddddeeee eeefffff ffgggggg ghhhhhhh
指数:[0] [1] [2] [3] [4] [5] [6]

您可以使用以下操作:

 output[0] = ((input[0] & 0x7f) << 1) | ((input[1] & 0x40) >> 6) output[1] = ((input[1] & 0x3f) << 2) | ((input[2] & 0x60) >> 5) : output[5] = ((input[5] & 0x03) << 6) | ((input[6] & 0x7e) >> 1) output[6] = ((input[6] & 0x01) << 7) | (input[7] & 0x7f) 

其他应该可以从上面的那些计算。 如果您想了解有关按位运算符的更多信息,请参阅此处 。

一旦你压缩了一个8字节的块,写出七字节的压缩块并继续。

唯一有点棘手的一点是在最后你可能没有完整的八个字节。 在这种情况下,您将输出与输入一样多的字节,但最后一个将填充零位。

而且,在减压方面,你会做相反的事情。 读入七个字节的块,使用按位运算符扩展并写出八个字节。 您还可以根据读取的最后一个部分的大小来确定哪些位在末尾填充。

正如paxdiablo所说:最简单的方法是用八个字节的块。 但为什么要换8字节? 您可以打包最后一个字节的前7个字节位! 简单快捷……

 Output[0] = ((Input[0] & 0x7f) | (Input[7] & 0x80)) //pack 7th bit in 0th byte Output[1] = ((Input[1] & 0x7f) | ((Input[7] << 1) & 0x80)) //pack 6th bit in 1th byte Output[2] = ((Input[2] & 0x7f) | ((Input[7] << 2) & 0x80)) //pack 5th bit in 2th byte ... 

为了恢复,只需将所有7个字节的第7位放到第7个字节中,并清除所有数组字节中的第7位。

您需要先将数据打包到内存中的缓冲区中。 例如,为了简单起见:

 unsigned char unpacked[128]; // read file input into this buffer unsigned char packed[128]; // copy from unpacked to here while compressing // then write() this to output file... 

要进行压缩本身,你需要循环读取到unpacked的字节数,并使用按位运算符,如& (按位AND), | (按位OR), <<按位左移。

如果此过程的某些特定部分您不知道该怎么做,请告诉我们您的尝试(在代码中),我们会为您提供更多详细信息,但您不能指望(或从中受益)执行所有作业的人。