位运算及其应用

到目前为止,我们已经知道数据在计算机内部是以二进制形式存储的。那么,我们如何操作二进制形式的数据呢?

布尔位运算

在 C 语言中,一个很有用的特性是可以按位进行布尔运算,对应的操作符是:|(OR),&(AND),~(NOT),^(XOR)。

  • OR 的任意一个操作数为真(1),结果就为真(1);AND 的任意一个操作数为假(0),结果就为假(0);XOR 的两个操作数不同时,结果为真(1)

    output = a | b;
    output = a & b;
    output = a ^ b;
    
  • NOT 的操作数为真(1)时,结果就为假(0);反之,操作数为假(0)时,结果就为真(1)

    output = ~a;
    

辨析:逻辑运算

在 C 语言中,逻辑运算(||&&!)很容易和位运算混淆。逻辑运算认为 0true0false

逻辑运算是按整体数值来计算结果的,并不是在位级别上进行操作;这是区别于位运算最大的地方。

移位运算

移位运算也可以称为一种位运算,因为该操作符将值当作一系列的位来对待,而不是一个整体数值。但由于寄存器的位数固定,所以在移位过程中,总会有一些位被移出(shifted out)寄存器,也会有一些位被移进(shifted in)寄存器。

x << k;   // 该表达式等于将 x 向左移动 k 个位后的值(x 不变)
x >>= k;  // 将 x 向右移动 k 个位(x 改变)

补充:k 的范围

如果 x 是一个 int 整型,则 x 将由 32 个位组成。如果执行下面的操作:

  • x << 32;

  • x >> 36;

  • x << 40;

参考书介绍说,这样的情况会先计算 k 和位数的模,再按模量来移动,上述语句最终移动的位数将变为 0、4 和 8 位。

在 C 语言中,k 为负值或大于等于数据类型宽度是未定义行为(Undefined Behavior),上述语句并不会真正工作。

左移操作

左移操作将二进制位模式向左移动指定数量的位置。移动之后,低位(lower order)增加的部分用 0 补充,高位多余的部分将会丢失。

00110111 << 2 // 11011100
01100011 << 4 // 00110000
10010101 << 4 // 01010000

右移操作

右移操作将二进制位模式向右移动指定数量的位置。移动之后,低位多余的部分将会丢失,但是高位(higher order)并不会默认补充 0。

  • 对于无符号整型,高位补充 0,这种右移操作称为逻辑右移(Logical Right Shift)

    unsigned short ux = 16;
    unsigned short uy = x >> 4;
    // 0000 0000 0001 0000 -> 0000 0000 0000 0001
    

    logical-shift

  • 对于有符号整型,高位补充符号位,这种右移操作称为算术右移(Arithmetic Right Shift)。

    虽然 C 标准并没有规定有符号整型必须采用算术右移,但是大部分编译器都默认这个行为,所以我们可以把这个行为当作事实来对待。

    short x = 16;
    short y = x >> 4;
    // 0000 0000 0001 0000 -> 0000 0000 0000 0001
    
    x = -16;
    y = x >> 4;
    // 1111 1111 1111 0000 -> 1111 1111 1111 1111
    

    arithmetic-shift

陷阱:注意操作符的优先级

由于加法操作符优先级比移位运算符高,所以表达式 1<<2 + 3<<4 在 C 语言中的解释是 1 << (2+3) << 4

为了避免不必要的麻烦,尽量多加一些括号,比如这样 (1<<2) + (3<<4)

位掩码

位操作在嵌入式等涉及到硬件操作的领域应用较为广泛,其中一个应用场景是对一组位模式进行选择性操作,即屏蔽掉部分位,只对感兴趣的部分进行修改,这种操作称为位掩码(Bitmask)。

位运算在底层库、嵌入式、网络、图形学领域有大量应用,即使不深入底层,掌握这些常见操作也是非常有必要的。

将指定的位设置为 1

置 1 操作,即打开某些位,可以使用按位或运算 |

  • Y | 1 = 1:按位或运算 | 搭配 1 可以将位设置为 1

  • Y | 0 = Y:按位或运算 | 搭配 0 可以保持位状态不变

示例:在较高的半字节(位 4、5、6、7)上置 1,同时保持较低的半字节(位 0、1、2、3)不变。

   10010101   10100101
 | 11110000   00010000
   --------   --------
   11110101   10110101

以上示例也可以理解为,求两组位模式的并集

将指定的位设置为 0

在实践中,更常见的是置 0 操作,可以使用按位与运算 &

  • Y & 1 = Y:按位与运算 & 搭配 0 可以将位设置为 0

  • Y & 0 = 0:按位与运算 & 搭配 1 可以保持位状态不变

示例:在较高的半字节(位 4、5、6、7)上置 0,同时保持较低的半字节(位 0、1、2、3)不变。

   10010101   10100101
 & 00001111   11001111
   --------   --------
   00000101   10000101

以上示例也可以理解为,求两组位模式的交集

查询某个位的状态

按位与运算 & 稍作变化就可以进行查询操作。结果为 true,则查询的位是 1;结果为 false,则查询的位为 0。

示例:查询第 4 个位的状态

  10011101   10010101
& 00001000   00001000
  --------   --------
  00001000   00000000

切换位的状态

上述应用,要么同时打开某些位,要么同时关闭某些位,但有些情况下,我们需要关闭一部分位的同时打开另一部分。 按位异或位操作 ^ 可以实现精准的控制。当且仅当 1 的数量为单数时,异或的结果为 1,所以对于 Y XOR 1

  • Y = 1 时,1 的数量不为单数,1 XOR 1 结果为 0

  • Y = 0 时,1 的数量为单数,0 XOR 1 结果为 1

示例:将第一组较低的半字节(位 0、1、2、3)切换状态,较高的半字节(位 4、5、6、7)保持不变;将第二组所有位切换状态

  10011101   10010101
^ 00001111   11111111
  --------   --------
  10010010   01101010

对于第二组,如果目的是切换所有位模式,也可以使用按位取反位操作 ~

~ 10010101
  --------
  01101010