为什么在比较范围内的数字时,汇编代码中是否出现分支?

我正在读这个问题,这是接受的答案。 我阅读了评论,但我无法弄清楚产生优化的原因。

使用以下代码时,为什么在汇编代码中出现分支?

x >= start && x <= end 

编辑:
为清楚起见,我想了解接受答案产生优化的原因。 据我所知,编译器生成的汇编代码中存在分支。 我想了解为什么生成的代码中有一个分支。

请注意,链接的问题具有根本不同的表达

 x >= start && x++ <= end 

它根本不同,因为这里的第二个子表达具有副作用。 我会解释一下。

请注意, &&是一个短路运算符 。 这意味着如果x >= start计算结果为false ,则机器可以x <= end求值进行分支。

更准确地说,当编译器发出x >= start && x <= end指令x >= start && x <= end ,它可以发出指令,当x >= start计算为false时,分支超过x <= end

但是,我强调在上述陈述中使用单词can 。 这是因为x <= end没有副作用,因此编译器是否对其进行分支无关紧要。

但是,如果第二个表达式确实有副作用,则编译器必须对其进行分支。 由于&&是一个短路算子,在a && b ,如果b有任何副作用,如果评估为false ,则不得观察到它们; 这是C和大多数(如果不是所有C语言)短路的要求。

所以,特别是当你看的时候

 define POINT_IN_RANGE_AND_INCREMENT(p, range) (p <= range.end && p++ >= range.start) 

请注意第二个表达式p++ >= range.start有副作用。 即,(后)将p递增1 。 但只有当p <= range.end评估为true才能观察到这种副作用。 因此,如果p <= range.end计算结果为false,则编译器必须p++ >= range.start p <= range.end求值进行p <= range.end

这导致分支的原因是因为机器要评估该表达式,它使用的事实是, 如果p <= range.end求值为false ,那么它会自动知道整个表达式的计算结果为false ,因此它不应该评估p++ >= range.start因为它有副作用。 因此,它必须分支评估表达式的第二部分。 所以在集会中:

 Ltmp1301: ldr r1, [sp, #172] @ 4-byte Reload ldr r1, [r1] cmp r0, r1 bls LBB44_32 mov r6, r0 @ if the result of the compare is false b LBB44_33 @ branch over evaluating the second expression @ to avoid the side effects of p++ LBB44_32: ldr r1, [sp, #188] @ 4-byte Reload adds r6, r0, #1 Ltmp1302: ldr r1, [r1] cmp r0, r1 bhs LBB44_36 

对Oli Charlesworth深表感谢,以获得富有洞察力的评论。