x86和x64之间的浮点算术的差异

我偶然发现了在x86和x64的MS VS 2010版本之间完成浮点算术的方式不同（两者都在同一台64位机器上执行）。

这是一个简化的代码示例：

float a = 50.0f; float b = 65.0f; float c = 1.3f; float d = a*c; bool bLarger1 = d<b; bool bLarger2 = (a*c)<b;

布尔bLarger1始终为false（在两个版本中d都设置为65.0）。变量bLarger2对于x64为false，但对于x86为true！

我很清楚浮点算术和圆角效应正在发生。我也知道32位有时使用不同的指令进行浮动操作而不是64位构建。但在这种情况下，我错过了一些信息。

为什么bLarger1和bLarger2之间首先存在差异？为什么它只出现在32位构建中？

左：x86，右：x64

问题取决于这个表达：

 bool bLarger2 = (a*c)


 我查看了VS2008下生成的代码，没有手持VS2010。 对于64位代码是： 
 000000013FD51100 movss xmm1，dword ptr [a] 
 000000013FD51106 mulss xmm1，dword ptr [E] 
 000000013FD5110C movss xmm0，dword ptr [b] 
 000000013FD51112 comiss xmm0，xmm1 

 对于32位代码是： 
 00FC14DC fld dword ptr [a] 
 00FC14DF fmul dword ptr [E] 
 00FC14E2 fld dword ptr [b] 
 00FC14E5 fcompp           

 因此，在32位下，计算在x87单元中执行，而在64位下，它由x64单元执行。 
 这里的区别在于x87操作都执行到高于单精度。 默认情况下，执行计算以获得双精度。 另一方面，SSE单元操作是纯单精度计算。 
 你可以说服32位单元执行所有计算到单精度精度，如下所示： 
 _controlfp(_PC_24, _MCW_PC); 
 当您将其添加到32位程序时，您会发现布尔值都设置为false。 
  x87和SSE浮点单元的工作方式存在根本区别。  x87单元对单精度和双精度类型使用相同的指令。 数据被加载到x87 FPU堆栈的寄存器中，这些寄存器总是10字节Intel扩展。 您可以使用浮点控制字来控制精度。 但编译器编写的指令不了解该状态。 
 另一方面，SSE单元对单精度和双精度的操作使用不同的指令。 这意味着编译器可以发出完全控制计算精度的代码。 
 所以，x87单元在这里是坏人。 您可以尝试说服编译器发出SSE指令，即使是32位目标也是如此。 当然，当我在VS2013下编译你的代码时，我发现32位和64位目标都发出了SSE指令。



		      	 浮点运算总是不精确的，比较两个浮点数这个接近（或相等）几乎从不返回正确的输出。 
 浮点数在32位和64位计算机上的存储和处理方式不同（也有注释建议）。 如果我没记错的话，在VC中32位浮点数保存在堆栈中，FPU（浮点单元）处理它们，而64位机器上的浮点数可以存储在专用寄存器（SSE）中，并使用CPU中的其他单位计算。 
 我的答案没有明确的来源，但请查看此页面或本页 。



  如何将复合文字用于`fprintf（）`具有任意碱基的多个格式化数字？
  使用scanf（）读取一行不好？
	在C中计算64×64 int产品的高64位
make plain int 64 bit会破坏很多合理的代码吗？
什么决定整数的大小？
C ++中的大文件支持
unsigned short和签名的短期比较奇怪的行为

x86和x64之间的浮点算术的差异

如何在命令行中使用Visual Studio编译x64代码？

C中x64的128位算术运算

C 64位指针对齐

#ifdef用于32位平台

在GNU / Linux中表示64位整数

从i386移动到x86_64时的浮点精度

制作一个64位共享库，动态链接到Mac OS X Snow Leopard上的32位库

C和C ++中float和double的大小是多少？

64位除法

如何在C中使用asm添加两个64位数时访问进位标志