Tag: pow

替换极其缓慢的pow（）函数: 我们有一个CFD求解器，在运行模拟时，发现它在某些机器上运行速度非常慢，而在其他机器上却运行得非常慢。使用英特尔VTune，发现以下行是问题（在Fortran中）： RHOV= RHO_INF*((1.0_wp – COEFF*EXP(F0)))**(1.0_wp/(GAMM – 1.0_wp)) 使用VTune进行钻取，问题可以追溯到call pow组装线，并且在跟踪堆栈时，它显示它正在使用__slowpow() 。经过一番搜索，这个页面出现了抱怨同样的事情。在具有libc版本2.12的机器上，模拟花了18秒。在具有libc版本2.14的机器上，模拟花了0秒。基于上述页面的信息，当pow()的基数接近1.0时出现问题。所以我们做了另一个简单的测试，我们在pow()之前用任意数字缩放基数，然后除以在pow()调用之后提升到指数的数字。使用libc 2.12，运行时间从18秒减少到0秒。但是，将这些全部放在我们执行a**b的代码上是不切实际的。如何更换libc中的pow()函数？例如，我希望Fortran编译器生成的组装线call pow调用我们编写的自定义pow()函数来执行缩放，调用libc pow()然后除以缩放。如何创建一个对编译器透明的中间层？编辑为了澄清，我们正在寻找类似（伪代码）的东西： double pow(a,b) { a *= 5.0 tmp = pow_from_libc(a,b) return tmp/pow_from_libc(5.0, b) } 是否可以从libc加载pow并在我们的自定义函数中重命名以避免命名冲突？如果customPow.o文件可以从libc重命名pow ，如果其他东西仍然需要libc会发生什么？这会导致customPow.o pow和libc中的pow之间的命名冲突吗？

powfunction在这里发生了什么？: 我在这里看到了各种答案，描述了C函数中的pow函数的奇怪行为。但我在这里问一些不同的东西。在下面的代码中，我初始化了int x = pow(10,2)和int y = pow(10,n) (int n = 2) 。在第一种情况下，当我打印结果时，它显示100而在另一种情况下，它显示为99 。我知道pow返回double并且在int存储时会被截断，但我想问为什么输出会有所不同。 CODE1 #include #include int main() { int n = 2; int x; int y; x = pow(10,2); //Printing Gives Output 100 y = pow(10,n); //Printing Gives Output 99 printf(“%d %d” , x , y); } Output : 100 […]