Tag: pow

替换极其缓慢的pow()函数

我们有一个CFD求解器,在运行模拟时,发现它在某些机器上运行速度非常慢,而在其他机器上却运行得非常慢。 使用英特尔VTune,发现以下行是问题(在Fortran中): RHOV= RHO_INF*((1.0_wp – COEFF*EXP(F0)))**(1.0_wp/(GAMM – 1.0_wp)) 使用VTune进行钻取,问题可以追溯到call pow组装线,并且在跟踪堆栈时,它显示它正在使用__slowpow() 。 经过一番搜索, 这个页面出现了抱怨同样的事情。 在具有libc版本2.12的机器上,模拟花了18秒。 在具有libc版本2.14的机器上,模拟花了0秒。 基于上述页面的信息,当pow()的基数接近1.0时出现问题。 所以我们做了另一个简单的测试,我们在pow()之前用任意数字缩放基数,然后除以在pow()调用之后提升到指数的数字。 使用libc 2.12,运行时间从18秒减少到0秒。 但是,将这些全部放在我们执行a**b的代码上是不切实际的。 如何更换libc中的pow()函数? 例如,我希望Fortran编译器生成的组装线call pow调用我们编写的自定义pow()函数来执行缩放,调用libc pow()然后除以缩放。 如何创建一个对编译器透明的中间层? 编辑 为了澄清,我们正在寻找类似(伪代码)的东西: double pow(a,b) { a *= 5.0 tmp = pow_from_libc(a,b) return tmp/pow_from_libc(5.0, b) } 是否可以从libc加载pow并在我们的自定义函数中重命名以避免命名冲突? 如果customPow.o文件可以从libc重命名pow ,如果其他东西仍然需要libc会发生什么? 这会导致customPow.o pow和libc中的pow之间的命名冲突吗?

powfunction在这里发生了什么?

我在这里看到了各种答案,描述了C函数中的pow函数的奇怪行为。 但我在这里问一些不同的东西。 在下面的代码中,我初始化了int x = pow(10,2)和int y = pow(10,n) (int n = 2) 。 在第一种情况下,当我打印结果时,它显示100而在另一种情况下,它显示为99 。 我知道pow返回double并且在int存储时会被截断,但我想问为什么输出会有所不同。 CODE1 #include #include int main() { int n = 2; int x; int y; x = pow(10,2); //Printing Gives Output 100 y = pow(10,n); //Printing Gives Output 99 printf(“%d %d” , x , y); } Output : 100 […]