C风格演员与内在演员
假设我已经定义了__m256d x
并且我想要提取较低的128位。 我会做:
__m128d xlow = _mm256_castpd256_pd128(x);
但是,我最近看到有人这样做:
__m128d xlow = (__m128d) x
是否有首选方法用于演员表? 为什么要使用第一种方法?
假设我已经定义了__m256d x
并且我想要提取较低的128位。 我会做:
__m128d xlow = _mm256_castpd256_pd128(x);
但是,我最近看到有人这样做:
__m128d xlow = (__m128d) x
是否有首选方法用于演员表? 为什么要使用第一种方法?