AltiVec signed integer pmadd removed, proved to be 2x slower than the scalar trait(!).

2025-08-04 11:10:40 +08:00 · 2010-06-28 21:24:55 +03:00 · 2010-06-28 21:24:55 +03:00 · cf3616b2c0
commit cf3616b2c0
parent 97889a7f46
1 changed files with 3 additions and 0 deletions
--- a/Eigen/src/Core/arch/AltiVec/PacketMath.h
+++ b/Eigen/src/Core/arch/AltiVec/PacketMath.h
@ -174,6 +174,8 @@ template<> EIGEN_STRONG_INLINE Packet4f ei_pnegate(const Packet4f& a) { return e
 template<> EIGEN_STRONG_INLINE Packet4i ei_pnegate(const Packet4i& a) { return ei_psub<Packet4i>(ei_p4i_ZERO, a); }
 template<> EIGEN_STRONG_INLINE Packet4f ei_pmul<Packet4f>(const Packet4f& a, const Packet4f& b) { return vec_madd(a,b,ei_p4f_ZERO); }
 /* Commented out: it's actually slower than processing it scalar
 *
 template<> EIGEN_STRONG_INLINE Packet4i ei_pmul<Packet4i>(const Packet4i& a, const Packet4i& b)
 {
  // Detailed in: http://freevec.org/content/32bit_signed_integer_multiplication_altivec
@ -207,6 +209,7 @@ template<> EIGEN_STRONG_INLINE Packet4i ei_pmul<Packet4i>(const Packet4i& a, con
  return prod;
 }
 */
 template<> EIGEN_STRONG_INLINE Packet4f ei_pdiv<Packet4f>(const Packet4f& a, const Packet4f& b)
 {
  Packet4f t, y_0, y_1, res;