Searched refs:vecInA (Results 1 – 4 of 4) sorted by relevance
/cmsis-dsp-latest/dsppp/Include/dsppp/Helium/ |
D | matrix_multiply_f16.hpp | 52 VEC vecInA, vecInB, vecDst; 63 vecInA = vldrhq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 74 vecDst = vmulq(vecInA, vecInB); 82 vecInA = vldrhq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 97 vecDst = vfmaq(vecDst, vecInA, vecInB); 135 float16x8_t vecInA, vecInB, vecDst; 147 vecInA = vldrhq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 157 vecDst = vmulq(vecInA, vecInB); 166 vecInA = vldrhq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 180 vecDst = vfmaq(vecDst, vecInA, vecInB); [all …]
|
D | matrix_multiply_f32.hpp | 43 VEC vecInA, vecInB, vecDst; 53 vecInA = vldrwq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 58 vecInA = inner::vload1_gen_stride<0, 0, s, s>::run(pSrcA.const_ptr()); 69 vecDst = inner::vmul(vecInA, vecInB); 83 vecInA = vldrwq_gather_shifted_offset(pSrcA.const_ptr(), vecOffsA); 88 vecInA = inner::vload1_gen_stride<1, 1, s+1, s+1>::run(pSrcA.const_ptr()); 107 vecDst = inner::vmacc(vecDst, vecInA, vecInB);
|
/cmsis-dsp-latest/Source/MatrixFunctions/ |
D | arm_mat_mult_f16.c | 64 f16x8_t vecInA, vecInB, vecDst; in arm_mat_mult_f16_2x2_mve() local 75 vecInA = vldrhq_gather_shifted_offset((float16_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f16_2x2_mve() 86 vecDst = vmulq(vecInA, vecInB); in arm_mat_mult_f16_2x2_mve() 94 vecInA = vldrhq_gather_shifted_offset((float16_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f16_2x2_mve() 109 vecDst = vfmaq(vecDst, vecInA, vecInB); in arm_mat_mult_f16_2x2_mve() 133 f16x8_t vecInA, vecInB, vecDst; in arm_mat_mult_f16_3x3_mve() local 145 vecInA = vldrhq_gather_shifted_offset((float16_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f16_3x3_mve() 155 vecDst = vmulq(vecInA, vecInB); in arm_mat_mult_f16_3x3_mve() 164 vecInA = vldrhq_gather_shifted_offset((float16_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f16_3x3_mve() 178 vecDst = vfmaq(vecDst, vecInA, vecInB); in arm_mat_mult_f16_3x3_mve() [all …]
|
D | arm_mat_mult_f32.c | 103 f32x4_t vecInA, vecInB, vecDst; in arm_mat_mult_f32_2x2_mve() local 108 vecInA = vldrwq_gather_shifted_offset((float32_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f32_2x2_mve() 111 vecDst = vmulq(vecInA, vecInB); in arm_mat_mult_f32_2x2_mve() 116 vecInA = vldrwq_gather_shifted_offset((float32_t const *) pSrcA->pData, vecOffsA); in arm_mat_mult_f32_2x2_mve() 119 vecDst = vfmaq(vecDst, vecInA, vecInB); in arm_mat_mult_f32_2x2_mve()
|