Lines Matching refs:vw
2312 __m128* OPJ_RESTRICT vw = (__m128*) w; in opj_v4dwt_decode_step1_sse() local
2315 vw += 2 * start; in opj_v4dwt_decode_step1_sse()
2316 for (i = start; i + 3 < end; i += 4, vw += 8) { in opj_v4dwt_decode_step1_sse()
2317 __m128 xmm0 = _mm_mul_ps(vw[0], c); in opj_v4dwt_decode_step1_sse()
2318 __m128 xmm2 = _mm_mul_ps(vw[2], c); in opj_v4dwt_decode_step1_sse()
2319 __m128 xmm4 = _mm_mul_ps(vw[4], c); in opj_v4dwt_decode_step1_sse()
2320 __m128 xmm6 = _mm_mul_ps(vw[6], c); in opj_v4dwt_decode_step1_sse()
2321 vw[0] = xmm0; in opj_v4dwt_decode_step1_sse()
2322 vw[2] = xmm2; in opj_v4dwt_decode_step1_sse()
2323 vw[4] = xmm4; in opj_v4dwt_decode_step1_sse()
2324 vw[6] = xmm6; in opj_v4dwt_decode_step1_sse()
2326 for (; i < end; ++i, vw += 2) { in opj_v4dwt_decode_step1_sse()
2327 vw[0] = _mm_mul_ps(vw[0], c); in opj_v4dwt_decode_step1_sse()
2338 __m128* OPJ_RESTRICT vw = (__m128*) w; in opj_v4dwt_decode_step2_sse() local
2345 vw += start * 2; in opj_v4dwt_decode_step2_sse()
2346 tmp1 = vw[-3]; in opj_v4dwt_decode_step2_sse()
2354 tmp2 = vw[-1]; in opj_v4dwt_decode_step2_sse()
2355 tmp3 = vw[ 0]; in opj_v4dwt_decode_step2_sse()
2356 tmp4 = vw[ 1]; in opj_v4dwt_decode_step2_sse()
2357 tmp5 = vw[ 2]; in opj_v4dwt_decode_step2_sse()
2358 tmp6 = vw[ 3]; in opj_v4dwt_decode_step2_sse()
2359 tmp7 = vw[ 4]; in opj_v4dwt_decode_step2_sse()
2360 tmp8 = vw[ 5]; in opj_v4dwt_decode_step2_sse()
2361 tmp9 = vw[ 6]; in opj_v4dwt_decode_step2_sse()
2362 vw[-1] = _mm_add_ps(tmp2, _mm_mul_ps(_mm_add_ps(tmp1, tmp3), c)); in opj_v4dwt_decode_step2_sse()
2363 vw[ 1] = _mm_add_ps(tmp4, _mm_mul_ps(_mm_add_ps(tmp3, tmp5), c)); in opj_v4dwt_decode_step2_sse()
2364 vw[ 3] = _mm_add_ps(tmp6, _mm_mul_ps(_mm_add_ps(tmp5, tmp7), c)); in opj_v4dwt_decode_step2_sse()
2365 vw[ 5] = _mm_add_ps(tmp8, _mm_mul_ps(_mm_add_ps(tmp7, tmp9), c)); in opj_v4dwt_decode_step2_sse()
2367 vw += 8; in opj_v4dwt_decode_step2_sse()
2371 tmp2 = vw[-1]; in opj_v4dwt_decode_step2_sse()
2372 tmp3 = vw[ 0]; in opj_v4dwt_decode_step2_sse()
2373 vw[-1] = _mm_add_ps(tmp2, _mm_mul_ps(_mm_add_ps(tmp1, tmp3), c)); in opj_v4dwt_decode_step2_sse()
2375 vw += 2; in opj_v4dwt_decode_step2_sse()
2380 c = _mm_mul_ps(c, vw[-2]); in opj_v4dwt_decode_step2_sse()
2381 vw[-1] = _mm_add_ps(vw[-1], c); in opj_v4dwt_decode_step2_sse()