/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
D | vp9_loopfilter_neon.asm | 57 vld1.u8 {d5}, [r2@64], r1 ; p1 70 vst1.u8 {d5}, [r3@64], r1 ; store op0 117 vld1.u8 {d5}, [r2], r1 127 vtrn.32 d5, d17 130 vtrn.16 d3, d5 136 vtrn.8 d5, d6 145 vst4.8 {d4[0], d5[0], d6[0], d7[0]}, [r0], r1 146 vst4.8 {d4[1], d5[1], d6[1], d7[1]}, [r0], r1 147 vst4.8 {d4[2], d5[2], d6[2], d7[2]}, [r0], r1 148 vst4.8 {d4[3], d5[3], d6[3], d7[3]}, [r0], r1 [all …]
|
D | vp9_idct16x16_1_add_neon.asm | 55 vld1.64 {d5}, [r1], r2 64 vaddw.u8 q12, q0, d5 ; dest[x] + a1 91 vld1.64 {d5}, [r1], r2 100 vaddw.u8 q12, q0, d5 ; dest[x] + a1 127 vld1.64 {d5}, [r1], r2 136 vaddw.u8 q12, q0, d5 ; dest[x] + a1 163 vld1.64 {d5}, [r1], r2 172 vaddw.u8 q12, q0, d5 ; dest[x] + a1
|
D | vp9_mb_lpf_neon.asm | 45 vld1.u8 {d5}, [r8@64], r1 ; p2 150 vld1.8 {d5}, [r8@64], r1 171 vtrn.8 d4, d5 297 ; d5 p2 312 vabd.u8 d19, d4, d5 ; abs(p3 - p2) 313 vabd.u8 d20, d5, d6 ; abs(p2 - p1) 336 vabd.u8 d25, d7, d5 ; abs(p0 - p2) 451 vmlal.u8 q15, d5, d29 ; op2 = p0 + q0 + p3 * 3 + p2 * 2 452 vaddl.u8 q10, d4, d5 474 vsubw.u8 q15, d5 ; oq1 = oq0 - p2 [all …]
|
D | vp9_idct8x8_1_add_neon.asm | 53 vld1.64 {d5}, [r1], r2 62 vaddw.u8 q12, q0, d5 ; dest[x] + a1
|
D | vp9_idct8x8_add_neon.asm | 274 vld1.64 {d5}, [r1], r2 284 vaddw.u8 q13, q13, d5 294 vqmovun.s16 d5, q13 304 vst1.64 {d5}, [r0], r2 480 vld1.64 {d5}, [r1], r2 490 vaddw.u8 q13, q13, d5 500 vqmovun.s16 d5, q13 510 vst1.64 {d5}, [r0], r2
|
D | vp9_iht4x4_add_neon.asm | 54 ; d5 must contain sinpi_4_9. d6 must contain sinpi_3_9. The output will be 62 vmull.s16 q13, d5, d18 ; s3 = sinpi_4_9 * x2 68 vmull.s16 q9, d5, d19 ; s6 = sinpi_4_9 * x3 129 vdup.16 d5, r12 ; duplicate sinpi_4_9
|
D | vp9_iht8x8_add_neon.asm | 409 vqrshrn.s32 d5, q6, #14 ; >> 14 448 vmull.s16 q3, d5, d30 452 vmull.s16 q2, d5, d31 522 vqrshrn.s32 d5, q3, #14 ; >> 14 662 vld1.64 {d5}, [r1], r2 672 vaddw.u8 q13, q13, d5 682 vqmovun.s16 d5, q13 692 vst1.64 {d5}, [r0], r2
|
D | vp9_idct32x32_add_neon.asm | 177 vld1.s16 {d5}, [r7] 185 vaddw.u8 q5, q5, d5 190 vqmovun.s16 d5, q5 195 vst1.16 {d5}, [r7], r11 211 vld1.s16 {d5}, [r7] 219 vaddw.u8 q5, q5, d5 224 vqmovun.s16 d5, q5 229 vst1.16 {d5}, [r7], r11 391 vswp d5, d12 466 DO_BUTTERFLY_STD cospi_31_64, cospi_1_64, d0, d1, d4, d5 [all …]
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
D | sixtappredict8x4_neon.asm | 62 vdup.8 d0, d24[0] ;first_pass filter (d0-d5) 72 vdup.8 d5, d26[4] 119 vmlal.u8 q7, d28, d5 ;(src_ptr[3] * vp8_filter[5]) 120 vmlal.u8 q8, d29, d5 121 vmlal.u8 q9, d30, d5 122 vmlal.u8 q10, d31, d5 204 vmlal.u8 q8, d27, d5 ;(src_ptr[3] * vp8_filter[5]) 205 vmlal.u8 q9, d28, d5 206 vmlal.u8 q10, d29, d5 207 vmlal.u8 q11, d30, d5 [all …]
|
D | dequant_idct_neon.c | 23 int16x4_t d2, d3, d4, d5, d10, d11, d12, d13; in vp8_dequant_idct_add_neon() local 78 d5 = vqsub_s16(d12, d11); in vp8_dequant_idct_add_neon() 81 d2tmp1 = vtrn_s32(vreinterpret_s32_s16(d3), vreinterpret_s32_s16(d5)); in vp8_dequant_idct_add_neon() 108 d5 = vqsub_s16(d12, d11); in vp8_dequant_idct_add_neon() 113 d5 = vrshr_n_s16(d5, 3); in vp8_dequant_idct_add_neon() 116 d2tmp1 = vtrn_s32(vreinterpret_s32_s16(d3), vreinterpret_s32_s16(d5)); in vp8_dequant_idct_add_neon()
|
D | sixtappredict8x8_neon.asm | 65 vdup.8 d0, d24[0] ;first_pass filter (d0-d5) 75 vdup.8 d5, d26[4] 123 vmlal.u8 q7, d28, d5 ;(src_ptr[3] * vp8_filter[5]) 124 vmlal.u8 q8, d29, d5 125 vmlal.u8 q9, d30, d5 126 vmlal.u8 q10, d31, d5 217 vmlal.u8 q8, d27, d5 ;(src_ptr[3] * vp8_filter[5]) 218 vmlal.u8 q9, d28, d5 219 vmlal.u8 q10, d29, d5 220 vmlal.u8 q11, d30, d5 [all …]
|
D | sixtappredict16x16_neon.asm | 72 vdup.8 d0, d24[0] ;first_pass filter (d0-d5) 77 vdup.8 d5, d26[4] 132 vmlal.u8 q8, d28, d5 ;(src_ptr[3] * vp8_filter[5]) 133 vmlal.u8 q10, d29, d5 134 vmlal.u8 q12, d30, d5 140 vmlal.u8 q9, d28, d5 ;(src_ptr[3] * vp8_filter[5]) 141 vmlal.u8 q11, d29, d5 142 vmlal.u8 q13, d30, d5 211 vdup.8 d0, d14[0] ;second_pass filter parameters (d0-d5) 216 vdup.8 d5, d16[4] [all …]
|
D | vp8_subpixelvariance16x16_neon.asm | 54 vld1.u8 {d5, d6, d7}, [r0], r1 72 vmull.u8 q9, d5, d0 80 vext.8 d5, d5, d6, #1 85 vmlal.u8 q9, d5, d1 111 vld1.u8 {d5, d6, d7}, [r0], r1 125 vmull.u8 q11, d5, d0 131 vext.8 d5, d5, d6, #1 135 vmlal.u8 q11, d5, d1 223 vqrshrn.u16 d5, q4, #7 230 vst1.u8 {d4, d5}, [r3]! [all …]
|
D | sixtappredict4x4_neon.asm | 61 vdup.8 d0, d24[0] ;first_pass filter (d0-d5) 69 vdup.8 d5, d26[4] 85 vmull.u8 q7, d18, d5 ;(src_ptr[3] * vp8_filter[5]) 86 vmull.u8 q8, d20, d5 150 vmull.u8 q7, d18, d5 ;(src_ptr[3] * vp8_filter[5]) 151 vmull.u8 q8, d20, d5 152 vmull.u8 q12, d31, d5 ;(src_ptr[3] * vp8_filter[5]) 224 vdup.8 d0, d14[0] ;second_pass filter parameters (d0-d5) 229 vdup.8 d5, d16[4] 234 vmull.u8 q5, d25, d5 ;(src_ptr[3] * vp8_filter[5]) [all …]
|
D | sad16_neon.asm | 46 vabal.u8 q13, d5, d13 71 vabal.u8 q13, d5, d13 96 vabal.u8 q13, d5, d13 121 vabal.u8 q13, d5, d13 165 vabal.u8 q13, d5, d13 189 vabal.u8 q13, d5, d13
|
D | vp8_subpixelvariance16x16s_neon.asm | 45 vld1.u8 {d4, d5, d6, d7}, [r0], r1 71 vsubl.u8 q1, d5, d27 99 vmlal.s16 q10, d5, d5 162 vsubl.u8 q14, d5, d7 192 vmlal.s16 q10, d5, d5 245 vld1.u8 {d4, d5, d6, d7}, [r0], r1 279 vsubl.u8 q1, d5, d15 372 vld1.u8 {d4, d5, d6, d7}, [r0], r1 399 vst1.u8 {d4, d5, d6, d7}, [r3]! 414 vld1.u8 {d4, d5, d6, d7}, [r0], r1 [all …]
|
D | vp8_subpixelvariance8x8_neon.asm | 55 vext.8 d5, d4, d5, #1 60 vmlal.u8 q7, d5, d1 83 vext.8 d5, d4, d5, #1 89 vmlal.u8 q7, d5, d1
|
D | iwalsh_neon.asm | 27 vsub.s16 d5, d0, d3 ;d = [0] - [12] 47 vsub.s16 d5, d0, d3 ;d = [0] - [3]
|
D | variance_neon.asm | 42 vsubl.u8 q12, d1, d5 115 vsubl.u8 q12, d1, d5 228 vld1.8 {d5}, [r2], r3 235 vsubl.u8 q12, d1, d5
|
D | mbloopfilter_neon.asm | 427 vmov.u8 d5, #9 ; #9 433 vmlal.s8 q0, d2, d5 ; 63 + Filter2 * 9 434 vmlal.s8 q11, d3, d5 435 vmov.u8 d5, #27 ; #27 438 vmlal.s8 q14, d2, d5 ; 63 + Filter2 * 27 439 vmlal.s8 q15, d3, d5
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
D | vp8_shortwalsh4x4_neon.asm | 41 vadd.s16 d5, d1, d3 ; ip[1] + ip[3] 46 vshl.s16 d5, d5, #2 ; d1 = (ip[1] + ip[3]) << 2 51 vadd.s16 d0, d4, d5 ; a1 + d1 53 vsub.s16 d3, d4, d5 ; op[3] = a1 - d1
|
D | shortfdct_neon.asm | 51 vadd.s16 d5, d1, d2 ; b1 = ip[1] + ip[2] 58 vadd.s16 d0, d4, d5 ; op[0] = a1 + b1 59 vsub.s16 d2, d4, d5 ; op[2] = a1 - b1 81 vadd.s16 d5, d1, d2 ; b1 = ip[4] + ip[8] 86 vadd.s16 d0, d4, d5 ; op[0] = a1 + b1 + 7 87 vsub.s16 d2, d4, d5 ; op[8] = a1 - b1 + 7 209 vshrn.s32 d5, q11, #16 ; B[4] = (c1*2217 + d1*5352 + 12000)>>16 211 vsub.s16 d5, d5, d29 ; B[4] += (d1!=0)
|
D | subtract_neon.asm | 41 vld1.8 {d5}, [r7], r2 47 vsubl.u8 q12, d4, d5 86 vsubl.u8 q11, d5, d7 128 vld1.8 {d5}, [r4], r6 142 vsubl.u8 q10, d4, d5 164 vld1.8 {d5}, [r5], r6 178 vsubl.u8 q10, d4, d5
|
D | vp8_mse16x16_neon.asm | 44 vsubl.u8 q12, d1, d5 88 vld1.8 {d5}, [r2], r3 95 vsubl.u8 q12, d1, d5
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/x86/ |
D | loopfilter_sse2.asm | 709 … movq xmm6, [rdi+4*rax] ; xx xx xx xx xx xx xx xx d7 d6 d5 d4 d3 d2 d1 d0 715 … punpcklbw xmm1, xmm6 ; d7 c7 d6 c6 d5 c5 d4 c4 d3 c3 d2 c2 d1 e1 d0 c0 722 … punpckhwd xmm6, xmm5 ; f7 e7 d7 c7 f6 e6 d6 c6 f5 e5 d5 c5 f4 e4 d4 c4 737 … punpckldq xmm1, xmm6 ; f5 e5 d5 c5 b5 a5 95 85 f4 e4 d4 c4 b4 a4 94 84 759 … punpckhqdq xmm5, xmm1 ; f5 e5 d5 c5 b5 a5 95 85 75 65 55 45 35 25 15 05 878 ; xmm7 = f5 e5 d5 c5 b5 a5 95 85 75 65 55 45 35 25 15 05 887 … punpckhbw xmm3, xmm7 ; f5 f4 e5 e4 d5 d4 c5 c4 b5 b4 a5 a4 95 94 85 84 897 … punpckhwd xmm5, xmm3 ; f5 f4 f3 f2 e5 e4 e3 e2 d5 d4 d3 d2 c5 c4 c3 c2 901 ; xmm5 = f5 f4 f3 f2 e5 e4 e3 e2 d5 d4 d3 d2 c5 c4 c3 c2 1106 …punpckhbw xmm7, [rsp+_q1] ; f5 f4 e5 e4 d5 d4 c5 c4 b5 b4 a5 a4 95 94 85… [all …]
|