/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
D | loopfiltersimpleverticaledge_neon.asm | 38 vld4.8 {d10[0], d11[0], d12[0], d13[0]}, [r0], r12 39 vld4.8 {d10[1], d11[1], d12[1], d13[1]}, [r3], r12 40 vld4.8 {d10[2], d11[2], d12[2], d13[2]}, [r0], r12 41 vld4.8 {d10[3], d11[3], d12[3], d13[3]}, [r3], r12 42 vld4.8 {d10[4], d11[4], d12[4], d13[4]}, [r0], r12 43 vld4.8 {d10[5], d11[5], d12[5], d13[5]}, [r3], r12 44 vld4.8 {d10[6], d11[6], d12[6], d13[6]}, [r0], r12 45 vld4.8 {d10[7], d11[7], d12[7], d13[7]}, [r3] 48 vswp d12, d9 106 vst2.8 {d12[0], d13[0]}, [r0], r12 [all …]
|
D | sad8_neon.asm | 37 vld1.8 {d12}, [r2], r3 44 vabal.u8 q12, d4, d12 57 vld1.8 {d12}, [r2], r3 64 vabal.u8 q12, d4, d12 94 vld1.8 {d12}, [r2], r3 101 vabal.u8 q12, d4, d12 114 vld1.8 {d12}, [r2], r3 121 vabal.u8 q12, d4, d12 134 vld1.8 {d12}, [r2], r3 141 vabal.u8 q12, d4, d12 [all …]
|
D | loopfilter_neon.asm | 82 vld1.u8 {d12}, [r3@64], r1 ; p0 100 vst1.u8 {d12}, [r0@64], r1 ; store u op0 133 vld1.u8 {d12}, [r12], r1 168 vswp d12, d11 173 vswp d14, d12 179 vst4.8 {d10[0], d11[0], d12[0], d13[0]}, [r0], r1 180 vst4.8 {d10[1], d11[1], d12[1], d13[1]}, [r12], r1 181 vst4.8 {d10[2], d11[2], d12[2], d13[2]}, [r0], r1 182 vst4.8 {d10[3], d11[3], d12[3], d13[3]}, [r12], r1 183 vst4.8 {d10[4], d11[4], d12[4], d13[4]}, [r0], r1 [all …]
|
D | dequant_idct_neon.c | 23 int16x4_t d2, d3, d4, d5, d10, d11, d12, d13; in vp8_dequant_idct_add_neon() local 58 d12 = vqadd_s16(vget_low_s16(q1), vget_low_s16(q2)); in vp8_dequant_idct_add_neon() 75 d2 = vqadd_s16(d12, d11); in vp8_dequant_idct_add_neon() 78 d5 = vqsub_s16(d12, d11); in vp8_dequant_idct_add_neon() 93 d12 = vqadd_s16(d2tmp2.val[0], d2tmp3.val[0]); in vp8_dequant_idct_add_neon() 105 d2 = vqadd_s16(d12, d11); in vp8_dequant_idct_add_neon() 108 d5 = vqsub_s16(d12, d11); in vp8_dequant_idct_add_neon()
|
D | vp8_subpixelvariance16x16_neon.asm | 60 vld1.u8 {d11, d12, d13}, [r0], r1 77 vmull.u8 q14, d12, d0 82 vext.8 d11, d11, d12, #1 92 vext.8 d12, d12, d13, #1 97 vmlal.u8 q14, d12, d1 116 vld1.u8 {d11, d12, d13}, [r0], r1 147 vmull.u8 q2, d12, d0 151 vext.8 d11, d11, d12, #1 ;construct src_ptr[1] 157 vext.8 d12, d12, d13, #1 160 vmlal.u8 q2, d12, d1 ;(src_ptr[0] * Filter[1]) [all …]
|
D | sixtappredict8x4_neon.asm | 82 vmull.u8 q10, d12, d0 87 vext.8 d31, d12, d13, #1 97 vext.8 d31, d12, d13, #4 107 vext.8 d31, d12, d13, #2 117 vext.8 d31, d12, d13, #5 127 vext.8 d31, d12, d13, #3 159 vmull.u8 q11, d12, d0 165 vext.8 d30, d12, d13, #1 177 vext.8 d30, d12, d13, #4 189 vext.8 d30, d12, d13, #2 [all …]
|
D | sad16_neon.asm | 45 vabal.u8 q12, d4, d12 70 vabal.u8 q12, d4, d12 95 vabal.u8 q12, d4, d12 120 vabal.u8 q12, d4, d12 164 vabal.u8 q12, d4, d12 188 vabal.u8 q12, d4, d12
|
D | sixtappredict8x8_neon.asm | 86 vmull.u8 q10, d12, d0 91 vext.8 d31, d12, d13, #1 101 vext.8 d31, d12, d13, #4 111 vext.8 d31, d12, d13, #2 121 vext.8 d31, d12, d13, #5 131 vext.8 d31, d12, d13, #3 172 vmull.u8 q11, d12, d0 178 vext.8 d30, d12, d13, #1 190 vext.8 d30, d12, d13, #4 202 vext.8 d30, d12, d13, #2 [all …]
|
D | save_reg_neon.asm | 23 vst1.i64 {d12, d13, d14, d15}, [r0]! 30 vld1.i64 {d12, d13, d14, d15}, [r0]!
|
D | vp8_subpixelvariance16x16s_neon.asm | 49 vld1.u8 {d12, d13, d14, d15}, [r0], r1 85 vmlal.s16 q9, d12, d12 165 vsubl.u8 q2, d12, d14 247 vld1.u8 {d12, d13, d14, d15}, [r0], r1 275 vsubl.u8 q11, d2, d12 316 vmlal.s16 q14, d12, d12 ;sse 374 vld1.u8 {d12, d13, d14, d15}, [r0], r1 416 vld1.u8 {d12, d13, d14, d15}, [r0], r1 449 vst1.u8 {d12, d13, d14, d15}, [r3]! 472 vld1.u8 {d12, d13}, [r0], r1 [all …]
|
D | mbloopfilter_neon.asm | 87 vld1.u8 {d12}, [r0@64], r1 ; p0 110 vst1.u8 {d12}, [r0@64], r1 ; store u op0 144 vld1.u8 {d12}, [r0], r1 200 vst1.8 {d12}, [r0], r1 239 vld1.u8 {d12}, [r0], r1 295 vst1.8 {d12}, [r0], r1 378 vsubl.s8 q2, d14, d12 ; qs0 - ps0
|
D | sixtappredict16x16_neon.asm | 83 vld1.u8 {d12, d13, d14}, [r0], r1 93 vmull.u8 q12, d12, d0 98 vext.8 d30, d12, d13, #1 114 vext.8 d30, d12, d13, #4 130 vext.8 d30, d12, d13, #5 146 vext.8 d30, d12, d13, #2 162 vext.8 d30, d12, d13, #3
|
D | sixtappredict4x4_neon.asm | 78 vext.8 d21, d12, d13, #5 81 vswp d11, d12 142 vext.8 d21, d12, d13, #5 145 vswp d11, d12 290 vext.8 d21, d12, d13, #5 293 vswp d11, d12
|
D | vp8_subpixelvariance8x8_neon.asm | 189 vmlal.s16 q9, d12, d12
|
D | loopfiltersimplehorizontaledge_neon.asm | 49 vsubl.s8 q2, d14, d12 ; ( qs0 - ps0)
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
D | vp9_idct16x16_add_neon.asm | 144 vqrshrn.s32 d12, q9, #14 ; >> 14 244 vqrshrn.s32 d12, q9, #14 ; >> 14 322 vdup.16 d12, r3 ; duplicate cospi_30_64 335 vmull.s16 q2, d16, d12 336 vmull.s16 q3, d17, d12 347 vmlal.s16 q1, d30, d12 348 vmlal.s16 q4, d31, d12 394 vqrshrn.s32 d12, q4, #14 ; >> 14 501 vqrshrn.s32 d12, q2, #14 ; >> 14 615 vld1.64 {d12}, [r7], r8 ; load destinatoin data [all …]
|
D | vp9_save_reg_neon.asm | 23 vst1.i64 {d12, d13, d14, d15}, [r0]! 30 vld1.i64 {d12, d13, d14, d15}, [r0]!
|
D | vp9_mb_lpf_neon.asm | 52 vld1.u8 {d12}, [r8@64], r1 ; q4 149 vld1.8 {d12}, [r0@64], r1 176 vtrn.8 d12, d13 304 ; d12 q4 367 vabd.u8 d23, d12, d8 ; abs(q4 - q0) 533 vaddw.u8 q15, d12 ; op2 += q4 576 vaddl.u8 q4, d12, d15 581 vaddl.u8 q14, d5, d12 599 vbif d1, d12, d17 ; oq4 |= q4 & ~(f2 & f & m)
|
D | vp9_idct8x8_add_neon.asm | 79 vqrshrn.s32 d12, q9, #14 ; >> 14 169 vqrshrn.s32 d12, q11, #14 ; >> 14 442 vqrshrn.s32 d12, q11, #14 ; >> 14
|
D | vp9_iht8x8_add_neon.asm | 178 vqrshrn.s32 d12, q9, #14 ; >> 14 267 vqrshrn.s32 d12, q11, #14 ; >> 14 549 vqrshrn.s32 d12, q11, #14 ; >> 14
|
D | vp9_idct32x32_add_neon.asm | 391 vswp d5, d12 565 DO_BUTTERFLY_STD cospi_24_64, cospi_8_64, d8, d9, d12, d13 624 DO_BUTTERFLY_STD cospi_3_64, cospi_29_64, d8, d9, d12, d13 713 DO_BUTTERFLY_STD (-cospi_8_64), (-cospi_24_64), d10, d11, d12, d13 824 DO_BUTTERFLY_STD cospi_6_64, cospi_26_64, d8, d9, d12, d13 939 DO_BUTTERFLY_STD cospi_24_64, cospi_8_64, d28, d29, d12, d13
|
D | vp9_loopfilter_16_neon.asm | 147 vsubl.s8 q2, d14, d12 ; ( qs0 - ps0)
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
D | subtract_neon.asm | 89 vsubl.u8 q14, d12, d14 135 vld1.8 {d12}, [r1], r3 146 vsubl.u8 q14, d12, d13 171 vld1.8 {d12}, [r2], r3 182 vsubl.u8 q14, d12, d13
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/x86/ |
D | fwalsh_sse2.asm | 81 pmaddwd xmm1, [GLOBAL(c1)] ; d12 a12 d13 a13 86 pshufd xmm6, xmm1, 0x72 ; d13 d12 a13 a12 94 punpckhqdq xmm6, xmm7 ; c13 c12 d13 d12
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vpx_scale/arm/neon/ |
D | vp8_vpxyv12_extendframeborders_neon.asm | 45 vld1.8 {d12[], d13[]}, [r2], lr 154 vld1.8 {d12[], d13[]}, [r1], lr
|