/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
D | sad8_neon.asm | 32 vld1.8 {d10}, [r2], r3 39 vabal.u8 q12, d2, d10 52 vld1.8 {d10}, [r2], r3 59 vabal.u8 q12, d2, d10 89 vld1.8 {d10}, [r2], r3 96 vabal.u8 q12, d2, d10 109 vld1.8 {d10}, [r2], r3 116 vabal.u8 q12, d2, d10 129 vld1.8 {d10}, [r2], r3 136 vabal.u8 q12, d2, d10 [all …]
|
D | idct_dequant_0_2x_neon.asm | 32 vld1.32 {d10[0]}, [r12], r3 34 vld1.32 {d10[1]}, [r12], r3 56 vaddw.u8 q5, q3, d10 64 vqmovun.s16 d10, q5 71 vst1.32 {d10[0]}, [r0], r3 73 vst1.32 {d10[1]}, [r0]
|
D | dequant_idct_neon.c | 23 int16x4_t d2, d3, d4, d5, d10, d11, d12, d13; in vp8_dequant_idct_add_neon() local 72 d10 = vqsub_s16(vget_low_s16(q3), vget_high_s16(q4)); in vp8_dequant_idct_add_neon() 76 d3 = vqadd_s16(d13, d10); in vp8_dequant_idct_add_neon() 77 d4 = vqsub_s16(d13, d10); in vp8_dequant_idct_add_neon() 102 d10 = vqsub_s16(vget_low_s16(q3), vget_high_s16(q4)); in vp8_dequant_idct_add_neon() 106 d3 = vqadd_s16(d13, d10); in vp8_dequant_idct_add_neon() 107 d4 = vqsub_s16(d13, d10); in vp8_dequant_idct_add_neon()
|
D | loopfiltersimpleverticaledge_neon.asm | 38 vld4.8 {d10[0], d11[0], d12[0], d13[0]}, [r0], r12 39 vld4.8 {d10[1], d11[1], d12[1], d13[1]}, [r3], r12 40 vld4.8 {d10[2], d11[2], d12[2], d13[2]}, [r0], r12 41 vld4.8 {d10[3], d11[3], d12[3], d13[3]}, [r3], r12 42 vld4.8 {d10[4], d11[4], d12[4], d13[4]}, [r0], r12 43 vld4.8 {d10[5], d11[5], d12[5], d13[5]}, [r3], r12 44 vld4.8 {d10[6], d11[6], d12[6], d13[6]}, [r0], r12 45 vld4.8 {d10[7], d11[7], d12[7], d13[7]}, [r3] 47 vswp d7, d10 69 vsubl.s8 q2, d8, d10 ; ( qs0 - ps0)
|
D | sixtappredict16x16_neon.asm | 82 vld1.u8 {d9, d10, d11}, [r0], r1 92 vmull.u8 q11, d10, d0 97 vext.8 d29, d9, d10, #1 105 vext.8 d29, d10, d11, #1 113 vext.8 d29, d9, d10, #4 121 vext.8 d29, d10, d11, #4 129 vext.8 d29, d9, d10, #5 137 vext.8 d29, d10, d11, #5 145 vext.8 d29, d9, d10, #2 153 vext.8 d29, d10, d11, #2 [all …]
|
D | loopfilter_neon.asm | 80 vld1.u8 {d10}, [r3@64], r1 ; p1 98 vst1.u8 {d10}, [r0@64], r1 ; store u op1 132 vld1.u8 {d10}, [r2], r1 179 vst4.8 {d10[0], d11[0], d12[0], d13[0]}, [r0], r1 180 vst4.8 {d10[1], d11[1], d12[1], d13[1]}, [r12], r1 181 vst4.8 {d10[2], d11[2], d12[2], d13[2]}, [r0], r1 182 vst4.8 {d10[3], d11[3], d12[3], d13[3]}, [r12], r1 183 vst4.8 {d10[4], d11[4], d12[4], d13[4]}, [r0], r1 184 vst4.8 {d10[5], d11[5], d12[5], d13[5]}, [r12], r1 185 vst4.8 {d10[6], d11[6], d12[6], d13[6]}, [r0], r1 [all …]
|
D | sixtappredict4x4_neon.asm | 77 vext.8 d20, d10, d11, #5 92 vzip.32 d10, d11 96 vmlal.u8 q8, d10, d0 106 vzip.32 d10, d11 110 vmlsl.u8 q8, d10, d4 120 vzip.32 d10, d11 122 vmull.u8 q10, d10, d3 141 vext.8 d20, d10, d11, #5 158 vzip.32 d10, d11 163 vmlal.u8 q8, d10, d0 [all …]
|
D | variance_neon.asm | 86 vshr.u32 d10, d10, #8 87 vsub.u32 d0, d1, d10 148 vshr.u32 d10, d10, #7 149 vsub.u32 d0, d1, d10 203 vshr.u32 d10, d10, #7 204 vsub.u32 d0, d1, d10 268 vshr.u32 d10, d10, #6 269 vsub.u32 d0, d1, d10
|
D | vp8_subpixelvariance16x16s_neon.asm | 47 vld1.u8 {d8, d9, d10, d11}, [r0], r1 82 vmlal.s16 q9, d10, d10 115 vshr.u32 d10, d10, #8 116 vsub.u32 d0, d1, d10 163 vsubl.u8 q0, d8, d10 211 vshr.u32 d10, d10, #8 212 vsub.u32 d0, d1, d10 246 vld1.u8 {d8, d9, d10, d11}, [r0], r1 273 vsubl.u8 q9, d0, d10 ;diff 310 vmlal.s16 q14, d10, d10 ;sse [all …]
|
D | sixtappredict8x4_neon.asm | 81 vmull.u8 q9, d10, d0 86 vext.8 d30, d10, d11, #1 96 vext.8 d30, d10, d11, #4 106 vext.8 d30, d10, d11, #2 116 vext.8 d30, d10, d11, #5 126 vext.8 d30, d10, d11, #3 158 vmull.u8 q10, d10, d0 164 vext.8 d29, d10, d11, #1 176 vext.8 d29, d10, d11, #4 188 vext.8 d29, d10, d11, #2 [all …]
|
D | sad16_neon.asm | 39 vabal.u8 q12, d2, d10 64 vabal.u8 q12, d2, d10 89 vabal.u8 q12, d2, d10 114 vabal.u8 q12, d2, d10 158 vabal.u8 q12, d2, d10 182 vabal.u8 q12, d2, d10
|
D | sixtappredict8x8_neon.asm | 85 vmull.u8 q9, d10, d0 90 vext.8 d30, d10, d11, #1 100 vext.8 d30, d10, d11, #4 110 vext.8 d30, d10, d11, #2 120 vext.8 d30, d10, d11, #5 130 vext.8 d30, d10, d11, #3 171 vmull.u8 q10, d10, d0 177 vext.8 d29, d10, d11, #1 189 vext.8 d29, d10, d11, #4 201 vext.8 d29, d10, d11, #2 [all …]
|
D | save_reg_neon.asm | 22 vst1.i64 {d8, d9, d10, d11}, [r0]! 29 vld1.i64 {d8, d9, d10, d11}, [r0]!
|
D | vp8_subpixelvariance8x8_neon.asm | 80 vmull.u8 q10, d10, d0 86 vext.8 d11, d10, d11, #1 183 vmlal.s16 q9, d10, d10 209 vshr.u32 d10, d10, #6 210 vsub.u32 d0, d1, d10
|
D | vp8_subpixelvariance16x16_neon.asm | 57 vld1.u8 {d8, d9, d10}, [r0], r1 91 vext.8 d9, d9, d10, #1 114 vld1.u8 {d8, d9, d10}, [r0], r1 140 vext.8 d9, d9, d10, #1 163 vqrshrn.u16 d10, q9, #7 ;shift/round/saturate to u8 174 vst1.u8 {d10, d11, d12, d13}, [lr]! ;store result 251 vld1.u8 {d8, d9, d10}, [r0], r1 279 vext.8 d9, d9, d10, #1 413 vshr.u32 d10, d10, #8 414 vsub.u32 d0, d1, d10
|
D | mbloopfilter_neon.asm | 85 vld1.u8 {d10}, [r0@64], r1 ; p1 108 vst1.u8 {d10}, [r0@64], r1 ; store u op1 142 vld1.u8 {d10}, [r0], r1 198 vst1.8 {d10}, [r0], r1 237 vld1.u8 {d10}, [r0], r1 293 vst1.8 {d10}, [r0], r1
|
D | idct_dequant_full_2x_neon.asm | 54 vswp d7, d10
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
D | vp9_save_reg_neon.asm | 22 vst1.i64 {d8, d9, d10, d11}, [r0]! 29 vld1.i64 {d8, d9, d10, d11}, [r0]!
|
D | vp9_mb_lpf_neon.asm | 50 vld1.u8 {d10}, [r8@64], r1 ; q2 145 vld1.8 {d10}, [r0@64], r1 175 vtrn.8 d10, d11 302 ; d10 q2 316 vabd.u8 d23, d10, d9 ; abs(q2 - q1) 317 vabd.u8 d24, d11, d10 ; abs(q3 - q2) 337 vabd.u8 d26, d8, d10 ; abs(q0 - q2) 460 vaddl.u8 q14, d7, d10 477 vaddl.u8 q14, d10, d11 493 vbif d23, d10, d16 ; t_oq2 |= q2 & ~(flat & mask) [all …]
|
D | vp9_idct32x32_add_neon.asm | 110 vld1.s16 {d10}, [r9] 118 vaddw.u8 q8, q8, d10 123 vqmovun.s16 d10, q8 128 vst1.16 {d10}, [r9], r2 144 vld1.s16 {d10}, [r9] 152 vaddw.u8 q8, q8, d10 157 vqmovun.s16 d10, q8 162 vst1.16 {d10}, [r9], r2 392 vswp d3, d10 491 DO_BUTTERFLY_STD cospi_28_64, cospi_4_64, d10, d11, d14, d15 [all …]
|
D | vp9_idct16x16_add_neon.asm | 140 vqrshrn.s32 d10, q2, #14 ; >> 14 240 vqrshrn.s32 d10, q6, #14 ; >> 14 431 vqrshrn.s32 d10, q4, #14 ; >> 14 532 vqrshrn.s32 d10, q8, #14 ; >> 14 573 vqrshrn.s32 d10, q10, #14 ; >> 14 778 vst1.64 {d10}, [r1], r3 873 vqrshrn.s32 d10, q6, #14 ; >> 14 1041 vqrshrn.s32 d10, q8, #14 ; >> 14 1082 vqrshrn.s32 d10, q0, #14 ; >> 14 1169 vst1.64 {d10}, [r1], r3
|
D | vp9_iht8x8_add_neon.asm | 151 vqrshrn.s32 d10, q5, #14 ; >> 14 263 vqrshrn.s32 d10, q9, #14 ; >> 14 483 vqrshrn.s32 d10, q5, #14 ; >> 14 529 vmull.s16 q13, d10, d30 533 vmull.s16 q11, d10, d30
|
D | vp9_idct8x8_add_neon.asm | 52 vqrshrn.s32 d10, q5, #14 ; >> 14 165 vqrshrn.s32 d10, q9, #14 ; >> 14 438 vqrshrn.s32 d10, q9, #14 ; >> 14
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
D | subtract_neon.asm | 87 vsubl.u8 q12, d8, d10 133 vld1.8 {d10}, [r1], r3 145 vsubl.u8 q13, d10, d11 169 vld1.8 {d10}, [r2], r3 181 vsubl.u8 q13, d10, d11
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/x86/ |
D | fwalsh_sse2.asm | 78 pmaddwd xmm0, [GLOBAL(c1)] ; d11 a11 d10 a10 84 pshufd xmm4, xmm0, 0xd8 ; d11 d10 a11 a10 91 punpckhqdq xmm4, xmm5 ; c11 c10 d11 d10
|