/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
D | iwalsh_neon.asm | 21 ; read in all four lines of values: d0->d3 25 vadd.s16 d4, d0, d3 ;a = [0] + [12] 27 vsub.s16 d5, d0, d3 ;d = [0] - [12] 35 vtrn.32 d1, d3 ;d1: 4 5 12 13 36 ;d3: 6 7 14 15 40 vtrn.16 d2, d3 ;d2: 2 6 10 14 41 ;d3: 3 7 11 15 45 vadd.s16 d4, d0, d3 ;a = [0] + [3] 47 vsub.s16 d5, d0, d3 ;d = [0] - [3] 67 vst1.i16 d3[0], [r3],r2 [all …]
|
D | dequant_idct_neon.c | 23 int16x4_t d2, d3, d4, d5, d10, d11, d12, d13; in vp8_dequant_idct_add_neon() local 76 d3 = vqadd_s16(d13, d10); in vp8_dequant_idct_add_neon() 81 d2tmp1 = vtrn_s32(vreinterpret_s32_s16(d3), vreinterpret_s32_s16(d5)); in vp8_dequant_idct_add_neon() 106 d3 = vqadd_s16(d13, d10); in vp8_dequant_idct_add_neon() 111 d3 = vrshr_n_s16(d3, 3); in vp8_dequant_idct_add_neon() 116 d2tmp1 = vtrn_s32(vreinterpret_s32_s16(d3), vreinterpret_s32_s16(d5)); in vp8_dequant_idct_add_neon()
|
D | vp8_subpixelvariance16x16_neon.asm | 52 vld1.u8 {d2, d3, d4}, [r0], r1 ;load src data 71 vmull.u8 q8, d3, d0 79 vext.8 d2, d2, d3, #1 ;construct src_ptr[1] 89 vext.8 d3, d3, d4, #1 94 vmlal.u8 q8, d3, d1 ;(src_ptr[0] * Filter[1]) 109 vld1.u8 {d2, d3, d4}, [r0], r1 ;load src data 124 vmull.u8 q10, d3, d0 130 vext.8 d2, d2, d3, #1 ;construct src_ptr[1] 138 vext.8 d3, d3, d4, #1 142 vmlal.u8 q10, d3, d1 ;(src_ptr[0] * Filter[1]) [all …]
|
D | sixtappredict8x4_neon.asm | 68 vdup.8 d3, d25[4] 129 vmull.u8 q3, d28, d3 ;(src_ptr[1] * vp8_filter[3]) 130 vmull.u8 q4, d29, d3 131 vmull.u8 q5, d30, d3 132 vmull.u8 q6, d31, d3 216 vmull.u8 q3, d27, d3 ;(src_ptr[1] * vp8_filter[3]) 217 vmull.u8 q4, d28, d3 218 vmull.u8 q5, d29, d3 219 vmull.u8 q6, d30, d3 220 vmull.u8 q7, d31, d3 [all …]
|
D | sixtappredict4x4_neon.asm | 67 vdup.8 d3, d25[4] 121 vmull.u8 q9, d6, d3 ;(src_ptr[1] * vp8_filter[3]) 122 vmull.u8 q10, d10, d3 199 vmull.u8 q9, d6, d3 ;(src_ptr[1] * vp8_filter[3]) 200 vmull.u8 q10, d10, d3 201 vmull.u8 q11, d31, d3 ;(src_ptr[1] * vp8_filter[3]) 227 vdup.8 d3, d15[4] 246 vmlal.u8 q5, d24, d3 ;(src_ptr[1] * vp8_filter[3]) 247 vmlal.u8 q6, d25, d3 256 vqrshrun.s16 d3, q5, #7 ;shift/round/saturate to u8 [all …]
|
D | sixtappredict8x8_neon.asm | 71 vdup.8 d3, d25[4] 133 vmull.u8 q3, d28, d3 ;(src_ptr[1] * vp8_filter[3]) 134 vmull.u8 q4, d29, d3 135 vmull.u8 q5, d30, d3 136 vmull.u8 q6, d31, d3 229 vmull.u8 q3, d27, d3 ;(src_ptr[1] * vp8_filter[3]) 230 vmull.u8 q4, d28, d3 231 vmull.u8 q5, d29, d3 232 vmull.u8 q6, d30, d3 233 vmull.u8 q7, d31, d3 [all …]
|
D | sixtappredict16x16_neon.asm | 75 vdup.8 d3, d25[4] 168 vmull.u8 q4, d28, d3 ;(src_ptr[1] * vp8_filter[3]) 169 vmull.u8 q5, d29, d3 170 vmull.u8 q6, d30, d3 176 vmull.u8 q6, d15, d3 ;(src_ptr[1] * vp8_filter[3]) 177 vmull.u8 q7, d31, d3 178 vmull.u8 q3, d6, d3 214 vdup.8 d3, d15[4] 257 vmull.u8 q7, d21, d3 ;(src_ptr[1] * vp8_filter[3]) 258 vmull.u8 q8, d22, d3 [all …]
|
D | vp8_subpixelvariance16x16s_neon.asm | 43 vld1.u8 {d0, d1, d2, d3}, [r0], r1 ;load src data 69 vsubl.u8 q7, d3, d25 96 vmlal.s16 q10, d3, d3 111 vadd.u64 d1, d2, d3 160 vsubl.u8 q12, d1, d3 189 vmlal.s16 q10, d3, d3 207 vadd.u64 d1, d2, d3 231 vld1.u8 {d0, d1, d2, d3}, [r0], r1 ;load src data 276 vsubl.u8 q12, d3, d13 307 vmlal.s16 q15, d3, d3 [all …]
|
D | vp8_subpixelvariance8x8_neon.asm | 54 vext.8 d3, d2, d3, #1 ;construct src_ptr[-1] 59 vmlal.u8 q6, d3, d1 ;(src_ptr[1] * Filter[1]) 82 vext.8 d3, d2, d3, #1 ;construct src_ptr[-1] 88 vmlal.u8 q6, d3, d1 ;(src_ptr[1] * Filter[1]) 171 vld1.8 {d3}, [r4], r5 180 vsubl.u8 q7, d25, d3 205 vadd.u64 d1, d2, d3
|
D | sad16_neon.asm | 40 vabal.u8 q13, d3, d11 65 vabal.u8 q13, d3, d11 90 vabal.u8 q13, d3, d11 115 vabal.u8 q13, d3, d11 159 vabal.u8 q13, d3, d11 183 vabal.u8 q13, d3, d11
|
D | variance_neon.asm | 44 vsubl.u8 q14, d3, d7 74 vadd.u64 d1, d2, d3 117 vsubl.u8 q14, d3, d7 144 vadd.u64 d1, d2, d3 199 vadd.u64 d1, d2, d3 231 vld1.8 {d3}, [r0], r1 237 vsubl.u8 q14, d3, d7 264 vadd.u64 d1, d2, d3
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
D | vp8_shortwalsh4x4_neon.asm | 28 vld1.16 {d3}, [r0@64] 31 ;transpose d0, d1, d2, d3. Then, d0=ip[0], d1=ip[1], d2=ip[2], d3=ip[3] 33 vtrn.32 d1, d3 38 vtrn.16 d2, d3 41 vadd.s16 d5, d1, d3 ; ip[1] + ip[3] 42 vsub.s16 d6, d1, d3 ; ip[1] - ip[3] 53 vsub.s16 d3, d4, d5 ; op[3] = a1 - d1 59 ;transpose d0, d1, d2, d3, Then, d0=ip[0], d1=ip[4], d2=ip[8], d3=ip[12] 60 vtrn.32 d1, d3 62 vtrn.16 d2, d3 [all …]
|
D | shortfdct_neon.asm | 41 vld1.16 {d3}, [r0@64], r2 43 ; transpose d0=ip[0], d1=ip[1], d2=ip[2], d3=ip[3] 45 vtrn.32 d1, d3 48 vtrn.16 d2, d3 50 vadd.s16 d4, d0, d3 ; a1 = ip[0] + ip[3] 53 vsub.s16 d7, d0, d3 ; d1 = ip[0] - ip[3] 67 vshrn.s32 d3, q10, #12 ; op[3] = (d1*2217 - c1*5352 + 7500)>>12 72 ; transpose d0=ip[0], d1=ip[4], d2=ip[8], d3=ip[12] 74 vtrn.32 d1, d3 76 vtrn.16 d2, d3 [all …]
|
D | vp8_mse16x16_neon.asm | 46 vsubl.u8 q14, d3, d7 69 vadd.u64 d0, d2, d3 91 vld1.8 {d3}, [r0], r1 97 vsubl.u8 q14, d3, d7 109 vadd.u64 d0, d2, d3
|
D | subtract_neon.asm | 39 vld1.8 {d3}, [r7], r2 46 vsubl.u8 q11, d2, d3 84 vsubl.u8 q9, d1, d3 126 vld1.8 {d3}, [r4], r6 141 vsubl.u8 q9, d2, d3 162 vld1.8 {d3}, [r5], r6 177 vsubl.u8 q9, d2, d3
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
D | vp9_idct16x16_1_add_neon.asm | 53 vld1.64 {d3}, [r1], r2 62 vaddw.u8 q10, q0, d3 ; dest[x] + a1 66 vqmovun.s16 d3, q10 ; clip_pixel 70 vst1.64 {d3}, [r12], r2 79 vqmovun.s16 d3, q10 ; clip_pixel 83 vst1.64 {d3}, [r12], r2 89 vld1.64 {d3}, [r1], r2 98 vaddw.u8 q10, q0, d3 ; dest[x] + a1 102 vqmovun.s16 d3, q10 ; clip_pixel 106 vst1.64 {d3}, [r12], r2 [all …]
|
D | vp9_reconintra_neon.asm | 205 vdup.8 q0, d3[0] 207 vdup.8 q0, d3[1] 209 vdup.8 q0, d3[2] 211 vdup.8 q0, d3[3] 213 vdup.8 q0, d3[4] 215 vdup.8 q0, d3[5] 217 vdup.8 q0, d3[6] 219 vdup.8 q0, d3[7] 261 vdup.8 q0, d3[0] 264 vdup.8 q0, d3[1] [all …]
|
D | vp9_idct8x8_1_add_neon.asm | 51 vld1.64 {d3}, [r1], r2 60 vaddw.u8 q10, q0, d3 ; dest[x] + a1 64 vqmovun.s16 d3, q10 ; clip_pixel 68 vst1.64 {d3}, [r12], r2 77 vqmovun.s16 d3, q10 ; clip_pixel 81 vst1.64 {d3}, [r12], r2
|
D | vp9_loopfilter_neon.asm | 55 vld1.u8 {d3}, [r2@64], r1 ; p3 115 vld1.u8 {d3}, [r2], r1 ; load s data 125 vtrn.32 d3, d7 130 vtrn.16 d3, d5 135 vtrn.8 d3, d4 173 ; d3 p3 189 vabd.u8 d19, d3, d4 ; m1 = abs(p3 - p2) 193 vabd.u8 d3, d17, d16 ; m5 = abs(q2 - q1) 202 vmax.u8 d3, d3, d4 ; m3 = max(m5, m6) 211 vmax.u8 d23, d23, d3 ; m1 = max(m1, m3) [all …]
|
D | vp9_convolve8_neon.asm | 138 vqrshrun.s32 d3, q2, #7 144 vqmovn.u16 d3, q2 147 vtrn.16 d2, d3 148 vtrn.32 d2, d3 149 vtrn.8 d2, d3 152 vst1.u32 {d3[0]}, [r2@32], r3 154 vst1.u32 {d3[1]}, [r2@32], r4 249 vqrshrun.s32 d3, q2, #7 255 vqmovn.u16 d3, q2 259 vst1.u32 {d3[0]}, [r5@32], r3 [all …]
|
D | vp9_convolve8_avg_neon.asm | 146 vqrshrun.s32 d3, q2, #7 152 vqmovn.u16 d3, q2 155 vtrn.16 d2, d3 156 vtrn.32 d2, d3 157 vtrn.8 d2, d3 163 vst1.u32 {d3[0]}, [r2@32], r3 165 vst1.u32 {d3[1]}, [r2@32], r4 265 vqrshrun.s32 d3, q2, #7 271 vqmovn.u16 d3, q2 281 vst1.u32 {d3[0]}, [r5@32], r3 [all …]
|
D | vp9_idct8x8_add_neon.asm | 29 vdup.16 d3, r6 ; duplicate cospi_20_64 44 vmlsl.s16 q5, d22, d3 45 vmlsl.s16 q6, d23, d3 60 vmull.s16 q9, d26, d3 61 vmull.s16 q13, d27, d3 272 vld1.64 {d3}, [r1], r2 282 vaddw.u8 q11, q11, d3 292 vqmovun.s16 d3, q11 302 vst1.64 {d3}, [r0], r2 478 vld1.64 {d3}, [r1], r2 [all …]
|
D | vp9_mb_lpf_neon.asm | 43 vld1.u8 {d3}, [r8@64], r1 ; p4 108 vst1.u8 {d3}, [r8@64], r1 ; store oq6 146 vld1.8 {d3}, [r8@64], r1 170 vtrn.8 d2, d3 248 vtrn.32 d22, d3 253 vtrn.16 d1, d3 259 vtrn.8 d3, d15 274 vst1.8 {d3}, [r0@64], r1 295 ; d3 p4 366 vabd.u8 d22, d3, d7 ; abs(p4 - p0) [all …]
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/armv6/ |
D | vp8_subtract_armv6.asm | 53 usub16 r5, r0, r1 ; [d3 | d1] 58 pkhtb r1, r5, r4, asr #16 ; [d3 | d2] 99 usub16 r7, r10, r11 ; [d3 | d1] (A) 105 pkhtb r9, r7, r6, asr #16 ; [d3 | d2] (A) 116 usub16 r7, r10, r11 ; [d3 | d1] (B) 122 pkhtb r9, r7, r6, asr #16 ; [d3 | d2] (B) 144 usub16 r7, r10, r11 ; [d3 | d1] (A) 150 pkhtb r9, r7, r6, asr #16 ; [d3 | d2] (A) 161 usub16 r7, r10, r11 ; [d3 | d1] (B) 167 pkhtb r9, r7, r6, asr #16 ; [d3 | d2] (B) [all …]
|
/hardware/bsp/intel/peripheral/libupm/src/lcd/ |
D | sainsmartks.cxx | 33 uint8_t d0, uint8_t d1, uint8_t d2, uint8_t d3, in SAINSMARTKS() argument 35 : Lcm1602(rs, enable, d0, d1, d2, d3), in SAINSMARTKS()
|