/external/libvpx/libvpx/vp9/common/arm/neon/ |
D | vp9_mb_lpf_neon.asm | 408 vmull.s8 q15, d28, d27 ; 3 * ( qs0 - ps0) 410 vaddw.s8 q15, q15, d29 ; filter + 3 * (qs0 - ps0) 414 vqmovn.s16 d28, q15 449 vaddl.u8 q15, d7, d8 ; op2 = p0 + q0 450 vmlal.u8 q15, d4, d27 ; op2 = p0 + q0 + p3 * 3 451 vmlal.u8 q15, d5, d29 ; op2 = p0 + q0 + p3 * 3 + p2 * 2 453 vaddw.u8 q15, d6 ; op2=p1 + p0 + q0 + p3 * 3 + p2 *2 455 vqrshrn.u16 d18, q15, #3 ; r_op2 457 vsub.i16 q15, q10 459 vadd.i16 q15, q14 [all …]
|
D | vp9_idct8x8_add_neon.asm | 20 ; loaded in q8-q15. The output will be stored back into q8-q15 registers. 88 vmull.s16 q15, d17, d0 96 vmlsl.s16 q15, d25, d0 107 vqrshrn.s32 d23, q15, #14 ; >> 14 134 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3] 137 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3] 180 vsub.s16 q15, q0, q7 ; output[7] = step1[0] - step1[7]; 183 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15. 193 vtrn.32 q13, q15 197 vtrn.16 q14, q15 [all …]
|
D | vp9_iht4x4_add_neon.asm | 21 ; into d16-d19 registers. This macro will touch q10- q15 registers and use 29 vmull.s16 q15, d17, d2 ; input[1] * cospi_24_64 33 vmlsl.s16 q15, d19, d0 ; input[1] * cospi_24_64 - input[3] * cospi_8_64 39 vqrshrn.s32 d29, q15, #14 56 ; q14,q15 registers and use them as buffer during calculation. 64 vmovl.s16 q15, d16 ; expand x0 from 16 bit to 32 bit 65 vaddw.s16 q15, q15, d19 ; x0 + x3 67 vsubw.s16 q15, q15, d18 ; s7 = x0 + x3 - x2 75 vmul.s32 q15, q15, q8 ; x2 = sinpi_3_9 * s7 85 vqrshrn.s32 d18, q15, #14
|
D | vp9_idct16x16_add_neon.asm | 21 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15. 31 vtrn.32 q13, q15 35 vtrn.16 q14, q15 46 ; idct16 stage1 - stage6 on all the elements loaded in q8-q15. The output 47 ; will be stored back into q8-q15 registers. This function will touch q0-q7 52 ; load elements of 0, 2, 4, 6, 8, 10, 12, 14 into q8 - q15 59 vld2.s16 {q14,q15}, [r0]! 61 vmov.s16 q15, q1 129 vmull.s16 q15, d27, d3 137 vmlal.s16 q15, d23, d2 [all …]
|
D | vp9_iht8x8_add_neon.asm | 101 ; Transpose a 8x8 16bits data matrix. Datas are loaded in q8-q15. 111 vtrn.32 q13, q15 115 vtrn.16 q14, q15 119 ; loaded in q8-q15. The IDCT constants are loaded in r3 - r9. The output 120 ; will be stored back into q8-q15 registers. This macro will touch q0-q7 187 vmull.s16 q15, d17, d0 195 vmlsl.s16 q15, d25, d0 206 vqrshrn.s32 d23, q15, #14 ; >> 14 232 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3] 235 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3] [all …]
|
D | vp9_idct32x32_1_add_neon.asm | 28 vld1.8 {q15}, [$src], $stride 40 vqadd.u8 q15, q15, $diff 52 vqsub.u8 q15, q15, $diff 64 vst1.8 {q15},[$dst], $stride
|
/external/libavc/encoder/arm/ |
D | ih264e_evaluate_intra4x4_modes_a9q.s | 258 vext.8 q15, q6, q6, #5 260 vext.8 q15, q6, q6, #15 262 vext.8 q15, q6, q6, #2 265 vext.8 q15, q6, q6, #4 287 vext.8 q15, q6, q6, #3 289 vext.8 q15, q6, q6, #1 291 vext.8 q15, q6, q6, #4 294 vext.8 q15, q6, q6, #6 315 vext.8 q15, q5, q5, #4 317 vext.8 q15, q5, q5, #3 [all …]
|
/external/libavc/common/arm/ |
D | ih264_inter_pred_luma_horz_hpel_vert_hpel_a9q.s | 165 vaddl.s16 q15, d21, d25 @// a0 + a5 (column1) 167 vmlal.s16 q15, d23, d0[0] @// a0 + a5 + 20a2 (column1) 171 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 (column1) 173 vmlal.s16 q15, d21, d0[0] @// a0 + a5 + 20a2 + 20a3 (column1) 177 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1) 179 vqrshrun.s32 d23, q15, #10 184 vaddl.s16 q15, d21, d27 @// a0 + a5 (column2) 186 vmlal.s16 q15, d23, d0[0] @// a0 + a5 + 20a2 (column2) 190 vmlal.s16 q15, d21, d0[0] @// a0 + a5 + 20a2 + 20a3 (column2) 193 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 (column2) [all …]
|
D | ih264_deblk_luma_a9.s | 119 vabd.u8 q15, q2, q0 @Q15 = Aq = ABS(q2 - q0) 126 vcgt.u8 q11, q8, q15 @Q11=(Aq<Beta) 129 vsubl.u8 q15, d1, d7 @ 133 vshl.i16 q13, q15, #2 @Q13 = (q0 - p0)<<2 135 vsubl.u8 q15, d9, d3 @Q15 = (p1 - q1)H 138 vadd.i16 q13, q13, q15 @Q13,Q12 = [ (q0 - p0)<<2 ] + (p1 - q1) 149 vaddl.u8 q15, d17, d5 @ 162 vsub.i16 q15, q15, q13 @Q15,Q2 = [q2 + (p0+q0+1)>>1] - (q1<<1) 166 vqshrn.s16 d31, q15, #1 @ 171 vmin.s8 q15, q15, q7 @Q15 = min(C0,i_macro_q1) [all …]
|
D | ih264_inter_pred_luma_horz_qpel_vert_hpel_a9q.s | 146 vmov.u16 q15, #0x5 @ Filter coeff 5 into Q12 176 vmls.u16 q9, q11, q15 178 vmls.u16 q10, q13, q15 181 vmls.u16 q11, q13, q15 253 vmls.u16 q9, q11, q15 255 vmls.u16 q10, q13, q15 258 vmls.u16 q11, q13, q15 346 vaddl.s16 q15, d12, d22 357 vmlal.s16 q15, d16, d26 358 vmlsl.s16 q15, d18, d24 [all …]
|
D | ih264_ihadamard_scaling_a9.s | 116 vsubl.s16 q15, d0, d3 @x3 = x4 - x7 119 vadd.s32 q3, q15, q14 @pi4_tmp_ptr[1] = x3 + x2 121 vsub.s32 q5, q15, q14 @pi4_tmp_ptr[3] = x3 - x2 133 vsub.s32 q15, q2, q5 @x3 = x4-x7 136 vadd.s32 q1, q15, q14 @pi4_tmp_ptr[1] = x3 + x2 138 vsub.s32 q3, q15, q14 @pi4_tmp_ptr[3] = x3 - x2 213 vmull.u16 q15, d26, d27 @pu2_iscal_mat[0] * pu2_weigh_mat[0] 214 vdup.u32 q15, d30[0] 236 vmul.s32 q5, q3, q15 237 vmul.s32 q6, q1, q15
|
/external/libhevc/common/arm/ |
D | ihevc_itrans_recon_8x8.s | 198 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3) 206 vmlsl.s16 q15,d7,d1[1] @// y1 * sin1 - y3 * sin3(part of b3) 237 vmlal.s16 q15,d14,d0[3] @// y1 * sin1 - y3 * sin3 + y5 * cos3(part of b3) 248 …vmlsl.s16 q15,d15,d0[1] @// b3 = y1 * sin1 - y3 * sin3 + y5 * cos3 - y7 * cos1(par… 264 vadd.s32 q13,q5,q15 @// a3 + b3(part of r3) 265 vsub.s32 q15,q5,q15 @// a3 - b3(part of r4) 274 vqrshrn.s32 d10,q15,#shift_stage1_idct @// r4 = (a3 - b3 + rnd) >> 7(shift_stage1_idct) 305 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3) 310 vmlsl.s16 q15,d7,d1[1] @// y1 * sin1 - y3 * sin3(part of b3) 332 vadd.s32 q13,q5,q15 @// a3 + b3(part of r3) [all …]
|
D | ihevc_itrans_recon_32x32.s | 214 vmull.s16 q15,d8,d1[3] @// y1 * sin1(part of b3) 219 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3) 254 vmlsl.s16 q15,d14,d7[1] 260 vmlsl.s16 q15,d15,d3[3] 284 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3) 289 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3) 328 vmlsl.s16 q15,d14,d6[3] 334 vmlal.s16 q15,d15,d5[3] 360 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3) 365 vmlal.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3) [all …]
|
D | ihevc_itrans_recon_16x16.s | 245 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3) 250 vmlsl.s16 q15,d7,d2[3] @// y1 * sin1 - y3 * sin3(part of b3) 272 vmlsl.s16 q15,d8,d0[3] 278 vmlal.s16 q15,d9,d3[3] 320 vmlal.s16 q15,d6,d0[1] @// y1 * sin1(part of b3) 325 vmlal.s16 q15,d7,d3[1] @// y1 * sin1 - y3 * sin3(part of b3) 332 vmlsl.s16 q15,d8,d1[1] 338 vmlsl.s16 q15,d9,d2[1] 380 vadd.s32 q8,q9,q15 381 vsub.s32 q14,q9,q15 [all …]
|
D | ihevc_inter_pred_chroma_vert_w16inp.s | 156 vqrshrun.s16 d30,q15,#6 @rounding shift 187 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0) 189 vmlal.s16 q15,d1,d13 190 vmlal.s16 q15,d2,d14 192 vmlal.s16 q15,d3,d15 204 vqshrn.s32 d30,q15,#6 @right shift 213 vqrshrun.s16 d30,q15,#6 @rounding shift 233 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0) 235 vmlal.s16 q15,d1,d13 237 vmlal.s16 q15,d2,d14 [all …]
|
D | ihevc_inter_pred_chroma_vert_w16inp_w16out.s | 186 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0) 188 vmlal.s16 q15,d1,d13 189 vmlal.s16 q15,d2,d14 191 vmlal.s16 q15,d3,d15 202 vqshrn.s32 d30,q15,#6 @right shift 230 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0) 232 vmlal.s16 q15,d1,d13 234 vmlal.s16 q15,d2,d14 235 vmlal.s16 q15,d3,d15 248 vqshrn.s32 d30,q15,#6 @right shift [all …]
|
D | ihevc_inter_pred_chroma_vert_w16out.s | 232 vmull.u8 q15,d5,d1 @mul with coeff 1 234 vmlsl.u8 q15,d4,d0 236 vmlal.u8 q15,d6,d2 237 vmlsl.u8 q15,d7,d3 252 vst1.8 {q15},[r1]! @stores the loaded value 275 vmull.u8 q15,d5,d1 @mul with coeff 1 277 vmlsl.u8 q15,d4,d0 279 vmlal.u8 q15,d6,d2 281 vmlsl.u8 q15,d7,d3 306 vst1.8 {q15},[r1]! @stores the loaded value [all …]
|
D | ihevc_inter_pred_chroma_vert.s | 232 vmull.u8 q15,d5,d1 @mul with coeff 1 234 vmlsl.u8 q15,d4,d0 236 vmlal.u8 q15,d6,d2 237 vmlsl.u8 q15,d7,d3 247 vqrshrun.s16 d30,q15,#6 279 vmull.u8 q15,d5,d1 @mul with coeff 1 281 vmlsl.u8 q15,d4,d0 283 vmlal.u8 q15,d6,d2 285 vmlsl.u8 q15,d7,d3 299 vqrshrun.s16 d30,q15,#6 [all …]
|
/external/libmpeg2/common/arm/ |
D | impeg2_idct.s | 151 vdup.s16 q15, r4 156 vaddw.u8 q4, q15, d0 158 vaddw.u8 q5, q15, d1 161 vaddw.u8 q6, q15, d2 165 vaddw.u8 q7, q15, d3 169 vaddw.u8 q8, q15, d4 173 vaddw.u8 q9, q15, d5 177 vaddw.u8 q10, q15, d6 181 vaddw.u8 q11, q15, d7 453 vmull.s16 q15, d6, d1[3] @// y1 * sin1(part of b3) [all …]
|
/external/jpeg/ |
D | jsimd_arm_neon.S | 206 vmul.s16 q7, q7, q15 248 vmov.s16 q15, #(0x80 << 5) 249 vqadd.s16 q2, q2, q15 250 vqadd.s16 q3, q3, q15 251 vqadd.s16 q4, q4, q15 252 vqadd.s16 q5, q5, q15 253 vqadd.s16 q6, q6, q15 254 vqadd.s16 q7, q7, q15 255 vqadd.s16 q8, q8, q15 256 vqadd.s16 q9, q9, q15 [all …]
|
/external/valgrind/none/tests/arm/ |
D | neon128.c | 364 TESTINSN_imm("vmov.i64 q15", q15, 0xFF0000FF00FFFF00); in main() 378 TESTINSN_imm("vmvn.i64 q15", q15, 0xFF0000FF00FFFF00); in main() 386 TESTINSN_imm("vorr.i32 q15", q15, 0x7000000); in main() 394 TESTINSN_imm("vbic.i32 q15", q15, 0x7000000); in main() 398 TESTINSN_un("vmvn q10, q15", q10, q15, i32, 24); in main() 403 TESTINSN_un("vmov q10, q15", q10, q15, i32, 24); in main() 409 TESTINSN_un("vmov q0, q15", q0, q15, i32, 7); in main() 422 TESTINSN_bin("vadd.i64 q13, q14, q15", q13, q14, i32, 140, q15, i32, 120); in main() 435 TESTINSN_bin("vsub.i64 q13, q14, q15", q13, q14, i32, 140, q15, i32, 120); in main() 441 TESTINSN_bin("vand q15, q15, q15", q15, q15, i8, 0xff, q15, i8, 0xff); in main() [all …]
|
/external/boringssl/linux-arm/crypto/aes/ |
D | bsaes-armv7.S | 1108 vstmia r12, {q15} @ save last round key 1124 vstmia r12, {q15} @ save last round key 1132 vld1.8 {q15}, [r8] @ load IV 1151 vstmia r9, {q15} @ put aside IV 1164 vld1.8 {q14,q15}, [r0]! 1192 vstmia r9, {q15} @ put aside IV 1218 vld1.8 {q15}, [r0]! 1241 vld1.8 {q15}, [r0]! 1259 vld1.8 {q15}, [r0]! 1277 vld1.8 {q15}, [r0]! [all …]
|
/external/libvpx/libvpx/vp8/common/arm/neon/ |
D | loopfiltersimpleverticaledge_neon.asm | 54 vabd.u8 q15, q5, q4 ; abs(p0 - q0) 57 vqadd.u8 q15, q15, q15 ; abs(p0 - q0) * 2 61 vqadd.u8 q15, q15, q14 ; abs(p0 - q0) * 2 + abs(p1 - q1) / 2 68 vcge.u8 q15, q1, q15 ; abs(p0 - q0)*2 + abs(p1-q1)/2 > flimit*2 + limit)*-1 90 vand q14, q14, q15 ; vp8_filter &= mask
|
/external/boringssl/src/crypto/chacha/ |
D | chacha_vec_arm.S | 169 vmov q15, q14 @ v4si 218 vadd.i32 q15, q15, q2 223 veor q6, q15, q5 268 vadd.i32 q15, q15, q2 274 veor q5, q15, q5 325 vext.32 q15, q15, q15, #2 331 vadd.i32 q15, q15, q2 337 veor q1, q15, q1 399 vadd.i32 q15, q15, q6 409 veor q6, q15, q1 [all …]
|
/external/libhevc/decoder/arm/ |
D | ihevcd_itrans_recon_dc_chroma.s | 105 vaddw.u8 q15,q0,d2 115 vqmovun.s16 d2,q15 120 vaddw.u8 q15,q0,d16 125 vqmovun.s16 d16,q15 167 vaddw.u8 q15,q0,d2 174 vqmovun.s16 d2,q15
|