Home
last modified time | relevance | path

Searched refs:q15 (Results 1 – 25 of 103) sorted by relevance

12345

/external/libvpx/libvpx/vp9/common/arm/neon/
Dvp9_mb_lpf_neon.asm408 vmull.s8 q15, d28, d27 ; 3 * ( qs0 - ps0)
410 vaddw.s8 q15, q15, d29 ; filter + 3 * (qs0 - ps0)
414 vqmovn.s16 d28, q15
449 vaddl.u8 q15, d7, d8 ; op2 = p0 + q0
450 vmlal.u8 q15, d4, d27 ; op2 = p0 + q0 + p3 * 3
451 vmlal.u8 q15, d5, d29 ; op2 = p0 + q0 + p3 * 3 + p2 * 2
453 vaddw.u8 q15, d6 ; op2=p1 + p0 + q0 + p3 * 3 + p2 *2
455 vqrshrn.u16 d18, q15, #3 ; r_op2
457 vsub.i16 q15, q10
459 vadd.i16 q15, q14
[all …]
Dvp9_idct8x8_add_neon.asm20 ; loaded in q8-q15. The output will be stored back into q8-q15 registers.
88 vmull.s16 q15, d17, d0
96 vmlsl.s16 q15, d25, d0
107 vqrshrn.s32 d23, q15, #14 ; >> 14
134 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3]
137 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3]
180 vsub.s16 q15, q0, q7 ; output[7] = step1[0] - step1[7];
183 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15.
193 vtrn.32 q13, q15
197 vtrn.16 q14, q15
[all …]
Dvp9_iht4x4_add_neon.asm21 ; into d16-d19 registers. This macro will touch q10- q15 registers and use
29 vmull.s16 q15, d17, d2 ; input[1] * cospi_24_64
33 vmlsl.s16 q15, d19, d0 ; input[1] * cospi_24_64 - input[3] * cospi_8_64
39 vqrshrn.s32 d29, q15, #14
56 ; q14,q15 registers and use them as buffer during calculation.
64 vmovl.s16 q15, d16 ; expand x0 from 16 bit to 32 bit
65 vaddw.s16 q15, q15, d19 ; x0 + x3
67 vsubw.s16 q15, q15, d18 ; s7 = x0 + x3 - x2
75 vmul.s32 q15, q15, q8 ; x2 = sinpi_3_9 * s7
85 vqrshrn.s32 d18, q15, #14
Dvp9_idct16x16_add_neon.asm21 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15.
31 vtrn.32 q13, q15
35 vtrn.16 q14, q15
46 ; idct16 stage1 - stage6 on all the elements loaded in q8-q15. The output
47 ; will be stored back into q8-q15 registers. This function will touch q0-q7
52 ; load elements of 0, 2, 4, 6, 8, 10, 12, 14 into q8 - q15
59 vld2.s16 {q14,q15}, [r0]!
61 vmov.s16 q15, q1
129 vmull.s16 q15, d27, d3
137 vmlal.s16 q15, d23, d2
[all …]
Dvp9_iht8x8_add_neon.asm101 ; Transpose a 8x8 16bits data matrix. Datas are loaded in q8-q15.
111 vtrn.32 q13, q15
115 vtrn.16 q14, q15
119 ; loaded in q8-q15. The IDCT constants are loaded in r3 - r9. The output
120 ; will be stored back into q8-q15 registers. This macro will touch q0-q7
187 vmull.s16 q15, d17, d0
195 vmlsl.s16 q15, d25, d0
206 vqrshrn.s32 d23, q15, #14 ; >> 14
232 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3]
235 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3]
[all …]
Dvp9_idct32x32_1_add_neon.asm28 vld1.8 {q15}, [$src], $stride
40 vqadd.u8 q15, q15, $diff
52 vqsub.u8 q15, q15, $diff
64 vst1.8 {q15},[$dst], $stride
/external/libavc/encoder/arm/
Dih264e_evaluate_intra4x4_modes_a9q.s258 vext.8 q15, q6, q6, #5
260 vext.8 q15, q6, q6, #15
262 vext.8 q15, q6, q6, #2
265 vext.8 q15, q6, q6, #4
287 vext.8 q15, q6, q6, #3
289 vext.8 q15, q6, q6, #1
291 vext.8 q15, q6, q6, #4
294 vext.8 q15, q6, q6, #6
315 vext.8 q15, q5, q5, #4
317 vext.8 q15, q5, q5, #3
[all …]
/external/libavc/common/arm/
Dih264_inter_pred_luma_horz_hpel_vert_hpel_a9q.s165 vaddl.s16 q15, d21, d25 @// a0 + a5 (column1)
167 vmlal.s16 q15, d23, d0[0] @// a0 + a5 + 20a2 (column1)
171 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 (column1)
173 vmlal.s16 q15, d21, d0[0] @// a0 + a5 + 20a2 + 20a3 (column1)
177 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1)
179 vqrshrun.s32 d23, q15, #10
184 vaddl.s16 q15, d21, d27 @// a0 + a5 (column2)
186 vmlal.s16 q15, d23, d0[0] @// a0 + a5 + 20a2 (column2)
190 vmlal.s16 q15, d21, d0[0] @// a0 + a5 + 20a2 + 20a3 (column2)
193 vmlsl.s16 q15, d23, d1[0] @// a0 + a5 + 20a2 + 20a3 - 5a1 (column2)
[all …]
Dih264_deblk_luma_a9.s119 vabd.u8 q15, q2, q0 @Q15 = Aq = ABS(q2 - q0)
126 vcgt.u8 q11, q8, q15 @Q11=(Aq<Beta)
129 vsubl.u8 q15, d1, d7 @
133 vshl.i16 q13, q15, #2 @Q13 = (q0 - p0)<<2
135 vsubl.u8 q15, d9, d3 @Q15 = (p1 - q1)H
138 vadd.i16 q13, q13, q15 @Q13,Q12 = [ (q0 - p0)<<2 ] + (p1 - q1)
149 vaddl.u8 q15, d17, d5 @
162 vsub.i16 q15, q15, q13 @Q15,Q2 = [q2 + (p0+q0+1)>>1] - (q1<<1)
166 vqshrn.s16 d31, q15, #1 @
171 vmin.s8 q15, q15, q7 @Q15 = min(C0,i_macro_q1)
[all …]
Dih264_inter_pred_luma_horz_qpel_vert_hpel_a9q.s146 vmov.u16 q15, #0x5 @ Filter coeff 5 into Q12
176 vmls.u16 q9, q11, q15
178 vmls.u16 q10, q13, q15
181 vmls.u16 q11, q13, q15
253 vmls.u16 q9, q11, q15
255 vmls.u16 q10, q13, q15
258 vmls.u16 q11, q13, q15
346 vaddl.s16 q15, d12, d22
357 vmlal.s16 q15, d16, d26
358 vmlsl.s16 q15, d18, d24
[all …]
Dih264_ihadamard_scaling_a9.s116 vsubl.s16 q15, d0, d3 @x3 = x4 - x7
119 vadd.s32 q3, q15, q14 @pi4_tmp_ptr[1] = x3 + x2
121 vsub.s32 q5, q15, q14 @pi4_tmp_ptr[3] = x3 - x2
133 vsub.s32 q15, q2, q5 @x3 = x4-x7
136 vadd.s32 q1, q15, q14 @pi4_tmp_ptr[1] = x3 + x2
138 vsub.s32 q3, q15, q14 @pi4_tmp_ptr[3] = x3 - x2
213 vmull.u16 q15, d26, d27 @pu2_iscal_mat[0] * pu2_weigh_mat[0]
214 vdup.u32 q15, d30[0]
236 vmul.s32 q5, q3, q15
237 vmul.s32 q6, q1, q15
/external/libhevc/common/arm/
Dihevc_itrans_recon_8x8.s198 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3)
206 vmlsl.s16 q15,d7,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
237 vmlal.s16 q15,d14,d0[3] @// y1 * sin1 - y3 * sin3 + y5 * cos3(part of b3)
248 …vmlsl.s16 q15,d15,d0[1] @// b3 = y1 * sin1 - y3 * sin3 + y5 * cos3 - y7 * cos1(par…
264 vadd.s32 q13,q5,q15 @// a3 + b3(part of r3)
265 vsub.s32 q15,q5,q15 @// a3 - b3(part of r4)
274 vqrshrn.s32 d10,q15,#shift_stage1_idct @// r4 = (a3 - b3 + rnd) >> 7(shift_stage1_idct)
305 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3)
310 vmlsl.s16 q15,d7,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
332 vadd.s32 q13,q5,q15 @// a3 + b3(part of r3)
[all …]
Dihevc_itrans_recon_32x32.s214 vmull.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
219 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
254 vmlsl.s16 q15,d14,d7[1]
260 vmlsl.s16 q15,d15,d3[3]
284 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3)
289 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
328 vmlsl.s16 q15,d14,d6[3]
334 vmlal.s16 q15,d15,d5[3]
360 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3)
365 vmlal.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
[all …]
Dihevc_itrans_recon_16x16.s245 vmull.s16 q15,d6,d1[3] @// y1 * sin1(part of b3)
250 vmlsl.s16 q15,d7,d2[3] @// y1 * sin1 - y3 * sin3(part of b3)
272 vmlsl.s16 q15,d8,d0[3]
278 vmlal.s16 q15,d9,d3[3]
320 vmlal.s16 q15,d6,d0[1] @// y1 * sin1(part of b3)
325 vmlal.s16 q15,d7,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
332 vmlsl.s16 q15,d8,d1[1]
338 vmlsl.s16 q15,d9,d2[1]
380 vadd.s32 q8,q9,q15
381 vsub.s32 q14,q9,q15
[all …]
Dihevc_inter_pred_chroma_vert_w16inp.s156 vqrshrun.s16 d30,q15,#6 @rounding shift
187 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0)
189 vmlal.s16 q15,d1,d13
190 vmlal.s16 q15,d2,d14
192 vmlal.s16 q15,d3,d15
204 vqshrn.s32 d30,q15,#6 @right shift
213 vqrshrun.s16 d30,q15,#6 @rounding shift
233 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0)
235 vmlal.s16 q15,d1,d13
237 vmlal.s16 q15,d2,d14
[all …]
Dihevc_inter_pred_chroma_vert_w16inp_w16out.s186 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0)
188 vmlal.s16 q15,d1,d13
189 vmlal.s16 q15,d2,d14
191 vmlal.s16 q15,d3,d15
202 vqshrn.s32 d30,q15,#6 @right shift
230 vmull.s16 q15,d0,d12 @vmull_s16(src_tmp1, coeff_0)
232 vmlal.s16 q15,d1,d13
234 vmlal.s16 q15,d2,d14
235 vmlal.s16 q15,d3,d15
248 vqshrn.s32 d30,q15,#6 @right shift
[all …]
Dihevc_inter_pred_chroma_vert_w16out.s232 vmull.u8 q15,d5,d1 @mul with coeff 1
234 vmlsl.u8 q15,d4,d0
236 vmlal.u8 q15,d6,d2
237 vmlsl.u8 q15,d7,d3
252 vst1.8 {q15},[r1]! @stores the loaded value
275 vmull.u8 q15,d5,d1 @mul with coeff 1
277 vmlsl.u8 q15,d4,d0
279 vmlal.u8 q15,d6,d2
281 vmlsl.u8 q15,d7,d3
306 vst1.8 {q15},[r1]! @stores the loaded value
[all …]
Dihevc_inter_pred_chroma_vert.s232 vmull.u8 q15,d5,d1 @mul with coeff 1
234 vmlsl.u8 q15,d4,d0
236 vmlal.u8 q15,d6,d2
237 vmlsl.u8 q15,d7,d3
247 vqrshrun.s16 d30,q15,#6
279 vmull.u8 q15,d5,d1 @mul with coeff 1
281 vmlsl.u8 q15,d4,d0
283 vmlal.u8 q15,d6,d2
285 vmlsl.u8 q15,d7,d3
299 vqrshrun.s16 d30,q15,#6
[all …]
/external/libmpeg2/common/arm/
Dimpeg2_idct.s151 vdup.s16 q15, r4
156 vaddw.u8 q4, q15, d0
158 vaddw.u8 q5, q15, d1
161 vaddw.u8 q6, q15, d2
165 vaddw.u8 q7, q15, d3
169 vaddw.u8 q8, q15, d4
173 vaddw.u8 q9, q15, d5
177 vaddw.u8 q10, q15, d6
181 vaddw.u8 q11, q15, d7
453 vmull.s16 q15, d6, d1[3] @// y1 * sin1(part of b3)
[all …]
/external/jpeg/
Djsimd_arm_neon.S206 vmul.s16 q7, q7, q15
248 vmov.s16 q15, #(0x80 << 5)
249 vqadd.s16 q2, q2, q15
250 vqadd.s16 q3, q3, q15
251 vqadd.s16 q4, q4, q15
252 vqadd.s16 q5, q5, q15
253 vqadd.s16 q6, q6, q15
254 vqadd.s16 q7, q7, q15
255 vqadd.s16 q8, q8, q15
256 vqadd.s16 q9, q9, q15
[all …]
/external/valgrind/none/tests/arm/
Dneon128.c364 TESTINSN_imm("vmov.i64 q15", q15, 0xFF0000FF00FFFF00); in main()
378 TESTINSN_imm("vmvn.i64 q15", q15, 0xFF0000FF00FFFF00); in main()
386 TESTINSN_imm("vorr.i32 q15", q15, 0x7000000); in main()
394 TESTINSN_imm("vbic.i32 q15", q15, 0x7000000); in main()
398 TESTINSN_un("vmvn q10, q15", q10, q15, i32, 24); in main()
403 TESTINSN_un("vmov q10, q15", q10, q15, i32, 24); in main()
409 TESTINSN_un("vmov q0, q15", q0, q15, i32, 7); in main()
422 TESTINSN_bin("vadd.i64 q13, q14, q15", q13, q14, i32, 140, q15, i32, 120); in main()
435 TESTINSN_bin("vsub.i64 q13, q14, q15", q13, q14, i32, 140, q15, i32, 120); in main()
441 TESTINSN_bin("vand q15, q15, q15", q15, q15, i8, 0xff, q15, i8, 0xff); in main()
[all …]
/external/boringssl/linux-arm/crypto/aes/
Dbsaes-armv7.S1108 vstmia r12, {q15} @ save last round key
1124 vstmia r12, {q15} @ save last round key
1132 vld1.8 {q15}, [r8] @ load IV
1151 vstmia r9, {q15} @ put aside IV
1164 vld1.8 {q14,q15}, [r0]!
1192 vstmia r9, {q15} @ put aside IV
1218 vld1.8 {q15}, [r0]!
1241 vld1.8 {q15}, [r0]!
1259 vld1.8 {q15}, [r0]!
1277 vld1.8 {q15}, [r0]!
[all …]
/external/libvpx/libvpx/vp8/common/arm/neon/
Dloopfiltersimpleverticaledge_neon.asm54 vabd.u8 q15, q5, q4 ; abs(p0 - q0)
57 vqadd.u8 q15, q15, q15 ; abs(p0 - q0) * 2
61 vqadd.u8 q15, q15, q14 ; abs(p0 - q0) * 2 + abs(p1 - q1) / 2
68 vcge.u8 q15, q1, q15 ; abs(p0 - q0)*2 + abs(p1-q1)/2 > flimit*2 + limit)*-1
90 vand q14, q14, q15 ; vp8_filter &= mask
/external/boringssl/src/crypto/chacha/
Dchacha_vec_arm.S169 vmov q15, q14 @ v4si
218 vadd.i32 q15, q15, q2
223 veor q6, q15, q5
268 vadd.i32 q15, q15, q2
274 veor q5, q15, q5
325 vext.32 q15, q15, q15, #2
331 vadd.i32 q15, q15, q2
337 veor q1, q15, q1
399 vadd.i32 q15, q15, q6
409 veor q6, q15, q1
[all …]
/external/libhevc/decoder/arm/
Dihevcd_itrans_recon_dc_chroma.s105 vaddw.u8 q15,q0,d2
115 vqmovun.s16 d2,q15
120 vaddw.u8 q15,q0,d16
125 vqmovun.s16 d16,q15
167 vaddw.u8 q15,q0,d2
174 vqmovun.s16 d2,q15

12345