Lines Matching refs:b

91     movi      v0.8b, #5
94 movi v1.8b, #20
100 ld1 {v2.8b, v3.8b, v4.8b}, [x0], x2 //// Load row0
101 ld1 {v5.8b, v6.8b, v7.8b}, [x0], x2 //// Load row1
105 ext v31.8b, v2.8b , v3.8b , #5
106 ext v30.8b, v3.8b , v4.8b , #5
108 uaddl v8.8h, v31.8b, v2.8b //// a0 + a5 (column1,row0)
109 ext v29.8b, v4.8b , v4.8b , #5
110 uaddl v10.8h, v30.8b, v3.8b //// a0 + a5 (column2,row0)
111 ext v28.8b, v5.8b , v6.8b , #5
112 uaddl v12.8h, v29.8b, v4.8b //// a0 + a5 (column3,row0)
113 ext v27.8b, v6.8b , v7.8b , #5
114 uaddl v14.8h, v28.8b, v5.8b //// a0 + a5 (column1,row1)
115 ext v26.8b, v7.8b , v7.8b , #5
117 uaddl v16.8h, v27.8b, v6.8b //// a0 + a5 (column2,row1)
118 ext v31.8b, v2.8b , v3.8b , #2
119 uaddl v18.8h, v26.8b, v7.8b //// a0 + a5 (column3,row1)
120 ext v30.8b, v3.8b , v4.8b , #2
121 umlal v8.8h, v31.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
122 ext v29.8b, v4.8b , v4.8b , #2
123 umlal v10.8h, v30.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
124 ext v28.8b, v5.8b , v6.8b , #2
125 umlal v12.8h, v29.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
126 ext v27.8b, v6.8b , v7.8b , #2
127 umlal v14.8h, v28.8b, v1.8b //// a0 + a5 + 20a2 (column1,row1)
128 ext v26.8b, v7.8b , v7.8b , #2
130 umlal v16.8h, v27.8b, v1.8b //// a0 + a5 + 20a2 (column2,row1)
131 ext v31.8b, v2.8b , v3.8b , #3
132 umlal v18.8h, v26.8b, v1.8b //// a0 + a5 + 20a2 (column3,row1)
133 ext v30.8b, v3.8b , v4.8b , #3
134 umlal v8.8h, v31.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
135 ext v29.8b, v4.8b , v4.8b , #3
136 umlal v10.8h, v30.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
137 ext v28.8b, v5.8b , v6.8b , #3
138 umlal v12.8h, v29.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
139 ext v27.8b, v6.8b , v7.8b , #3
140 umlal v14.8h, v28.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row1)
141 ext v26.8b, v7.8b , v7.8b , #3
143 umlal v16.8h, v27.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row1)
144 ext v31.8b, v2.8b , v3.8b , #1
145 umlal v18.8h, v26.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row1)
146 ext v30.8b, v3.8b , v4.8b , #1
147 umlsl v8.8h, v31.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
148 ext v29.8b, v4.8b , v4.8b , #1
149 umlsl v10.8h, v30.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
150 ext v28.8b, v5.8b , v6.8b , #1
151 umlsl v12.8h, v29.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
152 ext v27.8b, v6.8b , v7.8b , #1
153 umlsl v14.8h, v28.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row1)
154 ext v26.8b, v7.8b , v7.8b , #1
156 umlsl v16.8h, v27.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row1)
157 ext v31.8b, v2.8b , v3.8b , #4
158 umlsl v18.8h, v26.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row1)
159 ext v30.8b, v3.8b , v4.8b , #4
160 umlsl v8.8h, v31.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
161 ext v29.8b, v4.8b , v4.8b , #4
162 umlsl v10.8h, v30.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
163 ext v28.8b, v5.8b , v6.8b , #4
164 umlsl v12.8h, v29.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
165 ext v27.8b, v6.8b , v7.8b , #4
166 umlsl v14.8h, v28.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row1)
167 ext v26.8b, v7.8b , v7.8b , #4
169 umlsl v16.8h, v27.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row1)
170 umlsl v18.8h, v26.8b, v0.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row1)
172 …sqrshrun v20.8b, v8.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
173 …sqrshrun v21.8b, v10.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
174 …sqrshrun v22.8b, v12.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
175 …sqrshrun v23.8b, v14.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
176 …sqrshrun v24.8b, v16.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
177 …sqrshrun v25.8b, v18.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
179 st1 {v20.8b, v21.8b}, [x1], #16 ////Store dest row0
181 st1 {v23.8b, v24.8b}, [x1], #16 ////Store dest row1
275 ld1 {v2.8b, v3.8b, v4.8b}, [x0], x3
276 ld1 {v5.8b, v6.8b, v7.8b}, [x0], x3
277 ld1 {v8.8b, v9.8b, v10.8b}, [x0], x3
279 ld1 {v11.8b, v12.8b, v13.8b}, [x0], x3
281 ld1 {v14.8b, v15.8b, v16.8b}, [x0], x3
284 ld1 {v17.8b, v18.8b, v19.8b}, [x0], x3
285 movi v1.8b, #20
303 uaddl v20.8h, v2.8b, v17.8b //// a0 + a5 (column1,row0)
304 movi v31.8b, #5
305 umlal v20.8h, v8.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
306 umlal v20.8h, v11.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
307 umlsl v20.8h, v5.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
308 umlsl v20.8h, v14.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
311 uaddl v22.8h, v3.8b, v18.8b //// a0 + a5 (column2,row0)
312 umlal v22.8h, v9.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
313 umlal v22.8h, v12.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
314 umlsl v22.8h, v6.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
315 umlsl v22.8h, v15.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
316 ext v30.8b, v20.8b , v21.8b , #4
320 uaddl v24.8h, v4.8b, v19.8b //// a0 + a5 (column3,row0)
321 ext v29.8b, v20.8b , v21.8b , #6
322 umlal v24.8h, v10.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
323 umlal v24.8h, v13.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
324 umlsl v24.8h, v7.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
325 umlsl v24.8h, v16.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
328 …sqrshrun v2.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
329 ext v31.8b, v21.8b , v22.8b , #2
330 …sqrshrun v3.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
331 ext v28.8b, v20.8b , v21.8b , #2
334 ext v31.8b, v22.8b , v23.8b , #2
339 ext v30.8b, v21.8b , v22.8b , #4
341 …sqrshrun v4.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
342 ext v29.8b, v21.8b , v22.8b , #6
344 ext v28.8b, v21.8b , v22.8b , #2
350 ext v31.8b, v23.8b , v24.8b , #2
352 ext v2.8b, v2.8b , v3.8b , #2
353 ext v3.8b, v3.8b , v4.8b , #2
354 ext v4.8b, v4.8b , v4.8b , #2
356 st1 {v2.8b, v3.8b}, [x1], x12 //// store row1 - 1,1/2 grid
359 ext v30.8b, v22.8b , v23.8b , #4
360 ext v29.8b, v22.8b , v23.8b , #6
363 ext v28.8b, v22.8b , v23.8b , #2
368 ext v31.8b, v24.8b , v25.8b , #2
371 ext v30.8b, v23.8b , v24.8b , #4
373 ext v29.8b, v23.8b , v24.8b , #6
376 ext v28.8b, v23.8b , v24.8b , #2
377 ext v31.8b, v25.8b , v25.8b , #2
382 ext v30.8b, v24.8b , v25.8b , #4
385 ext v29.8b, v24.8b , v25.8b , #6
387 ext v31.8b, v24.8b , v25.8b , #2
390 ld1 {v2.8b, v3.8b, v4.8b}, [x0], x3 //// Load next Row data
397 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
410 uaddl v20.8h, v5.8b, v2.8b //// a0 + a5 (column1,row0)
411 movi v31.8b, #5
412 umlal v20.8h, v11.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
413 umlal v20.8h, v14.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
414 umlsl v20.8h, v8.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
415 umlsl v20.8h, v17.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
419 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
423 uaddl v22.8h, v6.8b, v3.8b //// a0 + a5 (column2,row0)
424 umlal v22.8h, v12.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
425 umlal v22.8h, v15.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
426 umlsl v22.8h, v9.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
427 umlsl v22.8h, v18.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
430 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
431 ext v30.8b, v20.8b , v21.8b , #4
433 uaddl v24.8h, v7.8b, v4.8b //// a0 + a5 (column3,row0)
434 ext v29.8b, v20.8b , v21.8b , #6
435 umlal v24.8h, v13.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
436 umlal v24.8h, v16.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
437 umlsl v24.8h, v10.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
438 umlsl v24.8h, v19.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
441 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
444 …sqrshrun v5.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
445 ext v31.8b, v21.8b , v22.8b , #2
446 …sqrshrun v6.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
447 ext v28.8b, v20.8b , v21.8b , #2
450 ext v31.8b, v22.8b , v23.8b , #2
455 ext v30.8b, v21.8b , v22.8b , #4
457 …sqrshrun v7.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
458 ext v29.8b, v21.8b , v22.8b , #6
460 ext v28.8b, v21.8b , v22.8b , #2
466 ext v31.8b, v23.8b , v24.8b , #2
468 ext v5.8b, v5.8b , v6.8b , #2
469 ext v6.8b, v6.8b , v7.8b , #2
470 ext v7.8b, v7.8b , v7.8b , #2
472 st1 {v5.8b, v6.8b}, [x1], x12 //// store row1 - 1,1/2 grid
475 ext v30.8b, v22.8b , v23.8b , #4
476 ext v29.8b, v22.8b , v23.8b , #6
479 ext v28.8b, v22.8b , v23.8b , #2
484 ext v31.8b, v24.8b , v25.8b , #2
487 ext v30.8b, v23.8b , v24.8b , #4
489 ext v29.8b, v23.8b , v24.8b , #6
492 ext v28.8b, v23.8b , v24.8b , #2
493 ext v31.8b, v25.8b , v25.8b , #2
498 ext v30.8b, v24.8b , v25.8b , #4
501 ext v29.8b, v24.8b , v25.8b , #6
503 ext v31.8b, v24.8b , v25.8b , #2
506 ld1 {v5.8b, v6.8b, v7.8b}, [x0], x3 //// Load next Row data
513 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
526 uaddl v20.8h, v8.8b, v5.8b //// a0 + a5 (column1,row0)
527 movi v31.8b, #5
528 umlal v20.8h, v14.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
529 umlal v20.8h, v17.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
530 umlsl v20.8h, v11.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
531 umlsl v20.8h, v2.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
535 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
538 uaddl v22.8h, v9.8b, v6.8b //// a0 + a5 (column2,row0)
539 umlal v22.8h, v15.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
540 umlal v22.8h, v18.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
541 umlsl v22.8h, v12.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
542 umlsl v22.8h, v3.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
545 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
546 ext v30.8b, v20.8b , v21.8b , #4
548 uaddl v24.8h, v10.8b, v7.8b //// a0 + a5 (column3,row0)
549 ext v29.8b, v20.8b , v21.8b , #6
550 umlal v24.8h, v16.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
551 umlal v24.8h, v19.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
552 umlsl v24.8h, v13.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
553 umlsl v24.8h, v4.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
556 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
559 …sqrshrun v8.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
560 ext v31.8b, v21.8b , v22.8b , #2
561 …sqrshrun v9.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
562 ext v28.8b, v20.8b , v21.8b , #2
565 ext v31.8b, v22.8b , v23.8b , #2
570 ext v30.8b, v21.8b , v22.8b , #4
572 …sqrshrun v10.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
573 ext v29.8b, v21.8b , v22.8b , #6
575 ext v28.8b, v21.8b , v22.8b , #2
581 ext v31.8b, v23.8b , v24.8b , #2
583 ext v8.8b, v8.8b , v9.8b , #2
584 ext v9.8b, v9.8b , v10.8b , #2
585 ext v10.8b, v10.8b , v10.8b , #2
587 st1 {v8.8b, v9.8b}, [x1], x12 //// store row1 - 1,1/2 grid
590 ext v30.8b, v22.8b , v23.8b , #4
591 ext v29.8b, v22.8b , v23.8b , #6
594 ext v28.8b, v22.8b , v23.8b , #2
599 ext v31.8b, v24.8b , v25.8b , #2
602 ext v30.8b, v23.8b , v24.8b , #4
604 ext v29.8b, v23.8b , v24.8b , #6
607 ext v28.8b, v23.8b , v24.8b , #2
608 ext v31.8b, v25.8b , v25.8b , #2
613 ext v30.8b, v24.8b , v25.8b , #4
616 ext v29.8b, v24.8b , v25.8b , #6
618 ext v31.8b, v24.8b , v25.8b , #2
621 ld1 {v8.8b, v9.8b, v10.8b}, [x0], x3 //// Load next Row data
628 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
641 uaddl v20.8h, v11.8b, v8.8b //// a0 + a5 (column1,row0)
642 movi v31.8b, #5
643 umlal v20.8h, v17.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
644 umlal v20.8h, v2.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
645 umlsl v20.8h, v14.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
646 umlsl v20.8h, v5.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
649 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
652 uaddl v22.8h, v12.8b, v9.8b //// a0 + a5 (column2,row0)
653 umlal v22.8h, v18.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
654 umlal v22.8h, v3.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
655 umlsl v22.8h, v15.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
656 umlsl v22.8h, v6.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
659 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
660 ext v30.8b, v20.8b , v21.8b , #4
662 uaddl v24.8h, v13.8b, v10.8b //// a0 + a5 (column3,row0)
663 ext v29.8b, v20.8b , v21.8b , #6
664 umlal v24.8h, v19.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
665 umlal v24.8h, v4.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
666 umlsl v24.8h, v16.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
667 umlsl v24.8h, v7.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
670 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
673 …sqrshrun v11.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
674 ext v31.8b, v21.8b , v22.8b , #2
675 …sqrshrun v12.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
676 ext v28.8b, v20.8b , v21.8b , #2
679 ext v31.8b, v22.8b , v23.8b , #2
684 ext v30.8b, v21.8b , v22.8b , #4
686 …sqrshrun v13.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
687 ext v29.8b, v21.8b , v22.8b , #6
689 ext v28.8b, v21.8b , v22.8b , #2
695 ext v31.8b, v23.8b , v24.8b , #2
697 ext v11.8b, v11.8b , v12.8b , #2
698 ext v12.8b, v12.8b , v13.8b , #2
699 ext v13.8b, v13.8b , v13.8b , #2
701 st1 {v11.8b, v12.8b}, [x1], x12 //// store row1 - 1,1/2 grid
704 ext v30.8b, v22.8b , v23.8b , #4
705 ext v29.8b, v22.8b , v23.8b , #6
708 ext v28.8b, v22.8b , v23.8b , #2
713 ext v31.8b, v24.8b , v25.8b , #2
716 ext v30.8b, v23.8b , v24.8b , #4
718 ext v29.8b, v23.8b , v24.8b , #6
721 ext v28.8b, v23.8b , v24.8b , #2
722 ext v31.8b, v25.8b , v25.8b , #2
727 ext v30.8b, v24.8b , v25.8b , #4
730 ext v29.8b, v24.8b , v25.8b , #6
732 ext v31.8b, v24.8b , v25.8b , #2
735 ld1 {v11.8b, v12.8b, v13.8b}, [x0], x3 //// Load next Row data
742 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
755 uaddl v20.8h, v14.8b, v11.8b //// a0 + a5 (column1,row0)
756 movi v31.8b, #5
757 umlal v20.8h, v2.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
758 umlal v20.8h, v5.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
759 umlsl v20.8h, v17.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
760 umlsl v20.8h, v8.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
763 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
766 uaddl v22.8h, v15.8b, v12.8b //// a0 + a5 (column2,row0)
767 umlal v22.8h, v3.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
768 umlal v22.8h, v6.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
769 umlsl v22.8h, v18.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
770 umlsl v22.8h, v9.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
773 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
774 ext v30.8b, v20.8b , v21.8b , #4
776 uaddl v24.8h, v16.8b, v13.8b //// a0 + a5 (column3,row0)
777 ext v29.8b, v20.8b , v21.8b , #6
778 umlal v24.8h, v4.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
779 umlal v24.8h, v7.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
780 umlsl v24.8h, v19.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
781 umlsl v24.8h, v10.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
784 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
787 …sqrshrun v14.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
788 ext v31.8b, v21.8b , v22.8b , #2
789 …sqrshrun v15.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
790 ext v28.8b, v20.8b , v21.8b , #2
793 ext v31.8b, v22.8b , v23.8b , #2
798 ext v30.8b, v21.8b , v22.8b , #4
800 …sqrshrun v16.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
801 ext v29.8b, v21.8b , v22.8b , #6
803 ext v28.8b, v21.8b , v22.8b , #2
809 ext v31.8b, v23.8b , v24.8b , #2
811 ext v14.8b, v14.8b , v15.8b , #2
812 ext v15.8b, v15.8b , v16.8b , #2
813 ext v16.8b, v16.8b , v16.8b , #2
815 st1 {v14.8b, v15.8b}, [x1], x12 //// store row1 - 1,1/2 grid
818 ext v30.8b, v22.8b , v23.8b , #4
819 ext v29.8b, v22.8b , v23.8b , #6
822 ext v28.8b, v22.8b , v23.8b , #2
827 ext v31.8b, v24.8b , v25.8b , #2
830 ext v30.8b, v23.8b , v24.8b , #4
832 ext v29.8b, v23.8b , v24.8b , #6
835 ext v28.8b, v23.8b , v24.8b , #2
836 ext v31.8b, v25.8b , v25.8b , #2
841 ext v30.8b, v24.8b , v25.8b , #4
844 ext v29.8b, v24.8b , v25.8b , #6
846 ext v31.8b, v24.8b , v25.8b , #2
849 ld1 {v14.8b, v15.8b, v16.8b}, [x0], x3 //// Load next Row data
856 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
872 uaddl v20.8h, v17.8b, v14.8b //// a0 + a5 (column1,row0)
873 movi v31.8b, #5
874 umlal v20.8h, v5.8b, v1.8b //// a0 + a5 + 20a2 (column1,row0)
875 umlal v20.8h, v8.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column1,row0)
876 umlsl v20.8h, v2.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column1,row0)
877 umlsl v20.8h, v11.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column1,row0)
880 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
883 uaddl v22.8h, v18.8b, v15.8b //// a0 + a5 (column2,row0)
884 umlal v22.8h, v6.8b, v1.8b //// a0 + a5 + 20a2 (column2,row0)
885 umlal v22.8h, v9.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column2,row0)
886 umlsl v22.8h, v3.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column2,row0)
887 umlsl v22.8h, v12.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column2,row0)
890 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
891 ext v30.8b, v20.8b , v21.8b , #4
893 uaddl v24.8h, v19.8b, v16.8b //// a0 + a5 (column3,row0)
894 ext v29.8b, v20.8b , v21.8b , #6
895 umlal v24.8h, v7.8b, v1.8b //// a0 + a5 + 20a2 (column3,row0)
896 umlal v24.8h, v10.8b, v1.8b //// a0 + a5 + 20a2 + 20a3 (column3,row0)
897 umlsl v24.8h, v4.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 (column3,row0)
898 umlsl v24.8h, v13.8b, v31.8b //// a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 (column3,row0)
901 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
904 …sqrshrun v17.8b, v20.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column1…
905 ext v31.8b, v21.8b , v22.8b , #2
906 …sqrshrun v18.8b, v22.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column2…
907 ext v28.8b, v20.8b , v21.8b , #2
910 ext v31.8b, v22.8b , v23.8b , #2
915 ext v30.8b, v21.8b , v22.8b , #4
917 …sqrshrun v19.8b, v24.8h, #5 //// (a0 + a5 + 20a2 + 20a3 - 5a1 - 5a4 + 16) >> 5 (column3…
918 ext v29.8b, v21.8b , v22.8b , #6
920 ext v28.8b, v21.8b , v22.8b , #2
926 ext v31.8b, v23.8b , v24.8b , #2
928 ext v17.8b, v17.8b , v18.8b , #2
929 ext v18.8b, v18.8b , v19.8b , #2
930 ext v19.8b, v19.8b , v19.8b , #2
932 st1 {v17.8b, v18.8b}, [x1], x12 //// store row1 - 1,1/2 grid
935 ext v30.8b, v22.8b , v23.8b , #4
936 ext v29.8b, v22.8b , v23.8b , #6
939 ext v28.8b, v22.8b , v23.8b , #2
944 ext v31.8b, v24.8b , v25.8b , #2
947 ext v30.8b, v23.8b , v24.8b , #4
949 ext v29.8b, v23.8b , v24.8b , #6
952 ext v28.8b, v23.8b , v24.8b , #2
953 ext v31.8b, v25.8b , v25.8b , #2
958 ext v30.8b, v24.8b , v25.8b , #4
961 ext v29.8b, v24.8b , v25.8b , #6
963 ext v31.8b, v24.8b , v25.8b , #2
966 ld1 {v17.8b, v18.8b, v19.8b}, [x0], x3 //// Load next Row data
973 sqrshrun v26.8b, v20.8h, #2 //// half,half gird set1,2
976 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
979 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
981 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values
1003 sqrshrun v27.8b, v28.8h, #2 //// half,half gird set3,4
1006 sqrshrun v28.8b, v28.8h, #2 //// half,half gird set5
1008 st1 {v26.8b, v27.8b}, [x2], #16 //// store 1/2,1,2 grif values