/external/llvm/test/CodeGen/X86/ |
D | vector-compare-results.ll | 3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42 58 ; SSE42-LABEL: test_cmp_v2i64: 59 ; SSE42: # BB#0: 60 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0 61 ; SSE42-NEXT: retq 127 ; SSE42-LABEL: test_cmp_v4f64: 128 ; SSE42: # BB#0: 129 ; SSE42-NEXT: cmpltpd %xmm1, %xmm3 130 ; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,1,0,2] 131 ; SSE42-NEXT: cmpltpd %xmm0, %xmm2 [all …]
|
D | widen_conv-4.ll | 3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42 5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42 28 ; X86-SSE42-LABEL: convert_v7i16_v7f32: 29 ; X86-SSE42: # BB#0: # %entry 30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax 31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1 32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero 33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0… 34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0 35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1 [all …]
|
D | widen_conv-3.ll | 3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42 5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42 22 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32: 23 ; X86-SSE42: # BB#0: # %entry 24 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax 25 ; X86-SSE42-NEXT: psllq $48, %xmm0 26 ; X86-SSE42-NEXT: psrad $16, %xmm0 27 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3] 28 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0 29 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax) [all …]
|
D | vec_minmax_uint.ll | 4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42 53 ; SSE42-LABEL: max_gt_v2i64: 54 ; SSE42: # BB#0: 55 ; SSE42-NEXT: movdqa %xmm0, %xmm2 56 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808] 57 ; SSE42-NEXT: movdqa %xmm1, %xmm3 58 ; SSE42-NEXT: pxor %xmm0, %xmm3 59 ; SSE42-NEXT: pxor %xmm2, %xmm0 60 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0 61 ; SSE42-NEXT: blendvpd %xmm2, %xmm1 [all …]
|
D | vec_minmax_sint.ll | 4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42 53 ; SSE42-LABEL: max_gt_v2i64: 54 ; SSE42: # BB#0: 55 ; SSE42-NEXT: movdqa %xmm0, %xmm2 56 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0 57 ; SSE42-NEXT: blendvpd %xmm2, %xmm1 58 ; SSE42-NEXT: movapd %xmm1, %xmm0 59 ; SSE42-NEXT: retq 140 ; SSE42-LABEL: max_gt_v4i64: 141 ; SSE42: # BB#0: [all …]
|
D | vec_cmp_uint-128.ll | 4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42 29 ; SSE42-LABEL: eq_v2i64: 30 ; SSE42: # BB#0: 31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0 32 ; SSE42-NEXT: retq 129 ; SSE42-LABEL: ne_v2i64: 130 ; SSE42: # BB#0: 131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0 132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1 133 ; SSE42-NEXT: pxor %xmm1, %xmm0 [all …]
|
/external/llvm-project/llvm/test/CodeGen/X86/ |
D | widen_conv-4.ll | 3 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 5 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 28 ; X86-SSE42-LABEL: convert_v7i16_v7f32: 29 ; X86-SSE42: # %bb.0: # %entry 30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax 31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1 32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero 33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0… 34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0 35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1 [all …]
|
D | widen_conv-3.ll | 3 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 5 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 19 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32: 20 ; X86-SSE42: # %bb.0: # %entry 21 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax 22 ; X86-SSE42-NEXT: pmovsxwd %xmm0, %xmm0 23 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0 24 ; X86-SSE42-NEXT: movlps %xmm0, (%eax) 25 ; X86-SSE42-NEXT: retl 35 ; X64-SSE42-LABEL: convert_v2i16_to_v2f32: [all …]
|
D | masked_compressstore.ll | 3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 627 ; SSE42-LABEL: compressstore_v2f32_v2i32: 628 ; SSE42: ## %bb.0: 629 ; SSE42-NEXT: pxor %xmm2, %xmm2 630 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm2 631 ; SSE42-NEXT: pmovsxdq %xmm2, %xmm1 632 ; SSE42-NEXT: movmskpd %xmm1, %eax 633 ; SSE42-NEXT: testb $1, %al 634 ; SSE42-NEXT: jne LBB2_1 635 ; SSE42-NEXT: ## %bb.2: ## %else [all …]
|
D | masked_load.ll | 3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 82 ; SSE42-LABEL: load_v2f64_v2i64: 83 ; SSE42: ## %bb.0: 84 ; SSE42-NEXT: pxor %xmm2, %xmm2 85 ; SSE42-NEXT: pcmpeqq %xmm0, %xmm2 86 ; SSE42-NEXT: movmskpd %xmm2, %eax 87 ; SSE42-NEXT: testb $1, %al 88 ; SSE42-NEXT: jne LBB1_1 89 ; SSE42-NEXT: ## %bb.2: ## %else 90 ; SSE42-NEXT: testb $2, %al [all …]
|
D | atomic-load-store-wide.ll | 2 …rei7 -mtriple=i686-- -verify-machineinstrs | FileCheck %s --check-prefix=CHECK --check-prefix=SSE42 9 ; SSE42-LABEL: test1: 10 ; SSE42: # %bb.0: 11 ; SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax 12 ; SSE42-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero 13 ; SSE42-NEXT: movlps %xmm0, (%eax) 14 ; SSE42-NEXT: lock orl $0, (%esp) 15 ; SSE42-NEXT: retl 43 ; SSE42-LABEL: test2: 44 ; SSE42: # %bb.0: [all …]
|
D | masked_expandload.ll | 3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 38 ; SSE42-LABEL: expandload_v2f64_v2i64: 39 ; SSE42: ## %bb.0: 40 ; SSE42-NEXT: pxor %xmm2, %xmm2 41 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm2 42 ; SSE42-NEXT: movmskpd %xmm2, %eax 43 ; SSE42-NEXT: testb $1, %al 44 ; SSE42-NEXT: jne LBB0_1 45 ; SSE42-NEXT: ## %bb.2: ## %else 46 ; SSE42-NEXT: testb $2, %al [all …]
|
D | oddshuffles.ll | 3 …< %s -mtriple=x86_64-pc-linux -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42 18 ; SSE42-LABEL: v3i64: 19 ; SSE42: # %bb.0: 20 ; SSE42-NEXT: pextrq $1, %xmm0, 16(%rdi) 21 ; SSE42-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0] 22 ; SSE42-NEXT: movdqa %xmm0, (%rdi) 23 ; SSE42-NEXT: retq 77 ; SSE42-LABEL: v3i32: 78 ; SSE42: # %bb.0: 79 ; SSE42-NEXT: extractps $1, %xmm0, 8(%rdi) [all …]
|
D | horizontal-reduce-umax.ll | 3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 40 ; X86-SSE42-LABEL: test_reduce_v2i64: 41 ; X86-SSE42: ## %bb.0: 42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1 43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3] 44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm3 = [0,2147483648,0,2147483648] 45 ; X86-SSE42-NEXT: pxor %xmm3, %xmm0 46 ; X86-SSE42-NEXT: pxor %xmm2, %xmm3 47 ; X86-SSE42-NEXT: pcmpgtq %xmm3, %xmm0 [all …]
|
D | clear_upper_vector_element_bits.ll | 3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42 17 ; SSE42-LABEL: _clearupper2xi64a: 18 ; SSE42: # %bb.0: 19 ; SSE42-NEXT: xorps %xmm1, %xmm1 20 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3] 21 ; SSE42-NEXT: retq 47 ; SSE42-LABEL: _clearupper4xi64a: 48 ; SSE42: # %bb.0: 49 ; SSE42-NEXT: xorps %xmm2, %xmm2 50 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3] [all …]
|
D | horizontal-reduce-umin.ll | 3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 40 ; X86-SSE42-LABEL: test_reduce_v2i64: 41 ; X86-SSE42: ## %bb.0: 42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1 43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3] 44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm0 = [0,2147483648,0,2147483648] 45 ; X86-SSE42-NEXT: movdqa %xmm1, %xmm3 46 ; X86-SSE42-NEXT: pxor %xmm0, %xmm3 47 ; X86-SSE42-NEXT: pxor %xmm2, %xmm0 [all …]
|
D | horizontal-reduce-smin.ll | 3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 40 ; X86-SSE42-LABEL: test_reduce_v2i64: 41 ; X86-SSE42: ## %bb.0: 42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1 43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3] 44 ; X86-SSE42-NEXT: movdqa %xmm2, %xmm0 45 ; X86-SSE42-NEXT: pcmpgtq %xmm1, %xmm0 46 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2 47 ; X86-SSE42-NEXT: movd %xmm2, %eax [all …]
|
D | horizontal-reduce-smax.ll | 3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42 7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42 40 ; X86-SSE42-LABEL: test_reduce_v2i64: 41 ; X86-SSE42: ## %bb.0: 42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1 43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3] 44 ; X86-SSE42-NEXT: pcmpgtq %xmm2, %xmm0 45 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2 46 ; X86-SSE42-NEXT: movd %xmm2, %eax 47 ; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx [all …]
|
D | vselect-packss.ll | 3 …RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE42 26 ; SSE42-LABEL: vselect_packss_v16i16: 27 ; SSE42: # %bb.0: 28 ; SSE42-NEXT: pcmpeqw %xmm3, %xmm1 29 ; SSE42-NEXT: pcmpeqw %xmm2, %xmm0 30 ; SSE42-NEXT: packsswb %xmm1, %xmm0 31 ; SSE42-NEXT: pblendvb %xmm0, %xmm4, %xmm5 32 ; SSE42-NEXT: movdqa %xmm5, %xmm0 33 ; SSE42-NEXT: retq 113 ; SSE42-LABEL: vselect_packss_v16i32: [all …]
|
D | vec_minmax_uint.ll | 4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 51 ; SSE42-LABEL: max_gt_v2i64: 52 ; SSE42: # %bb.0: 53 ; SSE42-NEXT: movdqa %xmm0, %xmm2 54 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808] 55 ; SSE42-NEXT: movdqa %xmm1, %xmm3 56 ; SSE42-NEXT: pxor %xmm0, %xmm3 57 ; SSE42-NEXT: pxor %xmm2, %xmm0 58 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0 59 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1 [all …]
|
D | vec_cmp_uint-128.ll | 4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 29 ; SSE42-LABEL: eq_v2i64: 30 ; SSE42: # %bb.0: 31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0 32 ; SSE42-NEXT: retq 129 ; SSE42-LABEL: ne_v2i64: 130 ; SSE42: # %bb.0: 131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0 132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1 133 ; SSE42-NEXT: pxor %xmm1, %xmm0 [all …]
|
D | combine-abs.ll | 3 …< %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=CHECK,SSE,SSE42 63 ; SSE42-LABEL: combine_v8i16_abs_abs: 64 ; SSE42: # %bb.0: 65 ; SSE42-NEXT: pabsw %xmm0, %xmm0 66 ; SSE42-NEXT: retq 90 ; SSE42-LABEL: combine_v32i8_abs_abs: 91 ; SSE42: # %bb.0: 92 ; SSE42-NEXT: pabsb %xmm0, %xmm0 93 ; SSE42-NEXT: pabsb %xmm1, %xmm1 94 ; SSE42-NEXT: retq [all …]
|
D | shuffle-strided-with-offset-128.ll | 3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 21 ; SSE42-LABEL: shuffle_v16i8_to_v8i8_1: 22 ; SSE42: # %bb.0: 23 ; SSE42-NEXT: movdqa (%rdi), %xmm0 24 ; SSE42-NEXT: pshufb {{.*#+}} xmm0 = xmm0[1,3,5,7,9,11,13,15,u,u,u,u,u,u,u,u] 25 ; SSE42-NEXT: movq %xmm0, (%rsi) 26 ; SSE42-NEXT: retq 57 ; SSE42-LABEL: shuffle_v8i16_to_v4i16_1: 58 ; SSE42: # %bb.0: 59 ; SSE42-NEXT: movdqa (%rdi), %xmm0 [all …]
|
D | vec_minmax_sint.ll | 4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42 51 ; SSE42-LABEL: max_gt_v2i64: 52 ; SSE42: # %bb.0: 53 ; SSE42-NEXT: movdqa %xmm0, %xmm2 54 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0 55 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1 56 ; SSE42-NEXT: movapd %xmm1, %xmm0 57 ; SSE42-NEXT: retq 148 ; SSE42-LABEL: max_gt_v4i64: 149 ; SSE42: # %bb.0: [all …]
|
/external/llvm/test/Analysis/CostModel/X86/ |
D | arith.ll | 2 …e=x86_64-apple-macosx10.8.0 -mattr=+sse4.2 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE42 12 ; SSE42: cost of 1 {{.*}} %A = add 17 ; SSE42: cost of 2 {{.*}} %B = add 22 ; SSE42: cost of 1 {{.*}} %C = add 27 ; SSE42: cost of 2 {{.*}} %D = add 32 ; SSE42: cost of 4 {{.*}} %E = add 42 ; SSE42: cost of 1 {{.*}} %A = xor 47 ; SSE42: cost of 2 {{.*}} %B = xor 52 ; SSE42: cost of 1 {{.*}} %C = xor 57 ; SSE42: cost of 2 {{.*}} %D = xor [all …]
|