Home
last modified time | relevance | path

Searched refs:SSE42 (Results 1 – 25 of 139) sorted by relevance

123456

/external/llvm/test/CodeGen/X86/
Dvector-compare-results.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
58 ; SSE42-LABEL: test_cmp_v2i64:
59 ; SSE42: # BB#0:
60 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
61 ; SSE42-NEXT: retq
127 ; SSE42-LABEL: test_cmp_v4f64:
128 ; SSE42: # BB#0:
129 ; SSE42-NEXT: cmpltpd %xmm1, %xmm3
130 ; SSE42-NEXT: pshufd {{.*#+}} xmm1 = xmm3[0,1,0,2]
131 ; SSE42-NEXT: cmpltpd %xmm0, %xmm2
[all …]
Dwiden_conv-4.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
28 ; X86-SSE42-LABEL: convert_v7i16_v7f32:
29 ; X86-SSE42: # BB#0: # %entry
30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1
32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0…
34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1
[all …]
Dwiden_conv-3.ll3 … %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86 --check-prefix=X86-SSE42
5 …s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64 --check-prefix=X64-SSE42
22 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32:
23 ; X86-SSE42: # BB#0: # %entry
24 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
25 ; X86-SSE42-NEXT: psllq $48, %xmm0
26 ; X86-SSE42-NEXT: psrad $16, %xmm0
27 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm0 = xmm0[1,3,2,3]
28 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
29 ; X86-SSE42-NEXT: extractps $1, %xmm0, 4(%eax)
[all …]
Dvec_minmax_uint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # BB#0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
57 ; SSE42-NEXT: movdqa %xmm1, %xmm3
58 ; SSE42-NEXT: pxor %xmm0, %xmm3
59 ; SSE42-NEXT: pxor %xmm2, %xmm0
60 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
61 ; SSE42-NEXT: blendvpd %xmm2, %xmm1
[all …]
Dvec_minmax_sint.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
53 ; SSE42-LABEL: max_gt_v2i64:
54 ; SSE42: # BB#0:
55 ; SSE42-NEXT: movdqa %xmm0, %xmm2
56 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
57 ; SSE42-NEXT: blendvpd %xmm2, %xmm1
58 ; SSE42-NEXT: movapd %xmm1, %xmm0
59 ; SSE42-NEXT: retq
140 ; SSE42-LABEL: max_gt_v4i64:
141 ; SSE42: # BB#0:
[all …]
Dvec_cmp_uint-128.ll4 …wn-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=ALL --check-prefix=SSE --check-prefix=SSE42
29 ; SSE42-LABEL: eq_v2i64:
30 ; SSE42: # BB#0:
31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
32 ; SSE42-NEXT: retq
129 ; SSE42-LABEL: ne_v2i64:
130 ; SSE42: # BB#0:
131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1
133 ; SSE42-NEXT: pxor %xmm1, %xmm0
[all …]
/external/llvm-project/llvm/test/CodeGen/X86/
Dwiden_conv-4.ll3 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
5 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
28 ; X86-SSE42-LABEL: convert_v7i16_v7f32:
29 ; X86-SSE42: # %bb.0: # %entry
30 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
31 ; X86-SSE42-NEXT: pxor %xmm1, %xmm1
32 ; X86-SSE42-NEXT: pmovzxwd {{.*#+}} xmm2 = xmm0[0],zero,xmm0[1],zero,xmm0[2],zero,xmm0[3],zero
33 ; X86-SSE42-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0…
34 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
35 ; X86-SSE42-NEXT: cvtdq2ps %xmm2, %xmm1
[all …]
Dwiden_conv-3.ll3 ; RUN: llc < %s -mtriple=i686-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
5 ; RUN: llc < %s -mtriple=x86_64-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
19 ; X86-SSE42-LABEL: convert_v2i16_to_v2f32:
20 ; X86-SSE42: # %bb.0: # %entry
21 ; X86-SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
22 ; X86-SSE42-NEXT: pmovsxwd %xmm0, %xmm0
23 ; X86-SSE42-NEXT: cvtdq2ps %xmm0, %xmm0
24 ; X86-SSE42-NEXT: movlps %xmm0, (%eax)
25 ; X86-SSE42-NEXT: retl
35 ; X64-SSE42-LABEL: convert_v2i16_to_v2f32:
[all …]
Dmasked_compressstore.ll3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
627 ; SSE42-LABEL: compressstore_v2f32_v2i32:
628 ; SSE42: ## %bb.0:
629 ; SSE42-NEXT: pxor %xmm2, %xmm2
630 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm2
631 ; SSE42-NEXT: pmovsxdq %xmm2, %xmm1
632 ; SSE42-NEXT: movmskpd %xmm1, %eax
633 ; SSE42-NEXT: testb $1, %al
634 ; SSE42-NEXT: jne LBB2_1
635 ; SSE42-NEXT: ## %bb.2: ## %else
[all …]
Dmasked_load.ll3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
82 ; SSE42-LABEL: load_v2f64_v2i64:
83 ; SSE42: ## %bb.0:
84 ; SSE42-NEXT: pxor %xmm2, %xmm2
85 ; SSE42-NEXT: pcmpeqq %xmm0, %xmm2
86 ; SSE42-NEXT: movmskpd %xmm2, %eax
87 ; SSE42-NEXT: testb $1, %al
88 ; SSE42-NEXT: jne LBB1_1
89 ; SSE42-NEXT: ## %bb.2: ## %else
90 ; SSE42-NEXT: testb $2, %al
[all …]
Datomic-load-store-wide.ll2 …rei7 -mtriple=i686-- -verify-machineinstrs | FileCheck %s --check-prefix=CHECK --check-prefix=SSE42
9 ; SSE42-LABEL: test1:
10 ; SSE42: # %bb.0:
11 ; SSE42-NEXT: movl {{[0-9]+}}(%esp), %eax
12 ; SSE42-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
13 ; SSE42-NEXT: movlps %xmm0, (%eax)
14 ; SSE42-NEXT: lock orl $0, (%esp)
15 ; SSE42-NEXT: retl
43 ; SSE42-LABEL: test2:
44 ; SSE42: # %bb.0:
[all …]
Dmasked_expandload.ll3 …able-peephole -mtriple=x86_64-apple-darwin -mattr=sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
38 ; SSE42-LABEL: expandload_v2f64_v2i64:
39 ; SSE42: ## %bb.0:
40 ; SSE42-NEXT: pxor %xmm2, %xmm2
41 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm2
42 ; SSE42-NEXT: movmskpd %xmm2, %eax
43 ; SSE42-NEXT: testb $1, %al
44 ; SSE42-NEXT: jne LBB0_1
45 ; SSE42-NEXT: ## %bb.2: ## %else
46 ; SSE42-NEXT: testb $2, %al
[all …]
Doddshuffles.ll3 …< %s -mtriple=x86_64-pc-linux -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
18 ; SSE42-LABEL: v3i64:
19 ; SSE42: # %bb.0:
20 ; SSE42-NEXT: pextrq $1, %xmm0, 16(%rdi)
21 ; SSE42-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
22 ; SSE42-NEXT: movdqa %xmm0, (%rdi)
23 ; SSE42-NEXT: retq
77 ; SSE42-LABEL: v3i32:
78 ; SSE42: # %bb.0:
79 ; SSE42-NEXT: extractps $1, %xmm0, 8(%rdi)
[all …]
Dhorizontal-reduce-umax.ll3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm3 = [0,2147483648,0,2147483648]
45 ; X86-SSE42-NEXT: pxor %xmm3, %xmm0
46 ; X86-SSE42-NEXT: pxor %xmm2, %xmm3
47 ; X86-SSE42-NEXT: pcmpgtq %xmm3, %xmm0
[all …]
Dclear_upper_vector_element_bits.ll3 …triple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE --check-prefix=SSE42
17 ; SSE42-LABEL: _clearupper2xi64a:
18 ; SSE42: # %bb.0:
19 ; SSE42-NEXT: xorps %xmm1, %xmm1
20 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm1[1],xmm0[2],xmm1[3]
21 ; SSE42-NEXT: retq
47 ; SSE42-LABEL: _clearupper4xi64a:
48 ; SSE42: # %bb.0:
49 ; SSE42-NEXT: xorps %xmm2, %xmm2
50 ; SSE42-NEXT: blendps {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]
[all …]
Dhorizontal-reduce-umin.ll3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
44 ; X86-SSE42-NEXT: movdqa {{.*#+}} xmm0 = [0,2147483648,0,2147483648]
45 ; X86-SSE42-NEXT: movdqa %xmm1, %xmm3
46 ; X86-SSE42-NEXT: pxor %xmm0, %xmm3
47 ; X86-SSE42-NEXT: pxor %xmm2, %xmm0
[all …]
Dhorizontal-reduce-smin.ll3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
44 ; X86-SSE42-NEXT: movdqa %xmm2, %xmm0
45 ; X86-SSE42-NEXT: pcmpgtq %xmm1, %xmm0
46 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
47 ; X86-SSE42-NEXT: movd %xmm2, %eax
[all …]
Dhorizontal-reduce-smax.ll3 ; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X86-SSE42
7 ; RUN: llc < %s -mtriple=x86_64-apple-darwin -mattr=+sse4.2 | FileCheck %s --check-prefix=X64-SSE42
40 ; X86-SSE42-LABEL: test_reduce_v2i64:
41 ; X86-SSE42: ## %bb.0:
42 ; X86-SSE42-NEXT: movdqa %xmm0, %xmm1
43 ; X86-SSE42-NEXT: pshufd {{.*#+}} xmm2 = xmm0[2,3,2,3]
44 ; X86-SSE42-NEXT: pcmpgtq %xmm2, %xmm0
45 ; X86-SSE42-NEXT: blendvpd %xmm0, %xmm1, %xmm2
46 ; X86-SSE42-NEXT: movd %xmm2, %eax
47 ; X86-SSE42-NEXT: pextrd $1, %xmm2, %edx
[all …]
Dvselect-packss.ll3 …RUN: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefix=SSE42
26 ; SSE42-LABEL: vselect_packss_v16i16:
27 ; SSE42: # %bb.0:
28 ; SSE42-NEXT: pcmpeqw %xmm3, %xmm1
29 ; SSE42-NEXT: pcmpeqw %xmm2, %xmm0
30 ; SSE42-NEXT: packsswb %xmm1, %xmm0
31 ; SSE42-NEXT: pblendvb %xmm0, %xmm4, %xmm5
32 ; SSE42-NEXT: movdqa %xmm5, %xmm0
33 ; SSE42-NEXT: retq
113 ; SSE42-LABEL: vselect_packss_v16i32:
[all …]
Dvec_minmax_uint.ll4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
51 ; SSE42-LABEL: max_gt_v2i64:
52 ; SSE42: # %bb.0:
53 ; SSE42-NEXT: movdqa %xmm0, %xmm2
54 ; SSE42-NEXT: movdqa {{.*#+}} xmm0 = [9223372036854775808,9223372036854775808]
55 ; SSE42-NEXT: movdqa %xmm1, %xmm3
56 ; SSE42-NEXT: pxor %xmm0, %xmm3
57 ; SSE42-NEXT: pxor %xmm2, %xmm0
58 ; SSE42-NEXT: pcmpgtq %xmm3, %xmm0
59 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1
[all …]
Dvec_cmp_uint-128.ll4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
29 ; SSE42-LABEL: eq_v2i64:
30 ; SSE42: # %bb.0:
31 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
32 ; SSE42-NEXT: retq
129 ; SSE42-LABEL: ne_v2i64:
130 ; SSE42: # %bb.0:
131 ; SSE42-NEXT: pcmpeqq %xmm1, %xmm0
132 ; SSE42-NEXT: pcmpeqd %xmm1, %xmm1
133 ; SSE42-NEXT: pxor %xmm1, %xmm0
[all …]
Dcombine-abs.ll3 …< %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=CHECK,SSE,SSE42
63 ; SSE42-LABEL: combine_v8i16_abs_abs:
64 ; SSE42: # %bb.0:
65 ; SSE42-NEXT: pabsw %xmm0, %xmm0
66 ; SSE42-NEXT: retq
90 ; SSE42-LABEL: combine_v32i8_abs_abs:
91 ; SSE42: # %bb.0:
92 ; SSE42-NEXT: pabsb %xmm0, %xmm0
93 ; SSE42-NEXT: pabsb %xmm1, %xmm1
94 ; SSE42-NEXT: retq
[all …]
Dshuffle-strided-with-offset-128.ll3 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
21 ; SSE42-LABEL: shuffle_v16i8_to_v8i8_1:
22 ; SSE42: # %bb.0:
23 ; SSE42-NEXT: movdqa (%rdi), %xmm0
24 ; SSE42-NEXT: pshufb {{.*#+}} xmm0 = xmm0[1,3,5,7,9,11,13,15,u,u,u,u,u,u,u,u]
25 ; SSE42-NEXT: movq %xmm0, (%rsi)
26 ; SSE42-NEXT: retq
57 ; SSE42-LABEL: shuffle_v8i16_to_v4i16_1:
58 ; SSE42: # %bb.0:
59 ; SSE42-NEXT: movdqa (%rdi), %xmm0
[all …]
Dvec_minmax_sint.ll4 …: llc < %s -mtriple=x86_64-unknown-unknown -mattr=+sse4.2 | FileCheck %s --check-prefixes=SSE,SSE42
51 ; SSE42-LABEL: max_gt_v2i64:
52 ; SSE42: # %bb.0:
53 ; SSE42-NEXT: movdqa %xmm0, %xmm2
54 ; SSE42-NEXT: pcmpgtq %xmm1, %xmm0
55 ; SSE42-NEXT: blendvpd %xmm0, %xmm2, %xmm1
56 ; SSE42-NEXT: movapd %xmm1, %xmm0
57 ; SSE42-NEXT: retq
148 ; SSE42-LABEL: max_gt_v4i64:
149 ; SSE42: # %bb.0:
[all …]
/external/llvm/test/Analysis/CostModel/X86/
Darith.ll2 …e=x86_64-apple-macosx10.8.0 -mattr=+sse4.2 | FileCheck %s --check-prefix=CHECK --check-prefix=SSE42
12 ; SSE42: cost of 1 {{.*}} %A = add
17 ; SSE42: cost of 2 {{.*}} %B = add
22 ; SSE42: cost of 1 {{.*}} %C = add
27 ; SSE42: cost of 2 {{.*}} %D = add
32 ; SSE42: cost of 4 {{.*}} %E = add
42 ; SSE42: cost of 1 {{.*}} %A = xor
47 ; SSE42: cost of 2 {{.*}} %B = xor
52 ; SSE42: cost of 1 {{.*}} %C = xor
57 ; SSE42: cost of 2 {{.*}} %D = xor
[all …]

123456