1; Like frame-05.ll, but with i64s rather than i32s.  Internally this
2; uses a different register class, but the set of saved and restored
3; registers should be the same.
4;
5; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
6
7; This function should require all GPRs, but no other spill slots.  The caller
8; allocates room for the GPR save slots, so we shouldn't need to allocate any
9; extra space.
10;
11; Use a different address for the final store, so that we can check that
12; %r15 isn't referenced again until after that.
13define void @f1(i64 *%ptr) {
14; CHECK-LABEL: f1:
15; CHECK: stmg %r6, %r15, 48(%r15)
16; CHECK-NOT: %r15
17; CHECK: .cfi_offset %r6, -112
18; CHECK: .cfi_offset %r7, -104
19; CHECK: .cfi_offset %r8, -96
20; CHECK: .cfi_offset %r9, -88
21; CHECK: .cfi_offset %r10, -80
22; CHECK: .cfi_offset %r11, -72
23; CHECK: .cfi_offset %r12, -64
24; CHECK: .cfi_offset %r13, -56
25; CHECK: .cfi_offset %r14, -48
26; CHECK: .cfi_offset %r15, -40
27; ...main function body...
28; CHECK-NOT: %r15
29; CHECK: stg {{.*}}, 8(%r2)
30; CHECK: lmg %r6, %r15, 48(%r15)
31; CHECK: br %r14
32  %l0 = load volatile i64 , i64 *%ptr
33  %l1 = load volatile i64 , i64 *%ptr
34  %l3 = load volatile i64 , i64 *%ptr
35  %l4 = load volatile i64 , i64 *%ptr
36  %l5 = load volatile i64 , i64 *%ptr
37  %l6 = load volatile i64 , i64 *%ptr
38  %l7 = load volatile i64 , i64 *%ptr
39  %l8 = load volatile i64 , i64 *%ptr
40  %l9 = load volatile i64 , i64 *%ptr
41  %l10 = load volatile i64 , i64 *%ptr
42  %l11 = load volatile i64 , i64 *%ptr
43  %l12 = load volatile i64 , i64 *%ptr
44  %l13 = load volatile i64 , i64 *%ptr
45  %l14 = load volatile i64 , i64 *%ptr
46  %add0 = add i64 %l0, %l0
47  %add1 = add i64 %l1, %add0
48  %add3 = add i64 %l3, %add1
49  %add4 = add i64 %l4, %add3
50  %add5 = add i64 %l5, %add4
51  %add6 = add i64 %l6, %add5
52  %add7 = add i64 %l7, %add6
53  %add8 = add i64 %l8, %add7
54  %add9 = add i64 %l9, %add8
55  %add10 = add i64 %l10, %add9
56  %add11 = add i64 %l11, %add10
57  %add12 = add i64 %l12, %add11
58  %add13 = add i64 %l13, %add12
59  %add14 = add i64 %l14, %add13
60  store volatile i64 %add0, i64 *%ptr
61  store volatile i64 %add1, i64 *%ptr
62  store volatile i64 %add3, i64 *%ptr
63  store volatile i64 %add4, i64 *%ptr
64  store volatile i64 %add5, i64 *%ptr
65  store volatile i64 %add6, i64 *%ptr
66  store volatile i64 %add7, i64 *%ptr
67  store volatile i64 %add8, i64 *%ptr
68  store volatile i64 %add9, i64 *%ptr
69  store volatile i64 %add10, i64 *%ptr
70  store volatile i64 %add11, i64 *%ptr
71  store volatile i64 %add12, i64 *%ptr
72  store volatile i64 %add13, i64 *%ptr
73  %final = getelementptr i64, i64 *%ptr, i64 1
74  store volatile i64 %add14, i64 *%final
75  ret void
76}
77
78; Like f1, but requires one fewer GPR.  We allocate the call-saved GPRs
79; from %r14 down, so that the STMG/LMG sequences aren't any longer than
80; they need to be.
81define void @f2(i64 *%ptr) {
82; CHECK-LABEL: f2:
83; CHECK: stmg %r7, %r15, 56(%r15)
84; CHECK-NOT: %r15
85; CHECK: .cfi_offset %r7, -104
86; CHECK: .cfi_offset %r8, -96
87; CHECK: .cfi_offset %r9, -88
88; CHECK: .cfi_offset %r10, -80
89; CHECK: .cfi_offset %r11, -72
90; CHECK: .cfi_offset %r12, -64
91; CHECK: .cfi_offset %r13, -56
92; CHECK: .cfi_offset %r14, -48
93; CHECK: .cfi_offset %r15, -40
94; ...main function body...
95; CHECK-NOT: %r15
96; CHECK-NOT: %r6
97; CHECK: stg {{.*}}, 8(%r2)
98; CHECK: lmg %r7, %r15, 56(%r15)
99; CHECK: br %r14
100  %l0 = load volatile i64 , i64 *%ptr
101  %l1 = load volatile i64 , i64 *%ptr
102  %l3 = load volatile i64 , i64 *%ptr
103  %l4 = load volatile i64 , i64 *%ptr
104  %l5 = load volatile i64 , i64 *%ptr
105  %l7 = load volatile i64 , i64 *%ptr
106  %l8 = load volatile i64 , i64 *%ptr
107  %l9 = load volatile i64 , i64 *%ptr
108  %l10 = load volatile i64 , i64 *%ptr
109  %l11 = load volatile i64 , i64 *%ptr
110  %l12 = load volatile i64 , i64 *%ptr
111  %l13 = load volatile i64 , i64 *%ptr
112  %l14 = load volatile i64 , i64 *%ptr
113  %add0 = add i64 %l0, %l0
114  %add1 = add i64 %l1, %add0
115  %add3 = add i64 %l3, %add1
116  %add4 = add i64 %l4, %add3
117  %add5 = add i64 %l5, %add4
118  %add7 = add i64 %l7, %add5
119  %add8 = add i64 %l8, %add7
120  %add9 = add i64 %l9, %add8
121  %add10 = add i64 %l10, %add9
122  %add11 = add i64 %l11, %add10
123  %add12 = add i64 %l12, %add11
124  %add13 = add i64 %l13, %add12
125  %add14 = add i64 %l14, %add13
126  store volatile i64 %add0, i64 *%ptr
127  store volatile i64 %add1, i64 *%ptr
128  store volatile i64 %add3, i64 *%ptr
129  store volatile i64 %add4, i64 *%ptr
130  store volatile i64 %add5, i64 *%ptr
131  store volatile i64 %add7, i64 *%ptr
132  store volatile i64 %add8, i64 *%ptr
133  store volatile i64 %add9, i64 *%ptr
134  store volatile i64 %add10, i64 *%ptr
135  store volatile i64 %add11, i64 *%ptr
136  store volatile i64 %add12, i64 *%ptr
137  store volatile i64 %add13, i64 *%ptr
138  %final = getelementptr i64, i64 *%ptr, i64 1
139  store volatile i64 %add14, i64 *%final
140  ret void
141}
142
143; Like f1, but only needs one call-saved GPR, which ought to be %r14.
144define void @f3(i64 *%ptr) {
145; CHECK-LABEL: f3:
146; CHECK: stmg %r14, %r15, 112(%r15)
147; CHECK-NOT: %r15
148; CHECK: .cfi_offset %r14, -48
149; CHECK: .cfi_offset %r15, -40
150; ...main function body...
151; CHECK-NOT: %r15
152; CHECK-NOT: %r6
153; CHECK-NOT: %r7
154; CHECK-NOT: %r8
155; CHECK-NOT: %r9
156; CHECK-NOT: %r10
157; CHECK-NOT: %r11
158; CHECK-NOT: %r12
159; CHECK-NOT: %r13
160; CHECK: stg {{.*}}, 8(%r2)
161; CHECK: lmg %r14, %r15, 112(%r15)
162; CHECK: br %r14
163  %l0 = load volatile i64 , i64 *%ptr
164  %l1 = load volatile i64 , i64 *%ptr
165  %l3 = load volatile i64 , i64 *%ptr
166  %l4 = load volatile i64 , i64 *%ptr
167  %l5 = load volatile i64 , i64 *%ptr
168  %l14 = load volatile i64 , i64 *%ptr
169  %add0 = add i64 %l0, %l0
170  %add1 = add i64 %l1, %add0
171  %add3 = add i64 %l3, %add1
172  %add4 = add i64 %l4, %add3
173  %add5 = add i64 %l5, %add4
174  %add14 = add i64 %l14, %add5
175  store volatile i64 %add0, i64 *%ptr
176  store volatile i64 %add1, i64 *%ptr
177  store volatile i64 %add3, i64 *%ptr
178  store volatile i64 %add4, i64 *%ptr
179  store volatile i64 %add5, i64 *%ptr
180  %final = getelementptr i64, i64 *%ptr, i64 1
181  store volatile i64 %add14, i64 *%final
182  ret void
183}
184
185; This function should use all call-clobbered GPRs but no call-saved ones.
186; It shouldn't need to touch the stack at all.
187define void @f4(i64 *%ptr) {
188; CHECK-LABEL: f4:
189; CHECK-NOT: %r15
190; CHECK-NOT: %r6
191; CHECK-NOT: %r7
192; CHECK-NOT: %r8
193; CHECK-NOT: %r9
194; CHECK-NOT: %r10
195; CHECK-NOT: %r11
196; CHECK-NOT: %r12
197; CHECK-NOT: %r13
198; CHECK: br %r14
199  %l0 = load volatile i64 , i64 *%ptr
200  %l1 = load volatile i64 , i64 *%ptr
201  %l3 = load volatile i64 , i64 *%ptr
202  %l4 = load volatile i64 , i64 *%ptr
203  %l5 = load volatile i64 , i64 *%ptr
204  %add0 = add i64 %l0, %l0
205  %add1 = add i64 %l1, %add0
206  %add3 = add i64 %l3, %add1
207  %add4 = add i64 %l4, %add3
208  %add5 = add i64 %l5, %add4
209  store volatile i64 %add0, i64 *%ptr
210  store volatile i64 %add1, i64 *%ptr
211  store volatile i64 %add3, i64 *%ptr
212  store volatile i64 %add4, i64 *%ptr
213  %final = getelementptr i64, i64 *%ptr, i64 1
214  store volatile i64 %add5, i64 *%final
215  ret void
216}
217