1; RUN: llc < %s -mtriple=armv7-apple-darwin | FileCheck %s
2
3; Make sure that we merge the consecutive load/store sequence below and use a
4; word (16 bit) instead of a byte copy.
5; CHECK: MergeLoadStoreBaseIndexOffset
6; CHECK: ldrh    [[REG:r[0-9]+]], [{{.*}}]
7; CHECK: strh    [[REG]], [r1], #2
8define void @MergeLoadStoreBaseIndexOffset(i32* %a, i8* %b, i8* %c, i32 %n) {
9  br label %1
10
11; <label>:1
12  %.09 = phi i32 [ %n, %0 ], [ %11, %1 ]
13  %.08 = phi i8* [ %b, %0 ], [ %10, %1 ]
14  %.0 = phi i32* [ %a, %0 ], [ %2, %1 ]
15  %2 = getelementptr inbounds i32, i32* %.0, i32 1
16  %3 = load i32, i32* %.0, align 1
17  %4 = getelementptr inbounds i8, i8* %c, i32 %3
18  %5 = load i8, i8* %4, align 1
19  %6 = add i32 %3, 1
20  %7 = getelementptr inbounds i8, i8* %c, i32 %6
21  %8 = load i8, i8* %7, align 1
22  store i8 %5, i8* %.08, align 1
23  %9 = getelementptr inbounds i8, i8* %.08, i32 1
24  store i8 %8, i8* %9, align 1
25  %10 = getelementptr inbounds i8, i8* %.08, i32 2
26  %11 = add nsw i32 %.09, -1
27  %12 = icmp eq i32 %11, 0
28  br i1 %12, label %13, label %1
29
30; <label>:13
31  ret void
32}
33
34; Make sure that we merge the consecutive load/store sequence below and use a
35; word (16 bit) instead of a byte copy even if there are intermediate sign
36; extensions.
37; CHECK: MergeLoadStoreBaseIndexOffsetSext
38; CHECK: ldrh    [[REG:r[0-9]+]], [{{.*}}]
39; CHECK: strh    [[REG]], [r1], #2
40define void @MergeLoadStoreBaseIndexOffsetSext(i8* %a, i8* %b, i8* %c, i32 %n) {
41  br label %1
42
43; <label>:1
44  %.09 = phi i32 [ %n, %0 ], [ %12, %1 ]
45  %.08 = phi i8* [ %b, %0 ], [ %11, %1 ]
46  %.0 = phi i8* [ %a, %0 ], [ %2, %1 ]
47  %2 = getelementptr inbounds i8, i8* %.0, i32 1
48  %3 = load i8, i8* %.0, align 1
49  %4 = sext i8 %3 to i32
50  %5 = getelementptr inbounds i8, i8* %c, i32 %4
51  %6 = load i8, i8* %5, align 1
52  %7 = add i32 %4, 1
53  %8 = getelementptr inbounds i8, i8* %c, i32 %7
54  %9 = load i8, i8* %8, align 1
55  store i8 %6, i8* %.08, align 1
56  %10 = getelementptr inbounds i8, i8* %.08, i32 1
57  store i8 %9, i8* %10, align 1
58  %11 = getelementptr inbounds i8, i8* %.08, i32 2
59  %12 = add nsw i32 %.09, -1
60  %13 = icmp eq i32 %12, 0
61  br i1 %13, label %14, label %1
62
63; <label>:14
64  ret void
65}
66
67; However, we can only merge ignore sign extensions when they are on all memory
68; computations;
69; CHECK: loadStoreBaseIndexOffsetSextNoSex
70; CHECK-NOT: ldrh    [[REG:r[0-9]+]], [{{.*}}]
71; CHECK-NOT: strh    [[REG]], [r1], #2
72define void @loadStoreBaseIndexOffsetSextNoSex(i8* %a, i8* %b, i8* %c, i32 %n) {
73  br label %1
74
75; <label>:1
76  %.09 = phi i32 [ %n, %0 ], [ %12, %1 ]
77  %.08 = phi i8* [ %b, %0 ], [ %11, %1 ]
78  %.0 = phi i8* [ %a, %0 ], [ %2, %1 ]
79  %2 = getelementptr inbounds i8, i8* %.0, i32 1
80  %3 = load i8, i8* %.0, align 1
81  %4 = sext i8 %3 to i32
82  %5 = getelementptr inbounds i8, i8* %c, i32 %4
83  %6 = load i8, i8* %5, align 1
84  %7 = add i8 %3, 1
85  %wrap.4 = sext i8 %7 to i32
86  %8 = getelementptr inbounds i8, i8* %c, i32 %wrap.4
87  %9 = load i8, i8* %8, align 1
88  store i8 %6, i8* %.08, align 1
89  %10 = getelementptr inbounds i8, i8* %.08, i32 1
90  store i8 %9, i8* %10, align 1
91  %11 = getelementptr inbounds i8, i8* %.08, i32 2
92  %12 = add nsw i32 %.09, -1
93  %13 = icmp eq i32 %12, 0
94  br i1 %13, label %14, label %1
95
96; <label>:14
97  ret void
98}
99