1; RUN: llc < %s -march=arm -mcpu=cortex-a9 -mattr=+neon,+neonfp -relocation-model=pic
2
3target triple = "armv6-none-linux-gnueabi"
4
5define void @sample_test(i8* %.T0348, i16* nocapture %sourceA, i16* nocapture %destValues) {
6L.entry:
7  %0 = call i32 (...) @get_index(i8* %.T0348, i32 0)
8  %1 = bitcast i16* %destValues to i8*
9  %2 = mul i32 %0, 6
10  %3 = getelementptr i8, i8* %1, i32 %2
11  %4 = bitcast i8* %3 to <3 x i16>*
12  %5 = load <3 x i16>, <3 x i16>* %4, align 1
13  %6 = bitcast i16* %sourceA to i8*
14  %7 = getelementptr i8, i8* %6, i32 %2
15  %8 = bitcast i8* %7 to <3 x i16>*
16  %9 = load <3 x i16>, <3 x i16>* %8, align 1
17  %10 = or <3 x i16> %9, %5
18  store <3 x i16> %10, <3 x i16>* %4, align 1
19  ret void
20}
21
22declare i32 @get_index(...)
23