Lines Matching full:float

24float inreg, i32 inreg, <2 x i32>, <2 x i32>, <2 x i32>, <3 x i32>, <2 x i32>, <2 x i32>, <2 x i32…
28 %23 = call float @llvm.SI.load.const(<16 x i8> %22, i32 96)
29 %24 = call float @llvm.SI.load.const(<16 x i8> %22, i32 100)
30 %25 = call float @llvm.SI.load.const(<16 x i8> %22, i32 104)
31 %26 = call float @llvm.SI.load.const(<16 x i8> %22, i32 112)
32 %27 = call float @llvm.SI.load.const(<16 x i8> %22, i32 116)
33 %28 = call float @llvm.SI.load.const(<16 x i8> %22, i32 120)
34 %29 = call float @llvm.SI.load.const(<16 x i8> %22, i32 128)
35 %30 = call float @llvm.SI.load.const(<16 x i8> %22, i32 132)
36 %31 = call float @llvm.SI.load.const(<16 x i8> %22, i32 140)
37 %32 = call float @llvm.SI.load.const(<16 x i8> %22, i32 144)
38 %33 = call float @llvm.SI.load.const(<16 x i8> %22, i32 160)
39 %34 = call float @llvm.SI.load.const(<16 x i8> %22, i32 176)
40 %35 = call float @llvm.SI.load.const(<16 x i8> %22, i32 180)
41 %36 = call float @llvm.SI.load.const(<16 x i8> %22, i32 184)
42 %37 = call float @llvm.SI.load.const(<16 x i8> %22, i32 192)
43 %38 = call float @llvm.SI.load.const(<16 x i8> %22, i32 196)
44 %39 = call float @llvm.SI.load.const(<16 x i8> %22, i32 200)
45 %40 = call float @llvm.SI.load.const(<16 x i8> %22, i32 208)
46 %41 = call float @llvm.SI.load.const(<16 x i8> %22, i32 212)
47 %42 = call float @llvm.SI.load.const(<16 x i8> %22, i32 216)
48 %43 = call float @llvm.SI.load.const(<16 x i8> %22, i32 224)
49 %44 = call float @llvm.SI.load.const(<16 x i8> %22, i32 240)
50 %45 = call float @llvm.SI.load.const(<16 x i8> %22, i32 244)
51 %46 = call float @llvm.SI.load.const(<16 x i8> %22, i32 248)
52 %47 = call float @llvm.SI.load.const(<16 x i8> %22, i32 256)
53 %48 = call float @llvm.SI.load.const(<16 x i8> %22, i32 272)
54 %49 = call float @llvm.SI.load.const(<16 x i8> %22, i32 276)
55 %50 = call float @llvm.SI.load.const(<16 x i8> %22, i32 280)
56 %51 = call float @llvm.SI.load.const(<16 x i8> %22, i32 288)
57 %52 = call float @llvm.SI.load.const(<16 x i8> %22, i32 292)
58 %53 = call float @llvm.SI.load.const(<16 x i8> %22, i32 296)
59 %54 = call float @llvm.SI.load.const(<16 x i8> %22, i32 304)
60 %55 = call float @llvm.SI.load.const(<16 x i8> %22, i32 308)
61 %56 = call float @llvm.SI.load.const(<16 x i8> %22, i32 312)
62 %57 = call float @llvm.SI.load.const(<16 x i8> %22, i32 368)
63 %58 = call float @llvm.SI.load.const(<16 x i8> %22, i32 372)
64 %59 = call float @llvm.SI.load.const(<16 x i8> %22, i32 376)
65 %60 = call float @llvm.SI.load.const(<16 x i8> %22, i32 384)
98 %93 = call float @llvm.SI.fs.interp(i32 0, i32 0, i32 %4, <2 x i32> %6)
99 %94 = call float @llvm.SI.fs.interp(i32 1, i32 0, i32 %4, <2 x i32> %6)
100 %95 = call float @llvm.SI.fs.interp(i32 0, i32 1, i32 %4, <2 x i32> %6)
101 %96 = call float @llvm.SI.fs.interp(i32 1, i32 1, i32 %4, <2 x i32> %6)
102 %97 = call float @llvm.SI.fs.interp(i32 2, i32 1, i32 %4, <2 x i32> %6)
103 %98 = call float @llvm.SI.fs.interp(i32 0, i32 2, i32 %4, <2 x i32> %6)
104 %99 = call float @llvm.SI.fs.interp(i32 1, i32 2, i32 %4, <2 x i32> %6)
105 %100 = call float @llvm.SI.fs.interp(i32 2, i32 2, i32 %4, <2 x i32> %6)
106 %101 = call float @llvm.SI.fs.interp(i32 0, i32 3, i32 %4, <2 x i32> %6)
107 %102 = call float @llvm.SI.fs.interp(i32 1, i32 3, i32 %4, <2 x i32> %6)
108 %103 = call float @llvm.SI.fs.interp(i32 2, i32 3, i32 %4, <2 x i32> %6)
109 %104 = call float @llvm.SI.fs.interp(i32 0, i32 4, i32 %4, <2 x i32> %6)
110 %105 = call float @llvm.SI.fs.interp(i32 1, i32 4, i32 %4, <2 x i32> %6)
111 %106 = call float @llvm.SI.fs.interp(i32 2, i32 4, i32 %4, <2 x i32> %6)
112 %107 = call float @llvm.SI.fs.interp(i32 0, i32 5, i32 %4, <2 x i32> %6)
113 %108 = call float @llvm.SI.fs.interp(i32 1, i32 5, i32 %4, <2 x i32> %6)
114 %109 = call float @llvm.SI.fs.interp(i32 2, i32 5, i32 %4, <2 x i32> %6)
117 %112 = bitcast float %93 to i32
119 %113 = bitcast float %94 to i32
127 %120 = bitcast float %93 to i32
130 %122 = bitcast i32 %121 to float
132 %124 = bitcast i32 %123 to float
133 %125 = fsub float %124, %122
134 %126 = bitcast float %94 to i32
137 %128 = bitcast i32 %127 to float
139 %130 = bitcast i32 %129 to float
140 %131 = fsub float %130, %128
141 %132 = insertelement <4 x float> undef, float %125, i32 0
142 %133 = insertelement <4 x float> %132, float %131, i32 1
143 %134 = insertelement <4 x float> %133, float %131, i32 2
144 %135 = insertelement <4 x float> %134, float %131, i32 3
145 %136 = extractelement <4 x float> %135, i32 0
146 %137 = extractelement <4 x float> %135, i32 1
147 %138 = fmul float %60, %93
148 %139 = fmul float %60, %94
149 %140 = fmul float %60, %94
150 %141 = fmul float %60, %94
153 %144 = bitcast float %138 to i32
155 %145 = bitcast float %139 to i32
157 %146 = bitcast float %140 to i32
159 %147 = bitcast float %141 to i32
167 %154 = bitcast float %138 to i32
170 %156 = bitcast i32 %155 to float
172 %158 = bitcast i32 %157 to float
173 %159 = fsub float %158, %156
174 %160 = bitcast float %139 to i32
177 %162 = bitcast i32 %161 to float
179 %164 = bitcast i32 %163 to float
180 %165 = fsub float %164, %162
181 %166 = bitcast float %140 to i32
184 %168 = bitcast i32 %167 to float
186 %170 = bitcast i32 %169 to float
187 %171 = fsub float %170, %168
188 %172 = bitcast float %141 to i32
191 %174 = bitcast i32 %173 to float
193 %176 = bitcast i32 %175 to float
194 %177 = fsub float %176, %174
195 %178 = insertelement <4 x float> undef, float %159, i32 0
196 %179 = insertelement <4 x float> %178, float %165, i32 1
197 %180 = insertelement <4 x float> %179, float %171, i32 2
198 %181 = insertelement <4 x float> %180, float %177, i32 3
199 %182 = extractelement <4 x float> %181, i32 0
200 %183 = extractelement <4 x float> %181, i32 1
201 %184 = fdiv float 1.000000e+00, %97
202 %185 = fmul float %33, %184
203 %186 = fcmp uge float 1.000000e+00, %185
204 %187 = select i1 %186, float %185, float 1.000000e+00
205 %188 = fmul float %187, %30
206 %189 = call float @ceil(float %188)
207 %190 = fcmp uge float 3.000000e+00, %189
208 %191 = select i1 %190, float 3.000000e+00, float %189
209 %192 = fdiv float 1.000000e+00, %191
210 %193 = fdiv float 1.000000e+00, %30
211 %194 = fmul float %191, %193
212 %195 = fmul float %31, %194
213 %196 = fmul float %95, %95
214 %197 = fmul float %96, %96
215 %198 = fadd float %197, %196
216 %199 = fmul float %97, %97
217 %200 = fadd float %198, %199
218 %201 = call float @llvm.AMDGPU.rsq.f32(float %200)
219 %202 = fmul float %95, %201
220 %203 = fmul float %96, %201
221 %204 = fmul float %202, %29
222 %205 = fmul float %203, %29
223 %206 = fmul float %204, -1.000000e+00
224 %207 = fmul float %205, 1.000000e+00
225 %208 = fmul float %206, %32
226 %209 = fmul float %207, %32
227 %210 = fsub float -0.000000e+00, %208
228 %211 = fadd float %93, %210
229 %212 = fsub float -0.000000e+00, %209
230 %213 = fadd float %94, %212
231 %214 = fmul float %206, %192
232 %215 = fmul float %207, %192
233 %216 = fmul float -1.000000e+00, %192
234 %217 = bitcast float %136 to i32
235 %218 = bitcast float %182 to i32
236 %219 = bitcast float %137 to i32
237 %220 = bitcast float %183 to i32
245 %temp24.0 = phi float [ 1.000000e+00, %main_body ], [ %258, %ENDIF ]
246 %temp28.0 = phi float [ %211, %main_body ], [ %253, %ENDIF ]
247 %temp29.0 = phi float [ %213, %main_body ], [ %255, %ENDIF ]
248 %temp30.0 = phi float [ 1.000000e+00, %main_body ], [ %257, %ENDIF ]
249 %225 = fcmp oge float %temp24.0, %191
251 %227 = bitcast i32 %226 to float
252 %228 = bitcast float %227 to i32
257 %230 = bitcast float %136 to i32
258 %231 = bitcast float %182 to i32
259 %232 = bitcast float %137 to i32
260 %233 = bitcast float %183 to i32
268 %238 = bitcast float %temp28.0 to i32
269 %239 = bitcast float %temp29.0 to i32
274 …%244 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %243, <32 x i8> %62, <16 x i8> %64, i32 2)
275 %245 = extractelement <4 x float> %244, i32 3
276 %246 = fcmp oge float %temp30.0, %245
278 %248 = bitcast i32 %247 to float
279 %249 = bitcast float %248 to i32
281 %251 = bitcast i32 %250 to float
282 %252 = fmul float %214, %251
283 %253 = fadd float %252, %temp28.0
284 %254 = fmul float %215, %251
285 %255 = fadd float %254, %temp29.0
286 %256 = fmul float %216, %251
287 %257 = fadd float %256, %temp30.0
288 %258 = fadd float %temp24.0, 1.000000e+00
292 %temp24.1 = phi float [ 0.000000e+00, %IF ], [ %610, %ENDIF66 ]
293 %temp28.1 = phi float [ %temp28.0, %IF ], [ %605, %ENDIF66 ]
294 %temp29.1 = phi float [ %temp29.0, %IF ], [ %607, %ENDIF66 ]
295 %temp30.1 = phi float [ %temp30.0, %IF ], [ %609, %ENDIF66 ]
296 %temp32.0 = phi float [ 1.000000e+00, %IF ], [ %611, %ENDIF66 ]
297 %259 = fcmp oge float %temp24.1, %195
299 %261 = bitcast i32 %260 to float
300 %262 = bitcast float %261 to i32
305 %264 = bitcast float %136 to i32
306 %265 = bitcast float %182 to i32
307 %266 = bitcast float %137 to i32
308 %267 = bitcast float %183 to i32
309 %268 = bitcast float %temp28.1 to i32
310 %269 = bitcast float %temp29.1 to i32
319 …%278 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %277, <32 x i8> %66, <16 x i8> %68, i32 2)
320 %279 = extractelement <4 x float> %278, i32 0
321 %280 = extractelement <4 x float> %278, i32 1
322 %281 = extractelement <4 x float> %278, i32 2
323 %282 = extractelement <4 x float> %278, i32 3
324 %283 = fmul float %282, %47
325 %284 = bitcast float %136 to i32
326 %285 = bitcast float %182 to i32
327 %286 = bitcast float %137 to i32
328 %287 = bitcast float %183 to i32
329 %288 = bitcast float %temp28.1 to i32
330 %289 = bitcast float %temp29.1 to i32
339 …%298 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %297, <32 x i8> %82, <16 x i8> %84, i32 2)
340 %299 = extractelement <4 x float> %298, i32 0
341 %300 = extractelement <4 x float> %298, i32 1
342 %301 = extractelement <4 x float> %298, i32 2
343 %302 = bitcast float %136 to i32
344 %303 = bitcast float %182 to i32
345 %304 = bitcast float %137 to i32
346 %305 = bitcast float %183 to i32
347 %306 = bitcast float %temp28.1 to i32
348 %307 = bitcast float %temp29.1 to i32
357 …%316 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %315, <32 x i8> %78, <16 x i8> %80, i32 2)
358 %317 = extractelement <4 x float> %316, i32 0
359 %318 = extractelement <4 x float> %316, i32 1
360 %319 = extractelement <4 x float> %316, i32 2
361 %320 = fmul float %317, %23
362 %321 = fmul float %318, %24
363 %322 = fmul float %319, %25
364 %323 = fmul float %299, %26
365 %324 = fadd float %323, %320
366 %325 = fmul float %300, %27
367 %326 = fadd float %325, %321
368 %327 = fmul float %301, %28
369 %328 = fadd float %327, %322
370 %329 = fadd float %279, %324
371 %330 = fadd float %280, %326
372 %331 = fadd float %281, %328
373 %332 = bitcast float %136 to i32
374 %333 = bitcast float %182 to i32
375 %334 = bitcast float %137 to i32
376 %335 = bitcast float %183 to i32
377 %336 = bitcast float %temp28.1 to i32
378 %337 = bitcast float %temp29.1 to i32
387 …%346 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %345, <32 x i8> %62, <16 x i8> %64, i32 2)
388 %347 = extractelement <4 x float> %346, i32 0
389 %348 = extractelement <4 x float> %346, i32 1
390 %349 = extractelement <4 x float> %346, i32 2
391 %350 = fadd float %347, -5.000000e-01
392 %351 = fadd float %348, -5.000000e-01
393 %352 = fadd float %349, -5.000000e-01
394 %353 = fmul float %350, %350
395 %354 = fmul float %351, %351
396 %355 = fadd float %354, %353
397 %356 = fmul float %352, %352
398 %357 = fadd float %355, %356
399 %358 = call float @llvm.AMDGPU.rsq.f32(float %357)
400 %359 = fmul float %350, %358
401 %360 = fmul float %351, %358
402 %361 = fmul float %352, %358
403 %362 = bitcast float %136 to i32
404 %363 = bitcast float %182 to i32
405 %364 = bitcast float %137 to i32
406 %365 = bitcast float %183 to i32
407 %366 = bitcast float %temp28.1 to i32
408 %367 = bitcast float %temp29.1 to i32
417 …%376 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %375, <32 x i8> %70, <16 x i8> %72, i32 2)
418 %377 = extractelement <4 x float> %376, i32 0
419 %378 = extractelement <4 x float> %376, i32 1
420 %379 = extractelement <4 x float> %376, i32 2
421 %380 = extractelement <4 x float> %376, i32 3
422 %381 = fsub float -0.000000e+00, %95
423 %382 = fsub float -0.000000e+00, %96
424 %383 = fsub float -0.000000e+00, %97
425 %384 = fmul float %359, %381
426 %385 = fmul float %360, %382
427 %386 = fadd float %385, %384
428 %387 = fmul float %361, %383
429 %388 = fadd float %386, %387
430 %389 = fmul float %388, %359
431 %390 = fmul float %388, %360
432 %391 = fmul float %388, %361
433 %392 = fmul float 2.000000e+00, %389
434 %393 = fmul float 2.000000e+00, %390
435 %394 = fmul float 2.000000e+00, %391
436 %395 = fsub float -0.000000e+00, %392
437 %396 = fadd float %381, %395
438 %397 = fsub float -0.000000e+00, %393
439 %398 = fadd float %382, %397
440 %399 = fsub float -0.000000e+00, %394
441 %400 = fadd float %383, %399
442 %401 = fmul float %396, %98
443 %402 = fmul float %396, %99
444 %403 = fmul float %396, %100
445 %404 = fmul float %398, %101
446 %405 = fadd float %404, %401
447 %406 = fmul float %398, %102
448 %407 = fadd float %406, %402
449 %408 = fmul float %398, %103
450 %409 = fadd float %408, %403
451 %410 = fmul float %400, %104
452 %411 = fadd float %410, %405
453 %412 = fmul float %400, %105
454 %413 = fadd float %412, %407
455 %414 = fmul float %400, %106
456 %415 = fadd float %414, %409
457 %416 = bitcast float %136 to i32
458 %417 = bitcast float %182 to i32
459 %418 = bitcast float %137 to i32
460 %419 = bitcast float %183 to i32
461 %420 = bitcast float %temp28.1 to i32
462 %421 = bitcast float %temp29.1 to i32
471 …%430 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %429, <32 x i8> %86, <16 x i8> %88, i32 2)
472 %431 = extractelement <4 x float> %430, i32 0
473 %432 = extractelement <4 x float> %430, i32 1
474 %433 = extractelement <4 x float> %430, i32 2
475 %434 = fmul float %48, %411
476 %435 = fmul float %49, %411
477 %436 = fmul float %50, %411
478 %437 = fmul float %51, %413
479 %438 = fadd float %437, %434
480 %439 = fmul float %52, %413
481 %440 = fadd float %439, %435
482 %441 = fmul float %53, %413
483 %442 = fadd float %441, %436
484 %443 = fmul float %54, %415
485 %444 = fadd float %443, %438
486 %445 = fmul float %55, %415
487 %446 = fadd float %445, %440
488 %447 = fmul float %56, %415
489 %448 = fadd float %447, %442
490 %449 = insertelement <4 x float> undef, float %444, i32 0
491 %450 = insertelement <4 x float> %449, float %446, i32 1
492 %451 = insertelement <4 x float> %450, float %448, i32 2
493 %452 = insertelement <4 x float> %451, float %195, i32 3
494 %453 = call <4 x float> @llvm.AMDGPU.cube(<4 x float> %452)
495 %454 = extractelement <4 x float> %453, i32 0
496 %455 = extractelement <4 x float> %453, i32 1
497 %456 = extractelement <4 x float> %453, i32 2
498 %457 = extractelement <4 x float> %453, i32 3
499 %458 = call float @fabs(float %456)
500 %459 = fdiv float 1.000000e+00, %458
501 %460 = fmul float %454, %459
502 %461 = fadd float %460, 1.500000e+00
503 %462 = fmul float %455, %459
504 %463 = fadd float %462, 1.500000e+00
505 %464 = bitcast float %463 to i32
506 %465 = bitcast float %461 to i32
507 %466 = bitcast float %457 to i32
512 %471 = call <4 x float> @llvm.SI.sample.v4i32(<4 x i32> %470, <32 x i8> %90, <16 x i8> %92, i32 4)
513 %472 = extractelement <4 x float> %471, i32 0
514 %473 = extractelement <4 x float> %471, i32 1
515 %474 = extractelement <4 x float> %471, i32 2
516 %475 = fmul float %431, %472
517 %476 = fadd float %475, %329
518 %477 = fmul float %432, %473
519 %478 = fadd float %477, %330
520 %479 = fmul float %433, %474
521 %480 = fadd float %479, %331
522 %481 = fmul float %107, %107
523 %482 = fmul float %108, %108
524 %483 = fadd float %482, %481
525 %484 = fmul float %109, %109
526 %485 = fadd float %483, %484
527 %486 = call float @llvm.AMDGPU.rsq.f32(float %485)
528 %487 = fmul float %107, %486
529 %488 = fmul float %108, %486
530 %489 = fmul float %109, %486
531 %490 = fmul float %377, %40
532 %491 = fmul float %378, %41
533 %492 = fmul float %379, %42
534 %493 = fmul float %359, %487
535 %494 = fmul float %360, %488
536 %495 = fadd float %494, %493
537 %496 = fmul float %361, %489
538 %497 = fadd float %495, %496
539 %498 = fmul float %497, %359
540 %499 = fmul float %497, %360
541 %500 = fmul float %497, %361
542 %501 = fmul float 2.000000e+00, %498
543 %502 = fmul float 2.000000e+00, %499
544 %503 = fmul float 2.000000e+00, %500
545 %504 = fsub float -0.000000e+00, %501
546 %505 = fadd float %487, %504
547 %506 = fsub float -0.000000e+00, %502
548 %507 = fadd float %488, %506
549 %508 = fsub float -0.000000e+00, %503
550 %509 = fadd float %489, %508
551 %510 = fmul float %95, %95
552 %511 = fmul float %96, %96
553 %512 = fadd float %511, %510
554 %513 = fmul float %97, %97
555 %514 = fadd float %512, %513
556 %515 = call float @llvm.AMDGPU.rsq.f32(float %514)
557 %516 = fmul float %95, %515
558 %517 = fmul float %96, %515
559 %518 = fmul float %97, %515
560 %519 = fmul float %505, %516
561 %520 = fmul float %507, %517
562 %521 = fadd float %520, %519
563 %522 = fmul float %509, %518
564 %523 = fadd float %521, %522
565 %524 = fsub float -0.000000e+00, %523
566 %525 = fcmp uge float %524, 0.000000e+00
567 %526 = select i1 %525, float %524, float 0.000000e+00
568 %527 = fmul float %43, %380
569 %528 = fadd float %527, 1.000000e+00
570 %529 = call float @llvm.pow.f32(float %526, float %528)
571 %530 = fmul float %476, %37
572 %531 = fmul float %478, %38
573 %532 = fmul float %480, %39
574 %533 = fmul float %359, %487
575 %534 = fmul float %360, %488
576 %535 = fadd float %534, %533
577 %536 = fmul float %361, %489
578 %537 = fadd float %535, %536
579 %538 = fcmp uge float %537, 0.000000e+00
580 %539 = select i1 %538, float %537, float 0.000000e+00
581 %540 = fmul float %530, %539
582 %541 = fmul float %531, %539
583 %542 = fmul float %532, %539
584 %543 = fmul float %490, %529
585 %544 = fadd float %543, %540
586 %545 = fmul float %491, %529
587 %546 = fadd float %545, %541
588 %547 = fmul float %492, %529
589 %548 = fadd float %547, %542
590 %549 = fmul float %476, %34
591 %550 = fmul float %478, %35
592 %551 = fmul float %480, %36
593 %552 = fmul float %544, %57
594 %553 = fadd float %552, %549
595 %554 = fmul float %546, %58
596 %555 = fadd float %554, %550
597 %556 = fmul float %548, %59
598 %557 = fadd float %556, %551
599 %558 = bitcast float %136 to i32
600 %559 = bitcast float %182 to i32
601 %560 = bitcast float %137 to i32
602 %561 = bitcast float %183 to i32
603 %562 = bitcast float %temp28.1 to i32
604 %563 = bitcast float %temp29.1 to i32
613 …%572 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %571, <32 x i8> %74, <16 x i8> %76, i32 2)
614 %573 = extractelement <4 x float> %572, i32 0
615 %574 = extractelement <4 x float> %572, i32 1
616 %575 = extractelement <4 x float> %572, i32 2
617 %576 = fmul float %573, %44
618 %577 = fadd float %576, %553
619 %578 = fmul float %574, %45
620 %579 = fadd float %578, %555
621 %580 = fmul float %575, %46
622 %581 = fadd float %580, %557
623 %582 = call i32 @llvm.SI.packf16(float %577, float %579)
624 %583 = bitcast i32 %582 to float
625 %584 = call i32 @llvm.SI.packf16(float %581, float %283)
626 %585 = bitcast i32 %584 to float
627 …oid @llvm.SI.export(i32 15, i32 1, i32 1, i32 0, i32 1, float %583, float %585, float %583, float
631 %586 = bitcast float %temp28.1 to i32
632 %587 = bitcast float %temp29.1 to i32
637 …%592 = call <4 x float> @llvm.SI.sampled.v8i32(<8 x i32> %591, <32 x i8> %62, <16 x i8> %64, i32 2)
638 %593 = extractelement <4 x float> %592, i32 3
639 %594 = fcmp oge float %temp30.1, %593
641 %596 = bitcast i32 %595 to float
642 %597 = bitcast float %596 to i32
644 %599 = bitcast i32 %598 to float
645 %600 = fmul float 5.000000e-01, %temp32.0
646 %601 = fsub float -0.000000e+00, %600
647 %602 = fmul float %599, %temp32.0
648 %603 = fadd float %602, %601
649 %604 = fmul float %214, %603
650 %605 = fadd float %604, %temp28.1
651 %606 = fmul float %215, %603
652 %607 = fadd float %606, %temp29.1
653 %608 = fmul float %216, %603
654 %609 = fadd float %608, %temp30.1
655 %610 = fadd float %temp24.1, 1.000000e+00
656 %611 = fmul float %temp32.0, 5.000000e-01
661 declare float @llvm.SI.load.const(<16 x i8>, i32) #1
664 declare float @llvm.SI.fs.interp(i32, i32, i32, <2 x i32>) #1
670 declare float @ceil(float) #3
673 declare float @llvm.AMDGPU.rsq.f32(float) #2
676 declare <4 x float> @llvm.SI.sampled.v8i32(<8 x i32>, <32 x i8>, <16 x i8>, i32) #1
679 declare <4 x float> @llvm.AMDGPU.cube(<4 x float>) #2
682 declare float @fabs(float) #2
685 declare <4 x float> @llvm.SI.sample.v4i32(<4 x i32>, <32 x i8>, <16 x i8>, i32) #1
688 declare float @llvm.pow.f32(float, float) #4
691 declare i32 @llvm.SI.packf16(float, float) #1
693 declare void @llvm.SI.export(i32, i32, i32, i32, i32, float, float, float, float)
705float inreg, i32 inreg, <2 x i32>, <2 x i32>, <2 x i32>, <3 x i32>, <2 x i32>, <2 x i32>, <2 x i32…
709 %23 = call float @llvm.SI.load.const(<16 x i8> %22, i32 0)
710 %24 = call float @llvm.SI.load.const(<16 x i8> %22, i32 4)
711 %25 = call float @llvm.SI.load.const(<16 x i8> %22, i32 8)
712 %26 = call float @llvm.SI.load.const(<16 x i8> %22, i32 12)
713 %27 = call float @llvm.SI.load.const(<16 x i8> %22, i32 28)
714 %28 = call float @llvm.SI.load.const(<16 x i8> %22, i32 48)
715 %29 = call float @llvm.SI.load.const(<16 x i8> %22, i32 52)
716 %30 = call float @llvm.SI.load.const(<16 x i8> %22, i32 56)
717 %31 = call float @llvm.SI.load.const(<16 x i8> %22, i32 64)
718 %32 = call float @llvm.SI.load.const(<16 x i8> %22, i32 68)
719 %33 = call float @llvm.SI.load.const(<16 x i8> %22, i32 72)
720 %34 = call float @llvm.SI.load.const(<16 x i8> %22, i32 76)
721 %35 = call float @llvm.SI.load.const(<16 x i8> %22, i32 128)
722 %36 = call float @llvm.SI.load.const(<16 x i8> %22, i32 132)
723 %37 = call float @llvm.SI.load.const(<16 x i8> %22, i32 144)
724 %38 = call float @llvm.SI.load.const(<16 x i8> %22, i32 148)
725 %39 = call float @llvm.SI.load.const(<16 x i8> %22, i32 152)
726 %40 = call float @llvm.SI.load.const(<16 x i8> %22, i32 160)
727 %41 = call float @llvm.SI.load.const(<16 x i8> %22, i32 164)
728 %42 = call float @llvm.SI.load.const(<16 x i8> %22, i32 168)
729 %43 = call float @llvm.SI.load.const(<16 x i8> %22, i32 172)
730 %44 = call float @llvm.SI.load.const(<16 x i8> %22, i32 176)
731 %45 = call float @llvm.SI.load.const(<16 x i8> %22, i32 180)
732 %46 = call float @llvm.SI.load.const(<16 x i8> %22, i32 184)
733 %47 = call float @llvm.SI.load.const(<16 x i8> %22, i32 192)
734 %48 = call float @llvm.SI.load.const(<16 x i8> %22, i32 196)
735 %49 = call float @llvm.SI.load.const(<16 x i8> %22, i32 200)
736 %50 = call float @llvm.SI.load.const(<16 x i8> %22, i32 208)
737 %51 = call float @llvm.SI.load.const(<16 x i8> %22, i32 212)
738 %52 = call float @llvm.SI.load.const(<16 x i8> %22, i32 216)
739 %53 = call float @llvm.SI.load.const(<16 x i8> %22, i32 220)
740 %54 = call float @llvm.SI.load.const(<16 x i8> %22, i32 236)
741 %55 = call float @llvm.SI.load.const(<16 x i8> %22, i32 240)
742 %56 = call float @llvm.SI.load.const(<16 x i8> %22, i32 244)
743 %57 = call float @llvm.SI.load.const(<16 x i8> %22, i32 248)
744 %58 = call float @llvm.SI.load.const(<16 x i8> %22, i32 252)
745 %59 = call float @llvm.SI.load.const(<16 x i8> %22, i32 256)
746 %60 = call float @llvm.SI.load.const(<16 x i8> %22, i32 260)
747 %61 = call float @llvm.SI.load.const(<16 x i8> %22, i32 264)
748 %62 = call float @llvm.SI.load.const(<16 x i8> %22, i32 268)
749 %63 = call float @llvm.SI.load.const(<16 x i8> %22, i32 272)
750 %64 = call float @llvm.SI.load.const(<16 x i8> %22, i32 276)
751 %65 = call float @llvm.SI.load.const(<16 x i8> %22, i32 280)
752 %66 = call float @llvm.SI.load.const(<16 x i8> %22, i32 284)
753 %67 = call float @llvm.SI.load.const(<16 x i8> %22, i32 288)
754 %68 = call float @llvm.SI.load.const(<16 x i8> %22, i32 292)
755 %69 = call float @llvm.SI.load.const(<16 x i8> %22, i32 464)
756 %70 = call float @llvm.SI.load.const(<16 x i8> %22, i32 468)
757 %71 = call float @llvm.SI.load.const(<16 x i8> %22, i32 472)
758 %72 = call float @llvm.SI.load.const(<16 x i8> %22, i32 496)
759 %73 = call float @llvm.SI.load.const(<16 x i8> %22, i32 500)
760 %74 = call float @llvm.SI.load.const(<16 x i8> %22, i32 504)
761 %75 = call float @llvm.SI.load.const(<16 x i8> %22, i32 512)
762 %76 = call float @llvm.SI.load.const(<16 x i8> %22, i32 516)
763 %77 = call float @llvm.SI.load.const(<16 x i8> %22, i32 524)
764 %78 = call float @llvm.SI.load.const(<16 x i8> %22, i32 532)
765 %79 = call float @llvm.SI.load.const(<16 x i8> %22, i32 536)
766 %80 = call float @llvm.SI.load.const(<16 x i8> %22, i32 540)
767 %81 = call float @llvm.SI.load.const(<16 x i8> %22, i32 544)
768 %82 = call float @llvm.SI.load.const(<16 x i8> %22, i32 548)
769 %83 = call float @llvm.SI.load.const(<16 x i8> %22, i32 552)
770 %84 = call float @llvm.SI.load.const(<16 x i8> %22, i32 556)
771 %85 = call float @llvm.SI.load.const(<16 x i8> %22, i32 560)
772 %86 = call float @llvm.SI.load.const(<16 x i8> %22, i32 564)
773 %87 = call float @llvm.SI.load.const(<16 x i8> %22, i32 568)
774 %88 = call float @llvm.SI.load.const(<16 x i8> %22, i32 572)
775 %89 = call float @llvm.SI.load.const(<16 x i8> %22, i32 576)
776 %90 = call float @llvm.SI.load.const(<16 x i8> %22, i32 580)
777 %91 = call float @llvm.SI.load.const(<16 x i8> %22, i32 584)
778 %92 = call float @llvm.SI.load.const(<16 x i8> %22, i32 588)
779 %93 = call float @llvm.SI.load.const(<16 x i8> %22, i32 592)
780 %94 = call float @llvm.SI.load.const(<16 x i8> %22, i32 596)
781 %95 = call float @llvm.SI.load.const(<16 x i8> %22, i32 600)
782 %96 = call float @llvm.SI.load.const(<16 x i8> %22, i32 604)
783 %97 = call float @llvm.SI.load.const(<16 x i8> %22, i32 608)
784 %98 = call float @llvm.SI.load.const(<16 x i8> %22, i32 612)
785 %99 = call float @llvm.SI.load.const(<16 x i8> %22, i32 616)
786 %100 = call float @llvm.SI.load.const(<16 x i8> %22, i32 624)
787 %101 = call float @llvm.SI.load.const(<16 x i8> %22, i32 628)
788 %102 = call float @llvm.SI.load.const(<16 x i8> %22, i32 632)
789 %103 = call float @llvm.SI.load.const(<16 x i8> %22, i32 636)
790 %104 = call float @llvm.SI.load.const(<16 x i8> %22, i32 640)
791 %105 = call float @llvm.SI.load.const(<16 x i8> %22, i32 644)
792 %106 = call float @llvm.SI.load.const(<16 x i8> %22, i32 648)
793 %107 = call float @llvm.SI.load.const(<16 x i8> %22, i32 652)
794 %108 = call float @llvm.SI.load.const(<16 x i8> %22, i32 656)
795 %109 = call float @llvm.SI.load.const(<16 x i8> %22, i32 660)
796 %110 = call float @llvm.SI.load.const(<16 x i8> %22, i32 664)
797 %111 = call float @llvm.SI.load.const(<16 x i8> %22, i32 668)
798 %112 = call float @llvm.SI.load.const(<16 x i8> %22, i32 672)
799 %113 = call float @llvm.SI.load.const(<16 x i8> %22, i32 676)
800 %114 = call float @llvm.SI.load.const(<16 x i8> %22, i32 680)
801 %115 = call float @llvm.SI.load.const(<16 x i8> %22, i32 684)
802 %116 = call float @llvm.SI.load.const(<16 x i8> %22, i32 688)
803 %117 = call float @llvm.SI.load.const(<16 x i8> %22, i32 692)
804 %118 = call float @llvm.SI.load.const(<16 x i8> %22, i32 696)
805 %119 = call float @llvm.SI.load.const(<16 x i8> %22, i32 700)
806 %120 = call float @llvm.SI.load.const(<16 x i8> %22, i32 704)
807 %121 = call float @llvm.SI.load.const(<16 x i8> %22, i32 708)
808 %122 = call float @llvm.SI.load.const(<16 x i8> %22, i32 712)
809 %123 = call float @llvm.SI.load.const(<16 x i8> %22, i32 716)
810 %124 = call float @llvm.SI.load.const(<16 x i8> %22, i32 864)
811 %125 = call float @llvm.SI.load.const(<16 x i8> %22, i32 868)
848 %162 = fcmp ugt float %17, 0.000000e+00
849 %163 = select i1 %162, float 1.000000e+00, float 0.000000e+00
850 %164 = call float @llvm.SI.fs.interp(i32 0, i32 0, i32 %4, <2 x i32> %6)
851 %165 = call float @llvm.SI.fs.interp(i32 1, i32 0, i32 %4, <2 x i32> %6)
852 %166 = call float @llvm.SI.fs.interp(i32 2, i32 0, i32 %4, <2 x i32> %6)
853 %167 = call float @llvm.SI.fs.interp(i32 3, i32 0, i32 %4, <2 x i32> %6)
854 %168 = call float @llvm.SI.fs.interp(i32 0, i32 1, i32 %4, <2 x i32> %6)
855 %169 = call float @llvm.SI.fs.interp(i32 1, i32 1, i32 %4, <2 x i32> %6)
856 %170 = call float @llvm.SI.fs.interp(i32 2, i32 1, i32 %4, <2 x i32> %6)
857 %171 = call float @llvm.SI.fs.interp(i32 3, i32 1, i32 %4, <2 x i32> %6)
858 %172 = call float @llvm.SI.fs.interp(i32 0, i32 2, i32 %4, <2 x i32> %6)
859 %173 = call float @llvm.SI.fs.interp(i32 1, i32 2, i32 %4, <2 x i32> %6)
860 %174 = call float @llvm.SI.fs.interp(i32 2, i32 2, i32 %4, <2 x i32> %6)
861 %175 = call float @llvm.SI.fs.interp(i32 3, i32 2, i32 %4, <2 x i32> %6)
862 %176 = call float @llvm.SI.fs.interp(i32 0, i32 3, i32 %4, <2 x i32> %6)
863 %177 = call float @llvm.SI.fs.interp(i32 1, i32 3, i32 %4, <2 x i32> %6)
864 %178 = call float @llvm.SI.fs.interp(i32 2, i32 3, i32 %4, <2 x i32> %6)
865 %179 = call float @llvm.SI.fs.interp(i32 3, i32 3, i32 %4, <2 x i32> %6)
866 %180 = call float @llvm.SI.fs.interp(i32 0, i32 4, i32 %4, <2 x i32> %6)
867 %181 = call float @llvm.SI.fs.interp(i32 1, i32 4, i32 %4, <2 x i32> %6)
868 %182 = call float @llvm.SI.fs.interp(i32 2, i32 4, i32 %4, <2 x i32> %6)
869 %183 = call float @llvm.SI.fs.interp(i32 3, i32 4, i32 %4, <2 x i32> %6)
870 %184 = call float @llvm.SI.fs.interp(i32 0, i32 5, i32 %4, <2 x i32> %6)
871 %185 = call float @llvm.SI.fs.interp(i32 1, i32 5, i32 %4, <2 x i32> %6)
872 %186 = call float @llvm.SI.fs.interp(i32 2, i32 5, i32 %4, <2 x i32> %6)
873 %187 = call float @llvm.SI.fs.interp(i32 3, i32 5, i32 %4, <2 x i32> %6)
874 %188 = call float @llvm.SI.fs.interp(i32 0, i32 6, i32 %4, <2 x i32> %6)
875 %189 = call float @llvm.SI.fs.interp(i32 1, i32 6, i32 %4, <2 x i32> %6)
876 %190 = call float @llvm.SI.fs.interp(i32 2, i32 6, i32 %4, <2 x i32> %6)
877 %191 = call float @llvm.SI.fs.interp(i32 3, i32 6, i32 %4, <2 x i32> %6)
878 %192 = call float @llvm.SI.fs.interp(i32 0, i32 7, i32 %4, <2 x i32> %6)
879 %193 = call float @llvm.SI.fs.interp(i32 1, i32 7, i32 %4, <2 x i32> %6)
880 %194 = call float @llvm.SI.fs.interp(i32 2, i32 7, i32 %4, <2 x i32> %6)
881 %195 = call float @llvm.SI.fs.interp(i32 3, i32 7, i32 %4, <2 x i32> %6)
882 %196 = fmul float %14, %124
883 %197 = fadd float %196, %125
884 %198 = call float @llvm.AMDIL.clamp.(float %163, float 0.000000e+00, float 1.000000e+00)
885 %199 = call float @llvm.AMDIL.clamp.(float 0.000000e+00, float 0.000000e+00, float 1.000000e+00)
886 %200 = call float @llvm.AMDIL.clamp.(float 0.000000e+00, float 0.000000e+00, float 1.000000e+00)
887 %201 = call float @llvm.AMDIL.clamp.(float 1.000000e+00, float 0.000000e+00, float 1.000000e+00)
888 %202 = bitcast float %198 to i32
890 %. = select i1 %203, float -1.000000e+00, float 1.000000e+00
891 %204 = fsub float -0.000000e+00, %164
892 %205 = fadd float %44, %204
893 %206 = fsub float -0.000000e+00, %165
894 %207 = fadd float %45, %206
895 %208 = fsub float -0.000000e+00, %166
896 %209 = fadd float %46, %208
897 %210 = fmul float %205, %205
898 %211 = fmul float %207, %207
899 %212 = fadd float %211, %210
900 %213 = fmul float %209, %209
901 %214 = fadd float %212, %213
902 %215 = call float @llvm.AMDGPU.rsq.f32(float %214)
903 %216 = fmul float %205, %215
904 %217 = fmul float %207, %215
905 %218 = fmul float %209, %215
906 %219 = fmul float %., %54
907 %220 = fmul float %13, %47
908 %221 = fmul float %197, %48
909 %222 = bitcast float %174 to i32
910 %223 = bitcast float %175 to i32
913 …%226 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %225, <32 x i8> %131, <16 x i8> %133, i32 …
914 %227 = extractelement <4 x float> %226, i32 0
915 %228 = extractelement <4 x float> %226, i32 1
916 %229 = extractelement <4 x float> %226, i32 2
917 %230 = extractelement <4 x float> %226, i32 3
918 %231 = fmul float %227, 0x4012611180000000
919 %232 = fmul float %228, 0x4012611180000000
920 %233 = fmul float %229, 0x4012611180000000
921 %234 = call float @llvm.AMDGPU.lrp(float %27, float %231, float 1.000000e+00)
922 %235 = call float @llvm.AMDGPU.lrp(float %27, float %232, float 1.000000e+00)
923 %236 = call float @llvm.AMDGPU.lrp(float %27, float %233, float 1.000000e+00)
924 %237 = fmul float %216, %184
925 %238 = fmul float %217, %185
926 %239 = fadd float %238, %237
927 %240 = fmul float %218, %186
928 %241 = fadd float %239, %240
929 %242 = fmul float %216, %187
930 %243 = fmul float %217, %188
931 %244 = fadd float %243, %242
932 %245 = fmul float %218, %189
933 %246 = fadd float %244, %245
934 %247 = fmul float %216, %190
935 %248 = fmul float %217, %191
936 %249 = fadd float %248, %247
937 %250 = fmul float %218, %192
938 %251 = fadd float %249, %250
939 %252 = call float @llvm.AMDIL.clamp.(float %251, float 0.000000e+00, float 1.000000e+00)
940 %253 = fmul float %214, 0x3F5A36E2E0000000
941 %254 = call float @llvm.AMDIL.clamp.(float %253, float 0.000000e+00, float 1.000000e+00)
942 %255 = fsub float -0.000000e+00, %254
943 %256 = fadd float 1.000000e+00, %255
944 %257 = call float @llvm.pow.f32(float %252, float 2.500000e-01)
945 %258 = fmul float %39, %257
946 %259 = fmul float %241, %258
947 %260 = fmul float %246, %258
948 %261 = fmul float %259, %230
949 %262 = fmul float %260, %230
950 %263 = fadd float %252, 0x3EE4F8B580000000
951 %264 = fsub float -0.000000e+00, %252
952 %265 = fadd float 1.000000e+00, %264
953 %266 = fmul float 1.200000e+01, %265
954 %267 = fadd float %266, 4.000000e+00
955 %268 = fsub float -0.000000e+00, %267
956 %269 = fmul float %268, %263
957 %270 = fsub float -0.000000e+00, %267
958 %271 = fmul float %270, %263
959 %272 = fsub float -0.000000e+00, %267
960 %273 = fmul float %272, %263
961 %274 = fdiv float 1.000000e+00, %269
962 %275 = fdiv float 1.000000e+00, %271
963 %276 = fdiv float 1.000000e+00, %273
964 %277 = fmul float %261, %274
965 %278 = fmul float %262, %275
966 %279 = fmul float %263, %276
970 %temp144.0 = phi float [ 1.000000e+00, %main_body ], [ %292, %LOOP ]
971 %temp168.0 = phi float [ %176, %main_body ], [ %288, %LOOP ]
972 %temp169.0 = phi float [ %177, %main_body ], [ %289, %LOOP ]
973 %temp170.0 = phi float [ %256, %main_body ], [ %290, %LOOP ]
974 %280 = bitcast float %temp168.0 to i32
975 %281 = bitcast float %temp169.0 to i32
980 …%286 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %285, <32 x i8> %147, <16 x i8> %149, i32…
981 %287 = extractelement <4 x float> %286, i32 3
982 %288 = fadd float %temp168.0, %277
983 %289 = fadd float %temp169.0, %278
984 %290 = fadd float %temp170.0, %279
985 %291 = fsub float -0.000000e+00, %287
986 %292 = fadd float %290, %291
987 %293 = fcmp oge float 0.000000e+00, %292
989 %295 = bitcast i32 %294 to float
990 %296 = bitcast float %295 to i32
995 %298 = extractelement <4 x float> %286, i32 0
996 %299 = extractelement <4 x float> %286, i32 1
997 %300 = extractelement <4 x float> %286, i32 2
998 %301 = fsub float -0.000000e+00, %292
999 %302 = fadd float %temp144.0, %301
1000 %303 = fdiv float 1.000000e+00, %302
1001 %304 = fmul float %292, %303
1002 %305 = fadd float %304, -1.000000e+00
1003 %306 = fmul float %305, %277
1004 %307 = fadd float %306, %288
1005 %308 = fmul float %305, %278
1006 %309 = fadd float %308, %289
1007 %310 = fsub float -0.000000e+00, %176
1008 %311 = fadd float %307, %310
1009 %312 = fsub float -0.000000e+00, %177
1010 %313 = fadd float %309, %312
1011 %314 = fadd float %176, %311
1012 %315 = fadd float %177, %313
1013 %316 = fmul float %311, %67
1014 %317 = fmul float %313, %68
1015 %318 = fmul float %316, %55
1016 %319 = fmul float %316, %56
1017 %320 = fmul float %317, %57
1018 %321 = fadd float %320, %318
1019 %322 = fmul float %317, %58
1020 %323 = fadd float %322, %319
1021 %324 = fadd float %178, %321
1022 %325 = fadd float %179, %323
1023 %326 = fmul float %316, %59
1024 %327 = fmul float %316, %60
1025 %328 = fmul float %316, %61
1026 %329 = fmul float %316, %62
1027 %330 = fmul float %317, %63
1028 %331 = fadd float %330, %326
1029 %332 = fmul float %317, %64
1030 %333 = fadd float %332, %327
1031 %334 = fmul float %317, %65
1032 %335 = fadd float %334, %328
1033 %336 = fmul float %317, %66
1034 %337 = fadd float %336, %329
1035 %338 = fadd float %168, %331
1036 %339 = fadd float %169, %333
1037 %340 = fadd float %170, %335
1038 %341 = fadd float %171, %337
1039 %342 = bitcast float %338 to i32
1040 %343 = bitcast float %339 to i32
1043 …%346 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %345, <32 x i8> %135, <16 x i8> %137, i32 …
1044 %347 = extractelement <4 x float> %346, i32 0
1045 %348 = extractelement <4 x float> %346, i32 1
1046 %349 = extractelement <4 x float> %346, i32 2
1047 %350 = extractelement <4 x float> %346, i32 3
1048 %351 = fmul float %347, %23
1049 %352 = fmul float %348, %24
1050 %353 = fmul float %349, %25
1051 %354 = fmul float %350, %26
1052 %355 = fmul float %351, %180
1053 %356 = fmul float %352, %181
1054 %357 = fmul float %353, %182
1055 %358 = fmul float %354, %183
1056 %359 = fsub float -0.000000e+00, %350
1057 %360 = fadd float 1.000000e+00, %359
1058 %361 = fmul float %360, %49
1059 %362 = call float @llvm.AMDGPU.lrp(float %361, float %347, float %355)
1060 %363 = call float @llvm.AMDGPU.lrp(float %361, float %348, float %356)
1061 %364 = call float @llvm.AMDGPU.lrp(float %361, float %349, float %357)
1062 %365 = bitcast float %340 to i32
1063 %366 = bitcast float %341 to i32
1066 …%369 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %368, <32 x i8> %151, <16 x i8> %153, i32 …
1067 %370 = extractelement <4 x float> %369, i32 2
1068 %371 = fmul float %362, %234
1069 %372 = fmul float %363, %235
1070 %373 = fmul float %364, %236
1071 %374 = fmul float %358, %230
1072 %375 = bitcast float %314 to i32
1073 %376 = bitcast float %315 to i32
1076 …%379 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %378, <32 x i8> %139, <16 x i8> %141, i32 …
1077 %380 = extractelement <4 x float> %379, i32 0
1078 %381 = extractelement <4 x float> %379, i32 1
1079 %382 = extractelement <4 x float> %379, i32 2
1080 %383 = extractelement <4 x float> %379, i32 3
1081 %384 = fcmp olt float 0.000000e+00, %382
1083 %386 = bitcast i32 %385 to float
1084 %387 = bitcast float %386 to i32
1086 %.224 = select i1 %388, float %381, float %380
1087 %.225 = select i1 %388, float %383, float %381
1088 %389 = bitcast float %324 to i32
1089 %390 = bitcast float %325 to i32
1092 …%393 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %392, <32 x i8> %143, <16 x i8> %145, i32 …
1093 %394 = extractelement <4 x float> %393, i32 0
1094 %395 = extractelement <4 x float> %393, i32 1
1095 %396 = extractelement <4 x float> %393, i32 2
1096 %397 = extractelement <4 x float> %393, i32 3
1097 %398 = fcmp olt float 0.000000e+00, %396
1099 %400 = bitcast i32 %399 to float
1100 %401 = bitcast float %400 to i32
1102 %temp112.1 = select i1 %402, float %395, float %394
1103 %temp113.1 = select i1 %402, float %397, float %395
1104 %403 = fmul float %.224, 2.000000e+00
1105 %404 = fadd float %403, -1.000000e+00
1106 %405 = fmul float %.225, 2.000000e+00
1107 %406 = fadd float %405, -1.000000e+00
1108 %407 = fmul float %temp112.1, 2.000000e+00
1109 %408 = fadd float %407, -1.000000e+00
1110 %409 = fmul float %temp113.1, 2.000000e+00
1111 %410 = fadd float %409, -1.000000e+00
1112 %411 = fsub float -0.000000e+00, %404
1113 %412 = fmul float %411, %35
1114 %413 = fsub float -0.000000e+00, %406
1115 %414 = fmul float %413, %35
1116 %415 = fsub float -0.000000e+00, %408
1117 %416 = fmul float %415, %36
1118 %417 = fsub float -0.000000e+00, %410
1119 %418 = fmul float %417, %36
1120 %419 = fmul float %416, %370
1121 %420 = fmul float %418, %370
1122 %421 = call float @fabs(float %412)
1123 %422 = call float @fabs(float %414)
1124 %423 = fsub float -0.000000e+00, %421
1125 %424 = fadd float 1.000000e+00, %423
1126 %425 = fsub float -0.000000e+00, %422
1127 %426 = fadd float 1.000000e+00, %425
1128 %427 = fmul float %424, %419
1129 %428 = fadd float %427, %412
1130 %429 = fmul float %426, %420
1131 %430 = fadd float %429, %414
1132 %431 = fmul float %428, %428
1133 %432 = fmul float %430, %430
1134 %433 = fadd float %431, %432
1135 %434 = fsub float -0.000000e+00, %433
1136 %435 = fadd float 0x3FF00068E0000000, %434
1137 %436 = call float @llvm.AMDIL.clamp.(float %435, float 0.000000e+00, float 1.000000e+00)
1138 %437 = call float @llvm.AMDGPU.rsq.f32(float %436)
1139 %438 = fmul float %437, %436
1140 %439 = fsub float -0.000000e+00, %436
1141 %440 = call float @llvm.AMDGPU.cndlt(float %439, float %438, float 0.000000e+00)
1142 %441 = fmul float %184, %428
1143 %442 = fmul float %185, %428
1144 %443 = fmul float %186, %428
1145 %444 = fmul float %187, %430
1146 %445 = fadd float %444, %441
1147 %446 = fmul float %188, %430
1148 %447 = fadd float %446, %442
1149 %448 = fmul float %189, %430
1150 %449 = fadd float %448, %443
1151 %450 = fmul float %190, %440
1152 %451 = fadd float %450, %445
1153 %452 = fmul float %191, %440
1154 %453 = fadd float %452, %447
1155 %454 = fmul float %192, %440
1156 %455 = fadd float %454, %449
1157 %456 = fmul float %451, %451
1158 %457 = fmul float %453, %453
1159 %458 = fadd float %457, %456
1160 %459 = fmul float %455, %455
1161 %460 = fadd float %458, %459
1162 %461 = call float @llvm.AMDGPU.rsq.f32(float %460)
1163 %462 = fmul float %451, %461
1164 %463 = fmul float %453, %461
1165 %464 = fmul float %455, %461
1166 %465 = fcmp olt float 0.000000e+00, %219
1168 %467 = bitcast i32 %466 to float
1169 %468 = bitcast float %467 to i32
1174 %470 = fsub float -0.000000e+00, %462
1175 %471 = fsub float -0.000000e+00, %463
1176 %472 = fsub float -0.000000e+00, %464
1180 %temp14.0 = phi float [ %472, %IF198 ], [ %464, %IF189 ]
1181 %temp13.0 = phi float [ %471, %IF198 ], [ %463, %IF189 ]
1182 %temp12.0 = phi float [ %470, %IF198 ], [ %462, %IF189 ]
1183 %473 = bitcast float %220 to i32
1184 %474 = bitcast float %221 to i32
1187 …%477 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %476, <32 x i8> %159, <16 x i8> %161, i32 …
1188 %478 = extractelement <4 x float> %477, i32 0
1189 %479 = extractelement <4 x float> %477, i32 1
1190 %480 = extractelement <4 x float> %477, i32 2
1191 %481 = extractelement <4 x float> %477, i32 3
1192 %482 = fmul float %478, %40
1193 %483 = fadd float %482, %41
1194 %484 = fmul float %479, %40
1195 %485 = fadd float %484, %41
1196 %486 = fmul float %480, %40
1197 %487 = fadd float %486, %41
1198 %488 = fmul float %481, %42
1199 %489 = fadd float %488, %43
1200 %490 = bitcast float %172 to i32
1201 %491 = bitcast float %173 to i32
1204 …%494 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %493, <32 x i8> %155, <16 x i8> %157, i32 …
1205 %495 = extractelement <4 x float> %494, i32 0
1206 %496 = extractelement <4 x float> %494, i32 1
1207 %497 = extractelement <4 x float> %494, i32 2
1208 %498 = extractelement <4 x float> %494, i32 3
1209 %499 = fmul float %498, 3.200000e+01
1210 %500 = fadd float %499, -1.600000e+01
1211 %501 = call float @llvm.AMDIL.exp.(float %500)
1212 %502 = fmul float %495, %501
1213 %503 = fmul float %496, %501
1214 %504 = fmul float %497, %501
1215 %505 = fmul float %28, %502
1216 %506 = fadd float %505, %193
1217 %507 = fmul float %29, %503
1218 %508 = fadd float %507, %194
1219 %509 = fmul float %30, %504
1220 %510 = fadd float %509, %195
1221 %511 = fmul float %506, %489
1222 %512 = fmul float %508, %489
1223 %513 = fmul float %510, %489
1224 %514 = fmul float %489, 5.000000e-01
1225 %515 = fadd float %514, 5.000000e-01
1226 %516 = fmul float %483, %515
1227 %517 = fadd float %516, %511
1228 %518 = fmul float %485, %515
1229 %519 = fadd float %518, %512
1230 %520 = fmul float %487, %515
1231 %521 = fadd float %520, %513
1232 %522 = fmul float %517, %371
1233 %523 = fmul float %519, %372
1234 %524 = fmul float %521, %373
1235 %525 = fmul float %428, 0x3FDB272440000000
1236 %526 = fmul float %430, 0xBFDB272440000000
1237 %527 = fadd float %526, %525
1238 %528 = fmul float %440, 0x3FE99999A0000000
1239 %529 = fadd float %527, %528
1240 %530 = fmul float %529, 5.000000e-01
1241 %531 = fadd float %530, 0x3FE3333340000000
1242 %532 = fmul float %531, %531
1243 %533 = fmul float %522, %532
1244 %534 = fmul float %523, %532
1245 %535 = fmul float %524, %532
1246 %536 = fsub float -0.000000e+00, %72
1247 %537 = fsub float -0.000000e+00, %73
1248 %538 = fsub float -0.000000e+00, %74
1249 %539 = fmul float %temp12.0, %536
1250 %540 = fmul float %temp13.0, %537
1251 %541 = fadd float %540, %539
1252 %542 = fmul float %temp14.0, %538
1253 %543 = fadd float %541, %542
1254 %544 = call float @llvm.AMDIL.clamp.(float %543, float 0.000000e+00, float 1.000000e+00)
1255 %545 = fmul float %371, %544
1256 %546 = fmul float %372, %544
1257 %547 = fmul float %373, %544
1258 %548 = fmul float %545, %69
1259 %549 = fmul float %546, %70
1260 %550 = fmul float %547, %71
1261 %551 = fsub float -0.000000e+00, %164
1262 %552 = fadd float %97, %551
1263 %553 = fsub float -0.000000e+00, %165
1264 %554 = fadd float %98, %553
1265 %555 = fsub float -0.000000e+00, %166
1266 %556 = fadd float %99, %555
1267 %557 = fmul float %552, %552
1268 %558 = fmul float %554, %554
1269 %559 = fadd float %558, %557
1270 %560 = fmul float %556, %556
1271 %561 = fadd float %559, %560
1272 %562 = call float @llvm.AMDGPU.rsq.f32(float %561)
1273 %563 = fmul float %562, %561
1274 %564 = fsub float -0.000000e+00, %561
1275 %565 = call float @llvm.AMDGPU.cndlt(float %564, float %563, float 0.000000e+00)
1276 %566 = fsub float -0.000000e+00, %84
1277 %567 = fadd float %565, %566
1278 %568 = fsub float -0.000000e+00, %83
1279 %569 = fadd float %565, %568
1280 %570 = fsub float -0.000000e+00, %82
1281 %571 = fadd float %565, %570
1282 %572 = fsub float -0.000000e+00, %84
1283 %573 = fadd float %83, %572
1284 %574 = fsub float -0.000000e+00, %83
1285 %575 = fadd float %82, %574
1286 %576 = fsub float -0.000000e+00, %82
1287 %577 = fadd float %81, %576
1288 %578 = fdiv float 1.000000e+00, %573
1289 %579 = fdiv float 1.000000e+00, %575
1290 %580 = fdiv float 1.000000e+00, %577
1291 %581 = fmul float %567, %578
1292 %582 = fmul float %569, %579
1293 %583 = fmul float %571, %580
1294 %584 = fcmp olt float %565, %83
1296 %586 = bitcast i32 %585 to float
1297 %587 = bitcast float %586 to i32
1302 %589 = fcmp olt float %565, %82
1304 %591 = bitcast i32 %590 to float
1305 %592 = bitcast float %591 to i32
1310 %temp80.0 = phi float [ %581, %ENDIF197 ], [ %.226, %ELSE205 ], [ %582, %ELSE202 ]
1311 %temp88.0 = phi float [ %122, %ENDIF197 ], [ %.227, %ELSE205 ], [ %120, %ELSE202 ]
1312 %temp89.0 = phi float [ %123, %ENDIF197 ], [ %.228, %ELSE205 ], [ %121, %ELSE202 ]
1313 %temp90.0 = phi float [ %120, %ENDIF197 ], [ %116, %ELSE205 ], [ %118, %ELSE202 ]
1314 %temp91.0 = phi float [ %121, %ENDIF197 ], [ %117, %ELSE205 ], [ %119, %ELSE202 ]
1315 %594 = fcmp olt float %565, %83
1317 %596 = bitcast i32 %595 to float
1318 %597 = bitcast float %596 to i32
1323 %599 = fcmp olt float %565, %81
1325 %601 = bitcast i32 %600 to float
1326 %602 = bitcast float %601 to i32
1328 %.226 = select i1 %603, float %583, float 1.000000e+00
1329 %.227 = select i1 %603, float %118, float %116
1330 %.228 = select i1 %603, float %119, float %117
1334 %604 = fcmp olt float %565, %82
1336 %606 = bitcast i32 %605 to float
1337 %607 = bitcast float %606 to i32
1342 %temp52.0 = phi float [ %108, %ENDIF200 ], [ %100, %ELSE214 ], [ %104, %ELSE211 ]
1343 %temp53.0 = phi float [ %109, %ENDIF200 ], [ %101, %ELSE214 ], [ %105, %ELSE211 ]
1344 %temp54.0 = phi float [ %110, %ENDIF200 ], [ %102, %ELSE214 ], [ %106, %ELSE211 ]
1345 %temp55.0 = phi float [ %111, %ENDIF200 ], [ %103, %ELSE214 ], [ %107, %ELSE211 ]
1346 %temp68.0 = phi float [ %112, %ENDIF200 ], [ %.230, %ELSE214 ], [ %108, %ELSE211 ]
1347 %temp69.0 = phi float [ %113, %ENDIF200 ], [ %.231, %ELSE214 ], [ %109, %ELSE211 ]
1348 %temp70.0 = phi float [ %114, %ENDIF200 ], [ %.232, %ELSE214 ], [ %110, %ELSE211 ]
1349 %temp71.0 = phi float [ %115, %ENDIF200 ], [ %.233, %ELSE214 ], [ %111, %ELSE211 ]
1350 %609 = fmul float %164, %85
1351 %610 = fmul float %165, %86
1352 %611 = fadd float %609, %610
1353 %612 = fmul float %166, %87
1354 %613 = fadd float %611, %612
1355 %614 = fmul float %167, %88
1356 %615 = fadd float %613, %614
1357 %616 = fmul float %164, %89
1358 %617 = fmul float %165, %90
1359 %618 = fadd float %616, %617
1360 %619 = fmul float %166, %91
1361 %620 = fadd float %618, %619
1362 %621 = fmul float %167, %92
1363 %622 = fadd float %620, %621
1364 %623 = fmul float %164, %93
1365 %624 = fmul float %165, %94
1366 %625 = fadd float %623, %624
1367 %626 = fmul float %166, %95
1368 %627 = fadd float %625, %626
1369 %628 = fmul float %167, %96
1370 %629 = fadd float %627, %628
1371 %630 = fsub float -0.000000e+00, %78
1372 %631 = fadd float 1.000000e+00, %630
1373 %632 = call float @fabs(float %615)
1374 %633 = call float @fabs(float %622)
1375 %634 = fcmp oge float %631, %632
1377 %636 = bitcast i32 %635 to float
1378 %637 = bitcast float %636 to i32
1380 %639 = bitcast i32 %638 to float
1381 %640 = fcmp oge float %631, %633
1383 %642 = bitcast i32 %641 to float
1384 %643 = bitcast float %642 to i32
1386 %645 = bitcast i32 %644 to float
1387 %646 = fmul float %639, %645
1388 %647 = fmul float %629, %646
1389 %648 = fmul float %615, %temp68.0
1390 %649 = fadd float %648, %temp70.0
1391 %650 = fmul float %622, %temp69.0
1392 %651 = fadd float %650, %temp71.0
1393 %652 = fmul float %615, %temp52.0
1394 %653 = fadd float %652, %temp54.0
1395 %654 = fmul float %622, %temp53.0
1396 %655 = fadd float %654, %temp55.0
1397 %656 = fadd float %temp80.0, -1.000000e+00
1398 %657 = fmul float %656, %77
1399 %658 = fadd float %657, 1.000000e+00
1400 %659 = call float @llvm.AMDIL.clamp.(float %658, float 0.000000e+00, float 1.000000e+00)
1401 %660 = bitcast float %649 to i32
1402 %661 = bitcast float %651 to i32
1403 %662 = bitcast float 0.000000e+00 to i32
1408 …%667 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %666, <32 x i8> %127, <16 x i8> %129, i32…
1409 %668 = extractelement <4 x float> %667, i32 0
1410 %669 = extractelement <4 x float> %667, i32 1
1411 %670 = bitcast float %653 to i32
1412 %671 = bitcast float %655 to i32
1413 %672 = bitcast float 0.000000e+00 to i32
1418 …%677 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %676, <32 x i8> %127, <16 x i8> %129, i32…
1419 %678 = extractelement <4 x float> %677, i32 0
1420 %679 = extractelement <4 x float> %677, i32 1
1421 %680 = fsub float -0.000000e+00, %669
1422 %681 = fadd float 1.000000e+00, %680
1423 %682 = fsub float -0.000000e+00, %679
1424 %683 = fadd float 1.000000e+00, %682
1425 %684 = fmul float %681, 2.500000e-01
1426 %685 = fmul float %683, 2.500000e-01
1427 %686 = fsub float -0.000000e+00, %684
1428 %687 = fadd float %668, %686
1429 %688 = fsub float -0.000000e+00, %685
1430 %689 = fadd float %678, %688
1431 %690 = fmul float %647, %temp88.0
1432 %691 = fadd float %690, %temp89.0
1433 %692 = fmul float %647, %temp90.0
1434 %693 = fadd float %692, %temp91.0
1435 %694 = call float @llvm.AMDIL.clamp.(float %691, float 0.000000e+00, float 1.000000e+00)
1436 %695 = call float @llvm.AMDIL.clamp.(float %693, float 0.000000e+00, float 1.000000e+00)
1437 %696 = fsub float -0.000000e+00, %694
1438 %697 = fadd float %668, %696
1439 %698 = fsub float -0.000000e+00, %695
1440 %699 = fadd float %678, %698
1441 %700 = fmul float %668, %668
1442 %701 = fmul float %678, %678
1443 %702 = fsub float -0.000000e+00, %700
1444 %703 = fadd float %687, %702
1445 %704 = fsub float -0.000000e+00, %701
1446 %705 = fadd float %689, %704
1447 %706 = fcmp uge float %703, %75
1448 %707 = select i1 %706, float %703, float %75
1449 %708 = fcmp uge float %705, %75
1450 %709 = select i1 %708, float %705, float %75
1451 %710 = fmul float %697, %697
1452 %711 = fadd float %710, %707
1453 %712 = fmul float %699, %699
1454 %713 = fadd float %712, %709
1455 %714 = fdiv float 1.000000e+00, %711
1456 %715 = fdiv float 1.000000e+00, %713
1457 %716 = fmul float %707, %714
1458 %717 = fmul float %709, %715
1459 %718 = fcmp oge float %697, 0.000000e+00
1461 %720 = bitcast i32 %719 to float
1462 %721 = bitcast float %720 to i32
1464 %.229 = select i1 %722, float 1.000000e+00, float %716
1465 %723 = fcmp oge float %699, 0.000000e+00
1467 %725 = bitcast i32 %724 to float
1468 %726 = bitcast float %725 to i32
1470 %temp28.0 = select i1 %727, float 1.000000e+00, float %717
1471 %728 = call float @llvm.AMDGPU.lrp(float %659, float %temp28.0, float %.229)
1472 %729 = call float @llvm.pow.f32(float %728, float %76)
1473 %730 = fmul float %729, %79
1474 %731 = fadd float %730, %80
1475 %732 = call float @llvm.AMDIL.clamp.(float %731, float 0.000000e+00, float 1.000000e+00)
1476 %733 = fmul float %732, %732
1477 %734 = fmul float 2.000000e+00, %732
1478 %735 = fsub float -0.000000e+00, %734
1479 %736 = fadd float 3.000000e+00, %735
1480 %737 = fmul float %733, %736
1481 %738 = fmul float %548, %737
1482 %739 = fmul float %549, %737
1483 %740 = fmul float %550, %737
1484 %741 = fmul float %738, %515
1485 %742 = fadd float %741, %533
1486 %743 = fmul float %739, %515
1487 %744 = fadd float %743, %534
1488 %745 = fmul float %740, %515
1489 %746 = fadd float %745, %535
1490 %747 = call float @llvm.AMDGPU.lrp(float %230, float %287, float 1.000000e+00)
1491 %748 = call float @llvm.AMDGPU.lrp(float %37, float %298, float 1.000000e+00)
1492 %749 = call float @llvm.AMDGPU.lrp(float %37, float %299, float 1.000000e+00)
1493 %750 = call float @llvm.AMDGPU.lrp(float %37, float %300, float 1.000000e+00)
1494 %751 = call float @llvm.AMDGPU.lrp(float %38, float %747, float 1.000000e+00)
1495 %752 = fmul float %748, %751
1496 %753 = fmul float %749, %751
1497 %754 = fmul float %750, %751
1498 %755 = fmul float %742, %752
1499 %756 = fmul float %744, %753
1500 %757 = fmul float %746, %754
1501 %758 = fmul float %temp12.0, %216
1502 %759 = fmul float %temp13.0, %217
1503 %760 = fadd float %759, %758
1504 %761 = fmul float %temp14.0, %218
1505 %762 = fadd float %760, %761
1506 %763 = call float @fabs(float %762)
1507 %764 = fmul float %763, %763
1508 %765 = fmul float %764, %50
1509 %766 = fadd float %765, %51
1510 %767 = call float @llvm.AMDIL.clamp.(float %766, float 0.000000e+00, float 1.000000e+00)
1511 %768 = fsub float -0.000000e+00, %767
1512 %769 = fadd float 1.000000e+00, %768
1513 %770 = fmul float %33, %769
1514 %771 = fmul float %33, %769
1515 %772 = fmul float %33, %769
1516 %773 = fmul float %34, %769
1517 %774 = call float @llvm.AMDGPU.lrp(float %770, float %31, float %755)
1518 %775 = call float @llvm.AMDGPU.lrp(float %771, float %31, float %756)
1519 %776 = call float @llvm.AMDGPU.lrp(float %772, float %31, float %757)
1520 %777 = call float @llvm.AMDGPU.lrp(float %773, float %32, float %374)
1521 %778 = fcmp uge float %774, 0x3E6FFFFE60000000
1522 %779 = select i1 %778, float %774, float 0x3E6FFFFE60000000
1523 %780 = fcmp uge float %775, 0x3E6FFFFE60000000
1524 %781 = select i1 %780, float %775, float 0x3E6FFFFE60000000
1525 %782 = fcmp uge float %776, 0x3E6FFFFE60000000
1526 %783 = select i1 %782, float %776, float 0x3E6FFFFE60000000
1527 %784 = fcmp uge float %779, 6.550400e+04
1528 %785 = select i1 %784, float 6.550400e+04, float %779
1529 %786 = fcmp uge float %781, 6.550400e+04
1530 %787 = select i1 %786, float 6.550400e+04, float %781
1531 %788 = fcmp uge float %783, 6.550400e+04
1532 %789 = select i1 %788, float 6.550400e+04, float %783
1533 %790 = fmul float %777, %52
1534 %791 = fadd float %790, %53
1535 %792 = call float @llvm.AMDIL.clamp.(float %791, float 0.000000e+00, float 1.000000e+00)
1536 %793 = call i32 @llvm.SI.packf16(float %785, float %787)
1537 %794 = bitcast i32 %793 to float
1538 %795 = call i32 @llvm.SI.packf16(float %789, float %792)
1539 %796 = bitcast i32 %795 to float
1540 …oid @llvm.SI.export(i32 15, i32 1, i32 1, i32 0, i32 1, float %794, float %796, float %794, float
1544 %797 = fcmp olt float %565, %81
1546 %799 = bitcast i32 %798 to float
1547 %800 = bitcast float %799 to i32
1549 %.230 = select i1 %801, float %104, float %100
1550 %.231 = select i1 %801, float %105, float %101
1551 %.232 = select i1 %801, float %106, float %102
1552 %.233 = select i1 %801, float %107, float %103
1557 declare float @llvm.AMDIL.clamp.(float, float, float) #2
1560 declare <4 x float> @llvm.SI.sample.v2i32(<2 x i32>, <32 x i8>, <16 x i8>, i32) #1
1563 declare float @llvm.AMDGPU.lrp(float, float, float) #2
1566 declare <4 x float> @llvm.SI.samplel.v4i32(<4 x i32>, <32 x i8>, <16 x i8>, i32) #1
1569 declare float @llvm.AMDGPU.cndlt(float, float, float) #2
1572 declare float @llvm.AMDIL.exp.(float) #2