Lines Matching refs:xmm11

3287 ; SSE2-NEXT:    movdqa %xmm4, %xmm11
3288 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm11
3289 ; SSE2-NEXT: pand %xmm11, %xmm0
3290 ; SSE2-NEXT: pandn %xmm4, %xmm11
3291 ; SSE2-NEXT: por %xmm11, %xmm0
3359 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3360 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
3361 ; SSE2-NEXT: pxor %xmm11, %xmm13
3362 ; SSE2-NEXT: pandn %xmm0, %xmm11
3364 ; SSE2-NEXT: por %xmm13, %xmm11
3374 ; SSE2-NEXT: movdqa %xmm11, %xmm0
3425 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3426 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
3427 ; SSE2-NEXT: pand %xmm11, %xmm0
3428 ; SSE2-NEXT: pandn %xmm4, %xmm11
3429 ; SSE2-NEXT: por %xmm0, %xmm11
3439 ; SSE2-NEXT: movdqa %xmm11, %xmm0
3499 ; SSE2-NEXT: movdqa %xmm14, %xmm11
3500 ; SSE2-NEXT: pxor %xmm0, %xmm11
3508 ; SSE2-NEXT: pandn %xmm5, %xmm11
3509 ; SSE2-NEXT: por %xmm14, %xmm11
3516 ; SSE2-NEXT: movdqa %xmm11, %xmm1
3878 ; SSE2-NEXT: movdqa %xmm2, %xmm11
3879 ; SSE2-NEXT: pxor %xmm10, %xmm11
3882 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm9
3883 ; SSE2-NEXT: movdqa %xmm1, %xmm11
3884 ; SSE2-NEXT: pxor %xmm10, %xmm11
3887 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm12
3888 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3889 ; SSE2-NEXT: pxor %xmm10, %xmm11
3891 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm10
3957 ; SSE2-NEXT: movdqa %xmm0, %xmm11
3958 ; SSE2-NEXT: psubusw %xmm4, %xmm11
3959 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
3960 ; SSE2-NEXT: pand %xmm11, %xmm0
3961 ; SSE2-NEXT: pandn %xmm4, %xmm11
3962 ; SSE2-NEXT: por %xmm0, %xmm11
3972 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4016 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [32768,32768,32768,32768,32768,32768,32768,32768]
4018 ; SSE2-NEXT: pxor %xmm11, %xmm9
4020 ; SSE2-NEXT: pxor %xmm11, %xmm8
4023 ; SSE2-NEXT: pxor %xmm11, %xmm10
4025 ; SSE2-NEXT: pxor %xmm11, %xmm9
4028 ; SSE2-NEXT: pxor %xmm11, %xmm12
4030 ; SSE2-NEXT: pxor %xmm11, %xmm10
4033 ; SSE2-NEXT: pxor %xmm11, %xmm12
4034 ; SSE2-NEXT: pxor %xmm0, %xmm11
4035 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm11
4036 ; SSE2-NEXT: pand %xmm11, %xmm0
4037 ; SSE2-NEXT: pandn %xmm4, %xmm11
4038 ; SSE2-NEXT: por %xmm11, %xmm0
4101 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4102 ; SSE2-NEXT: psubusw %xmm1, %xmm11
4103 ; SSE2-NEXT: pcmpeqw %xmm9, %xmm11
4110 ; SSE2-NEXT: pand %xmm11, %xmm1
4111 ; SSE2-NEXT: pandn %xmm5, %xmm11
4112 ; SSE2-NEXT: por %xmm11, %xmm1
4168 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4169 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm11
4170 ; SSE2-NEXT: pand %xmm11, %xmm0
4171 ; SSE2-NEXT: pandn %xmm4, %xmm11
4172 ; SSE2-NEXT: por %xmm11, %xmm0
4240 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4241 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
4242 ; SSE2-NEXT: pxor %xmm11, %xmm13
4243 ; SSE2-NEXT: pandn %xmm0, %xmm11
4245 ; SSE2-NEXT: por %xmm13, %xmm11
4255 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4306 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4307 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
4308 ; SSE2-NEXT: pand %xmm11, %xmm0
4309 ; SSE2-NEXT: pandn %xmm4, %xmm11
4310 ; SSE2-NEXT: por %xmm0, %xmm11
4320 ; SSE2-NEXT: movdqa %xmm11, %xmm0
4380 ; SSE2-NEXT: movdqa %xmm14, %xmm11
4381 ; SSE2-NEXT: pxor %xmm0, %xmm11
4389 ; SSE2-NEXT: pandn %xmm5, %xmm11
4390 ; SSE2-NEXT: por %xmm14, %xmm11
4397 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4447 ; SSE2-NEXT: movdqa %xmm2, %xmm11
4448 ; SSE2-NEXT: pxor %xmm10, %xmm11
4451 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm9
4452 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4453 ; SSE2-NEXT: pxor %xmm10, %xmm11
4456 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm12
4457 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4458 ; SSE2-NEXT: pxor %xmm10, %xmm11
4460 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm10
4533 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4534 ; SSE2-NEXT: pxor %xmm14, %xmm11
4537 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4538 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4539 ; SSE2-NEXT: pxor %xmm14, %xmm11
4541 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4542 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4543 ; SSE2-NEXT: pxor %xmm0, %xmm11
4549 ; SSE2-NEXT: pandn %xmm5, %xmm11
4550 ; SSE2-NEXT: por %xmm15, %xmm11
4557 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4603 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
4605 ; SSE2-NEXT: pxor %xmm11, %xmm9
4607 ; SSE2-NEXT: pxor %xmm11, %xmm8
4610 ; SSE2-NEXT: pxor %xmm11, %xmm10
4612 ; SSE2-NEXT: pxor %xmm11, %xmm9
4615 ; SSE2-NEXT: pxor %xmm11, %xmm12
4617 ; SSE2-NEXT: pxor %xmm11, %xmm10
4620 ; SSE2-NEXT: pxor %xmm11, %xmm12
4621 ; SSE2-NEXT: pxor %xmm0, %xmm11
4622 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm11
4623 ; SSE2-NEXT: pand %xmm11, %xmm0
4624 ; SSE2-NEXT: pandn %xmm4, %xmm11
4625 ; SSE2-NEXT: por %xmm11, %xmm0
4698 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4699 ; SSE2-NEXT: pxor %xmm14, %xmm11
4702 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4703 ; SSE2-NEXT: movdqa %xmm10, %xmm11
4704 ; SSE2-NEXT: pxor %xmm14, %xmm11
4706 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4707 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4708 ; SSE2-NEXT: pxor %xmm0, %xmm11
4714 ; SSE2-NEXT: pandn %xmm5, %xmm11
4715 ; SSE2-NEXT: por %xmm15, %xmm11
4722 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4773 ; SSE2-NEXT: movdqa %xmm10, %xmm11
4774 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
4775 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4779 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
4783 ; SSE2-NEXT: movdqa %xmm6, %xmm11
4784 ; SSE2-NEXT: pxor %xmm9, %xmm11
4785 ; SSE2-NEXT: movdqa %xmm11, %xmm12
4788 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
4789 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
4790 ; SSE2-NEXT: pand %xmm13, %xmm11
4792 ; SSE2-NEXT: por %xmm11, %xmm10
4793 ; SSE2-NEXT: movdqa %xmm1, %xmm11
4794 ; SSE2-NEXT: pxor %xmm9, %xmm11
4798 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
4800 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
4801 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
4802 ; SSE2-NEXT: pand %xmm14, %xmm11
4804 ; SSE2-NEXT: por %xmm11, %xmm12
4805 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4806 ; SSE2-NEXT: pxor %xmm9, %xmm11
4809 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
4811 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
4814 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
4815 ; SSE2-NEXT: por %xmm9, %xmm11
4816 ; SSE2-NEXT: pand %xmm11, %xmm0
4817 ; SSE2-NEXT: pandn %xmm4, %xmm11
4818 ; SSE2-NEXT: por %xmm11, %xmm0
4837 ; SSE4-NEXT: movdqa %xmm5, %xmm11
4838 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
4842 ; SSE4-NEXT: movdqa %xmm11, %xmm0
4901 ; SSE2-NEXT: movdqa %xmm0, %xmm11
4902 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
4903 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4907 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
4912 ; SSE2-NEXT: movdqa %xmm6, %xmm11
4913 ; SSE2-NEXT: pxor %xmm10, %xmm11
4917 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4919 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
4920 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
4921 ; SSE2-NEXT: pand %xmm15, %xmm11
4923 ; SSE2-NEXT: por %xmm11, %xmm13
4924 ; SSE2-NEXT: movdqa %xmm5, %xmm11
4925 ; SSE2-NEXT: pxor %xmm10, %xmm11
4929 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
4930 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
4931 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
4933 ; SSE2-NEXT: pand %xmm11, %xmm14
4936 ; SSE2-NEXT: movdqa %xmm4, %xmm11
4937 ; SSE2-NEXT: pxor %xmm10, %xmm11
4940 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
4941 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
4942 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
4944 ; SSE2-NEXT: pand %xmm11, %xmm0
4949 ; SSE2-NEXT: movdqa %xmm15, %xmm11
4950 ; SSE2-NEXT: pxor %xmm1, %xmm11
4956 ; SSE2-NEXT: pandn %xmm5, %xmm11
4957 ; SSE2-NEXT: por %xmm15, %xmm11
4965 ; SSE2-NEXT: movdqa %xmm11, %xmm1
4980 ; SSE4-NEXT: movdqa %xmm1, %xmm11
4981 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
4982 ; SSE4-NEXT: pxor %xmm12, %xmm11
4986 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5048 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5049 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5050 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5054 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5058 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5059 ; SSE2-NEXT: pxor %xmm9, %xmm11
5060 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5063 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5064 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5065 ; SSE2-NEXT: pand %xmm13, %xmm11
5067 ; SSE2-NEXT: por %xmm11, %xmm10
5068 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5069 ; SSE2-NEXT: pxor %xmm9, %xmm11
5073 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5075 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5076 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5077 ; SSE2-NEXT: pand %xmm14, %xmm11
5079 ; SSE2-NEXT: por %xmm11, %xmm12
5080 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5081 ; SSE2-NEXT: pxor %xmm9, %xmm11
5084 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5086 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5089 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5090 ; SSE2-NEXT: por %xmm9, %xmm11
5091 ; SSE2-NEXT: pand %xmm11, %xmm0
5092 ; SSE2-NEXT: pandn %xmm4, %xmm11
5093 ; SSE2-NEXT: por %xmm11, %xmm0
5112 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5113 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
5116 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5165 ; SSE2-NEXT: movdqa %xmm7, %xmm11
5166 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
5174 ; SSE2-NEXT: movdqa %xmm11, %xmm0
5176 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5177 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5178 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5182 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5187 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5188 ; SSE2-NEXT: pxor %xmm10, %xmm11
5192 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5194 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5195 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5196 ; SSE2-NEXT: pand %xmm15, %xmm11
5198 ; SSE2-NEXT: por %xmm11, %xmm13
5199 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5200 ; SSE2-NEXT: pxor %xmm10, %xmm11
5204 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5205 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5206 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5208 ; SSE2-NEXT: pand %xmm11, %xmm14
5211 ; SSE2-NEXT: movdqa %xmm9, %xmm11
5212 ; SSE2-NEXT: pxor %xmm10, %xmm11
5215 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5216 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5217 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5219 ; SSE2-NEXT: pand %xmm11, %xmm0
5224 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5225 ; SSE2-NEXT: pxor %xmm1, %xmm11
5231 ; SSE2-NEXT: pandn %xmm5, %xmm11
5232 ; SSE2-NEXT: por %xmm15, %xmm11
5240 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5255 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5256 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
5257 ; SSE4-NEXT: pxor %xmm0, %xmm11
5262 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5324 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5325 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5326 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5330 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5334 ; SSE2-NEXT: movdqa %xmm6, %xmm11
5335 ; SSE2-NEXT: pxor %xmm9, %xmm11
5336 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5339 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5340 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5341 ; SSE2-NEXT: pand %xmm13, %xmm11
5343 ; SSE2-NEXT: por %xmm11, %xmm10
5344 ; SSE2-NEXT: movdqa %xmm1, %xmm11
5345 ; SSE2-NEXT: pxor %xmm9, %xmm11
5349 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5351 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5352 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5353 ; SSE2-NEXT: pand %xmm14, %xmm11
5355 ; SSE2-NEXT: por %xmm11, %xmm12
5356 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5357 ; SSE2-NEXT: pxor %xmm9, %xmm11
5360 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5362 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5365 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5366 ; SSE2-NEXT: por %xmm9, %xmm11
5367 ; SSE2-NEXT: pand %xmm11, %xmm0
5368 ; SSE2-NEXT: pandn %xmm4, %xmm11
5369 ; SSE2-NEXT: por %xmm11, %xmm0
5390 ; SSE4-NEXT: movdqa %xmm2, %xmm11
5391 ; SSE4-NEXT: pxor %xmm0, %xmm11
5394 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5397 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5398 ; SSE4-NEXT: pxor %xmm0, %xmm11
5399 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5405 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5478 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5479 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5480 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5484 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5489 ; SSE2-NEXT: movdqa %xmm6, %xmm11
5490 ; SSE2-NEXT: pxor %xmm10, %xmm11
5494 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5496 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5497 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5498 ; SSE2-NEXT: pand %xmm15, %xmm11
5500 ; SSE2-NEXT: por %xmm11, %xmm13
5501 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5502 ; SSE2-NEXT: pxor %xmm10, %xmm11
5506 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5507 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5508 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5510 ; SSE2-NEXT: pand %xmm11, %xmm14
5513 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5514 ; SSE2-NEXT: pxor %xmm10, %xmm11
5517 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5518 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5519 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5521 ; SSE2-NEXT: pand %xmm11, %xmm0
5526 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5527 ; SSE2-NEXT: pxor %xmm1, %xmm11
5533 ; SSE2-NEXT: pandn %xmm5, %xmm11
5534 ; SSE2-NEXT: por %xmm15, %xmm11
5542 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5558 ; SSE4-NEXT: movdqa %xmm6, %xmm11
5559 ; SSE4-NEXT: pxor %xmm0, %xmm11
5562 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5566 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5567 ; SSE4-NEXT: pxor %xmm0, %xmm11
5568 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
5569 ; SSE4-NEXT: pxor %xmm12, %xmm11
5576 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5652 ; SSE2-NEXT: movdqa %xmm10, %xmm11
5653 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5654 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5658 ; SSE2-NEXT: pshufd {{.*#+}} xmm8 = xmm11[1,1,3,3]
5662 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5663 ; SSE2-NEXT: pxor %xmm9, %xmm11
5664 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5667 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm11
5668 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm11[1,1,3,3]
5669 ; SSE2-NEXT: pand %xmm13, %xmm11
5671 ; SSE2-NEXT: por %xmm11, %xmm10
5672 ; SSE2-NEXT: movdqa %xmm5, %xmm11
5673 ; SSE2-NEXT: pxor %xmm9, %xmm11
5677 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5679 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5680 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5681 ; SSE2-NEXT: pand %xmm14, %xmm11
5683 ; SSE2-NEXT: por %xmm11, %xmm12
5684 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5685 ; SSE2-NEXT: pxor %xmm9, %xmm11
5688 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm13
5690 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm9
5693 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5694 ; SSE2-NEXT: por %xmm9, %xmm11
5695 ; SSE2-NEXT: pand %xmm11, %xmm0
5696 ; SSE2-NEXT: pandn %xmm4, %xmm11
5697 ; SSE2-NEXT: por %xmm11, %xmm0
5718 ; SSE4-NEXT: movdqa %xmm6, %xmm11
5719 ; SSE4-NEXT: pxor %xmm0, %xmm11
5722 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5725 ; SSE4-NEXT: movdqa %xmm1, %xmm11
5726 ; SSE4-NEXT: pxor %xmm0, %xmm11
5727 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5733 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5796 ; SSE2-NEXT: movdqa %xmm7, %xmm11
5797 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
5805 ; SSE2-NEXT: movdqa %xmm11, %xmm0
5807 ; SSE2-NEXT: movdqa %xmm0, %xmm11
5808 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
5809 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5813 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5818 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5819 ; SSE2-NEXT: pxor %xmm10, %xmm11
5823 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5825 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
5826 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
5827 ; SSE2-NEXT: pand %xmm15, %xmm11
5829 ; SSE2-NEXT: por %xmm11, %xmm13
5830 ; SSE2-NEXT: movdqa %xmm2, %xmm11
5831 ; SSE2-NEXT: pxor %xmm10, %xmm11
5835 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
5836 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
5837 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
5839 ; SSE2-NEXT: pand %xmm11, %xmm14
5842 ; SSE2-NEXT: movdqa %xmm9, %xmm11
5843 ; SSE2-NEXT: pxor %xmm10, %xmm11
5846 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
5847 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
5848 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
5850 ; SSE2-NEXT: pand %xmm11, %xmm0
5855 ; SSE2-NEXT: movdqa %xmm15, %xmm11
5856 ; SSE2-NEXT: pxor %xmm1, %xmm11
5862 ; SSE2-NEXT: pandn %xmm5, %xmm11
5863 ; SSE2-NEXT: por %xmm15, %xmm11
5871 ; SSE2-NEXT: movdqa %xmm11, %xmm1
5887 ; SSE4-NEXT: movdqa %xmm2, %xmm11
5888 ; SSE4-NEXT: pxor %xmm0, %xmm11
5891 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
5895 ; SSE4-NEXT: movdqa %xmm5, %xmm11
5896 ; SSE4-NEXT: pxor %xmm0, %xmm11
5897 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
5898 ; SSE4-NEXT: pxor %xmm12, %xmm11
5905 ; SSE4-NEXT: movdqa %xmm11, %xmm0
5983 ; SSE2-NEXT: movdqa %xmm4, %xmm11
5984 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm11
5985 ; SSE2-NEXT: pand %xmm11, %xmm4
5986 ; SSE2-NEXT: pandn %xmm0, %xmm11
5987 ; SSE2-NEXT: por %xmm4, %xmm11
5997 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6057 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6058 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
6059 ; SSE2-NEXT: pxor %xmm11, %xmm13
6060 ; SSE2-NEXT: pandn %xmm4, %xmm11
6062 ; SSE2-NEXT: por %xmm13, %xmm11
6072 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6124 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6125 ; SSE2-NEXT: pcmpgtb %xmm4, %xmm11
6126 ; SSE2-NEXT: pand %xmm11, %xmm4
6127 ; SSE2-NEXT: pandn %xmm0, %xmm11
6128 ; SSE2-NEXT: por %xmm4, %xmm11
6138 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6197 ; SSE2-NEXT: movdqa %xmm14, %xmm11
6198 ; SSE2-NEXT: pxor %xmm0, %xmm11
6206 ; SSE2-NEXT: pandn %xmm1, %xmm11
6207 ; SSE2-NEXT: por %xmm14, %xmm11
6214 ; SSE2-NEXT: movdqa %xmm11, %xmm1
6571 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6588 ; SSE2-NEXT: movdqa %xmm11, %xmm12
6593 ; SSE2-NEXT: pandn %xmm11, %xmm0
6660 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6661 ; SSE2-NEXT: psubusw %xmm4, %xmm11
6662 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6663 ; SSE2-NEXT: pand %xmm11, %xmm4
6664 ; SSE2-NEXT: pandn %xmm0, %xmm11
6665 ; SSE2-NEXT: por %xmm4, %xmm11
6675 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6719 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6738 ; SSE2-NEXT: pxor %xmm11, %xmm0
6741 ; SSE2-NEXT: pandn %xmm11, %xmm0
6811 ; SSE2-NEXT: movdqa %xmm4, %xmm11
6812 ; SSE2-NEXT: psubusw %xmm0, %xmm11
6813 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6814 ; SSE2-NEXT: pand %xmm11, %xmm4
6815 ; SSE2-NEXT: pandn %xmm0, %xmm11
6816 ; SSE2-NEXT: por %xmm4, %xmm11
6826 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6877 ; SSE2-NEXT: movdqa %xmm4, %xmm11
6878 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm11
6879 ; SSE2-NEXT: pand %xmm11, %xmm4
6880 ; SSE2-NEXT: pandn %xmm0, %xmm11
6881 ; SSE2-NEXT: por %xmm4, %xmm11
6891 ; SSE2-NEXT: movdqa %xmm11, %xmm0
6951 ; SSE2-NEXT: movdqa %xmm0, %xmm11
6952 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
6953 ; SSE2-NEXT: pxor %xmm11, %xmm13
6954 ; SSE2-NEXT: pandn %xmm4, %xmm11
6956 ; SSE2-NEXT: por %xmm13, %xmm11
6966 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7018 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7019 ; SSE2-NEXT: pcmpgtd %xmm4, %xmm11
7020 ; SSE2-NEXT: pand %xmm11, %xmm4
7021 ; SSE2-NEXT: pandn %xmm0, %xmm11
7022 ; SSE2-NEXT: por %xmm4, %xmm11
7032 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7091 ; SSE2-NEXT: movdqa %xmm14, %xmm11
7092 ; SSE2-NEXT: pxor %xmm0, %xmm11
7100 ; SSE2-NEXT: pandn %xmm1, %xmm11
7101 ; SSE2-NEXT: por %xmm14, %xmm11
7108 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7153 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7170 ; SSE2-NEXT: movdqa %xmm11, %xmm12
7175 ; SSE2-NEXT: pandn %xmm11, %xmm0
7249 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7250 ; SSE2-NEXT: pxor %xmm14, %xmm11
7253 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7254 ; SSE2-NEXT: movdqa %xmm4, %xmm11
7255 ; SSE2-NEXT: pxor %xmm14, %xmm11
7257 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7258 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7259 ; SSE2-NEXT: pxor %xmm0, %xmm11
7265 ; SSE2-NEXT: pandn %xmm1, %xmm11
7266 ; SSE2-NEXT: por %xmm15, %xmm11
7273 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7319 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7338 ; SSE2-NEXT: pxor %xmm11, %xmm0
7341 ; SSE2-NEXT: pandn %xmm11, %xmm0
7415 ; SSE2-NEXT: movdqa %xmm1, %xmm11
7416 ; SSE2-NEXT: pxor %xmm14, %xmm11
7419 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7420 ; SSE2-NEXT: movdqa %xmm10, %xmm11
7421 ; SSE2-NEXT: pxor %xmm14, %xmm11
7423 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7424 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7425 ; SSE2-NEXT: pxor %xmm0, %xmm11
7431 ; SSE2-NEXT: pandn %xmm1, %xmm11
7432 ; SSE2-NEXT: por %xmm15, %xmm11
7439 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7487 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,0,2147483648,0]
7489 ; SSE2-NEXT: pxor %xmm11, %xmm8
7491 ; SSE2-NEXT: pxor %xmm11, %xmm9
7501 ; SSE2-NEXT: pxor %xmm11, %xmm9
7503 ; SSE2-NEXT: pxor %xmm11, %xmm10
7513 ; SSE2-NEXT: pxor %xmm11, %xmm10
7515 ; SSE2-NEXT: pxor %xmm11, %xmm12
7525 ; SSE2-NEXT: pxor %xmm11, %xmm12
7526 ; SSE2-NEXT: pxor %xmm4, %xmm11
7527 ; SSE2-NEXT: movdqa %xmm11, %xmm13
7530 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7531 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7533 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7534 ; SSE2-NEXT: por %xmm12, %xmm11
7535 ; SSE2-NEXT: pand %xmm11, %xmm4
7536 ; SSE2-NEXT: pandn %xmm0, %xmm11
7537 ; SSE2-NEXT: por %xmm4, %xmm11
7547 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7560 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7561 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
7565 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7621 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7622 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
7623 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7627 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7632 ; SSE2-NEXT: movdqa %xmm6, %xmm11
7633 ; SSE2-NEXT: pxor %xmm10, %xmm11
7637 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7639 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
7640 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7641 ; SSE2-NEXT: pand %xmm15, %xmm11
7643 ; SSE2-NEXT: por %xmm11, %xmm13
7644 ; SSE2-NEXT: movdqa %xmm5, %xmm11
7645 ; SSE2-NEXT: pxor %xmm10, %xmm11
7649 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7650 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
7651 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
7653 ; SSE2-NEXT: pand %xmm11, %xmm14
7656 ; SSE2-NEXT: movdqa %xmm4, %xmm11
7657 ; SSE2-NEXT: pxor %xmm10, %xmm11
7660 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7661 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
7662 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
7664 ; SSE2-NEXT: pand %xmm11, %xmm0
7669 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7670 ; SSE2-NEXT: pxor %xmm1, %xmm11
7676 ; SSE2-NEXT: pandn %xmm2, %xmm11
7677 ; SSE2-NEXT: por %xmm15, %xmm11
7685 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7700 ; SSE4-NEXT: movdqa %xmm1, %xmm11
7701 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7702 ; SSE4-NEXT: pxor %xmm12, %xmm11
7706 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7760 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,0,2147483648,0]
7762 ; SSE2-NEXT: pxor %xmm11, %xmm8
7764 ; SSE2-NEXT: pxor %xmm11, %xmm9
7774 ; SSE2-NEXT: pxor %xmm11, %xmm9
7776 ; SSE2-NEXT: pxor %xmm11, %xmm10
7786 ; SSE2-NEXT: pxor %xmm11, %xmm10
7788 ; SSE2-NEXT: pxor %xmm11, %xmm12
7798 ; SSE2-NEXT: pxor %xmm11, %xmm12
7799 ; SSE2-NEXT: pxor %xmm0, %xmm11
7800 ; SSE2-NEXT: movdqa %xmm11, %xmm13
7803 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7804 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7806 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7807 ; SSE2-NEXT: por %xmm12, %xmm11
7808 ; SSE2-NEXT: pand %xmm11, %xmm4
7809 ; SSE2-NEXT: pandn %xmm0, %xmm11
7810 ; SSE2-NEXT: por %xmm4, %xmm11
7820 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7833 ; SSE4-NEXT: movdqa %xmm1, %xmm11
7834 ; SSE4-NEXT: pcmpgtq %xmm5, %xmm11
7837 ; SSE4-NEXT: movdqa %xmm11, %xmm0
7883 ; SSE2-NEXT: movdqa %xmm7, %xmm11
7884 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
7892 ; SSE2-NEXT: movdqa %xmm11, %xmm0
7894 ; SSE2-NEXT: movdqa %xmm0, %xmm11
7895 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
7896 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7900 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7905 ; SSE2-NEXT: movdqa %xmm3, %xmm11
7906 ; SSE2-NEXT: pxor %xmm10, %xmm11
7910 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7912 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
7913 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
7914 ; SSE2-NEXT: pand %xmm15, %xmm11
7916 ; SSE2-NEXT: por %xmm11, %xmm13
7917 ; SSE2-NEXT: movdqa %xmm2, %xmm11
7918 ; SSE2-NEXT: pxor %xmm10, %xmm11
7922 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
7923 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
7924 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
7926 ; SSE2-NEXT: pand %xmm11, %xmm14
7929 ; SSE2-NEXT: movdqa %xmm9, %xmm11
7930 ; SSE2-NEXT: pxor %xmm10, %xmm11
7933 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
7934 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
7935 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
7937 ; SSE2-NEXT: pand %xmm11, %xmm0
7942 ; SSE2-NEXT: movdqa %xmm15, %xmm11
7943 ; SSE2-NEXT: pxor %xmm1, %xmm11
7949 ; SSE2-NEXT: pandn %xmm2, %xmm11
7950 ; SSE2-NEXT: por %xmm15, %xmm11
7958 ; SSE2-NEXT: movdqa %xmm11, %xmm1
7973 ; SSE4-NEXT: movdqa %xmm5, %xmm11
7974 ; SSE4-NEXT: pcmpgtq %xmm1, %xmm11
7975 ; SSE4-NEXT: pxor %xmm0, %xmm11
7980 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8034 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
8036 ; SSE2-NEXT: pxor %xmm11, %xmm8
8038 ; SSE2-NEXT: pxor %xmm11, %xmm9
8048 ; SSE2-NEXT: pxor %xmm11, %xmm9
8050 ; SSE2-NEXT: pxor %xmm11, %xmm10
8060 ; SSE2-NEXT: pxor %xmm11, %xmm10
8062 ; SSE2-NEXT: pxor %xmm11, %xmm12
8072 ; SSE2-NEXT: pxor %xmm11, %xmm12
8073 ; SSE2-NEXT: pxor %xmm4, %xmm11
8074 ; SSE2-NEXT: movdqa %xmm11, %xmm13
8077 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8078 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8080 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8081 ; SSE2-NEXT: por %xmm12, %xmm11
8082 ; SSE2-NEXT: pand %xmm11, %xmm4
8083 ; SSE2-NEXT: pandn %xmm0, %xmm11
8084 ; SSE2-NEXT: por %xmm4, %xmm11
8094 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8109 ; SSE4-NEXT: movdqa %xmm2, %xmm11
8110 ; SSE4-NEXT: pxor %xmm0, %xmm11
8113 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8116 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8117 ; SSE4-NEXT: pxor %xmm0, %xmm11
8118 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8124 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8194 ; SSE2-NEXT: movdqa %xmm0, %xmm11
8195 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
8196 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8200 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8205 ; SSE2-NEXT: movdqa %xmm6, %xmm11
8206 ; SSE2-NEXT: pxor %xmm10, %xmm11
8210 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8212 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
8213 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8214 ; SSE2-NEXT: pand %xmm15, %xmm11
8216 ; SSE2-NEXT: por %xmm11, %xmm13
8217 ; SSE2-NEXT: movdqa %xmm5, %xmm11
8218 ; SSE2-NEXT: pxor %xmm10, %xmm11
8222 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
8223 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
8224 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
8226 ; SSE2-NEXT: pand %xmm11, %xmm14
8229 ; SSE2-NEXT: movdqa %xmm4, %xmm11
8230 ; SSE2-NEXT: pxor %xmm10, %xmm11
8233 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8234 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
8235 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
8237 ; SSE2-NEXT: pand %xmm11, %xmm0
8242 ; SSE2-NEXT: movdqa %xmm15, %xmm11
8243 ; SSE2-NEXT: pxor %xmm1, %xmm11
8249 ; SSE2-NEXT: pandn %xmm2, %xmm11
8250 ; SSE2-NEXT: por %xmm15, %xmm11
8258 ; SSE2-NEXT: movdqa %xmm11, %xmm1
8274 ; SSE4-NEXT: movdqa %xmm6, %xmm11
8275 ; SSE4-NEXT: pxor %xmm0, %xmm11
8278 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8282 ; SSE4-NEXT: movdqa %xmm1, %xmm11
8283 ; SSE4-NEXT: pxor %xmm0, %xmm11
8284 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
8285 ; SSE4-NEXT: pxor %xmm12, %xmm11
8292 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8360 ; SSE2-NEXT: movdqa {{.*#+}} xmm11 = [2147483648,2147483648,2147483648,2147483648]
8362 ; SSE2-NEXT: pxor %xmm11, %xmm8
8364 ; SSE2-NEXT: pxor %xmm11, %xmm9
8374 ; SSE2-NEXT: pxor %xmm11, %xmm9
8376 ; SSE2-NEXT: pxor %xmm11, %xmm10
8386 ; SSE2-NEXT: pxor %xmm11, %xmm10
8388 ; SSE2-NEXT: pxor %xmm11, %xmm12
8398 ; SSE2-NEXT: pxor %xmm11, %xmm12
8399 ; SSE2-NEXT: pxor %xmm0, %xmm11
8400 ; SSE2-NEXT: movdqa %xmm11, %xmm13
8403 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8404 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8406 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8407 ; SSE2-NEXT: por %xmm12, %xmm11
8408 ; SSE2-NEXT: pand %xmm11, %xmm4
8409 ; SSE2-NEXT: pandn %xmm0, %xmm11
8410 ; SSE2-NEXT: por %xmm4, %xmm11
8420 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8435 ; SSE4-NEXT: movdqa %xmm6, %xmm11
8436 ; SSE4-NEXT: pxor %xmm0, %xmm11
8439 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8442 ; SSE4-NEXT: movdqa %xmm1, %xmm11
8443 ; SSE4-NEXT: pxor %xmm0, %xmm11
8444 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8450 ; SSE4-NEXT: movdqa %xmm11, %xmm0
8510 ; SSE2-NEXT: movdqa %xmm7, %xmm11
8511 ; SSE2-NEXT: movdqa %xmm11, -{{[0-9]+}}(%rsp) # 16-byte Spill
8519 ; SSE2-NEXT: movdqa %xmm11, %xmm0
8521 ; SSE2-NEXT: movdqa %xmm0, %xmm11
8522 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm11
8523 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8527 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8532 ; SSE2-NEXT: movdqa %xmm3, %xmm11
8533 ; SSE2-NEXT: pxor %xmm10, %xmm11
8537 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8539 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm13
8540 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm13[1,1,3,3]
8541 ; SSE2-NEXT: pand %xmm15, %xmm11
8543 ; SSE2-NEXT: por %xmm11, %xmm13
8544 ; SSE2-NEXT: movdqa %xmm2, %xmm11
8545 ; SSE2-NEXT: pxor %xmm10, %xmm11
8549 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm15
8550 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm14
8551 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm15[0,0,2,2]
8553 ; SSE2-NEXT: pand %xmm11, %xmm14
8556 ; SSE2-NEXT: movdqa %xmm9, %xmm11
8557 ; SSE2-NEXT: pxor %xmm10, %xmm11
8560 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm14
8561 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm10
8562 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm14[0,0,2,2]
8564 ; SSE2-NEXT: pand %xmm11, %xmm0
8569 ; SSE2-NEXT: movdqa %xmm15, %xmm11
8570 ; SSE2-NEXT: pxor %xmm1, %xmm11
8576 ; SSE2-NEXT: pandn %xmm2, %xmm11
8577 ; SSE2-NEXT: por %xmm15, %xmm11
8585 ; SSE2-NEXT: movdqa %xmm11, %xmm1
8601 ; SSE4-NEXT: movdqa %xmm2, %xmm11
8602 ; SSE4-NEXT: pxor %xmm0, %xmm11
8605 ; SSE4-NEXT: pcmpgtq %xmm11, %xmm10
8609 ; SSE4-NEXT: movdqa %xmm5, %xmm11
8610 ; SSE4-NEXT: pxor %xmm0, %xmm11
8611 ; SSE4-NEXT: pcmpgtq %xmm13, %xmm11
8612 ; SSE4-NEXT: pxor %xmm12, %xmm11
8619 ; SSE4-NEXT: movdqa %xmm11, %xmm0