aboutsummaryrefslogtreecommitdiff
path: root/modules/arch/x86/tests/ssewidth.asm
blob: 0824b76945f112ac31128b4d173d2306959e44c7 (plain)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
[bits 64]
addpd xmm1, xmm2
addpd xmm1, dqword [rbx]

addps xmm1, xmm2
addps xmm1, dqword [rbx]

addsd xmm1, xmm2
addsd xmm1, qword [rbx]

addss xmm1, xmm2
addss xmm1, dword [rbx]

addsubpd xmm1, xmm2
addsubpd xmm1, dqword [rbx]

addsubps xmm1, xmm2
addsubps xmm1, dqword [rbx]

andnpd xmm1, xmm2
andnpd xmm1, dqword [rbx]

andnps xmm1, xmm2
andnps xmm1, dqword [rbx]

andpd xmm1, xmm2
andpd xmm1, dqword [rbx]

andps xmm1, xmm2
andps xmm1, dqword [rbx]

cmppd xmm1, xmm2, 0
cmppd xmm1, dqword [rbx], 0
cmpeqpd xmm1, xmm2
cmpeqpd xmm1, dqword [rbx]

cmpps xmm1, xmm2, 0
cmpps xmm1, dqword [rbx], 0
cmpeqps xmm1, xmm2
cmpeqps xmm1, dqword [rbx]

cmpsd xmm1, xmm2, 0
cmpsd xmm1, qword [rbx], 0
cmpeqsd xmm1, xmm2
cmpeqsd xmm1, qword [rbx]

cmpss xmm1, xmm2, 0
cmpss xmm1, dword [rbx], 0
cmpeqss xmm1, xmm2
cmpeqss xmm1, dword [rbx]

comisd xmm1, xmm2
comisd xmm1, qword [rbx]

comiss xmm1, xmm2
comiss xmm1, dword [rbx]

cvtdq2pd xmm1, xmm2
cvtdq2pd xmm1, qword [rbx]

cvtdq2ps xmm1, xmm2
cvtdq2ps xmm1, dqword [rbx]

cvtpd2dq xmm1, xmm2
cvtpd2dq xmm1, dqword [rbx]

cvtpd2pi mm1, xmm2		; mmx
cvtpd2pi mm1, dqword [rbx]

cvtpd2ps xmm1, xmm2
cvtpd2ps xmm1, dqword [rbx]

cvtpi2pd xmm1, mm2		; mmx
cvtpi2pd xmm1, qword [rbx]

cvtpi2ps xmm1, mm2		; mmx
cvtpi2ps xmm1, qword [rbx]

cvtps2dq xmm1, xmm2
cvtps2dq xmm1, dqword [rbx]

cvtps2pd xmm1, xmm2
cvtps2pd xmm1, qword [rbx]

cvtps2pi mm1, xmm2
cvtps2pi mm1, qword [rbx]

cvtsd2si rbx, xmm2
cvtsd2si rbx, qword [rbx]

cvtsd2ss xmm1, xmm2
cvtsd2ss xmm1, qword [rbx]

cvtsi2sd xmm1, ebx
cvtsi2sd xmm1, dword [rbx]
cvtsi2sd xmm1, rbx
cvtsi2sd xmm1, qword [rbx]

cvtsi2ss xmm1, ebx
cvtsi2ss xmm1, dword [rbx]
cvtsi2ss xmm1, rbx
cvtsi2ss xmm1, qword [rbx]

cvtss2sd xmm1, xmm2
cvtss2sd xmm1, dword [rbx]

cvtss2si ebx, xmm2
cvtss2si ebx, dword [rbx]
cvtss2si rbx, xmm2
cvtss2si rbx, dword [rbx]

cvttpd2dq xmm1, xmm2
cvttpd2dq xmm1, dqword [rbx]

cvttpd2pi mm1, xmm2
cvttpd2pi mm1, dqword [rbx]

cvttps2dq xmm1, xmm2
cvttps2dq xmm1, dqword [rbx]

cvttps2pi mm1, xmm2
cvttps2pi mm1, qword [rbx]

cvttsd2si eax, xmm1
cvttsd2si eax, qword [rbx]
cvttsd2si rax, xmm1
cvttsd2si rax, qword [rbx]

cvttss2si eax, xmm1
cvttss2si eax, dword [rbx]
cvttss2si rax, xmm1
cvttss2si rax, dword [rbx]

divpd xmm1, xmm2
divpd xmm1, dqword [rbx]

divps xmm1, xmm2
divps xmm1, dqword [rbx]

divsd xmm1, xmm2
divsd xmm1, qword [rbx]

divss xmm1, xmm2
divss xmm1, dword [rbx]

extrq xmm1, 0, 1
extrq xmm1, byte 0, byte 1
extrq xmm1, xmm2

haddpd xmm1, xmm2
haddpd xmm1, dqword [rbx]

haddps xmm1, xmm2
haddps xmm1, dqword [rbx]

hsubpd xmm1, xmm2
hsubpd xmm1, dqword [rbx]

hsubps xmm1, xmm2
hsubps xmm1, dqword [rbx]

insertq xmm1, xmm2, 0, 1
insertq xmm1, xmm2, byte 0, byte 1
insertq xmm1, xmm2

lddqu xmm1, dqword [rbx]

ldmxcsr dword [rbx]

maskmovdqu xmm1, xmm2

maxpd xmm1, xmm2
maxpd xmm1, dqword [rbx]

maxps xmm1, xmm2
maxps xmm1, dqword [rbx]

maxsd xmm1, xmm2
maxsd xmm1, qword [rbx]

maxss xmm1, xmm2
maxss xmm1, dword [rbx]

minpd xmm1, xmm2
minpd xmm1, dqword [rbx]

minps xmm1, xmm2
minps xmm1, dqword [rbx]

minsd xmm1, xmm2
minsd xmm1, qword [rbx]

minss xmm1, xmm2
minss xmm1, dword [rbx]

movapd xmm1, xmm2
movapd xmm1, dqword [rbx]
movapd dqword [rbx], xmm2

movaps xmm1, xmm2
movaps xmm1, dqword [rbx]
movaps dqword [rbx], xmm2

movd xmm1, ebx
movd xmm1, dword [rbx]
movd xmm1, rbx
movd xmm1, qword [rbx]
movd dword [rbx], xmm2
movd qword [rbx], xmm2

movddup xmm1, xmm2
movddup xmm1, qword [rbx]

movdq2q mm1, xmm2

movdqa xmm1, xmm2
movdqa xmm1, dqword [rbx]
movdqa dqword [rbx], xmm2

movdqu xmm1, xmm2
movdqu xmm1, dqword [rbx]
movdqu dqword [rbx], xmm2

movhlps xmm1, xmm2

movhpd xmm1, qword [rbx]
movhpd qword [rbx], xmm2

movhps xmm1, qword [rbx]
movhps qword [rbx], xmm2

movlhps xmm1, xmm2

movlpd xmm1, qword [rbx]
movlpd qword [rbx], xmm2

movlps xmm1, qword [rbx]
movlps qword [rbx], xmm2

movmskpd ebx, xmm2

movmskps ebx, xmm2

movntdq dqword [rbx], xmm2

movntpd dqword [rbx], xmm2

movntps dqword [rbx], xmm2

movntsd qword [rbx], xmm2

movntss dword [rbx], xmm2

movq xmm1, xmm2
movq xmm1, qword [rbx]
movq qword [rbx], xmm2

movq2dq xmm1, mm2

movsd xmm1, xmm2
movsd xmm1, qword [rbx]
movsd qword [rbx], xmm2

movshdup xmm1, xmm2
movshdup xmm1, dqword [rbx]

movsldup xmm1, xmm2
movsldup xmm1, dqword [rbx]

movss xmm1, xmm2
movss xmm1, dword [rbx]
movss dword [rbx], xmm2

movupd xmm1, xmm2
movupd xmm1, dqword [rbx]
movupd dqword [rbx], xmm2

movups xmm1, xmm2
movups xmm1, dqword [rbx]
movups dqword [rbx], xmm2

mulpd xmm1, xmm2
mulpd xmm1, dqword [rbx]

mulps xmm1, xmm2
mulps xmm1, dqword [rbx]

mulsd xmm1, xmm2
mulsd xmm1, qword [rbx]

mulss xmm1, xmm2
mulss xmm1, dword [rbx]

orpd xmm1, xmm2
orpd xmm1, dqword [rbx]

orps xmm1, xmm2
orps xmm1, dqword [rbx]

packssdw xmm1, xmm2
packssdw xmm1, dqword [rbx]

packsswb xmm1, xmm2
packsswb xmm1, dqword [rbx]

packuswb xmm1, xmm2
packuswb xmm1, dqword [rbx]

paddb xmm1, xmm2
paddb xmm1, dqword [rbx]

paddd xmm1, xmm2
paddd xmm1, dqword [rbx]

paddq xmm1, xmm2
paddq xmm1, dqword [rbx]

paddsb xmm1, xmm2
paddsb xmm1, dqword [rbx]

paddsw xmm1, xmm2
paddsw xmm1, dqword [rbx]

paddusb xmm1, xmm2
paddusb xmm1, dqword [rbx]

paddusw xmm1, xmm2
paddusw xmm1, dqword [rbx]

paddw xmm1, xmm2
paddw xmm1, dqword [rbx]

pand xmm1, xmm2
pand xmm1, dqword [rbx]

pandn xmm1, xmm2
pandn xmm1, dqword [rbx]

pavgb xmm1, xmm2
pavgb xmm1, dqword [rbx]

pavgw xmm1, xmm2
pavgw xmm1, dqword [rbx]

pcmpeqb xmm1, xmm2
pcmpeqb xmm1, dqword [rbx]

pcmpeqd xmm1, xmm2
pcmpeqd xmm1, dqword [rbx]

pcmpeqw xmm1, xmm2
pcmpeqw xmm1, dqword [rbx]

pcmpgtb xmm1, xmm2
pcmpgtb xmm1, dqword [rbx]

pcmpgtd xmm1, xmm2
pcmpgtd xmm1, dqword [rbx]

pcmpgtw xmm1, xmm2
pcmpgtw xmm1, dqword [rbx]

pextrw ebx, xmm2, byte 0

pinsrw xmm1, ebx, byte 0
pinsrw xmm1, word [rbx], byte 0

pmaddwd xmm1, xmm2
pmaddwd xmm1, dqword [rbx]

pmaxsw xmm1, xmm2
pmaxsw xmm1, dqword [rbx]

pmaxub xmm1, xmm2
pmaxub xmm1, dqword [rbx]

pminsw xmm1, xmm2
pminsw xmm1, dqword [rbx]

pminub xmm1, xmm2
pminub xmm1, dqword [rbx]

pmovmskb eax, xmm2

pmulhuw xmm1, xmm2
pmulhuw xmm1, dqword [rbx]

pmulhw xmm1, xmm2
pmulhw xmm1, dqword [rbx]

pmullw xmm1, xmm2
pmullw xmm1, dqword [rbx]

pmuludq xmm1, xmm2
pmuludq xmm1, dqword [rbx]

por xmm1, xmm2
por xmm1, dqword [rbx]

psadbw xmm1, xmm2
psadbw xmm1, dqword [rbx]

pshufd xmm1, xmm2, byte 0
pshufd xmm1, dqword [rbx], byte 0

pshufhw xmm1, xmm2, byte 0
pshufhw xmm1, dqword [rbx], byte 0

pshuflw xmm1, xmm2, byte 0
pshuflw xmm1, dqword [rbx], byte 0

pslld xmm1, xmm2
pslld xmm1, dqword [rbx]
pslld xmm1, byte 5

pslldq xmm1, byte 5

psllq xmm1, xmm2
psllq xmm1, dqword [rbx]
psllq xmm1, byte 5

psllw xmm1, xmm2
psllw xmm1, dqword [rbx]
psllw xmm1, byte 5

psrad xmm1, xmm2
psrad xmm1, dqword [rbx]
psrad xmm1, byte 5

psraw xmm1, xmm2
psraw xmm1, dqword [rbx]
psraw xmm1, byte 5

psrld xmm1, xmm2
psrld xmm1, dqword [rbx]
psrld xmm1, byte 5

psrldq xmm1, byte 5

psrlq xmm1, xmm2
psrlq xmm1, dqword [rbx]
psrlq xmm1, byte 5

psrlw xmm1, xmm2
psrlw xmm1, dqword [rbx]
psrlw xmm1, byte 5

psubb xmm1, xmm2
psubb xmm1, dqword [rbx]

psubd xmm1, xmm2
psubd xmm1, dqword [rbx]

psubq xmm1, xmm2
psubq xmm1, dqword [rbx]

psubsb xmm1, xmm2
psubsb xmm1, dqword [rbx]

psubsw xmm1, xmm2
psubsw xmm1, dqword [rbx]

psubusb xmm1, xmm2
psubusb xmm1, dqword [rbx]

psubusw xmm1, xmm2
psubusw xmm1, dqword [rbx]

psubw xmm1, xmm2
psubw xmm1, dqword [rbx]

punpckhbw xmm1, xmm2
punpckhbw xmm1, dqword [rbx]

punpckhdq xmm1, xmm2
punpckhdq xmm1, dqword [rbx]

punpckhqdq xmm1, xmm2
punpckhqdq xmm1, dqword [rbx]

punpckhwd xmm1, xmm2
punpckhwd xmm1, dqword [rbx]

punpcklbw xmm1, xmm2
punpcklbw xmm1, dqword [rbx]

punpckldq xmm1, xmm2
punpckldq xmm1, dqword [rbx]

punpcklqdq xmm1, xmm2
punpcklqdq xmm1, dqword [rbx]

punpcklwd xmm1, xmm2
punpcklwd xmm1, dqword [rbx]

pxor xmm1, xmm2
pxor xmm1, dqword [rbx]

rcpps xmm1, xmm2
rcpps xmm1, dqword [rbx]

rcpss xmm1, xmm2
rcpss xmm1, dword [rbx]

rsqrtps xmm1, xmm2
rsqrtps xmm1, dqword [rbx]

rsqrtss xmm1, xmm2
rsqrtss xmm1, dword [rbx]

shufpd xmm1, xmm2, 0
shufpd xmm1, dqword [rbx], byte 0

shufps xmm1, xmm2, 0
shufps xmm1, dqword [rbx], byte 0

sqrtpd xmm1, xmm2
sqrtpd xmm1, dqword [rbx]

sqrtps xmm1, xmm2
sqrtps xmm1, dqword [rbx]

sqrtsd xmm1, xmm2
sqrtsd xmm1, qword [rbx]

sqrtss xmm1, xmm2
sqrtss xmm1, dword [rbx]

stmxcsr dword [rbx]

subpd xmm1, xmm2
subpd xmm1, dqword [rbx]

subps xmm1, xmm2
subps xmm1, dqword [rbx]

subsd xmm1, xmm2
subsd xmm1, qword [rbx]

subss xmm1, xmm2
subss xmm1, dword [rbx]

ucomisd xmm1, xmm2
ucomisd xmm1, qword [rbx]

ucomiss xmm1, xmm2
ucomiss xmm1, dword [rbx]

unpckhpd xmm1, xmm2
unpckhpd xmm1, dqword [rbx]

unpckhps xmm1, xmm2
unpckhps xmm1, dqword [rbx]

unpcklpd xmm1, xmm2
unpcklpd xmm1, dqword [rbx]

unpcklps xmm1, xmm2
unpcklps xmm1, dqword [rbx]

xorpd xmm1, xmm2
xorpd xmm1, dqword [rbx]

xorps xmm1, xmm2
xorps xmm1, dqword [rbx]