]> Cypherpunks repositories - gostls13.git/commitdiff
cmd/asm: enable AVX512
authorisharipo <iskander.sharipov@intel.com>
Tue, 15 May 2018 23:21:59 +0000 (02:21 +0300)
committerIlya Tocar <ilya.tocar@intel.com>
Tue, 22 May 2018 14:57:15 +0000 (14:57 +0000)
- Uncomment tests for AVX512 encoder
- Permit instruction suffixes for x86
- Permit limited reg list [reg-reg] syntax for x86 for multi-source ops
- EVEX encoding support in obj/x86 (Z-cases, asmevex, etc.)
- optabs and ytabs generated by x86avxgen (https://golang.org/cl/107216)

Note: suffix formatting implemented with updated CConv function.
Now arch asm backend should register formatting function by
calling RegisterOpSuffix.

Updates #22779

Change-Id: I076a167ee49582700e058c56ad74e6696710c8c8
Reviewed-on: https://go-review.googlesource.com/113315
Run-TryBot: Iskander Sharipov <iskander.sharipov@intel.com>
TryBot-Result: Gobot Gobot <gobot@golang.org>
Reviewed-by: Cherry Zhang <cherryyz@google.com>
36 files changed:
src/cmd/asm/internal/asm/asm.go
src/cmd/asm/internal/asm/expr_test.go
src/cmd/asm/internal/asm/line_test.go [new file with mode: 0644]
src/cmd/asm/internal/asm/operand_test.go
src/cmd/asm/internal/asm/parse.go
src/cmd/asm/internal/asm/testdata/amd64error.s
src/cmd/asm/internal/asm/testdata/avx512enc/aes_avx512f.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_4fmaps.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_4vnniw.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_bitalg.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_ifma.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_vbmi.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_vbmi2.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_vnni.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512_vpopcntdq.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512bw.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512cd.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512dq.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512er.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512f.s
src/cmd/asm/internal/asm/testdata/avx512enc/avx512pf.s
src/cmd/asm/internal/asm/testdata/avx512enc/gfni_avx512f.s
src/cmd/asm/internal/asm/testdata/avx512enc/vpclmulqdq_avx512f.s
src/cmd/internal/obj/arm/list5.go
src/cmd/internal/obj/arm64/list7.go
src/cmd/internal/obj/link.go
src/cmd/internal/obj/util.go
src/cmd/internal/obj/x86/a.out.go
src/cmd/internal/obj/x86/aenum.go
src/cmd/internal/obj/x86/anames.go
src/cmd/internal/obj/x86/asm6.go
src/cmd/internal/obj/x86/asm_test.go [new file with mode: 0644]
src/cmd/internal/obj/x86/avx_optabs.go [new file with mode: 0644]
src/cmd/internal/obj/x86/evex.go [new file with mode: 0644]
src/cmd/internal/obj/x86/list6.go
src/cmd/internal/obj/x86/vex_optabs.go [deleted file]

index 17572e731df102fdebc5b06f96ecfd0597812f08..1e2d5d39edb9621a5f181d2e614216aa42c85e95 100644 (file)
@@ -13,6 +13,7 @@ import (
        "cmd/asm/internal/flags"
        "cmd/asm/internal/lex"
        "cmd/internal/obj"
+       "cmd/internal/obj/x86"
        "cmd/internal/objabi"
        "cmd/internal/sys"
 )
@@ -38,6 +39,12 @@ func (p *Parser) append(prog *obj.Prog, cond string, doLabel bool) {
                                return
                        }
 
+               case sys.AMD64, sys.I386:
+                       if err := x86.ParseSuffix(prog, cond); err != nil {
+                               p.errorf("%v", err)
+                               return
+                       }
+
                default:
                        p.errorf("unrecognized suffix .%q", cond)
                        return
@@ -740,6 +747,12 @@ func (p *Parser) asmInstruction(op obj.As, cond string, a []obj.Addr) {
                        prog.To = a[4]
                        break
                }
+               if p.arch.Family == sys.AMD64 {
+                       prog.From = a[0]
+                       prog.RestArgs = []obj.Addr{a[1], a[2], a[3]}
+                       prog.To = a[4]
+                       break
+               }
                p.errorf("can't handle %s instruction with 5 operands", op)
                return
        case 6:
index eafbc5fee715910a73b7f2f9d7148c959736bdfe..1251594349fc01da5e074395e811a5e8da85c74d 100644 (file)
@@ -97,10 +97,6 @@ var badExprTests = []badExprTest{
 }
 
 func TestBadExpr(t *testing.T) {
-       panicOnError = true
-       defer func() {
-               panicOnError = false
-       }()
        for i, test := range badExprTests {
                err := runBadTest(i, test, t)
                if err == nil {
@@ -119,13 +115,7 @@ func TestBadExpr(t *testing.T) {
 func runBadTest(i int, test badExprTest, t *testing.T) (err error) {
        p := NewParser(nil, nil, nil) // Expression evaluation uses none of these fields of the parser.
        p.start(lex.Tokenize(test.input))
-       defer func() {
-               e := recover()
-               var ok bool
-               if err, ok = e.(error); e != nil && !ok {
-                       t.Fatal(e)
-               }
-       }()
-       p.expr()
-       return nil
+       return tryParse(t, func() {
+               p.expr()
+       })
 }
diff --git a/src/cmd/asm/internal/asm/line_test.go b/src/cmd/asm/internal/asm/line_test.go
new file mode 100644 (file)
index 0000000..b77337b
--- /dev/null
@@ -0,0 +1,52 @@
+// Copyright 2018 The Go Authors. All rights reserved.
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+package asm
+
+import (
+       "cmd/asm/internal/lex"
+       "strings"
+       "testing"
+)
+
+type badInstTest struct {
+       input, error string
+}
+
+func TestAMD64BadInstParser(t *testing.T) {
+       testBadInstParser(t, "amd64", []badInstTest{
+               // Test AVX512 suffixes.
+               {"VADDPD.A X0, X1, X2", `unknown suffix "A"`},
+               {"VADDPD.A.A X0, X1, X2", `unknown suffix "A"; duplicate suffix "A"`},
+               {"VADDPD.A.A.A X0, X1, X2", `unknown suffix "A"; duplicate suffix "A"`},
+               {"VADDPD.A.B X0, X1, X2", `unknown suffix "A"; unknown suffix "B"`},
+               {"VADDPD.Z.A X0, X1, X2", `Z suffix should be the last; unknown suffix "A"`},
+               {"VADDPD.Z.Z X0, X1, X2", `Z suffix should be the last; duplicate suffix "Z"`},
+               {"VADDPD.SAE.BCST X0, X1, X2", `can't combine rounding/SAE and broadcast`},
+               {"VADDPD.BCST.SAE X0, X1, X2", `can't combine rounding/SAE and broadcast`},
+               {"VADDPD.BCST.Z.SAE X0, X1, X2", `Z suffix should be the last; can't combine rounding/SAE and broadcast`},
+               {"VADDPD.SAE.SAE X0, X1, X2", `duplicate suffix "SAE"`},
+               {"VADDPD.RZ_SAE.SAE X0, X1, X2", `bad suffix combination`},
+       })
+}
+
+func testBadInstParser(t *testing.T, goarch string, tests []badInstTest) {
+       for i, test := range tests {
+               arch, ctxt := setArch(goarch)
+               tokenizer := lex.NewTokenizer("", strings.NewReader(test.input+"\n"), nil)
+               parser := NewParser(ctxt, arch, tokenizer)
+
+               err := tryParse(t, func() {
+                       parser.start(lex.Tokenize(test.input))
+                       parser.line()
+               })
+
+               switch {
+               case err == nil:
+                       t.Errorf("#%d: %q: want error %q; have none", i, test.input, test.error)
+               case !strings.Contains(err.Error(), test.error):
+                       t.Errorf("#%d: %q: want error %q; have %q", i, test.input, test.error, err)
+               }
+       }
+}
index 75cbd9b4912d9f659a8384c465b7ac876f37c1d0..1d1cf510cb77dc75e27a5e59a3550c4c1ca0ade6 100644 (file)
@@ -5,6 +5,7 @@
 package asm
 
 import (
+       "strings"
        "testing"
 
        "cmd/asm/internal/arch"
@@ -30,6 +31,45 @@ func newParser(goarch string) *Parser {
        return NewParser(ctxt, architecture, nil)
 }
 
+// tryParse executes parse func in panicOnError=true context.
+// parse is expected to call any parsing methods that may panic.
+// Returns error gathered from recover; nil if no parse errors occured.
+//
+// For unexpected panics, calls t.Fatal.
+func tryParse(t *testing.T, parse func()) (err error) {
+       panicOnError = true
+       defer func() {
+               panicOnError = false
+
+               e := recover()
+               var ok bool
+               if err, ok = e.(error); e != nil && !ok {
+                       t.Fatal(e)
+               }
+       }()
+
+       parse()
+
+       return nil
+}
+
+func testBadOperandParser(t *testing.T, parser *Parser, tests []badOperandTest) {
+       for _, test := range tests {
+               err := tryParse(t, func() {
+                       parser.start(lex.Tokenize(test.input))
+                       addr := obj.Addr{}
+                       parser.operand(&addr)
+               })
+
+               switch {
+               case err == nil:
+                       t.Errorf("fail at %s: got no errors; expected %s\n", test.input, test.error)
+               case !strings.Contains(err.Error(), test.error):
+                       t.Errorf("fail at %s: got %s; expected %s", test.input, err, test.error)
+               }
+       }
+}
+
 func testOperandParser(t *testing.T, parser *Parser, tests []operandTest) {
        for _, test := range tests {
                parser.start(lex.Tokenize(test.input))
@@ -45,6 +85,7 @@ func testOperandParser(t *testing.T, parser *Parser, tests []operandTest) {
 func TestAMD64OperandParser(t *testing.T) {
        parser := newParser("amd64")
        testOperandParser(t, parser, amd64OperandTests)
+       testBadOperandParser(t, parser, amd64BadOperandTests)
 }
 
 func Test386OperandParser(t *testing.T) {
@@ -85,6 +126,10 @@ type operandTest struct {
        input, output string
 }
 
+type badOperandTest struct {
+       input, error string
+}
+
 // Examples collected by scanning all the assembly in the standard repo.
 
 var amd64OperandTests = []operandTest{
@@ -202,9 +247,28 @@ var amd64OperandTests = []operandTest{
        {"y+56(FP)", "y+56(FP)"},
        {"·AddUint32(SB)", "\"\".AddUint32(SB)"},
        {"·callReflect(SB)", "\"\".callReflect(SB)"},
+       {"[X0-X0]", "[X0-X0]"},
+       {"[ Z9 - Z12 ]", "[Z9-Z12]"},
+       {"[X0-AX]", "[X0-AX]"},
+       {"[AX-X0]", "[AX-X0]"},
        {"[):[o-FP", ""}, // Issue 12469 - asm hung parsing the o-FP range on non ARM platforms.
 }
 
+var amd64BadOperandTests = []badOperandTest{
+       {"[", "register list: expected ']', found EOF"},
+       {"[4", "register list: bad low register in `[4`"},
+       {"[]", "register list: bad low register in `[]`"},
+       {"[f-x]", "register list: bad low register in `[f`"},
+       {"[r10-r13]", "register list: bad low register in `[r10`"},
+       {"[k3-k6]", "register list: bad low register in `[k3`"},
+       {"[X0]", "register list: expected '-' after `[X0`, found ']'"},
+       {"[X0-]", "register list: bad high register in `[X0-]`"},
+       {"[X0-x]", "register list: bad high register in `[X0-x`"},
+       {"[X0-X1-X2]", "register list: expected ']' after `[X0-X1`, found '-'"},
+       {"[X0,X3]", "register list: expected '-' after `[X0`, found ','"},
+       {"[X0,X1,X2,X3]", "register list: expected '-' after `[X0`, found ','"},
+}
+
 var x86OperandTests = []operandTest{
        {"$(2.928932188134524e-01)", "$(0.29289321881345243)"},
        {"$-1", "$-1"},
index 0ac1f04c10e63b0684d084797d3a0455beb48655..48749b7874a825f623aa7638d37f6aa54daa92fe 100644 (file)
@@ -19,6 +19,7 @@ import (
        "cmd/asm/internal/flags"
        "cmd/asm/internal/lex"
        "cmd/internal/obj"
+       "cmd/internal/obj/x86"
        "cmd/internal/src"
        "cmd/internal/sys"
 )
@@ -134,12 +135,12 @@ func (p *Parser) line() bool {
                for {
                        tok = p.lex.Next()
                        if len(operands) == 0 && len(items) == 0 {
-                               if p.arch.InFamily(sys.ARM, sys.ARM64) && tok == '.' {
-                                       // ARM conditionals.
+                               if p.arch.InFamily(sys.ARM, sys.ARM64, sys.AMD64, sys.I386) && tok == '.' {
+                                       // Suffixes: ARM conditionals or x86 modifiers.
                                        tok = p.lex.Next()
                                        str := p.lex.Text()
                                        if tok != scanner.Ident {
-                                               p.errorf("ARM condition expected identifier, found %s", str)
+                                               p.errorf("instruction suffix expected identifier, found %s", str)
                                        }
                                        cond = cond + "." + str
                                        continue
@@ -827,8 +828,25 @@ func (p *Parser) registerIndirect(a *obj.Addr, prefix rune) {
 // registers, as in [R1,R3-R5] or [V1.S4, V2.S4, V3.S4, V4.S4].
 // For ARM, only R0 through R15 may appear.
 // For ARM64, V0 through V31 with arrangement may appear.
+//
+// For 386/AMD64 register list specifies 4VNNIW-style multi-source operand.
+// For range of 4 elements, Intel manual uses "+3" notation, for example:
+//     VP4DPWSSDS zmm1{k1}{z}, zmm2+3, m128
+// Given asm line:
+//     VP4DPWSSDS Z5, [Z10-Z13], (AX)
+// zmm2 is Z10, and Z13 is the only valid value for it (Z10+3).
+// Only simple ranges are accepted, like [Z0-Z3].
+//
 // The opening bracket has been consumed.
 func (p *Parser) registerList(a *obj.Addr) {
+       if p.arch.InFamily(sys.I386, sys.AMD64) {
+               p.registerListX86(a)
+       } else {
+               p.registerListARM(a)
+       }
+}
+
+func (p *Parser) registerListARM(a *obj.Addr) {
        // One range per loop.
        var maxReg int
        var bits uint16
@@ -923,6 +941,39 @@ ListLoop:
        }
 }
 
+func (p *Parser) registerListX86(a *obj.Addr) {
+       // Accept only [RegA-RegB] syntax.
+       // Don't use p.get() to provide better error messages.
+
+       loName := p.next().String()
+       lo, ok := p.arch.Register[loName]
+       if !ok {
+               if loName == "EOF" {
+                       p.errorf("register list: expected ']', found EOF")
+               } else {
+                       p.errorf("register list: bad low register in `[%s`", loName)
+               }
+               return
+       }
+       if tok := p.next().ScanToken; tok != '-' {
+               p.errorf("register list: expected '-' after `[%s`, found %s", loName, tok)
+               return
+       }
+       hiName := p.next().String()
+       hi, ok := p.arch.Register[hiName]
+       if !ok {
+               p.errorf("register list: bad high register in `[%s-%s`", loName, hiName)
+               return
+       }
+       if tok := p.next().ScanToken; tok != ']' {
+               p.errorf("register list: expected ']' after `[%s-%s`, found %s", loName, hiName, tok)
+       }
+
+       a.Type = obj.TYPE_REGLIST
+       a.Reg = lo
+       a.Offset = x86.EncodeRegisterRange(lo, hi)
+}
+
 // register number is ARM-specific. It returns the number of the specified register.
 func (p *Parser) registerNumber(name string) uint16 {
        if p.arch.Family == sys.ARM && name == "g" {
index 87f6ecf7e97934ca08d76edb62450452f2b89313..93272e39d541de74e30fb041d2595eb0cb2648d4 100644 (file)
@@ -23,6 +23,10 @@ TEXT errors(SB),$0
        // No VSIB for legacy instructions.
        MOVL (AX)(X0*1), AX             // ERROR "invalid instruction"
        MOVL (AX)(Y0*1), AX             // ERROR "invalid instruction"
+       // VSIB/VM is invalid without vector index.
+       // TODO(quasilyte): improve error message (#21860).
+       // "invalid VSIB address (missing vector index)"
+       VPGATHERQQ Y2, (BP), Y1         // ERROR "invalid instruction"
        // AVX2GATHER mask/index/dest #UD cases.
        VPGATHERQQ Y2, (BP)(X2*2), Y2   // ERROR "mask, index, and destination registers should be distinct"
        VPGATHERQQ Y2, (BP)(X2*2), Y7   // ERROR "mask, index, and destination registers should be distinct"
@@ -70,4 +74,62 @@ TEXT errors(SB),$0
        MOVQ (AX), DR3                  // ERROR "invalid instruction"
        MOVQ (AX), DR6                  // ERROR "invalid instruction"
        MOVQ (AX), DR7                  // ERROR "invalid instruction"
+        // AVX512GATHER index/index #UD cases.
+       VPGATHERQQ (BP)(X2*2), K1, X2   // ERROR "index and destination registers should be distinct"
+       VPGATHERQQ (BP)(Y15*2), K1, Y15 // ERROR "index and destination registers should be distinct"
+       VPGATHERQQ (BP)(Z20*2), K1, Z20 // ERROR "index and destination registers should be distinct"
+       VPGATHERDQ (BP)(X2*2), K1, X2   // ERROR "index and destination registers should be distinct"
+       VPGATHERDQ (BP)(X15*2), K1, Y15 // ERROR "index and destination registers should be distinct"
+       VPGATHERDQ (BP)(Y20*2), K1, Z20 // ERROR "index and destination registers should be distinct"
+       // Instructions without EVEX variant can't use High-16 registers.
+       VADDSUBPD X20, X1, X2           // ERROR "invalid instruction"
+       VADDSUBPS X0, X20, X2           // ERROR "invalid instruction"
+       // Use of K0 for write mask (Yknot0).
+       // TODO(quasilyte): improve error message (#21860).
+       //                  "K0 can't be used for write mask"
+       VADDPD X0, X1, K0, X2           // ERROR "invalid instruction"
+       VADDPD Y0, Y1, K0, Y2           // ERROR "invalid instruction"
+       VADDPD Z0, Z1, K0, Z2           // ERROR "invalid instruction"
+       // VEX-encoded VSIB can't use High-16 registers as index (unlike EVEX).
+       // TODO(quasilyte): improve error message (#21860).
+       VPGATHERQQ X2, (BP)(X20*2), X3  // ERROR "invalid instruction"
+       VPGATHERQQ Y2, (BP)(Y20*2), Y3  // ERROR "invalid instruction"
+       // YzrMulti4 expects exactly 4 registers referenced by REG_LIST.
+       // TODO(quasilyte): improve error message (#21860).
+       V4FMADDPS (AX), [Z0-Z4], K1, Z7  // ERROR "invalid instruction"
+       V4FMADDPS (AX), [Z0-Z0], K1, Z7  // ERROR "invalid instruction"
+       // Invalid ranges in REG_LIST (low > high).
+       // TODO(quasilyte): improve error message (#21860).
+       V4FMADDPS (AX), [Z4-Z0], K1, Z7  // ERROR "invalid instruction"
+       V4FMADDPS (AX), [Z1-Z0], K1, Z7  // ERROR "invalid instruction"
+       // Mismatching registers in a range.
+       // TODO(quasilyte): improve error message (#21860).
+       V4FMADDPS (AX), [AX-Z3], K1, Z7  // ERROR "invalid instruction"
+       V4FMADDPS (AX), [Z0-AX], K1, Z7  // ERROR "invalid instruction"
+       // Usage of suffixes for non-EVEX instructions.
+       ADCB.Z $7, AL                    // ERROR "invalid instruction"
+       ADCB.RU_SAE $7, AL               // ERROR "invalid instruction"
+       ADCB.RU_SAE.Z $7, AL             // ERROR "invalid instruction"
+       // Usage of rounding with invalid operands.
+       VADDPD.RU_SAE X3, X2, K1, X1     // ERROR "unsupported rounding"
+       VADDPD.RD_SAE X3, X2, K1, X1     // ERROR "unsupported rounding"
+       VADDPD.RZ_SAE X3, X2, K1, X1     // ERROR "unsupported rounding"
+       VADDPD.RN_SAE X3, X2, K1, X1     // ERROR "unsupported rounding"
+       VADDPD.RU_SAE Y3, Y2, K1, Y1     // ERROR "unsupported rounding"
+       VADDPD.RD_SAE Y3, Y2, K1, Y1     // ERROR "unsupported rounding"
+       VADDPD.RZ_SAE Y3, Y2, K1, Y1     // ERROR "unsupported rounding"
+       VADDPD.RN_SAE Y3, Y2, K1, Y1     // ERROR "unsupported rounding"
+       // Unsupported SAE.
+       VMAXPD.SAE (AX), Z2, K1, Z1      // ERROR "illegal SAE with memory argument"
+       VADDPD.SAE X3, X2, K1, X1        // ERROR "unsupported SAE"
+       // Unsupported zeroing.
+       VFPCLASSPDX.Z $0, (AX), K2, K1   // ERROR "unsupported zeroing"
+       VFPCLASSPDY.Z $0, (AX), K2, K1   // ERROR "unsupported zeroing"
+       // Unsupported broadcast.
+       VFPCLASSSD.BCST $0, (AX), K2, K1 // ERROR "unsupported broadcast"
+       VFPCLASSSS.BCST $0, (AX), K2, K1 // ERROR "unsupported broadcast"
+       // Broadcast without memory operand.
+       VADDPD.BCST X3, X2, K1, X1       // ERROR "illegal broadcast without memory argument"
+       VADDPD.BCST X3, X2, K1, X1       // ERROR "illegal broadcast without memory argument"
+       VADDPD.BCST X3, X2, K1, X1       // ERROR "illegal broadcast without memory argument"
        RET
index f83f74b4c1e6c18d2b29aa6cd36c794b14c820ed..87fa5f718a49fe9de5ddc60c79a6b2eaf2014cd1 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_aes_avx512f(SB), NOSPLIT, $0
-       //TODO: VAESDEC X24, X7, X11                               // 62124508ded8 or 6212c508ded8
-       //TODO: VAESDEC X20, X7, X11                               // 62324508dedc or 6232c508dedc
-       //TODO: VAESDEC X24, X0, X11                               // 62127d08ded8 or 6212fd08ded8
-       //TODO: VAESDEC X20, X0, X11                               // 62327d08dedc or 6232fd08dedc
-       //TODO: VAESDEC X24, X7, X31                               // 62024508def8 or 6202c508def8
-       //TODO: VAESDEC X20, X7, X31                               // 62224508defc or 6222c508defc
-       //TODO: VAESDEC X7, X7, X31                                // 62624508deff or 6262c508deff
-       //TODO: VAESDEC -7(DI)(R8*1), X7, X31                      // 62224508debc07f9ffffff or 6222c508debc07f9ffffff
-       //TODO: VAESDEC (SP), X7, X31                              // 62624508de3c24 or 6262c508de3c24
-       //TODO: VAESDEC X24, X0, X31                               // 62027d08def8 or 6202fd08def8
-       //TODO: VAESDEC X20, X0, X31                               // 62227d08defc or 6222fd08defc
-       //TODO: VAESDEC X7, X0, X31                                // 62627d08deff or 6262fd08deff
-       //TODO: VAESDEC -7(DI)(R8*1), X0, X31                      // 62227d08debc07f9ffffff or 6222fd08debc07f9ffffff
-       //TODO: VAESDEC (SP), X0, X31                              // 62627d08de3c24 or 6262fd08de3c24
-       //TODO: VAESDEC X24, X7, X3                                // 62924508ded8 or 6292c508ded8
-       //TODO: VAESDEC X20, X7, X3                                // 62b24508dedc or 62b2c508dedc
-       //TODO: VAESDEC X24, X0, X3                                // 62927d08ded8 or 6292fd08ded8
-       //TODO: VAESDEC X20, X0, X3                                // 62b27d08dedc or 62b2fd08dedc
-       //TODO: VAESDEC Y5, Y31, Y22                               // 62e20520def5 or 62e28520def5
-       //TODO: VAESDEC Y19, Y31, Y22                              // 62a20520def3 or 62a28520def3
-       //TODO: VAESDEC Y31, Y31, Y22                              // 62820520def7 or 62828520def7
-       //TODO: VAESDEC 99(R15)(R15*1), Y31, Y22                   // 62820520deb43f63000000 or 62828520deb43f63000000
-       //TODO: VAESDEC (DX), Y31, Y22                             // 62e20520de32 or 62e28520de32
-       //TODO: VAESDEC Y5, Y5, Y22                                // 62e25528def5 or 62e2d528def5
-       //TODO: VAESDEC Y19, Y5, Y22                               // 62a25528def3 or 62a2d528def3
-       //TODO: VAESDEC Y31, Y5, Y22                               // 62825528def7 or 6282d528def7
-       //TODO: VAESDEC 99(R15)(R15*1), Y5, Y22                    // 62825528deb43f63000000 or 6282d528deb43f63000000
-       //TODO: VAESDEC (DX), Y5, Y22                              // 62e25528de32 or 62e2d528de32
-       //TODO: VAESDEC Y5, Y0, Y22                                // 62e27d28def5 or 62e2fd28def5
-       //TODO: VAESDEC Y19, Y0, Y22                               // 62a27d28def3 or 62a2fd28def3
-       //TODO: VAESDEC Y31, Y0, Y22                               // 62827d28def7 or 6282fd28def7
-       //TODO: VAESDEC 99(R15)(R15*1), Y0, Y22                    // 62827d28deb43f63000000 or 6282fd28deb43f63000000
-       //TODO: VAESDEC (DX), Y0, Y22                              // 62e27d28de32 or 62e2fd28de32
-       //TODO: VAESDEC Y5, Y31, Y9                                // 62720520decd or 62728520decd
-       //TODO: VAESDEC Y19, Y31, Y9                               // 62320520decb or 62328520decb
-       //TODO: VAESDEC Y31, Y31, Y9                               // 62120520decf or 62128520decf
-       //TODO: VAESDEC 99(R15)(R15*1), Y31, Y9                    // 62120520de8c3f63000000 or 62128520de8c3f63000000
-       //TODO: VAESDEC (DX), Y31, Y9                              // 62720520de0a or 62728520de0a
-       //TODO: VAESDEC Y19, Y5, Y9                                // 62325528decb or 6232d528decb
-       //TODO: VAESDEC Y31, Y5, Y9                                // 62125528decf or 6212d528decf
-       //TODO: VAESDEC Y19, Y0, Y9                                // 62327d28decb or 6232fd28decb
-       //TODO: VAESDEC Y31, Y0, Y9                                // 62127d28decf or 6212fd28decf
-       //TODO: VAESDEC Y5, Y31, Y23                               // 62e20520defd or 62e28520defd
-       //TODO: VAESDEC Y19, Y31, Y23                              // 62a20520defb or 62a28520defb
-       //TODO: VAESDEC Y31, Y31, Y23                              // 62820520deff or 62828520deff
-       //TODO: VAESDEC 99(R15)(R15*1), Y31, Y23                   // 62820520debc3f63000000 or 62828520debc3f63000000
-       //TODO: VAESDEC (DX), Y31, Y23                             // 62e20520de3a or 62e28520de3a
-       //TODO: VAESDEC Y5, Y5, Y23                                // 62e25528defd or 62e2d528defd
-       //TODO: VAESDEC Y19, Y5, Y23                               // 62a25528defb or 62a2d528defb
-       //TODO: VAESDEC Y31, Y5, Y23                               // 62825528deff or 6282d528deff
-       //TODO: VAESDEC 99(R15)(R15*1), Y5, Y23                    // 62825528debc3f63000000 or 6282d528debc3f63000000
-       //TODO: VAESDEC (DX), Y5, Y23                              // 62e25528de3a or 62e2d528de3a
-       //TODO: VAESDEC Y5, Y0, Y23                                // 62e27d28defd or 62e2fd28defd
-       //TODO: VAESDEC Y19, Y0, Y23                               // 62a27d28defb or 62a2fd28defb
-       //TODO: VAESDEC Y31, Y0, Y23                               // 62827d28deff or 6282fd28deff
-       //TODO: VAESDEC 99(R15)(R15*1), Y0, Y23                    // 62827d28debc3f63000000 or 6282fd28debc3f63000000
-       //TODO: VAESDEC (DX), Y0, Y23                              // 62e27d28de3a or 62e2fd28de3a
-       //TODO: VAESDEC Z27, Z3, Z11                               // 62126548dedb or 6212e548dedb
-       //TODO: VAESDEC Z15, Z3, Z11                               // 62526548dedf or 6252e548dedf
-       //TODO: VAESDEC 99(R15)(R15*1), Z3, Z11                    // 62126548de9c3f63000000 or 6212e548de9c3f63000000
-       //TODO: VAESDEC (DX), Z3, Z11                              // 62726548de1a or 6272e548de1a
-       //TODO: VAESDEC Z27, Z12, Z11                              // 62121d48dedb or 62129d48dedb
-       //TODO: VAESDEC Z15, Z12, Z11                              // 62521d48dedf or 62529d48dedf
-       //TODO: VAESDEC 99(R15)(R15*1), Z12, Z11                   // 62121d48de9c3f63000000 or 62129d48de9c3f63000000
-       //TODO: VAESDEC (DX), Z12, Z11                             // 62721d48de1a or 62729d48de1a
-       //TODO: VAESDEC Z27, Z3, Z25                               // 62026548decb or 6202e548decb
-       //TODO: VAESDEC Z15, Z3, Z25                               // 62426548decf or 6242e548decf
-       //TODO: VAESDEC 99(R15)(R15*1), Z3, Z25                    // 62026548de8c3f63000000 or 6202e548de8c3f63000000
-       //TODO: VAESDEC (DX), Z3, Z25                              // 62626548de0a or 6262e548de0a
-       //TODO: VAESDEC Z27, Z12, Z25                              // 62021d48decb or 62029d48decb
-       //TODO: VAESDEC Z15, Z12, Z25                              // 62421d48decf or 62429d48decf
-       //TODO: VAESDEC 99(R15)(R15*1), Z12, Z25                   // 62021d48de8c3f63000000 or 62029d48de8c3f63000000
-       //TODO: VAESDEC (DX), Z12, Z25                             // 62621d48de0a or 62629d48de0a
-       //TODO: VAESDECLAST X21, X5, X9                            // 62325508dfcd or 6232d508dfcd
-       //TODO: VAESDECLAST X21, X31, X9                           // 62320500dfcd or 62328500dfcd
-       //TODO: VAESDECLAST X1, X31, X9                            // 62720500dfc9 or 62728500dfc9
-       //TODO: VAESDECLAST X11, X31, X9                           // 62520500dfcb or 62528500dfcb
-       //TODO: VAESDECLAST -7(CX), X31, X9                        // 62720500df89f9ffffff or 62728500df89f9ffffff
-       //TODO: VAESDECLAST 15(DX)(BX*4), X31, X9                  // 62720500df8c9a0f000000 or 62728500df8c9a0f000000
-       //TODO: VAESDECLAST X21, X3, X9                            // 62326508dfcd or 6232e508dfcd
-       //TODO: VAESDECLAST X21, X5, X7                            // 62b25508dffd or 62b2d508dffd
-       //TODO: VAESDECLAST X21, X31, X7                           // 62b20500dffd or 62b28500dffd
-       //TODO: VAESDECLAST X1, X31, X7                            // 62f20500dff9 or 62f28500dff9
-       //TODO: VAESDECLAST X11, X31, X7                           // 62d20500dffb or 62d28500dffb
-       //TODO: VAESDECLAST -7(CX), X31, X7                        // 62f20500dfb9f9ffffff or 62f28500dfb9f9ffffff
-       //TODO: VAESDECLAST 15(DX)(BX*4), X31, X7                  // 62f20500dfbc9a0f000000 or 62f28500dfbc9a0f000000
-       //TODO: VAESDECLAST X21, X3, X7                            // 62b26508dffd or 62b2e508dffd
-       //TODO: VAESDECLAST X21, X5, X14                           // 62325508dff5 or 6232d508dff5
-       //TODO: VAESDECLAST X21, X31, X14                          // 62320500dff5 or 62328500dff5
-       //TODO: VAESDECLAST X1, X31, X14                           // 62720500dff1 or 62728500dff1
-       //TODO: VAESDECLAST X11, X31, X14                          // 62520500dff3 or 62528500dff3
-       //TODO: VAESDECLAST -7(CX), X31, X14                       // 62720500dfb1f9ffffff or 62728500dfb1f9ffffff
-       //TODO: VAESDECLAST 15(DX)(BX*4), X31, X14                 // 62720500dfb49a0f000000 or 62728500dfb49a0f000000
-       //TODO: VAESDECLAST X21, X3, X14                           // 62326508dff5 or 6232e508dff5
-       //TODO: VAESDECLAST Y31, Y27, Y28                          // 62022520dfe7 or 6202a520dfe7
-       //TODO: VAESDECLAST Y3, Y27, Y28                           // 62622520dfe3 or 6262a520dfe3
-       //TODO: VAESDECLAST Y14, Y27, Y28                          // 62422520dfe6 or 6242a520dfe6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y27, Y28                // 62622520dfa4f5efffffff or 6262a520dfa4f5efffffff
-       //TODO: VAESDECLAST (R15), Y27, Y28                        // 62422520df27 or 6242a520df27
-       //TODO: VAESDECLAST Y31, Y0, Y28                           // 62027d28dfe7 or 6202fd28dfe7
-       //TODO: VAESDECLAST Y3, Y0, Y28                            // 62627d28dfe3 or 6262fd28dfe3
-       //TODO: VAESDECLAST Y14, Y0, Y28                           // 62427d28dfe6 or 6242fd28dfe6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y0, Y28                 // 62627d28dfa4f5efffffff or 6262fd28dfa4f5efffffff
-       //TODO: VAESDECLAST (R15), Y0, Y28                         // 62427d28df27 or 6242fd28df27
-       //TODO: VAESDECLAST Y31, Y11, Y28                          // 62022528dfe7 or 6202a528dfe7
-       //TODO: VAESDECLAST Y3, Y11, Y28                           // 62622528dfe3 or 6262a528dfe3
-       //TODO: VAESDECLAST Y14, Y11, Y28                          // 62422528dfe6 or 6242a528dfe6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y11, Y28                // 62622528dfa4f5efffffff or 6262a528dfa4f5efffffff
-       //TODO: VAESDECLAST (R15), Y11, Y28                        // 62422528df27 or 6242a528df27
-       //TODO: VAESDECLAST Y31, Y27, Y2                           // 62922520dfd7 or 6292a520dfd7
-       //TODO: VAESDECLAST Y3, Y27, Y2                            // 62f22520dfd3 or 62f2a520dfd3
-       //TODO: VAESDECLAST Y14, Y27, Y2                           // 62d22520dfd6 or 62d2a520dfd6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y27, Y2                 // 62f22520df94f5efffffff or 62f2a520df94f5efffffff
-       //TODO: VAESDECLAST (R15), Y27, Y2                         // 62d22520df17 or 62d2a520df17
-       //TODO: VAESDECLAST Y31, Y0, Y2                            // 62927d28dfd7 or 6292fd28dfd7
-       //TODO: VAESDECLAST Y31, Y11, Y2                           // 62922528dfd7 or 6292a528dfd7
-       //TODO: VAESDECLAST Y31, Y27, Y24                          // 62022520dfc7 or 6202a520dfc7
-       //TODO: VAESDECLAST Y3, Y27, Y24                           // 62622520dfc3 or 6262a520dfc3
-       //TODO: VAESDECLAST Y14, Y27, Y24                          // 62422520dfc6 or 6242a520dfc6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y27, Y24                // 62622520df84f5efffffff or 6262a520df84f5efffffff
-       //TODO: VAESDECLAST (R15), Y27, Y24                        // 62422520df07 or 6242a520df07
-       //TODO: VAESDECLAST Y31, Y0, Y24                           // 62027d28dfc7 or 6202fd28dfc7
-       //TODO: VAESDECLAST Y3, Y0, Y24                            // 62627d28dfc3 or 6262fd28dfc3
-       //TODO: VAESDECLAST Y14, Y0, Y24                           // 62427d28dfc6 or 6242fd28dfc6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y0, Y24                 // 62627d28df84f5efffffff or 6262fd28df84f5efffffff
-       //TODO: VAESDECLAST (R15), Y0, Y24                         // 62427d28df07 or 6242fd28df07
-       //TODO: VAESDECLAST Y31, Y11, Y24                          // 62022528dfc7 or 6202a528dfc7
-       //TODO: VAESDECLAST Y3, Y11, Y24                           // 62622528dfc3 or 6262a528dfc3
-       //TODO: VAESDECLAST Y14, Y11, Y24                          // 62422528dfc6 or 6242a528dfc6
-       //TODO: VAESDECLAST -17(BP)(SI*8), Y11, Y24                // 62622528df84f5efffffff or 6262a528df84f5efffffff
-       //TODO: VAESDECLAST (R15), Y11, Y24                        // 62422528df07 or 6242a528df07
-       //TODO: VAESDECLAST Z8, Z23, Z23                           // 62c24540dff8 or 62c2c540dff8
-       //TODO: VAESDECLAST Z28, Z23, Z23                          // 62824540dffc or 6282c540dffc
-       //TODO: VAESDECLAST -17(BP)(SI*8), Z23, Z23                // 62e24540dfbcf5efffffff or 62e2c540dfbcf5efffffff
-       //TODO: VAESDECLAST (R15), Z23, Z23                        // 62c24540df3f or 62c2c540df3f
-       //TODO: VAESDECLAST Z8, Z6, Z23                            // 62c24d48dff8 or 62c2cd48dff8
-       //TODO: VAESDECLAST Z28, Z6, Z23                           // 62824d48dffc or 6282cd48dffc
-       //TODO: VAESDECLAST -17(BP)(SI*8), Z6, Z23                 // 62e24d48dfbcf5efffffff or 62e2cd48dfbcf5efffffff
-       //TODO: VAESDECLAST (R15), Z6, Z23                         // 62c24d48df3f or 62c2cd48df3f
-       //TODO: VAESDECLAST Z8, Z23, Z5                            // 62d24540dfe8 or 62d2c540dfe8
-       //TODO: VAESDECLAST Z28, Z23, Z5                           // 62924540dfec or 6292c540dfec
-       //TODO: VAESDECLAST -17(BP)(SI*8), Z23, Z5                 // 62f24540dfacf5efffffff or 62f2c540dfacf5efffffff
-       //TODO: VAESDECLAST (R15), Z23, Z5                         // 62d24540df2f or 62d2c540df2f
-       //TODO: VAESDECLAST Z8, Z6, Z5                             // 62d24d48dfe8 or 62d2cd48dfe8
-       //TODO: VAESDECLAST Z28, Z6, Z5                            // 62924d48dfec or 6292cd48dfec
-       //TODO: VAESDECLAST -17(BP)(SI*8), Z6, Z5                  // 62f24d48dfacf5efffffff or 62f2cd48dfacf5efffffff
-       //TODO: VAESDECLAST (R15), Z6, Z5                          // 62d24d48df2f or 62d2cd48df2f
-       //TODO: VAESENC X14, X16, X13                              // 62527d00dcee or 6252fd00dcee
-       //TODO: VAESENC X19, X16, X13                              // 62327d00dceb or 6232fd00dceb
-       //TODO: VAESENC X8, X16, X13                               // 62527d00dce8 or 6252fd00dce8
-       //TODO: VAESENC 99(R15)(R15*8), X16, X13                   // 62127d00dcacff63000000 or 6212fd00dcacff63000000
-       //TODO: VAESENC 7(AX)(CX*8), X16, X13                      // 62727d00dcacc807000000 or 6272fd00dcacc807000000
-       //TODO: VAESENC X19, X14, X13                              // 62320d08dceb or 62328d08dceb
-       //TODO: VAESENC X19, X11, X13                              // 62322508dceb or 6232a508dceb
-       //TODO: VAESENC X14, X16, X0                               // 62d27d00dcc6 or 62d2fd00dcc6
-       //TODO: VAESENC X19, X16, X0                               // 62b27d00dcc3 or 62b2fd00dcc3
-       //TODO: VAESENC X8, X16, X0                                // 62d27d00dcc0 or 62d2fd00dcc0
-       //TODO: VAESENC 99(R15)(R15*8), X16, X0                    // 62927d00dc84ff63000000 or 6292fd00dc84ff63000000
-       //TODO: VAESENC 7(AX)(CX*8), X16, X0                       // 62f27d00dc84c807000000 or 62f2fd00dc84c807000000
-       //TODO: VAESENC X19, X14, X0                               // 62b20d08dcc3 or 62b28d08dcc3
-       //TODO: VAESENC X19, X11, X0                               // 62b22508dcc3 or 62b2a508dcc3
-       //TODO: VAESENC X14, X16, X30                              // 62427d00dcf6 or 6242fd00dcf6
-       //TODO: VAESENC X19, X16, X30                              // 62227d00dcf3 or 6222fd00dcf3
-       //TODO: VAESENC X8, X16, X30                               // 62427d00dcf0 or 6242fd00dcf0
-       //TODO: VAESENC 99(R15)(R15*8), X16, X30                   // 62027d00dcb4ff63000000 or 6202fd00dcb4ff63000000
-       //TODO: VAESENC 7(AX)(CX*8), X16, X30                      // 62627d00dcb4c807000000 or 6262fd00dcb4c807000000
-       //TODO: VAESENC X14, X14, X30                              // 62420d08dcf6 or 62428d08dcf6
-       //TODO: VAESENC X19, X14, X30                              // 62220d08dcf3 or 62228d08dcf3
-       //TODO: VAESENC X8, X14, X30                               // 62420d08dcf0 or 62428d08dcf0
-       //TODO: VAESENC 99(R15)(R15*8), X14, X30                   // 62020d08dcb4ff63000000 or 62028d08dcb4ff63000000
-       //TODO: VAESENC 7(AX)(CX*8), X14, X30                      // 62620d08dcb4c807000000 or 62628d08dcb4c807000000
-       //TODO: VAESENC X14, X11, X30                              // 62422508dcf6 or 6242a508dcf6
-       //TODO: VAESENC X19, X11, X30                              // 62222508dcf3 or 6222a508dcf3
-       //TODO: VAESENC X8, X11, X30                               // 62422508dcf0 or 6242a508dcf0
-       //TODO: VAESENC 99(R15)(R15*8), X11, X30                   // 62022508dcb4ff63000000 or 6202a508dcb4ff63000000
-       //TODO: VAESENC 7(AX)(CX*8), X11, X30                      // 62622508dcb4c807000000 or 6262a508dcb4c807000000
-       //TODO: VAESENC Y18, Y15, Y2                               // 62b20528dcd2 or 62b28528dcd2
-       //TODO: VAESENC Y24, Y15, Y2                               // 62920528dcd0 or 62928528dcd0
-       //TODO: VAESENC Y18, Y22, Y2                               // 62b24d20dcd2 or 62b2cd20dcd2
-       //TODO: VAESENC Y24, Y22, Y2                               // 62924d20dcd0 or 6292cd20dcd0
-       //TODO: VAESENC Y9, Y22, Y2                                // 62d24d20dcd1 or 62d2cd20dcd1
-       //TODO: VAESENC 7(SI)(DI*8), Y22, Y2                       // 62f24d20dc94fe07000000 or 62f2cd20dc94fe07000000
-       //TODO: VAESENC -15(R14), Y22, Y2                          // 62d24d20dc96f1ffffff or 62d2cd20dc96f1ffffff
-       //TODO: VAESENC Y18, Y20, Y2                               // 62b25d20dcd2 or 62b2dd20dcd2
-       //TODO: VAESENC Y24, Y20, Y2                               // 62925d20dcd0 or 6292dd20dcd0
-       //TODO: VAESENC Y9, Y20, Y2                                // 62d25d20dcd1 or 62d2dd20dcd1
-       //TODO: VAESENC 7(SI)(DI*8), Y20, Y2                       // 62f25d20dc94fe07000000 or 62f2dd20dc94fe07000000
-       //TODO: VAESENC -15(R14), Y20, Y2                          // 62d25d20dc96f1ffffff or 62d2dd20dc96f1ffffff
-       //TODO: VAESENC Y18, Y15, Y13                              // 62320528dcea or 62328528dcea
-       //TODO: VAESENC Y24, Y15, Y13                              // 62120528dce8 or 62128528dce8
-       //TODO: VAESENC Y18, Y22, Y13                              // 62324d20dcea or 6232cd20dcea
-       //TODO: VAESENC Y24, Y22, Y13                              // 62124d20dce8 or 6212cd20dce8
-       //TODO: VAESENC Y9, Y22, Y13                               // 62524d20dce9 or 6252cd20dce9
-       //TODO: VAESENC 7(SI)(DI*8), Y22, Y13                      // 62724d20dcacfe07000000 or 6272cd20dcacfe07000000
-       //TODO: VAESENC -15(R14), Y22, Y13                         // 62524d20dcaef1ffffff or 6252cd20dcaef1ffffff
-       //TODO: VAESENC Y18, Y20, Y13                              // 62325d20dcea or 6232dd20dcea
-       //TODO: VAESENC Y24, Y20, Y13                              // 62125d20dce8 or 6212dd20dce8
-       //TODO: VAESENC Y9, Y20, Y13                               // 62525d20dce9 or 6252dd20dce9
-       //TODO: VAESENC 7(SI)(DI*8), Y20, Y13                      // 62725d20dcacfe07000000 or 6272dd20dcacfe07000000
-       //TODO: VAESENC -15(R14), Y20, Y13                         // 62525d20dcaef1ffffff or 6252dd20dcaef1ffffff
-       //TODO: VAESENC Y18, Y15, Y27                              // 62220528dcda or 62228528dcda
-       //TODO: VAESENC Y24, Y15, Y27                              // 62020528dcd8 or 62028528dcd8
-       //TODO: VAESENC Y9, Y15, Y27                               // 62420528dcd9 or 62428528dcd9
-       //TODO: VAESENC 7(SI)(DI*8), Y15, Y27                      // 62620528dc9cfe07000000 or 62628528dc9cfe07000000
-       //TODO: VAESENC -15(R14), Y15, Y27                         // 62420528dc9ef1ffffff or 62428528dc9ef1ffffff
-       //TODO: VAESENC Y18, Y22, Y27                              // 62224d20dcda or 6222cd20dcda
-       //TODO: VAESENC Y24, Y22, Y27                              // 62024d20dcd8 or 6202cd20dcd8
-       //TODO: VAESENC Y9, Y22, Y27                               // 62424d20dcd9 or 6242cd20dcd9
-       //TODO: VAESENC 7(SI)(DI*8), Y22, Y27                      // 62624d20dc9cfe07000000 or 6262cd20dc9cfe07000000
-       //TODO: VAESENC -15(R14), Y22, Y27                         // 62424d20dc9ef1ffffff or 6242cd20dc9ef1ffffff
-       //TODO: VAESENC Y18, Y20, Y27                              // 62225d20dcda or 6222dd20dcda
-       //TODO: VAESENC Y24, Y20, Y27                              // 62025d20dcd8 or 6202dd20dcd8
-       //TODO: VAESENC Y9, Y20, Y27                               // 62425d20dcd9 or 6242dd20dcd9
-       //TODO: VAESENC 7(SI)(DI*8), Y20, Y27                      // 62625d20dc9cfe07000000 or 6262dd20dc9cfe07000000
-       //TODO: VAESENC -15(R14), Y20, Y27                         // 62425d20dc9ef1ffffff or 6242dd20dc9ef1ffffff
-       //TODO: VAESENC Z12, Z16, Z21                              // 62c27d40dcec or 62c2fd40dcec
-       //TODO: VAESENC Z27, Z16, Z21                              // 62827d40dceb or 6282fd40dceb
-       //TODO: VAESENC 7(SI)(DI*8), Z16, Z21                      // 62e27d40dcacfe07000000 or 62e2fd40dcacfe07000000
-       //TODO: VAESENC -15(R14), Z16, Z21                         // 62c27d40dcaef1ffffff or 62c2fd40dcaef1ffffff
-       //TODO: VAESENC Z12, Z13, Z21                              // 62c21548dcec or 62c29548dcec
-       //TODO: VAESENC Z27, Z13, Z21                              // 62821548dceb or 62829548dceb
-       //TODO: VAESENC 7(SI)(DI*8), Z13, Z21                      // 62e21548dcacfe07000000 or 62e29548dcacfe07000000
-       //TODO: VAESENC -15(R14), Z13, Z21                         // 62c21548dcaef1ffffff or 62c29548dcaef1ffffff
-       //TODO: VAESENC Z12, Z16, Z5                               // 62d27d40dcec or 62d2fd40dcec
-       //TODO: VAESENC Z27, Z16, Z5                               // 62927d40dceb or 6292fd40dceb
-       //TODO: VAESENC 7(SI)(DI*8), Z16, Z5                       // 62f27d40dcacfe07000000 or 62f2fd40dcacfe07000000
-       //TODO: VAESENC -15(R14), Z16, Z5                          // 62d27d40dcaef1ffffff or 62d2fd40dcaef1ffffff
-       //TODO: VAESENC Z12, Z13, Z5                               // 62d21548dcec or 62d29548dcec
-       //TODO: VAESENC Z27, Z13, Z5                               // 62921548dceb or 62929548dceb
-       //TODO: VAESENC 7(SI)(DI*8), Z13, Z5                       // 62f21548dcacfe07000000 or 62f29548dcacfe07000000
-       //TODO: VAESENC -15(R14), Z13, Z5                          // 62d21548dcaef1ffffff or 62d29548dcaef1ffffff
-       //TODO: VAESENCLAST X23, X12, X8                           // 62321d08ddc7 or 62329d08ddc7
-       //TODO: VAESENCLAST X31, X12, X8                           // 62121d08ddc7 or 62129d08ddc7
-       //TODO: VAESENCLAST X23, X16, X8                           // 62327d00ddc7 or 6232fd00ddc7
-       //TODO: VAESENCLAST X11, X16, X8                           // 62527d00ddc3 or 6252fd00ddc3
-       //TODO: VAESENCLAST X31, X16, X8                           // 62127d00ddc7 or 6212fd00ddc7
-       //TODO: VAESENCLAST (AX), X16, X8                          // 62727d00dd00 or 6272fd00dd00
-       //TODO: VAESENCLAST 7(SI), X16, X8                         // 62727d00dd8607000000 or 6272fd00dd8607000000
-       //TODO: VAESENCLAST X23, X23, X8                           // 62324500ddc7 or 6232c500ddc7
-       //TODO: VAESENCLAST X11, X23, X8                           // 62524500ddc3 or 6252c500ddc3
-       //TODO: VAESENCLAST X31, X23, X8                           // 62124500ddc7 or 6212c500ddc7
-       //TODO: VAESENCLAST (AX), X23, X8                          // 62724500dd00 or 6272c500dd00
-       //TODO: VAESENCLAST 7(SI), X23, X8                         // 62724500dd8607000000 or 6272c500dd8607000000
-       //TODO: VAESENCLAST X23, X12, X26                          // 62221d08ddd7 or 62229d08ddd7
-       //TODO: VAESENCLAST X11, X12, X26                          // 62421d08ddd3 or 62429d08ddd3
-       //TODO: VAESENCLAST X31, X12, X26                          // 62021d08ddd7 or 62029d08ddd7
-       //TODO: VAESENCLAST (AX), X12, X26                         // 62621d08dd10 or 62629d08dd10
-       //TODO: VAESENCLAST 7(SI), X12, X26                        // 62621d08dd9607000000 or 62629d08dd9607000000
-       //TODO: VAESENCLAST X23, X16, X26                          // 62227d00ddd7 or 6222fd00ddd7
-       //TODO: VAESENCLAST X11, X16, X26                          // 62427d00ddd3 or 6242fd00ddd3
-       //TODO: VAESENCLAST X31, X16, X26                          // 62027d00ddd7 or 6202fd00ddd7
-       //TODO: VAESENCLAST (AX), X16, X26                         // 62627d00dd10 or 6262fd00dd10
-       //TODO: VAESENCLAST 7(SI), X16, X26                        // 62627d00dd9607000000 or 6262fd00dd9607000000
-       //TODO: VAESENCLAST X23, X23, X26                          // 62224500ddd7 or 6222c500ddd7
-       //TODO: VAESENCLAST X11, X23, X26                          // 62424500ddd3 or 6242c500ddd3
-       //TODO: VAESENCLAST X31, X23, X26                          // 62024500ddd7 or 6202c500ddd7
-       //TODO: VAESENCLAST (AX), X23, X26                         // 62624500dd10 or 6262c500dd10
-       //TODO: VAESENCLAST 7(SI), X23, X26                        // 62624500dd9607000000 or 6262c500dd9607000000
-       //TODO: VAESENCLAST X23, X12, X23                          // 62a21d08ddff or 62a29d08ddff
-       //TODO: VAESENCLAST X11, X12, X23                          // 62c21d08ddfb or 62c29d08ddfb
-       //TODO: VAESENCLAST X31, X12, X23                          // 62821d08ddff or 62829d08ddff
-       //TODO: VAESENCLAST (AX), X12, X23                         // 62e21d08dd38 or 62e29d08dd38
-       //TODO: VAESENCLAST 7(SI), X12, X23                        // 62e21d08ddbe07000000 or 62e29d08ddbe07000000
-       //TODO: VAESENCLAST X23, X16, X23                          // 62a27d00ddff or 62a2fd00ddff
-       //TODO: VAESENCLAST X11, X16, X23                          // 62c27d00ddfb or 62c2fd00ddfb
-       //TODO: VAESENCLAST X31, X16, X23                          // 62827d00ddff or 6282fd00ddff
-       //TODO: VAESENCLAST (AX), X16, X23                         // 62e27d00dd38 or 62e2fd00dd38
-       //TODO: VAESENCLAST 7(SI), X16, X23                        // 62e27d00ddbe07000000 or 62e2fd00ddbe07000000
-       //TODO: VAESENCLAST X23, X23, X23                          // 62a24500ddff or 62a2c500ddff
-       //TODO: VAESENCLAST X11, X23, X23                          // 62c24500ddfb or 62c2c500ddfb
-       //TODO: VAESENCLAST X31, X23, X23                          // 62824500ddff or 6282c500ddff
-       //TODO: VAESENCLAST (AX), X23, X23                         // 62e24500dd38 or 62e2c500dd38
-       //TODO: VAESENCLAST 7(SI), X23, X23                        // 62e24500ddbe07000000 or 62e2c500ddbe07000000
-       //TODO: VAESENCLAST Y5, Y19, Y3                            // 62f26520dddd or 62f2e520dddd
-       //TODO: VAESENCLAST Y16, Y19, Y3                           // 62b26520ddd8 or 62b2e520ddd8
-       //TODO: VAESENCLAST Y2, Y19, Y3                            // 62f26520ddda or 62f2e520ddda
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y19, Y3                   // 62f26520dd9c3e07000000 or 62f2e520dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y19, Y3                  // 62f26520dd9cda0f000000 or 62f2e520dd9cda0f000000
-       //TODO: VAESENCLAST Y16, Y14, Y3                           // 62b20d28ddd8 or 62b28d28ddd8
-       //TODO: VAESENCLAST Y5, Y21, Y3                            // 62f25520dddd or 62f2d520dddd
-       //TODO: VAESENCLAST Y16, Y21, Y3                           // 62b25520ddd8 or 62b2d520ddd8
-       //TODO: VAESENCLAST Y2, Y21, Y3                            // 62f25520ddda or 62f2d520ddda
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y21, Y3                   // 62f25520dd9c3e07000000 or 62f2d520dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y21, Y3                  // 62f25520dd9cda0f000000 or 62f2d520dd9cda0f000000
-       //TODO: VAESENCLAST Y5, Y19, Y19                           // 62e26520dddd or 62e2e520dddd
-       //TODO: VAESENCLAST Y16, Y19, Y19                          // 62a26520ddd8 or 62a2e520ddd8
-       //TODO: VAESENCLAST Y2, Y19, Y19                           // 62e26520ddda or 62e2e520ddda
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y19, Y19                  // 62e26520dd9c3e07000000 or 62e2e520dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y19, Y19                 // 62e26520dd9cda0f000000 or 62e2e520dd9cda0f000000
-       //TODO: VAESENCLAST Y5, Y14, Y19                           // 62e20d28dddd or 62e28d28dddd
-       //TODO: VAESENCLAST Y16, Y14, Y19                          // 62a20d28ddd8 or 62a28d28ddd8
-       //TODO: VAESENCLAST Y2, Y14, Y19                           // 62e20d28ddda or 62e28d28ddda
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y14, Y19                  // 62e20d28dd9c3e07000000 or 62e28d28dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y14, Y19                 // 62e20d28dd9cda0f000000 or 62e28d28dd9cda0f000000
-       //TODO: VAESENCLAST Y5, Y21, Y19                           // 62e25520dddd or 62e2d520dddd
-       //TODO: VAESENCLAST Y16, Y21, Y19                          // 62a25520ddd8 or 62a2d520ddd8
-       //TODO: VAESENCLAST Y2, Y21, Y19                           // 62e25520ddda or 62e2d520ddda
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y21, Y19                  // 62e25520dd9c3e07000000 or 62e2d520dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y21, Y19                 // 62e25520dd9cda0f000000 or 62e2d520dd9cda0f000000
-       //TODO: VAESENCLAST Y5, Y19, Y23                           // 62e26520ddfd or 62e2e520ddfd
-       //TODO: VAESENCLAST Y16, Y19, Y23                          // 62a26520ddf8 or 62a2e520ddf8
-       //TODO: VAESENCLAST Y2, Y19, Y23                           // 62e26520ddfa or 62e2e520ddfa
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y19, Y23                  // 62e26520ddbc3e07000000 or 62e2e520ddbc3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y19, Y23                 // 62e26520ddbcda0f000000 or 62e2e520ddbcda0f000000
-       //TODO: VAESENCLAST Y5, Y14, Y23                           // 62e20d28ddfd or 62e28d28ddfd
-       //TODO: VAESENCLAST Y16, Y14, Y23                          // 62a20d28ddf8 or 62a28d28ddf8
-       //TODO: VAESENCLAST Y2, Y14, Y23                           // 62e20d28ddfa or 62e28d28ddfa
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y14, Y23                  // 62e20d28ddbc3e07000000 or 62e28d28ddbc3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y14, Y23                 // 62e20d28ddbcda0f000000 or 62e28d28ddbcda0f000000
-       //TODO: VAESENCLAST Y5, Y21, Y23                           // 62e25520ddfd or 62e2d520ddfd
-       //TODO: VAESENCLAST Y16, Y21, Y23                          // 62a25520ddf8 or 62a2d520ddf8
-       //TODO: VAESENCLAST Y2, Y21, Y23                           // 62e25520ddfa or 62e2d520ddfa
-       //TODO: VAESENCLAST 7(SI)(DI*1), Y21, Y23                  // 62e25520ddbc3e07000000 or 62e2d520ddbc3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Y21, Y23                 // 62e25520ddbcda0f000000 or 62e2d520ddbcda0f000000
-       //TODO: VAESENCLAST Z25, Z6, Z22                           // 62824d48ddf1 or 6282cd48ddf1
-       //TODO: VAESENCLAST Z12, Z6, Z22                           // 62c24d48ddf4 or 62c2cd48ddf4
-       //TODO: VAESENCLAST 7(SI)(DI*1), Z6, Z22                   // 62e24d48ddb43e07000000 or 62e2cd48ddb43e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Z6, Z22                  // 62e24d48ddb4da0f000000 or 62e2cd48ddb4da0f000000
-       //TODO: VAESENCLAST Z25, Z8, Z22                           // 62823d48ddf1 or 6282bd48ddf1
-       //TODO: VAESENCLAST Z12, Z8, Z22                           // 62c23d48ddf4 or 62c2bd48ddf4
-       //TODO: VAESENCLAST 7(SI)(DI*1), Z8, Z22                   // 62e23d48ddb43e07000000 or 62e2bd48ddb43e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Z8, Z22                  // 62e23d48ddb4da0f000000 or 62e2bd48ddb4da0f000000
-       //TODO: VAESENCLAST Z25, Z6, Z11                           // 62124d48ddd9 or 6212cd48ddd9
-       //TODO: VAESENCLAST Z12, Z6, Z11                           // 62524d48dddc or 6252cd48dddc
-       //TODO: VAESENCLAST 7(SI)(DI*1), Z6, Z11                   // 62724d48dd9c3e07000000 or 6272cd48dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Z6, Z11                  // 62724d48dd9cda0f000000 or 6272cd48dd9cda0f000000
-       //TODO: VAESENCLAST Z25, Z8, Z11                           // 62123d48ddd9 or 6212bd48ddd9
-       //TODO: VAESENCLAST Z12, Z8, Z11                           // 62523d48dddc or 6252bd48dddc
-       //TODO: VAESENCLAST 7(SI)(DI*1), Z8, Z11                   // 62723d48dd9c3e07000000 or 6272bd48dd9c3e07000000
-       //TODO: VAESENCLAST 15(DX)(BX*8), Z8, Z11                  // 62723d48dd9cda0f000000 or 6272bd48dd9cda0f000000
+       VAESDEC X24, X7, X11                               // 62124508ded8 or 6212c508ded8
+       VAESDEC X20, X7, X11                               // 62324508dedc or 6232c508dedc
+       VAESDEC X24, X0, X11                               // 62127d08ded8 or 6212fd08ded8
+       VAESDEC X20, X0, X11                               // 62327d08dedc or 6232fd08dedc
+       VAESDEC X24, X7, X31                               // 62024508def8 or 6202c508def8
+       VAESDEC X20, X7, X31                               // 62224508defc or 6222c508defc
+       VAESDEC X7, X7, X31                                // 62624508deff or 6262c508deff
+       VAESDEC -7(DI)(R8*1), X7, X31                      // 62224508debc07f9ffffff or 6222c508debc07f9ffffff
+       VAESDEC (SP), X7, X31                              // 62624508de3c24 or 6262c508de3c24
+       VAESDEC X24, X0, X31                               // 62027d08def8 or 6202fd08def8
+       VAESDEC X20, X0, X31                               // 62227d08defc or 6222fd08defc
+       VAESDEC X7, X0, X31                                // 62627d08deff or 6262fd08deff
+       VAESDEC -7(DI)(R8*1), X0, X31                      // 62227d08debc07f9ffffff or 6222fd08debc07f9ffffff
+       VAESDEC (SP), X0, X31                              // 62627d08de3c24 or 6262fd08de3c24
+       VAESDEC X24, X7, X3                                // 62924508ded8 or 6292c508ded8
+       VAESDEC X20, X7, X3                                // 62b24508dedc or 62b2c508dedc
+       VAESDEC X24, X0, X3                                // 62927d08ded8 or 6292fd08ded8
+       VAESDEC X20, X0, X3                                // 62b27d08dedc or 62b2fd08dedc
+       VAESDEC Y5, Y31, Y22                               // 62e20520def5 or 62e28520def5
+       VAESDEC Y19, Y31, Y22                              // 62a20520def3 or 62a28520def3
+       VAESDEC Y31, Y31, Y22                              // 62820520def7 or 62828520def7
+       VAESDEC 99(R15)(R15*1), Y31, Y22                   // 62820520deb43f63000000 or 62828520deb43f63000000
+       VAESDEC (DX), Y31, Y22                             // 62e20520de32 or 62e28520de32
+       VAESDEC Y5, Y5, Y22                                // 62e25528def5 or 62e2d528def5
+       VAESDEC Y19, Y5, Y22                               // 62a25528def3 or 62a2d528def3
+       VAESDEC Y31, Y5, Y22                               // 62825528def7 or 6282d528def7
+       VAESDEC 99(R15)(R15*1), Y5, Y22                    // 62825528deb43f63000000 or 6282d528deb43f63000000
+       VAESDEC (DX), Y5, Y22                              // 62e25528de32 or 62e2d528de32
+       VAESDEC Y5, Y0, Y22                                // 62e27d28def5 or 62e2fd28def5
+       VAESDEC Y19, Y0, Y22                               // 62a27d28def3 or 62a2fd28def3
+       VAESDEC Y31, Y0, Y22                               // 62827d28def7 or 6282fd28def7
+       VAESDEC 99(R15)(R15*1), Y0, Y22                    // 62827d28deb43f63000000 or 6282fd28deb43f63000000
+       VAESDEC (DX), Y0, Y22                              // 62e27d28de32 or 62e2fd28de32
+       VAESDEC Y5, Y31, Y9                                // 62720520decd or 62728520decd
+       VAESDEC Y19, Y31, Y9                               // 62320520decb or 62328520decb
+       VAESDEC Y31, Y31, Y9                               // 62120520decf or 62128520decf
+       VAESDEC 99(R15)(R15*1), Y31, Y9                    // 62120520de8c3f63000000 or 62128520de8c3f63000000
+       VAESDEC (DX), Y31, Y9                              // 62720520de0a or 62728520de0a
+       VAESDEC Y19, Y5, Y9                                // 62325528decb or 6232d528decb
+       VAESDEC Y31, Y5, Y9                                // 62125528decf or 6212d528decf
+       VAESDEC Y19, Y0, Y9                                // 62327d28decb or 6232fd28decb
+       VAESDEC Y31, Y0, Y9                                // 62127d28decf or 6212fd28decf
+       VAESDEC Y5, Y31, Y23                               // 62e20520defd or 62e28520defd
+       VAESDEC Y19, Y31, Y23                              // 62a20520defb or 62a28520defb
+       VAESDEC Y31, Y31, Y23                              // 62820520deff or 62828520deff
+       VAESDEC 99(R15)(R15*1), Y31, Y23                   // 62820520debc3f63000000 or 62828520debc3f63000000
+       VAESDEC (DX), Y31, Y23                             // 62e20520de3a or 62e28520de3a
+       VAESDEC Y5, Y5, Y23                                // 62e25528defd or 62e2d528defd
+       VAESDEC Y19, Y5, Y23                               // 62a25528defb or 62a2d528defb
+       VAESDEC Y31, Y5, Y23                               // 62825528deff or 6282d528deff
+       VAESDEC 99(R15)(R15*1), Y5, Y23                    // 62825528debc3f63000000 or 6282d528debc3f63000000
+       VAESDEC (DX), Y5, Y23                              // 62e25528de3a or 62e2d528de3a
+       VAESDEC Y5, Y0, Y23                                // 62e27d28defd or 62e2fd28defd
+       VAESDEC Y19, Y0, Y23                               // 62a27d28defb or 62a2fd28defb
+       VAESDEC Y31, Y0, Y23                               // 62827d28deff or 6282fd28deff
+       VAESDEC 99(R15)(R15*1), Y0, Y23                    // 62827d28debc3f63000000 or 6282fd28debc3f63000000
+       VAESDEC (DX), Y0, Y23                              // 62e27d28de3a or 62e2fd28de3a
+       VAESDEC Z27, Z3, Z11                               // 62126548dedb or 6212e548dedb
+       VAESDEC Z15, Z3, Z11                               // 62526548dedf or 6252e548dedf
+       VAESDEC 99(R15)(R15*1), Z3, Z11                    // 62126548de9c3f63000000 or 6212e548de9c3f63000000
+       VAESDEC (DX), Z3, Z11                              // 62726548de1a or 6272e548de1a
+       VAESDEC Z27, Z12, Z11                              // 62121d48dedb or 62129d48dedb
+       VAESDEC Z15, Z12, Z11                              // 62521d48dedf or 62529d48dedf
+       VAESDEC 99(R15)(R15*1), Z12, Z11                   // 62121d48de9c3f63000000 or 62129d48de9c3f63000000
+       VAESDEC (DX), Z12, Z11                             // 62721d48de1a or 62729d48de1a
+       VAESDEC Z27, Z3, Z25                               // 62026548decb or 6202e548decb
+       VAESDEC Z15, Z3, Z25                               // 62426548decf or 6242e548decf
+       VAESDEC 99(R15)(R15*1), Z3, Z25                    // 62026548de8c3f63000000 or 6202e548de8c3f63000000
+       VAESDEC (DX), Z3, Z25                              // 62626548de0a or 6262e548de0a
+       VAESDEC Z27, Z12, Z25                              // 62021d48decb or 62029d48decb
+       VAESDEC Z15, Z12, Z25                              // 62421d48decf or 62429d48decf
+       VAESDEC 99(R15)(R15*1), Z12, Z25                   // 62021d48de8c3f63000000 or 62029d48de8c3f63000000
+       VAESDEC (DX), Z12, Z25                             // 62621d48de0a or 62629d48de0a
+       VAESDECLAST X21, X5, X9                            // 62325508dfcd or 6232d508dfcd
+       VAESDECLAST X21, X31, X9                           // 62320500dfcd or 62328500dfcd
+       VAESDECLAST X1, X31, X9                            // 62720500dfc9 or 62728500dfc9
+       VAESDECLAST X11, X31, X9                           // 62520500dfcb or 62528500dfcb
+       VAESDECLAST -7(CX), X31, X9                        // 62720500df89f9ffffff or 62728500df89f9ffffff
+       VAESDECLAST 15(DX)(BX*4), X31, X9                  // 62720500df8c9a0f000000 or 62728500df8c9a0f000000
+       VAESDECLAST X21, X3, X9                            // 62326508dfcd or 6232e508dfcd
+       VAESDECLAST X21, X5, X7                            // 62b25508dffd or 62b2d508dffd
+       VAESDECLAST X21, X31, X7                           // 62b20500dffd or 62b28500dffd
+       VAESDECLAST X1, X31, X7                            // 62f20500dff9 or 62f28500dff9
+       VAESDECLAST X11, X31, X7                           // 62d20500dffb or 62d28500dffb
+       VAESDECLAST -7(CX), X31, X7                        // 62f20500dfb9f9ffffff or 62f28500dfb9f9ffffff
+       VAESDECLAST 15(DX)(BX*4), X31, X7                  // 62f20500dfbc9a0f000000 or 62f28500dfbc9a0f000000
+       VAESDECLAST X21, X3, X7                            // 62b26508dffd or 62b2e508dffd
+       VAESDECLAST X21, X5, X14                           // 62325508dff5 or 6232d508dff5
+       VAESDECLAST X21, X31, X14                          // 62320500dff5 or 62328500dff5
+       VAESDECLAST X1, X31, X14                           // 62720500dff1 or 62728500dff1
+       VAESDECLAST X11, X31, X14                          // 62520500dff3 or 62528500dff3
+       VAESDECLAST -7(CX), X31, X14                       // 62720500dfb1f9ffffff or 62728500dfb1f9ffffff
+       VAESDECLAST 15(DX)(BX*4), X31, X14                 // 62720500dfb49a0f000000 or 62728500dfb49a0f000000
+       VAESDECLAST X21, X3, X14                           // 62326508dff5 or 6232e508dff5
+       VAESDECLAST Y31, Y27, Y28                          // 62022520dfe7 or 6202a520dfe7
+       VAESDECLAST Y3, Y27, Y28                           // 62622520dfe3 or 6262a520dfe3
+       VAESDECLAST Y14, Y27, Y28                          // 62422520dfe6 or 6242a520dfe6
+       VAESDECLAST -17(BP)(SI*8), Y27, Y28                // 62622520dfa4f5efffffff or 6262a520dfa4f5efffffff
+       VAESDECLAST (R15), Y27, Y28                        // 62422520df27 or 6242a520df27
+       VAESDECLAST Y31, Y0, Y28                           // 62027d28dfe7 or 6202fd28dfe7
+       VAESDECLAST Y3, Y0, Y28                            // 62627d28dfe3 or 6262fd28dfe3
+       VAESDECLAST Y14, Y0, Y28                           // 62427d28dfe6 or 6242fd28dfe6
+       VAESDECLAST -17(BP)(SI*8), Y0, Y28                 // 62627d28dfa4f5efffffff or 6262fd28dfa4f5efffffff
+       VAESDECLAST (R15), Y0, Y28                         // 62427d28df27 or 6242fd28df27
+       VAESDECLAST Y31, Y11, Y28                          // 62022528dfe7 or 6202a528dfe7
+       VAESDECLAST Y3, Y11, Y28                           // 62622528dfe3 or 6262a528dfe3
+       VAESDECLAST Y14, Y11, Y28                          // 62422528dfe6 or 6242a528dfe6
+       VAESDECLAST -17(BP)(SI*8), Y11, Y28                // 62622528dfa4f5efffffff or 6262a528dfa4f5efffffff
+       VAESDECLAST (R15), Y11, Y28                        // 62422528df27 or 6242a528df27
+       VAESDECLAST Y31, Y27, Y2                           // 62922520dfd7 or 6292a520dfd7
+       VAESDECLAST Y3, Y27, Y2                            // 62f22520dfd3 or 62f2a520dfd3
+       VAESDECLAST Y14, Y27, Y2                           // 62d22520dfd6 or 62d2a520dfd6
+       VAESDECLAST -17(BP)(SI*8), Y27, Y2                 // 62f22520df94f5efffffff or 62f2a520df94f5efffffff
+       VAESDECLAST (R15), Y27, Y2                         // 62d22520df17 or 62d2a520df17
+       VAESDECLAST Y31, Y0, Y2                            // 62927d28dfd7 or 6292fd28dfd7
+       VAESDECLAST Y31, Y11, Y2                           // 62922528dfd7 or 6292a528dfd7
+       VAESDECLAST Y31, Y27, Y24                          // 62022520dfc7 or 6202a520dfc7
+       VAESDECLAST Y3, Y27, Y24                           // 62622520dfc3 or 6262a520dfc3
+       VAESDECLAST Y14, Y27, Y24                          // 62422520dfc6 or 6242a520dfc6
+       VAESDECLAST -17(BP)(SI*8), Y27, Y24                // 62622520df84f5efffffff or 6262a520df84f5efffffff
+       VAESDECLAST (R15), Y27, Y24                        // 62422520df07 or 6242a520df07
+       VAESDECLAST Y31, Y0, Y24                           // 62027d28dfc7 or 6202fd28dfc7
+       VAESDECLAST Y3, Y0, Y24                            // 62627d28dfc3 or 6262fd28dfc3
+       VAESDECLAST Y14, Y0, Y24                           // 62427d28dfc6 or 6242fd28dfc6
+       VAESDECLAST -17(BP)(SI*8), Y0, Y24                 // 62627d28df84f5efffffff or 6262fd28df84f5efffffff
+       VAESDECLAST (R15), Y0, Y24                         // 62427d28df07 or 6242fd28df07
+       VAESDECLAST Y31, Y11, Y24                          // 62022528dfc7 or 6202a528dfc7
+       VAESDECLAST Y3, Y11, Y24                           // 62622528dfc3 or 6262a528dfc3
+       VAESDECLAST Y14, Y11, Y24                          // 62422528dfc6 or 6242a528dfc6
+       VAESDECLAST -17(BP)(SI*8), Y11, Y24                // 62622528df84f5efffffff or 6262a528df84f5efffffff
+       VAESDECLAST (R15), Y11, Y24                        // 62422528df07 or 6242a528df07
+       VAESDECLAST Z8, Z23, Z23                           // 62c24540dff8 or 62c2c540dff8
+       VAESDECLAST Z28, Z23, Z23                          // 62824540dffc or 6282c540dffc
+       VAESDECLAST -17(BP)(SI*8), Z23, Z23                // 62e24540dfbcf5efffffff or 62e2c540dfbcf5efffffff
+       VAESDECLAST (R15), Z23, Z23                        // 62c24540df3f or 62c2c540df3f
+       VAESDECLAST Z8, Z6, Z23                            // 62c24d48dff8 or 62c2cd48dff8
+       VAESDECLAST Z28, Z6, Z23                           // 62824d48dffc or 6282cd48dffc
+       VAESDECLAST -17(BP)(SI*8), Z6, Z23                 // 62e24d48dfbcf5efffffff or 62e2cd48dfbcf5efffffff
+       VAESDECLAST (R15), Z6, Z23                         // 62c24d48df3f or 62c2cd48df3f
+       VAESDECLAST Z8, Z23, Z5                            // 62d24540dfe8 or 62d2c540dfe8
+       VAESDECLAST Z28, Z23, Z5                           // 62924540dfec or 6292c540dfec
+       VAESDECLAST -17(BP)(SI*8), Z23, Z5                 // 62f24540dfacf5efffffff or 62f2c540dfacf5efffffff
+       VAESDECLAST (R15), Z23, Z5                         // 62d24540df2f or 62d2c540df2f
+       VAESDECLAST Z8, Z6, Z5                             // 62d24d48dfe8 or 62d2cd48dfe8
+       VAESDECLAST Z28, Z6, Z5                            // 62924d48dfec or 6292cd48dfec
+       VAESDECLAST -17(BP)(SI*8), Z6, Z5                  // 62f24d48dfacf5efffffff or 62f2cd48dfacf5efffffff
+       VAESDECLAST (R15), Z6, Z5                          // 62d24d48df2f or 62d2cd48df2f
+       VAESENC X14, X16, X13                              // 62527d00dcee or 6252fd00dcee
+       VAESENC X19, X16, X13                              // 62327d00dceb or 6232fd00dceb
+       VAESENC X8, X16, X13                               // 62527d00dce8 or 6252fd00dce8
+       VAESENC 99(R15)(R15*8), X16, X13                   // 62127d00dcacff63000000 or 6212fd00dcacff63000000
+       VAESENC 7(AX)(CX*8), X16, X13                      // 62727d00dcacc807000000 or 6272fd00dcacc807000000
+       VAESENC X19, X14, X13                              // 62320d08dceb or 62328d08dceb
+       VAESENC X19, X11, X13                              // 62322508dceb or 6232a508dceb
+       VAESENC X14, X16, X0                               // 62d27d00dcc6 or 62d2fd00dcc6
+       VAESENC X19, X16, X0                               // 62b27d00dcc3 or 62b2fd00dcc3
+       VAESENC X8, X16, X0                                // 62d27d00dcc0 or 62d2fd00dcc0
+       VAESENC 99(R15)(R15*8), X16, X0                    // 62927d00dc84ff63000000 or 6292fd00dc84ff63000000
+       VAESENC 7(AX)(CX*8), X16, X0                       // 62f27d00dc84c807000000 or 62f2fd00dc84c807000000
+       VAESENC X19, X14, X0                               // 62b20d08dcc3 or 62b28d08dcc3
+       VAESENC X19, X11, X0                               // 62b22508dcc3 or 62b2a508dcc3
+       VAESENC X14, X16, X30                              // 62427d00dcf6 or 6242fd00dcf6
+       VAESENC X19, X16, X30                              // 62227d00dcf3 or 6222fd00dcf3
+       VAESENC X8, X16, X30                               // 62427d00dcf0 or 6242fd00dcf0
+       VAESENC 99(R15)(R15*8), X16, X30                   // 62027d00dcb4ff63000000 or 6202fd00dcb4ff63000000
+       VAESENC 7(AX)(CX*8), X16, X30                      // 62627d00dcb4c807000000 or 6262fd00dcb4c807000000
+       VAESENC X14, X14, X30                              // 62420d08dcf6 or 62428d08dcf6
+       VAESENC X19, X14, X30                              // 62220d08dcf3 or 62228d08dcf3
+       VAESENC X8, X14, X30                               // 62420d08dcf0 or 62428d08dcf0
+       VAESENC 99(R15)(R15*8), X14, X30                   // 62020d08dcb4ff63000000 or 62028d08dcb4ff63000000
+       VAESENC 7(AX)(CX*8), X14, X30                      // 62620d08dcb4c807000000 or 62628d08dcb4c807000000
+       VAESENC X14, X11, X30                              // 62422508dcf6 or 6242a508dcf6
+       VAESENC X19, X11, X30                              // 62222508dcf3 or 6222a508dcf3
+       VAESENC X8, X11, X30                               // 62422508dcf0 or 6242a508dcf0
+       VAESENC 99(R15)(R15*8), X11, X30                   // 62022508dcb4ff63000000 or 6202a508dcb4ff63000000
+       VAESENC 7(AX)(CX*8), X11, X30                      // 62622508dcb4c807000000 or 6262a508dcb4c807000000
+       VAESENC Y18, Y15, Y2                               // 62b20528dcd2 or 62b28528dcd2
+       VAESENC Y24, Y15, Y2                               // 62920528dcd0 or 62928528dcd0
+       VAESENC Y18, Y22, Y2                               // 62b24d20dcd2 or 62b2cd20dcd2
+       VAESENC Y24, Y22, Y2                               // 62924d20dcd0 or 6292cd20dcd0
+       VAESENC Y9, Y22, Y2                                // 62d24d20dcd1 or 62d2cd20dcd1
+       VAESENC 7(SI)(DI*8), Y22, Y2                       // 62f24d20dc94fe07000000 or 62f2cd20dc94fe07000000
+       VAESENC -15(R14), Y22, Y2                          // 62d24d20dc96f1ffffff or 62d2cd20dc96f1ffffff
+       VAESENC Y18, Y20, Y2                               // 62b25d20dcd2 or 62b2dd20dcd2
+       VAESENC Y24, Y20, Y2                               // 62925d20dcd0 or 6292dd20dcd0
+       VAESENC Y9, Y20, Y2                                // 62d25d20dcd1 or 62d2dd20dcd1
+       VAESENC 7(SI)(DI*8), Y20, Y2                       // 62f25d20dc94fe07000000 or 62f2dd20dc94fe07000000
+       VAESENC -15(R14), Y20, Y2                          // 62d25d20dc96f1ffffff or 62d2dd20dc96f1ffffff
+       VAESENC Y18, Y15, Y13                              // 62320528dcea or 62328528dcea
+       VAESENC Y24, Y15, Y13                              // 62120528dce8 or 62128528dce8
+       VAESENC Y18, Y22, Y13                              // 62324d20dcea or 6232cd20dcea
+       VAESENC Y24, Y22, Y13                              // 62124d20dce8 or 6212cd20dce8
+       VAESENC Y9, Y22, Y13                               // 62524d20dce9 or 6252cd20dce9
+       VAESENC 7(SI)(DI*8), Y22, Y13                      // 62724d20dcacfe07000000 or 6272cd20dcacfe07000000
+       VAESENC -15(R14), Y22, Y13                         // 62524d20dcaef1ffffff or 6252cd20dcaef1ffffff
+       VAESENC Y18, Y20, Y13                              // 62325d20dcea or 6232dd20dcea
+       VAESENC Y24, Y20, Y13                              // 62125d20dce8 or 6212dd20dce8
+       VAESENC Y9, Y20, Y13                               // 62525d20dce9 or 6252dd20dce9
+       VAESENC 7(SI)(DI*8), Y20, Y13                      // 62725d20dcacfe07000000 or 6272dd20dcacfe07000000
+       VAESENC -15(R14), Y20, Y13                         // 62525d20dcaef1ffffff or 6252dd20dcaef1ffffff
+       VAESENC Y18, Y15, Y27                              // 62220528dcda or 62228528dcda
+       VAESENC Y24, Y15, Y27                              // 62020528dcd8 or 62028528dcd8
+       VAESENC Y9, Y15, Y27                               // 62420528dcd9 or 62428528dcd9
+       VAESENC 7(SI)(DI*8), Y15, Y27                      // 62620528dc9cfe07000000 or 62628528dc9cfe07000000
+       VAESENC -15(R14), Y15, Y27                         // 62420528dc9ef1ffffff or 62428528dc9ef1ffffff
+       VAESENC Y18, Y22, Y27                              // 62224d20dcda or 6222cd20dcda
+       VAESENC Y24, Y22, Y27                              // 62024d20dcd8 or 6202cd20dcd8
+       VAESENC Y9, Y22, Y27                               // 62424d20dcd9 or 6242cd20dcd9
+       VAESENC 7(SI)(DI*8), Y22, Y27                      // 62624d20dc9cfe07000000 or 6262cd20dc9cfe07000000
+       VAESENC -15(R14), Y22, Y27                         // 62424d20dc9ef1ffffff or 6242cd20dc9ef1ffffff
+       VAESENC Y18, Y20, Y27                              // 62225d20dcda or 6222dd20dcda
+       VAESENC Y24, Y20, Y27                              // 62025d20dcd8 or 6202dd20dcd8
+       VAESENC Y9, Y20, Y27                               // 62425d20dcd9 or 6242dd20dcd9
+       VAESENC 7(SI)(DI*8), Y20, Y27                      // 62625d20dc9cfe07000000 or 6262dd20dc9cfe07000000
+       VAESENC -15(R14), Y20, Y27                         // 62425d20dc9ef1ffffff or 6242dd20dc9ef1ffffff
+       VAESENC Z12, Z16, Z21                              // 62c27d40dcec or 62c2fd40dcec
+       VAESENC Z27, Z16, Z21                              // 62827d40dceb or 6282fd40dceb
+       VAESENC 7(SI)(DI*8), Z16, Z21                      // 62e27d40dcacfe07000000 or 62e2fd40dcacfe07000000
+       VAESENC -15(R14), Z16, Z21                         // 62c27d40dcaef1ffffff or 62c2fd40dcaef1ffffff
+       VAESENC Z12, Z13, Z21                              // 62c21548dcec or 62c29548dcec
+       VAESENC Z27, Z13, Z21                              // 62821548dceb or 62829548dceb
+       VAESENC 7(SI)(DI*8), Z13, Z21                      // 62e21548dcacfe07000000 or 62e29548dcacfe07000000
+       VAESENC -15(R14), Z13, Z21                         // 62c21548dcaef1ffffff or 62c29548dcaef1ffffff
+       VAESENC Z12, Z16, Z5                               // 62d27d40dcec or 62d2fd40dcec
+       VAESENC Z27, Z16, Z5                               // 62927d40dceb or 6292fd40dceb
+       VAESENC 7(SI)(DI*8), Z16, Z5                       // 62f27d40dcacfe07000000 or 62f2fd40dcacfe07000000
+       VAESENC -15(R14), Z16, Z5                          // 62d27d40dcaef1ffffff or 62d2fd40dcaef1ffffff
+       VAESENC Z12, Z13, Z5                               // 62d21548dcec or 62d29548dcec
+       VAESENC Z27, Z13, Z5                               // 62921548dceb or 62929548dceb
+       VAESENC 7(SI)(DI*8), Z13, Z5                       // 62f21548dcacfe07000000 or 62f29548dcacfe07000000
+       VAESENC -15(R14), Z13, Z5                          // 62d21548dcaef1ffffff or 62d29548dcaef1ffffff
+       VAESENCLAST X23, X12, X8                           // 62321d08ddc7 or 62329d08ddc7
+       VAESENCLAST X31, X12, X8                           // 62121d08ddc7 or 62129d08ddc7
+       VAESENCLAST X23, X16, X8                           // 62327d00ddc7 or 6232fd00ddc7
+       VAESENCLAST X11, X16, X8                           // 62527d00ddc3 or 6252fd00ddc3
+       VAESENCLAST X31, X16, X8                           // 62127d00ddc7 or 6212fd00ddc7
+       VAESENCLAST (AX), X16, X8                          // 62727d00dd00 or 6272fd00dd00
+       VAESENCLAST 7(SI), X16, X8                         // 62727d00dd8607000000 or 6272fd00dd8607000000
+       VAESENCLAST X23, X23, X8                           // 62324500ddc7 or 6232c500ddc7
+       VAESENCLAST X11, X23, X8                           // 62524500ddc3 or 6252c500ddc3
+       VAESENCLAST X31, X23, X8                           // 62124500ddc7 or 6212c500ddc7
+       VAESENCLAST (AX), X23, X8                          // 62724500dd00 or 6272c500dd00
+       VAESENCLAST 7(SI), X23, X8                         // 62724500dd8607000000 or 6272c500dd8607000000
+       VAESENCLAST X23, X12, X26                          // 62221d08ddd7 or 62229d08ddd7
+       VAESENCLAST X11, X12, X26                          // 62421d08ddd3 or 62429d08ddd3
+       VAESENCLAST X31, X12, X26                          // 62021d08ddd7 or 62029d08ddd7
+       VAESENCLAST (AX), X12, X26                         // 62621d08dd10 or 62629d08dd10
+       VAESENCLAST 7(SI), X12, X26                        // 62621d08dd9607000000 or 62629d08dd9607000000
+       VAESENCLAST X23, X16, X26                          // 62227d00ddd7 or 6222fd00ddd7
+       VAESENCLAST X11, X16, X26                          // 62427d00ddd3 or 6242fd00ddd3
+       VAESENCLAST X31, X16, X26                          // 62027d00ddd7 or 6202fd00ddd7
+       VAESENCLAST (AX), X16, X26                         // 62627d00dd10 or 6262fd00dd10
+       VAESENCLAST 7(SI), X16, X26                        // 62627d00dd9607000000 or 6262fd00dd9607000000
+       VAESENCLAST X23, X23, X26                          // 62224500ddd7 or 6222c500ddd7
+       VAESENCLAST X11, X23, X26                          // 62424500ddd3 or 6242c500ddd3
+       VAESENCLAST X31, X23, X26                          // 62024500ddd7 or 6202c500ddd7
+       VAESENCLAST (AX), X23, X26                         // 62624500dd10 or 6262c500dd10
+       VAESENCLAST 7(SI), X23, X26                        // 62624500dd9607000000 or 6262c500dd9607000000
+       VAESENCLAST X23, X12, X23                          // 62a21d08ddff or 62a29d08ddff
+       VAESENCLAST X11, X12, X23                          // 62c21d08ddfb or 62c29d08ddfb
+       VAESENCLAST X31, X12, X23                          // 62821d08ddff or 62829d08ddff
+       VAESENCLAST (AX), X12, X23                         // 62e21d08dd38 or 62e29d08dd38
+       VAESENCLAST 7(SI), X12, X23                        // 62e21d08ddbe07000000 or 62e29d08ddbe07000000
+       VAESENCLAST X23, X16, X23                          // 62a27d00ddff or 62a2fd00ddff
+       VAESENCLAST X11, X16, X23                          // 62c27d00ddfb or 62c2fd00ddfb
+       VAESENCLAST X31, X16, X23                          // 62827d00ddff or 6282fd00ddff
+       VAESENCLAST (AX), X16, X23                         // 62e27d00dd38 or 62e2fd00dd38
+       VAESENCLAST 7(SI), X16, X23                        // 62e27d00ddbe07000000 or 62e2fd00ddbe07000000
+       VAESENCLAST X23, X23, X23                          // 62a24500ddff or 62a2c500ddff
+       VAESENCLAST X11, X23, X23                          // 62c24500ddfb or 62c2c500ddfb
+       VAESENCLAST X31, X23, X23                          // 62824500ddff or 6282c500ddff
+       VAESENCLAST (AX), X23, X23                         // 62e24500dd38 or 62e2c500dd38
+       VAESENCLAST 7(SI), X23, X23                        // 62e24500ddbe07000000 or 62e2c500ddbe07000000
+       VAESENCLAST Y5, Y19, Y3                            // 62f26520dddd or 62f2e520dddd
+       VAESENCLAST Y16, Y19, Y3                           // 62b26520ddd8 or 62b2e520ddd8
+       VAESENCLAST Y2, Y19, Y3                            // 62f26520ddda or 62f2e520ddda
+       VAESENCLAST 7(SI)(DI*1), Y19, Y3                   // 62f26520dd9c3e07000000 or 62f2e520dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y19, Y3                  // 62f26520dd9cda0f000000 or 62f2e520dd9cda0f000000
+       VAESENCLAST Y16, Y14, Y3                           // 62b20d28ddd8 or 62b28d28ddd8
+       VAESENCLAST Y5, Y21, Y3                            // 62f25520dddd or 62f2d520dddd
+       VAESENCLAST Y16, Y21, Y3                           // 62b25520ddd8 or 62b2d520ddd8
+       VAESENCLAST Y2, Y21, Y3                            // 62f25520ddda or 62f2d520ddda
+       VAESENCLAST 7(SI)(DI*1), Y21, Y3                   // 62f25520dd9c3e07000000 or 62f2d520dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y21, Y3                  // 62f25520dd9cda0f000000 or 62f2d520dd9cda0f000000
+       VAESENCLAST Y5, Y19, Y19                           // 62e26520dddd or 62e2e520dddd
+       VAESENCLAST Y16, Y19, Y19                          // 62a26520ddd8 or 62a2e520ddd8
+       VAESENCLAST Y2, Y19, Y19                           // 62e26520ddda or 62e2e520ddda
+       VAESENCLAST 7(SI)(DI*1), Y19, Y19                  // 62e26520dd9c3e07000000 or 62e2e520dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y19, Y19                 // 62e26520dd9cda0f000000 or 62e2e520dd9cda0f000000
+       VAESENCLAST Y5, Y14, Y19                           // 62e20d28dddd or 62e28d28dddd
+       VAESENCLAST Y16, Y14, Y19                          // 62a20d28ddd8 or 62a28d28ddd8
+       VAESENCLAST Y2, Y14, Y19                           // 62e20d28ddda or 62e28d28ddda
+       VAESENCLAST 7(SI)(DI*1), Y14, Y19                  // 62e20d28dd9c3e07000000 or 62e28d28dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y14, Y19                 // 62e20d28dd9cda0f000000 or 62e28d28dd9cda0f000000
+       VAESENCLAST Y5, Y21, Y19                           // 62e25520dddd or 62e2d520dddd
+       VAESENCLAST Y16, Y21, Y19                          // 62a25520ddd8 or 62a2d520ddd8
+       VAESENCLAST Y2, Y21, Y19                           // 62e25520ddda or 62e2d520ddda
+       VAESENCLAST 7(SI)(DI*1), Y21, Y19                  // 62e25520dd9c3e07000000 or 62e2d520dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y21, Y19                 // 62e25520dd9cda0f000000 or 62e2d520dd9cda0f000000
+       VAESENCLAST Y5, Y19, Y23                           // 62e26520ddfd or 62e2e520ddfd
+       VAESENCLAST Y16, Y19, Y23                          // 62a26520ddf8 or 62a2e520ddf8
+       VAESENCLAST Y2, Y19, Y23                           // 62e26520ddfa or 62e2e520ddfa
+       VAESENCLAST 7(SI)(DI*1), Y19, Y23                  // 62e26520ddbc3e07000000 or 62e2e520ddbc3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y19, Y23                 // 62e26520ddbcda0f000000 or 62e2e520ddbcda0f000000
+       VAESENCLAST Y5, Y14, Y23                           // 62e20d28ddfd or 62e28d28ddfd
+       VAESENCLAST Y16, Y14, Y23                          // 62a20d28ddf8 or 62a28d28ddf8
+       VAESENCLAST Y2, Y14, Y23                           // 62e20d28ddfa or 62e28d28ddfa
+       VAESENCLAST 7(SI)(DI*1), Y14, Y23                  // 62e20d28ddbc3e07000000 or 62e28d28ddbc3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y14, Y23                 // 62e20d28ddbcda0f000000 or 62e28d28ddbcda0f000000
+       VAESENCLAST Y5, Y21, Y23                           // 62e25520ddfd or 62e2d520ddfd
+       VAESENCLAST Y16, Y21, Y23                          // 62a25520ddf8 or 62a2d520ddf8
+       VAESENCLAST Y2, Y21, Y23                           // 62e25520ddfa or 62e2d520ddfa
+       VAESENCLAST 7(SI)(DI*1), Y21, Y23                  // 62e25520ddbc3e07000000 or 62e2d520ddbc3e07000000
+       VAESENCLAST 15(DX)(BX*8), Y21, Y23                 // 62e25520ddbcda0f000000 or 62e2d520ddbcda0f000000
+       VAESENCLAST Z25, Z6, Z22                           // 62824d48ddf1 or 6282cd48ddf1
+       VAESENCLAST Z12, Z6, Z22                           // 62c24d48ddf4 or 62c2cd48ddf4
+       VAESENCLAST 7(SI)(DI*1), Z6, Z22                   // 62e24d48ddb43e07000000 or 62e2cd48ddb43e07000000
+       VAESENCLAST 15(DX)(BX*8), Z6, Z22                  // 62e24d48ddb4da0f000000 or 62e2cd48ddb4da0f000000
+       VAESENCLAST Z25, Z8, Z22                           // 62823d48ddf1 or 6282bd48ddf1
+       VAESENCLAST Z12, Z8, Z22                           // 62c23d48ddf4 or 62c2bd48ddf4
+       VAESENCLAST 7(SI)(DI*1), Z8, Z22                   // 62e23d48ddb43e07000000 or 62e2bd48ddb43e07000000
+       VAESENCLAST 15(DX)(BX*8), Z8, Z22                  // 62e23d48ddb4da0f000000 or 62e2bd48ddb4da0f000000
+       VAESENCLAST Z25, Z6, Z11                           // 62124d48ddd9 or 6212cd48ddd9
+       VAESENCLAST Z12, Z6, Z11                           // 62524d48dddc or 6252cd48dddc
+       VAESENCLAST 7(SI)(DI*1), Z6, Z11                   // 62724d48dd9c3e07000000 or 6272cd48dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Z6, Z11                  // 62724d48dd9cda0f000000 or 6272cd48dd9cda0f000000
+       VAESENCLAST Z25, Z8, Z11                           // 62123d48ddd9 or 6212bd48ddd9
+       VAESENCLAST Z12, Z8, Z11                           // 62523d48dddc or 6252bd48dddc
+       VAESENCLAST 7(SI)(DI*1), Z8, Z11                   // 62723d48dd9c3e07000000 or 6272bd48dd9c3e07000000
+       VAESENCLAST 15(DX)(BX*8), Z8, Z11                  // 62723d48dd9cda0f000000 or 6272bd48dd9cda0f000000
        RET
index 4a318f313a6604ba546773c70d7a798d143223ca..e30f41d679dd37af154ebfe0dbe51d270037ff9b 100644 (file)
@@ -3,64 +3,64 @@
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_4fmaps(SB), NOSPLIT, $0
-       //TODO: V4FMADDPS 17(SP), [Z0-Z3], K2, Z0                  // 62f27f4a9a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z0-Z3], K2, Z0           // 62f27f4a9a84b5efffffff
-       //TODO: V4FMADDPS 17(SP), [Z10-Z13], K2, Z0                // 62f22f4a9a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z10-Z13], K2, Z0         // 62f22f4a9a84b5efffffff
-       //TODO: V4FMADDPS 17(SP), [Z20-Z23], K2, Z0                // 62f25f429a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z20-Z23], K2, Z0         // 62f25f429a84b5efffffff
-       //TODO: V4FMADDPS 17(SP), [Z0-Z3], K2, Z8                  // 62727f4a9a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z0-Z3], K2, Z8           // 62727f4a9a84b5efffffff
-       //TODO: V4FMADDPS 17(SP), [Z10-Z13], K2, Z8                // 62722f4a9a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z10-Z13], K2, Z8         // 62722f4a9a84b5efffffff
-       //TODO: V4FMADDPS 17(SP), [Z20-Z23], K2, Z8                // 62725f429a842411000000
-       //TODO: V4FMADDPS -17(BP)(SI*4), [Z20-Z23], K2, Z8         // 62725f429a84b5efffffff
-       //TODO: V4FMADDSS 7(AX), [X0-X3], K5, X22                  // 62e27f0d9bb007000000 or 62e27f2d9bb007000000 or 62e27f4d9bb007000000
-       //TODO: V4FMADDSS (DI), [X0-X3], K5, X22                   // 62e27f0d9b37 or 62e27f2d9b37 or 62e27f4d9b37
-       //TODO: V4FMADDSS 7(AX), [X10-X13], K5, X22                // 62e22f0d9bb007000000 or 62e22f2d9bb007000000 or 62e22f4d9bb007000000
-       //TODO: V4FMADDSS (DI), [X10-X13], K5, X22                 // 62e22f0d9b37 or 62e22f2d9b37 or 62e22f4d9b37
-       //TODO: V4FMADDSS 7(AX), [X20-X23], K5, X22                // 62e25f059bb007000000 or 62e25f259bb007000000 or 62e25f459bb007000000
-       //TODO: V4FMADDSS (DI), [X20-X23], K5, X22                 // 62e25f059b37 or 62e25f259b37 or 62e25f459b37
-       //TODO: V4FMADDSS 7(AX), [X0-X3], K5, X30                  // 62627f0d9bb007000000 or 62627f2d9bb007000000 or 62627f4d9bb007000000
-       //TODO: V4FMADDSS (DI), [X0-X3], K5, X30                   // 62627f0d9b37 or 62627f2d9b37 or 62627f4d9b37
-       //TODO: V4FMADDSS 7(AX), [X10-X13], K5, X30                // 62622f0d9bb007000000 or 62622f2d9bb007000000 or 62622f4d9bb007000000
-       //TODO: V4FMADDSS (DI), [X10-X13], K5, X30                 // 62622f0d9b37 or 62622f2d9b37 or 62622f4d9b37
-       //TODO: V4FMADDSS 7(AX), [X20-X23], K5, X30                // 62625f059bb007000000 or 62625f259bb007000000 or 62625f459bb007000000
-       //TODO: V4FMADDSS (DI), [X20-X23], K5, X30                 // 62625f059b37 or 62625f259b37 or 62625f459b37
-       //TODO: V4FMADDSS 7(AX), [X0-X3], K5, X3                   // 62f27f0d9b9807000000 or 62f27f2d9b9807000000 or 62f27f4d9b9807000000
-       //TODO: V4FMADDSS (DI), [X0-X3], K5, X3                    // 62f27f0d9b1f or 62f27f2d9b1f or 62f27f4d9b1f
-       //TODO: V4FMADDSS 7(AX), [X10-X13], K5, X3                 // 62f22f0d9b9807000000 or 62f22f2d9b9807000000 or 62f22f4d9b9807000000
-       //TODO: V4FMADDSS (DI), [X10-X13], K5, X3                  // 62f22f0d9b1f or 62f22f2d9b1f or 62f22f4d9b1f
-       //TODO: V4FMADDSS 7(AX), [X20-X23], K5, X3                 // 62f25f059b9807000000 or 62f25f259b9807000000 or 62f25f459b9807000000
-       //TODO: V4FMADDSS (DI), [X20-X23], K5, X3                  // 62f25f059b1f or 62f25f259b1f or 62f25f459b1f
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z1-Z4], K3, Z15        // 6212774baabc3f63000000
-       //TODO: V4FNMADDPS (DX), [Z1-Z4], K3, Z15                  // 6272774baa3a
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z11-Z14], K3, Z15      // 6212274baabc3f63000000
-       //TODO: V4FNMADDPS (DX), [Z11-Z14], K3, Z15                // 6272274baa3a
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z21-Z24], K3, Z15      // 62125743aabc3f63000000
-       //TODO: V4FNMADDPS (DX), [Z21-Z24], K3, Z15                // 62725743aa3a
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z1-Z4], K3, Z12        // 6212774baaa43f63000000
-       //TODO: V4FNMADDPS (DX), [Z1-Z4], K3, Z12                  // 6272774baa22
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z11-Z14], K3, Z12      // 6212274baaa43f63000000
-       //TODO: V4FNMADDPS (DX), [Z11-Z14], K3, Z12                // 6272274baa22
-       //TODO: V4FNMADDPS 99(R15)(R15*1), [Z21-Z24], K3, Z12      // 62125743aaa43f63000000
-       //TODO: V4FNMADDPS (DX), [Z21-Z24], K3, Z12                // 62725743aa22
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X11         // 6272770cab9cf5efffffff or 6272772cab9cf5efffffff or 6272774cab9cf5efffffff
-       //TODO: V4FNMADDSS (R15), [X1-X4], K4, X11                 // 6252770cab1f or 6252772cab1f or 6252774cab1f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X11       // 6272270cab9cf5efffffff or 6272272cab9cf5efffffff or 6272274cab9cf5efffffff
-       //TODO: V4FNMADDSS (R15), [X11-X14], K4, X11               // 6252270cab1f or 6252272cab1f or 6252274cab1f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X11       // 62725704ab9cf5efffffff or 62725724ab9cf5efffffff or 62725744ab9cf5efffffff
-       //TODO: V4FNMADDSS (R15), [X21-X24], K4, X11               // 62525704ab1f or 62525724ab1f or 62525744ab1f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X15         // 6272770cabbcf5efffffff or 6272772cabbcf5efffffff or 6272774cabbcf5efffffff
-       //TODO: V4FNMADDSS (R15), [X1-X4], K4, X15                 // 6252770cab3f or 6252772cab3f or 6252774cab3f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X15       // 6272270cabbcf5efffffff or 6272272cabbcf5efffffff or 6272274cabbcf5efffffff
-       //TODO: V4FNMADDSS (R15), [X11-X14], K4, X15               // 6252270cab3f or 6252272cab3f or 6252274cab3f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X15       // 62725704abbcf5efffffff or 62725724abbcf5efffffff or 62725744abbcf5efffffff
-       //TODO: V4FNMADDSS (R15), [X21-X24], K4, X15               // 62525704ab3f or 62525724ab3f or 62525744ab3f
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X30         // 6262770cabb4f5efffffff or 6262772cabb4f5efffffff or 6262774cabb4f5efffffff
-       //TODO: V4FNMADDSS (R15), [X1-X4], K4, X30                 // 6242770cab37 or 6242772cab37 or 6242774cab37
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X30       // 6262270cabb4f5efffffff or 6262272cabb4f5efffffff or 6262274cabb4f5efffffff
-       //TODO: V4FNMADDSS (R15), [X11-X14], K4, X30               // 6242270cab37 or 6242272cab37 or 6242274cab37
-       //TODO: V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X30       // 62625704abb4f5efffffff or 62625724abb4f5efffffff or 62625744abb4f5efffffff
-       //TODO: V4FNMADDSS (R15), [X21-X24], K4, X30               // 62425704ab37 or 62425724ab37 or 62425744ab37
+       V4FMADDPS 17(SP), [Z0-Z3], K2, Z0                  // 62f27f4a9a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z0-Z3], K2, Z0           // 62f27f4a9a84b5efffffff
+       V4FMADDPS 17(SP), [Z10-Z13], K2, Z0                // 62f22f4a9a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z10-Z13], K2, Z0         // 62f22f4a9a84b5efffffff
+       V4FMADDPS 17(SP), [Z20-Z23], K2, Z0                // 62f25f429a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z20-Z23], K2, Z0         // 62f25f429a84b5efffffff
+       V4FMADDPS 17(SP), [Z0-Z3], K2, Z8                  // 62727f4a9a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z0-Z3], K2, Z8           // 62727f4a9a84b5efffffff
+       V4FMADDPS 17(SP), [Z10-Z13], K2, Z8                // 62722f4a9a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z10-Z13], K2, Z8         // 62722f4a9a84b5efffffff
+       V4FMADDPS 17(SP), [Z20-Z23], K2, Z8                // 62725f429a842411000000
+       V4FMADDPS -17(BP)(SI*4), [Z20-Z23], K2, Z8         // 62725f429a84b5efffffff
+       V4FMADDSS 7(AX), [X0-X3], K5, X22                  // 62e27f0d9bb007000000 or 62e27f2d9bb007000000 or 62e27f4d9bb007000000
+       V4FMADDSS (DI), [X0-X3], K5, X22                   // 62e27f0d9b37 or 62e27f2d9b37 or 62e27f4d9b37
+       V4FMADDSS 7(AX), [X10-X13], K5, X22                // 62e22f0d9bb007000000 or 62e22f2d9bb007000000 or 62e22f4d9bb007000000
+       V4FMADDSS (DI), [X10-X13], K5, X22                 // 62e22f0d9b37 or 62e22f2d9b37 or 62e22f4d9b37
+       V4FMADDSS 7(AX), [X20-X23], K5, X22                // 62e25f059bb007000000 or 62e25f259bb007000000 or 62e25f459bb007000000
+       V4FMADDSS (DI), [X20-X23], K5, X22                 // 62e25f059b37 or 62e25f259b37 or 62e25f459b37
+       V4FMADDSS 7(AX), [X0-X3], K5, X30                  // 62627f0d9bb007000000 or 62627f2d9bb007000000 or 62627f4d9bb007000000
+       V4FMADDSS (DI), [X0-X3], K5, X30                   // 62627f0d9b37 or 62627f2d9b37 or 62627f4d9b37
+       V4FMADDSS 7(AX), [X10-X13], K5, X30                // 62622f0d9bb007000000 or 62622f2d9bb007000000 or 62622f4d9bb007000000
+       V4FMADDSS (DI), [X10-X13], K5, X30                 // 62622f0d9b37 or 62622f2d9b37 or 62622f4d9b37
+       V4FMADDSS 7(AX), [X20-X23], K5, X30                // 62625f059bb007000000 or 62625f259bb007000000 or 62625f459bb007000000
+       V4FMADDSS (DI), [X20-X23], K5, X30                 // 62625f059b37 or 62625f259b37 or 62625f459b37
+       V4FMADDSS 7(AX), [X0-X3], K5, X3                   // 62f27f0d9b9807000000 or 62f27f2d9b9807000000 or 62f27f4d9b9807000000
+       V4FMADDSS (DI), [X0-X3], K5, X3                    // 62f27f0d9b1f or 62f27f2d9b1f or 62f27f4d9b1f
+       V4FMADDSS 7(AX), [X10-X13], K5, X3                 // 62f22f0d9b9807000000 or 62f22f2d9b9807000000 or 62f22f4d9b9807000000
+       V4FMADDSS (DI), [X10-X13], K5, X3                  // 62f22f0d9b1f or 62f22f2d9b1f or 62f22f4d9b1f
+       V4FMADDSS 7(AX), [X20-X23], K5, X3                 // 62f25f059b9807000000 or 62f25f259b9807000000 or 62f25f459b9807000000
+       V4FMADDSS (DI), [X20-X23], K5, X3                  // 62f25f059b1f or 62f25f259b1f or 62f25f459b1f
+       V4FNMADDPS 99(R15)(R15*1), [Z1-Z4], K3, Z15        // 6212774baabc3f63000000
+       V4FNMADDPS (DX), [Z1-Z4], K3, Z15                  // 6272774baa3a
+       V4FNMADDPS 99(R15)(R15*1), [Z11-Z14], K3, Z15      // 6212274baabc3f63000000
+       V4FNMADDPS (DX), [Z11-Z14], K3, Z15                // 6272274baa3a
+       V4FNMADDPS 99(R15)(R15*1), [Z21-Z24], K3, Z15      // 62125743aabc3f63000000
+       V4FNMADDPS (DX), [Z21-Z24], K3, Z15                // 62725743aa3a
+       V4FNMADDPS 99(R15)(R15*1), [Z1-Z4], K3, Z12        // 6212774baaa43f63000000
+       V4FNMADDPS (DX), [Z1-Z4], K3, Z12                  // 6272774baa22
+       V4FNMADDPS 99(R15)(R15*1), [Z11-Z14], K3, Z12      // 6212274baaa43f63000000
+       V4FNMADDPS (DX), [Z11-Z14], K3, Z12                // 6272274baa22
+       V4FNMADDPS 99(R15)(R15*1), [Z21-Z24], K3, Z12      // 62125743aaa43f63000000
+       V4FNMADDPS (DX), [Z21-Z24], K3, Z12                // 62725743aa22
+       V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X11         // 6272770cab9cf5efffffff or 6272772cab9cf5efffffff or 6272774cab9cf5efffffff
+       V4FNMADDSS (R15), [X1-X4], K4, X11                 // 6252770cab1f or 6252772cab1f or 6252774cab1f
+       V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X11       // 6272270cab9cf5efffffff or 6272272cab9cf5efffffff or 6272274cab9cf5efffffff
+       V4FNMADDSS (R15), [X11-X14], K4, X11               // 6252270cab1f or 6252272cab1f or 6252274cab1f
+       V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X11       // 62725704ab9cf5efffffff or 62725724ab9cf5efffffff or 62725744ab9cf5efffffff
+       V4FNMADDSS (R15), [X21-X24], K4, X11               // 62525704ab1f or 62525724ab1f or 62525744ab1f
+       V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X15         // 6272770cabbcf5efffffff or 6272772cabbcf5efffffff or 6272774cabbcf5efffffff
+       V4FNMADDSS (R15), [X1-X4], K4, X15                 // 6252770cab3f or 6252772cab3f or 6252774cab3f
+       V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X15       // 6272270cabbcf5efffffff or 6272272cabbcf5efffffff or 6272274cabbcf5efffffff
+       V4FNMADDSS (R15), [X11-X14], K4, X15               // 6252270cab3f or 6252272cab3f or 6252274cab3f
+       V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X15       // 62725704abbcf5efffffff or 62725724abbcf5efffffff or 62725744abbcf5efffffff
+       V4FNMADDSS (R15), [X21-X24], K4, X15               // 62525704ab3f or 62525724ab3f or 62525744ab3f
+       V4FNMADDSS -17(BP)(SI*8), [X1-X4], K4, X30         // 6262770cabb4f5efffffff or 6262772cabb4f5efffffff or 6262774cabb4f5efffffff
+       V4FNMADDSS (R15), [X1-X4], K4, X30                 // 6242770cab37 or 6242772cab37 or 6242774cab37
+       V4FNMADDSS -17(BP)(SI*8), [X11-X14], K4, X30       // 6262270cabb4f5efffffff or 6262272cabb4f5efffffff or 6262274cabb4f5efffffff
+       V4FNMADDSS (R15), [X11-X14], K4, X30               // 6242270cab37 or 6242272cab37 or 6242274cab37
+       V4FNMADDSS -17(BP)(SI*8), [X21-X24], K4, X30       // 62625704abb4f5efffffff or 62625724abb4f5efffffff or 62625744abb4f5efffffff
+       V4FNMADDSS (R15), [X21-X24], K4, X30               // 62425704ab37 or 62425724ab37 or 62425744ab37
        RET
index 42b2c6b4cd819f42f1090631bada0acb56440b81..5a80ed0f458022f2192ba1e2a6b3991682e89682 100644 (file)
@@ -3,28 +3,28 @@
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_4vnniw(SB), NOSPLIT, $0
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z2-Z5], K4, Z17            // 62e26f4c528c3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z2-Z5], K4, Z17           // 62e26f4c528cda0f000000
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z12-Z15], K4, Z17          // 62e21f4c528c3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z12-Z15], K4, Z17         // 62e21f4c528cda0f000000
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z22-Z25], K4, Z17          // 62e24f44528c3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z22-Z25], K4, Z17         // 62e24f44528cda0f000000
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z2-Z5], K4, Z23            // 62e26f4c52bc3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z2-Z5], K4, Z23           // 62e26f4c52bcda0f000000
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z12-Z15], K4, Z23          // 62e21f4c52bc3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z12-Z15], K4, Z23         // 62e21f4c52bcda0f000000
-       //TODO: VP4DPWSSD 7(SI)(DI*1), [Z22-Z25], K4, Z23          // 62e24f4452bc3e07000000
-       //TODO: VP4DPWSSD 15(DX)(BX*8), [Z22-Z25], K4, Z23         // 62e24f4452bcda0f000000
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z4-Z7], K1, Z31          // 62225f4953bc07f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z4-Z7], K1, Z31                  // 62625f49533c24
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z14-Z17], K1, Z31        // 62220f4953bc07f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z14-Z17], K1, Z31                // 62620f49533c24
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z24-Z27], K1, Z31        // 62223f4153bc07f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z24-Z27], K1, Z31                // 62623f41533c24
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z4-Z7], K1, Z0           // 62b25f49538407f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z4-Z7], K1, Z0                   // 62f25f49530424
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z14-Z17], K1, Z0         // 62b20f49538407f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z14-Z17], K1, Z0                 // 62f20f49530424
-       //TODO: VP4DPWSSDS -7(DI)(R8*1), [Z24-Z27], K1, Z0         // 62b23f41538407f9ffffff
-       //TODO: VP4DPWSSDS (SP), [Z24-Z27], K1, Z0                 // 62f23f41530424
+       VP4DPWSSD 7(SI)(DI*1), [Z2-Z5], K4, Z17            // 62e26f4c528c3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z2-Z5], K4, Z17           // 62e26f4c528cda0f000000
+       VP4DPWSSD 7(SI)(DI*1), [Z12-Z15], K4, Z17          // 62e21f4c528c3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z12-Z15], K4, Z17         // 62e21f4c528cda0f000000
+       VP4DPWSSD 7(SI)(DI*1), [Z22-Z25], K4, Z17          // 62e24f44528c3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z22-Z25], K4, Z17         // 62e24f44528cda0f000000
+       VP4DPWSSD 7(SI)(DI*1), [Z2-Z5], K4, Z23            // 62e26f4c52bc3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z2-Z5], K4, Z23           // 62e26f4c52bcda0f000000
+       VP4DPWSSD 7(SI)(DI*1), [Z12-Z15], K4, Z23          // 62e21f4c52bc3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z12-Z15], K4, Z23         // 62e21f4c52bcda0f000000
+       VP4DPWSSD 7(SI)(DI*1), [Z22-Z25], K4, Z23          // 62e24f4452bc3e07000000
+       VP4DPWSSD 15(DX)(BX*8), [Z22-Z25], K4, Z23         // 62e24f4452bcda0f000000
+       VP4DPWSSDS -7(DI)(R8*1), [Z4-Z7], K1, Z31          // 62225f4953bc07f9ffffff
+       VP4DPWSSDS (SP), [Z4-Z7], K1, Z31                  // 62625f49533c24
+       VP4DPWSSDS -7(DI)(R8*1), [Z14-Z17], K1, Z31        // 62220f4953bc07f9ffffff
+       VP4DPWSSDS (SP), [Z14-Z17], K1, Z31                // 62620f49533c24
+       VP4DPWSSDS -7(DI)(R8*1), [Z24-Z27], K1, Z31        // 62223f4153bc07f9ffffff
+       VP4DPWSSDS (SP), [Z24-Z27], K1, Z31                // 62623f41533c24
+       VP4DPWSSDS -7(DI)(R8*1), [Z4-Z7], K1, Z0           // 62b25f49538407f9ffffff
+       VP4DPWSSDS (SP), [Z4-Z7], K1, Z0                   // 62f25f49530424
+       VP4DPWSSDS -7(DI)(R8*1), [Z14-Z17], K1, Z0         // 62b20f49538407f9ffffff
+       VP4DPWSSDS (SP), [Z14-Z17], K1, Z0                 // 62f20f49530424
+       VP4DPWSSDS -7(DI)(R8*1), [Z24-Z27], K1, Z0         // 62b23f41538407f9ffffff
+       VP4DPWSSDS (SP), [Z24-Z27], K1, Z0                 // 62f23f41530424
        RET
index 474747fac08023b6440a95c14056fe3d26e6a6ec..fc9dd0cecdc5ed8f0760ea1771719122b08a65cb 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_bitalg(SB), NOSPLIT, $0
-       //TODO: VPOPCNTB X14, K4, X16                              // 62c27d0c54c6
-       //TODO: VPOPCNTB X19, K4, X16                              // 62a27d0c54c3
-       //TODO: VPOPCNTB X8, K4, X16                               // 62c27d0c54c0
-       //TODO: VPOPCNTB 15(R8)(R14*1), K4, X16                    // 62827d0c5484300f000000
-       //TODO: VPOPCNTB 15(R8)(R14*2), K4, X16                    // 62827d0c5484700f000000
-       //TODO: VPOPCNTB X14, K4, X14                              // 62527d0c54f6
-       //TODO: VPOPCNTB X19, K4, X14                              // 62327d0c54f3
-       //TODO: VPOPCNTB X8, K4, X14                               // 62527d0c54f0
-       //TODO: VPOPCNTB 15(R8)(R14*1), K4, X14                    // 62127d0c54b4300f000000
-       //TODO: VPOPCNTB 15(R8)(R14*2), K4, X14                    // 62127d0c54b4700f000000
-       //TODO: VPOPCNTB X14, K4, X11                              // 62527d0c54de
-       //TODO: VPOPCNTB X19, K4, X11                              // 62327d0c54db
-       //TODO: VPOPCNTB X8, K4, X11                               // 62527d0c54d8
-       //TODO: VPOPCNTB 15(R8)(R14*1), K4, X11                    // 62127d0c549c300f000000
-       //TODO: VPOPCNTB 15(R8)(R14*2), K4, X11                    // 62127d0c549c700f000000
-       //TODO: VPOPCNTB Y14, K4, Y24                              // 62427d2c54c6
-       //TODO: VPOPCNTB Y21, K4, Y24                              // 62227d2c54c5
-       //TODO: VPOPCNTB Y1, K4, Y24                               // 62627d2c54c1
-       //TODO: VPOPCNTB 15(R8)(R14*8), K4, Y24                    // 62027d2c5484f00f000000
-       //TODO: VPOPCNTB -15(R14)(R15*2), K4, Y24                  // 62027d2c54847ef1ffffff
-       //TODO: VPOPCNTB Y14, K4, Y13                              // 62527d2c54ee
-       //TODO: VPOPCNTB Y21, K4, Y13                              // 62327d2c54ed
-       //TODO: VPOPCNTB Y1, K4, Y13                               // 62727d2c54e9
-       //TODO: VPOPCNTB 15(R8)(R14*8), K4, Y13                    // 62127d2c54acf00f000000
-       //TODO: VPOPCNTB -15(R14)(R15*2), K4, Y13                  // 62127d2c54ac7ef1ffffff
-       //TODO: VPOPCNTB Y14, K4, Y20                              // 62c27d2c54e6
-       //TODO: VPOPCNTB Y21, K4, Y20                              // 62a27d2c54e5
-       //TODO: VPOPCNTB Y1, K4, Y20                               // 62e27d2c54e1
-       //TODO: VPOPCNTB 15(R8)(R14*8), K4, Y20                    // 62827d2c54a4f00f000000
-       //TODO: VPOPCNTB -15(R14)(R15*2), K4, Y20                  // 62827d2c54a47ef1ffffff
-       //TODO: VPOPCNTB Z18, K7, Z13                              // 62327d4f54ea
-       //TODO: VPOPCNTB Z8, K7, Z13                               // 62527d4f54e8
-       //TODO: VPOPCNTB 17(SP)(BP*8), K7, Z13                     // 62727d4f54acec11000000
-       //TODO: VPOPCNTB 17(SP)(BP*4), K7, Z13                     // 62727d4f54acac11000000
-       //TODO: VPOPCNTW X20, K3, X11                              // 6232fd0b54dc
-       //TODO: VPOPCNTW X5, K3, X11                               // 6272fd0b54dd
-       //TODO: VPOPCNTW X25, K3, X11                              // 6212fd0b54d9
-       //TODO: VPOPCNTW (CX), K3, X11                             // 6272fd0b5419
-       //TODO: VPOPCNTW 99(R15), K3, X11                          // 6252fd0b549f63000000
-       //TODO: VPOPCNTW X20, K3, X23                              // 62a2fd0b54fc
-       //TODO: VPOPCNTW X5, K3, X23                               // 62e2fd0b54fd
-       //TODO: VPOPCNTW X25, K3, X23                              // 6282fd0b54f9
-       //TODO: VPOPCNTW (CX), K3, X23                             // 62e2fd0b5439
-       //TODO: VPOPCNTW 99(R15), K3, X23                          // 62c2fd0b54bf63000000
-       //TODO: VPOPCNTW X20, K3, X2                               // 62b2fd0b54d4
-       //TODO: VPOPCNTW X5, K3, X2                                // 62f2fd0b54d5
-       //TODO: VPOPCNTW X25, K3, X2                               // 6292fd0b54d1
-       //TODO: VPOPCNTW (CX), K3, X2                              // 62f2fd0b5411
-       //TODO: VPOPCNTW 99(R15), K3, X2                           // 62d2fd0b549763000000
-       //TODO: VPOPCNTW Y13, K3, Y21                              // 62c2fd2b54ed
-       //TODO: VPOPCNTW Y18, K3, Y21                              // 62a2fd2b54ea
-       //TODO: VPOPCNTW Y24, K3, Y21                              // 6282fd2b54e8
-       //TODO: VPOPCNTW (SI), K3, Y21                             // 62e2fd2b542e
-       //TODO: VPOPCNTW 7(SI)(DI*2), K3, Y21                      // 62e2fd2b54ac7e07000000
-       //TODO: VPOPCNTW Y13, K3, Y7                               // 62d2fd2b54fd
-       //TODO: VPOPCNTW Y18, K3, Y7                               // 62b2fd2b54fa
-       //TODO: VPOPCNTW Y24, K3, Y7                               // 6292fd2b54f8
-       //TODO: VPOPCNTW (SI), K3, Y7                              // 62f2fd2b543e
-       //TODO: VPOPCNTW 7(SI)(DI*2), K3, Y7                       // 62f2fd2b54bc7e07000000
-       //TODO: VPOPCNTW Y13, K3, Y30                              // 6242fd2b54f5
-       //TODO: VPOPCNTW Y18, K3, Y30                              // 6222fd2b54f2
-       //TODO: VPOPCNTW Y24, K3, Y30                              // 6202fd2b54f0
-       //TODO: VPOPCNTW (SI), K3, Y30                             // 6262fd2b5436
-       //TODO: VPOPCNTW 7(SI)(DI*2), K3, Y30                      // 6262fd2b54b47e07000000
-       //TODO: VPOPCNTW Z28, K3, Z12                              // 6212fd4b54e4
-       //TODO: VPOPCNTW Z13, K3, Z12                              // 6252fd4b54e5
-       //TODO: VPOPCNTW 7(AX), K3, Z12                            // 6272fd4b54a007000000
-       //TODO: VPOPCNTW (DI), K3, Z12                             // 6272fd4b5427
-       //TODO: VPOPCNTW Z28, K3, Z16                              // 6282fd4b54c4
-       //TODO: VPOPCNTW Z13, K3, Z16                              // 62c2fd4b54c5
-       //TODO: VPOPCNTW 7(AX), K3, Z16                            // 62e2fd4b548007000000
-       //TODO: VPOPCNTW (DI), K3, Z16                             // 62e2fd4b5407
-       //TODO: VPSHUFBITQMB X24, X7, K6, K0                       // 6292450e8fc0
-       //TODO: VPSHUFBITQMB X7, X7, K6, K0                        // 62f2450e8fc7
-       //TODO: VPSHUFBITQMB X0, X7, K6, K0                        // 62f2450e8fc0
-       //TODO: VPSHUFBITQMB (R8), X7, K6, K0                      // 62d2450e8f00
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X7, K6, K0              // 62f2450e8f845a0f000000
-       //TODO: VPSHUFBITQMB X24, X13, K6, K0                      // 6292150e8fc0
-       //TODO: VPSHUFBITQMB X7, X13, K6, K0                       // 62f2150e8fc7
-       //TODO: VPSHUFBITQMB X0, X13, K6, K0                       // 62f2150e8fc0
-       //TODO: VPSHUFBITQMB (R8), X13, K6, K0                     // 62d2150e8f00
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X13, K6, K0             // 62f2150e8f845a0f000000
-       //TODO: VPSHUFBITQMB X24, X8, K6, K0                       // 62923d0e8fc0
-       //TODO: VPSHUFBITQMB X7, X8, K6, K0                        // 62f23d0e8fc7
-       //TODO: VPSHUFBITQMB X0, X8, K6, K0                        // 62f23d0e8fc0
-       //TODO: VPSHUFBITQMB (R8), X8, K6, K0                      // 62d23d0e8f00
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X8, K6, K0              // 62f23d0e8f845a0f000000
-       //TODO: VPSHUFBITQMB X24, X7, K6, K5                       // 6292450e8fe8
-       //TODO: VPSHUFBITQMB X7, X7, K6, K5                        // 62f2450e8fef
-       //TODO: VPSHUFBITQMB X0, X7, K6, K5                        // 62f2450e8fe8
-       //TODO: VPSHUFBITQMB (R8), X7, K6, K5                      // 62d2450e8f28
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X7, K6, K5              // 62f2450e8fac5a0f000000
-       //TODO: VPSHUFBITQMB X24, X13, K6, K5                      // 6292150e8fe8
-       //TODO: VPSHUFBITQMB X7, X13, K6, K5                       // 62f2150e8fef
-       //TODO: VPSHUFBITQMB X0, X13, K6, K5                       // 62f2150e8fe8
-       //TODO: VPSHUFBITQMB (R8), X13, K6, K5                     // 62d2150e8f28
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X13, K6, K5             // 62f2150e8fac5a0f000000
-       //TODO: VPSHUFBITQMB X24, X8, K6, K5                       // 62923d0e8fe8
-       //TODO: VPSHUFBITQMB X7, X8, K6, K5                        // 62f23d0e8fef
-       //TODO: VPSHUFBITQMB X0, X8, K6, K5                        // 62f23d0e8fe8
-       //TODO: VPSHUFBITQMB (R8), X8, K6, K5                      // 62d23d0e8f28
-       //TODO: VPSHUFBITQMB 15(DX)(BX*2), X8, K6, K5              // 62f23d0e8fac5a0f000000
-       //TODO: VPSHUFBITQMB Y14, Y2, K3, K6                       // 62d26d2b8ff6
-       //TODO: VPSHUFBITQMB Y8, Y2, K3, K6                        // 62d26d2b8ff0
-       //TODO: VPSHUFBITQMB Y20, Y2, K3, K6                       // 62b26d2b8ff4
-       //TODO: VPSHUFBITQMB -17(BP), Y2, K3, K6                   // 62f26d2b8fb5efffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y2, K3, K6           // 62926d2b8fb4fef1ffffff
-       //TODO: VPSHUFBITQMB Y14, Y7, K3, K6                       // 62d2452b8ff6
-       //TODO: VPSHUFBITQMB Y8, Y7, K3, K6                        // 62d2452b8ff0
-       //TODO: VPSHUFBITQMB Y20, Y7, K3, K6                       // 62b2452b8ff4
-       //TODO: VPSHUFBITQMB -17(BP), Y7, K3, K6                   // 62f2452b8fb5efffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y7, K3, K6           // 6292452b8fb4fef1ffffff
-       //TODO: VPSHUFBITQMB Y14, Y21, K3, K6                      // 62d255238ff6
-       //TODO: VPSHUFBITQMB Y8, Y21, K3, K6                       // 62d255238ff0
-       //TODO: VPSHUFBITQMB Y20, Y21, K3, K6                      // 62b255238ff4
-       //TODO: VPSHUFBITQMB -17(BP), Y21, K3, K6                  // 62f255238fb5efffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y21, K3, K6          // 629255238fb4fef1ffffff
-       //TODO: VPSHUFBITQMB Y14, Y2, K3, K5                       // 62d26d2b8fee
-       //TODO: VPSHUFBITQMB Y8, Y2, K3, K5                        // 62d26d2b8fe8
-       //TODO: VPSHUFBITQMB Y20, Y2, K3, K5                       // 62b26d2b8fec
-       //TODO: VPSHUFBITQMB -17(BP), Y2, K3, K5                   // 62f26d2b8fadefffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y2, K3, K5           // 62926d2b8facfef1ffffff
-       //TODO: VPSHUFBITQMB Y14, Y7, K3, K5                       // 62d2452b8fee
-       //TODO: VPSHUFBITQMB Y8, Y7, K3, K5                        // 62d2452b8fe8
-       //TODO: VPSHUFBITQMB Y20, Y7, K3, K5                       // 62b2452b8fec
-       //TODO: VPSHUFBITQMB -17(BP), Y7, K3, K5                   // 62f2452b8fadefffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y7, K3, K5           // 6292452b8facfef1ffffff
-       //TODO: VPSHUFBITQMB Y14, Y21, K3, K5                      // 62d255238fee
-       //TODO: VPSHUFBITQMB Y8, Y21, K3, K5                       // 62d255238fe8
-       //TODO: VPSHUFBITQMB Y20, Y21, K3, K5                      // 62b255238fec
-       //TODO: VPSHUFBITQMB -17(BP), Y21, K3, K5                  // 62f255238fadefffffff
-       //TODO: VPSHUFBITQMB -15(R14)(R15*8), Y21, K3, K5          // 629255238facfef1ffffff
-       //TODO: VPSHUFBITQMB Z3, Z6, K7, K1                        // 62f24d4f8fcb
-       //TODO: VPSHUFBITQMB Z21, Z6, K7, K1                       // 62b24d4f8fcd
-       //TODO: VPSHUFBITQMB -15(R14)(R15*1), Z6, K7, K1           // 62924d4f8f8c3ef1ffffff
-       //TODO: VPSHUFBITQMB -15(BX), Z6, K7, K1                   // 62f24d4f8f8bf1ffffff
-       //TODO: VPSHUFBITQMB Z3, Z25, K7, K1                       // 62f235478fcb
-       //TODO: VPSHUFBITQMB Z21, Z25, K7, K1                      // 62b235478fcd
-       //TODO: VPSHUFBITQMB -15(R14)(R15*1), Z25, K7, K1          // 629235478f8c3ef1ffffff
-       //TODO: VPSHUFBITQMB -15(BX), Z25, K7, K1                  // 62f235478f8bf1ffffff
-       //TODO: VPSHUFBITQMB Z3, Z6, K7, K5                        // 62f24d4f8feb
-       //TODO: VPSHUFBITQMB Z21, Z6, K7, K5                       // 62b24d4f8fed
-       //TODO: VPSHUFBITQMB -15(R14)(R15*1), Z6, K7, K5           // 62924d4f8fac3ef1ffffff
-       //TODO: VPSHUFBITQMB -15(BX), Z6, K7, K5                   // 62f24d4f8fabf1ffffff
-       //TODO: VPSHUFBITQMB Z3, Z25, K7, K5                       // 62f235478feb
-       //TODO: VPSHUFBITQMB Z21, Z25, K7, K5                      // 62b235478fed
-       //TODO: VPSHUFBITQMB -15(R14)(R15*1), Z25, K7, K5          // 629235478fac3ef1ffffff
-       //TODO: VPSHUFBITQMB -15(BX), Z25, K7, K5                  // 62f235478fabf1ffffff
+       VPOPCNTB X14, K4, X16                              // 62c27d0c54c6
+       VPOPCNTB X19, K4, X16                              // 62a27d0c54c3
+       VPOPCNTB X8, K4, X16                               // 62c27d0c54c0
+       VPOPCNTB 15(R8)(R14*1), K4, X16                    // 62827d0c5484300f000000
+       VPOPCNTB 15(R8)(R14*2), K4, X16                    // 62827d0c5484700f000000
+       VPOPCNTB X14, K4, X14                              // 62527d0c54f6
+       VPOPCNTB X19, K4, X14                              // 62327d0c54f3
+       VPOPCNTB X8, K4, X14                               // 62527d0c54f0
+       VPOPCNTB 15(R8)(R14*1), K4, X14                    // 62127d0c54b4300f000000
+       VPOPCNTB 15(R8)(R14*2), K4, X14                    // 62127d0c54b4700f000000
+       VPOPCNTB X14, K4, X11                              // 62527d0c54de
+       VPOPCNTB X19, K4, X11                              // 62327d0c54db
+       VPOPCNTB X8, K4, X11                               // 62527d0c54d8
+       VPOPCNTB 15(R8)(R14*1), K4, X11                    // 62127d0c549c300f000000
+       VPOPCNTB 15(R8)(R14*2), K4, X11                    // 62127d0c549c700f000000
+       VPOPCNTB Y14, K4, Y24                              // 62427d2c54c6
+       VPOPCNTB Y21, K4, Y24                              // 62227d2c54c5
+       VPOPCNTB Y1, K4, Y24                               // 62627d2c54c1
+       VPOPCNTB 15(R8)(R14*8), K4, Y24                    // 62027d2c5484f00f000000
+       VPOPCNTB -15(R14)(R15*2), K4, Y24                  // 62027d2c54847ef1ffffff
+       VPOPCNTB Y14, K4, Y13                              // 62527d2c54ee
+       VPOPCNTB Y21, K4, Y13                              // 62327d2c54ed
+       VPOPCNTB Y1, K4, Y13                               // 62727d2c54e9
+       VPOPCNTB 15(R8)(R14*8), K4, Y13                    // 62127d2c54acf00f000000
+       VPOPCNTB -15(R14)(R15*2), K4, Y13                  // 62127d2c54ac7ef1ffffff
+       VPOPCNTB Y14, K4, Y20                              // 62c27d2c54e6
+       VPOPCNTB Y21, K4, Y20                              // 62a27d2c54e5
+       VPOPCNTB Y1, K4, Y20                               // 62e27d2c54e1
+       VPOPCNTB 15(R8)(R14*8), K4, Y20                    // 62827d2c54a4f00f000000
+       VPOPCNTB -15(R14)(R15*2), K4, Y20                  // 62827d2c54a47ef1ffffff
+       VPOPCNTB Z18, K7, Z13                              // 62327d4f54ea
+       VPOPCNTB Z8, K7, Z13                               // 62527d4f54e8
+       VPOPCNTB 17(SP)(BP*8), K7, Z13                     // 62727d4f54acec11000000
+       VPOPCNTB 17(SP)(BP*4), K7, Z13                     // 62727d4f54acac11000000
+       VPOPCNTW X20, K3, X11                              // 6232fd0b54dc
+       VPOPCNTW X5, K3, X11                               // 6272fd0b54dd
+       VPOPCNTW X25, K3, X11                              // 6212fd0b54d9
+       VPOPCNTW (CX), K3, X11                             // 6272fd0b5419
+       VPOPCNTW 99(R15), K3, X11                          // 6252fd0b549f63000000
+       VPOPCNTW X20, K3, X23                              // 62a2fd0b54fc
+       VPOPCNTW X5, K3, X23                               // 62e2fd0b54fd
+       VPOPCNTW X25, K3, X23                              // 6282fd0b54f9
+       VPOPCNTW (CX), K3, X23                             // 62e2fd0b5439
+       VPOPCNTW 99(R15), K3, X23                          // 62c2fd0b54bf63000000
+       VPOPCNTW X20, K3, X2                               // 62b2fd0b54d4
+       VPOPCNTW X5, K3, X2                                // 62f2fd0b54d5
+       VPOPCNTW X25, K3, X2                               // 6292fd0b54d1
+       VPOPCNTW (CX), K3, X2                              // 62f2fd0b5411
+       VPOPCNTW 99(R15), K3, X2                           // 62d2fd0b549763000000
+       VPOPCNTW Y13, K3, Y21                              // 62c2fd2b54ed
+       VPOPCNTW Y18, K3, Y21                              // 62a2fd2b54ea
+       VPOPCNTW Y24, K3, Y21                              // 6282fd2b54e8
+       VPOPCNTW (SI), K3, Y21                             // 62e2fd2b542e
+       VPOPCNTW 7(SI)(DI*2), K3, Y21                      // 62e2fd2b54ac7e07000000
+       VPOPCNTW Y13, K3, Y7                               // 62d2fd2b54fd
+       VPOPCNTW Y18, K3, Y7                               // 62b2fd2b54fa
+       VPOPCNTW Y24, K3, Y7                               // 6292fd2b54f8
+       VPOPCNTW (SI), K3, Y7                              // 62f2fd2b543e
+       VPOPCNTW 7(SI)(DI*2), K3, Y7                       // 62f2fd2b54bc7e07000000
+       VPOPCNTW Y13, K3, Y30                              // 6242fd2b54f5
+       VPOPCNTW Y18, K3, Y30                              // 6222fd2b54f2
+       VPOPCNTW Y24, K3, Y30                              // 6202fd2b54f0
+       VPOPCNTW (SI), K3, Y30                             // 6262fd2b5436
+       VPOPCNTW 7(SI)(DI*2), K3, Y30                      // 6262fd2b54b47e07000000
+       VPOPCNTW Z28, K3, Z12                              // 6212fd4b54e4
+       VPOPCNTW Z13, K3, Z12                              // 6252fd4b54e5
+       VPOPCNTW 7(AX), K3, Z12                            // 6272fd4b54a007000000
+       VPOPCNTW (DI), K3, Z12                             // 6272fd4b5427
+       VPOPCNTW Z28, K3, Z16                              // 6282fd4b54c4
+       VPOPCNTW Z13, K3, Z16                              // 62c2fd4b54c5
+       VPOPCNTW 7(AX), K3, Z16                            // 62e2fd4b548007000000
+       VPOPCNTW (DI), K3, Z16                             // 62e2fd4b5407
+       VPSHUFBITQMB X24, X7, K6, K0                       // 6292450e8fc0
+       VPSHUFBITQMB X7, X7, K6, K0                        // 62f2450e8fc7
+       VPSHUFBITQMB X0, X7, K6, K0                        // 62f2450e8fc0
+       VPSHUFBITQMB (R8), X7, K6, K0                      // 62d2450e8f00
+       VPSHUFBITQMB 15(DX)(BX*2), X7, K6, K0              // 62f2450e8f845a0f000000
+       VPSHUFBITQMB X24, X13, K6, K0                      // 6292150e8fc0
+       VPSHUFBITQMB X7, X13, K6, K0                       // 62f2150e8fc7
+       VPSHUFBITQMB X0, X13, K6, K0                       // 62f2150e8fc0
+       VPSHUFBITQMB (R8), X13, K6, K0                     // 62d2150e8f00
+       VPSHUFBITQMB 15(DX)(BX*2), X13, K6, K0             // 62f2150e8f845a0f000000
+       VPSHUFBITQMB X24, X8, K6, K0                       // 62923d0e8fc0
+       VPSHUFBITQMB X7, X8, K6, K0                        // 62f23d0e8fc7
+       VPSHUFBITQMB X0, X8, K6, K0                        // 62f23d0e8fc0
+       VPSHUFBITQMB (R8), X8, K6, K0                      // 62d23d0e8f00
+       VPSHUFBITQMB 15(DX)(BX*2), X8, K6, K0              // 62f23d0e8f845a0f000000
+       VPSHUFBITQMB X24, X7, K6, K5                       // 6292450e8fe8
+       VPSHUFBITQMB X7, X7, K6, K5                        // 62f2450e8fef
+       VPSHUFBITQMB X0, X7, K6, K5                        // 62f2450e8fe8
+       VPSHUFBITQMB (R8), X7, K6, K5                      // 62d2450e8f28
+       VPSHUFBITQMB 15(DX)(BX*2), X7, K6, K5              // 62f2450e8fac5a0f000000
+       VPSHUFBITQMB X24, X13, K6, K5                      // 6292150e8fe8
+       VPSHUFBITQMB X7, X13, K6, K5                       // 62f2150e8fef
+       VPSHUFBITQMB X0, X13, K6, K5                       // 62f2150e8fe8
+       VPSHUFBITQMB (R8), X13, K6, K5                     // 62d2150e8f28
+       VPSHUFBITQMB 15(DX)(BX*2), X13, K6, K5             // 62f2150e8fac5a0f000000
+       VPSHUFBITQMB X24, X8, K6, K5                       // 62923d0e8fe8
+       VPSHUFBITQMB X7, X8, K6, K5                        // 62f23d0e8fef
+       VPSHUFBITQMB X0, X8, K6, K5                        // 62f23d0e8fe8
+       VPSHUFBITQMB (R8), X8, K6, K5                      // 62d23d0e8f28
+       VPSHUFBITQMB 15(DX)(BX*2), X8, K6, K5              // 62f23d0e8fac5a0f000000
+       VPSHUFBITQMB Y14, Y2, K3, K6                       // 62d26d2b8ff6
+       VPSHUFBITQMB Y8, Y2, K3, K6                        // 62d26d2b8ff0
+       VPSHUFBITQMB Y20, Y2, K3, K6                       // 62b26d2b8ff4
+       VPSHUFBITQMB -17(BP), Y2, K3, K6                   // 62f26d2b8fb5efffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y2, K3, K6           // 62926d2b8fb4fef1ffffff
+       VPSHUFBITQMB Y14, Y7, K3, K6                       // 62d2452b8ff6
+       VPSHUFBITQMB Y8, Y7, K3, K6                        // 62d2452b8ff0
+       VPSHUFBITQMB Y20, Y7, K3, K6                       // 62b2452b8ff4
+       VPSHUFBITQMB -17(BP), Y7, K3, K6                   // 62f2452b8fb5efffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y7, K3, K6           // 6292452b8fb4fef1ffffff
+       VPSHUFBITQMB Y14, Y21, K3, K6                      // 62d255238ff6
+       VPSHUFBITQMB Y8, Y21, K3, K6                       // 62d255238ff0
+       VPSHUFBITQMB Y20, Y21, K3, K6                      // 62b255238ff4
+       VPSHUFBITQMB -17(BP), Y21, K3, K6                  // 62f255238fb5efffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y21, K3, K6          // 629255238fb4fef1ffffff
+       VPSHUFBITQMB Y14, Y2, K3, K5                       // 62d26d2b8fee
+       VPSHUFBITQMB Y8, Y2, K3, K5                        // 62d26d2b8fe8
+       VPSHUFBITQMB Y20, Y2, K3, K5                       // 62b26d2b8fec
+       VPSHUFBITQMB -17(BP), Y2, K3, K5                   // 62f26d2b8fadefffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y2, K3, K5           // 62926d2b8facfef1ffffff
+       VPSHUFBITQMB Y14, Y7, K3, K5                       // 62d2452b8fee
+       VPSHUFBITQMB Y8, Y7, K3, K5                        // 62d2452b8fe8
+       VPSHUFBITQMB Y20, Y7, K3, K5                       // 62b2452b8fec
+       VPSHUFBITQMB -17(BP), Y7, K3, K5                   // 62f2452b8fadefffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y7, K3, K5           // 6292452b8facfef1ffffff
+       VPSHUFBITQMB Y14, Y21, K3, K5                      // 62d255238fee
+       VPSHUFBITQMB Y8, Y21, K3, K5                       // 62d255238fe8
+       VPSHUFBITQMB Y20, Y21, K3, K5                      // 62b255238fec
+       VPSHUFBITQMB -17(BP), Y21, K3, K5                  // 62f255238fadefffffff
+       VPSHUFBITQMB -15(R14)(R15*8), Y21, K3, K5          // 629255238facfef1ffffff
+       VPSHUFBITQMB Z3, Z6, K7, K1                        // 62f24d4f8fcb
+       VPSHUFBITQMB Z21, Z6, K7, K1                       // 62b24d4f8fcd
+       VPSHUFBITQMB -15(R14)(R15*1), Z6, K7, K1           // 62924d4f8f8c3ef1ffffff
+       VPSHUFBITQMB -15(BX), Z6, K7, K1                   // 62f24d4f8f8bf1ffffff
+       VPSHUFBITQMB Z3, Z25, K7, K1                       // 62f235478fcb
+       VPSHUFBITQMB Z21, Z25, K7, K1                      // 62b235478fcd
+       VPSHUFBITQMB -15(R14)(R15*1), Z25, K7, K1          // 629235478f8c3ef1ffffff
+       VPSHUFBITQMB -15(BX), Z25, K7, K1                  // 62f235478f8bf1ffffff
+       VPSHUFBITQMB Z3, Z6, K7, K5                        // 62f24d4f8feb
+       VPSHUFBITQMB Z21, Z6, K7, K5                       // 62b24d4f8fed
+       VPSHUFBITQMB -15(R14)(R15*1), Z6, K7, K5           // 62924d4f8fac3ef1ffffff
+       VPSHUFBITQMB -15(BX), Z6, K7, K5                   // 62f24d4f8fabf1ffffff
+       VPSHUFBITQMB Z3, Z25, K7, K5                       // 62f235478feb
+       VPSHUFBITQMB Z21, Z25, K7, K5                      // 62b235478fed
+       VPSHUFBITQMB -15(R14)(R15*1), Z25, K7, K5          // 629235478fac3ef1ffffff
+       VPSHUFBITQMB -15(BX), Z25, K7, K5                  // 62f235478fabf1ffffff
        RET
index ed7732115f60135655e713a434cd746df592d9e3..6a1e5baadc3e2d14a33056cd221d0f117ce11958 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_ifma(SB), NOSPLIT, $0
-       //TODO: VPMADD52HUQ X7, X11, K1, X18                       // 62e2a509b5d7
-       //TODO: VPMADD52HUQ X0, X11, K1, X18                       // 62e2a509b5d0
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X11, K1, X18             // 62e2a509b5946c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X11, K1, X18             // 62a2a509b59487f9ffffff
-       //TODO: VPMADD52HUQ X7, X31, K1, X18                       // 62e28501b5d7
-       //TODO: VPMADD52HUQ X0, X31, K1, X18                       // 62e28501b5d0
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X31, K1, X18             // 62e28501b5946c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X31, K1, X18             // 62a28501b59487f9ffffff
-       //TODO: VPMADD52HUQ X7, X3, K1, X18                        // 62e2e509b5d7
-       //TODO: VPMADD52HUQ X0, X3, K1, X18                        // 62e2e509b5d0
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X3, K1, X18              // 62e2e509b5946c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X3, K1, X18              // 62a2e509b59487f9ffffff
-       //TODO: VPMADD52HUQ X7, X11, K1, X21                       // 62e2a509b5ef
-       //TODO: VPMADD52HUQ X0, X11, K1, X21                       // 62e2a509b5e8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X11, K1, X21             // 62e2a509b5ac6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X11, K1, X21             // 62a2a509b5ac87f9ffffff
-       //TODO: VPMADD52HUQ X7, X31, K1, X21                       // 62e28501b5ef
-       //TODO: VPMADD52HUQ X0, X31, K1, X21                       // 62e28501b5e8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X31, K1, X21             // 62e28501b5ac6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X31, K1, X21             // 62a28501b5ac87f9ffffff
-       //TODO: VPMADD52HUQ X7, X3, K1, X21                        // 62e2e509b5ef
-       //TODO: VPMADD52HUQ X0, X3, K1, X21                        // 62e2e509b5e8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X3, K1, X21              // 62e2e509b5ac6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X3, K1, X21              // 62a2e509b5ac87f9ffffff
-       //TODO: VPMADD52HUQ X7, X11, K1, X1                        // 62f2a509b5cf
-       //TODO: VPMADD52HUQ X0, X11, K1, X1                        // 62f2a509b5c8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X11, K1, X1              // 62f2a509b58c6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X11, K1, X1              // 62b2a509b58c87f9ffffff
-       //TODO: VPMADD52HUQ X7, X31, K1, X1                        // 62f28501b5cf
-       //TODO: VPMADD52HUQ X0, X31, K1, X1                        // 62f28501b5c8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X31, K1, X1              // 62f28501b58c6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X31, K1, X1              // 62b28501b58c87f9ffffff
-       //TODO: VPMADD52HUQ X7, X3, K1, X1                         // 62f2e509b5cf
-       //TODO: VPMADD52HUQ X0, X3, K1, X1                         // 62f2e509b5c8
-       //TODO: VPMADD52HUQ 17(SP)(BP*2), X3, K1, X1               // 62f2e509b58c6c11000000
-       //TODO: VPMADD52HUQ -7(DI)(R8*4), X3, K1, X1               // 62b2e509b58c87f9ffffff
-       //TODO: VPMADD52HUQ Y28, Y31, K7, Y17                      // 62828527b5cc
-       //TODO: VPMADD52HUQ Y13, Y31, K7, Y17                      // 62c28527b5cd
-       //TODO: VPMADD52HUQ Y7, Y31, K7, Y17                       // 62e28527b5cf
-       //TODO: VPMADD52HUQ (R8), Y31, K7, Y17                     // 62c28527b508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y17             // 62e28527b58c5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y8, K7, Y17                       // 6282bd2fb5cc
-       //TODO: VPMADD52HUQ Y13, Y8, K7, Y17                       // 62c2bd2fb5cd
-       //TODO: VPMADD52HUQ Y7, Y8, K7, Y17                        // 62e2bd2fb5cf
-       //TODO: VPMADD52HUQ (R8), Y8, K7, Y17                      // 62c2bd2fb508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y17              // 62e2bd2fb58c5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y1, K7, Y17                       // 6282f52fb5cc
-       //TODO: VPMADD52HUQ Y13, Y1, K7, Y17                       // 62c2f52fb5cd
-       //TODO: VPMADD52HUQ Y7, Y1, K7, Y17                        // 62e2f52fb5cf
-       //TODO: VPMADD52HUQ (R8), Y1, K7, Y17                      // 62c2f52fb508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y17              // 62e2f52fb58c5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y31, K7, Y7                       // 62928527b5fc
-       //TODO: VPMADD52HUQ Y13, Y31, K7, Y7                       // 62d28527b5fd
-       //TODO: VPMADD52HUQ Y7, Y31, K7, Y7                        // 62f28527b5ff
-       //TODO: VPMADD52HUQ (R8), Y31, K7, Y7                      // 62d28527b538
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y7              // 62f28527b5bc5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y8, K7, Y7                        // 6292bd2fb5fc
-       //TODO: VPMADD52HUQ Y13, Y8, K7, Y7                        // 62d2bd2fb5fd
-       //TODO: VPMADD52HUQ Y7, Y8, K7, Y7                         // 62f2bd2fb5ff
-       //TODO: VPMADD52HUQ (R8), Y8, K7, Y7                       // 62d2bd2fb538
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y7               // 62f2bd2fb5bc5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y1, K7, Y7                        // 6292f52fb5fc
-       //TODO: VPMADD52HUQ Y13, Y1, K7, Y7                        // 62d2f52fb5fd
-       //TODO: VPMADD52HUQ Y7, Y1, K7, Y7                         // 62f2f52fb5ff
-       //TODO: VPMADD52HUQ (R8), Y1, K7, Y7                       // 62d2f52fb538
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y7               // 62f2f52fb5bc5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y31, K7, Y9                       // 62128527b5cc
-       //TODO: VPMADD52HUQ Y13, Y31, K7, Y9                       // 62528527b5cd
-       //TODO: VPMADD52HUQ Y7, Y31, K7, Y9                        // 62728527b5cf
-       //TODO: VPMADD52HUQ (R8), Y31, K7, Y9                      // 62528527b508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y9              // 62728527b58c5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y8, K7, Y9                        // 6212bd2fb5cc
-       //TODO: VPMADD52HUQ Y13, Y8, K7, Y9                        // 6252bd2fb5cd
-       //TODO: VPMADD52HUQ Y7, Y8, K7, Y9                         // 6272bd2fb5cf
-       //TODO: VPMADD52HUQ (R8), Y8, K7, Y9                       // 6252bd2fb508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y9               // 6272bd2fb58c5a0f000000
-       //TODO: VPMADD52HUQ Y28, Y1, K7, Y9                        // 6212f52fb5cc
-       //TODO: VPMADD52HUQ Y13, Y1, K7, Y9                        // 6252f52fb5cd
-       //TODO: VPMADD52HUQ Y7, Y1, K7, Y9                         // 6272f52fb5cf
-       //TODO: VPMADD52HUQ (R8), Y1, K7, Y9                       // 6252f52fb508
-       //TODO: VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y9               // 6272f52fb58c5a0f000000
-       //TODO: VPMADD52HUQ Z23, Z23, K1, Z27                      // 6222c541b5df
-       //TODO: VPMADD52HUQ Z6, Z23, K1, Z27                       // 6262c541b5de
-       //TODO: VPMADD52HUQ 17(SP), Z23, K1, Z27                   // 6262c541b59c2411000000
-       //TODO: VPMADD52HUQ -17(BP)(SI*4), Z23, K1, Z27            // 6262c541b59cb5efffffff
-       //TODO: VPMADD52HUQ Z23, Z5, K1, Z27                       // 6222d549b5df
-       //TODO: VPMADD52HUQ Z6, Z5, K1, Z27                        // 6262d549b5de
-       //TODO: VPMADD52HUQ 17(SP), Z5, K1, Z27                    // 6262d549b59c2411000000
-       //TODO: VPMADD52HUQ -17(BP)(SI*4), Z5, K1, Z27             // 6262d549b59cb5efffffff
-       //TODO: VPMADD52HUQ Z23, Z23, K1, Z15                      // 6232c541b5ff
-       //TODO: VPMADD52HUQ Z6, Z23, K1, Z15                       // 6272c541b5fe
-       //TODO: VPMADD52HUQ 17(SP), Z23, K1, Z15                   // 6272c541b5bc2411000000
-       //TODO: VPMADD52HUQ -17(BP)(SI*4), Z23, K1, Z15            // 6272c541b5bcb5efffffff
-       //TODO: VPMADD52HUQ Z23, Z5, K1, Z15                       // 6232d549b5ff
-       //TODO: VPMADD52HUQ Z6, Z5, K1, Z15                        // 6272d549b5fe
-       //TODO: VPMADD52HUQ 17(SP), Z5, K1, Z15                    // 6272d549b5bc2411000000
-       //TODO: VPMADD52HUQ -17(BP)(SI*4), Z5, K1, Z15             // 6272d549b5bcb5efffffff
-       //TODO: VPMADD52LUQ X5, X9, K1, X24                        // 6262b509b4c5
-       //TODO: VPMADD52LUQ X31, X9, K1, X24                       // 6202b509b4c7
-       //TODO: VPMADD52LUQ X3, X9, K1, X24                        // 6262b509b4c3
-       //TODO: VPMADD52LUQ 15(R8), X9, K1, X24                    // 6242b509b4800f000000
-       //TODO: VPMADD52LUQ (BP), X9, K1, X24                      // 6262b509b44500
-       //TODO: VPMADD52LUQ X5, X7, K1, X24                        // 6262c509b4c5
-       //TODO: VPMADD52LUQ X31, X7, K1, X24                       // 6202c509b4c7
-       //TODO: VPMADD52LUQ X3, X7, K1, X24                        // 6262c509b4c3
-       //TODO: VPMADD52LUQ 15(R8), X7, K1, X24                    // 6242c509b4800f000000
-       //TODO: VPMADD52LUQ (BP), X7, K1, X24                      // 6262c509b44500
-       //TODO: VPMADD52LUQ X5, X14, K1, X24                       // 62628d09b4c5
-       //TODO: VPMADD52LUQ X31, X14, K1, X24                      // 62028d09b4c7
-       //TODO: VPMADD52LUQ X3, X14, K1, X24                       // 62628d09b4c3
-       //TODO: VPMADD52LUQ 15(R8), X14, K1, X24                   // 62428d09b4800f000000
-       //TODO: VPMADD52LUQ (BP), X14, K1, X24                     // 62628d09b44500
-       //TODO: VPMADD52LUQ X5, X9, K1, X20                        // 62e2b509b4e5
-       //TODO: VPMADD52LUQ X31, X9, K1, X20                       // 6282b509b4e7
-       //TODO: VPMADD52LUQ X3, X9, K1, X20                        // 62e2b509b4e3
-       //TODO: VPMADD52LUQ 15(R8), X9, K1, X20                    // 62c2b509b4a00f000000
-       //TODO: VPMADD52LUQ (BP), X9, K1, X20                      // 62e2b509b46500
-       //TODO: VPMADD52LUQ X5, X7, K1, X20                        // 62e2c509b4e5
-       //TODO: VPMADD52LUQ X31, X7, K1, X20                       // 6282c509b4e7
-       //TODO: VPMADD52LUQ X3, X7, K1, X20                        // 62e2c509b4e3
-       //TODO: VPMADD52LUQ 15(R8), X7, K1, X20                    // 62c2c509b4a00f000000
-       //TODO: VPMADD52LUQ (BP), X7, K1, X20                      // 62e2c509b46500
-       //TODO: VPMADD52LUQ X5, X14, K1, X20                       // 62e28d09b4e5
-       //TODO: VPMADD52LUQ X31, X14, K1, X20                      // 62828d09b4e7
-       //TODO: VPMADD52LUQ X3, X14, K1, X20                       // 62e28d09b4e3
-       //TODO: VPMADD52LUQ 15(R8), X14, K1, X20                   // 62c28d09b4a00f000000
-       //TODO: VPMADD52LUQ (BP), X14, K1, X20                     // 62e28d09b46500
-       //TODO: VPMADD52LUQ X5, X9, K1, X7                         // 62f2b509b4fd
-       //TODO: VPMADD52LUQ X31, X9, K1, X7                        // 6292b509b4ff
-       //TODO: VPMADD52LUQ X3, X9, K1, X7                         // 62f2b509b4fb
-       //TODO: VPMADD52LUQ 15(R8), X9, K1, X7                     // 62d2b509b4b80f000000
-       //TODO: VPMADD52LUQ (BP), X9, K1, X7                       // 62f2b509b47d00
-       //TODO: VPMADD52LUQ X5, X7, K1, X7                         // 62f2c509b4fd
-       //TODO: VPMADD52LUQ X31, X7, K1, X7                        // 6292c509b4ff
-       //TODO: VPMADD52LUQ X3, X7, K1, X7                         // 62f2c509b4fb
-       //TODO: VPMADD52LUQ 15(R8), X7, K1, X7                     // 62d2c509b4b80f000000
-       //TODO: VPMADD52LUQ (BP), X7, K1, X7                       // 62f2c509b47d00
-       //TODO: VPMADD52LUQ X5, X14, K1, X7                        // 62f28d09b4fd
-       //TODO: VPMADD52LUQ X31, X14, K1, X7                       // 62928d09b4ff
-       //TODO: VPMADD52LUQ X3, X14, K1, X7                        // 62f28d09b4fb
-       //TODO: VPMADD52LUQ 15(R8), X14, K1, X7                    // 62d28d09b4b80f000000
-       //TODO: VPMADD52LUQ (BP), X14, K1, X7                      // 62f28d09b47d00
-       //TODO: VPMADD52LUQ Y3, Y9, K1, Y2                         // 62f2b529b4d3
-       //TODO: VPMADD52LUQ Y2, Y9, K1, Y2                         // 62f2b529b4d2
-       //TODO: VPMADD52LUQ Y9, Y9, K1, Y2                         // 62d2b529b4d1
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y2               // 62f2b529b4942c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y2               // 62f2b529b494d1f9ffffff
-       //TODO: VPMADD52LUQ Y3, Y1, K1, Y2                         // 62f2f529b4d3
-       //TODO: VPMADD52LUQ Y2, Y1, K1, Y2                         // 62f2f529b4d2
-       //TODO: VPMADD52LUQ Y9, Y1, K1, Y2                         // 62d2f529b4d1
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y2               // 62f2f529b4942c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y2               // 62f2f529b494d1f9ffffff
-       //TODO: VPMADD52LUQ Y3, Y9, K1, Y21                        // 62e2b529b4eb
-       //TODO: VPMADD52LUQ Y2, Y9, K1, Y21                        // 62e2b529b4ea
-       //TODO: VPMADD52LUQ Y9, Y9, K1, Y21                        // 62c2b529b4e9
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y21              // 62e2b529b4ac2c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y21              // 62e2b529b4acd1f9ffffff
-       //TODO: VPMADD52LUQ Y3, Y1, K1, Y21                        // 62e2f529b4eb
-       //TODO: VPMADD52LUQ Y2, Y1, K1, Y21                        // 62e2f529b4ea
-       //TODO: VPMADD52LUQ Y9, Y1, K1, Y21                        // 62c2f529b4e9
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y21              // 62e2f529b4ac2c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y21              // 62e2f529b4acd1f9ffffff
-       //TODO: VPMADD52LUQ Y3, Y9, K1, Y12                        // 6272b529b4e3
-       //TODO: VPMADD52LUQ Y2, Y9, K1, Y12                        // 6272b529b4e2
-       //TODO: VPMADD52LUQ Y9, Y9, K1, Y12                        // 6252b529b4e1
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y12              // 6272b529b4a42c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y12              // 6272b529b4a4d1f9ffffff
-       //TODO: VPMADD52LUQ Y3, Y1, K1, Y12                        // 6272f529b4e3
-       //TODO: VPMADD52LUQ Y2, Y1, K1, Y12                        // 6272f529b4e2
-       //TODO: VPMADD52LUQ Y9, Y1, K1, Y12                        // 6252f529b4e1
-       //TODO: VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y12              // 6272f529b4a42c11000000
-       //TODO: VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y12              // 6272f529b4a4d1f9ffffff
-       //TODO: VPMADD52LUQ Z16, Z21, K7, Z8                       // 6232d547b4c0
-       //TODO: VPMADD52LUQ Z13, Z21, K7, Z8                       // 6252d547b4c5
-       //TODO: VPMADD52LUQ 7(AX), Z21, K7, Z8                     // 6272d547b48007000000
-       //TODO: VPMADD52LUQ (DI), Z21, K7, Z8                      // 6272d547b407
-       //TODO: VPMADD52LUQ Z16, Z5, K7, Z8                        // 6232d54fb4c0
-       //TODO: VPMADD52LUQ Z13, Z5, K7, Z8                        // 6252d54fb4c5
-       //TODO: VPMADD52LUQ 7(AX), Z5, K7, Z8                      // 6272d54fb48007000000
-       //TODO: VPMADD52LUQ (DI), Z5, K7, Z8                       // 6272d54fb407
-       //TODO: VPMADD52LUQ Z16, Z21, K7, Z28                      // 6222d547b4e0
-       //TODO: VPMADD52LUQ Z13, Z21, K7, Z28                      // 6242d547b4e5
-       //TODO: VPMADD52LUQ 7(AX), Z21, K7, Z28                    // 6262d547b4a007000000
-       //TODO: VPMADD52LUQ (DI), Z21, K7, Z28                     // 6262d547b427
-       //TODO: VPMADD52LUQ Z16, Z5, K7, Z28                       // 6222d54fb4e0
-       //TODO: VPMADD52LUQ Z13, Z5, K7, Z28                       // 6242d54fb4e5
-       //TODO: VPMADD52LUQ 7(AX), Z5, K7, Z28                     // 6262d54fb4a007000000
-       //TODO: VPMADD52LUQ (DI), Z5, K7, Z28                      // 6262d54fb427
+       VPMADD52HUQ X7, X11, K1, X18                       // 62e2a509b5d7
+       VPMADD52HUQ X0, X11, K1, X18                       // 62e2a509b5d0
+       VPMADD52HUQ 17(SP)(BP*2), X11, K1, X18             // 62e2a509b5946c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X11, K1, X18             // 62a2a509b59487f9ffffff
+       VPMADD52HUQ X7, X31, K1, X18                       // 62e28501b5d7
+       VPMADD52HUQ X0, X31, K1, X18                       // 62e28501b5d0
+       VPMADD52HUQ 17(SP)(BP*2), X31, K1, X18             // 62e28501b5946c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X31, K1, X18             // 62a28501b59487f9ffffff
+       VPMADD52HUQ X7, X3, K1, X18                        // 62e2e509b5d7
+       VPMADD52HUQ X0, X3, K1, X18                        // 62e2e509b5d0
+       VPMADD52HUQ 17(SP)(BP*2), X3, K1, X18              // 62e2e509b5946c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X3, K1, X18              // 62a2e509b59487f9ffffff
+       VPMADD52HUQ X7, X11, K1, X21                       // 62e2a509b5ef
+       VPMADD52HUQ X0, X11, K1, X21                       // 62e2a509b5e8
+       VPMADD52HUQ 17(SP)(BP*2), X11, K1, X21             // 62e2a509b5ac6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X11, K1, X21             // 62a2a509b5ac87f9ffffff
+       VPMADD52HUQ X7, X31, K1, X21                       // 62e28501b5ef
+       VPMADD52HUQ X0, X31, K1, X21                       // 62e28501b5e8
+       VPMADD52HUQ 17(SP)(BP*2), X31, K1, X21             // 62e28501b5ac6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X31, K1, X21             // 62a28501b5ac87f9ffffff
+       VPMADD52HUQ X7, X3, K1, X21                        // 62e2e509b5ef
+       VPMADD52HUQ X0, X3, K1, X21                        // 62e2e509b5e8
+       VPMADD52HUQ 17(SP)(BP*2), X3, K1, X21              // 62e2e509b5ac6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X3, K1, X21              // 62a2e509b5ac87f9ffffff
+       VPMADD52HUQ X7, X11, K1, X1                        // 62f2a509b5cf
+       VPMADD52HUQ X0, X11, K1, X1                        // 62f2a509b5c8
+       VPMADD52HUQ 17(SP)(BP*2), X11, K1, X1              // 62f2a509b58c6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X11, K1, X1              // 62b2a509b58c87f9ffffff
+       VPMADD52HUQ X7, X31, K1, X1                        // 62f28501b5cf
+       VPMADD52HUQ X0, X31, K1, X1                        // 62f28501b5c8
+       VPMADD52HUQ 17(SP)(BP*2), X31, K1, X1              // 62f28501b58c6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X31, K1, X1              // 62b28501b58c87f9ffffff
+       VPMADD52HUQ X7, X3, K1, X1                         // 62f2e509b5cf
+       VPMADD52HUQ X0, X3, K1, X1                         // 62f2e509b5c8
+       VPMADD52HUQ 17(SP)(BP*2), X3, K1, X1               // 62f2e509b58c6c11000000
+       VPMADD52HUQ -7(DI)(R8*4), X3, K1, X1               // 62b2e509b58c87f9ffffff
+       VPMADD52HUQ Y28, Y31, K7, Y17                      // 62828527b5cc
+       VPMADD52HUQ Y13, Y31, K7, Y17                      // 62c28527b5cd
+       VPMADD52HUQ Y7, Y31, K7, Y17                       // 62e28527b5cf
+       VPMADD52HUQ (R8), Y31, K7, Y17                     // 62c28527b508
+       VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y17             // 62e28527b58c5a0f000000
+       VPMADD52HUQ Y28, Y8, K7, Y17                       // 6282bd2fb5cc
+       VPMADD52HUQ Y13, Y8, K7, Y17                       // 62c2bd2fb5cd
+       VPMADD52HUQ Y7, Y8, K7, Y17                        // 62e2bd2fb5cf
+       VPMADD52HUQ (R8), Y8, K7, Y17                      // 62c2bd2fb508
+       VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y17              // 62e2bd2fb58c5a0f000000
+       VPMADD52HUQ Y28, Y1, K7, Y17                       // 6282f52fb5cc
+       VPMADD52HUQ Y13, Y1, K7, Y17                       // 62c2f52fb5cd
+       VPMADD52HUQ Y7, Y1, K7, Y17                        // 62e2f52fb5cf
+       VPMADD52HUQ (R8), Y1, K7, Y17                      // 62c2f52fb508
+       VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y17              // 62e2f52fb58c5a0f000000
+       VPMADD52HUQ Y28, Y31, K7, Y7                       // 62928527b5fc
+       VPMADD52HUQ Y13, Y31, K7, Y7                       // 62d28527b5fd
+       VPMADD52HUQ Y7, Y31, K7, Y7                        // 62f28527b5ff
+       VPMADD52HUQ (R8), Y31, K7, Y7                      // 62d28527b538
+       VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y7              // 62f28527b5bc5a0f000000
+       VPMADD52HUQ Y28, Y8, K7, Y7                        // 6292bd2fb5fc
+       VPMADD52HUQ Y13, Y8, K7, Y7                        // 62d2bd2fb5fd
+       VPMADD52HUQ Y7, Y8, K7, Y7                         // 62f2bd2fb5ff
+       VPMADD52HUQ (R8), Y8, K7, Y7                       // 62d2bd2fb538
+       VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y7               // 62f2bd2fb5bc5a0f000000
+       VPMADD52HUQ Y28, Y1, K7, Y7                        // 6292f52fb5fc
+       VPMADD52HUQ Y13, Y1, K7, Y7                        // 62d2f52fb5fd
+       VPMADD52HUQ Y7, Y1, K7, Y7                         // 62f2f52fb5ff
+       VPMADD52HUQ (R8), Y1, K7, Y7                       // 62d2f52fb538
+       VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y7               // 62f2f52fb5bc5a0f000000
+       VPMADD52HUQ Y28, Y31, K7, Y9                       // 62128527b5cc
+       VPMADD52HUQ Y13, Y31, K7, Y9                       // 62528527b5cd
+       VPMADD52HUQ Y7, Y31, K7, Y9                        // 62728527b5cf
+       VPMADD52HUQ (R8), Y31, K7, Y9                      // 62528527b508
+       VPMADD52HUQ 15(DX)(BX*2), Y31, K7, Y9              // 62728527b58c5a0f000000
+       VPMADD52HUQ Y28, Y8, K7, Y9                        // 6212bd2fb5cc
+       VPMADD52HUQ Y13, Y8, K7, Y9                        // 6252bd2fb5cd
+       VPMADD52HUQ Y7, Y8, K7, Y9                         // 6272bd2fb5cf
+       VPMADD52HUQ (R8), Y8, K7, Y9                       // 6252bd2fb508
+       VPMADD52HUQ 15(DX)(BX*2), Y8, K7, Y9               // 6272bd2fb58c5a0f000000
+       VPMADD52HUQ Y28, Y1, K7, Y9                        // 6212f52fb5cc
+       VPMADD52HUQ Y13, Y1, K7, Y9                        // 6252f52fb5cd
+       VPMADD52HUQ Y7, Y1, K7, Y9                         // 6272f52fb5cf
+       VPMADD52HUQ (R8), Y1, K7, Y9                       // 6252f52fb508
+       VPMADD52HUQ 15(DX)(BX*2), Y1, K7, Y9               // 6272f52fb58c5a0f000000
+       VPMADD52HUQ Z23, Z23, K1, Z27                      // 6222c541b5df
+       VPMADD52HUQ Z6, Z23, K1, Z27                       // 6262c541b5de
+       VPMADD52HUQ 17(SP), Z23, K1, Z27                   // 6262c541b59c2411000000
+       VPMADD52HUQ -17(BP)(SI*4), Z23, K1, Z27            // 6262c541b59cb5efffffff
+       VPMADD52HUQ Z23, Z5, K1, Z27                       // 6222d549b5df
+       VPMADD52HUQ Z6, Z5, K1, Z27                        // 6262d549b5de
+       VPMADD52HUQ 17(SP), Z5, K1, Z27                    // 6262d549b59c2411000000
+       VPMADD52HUQ -17(BP)(SI*4), Z5, K1, Z27             // 6262d549b59cb5efffffff
+       VPMADD52HUQ Z23, Z23, K1, Z15                      // 6232c541b5ff
+       VPMADD52HUQ Z6, Z23, K1, Z15                       // 6272c541b5fe
+       VPMADD52HUQ 17(SP), Z23, K1, Z15                   // 6272c541b5bc2411000000
+       VPMADD52HUQ -17(BP)(SI*4), Z23, K1, Z15            // 6272c541b5bcb5efffffff
+       VPMADD52HUQ Z23, Z5, K1, Z15                       // 6232d549b5ff
+       VPMADD52HUQ Z6, Z5, K1, Z15                        // 6272d549b5fe
+       VPMADD52HUQ 17(SP), Z5, K1, Z15                    // 6272d549b5bc2411000000
+       VPMADD52HUQ -17(BP)(SI*4), Z5, K1, Z15             // 6272d549b5bcb5efffffff
+       VPMADD52LUQ X5, X9, K1, X24                        // 6262b509b4c5
+       VPMADD52LUQ X31, X9, K1, X24                       // 6202b509b4c7
+       VPMADD52LUQ X3, X9, K1, X24                        // 6262b509b4c3
+       VPMADD52LUQ 15(R8), X9, K1, X24                    // 6242b509b4800f000000
+       VPMADD52LUQ (BP), X9, K1, X24                      // 6262b509b44500
+       VPMADD52LUQ X5, X7, K1, X24                        // 6262c509b4c5
+       VPMADD52LUQ X31, X7, K1, X24                       // 6202c509b4c7
+       VPMADD52LUQ X3, X7, K1, X24                        // 6262c509b4c3
+       VPMADD52LUQ 15(R8), X7, K1, X24                    // 6242c509b4800f000000
+       VPMADD52LUQ (BP), X7, K1, X24                      // 6262c509b44500
+       VPMADD52LUQ X5, X14, K1, X24                       // 62628d09b4c5
+       VPMADD52LUQ X31, X14, K1, X24                      // 62028d09b4c7
+       VPMADD52LUQ X3, X14, K1, X24                       // 62628d09b4c3
+       VPMADD52LUQ 15(R8), X14, K1, X24                   // 62428d09b4800f000000
+       VPMADD52LUQ (BP), X14, K1, X24                     // 62628d09b44500
+       VPMADD52LUQ X5, X9, K1, X20                        // 62e2b509b4e5
+       VPMADD52LUQ X31, X9, K1, X20                       // 6282b509b4e7
+       VPMADD52LUQ X3, X9, K1, X20                        // 62e2b509b4e3
+       VPMADD52LUQ 15(R8), X9, K1, X20                    // 62c2b509b4a00f000000
+       VPMADD52LUQ (BP), X9, K1, X20                      // 62e2b509b46500
+       VPMADD52LUQ X5, X7, K1, X20                        // 62e2c509b4e5
+       VPMADD52LUQ X31, X7, K1, X20                       // 6282c509b4e7
+       VPMADD52LUQ X3, X7, K1, X20                        // 62e2c509b4e3
+       VPMADD52LUQ 15(R8), X7, K1, X20                    // 62c2c509b4a00f000000
+       VPMADD52LUQ (BP), X7, K1, X20                      // 62e2c509b46500
+       VPMADD52LUQ X5, X14, K1, X20                       // 62e28d09b4e5
+       VPMADD52LUQ X31, X14, K1, X20                      // 62828d09b4e7
+       VPMADD52LUQ X3, X14, K1, X20                       // 62e28d09b4e3
+       VPMADD52LUQ 15(R8), X14, K1, X20                   // 62c28d09b4a00f000000
+       VPMADD52LUQ (BP), X14, K1, X20                     // 62e28d09b46500
+       VPMADD52LUQ X5, X9, K1, X7                         // 62f2b509b4fd
+       VPMADD52LUQ X31, X9, K1, X7                        // 6292b509b4ff
+       VPMADD52LUQ X3, X9, K1, X7                         // 62f2b509b4fb
+       VPMADD52LUQ 15(R8), X9, K1, X7                     // 62d2b509b4b80f000000
+       VPMADD52LUQ (BP), X9, K1, X7                       // 62f2b509b47d00
+       VPMADD52LUQ X5, X7, K1, X7                         // 62f2c509b4fd
+       VPMADD52LUQ X31, X7, K1, X7                        // 6292c509b4ff
+       VPMADD52LUQ X3, X7, K1, X7                         // 62f2c509b4fb
+       VPMADD52LUQ 15(R8), X7, K1, X7                     // 62d2c509b4b80f000000
+       VPMADD52LUQ (BP), X7, K1, X7                       // 62f2c509b47d00
+       VPMADD52LUQ X5, X14, K1, X7                        // 62f28d09b4fd
+       VPMADD52LUQ X31, X14, K1, X7                       // 62928d09b4ff
+       VPMADD52LUQ X3, X14, K1, X7                        // 62f28d09b4fb
+       VPMADD52LUQ 15(R8), X14, K1, X7                    // 62d28d09b4b80f000000
+       VPMADD52LUQ (BP), X14, K1, X7                      // 62f28d09b47d00
+       VPMADD52LUQ Y3, Y9, K1, Y2                         // 62f2b529b4d3
+       VPMADD52LUQ Y2, Y9, K1, Y2                         // 62f2b529b4d2
+       VPMADD52LUQ Y9, Y9, K1, Y2                         // 62d2b529b4d1
+       VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y2               // 62f2b529b4942c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y2               // 62f2b529b494d1f9ffffff
+       VPMADD52LUQ Y3, Y1, K1, Y2                         // 62f2f529b4d3
+       VPMADD52LUQ Y2, Y1, K1, Y2                         // 62f2f529b4d2
+       VPMADD52LUQ Y9, Y1, K1, Y2                         // 62d2f529b4d1
+       VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y2               // 62f2f529b4942c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y2               // 62f2f529b494d1f9ffffff
+       VPMADD52LUQ Y3, Y9, K1, Y21                        // 62e2b529b4eb
+       VPMADD52LUQ Y2, Y9, K1, Y21                        // 62e2b529b4ea
+       VPMADD52LUQ Y9, Y9, K1, Y21                        // 62c2b529b4e9
+       VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y21              // 62e2b529b4ac2c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y21              // 62e2b529b4acd1f9ffffff
+       VPMADD52LUQ Y3, Y1, K1, Y21                        // 62e2f529b4eb
+       VPMADD52LUQ Y2, Y1, K1, Y21                        // 62e2f529b4ea
+       VPMADD52LUQ Y9, Y1, K1, Y21                        // 62c2f529b4e9
+       VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y21              // 62e2f529b4ac2c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y21              // 62e2f529b4acd1f9ffffff
+       VPMADD52LUQ Y3, Y9, K1, Y12                        // 6272b529b4e3
+       VPMADD52LUQ Y2, Y9, K1, Y12                        // 6272b529b4e2
+       VPMADD52LUQ Y9, Y9, K1, Y12                        // 6252b529b4e1
+       VPMADD52LUQ 17(SP)(BP*1), Y9, K1, Y12              // 6272b529b4a42c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y9, K1, Y12              // 6272b529b4a4d1f9ffffff
+       VPMADD52LUQ Y3, Y1, K1, Y12                        // 6272f529b4e3
+       VPMADD52LUQ Y2, Y1, K1, Y12                        // 6272f529b4e2
+       VPMADD52LUQ Y9, Y1, K1, Y12                        // 6252f529b4e1
+       VPMADD52LUQ 17(SP)(BP*1), Y1, K1, Y12              // 6272f529b4a42c11000000
+       VPMADD52LUQ -7(CX)(DX*8), Y1, K1, Y12              // 6272f529b4a4d1f9ffffff
+       VPMADD52LUQ Z16, Z21, K7, Z8                       // 6232d547b4c0
+       VPMADD52LUQ Z13, Z21, K7, Z8                       // 6252d547b4c5
+       VPMADD52LUQ 7(AX), Z21, K7, Z8                     // 6272d547b48007000000
+       VPMADD52LUQ (DI), Z21, K7, Z8                      // 6272d547b407
+       VPMADD52LUQ Z16, Z5, K7, Z8                        // 6232d54fb4c0
+       VPMADD52LUQ Z13, Z5, K7, Z8                        // 6252d54fb4c5
+       VPMADD52LUQ 7(AX), Z5, K7, Z8                      // 6272d54fb48007000000
+       VPMADD52LUQ (DI), Z5, K7, Z8                       // 6272d54fb407
+       VPMADD52LUQ Z16, Z21, K7, Z28                      // 6222d547b4e0
+       VPMADD52LUQ Z13, Z21, K7, Z28                      // 6242d547b4e5
+       VPMADD52LUQ 7(AX), Z21, K7, Z28                    // 6262d547b4a007000000
+       VPMADD52LUQ (DI), Z21, K7, Z28                     // 6262d547b427
+       VPMADD52LUQ Z16, Z5, K7, Z28                       // 6222d54fb4e0
+       VPMADD52LUQ Z13, Z5, K7, Z28                       // 6242d54fb4e5
+       VPMADD52LUQ 7(AX), Z5, K7, Z28                     // 6262d54fb4a007000000
+       VPMADD52LUQ (DI), Z5, K7, Z28                      // 6262d54fb427
        RET
index d1d205c71feb6668eb9698a063b78db8997ad44d..d598acbd7ea2a678b23c53c3c9ec3d90fe3ce152 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_vbmi(SB), NOSPLIT, $0
-       //TODO: VPERMB X26, X20, K1, X23                           // 62825d018dfa
-       //TODO: VPERMB X19, X20, K1, X23                           // 62a25d018dfb
-       //TODO: VPERMB X0, X20, K1, X23                            // 62e25d018df8
-       //TODO: VPERMB 7(SI)(DI*4), X20, K1, X23                   // 62e25d018dbcbe07000000
-       //TODO: VPERMB -7(DI)(R8*2), X20, K1, X23                  // 62a25d018dbc47f9ffffff
-       //TODO: VPERMB X26, X2, K1, X23                            // 62826d098dfa
-       //TODO: VPERMB X19, X2, K1, X23                            // 62a26d098dfb
-       //TODO: VPERMB X0, X2, K1, X23                             // 62e26d098df8
-       //TODO: VPERMB 7(SI)(DI*4), X2, K1, X23                    // 62e26d098dbcbe07000000
-       //TODO: VPERMB -7(DI)(R8*2), X2, K1, X23                   // 62a26d098dbc47f9ffffff
-       //TODO: VPERMB X26, X9, K1, X23                            // 628235098dfa
-       //TODO: VPERMB X19, X9, K1, X23                            // 62a235098dfb
-       //TODO: VPERMB X0, X9, K1, X23                             // 62e235098df8
-       //TODO: VPERMB 7(SI)(DI*4), X9, K1, X23                    // 62e235098dbcbe07000000
-       //TODO: VPERMB -7(DI)(R8*2), X9, K1, X23                   // 62a235098dbc47f9ffffff
-       //TODO: VPERMB X26, X20, K1, X30                           // 62025d018df2
-       //TODO: VPERMB X19, X20, K1, X30                           // 62225d018df3
-       //TODO: VPERMB X0, X20, K1, X30                            // 62625d018df0
-       //TODO: VPERMB 7(SI)(DI*4), X20, K1, X30                   // 62625d018db4be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X20, K1, X30                  // 62225d018db447f9ffffff
-       //TODO: VPERMB X26, X2, K1, X30                            // 62026d098df2
-       //TODO: VPERMB X19, X2, K1, X30                            // 62226d098df3
-       //TODO: VPERMB X0, X2, K1, X30                             // 62626d098df0
-       //TODO: VPERMB 7(SI)(DI*4), X2, K1, X30                    // 62626d098db4be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X2, K1, X30                   // 62226d098db447f9ffffff
-       //TODO: VPERMB X26, X9, K1, X30                            // 620235098df2
-       //TODO: VPERMB X19, X9, K1, X30                            // 622235098df3
-       //TODO: VPERMB X0, X9, K1, X30                             // 626235098df0
-       //TODO: VPERMB 7(SI)(DI*4), X9, K1, X30                    // 626235098db4be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X9, K1, X30                   // 622235098db447f9ffffff
-       //TODO: VPERMB X26, X20, K1, X8                            // 62125d018dc2
-       //TODO: VPERMB X19, X20, K1, X8                            // 62325d018dc3
-       //TODO: VPERMB X0, X20, K1, X8                             // 62725d018dc0
-       //TODO: VPERMB 7(SI)(DI*4), X20, K1, X8                    // 62725d018d84be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X20, K1, X8                   // 62325d018d8447f9ffffff
-       //TODO: VPERMB X26, X2, K1, X8                             // 62126d098dc2
-       //TODO: VPERMB X19, X2, K1, X8                             // 62326d098dc3
-       //TODO: VPERMB X0, X2, K1, X8                              // 62726d098dc0
-       //TODO: VPERMB 7(SI)(DI*4), X2, K1, X8                     // 62726d098d84be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X2, K1, X8                    // 62326d098d8447f9ffffff
-       //TODO: VPERMB X26, X9, K1, X8                             // 621235098dc2
-       //TODO: VPERMB X19, X9, K1, X8                             // 623235098dc3
-       //TODO: VPERMB X0, X9, K1, X8                              // 627235098dc0
-       //TODO: VPERMB 7(SI)(DI*4), X9, K1, X8                     // 627235098d84be07000000
-       //TODO: VPERMB -7(DI)(R8*2), X9, K1, X8                    // 623235098d8447f9ffffff
-       //TODO: VPERMB Y5, Y31, K7, Y22                            // 62e205278df5
-       //TODO: VPERMB Y19, Y31, K7, Y22                           // 62a205278df3
-       //TODO: VPERMB Y31, Y31, K7, Y22                           // 628205278df7
-       //TODO: VPERMB 17(SP)(BP*1), Y31, K7, Y22                  // 62e205278db42c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y31, K7, Y22                  // 62e205278db4d1f9ffffff
-       //TODO: VPERMB Y5, Y5, K7, Y22                             // 62e2552f8df5
-       //TODO: VPERMB Y19, Y5, K7, Y22                            // 62a2552f8df3
-       //TODO: VPERMB Y31, Y5, K7, Y22                            // 6282552f8df7
-       //TODO: VPERMB 17(SP)(BP*1), Y5, K7, Y22                   // 62e2552f8db42c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y5, K7, Y22                   // 62e2552f8db4d1f9ffffff
-       //TODO: VPERMB Y5, Y0, K7, Y22                             // 62e27d2f8df5
-       //TODO: VPERMB Y19, Y0, K7, Y22                            // 62a27d2f8df3
-       //TODO: VPERMB Y31, Y0, K7, Y22                            // 62827d2f8df7
-       //TODO: VPERMB 17(SP)(BP*1), Y0, K7, Y22                   // 62e27d2f8db42c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y0, K7, Y22                   // 62e27d2f8db4d1f9ffffff
-       //TODO: VPERMB Y5, Y31, K7, Y9                             // 627205278dcd
-       //TODO: VPERMB Y19, Y31, K7, Y9                            // 623205278dcb
-       //TODO: VPERMB Y31, Y31, K7, Y9                            // 621205278dcf
-       //TODO: VPERMB 17(SP)(BP*1), Y31, K7, Y9                   // 627205278d8c2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y31, K7, Y9                   // 627205278d8cd1f9ffffff
-       //TODO: VPERMB Y5, Y5, K7, Y9                              // 6272552f8dcd
-       //TODO: VPERMB Y19, Y5, K7, Y9                             // 6232552f8dcb
-       //TODO: VPERMB Y31, Y5, K7, Y9                             // 6212552f8dcf
-       //TODO: VPERMB 17(SP)(BP*1), Y5, K7, Y9                    // 6272552f8d8c2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y5, K7, Y9                    // 6272552f8d8cd1f9ffffff
-       //TODO: VPERMB Y5, Y0, K7, Y9                              // 62727d2f8dcd
-       //TODO: VPERMB Y19, Y0, K7, Y9                             // 62327d2f8dcb
-       //TODO: VPERMB Y31, Y0, K7, Y9                             // 62127d2f8dcf
-       //TODO: VPERMB 17(SP)(BP*1), Y0, K7, Y9                    // 62727d2f8d8c2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y0, K7, Y9                    // 62727d2f8d8cd1f9ffffff
-       //TODO: VPERMB Y5, Y31, K7, Y23                            // 62e205278dfd
-       //TODO: VPERMB Y19, Y31, K7, Y23                           // 62a205278dfb
-       //TODO: VPERMB Y31, Y31, K7, Y23                           // 628205278dff
-       //TODO: VPERMB 17(SP)(BP*1), Y31, K7, Y23                  // 62e205278dbc2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y31, K7, Y23                  // 62e205278dbcd1f9ffffff
-       //TODO: VPERMB Y5, Y5, K7, Y23                             // 62e2552f8dfd
-       //TODO: VPERMB Y19, Y5, K7, Y23                            // 62a2552f8dfb
-       //TODO: VPERMB Y31, Y5, K7, Y23                            // 6282552f8dff
-       //TODO: VPERMB 17(SP)(BP*1), Y5, K7, Y23                   // 62e2552f8dbc2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y5, K7, Y23                   // 62e2552f8dbcd1f9ffffff
-       //TODO: VPERMB Y5, Y0, K7, Y23                             // 62e27d2f8dfd
-       //TODO: VPERMB Y19, Y0, K7, Y23                            // 62a27d2f8dfb
-       //TODO: VPERMB Y31, Y0, K7, Y23                            // 62827d2f8dff
-       //TODO: VPERMB 17(SP)(BP*1), Y0, K7, Y23                   // 62e27d2f8dbc2c11000000
-       //TODO: VPERMB -7(CX)(DX*8), Y0, K7, Y23                   // 62e27d2f8dbcd1f9ffffff
-       //TODO: VPERMB Z3, Z8, K1, Z3                              // 62f23d498ddb
-       //TODO: VPERMB Z27, Z8, K1, Z3                             // 62923d498ddb
-       //TODO: VPERMB 7(AX), Z8, K1, Z3                           // 62f23d498d9807000000
-       //TODO: VPERMB (DI), Z8, K1, Z3                            // 62f23d498d1f
-       //TODO: VPERMB Z3, Z2, K1, Z3                              // 62f26d498ddb
-       //TODO: VPERMB Z27, Z2, K1, Z3                             // 62926d498ddb
-       //TODO: VPERMB 7(AX), Z2, K1, Z3                           // 62f26d498d9807000000
-       //TODO: VPERMB (DI), Z2, K1, Z3                            // 62f26d498d1f
-       //TODO: VPERMB Z3, Z8, K1, Z21                             // 62e23d498deb
-       //TODO: VPERMB Z27, Z8, K1, Z21                            // 62823d498deb
-       //TODO: VPERMB 7(AX), Z8, K1, Z21                          // 62e23d498da807000000
-       //TODO: VPERMB (DI), Z8, K1, Z21                           // 62e23d498d2f
-       //TODO: VPERMB Z3, Z2, K1, Z21                             // 62e26d498deb
-       //TODO: VPERMB Z27, Z2, K1, Z21                            // 62826d498deb
-       //TODO: VPERMB 7(AX), Z2, K1, Z21                          // 62e26d498da807000000
-       //TODO: VPERMB (DI), Z2, K1, Z21                           // 62e26d498d2f
-       //TODO: VPERMI2B X15, X8, K7, X31                          // 62423d0f75ff
-       //TODO: VPERMI2B X0, X8, K7, X31                           // 62623d0f75f8
-       //TODO: VPERMI2B X16, X8, K7, X31                          // 62223d0f75f8
-       //TODO: VPERMI2B 17(SP), X8, K7, X31                       // 62623d0f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X8, K7, X31                // 62623d0f75bcb5efffffff
-       //TODO: VPERMI2B X15, X1, K7, X31                          // 6242750f75ff
-       //TODO: VPERMI2B X0, X1, K7, X31                           // 6262750f75f8
-       //TODO: VPERMI2B X16, X1, K7, X31                          // 6222750f75f8
-       //TODO: VPERMI2B 17(SP), X1, K7, X31                       // 6262750f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X1, K7, X31                // 6262750f75bcb5efffffff
-       //TODO: VPERMI2B X15, X0, K7, X31                          // 62427d0f75ff
-       //TODO: VPERMI2B X0, X0, K7, X31                           // 62627d0f75f8
-       //TODO: VPERMI2B X16, X0, K7, X31                          // 62227d0f75f8
-       //TODO: VPERMI2B 17(SP), X0, K7, X31                       // 62627d0f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X0, K7, X31                // 62627d0f75bcb5efffffff
-       //TODO: VPERMI2B X15, X8, K7, X16                          // 62c23d0f75c7
-       //TODO: VPERMI2B X0, X8, K7, X16                           // 62e23d0f75c0
-       //TODO: VPERMI2B X16, X8, K7, X16                          // 62a23d0f75c0
-       //TODO: VPERMI2B 17(SP), X8, K7, X16                       // 62e23d0f75842411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X8, K7, X16                // 62e23d0f7584b5efffffff
-       //TODO: VPERMI2B X15, X1, K7, X16                          // 62c2750f75c7
-       //TODO: VPERMI2B X0, X1, K7, X16                           // 62e2750f75c0
-       //TODO: VPERMI2B X16, X1, K7, X16                          // 62a2750f75c0
-       //TODO: VPERMI2B 17(SP), X1, K7, X16                       // 62e2750f75842411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X1, K7, X16                // 62e2750f7584b5efffffff
-       //TODO: VPERMI2B X15, X0, K7, X16                          // 62c27d0f75c7
-       //TODO: VPERMI2B X0, X0, K7, X16                           // 62e27d0f75c0
-       //TODO: VPERMI2B X16, X0, K7, X16                          // 62a27d0f75c0
-       //TODO: VPERMI2B 17(SP), X0, K7, X16                       // 62e27d0f75842411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X0, K7, X16                // 62e27d0f7584b5efffffff
-       //TODO: VPERMI2B X15, X8, K7, X7                           // 62d23d0f75ff
-       //TODO: VPERMI2B X0, X8, K7, X7                            // 62f23d0f75f8
-       //TODO: VPERMI2B X16, X8, K7, X7                           // 62b23d0f75f8
-       //TODO: VPERMI2B 17(SP), X8, K7, X7                        // 62f23d0f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X8, K7, X7                 // 62f23d0f75bcb5efffffff
-       //TODO: VPERMI2B X15, X1, K7, X7                           // 62d2750f75ff
-       //TODO: VPERMI2B X0, X1, K7, X7                            // 62f2750f75f8
-       //TODO: VPERMI2B X16, X1, K7, X7                           // 62b2750f75f8
-       //TODO: VPERMI2B 17(SP), X1, K7, X7                        // 62f2750f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X1, K7, X7                 // 62f2750f75bcb5efffffff
-       //TODO: VPERMI2B X15, X0, K7, X7                           // 62d27d0f75ff
-       //TODO: VPERMI2B X0, X0, K7, X7                            // 62f27d0f75f8
-       //TODO: VPERMI2B X16, X0, K7, X7                           // 62b27d0f75f8
-       //TODO: VPERMI2B 17(SP), X0, K7, X7                        // 62f27d0f75bc2411000000
-       //TODO: VPERMI2B -17(BP)(SI*4), X0, K7, X7                 // 62f27d0f75bcb5efffffff
-       //TODO: VPERMI2B Y18, Y15, K2, Y2                          // 62b2052a75d2
-       //TODO: VPERMI2B Y24, Y15, K2, Y2                          // 6292052a75d0
-       //TODO: VPERMI2B Y9, Y15, K2, Y2                           // 62d2052a75d1
-       //TODO: VPERMI2B 15(R8)(R14*1), Y15, K2, Y2                // 6292052a7594300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y15, K2, Y2                // 6292052a7594700f000000
-       //TODO: VPERMI2B Y18, Y22, K2, Y2                          // 62b24d2275d2
-       //TODO: VPERMI2B Y24, Y22, K2, Y2                          // 62924d2275d0
-       //TODO: VPERMI2B Y9, Y22, K2, Y2                           // 62d24d2275d1
-       //TODO: VPERMI2B 15(R8)(R14*1), Y22, K2, Y2                // 62924d227594300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y22, K2, Y2                // 62924d227594700f000000
-       //TODO: VPERMI2B Y18, Y20, K2, Y2                          // 62b25d2275d2
-       //TODO: VPERMI2B Y24, Y20, K2, Y2                          // 62925d2275d0
-       //TODO: VPERMI2B Y9, Y20, K2, Y2                           // 62d25d2275d1
-       //TODO: VPERMI2B 15(R8)(R14*1), Y20, K2, Y2                // 62925d227594300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y20, K2, Y2                // 62925d227594700f000000
-       //TODO: VPERMI2B Y18, Y15, K2, Y13                         // 6232052a75ea
-       //TODO: VPERMI2B Y24, Y15, K2, Y13                         // 6212052a75e8
-       //TODO: VPERMI2B Y9, Y15, K2, Y13                          // 6252052a75e9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y15, K2, Y13               // 6212052a75ac300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y15, K2, Y13               // 6212052a75ac700f000000
-       //TODO: VPERMI2B Y18, Y22, K2, Y13                         // 62324d2275ea
-       //TODO: VPERMI2B Y24, Y22, K2, Y13                         // 62124d2275e8
-       //TODO: VPERMI2B Y9, Y22, K2, Y13                          // 62524d2275e9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y22, K2, Y13               // 62124d2275ac300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y22, K2, Y13               // 62124d2275ac700f000000
-       //TODO: VPERMI2B Y18, Y20, K2, Y13                         // 62325d2275ea
-       //TODO: VPERMI2B Y24, Y20, K2, Y13                         // 62125d2275e8
-       //TODO: VPERMI2B Y9, Y20, K2, Y13                          // 62525d2275e9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y20, K2, Y13               // 62125d2275ac300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y20, K2, Y13               // 62125d2275ac700f000000
-       //TODO: VPERMI2B Y18, Y15, K2, Y27                         // 6222052a75da
-       //TODO: VPERMI2B Y24, Y15, K2, Y27                         // 6202052a75d8
-       //TODO: VPERMI2B Y9, Y15, K2, Y27                          // 6242052a75d9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y15, K2, Y27               // 6202052a759c300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y15, K2, Y27               // 6202052a759c700f000000
-       //TODO: VPERMI2B Y18, Y22, K2, Y27                         // 62224d2275da
-       //TODO: VPERMI2B Y24, Y22, K2, Y27                         // 62024d2275d8
-       //TODO: VPERMI2B Y9, Y22, K2, Y27                          // 62424d2275d9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y22, K2, Y27               // 62024d22759c300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y22, K2, Y27               // 62024d22759c700f000000
-       //TODO: VPERMI2B Y18, Y20, K2, Y27                         // 62225d2275da
-       //TODO: VPERMI2B Y24, Y20, K2, Y27                         // 62025d2275d8
-       //TODO: VPERMI2B Y9, Y20, K2, Y27                          // 62425d2275d9
-       //TODO: VPERMI2B 15(R8)(R14*1), Y20, K2, Y27               // 62025d22759c300f000000
-       //TODO: VPERMI2B 15(R8)(R14*2), Y20, K2, Y27               // 62025d22759c700f000000
-       //TODO: VPERMI2B Z12, Z9, K4, Z3                           // 62d2354c75dc
-       //TODO: VPERMI2B Z22, Z9, K4, Z3                           // 62b2354c75de
-       //TODO: VPERMI2B -17(BP)(SI*8), Z9, K4, Z3                 // 62f2354c759cf5efffffff
-       //TODO: VPERMI2B (R15), Z9, K4, Z3                         // 62d2354c751f
-       //TODO: VPERMI2B Z12, Z19, K4, Z3                          // 62d2654475dc
-       //TODO: VPERMI2B Z22, Z19, K4, Z3                          // 62b2654475de
-       //TODO: VPERMI2B -17(BP)(SI*8), Z19, K4, Z3                // 62f26544759cf5efffffff
-       //TODO: VPERMI2B (R15), Z19, K4, Z3                        // 62d26544751f
-       //TODO: VPERMI2B Z12, Z9, K4, Z30                          // 6242354c75f4
-       //TODO: VPERMI2B Z22, Z9, K4, Z30                          // 6222354c75f6
-       //TODO: VPERMI2B -17(BP)(SI*8), Z9, K4, Z30                // 6262354c75b4f5efffffff
-       //TODO: VPERMI2B (R15), Z9, K4, Z30                        // 6242354c7537
-       //TODO: VPERMI2B Z12, Z19, K4, Z30                         // 6242654475f4
-       //TODO: VPERMI2B Z22, Z19, K4, Z30                         // 6222654475f6
-       //TODO: VPERMI2B -17(BP)(SI*8), Z19, K4, Z30               // 6262654475b4f5efffffff
-       //TODO: VPERMI2B (R15), Z19, K4, Z30                       // 624265447537
-       //TODO: VPERMT2B X2, X0, K7, X20                           // 62e27d0f7de2
-       //TODO: VPERMT2B X8, X0, K7, X20                           // 62c27d0f7de0
-       //TODO: VPERMT2B X9, X0, K7, X20                           // 62c27d0f7de1
-       //TODO: VPERMT2B (BX), X0, K7, X20                         // 62e27d0f7d23
-       //TODO: VPERMT2B -17(BP)(SI*1), X0, K7, X20                // 62e27d0f7da435efffffff
-       //TODO: VPERMT2B X2, X9, K7, X20                           // 62e2350f7de2
-       //TODO: VPERMT2B X8, X9, K7, X20                           // 62c2350f7de0
-       //TODO: VPERMT2B X9, X9, K7, X20                           // 62c2350f7de1
-       //TODO: VPERMT2B (BX), X9, K7, X20                         // 62e2350f7d23
-       //TODO: VPERMT2B -17(BP)(SI*1), X9, K7, X20                // 62e2350f7da435efffffff
-       //TODO: VPERMT2B X2, X13, K7, X20                          // 62e2150f7de2
-       //TODO: VPERMT2B X8, X13, K7, X20                          // 62c2150f7de0
-       //TODO: VPERMT2B X9, X13, K7, X20                          // 62c2150f7de1
-       //TODO: VPERMT2B (BX), X13, K7, X20                        // 62e2150f7d23
-       //TODO: VPERMT2B -17(BP)(SI*1), X13, K7, X20               // 62e2150f7da435efffffff
-       //TODO: VPERMT2B X2, X0, K7, X5                            // 62f27d0f7dea
-       //TODO: VPERMT2B X8, X0, K7, X5                            // 62d27d0f7de8
-       //TODO: VPERMT2B X9, X0, K7, X5                            // 62d27d0f7de9
-       //TODO: VPERMT2B (BX), X0, K7, X5                          // 62f27d0f7d2b
-       //TODO: VPERMT2B -17(BP)(SI*1), X0, K7, X5                 // 62f27d0f7dac35efffffff
-       //TODO: VPERMT2B X2, X9, K7, X5                            // 62f2350f7dea
-       //TODO: VPERMT2B X8, X9, K7, X5                            // 62d2350f7de8
-       //TODO: VPERMT2B X9, X9, K7, X5                            // 62d2350f7de9
-       //TODO: VPERMT2B (BX), X9, K7, X5                          // 62f2350f7d2b
-       //TODO: VPERMT2B -17(BP)(SI*1), X9, K7, X5                 // 62f2350f7dac35efffffff
-       //TODO: VPERMT2B X2, X13, K7, X5                           // 62f2150f7dea
-       //TODO: VPERMT2B X8, X13, K7, X5                           // 62d2150f7de8
-       //TODO: VPERMT2B X9, X13, K7, X5                           // 62d2150f7de9
-       //TODO: VPERMT2B (BX), X13, K7, X5                         // 62f2150f7d2b
-       //TODO: VPERMT2B -17(BP)(SI*1), X13, K7, X5                // 62f2150f7dac35efffffff
-       //TODO: VPERMT2B X2, X0, K7, X25                           // 62627d0f7dca
-       //TODO: VPERMT2B X8, X0, K7, X25                           // 62427d0f7dc8
-       //TODO: VPERMT2B X9, X0, K7, X25                           // 62427d0f7dc9
-       //TODO: VPERMT2B (BX), X0, K7, X25                         // 62627d0f7d0b
-       //TODO: VPERMT2B -17(BP)(SI*1), X0, K7, X25                // 62627d0f7d8c35efffffff
-       //TODO: VPERMT2B X2, X9, K7, X25                           // 6262350f7dca
-       //TODO: VPERMT2B X8, X9, K7, X25                           // 6242350f7dc8
-       //TODO: VPERMT2B X9, X9, K7, X25                           // 6242350f7dc9
-       //TODO: VPERMT2B (BX), X9, K7, X25                         // 6262350f7d0b
-       //TODO: VPERMT2B -17(BP)(SI*1), X9, K7, X25                // 6262350f7d8c35efffffff
-       //TODO: VPERMT2B X2, X13, K7, X25                          // 6262150f7dca
-       //TODO: VPERMT2B X8, X13, K7, X25                          // 6242150f7dc8
-       //TODO: VPERMT2B X9, X13, K7, X25                          // 6242150f7dc9
-       //TODO: VPERMT2B (BX), X13, K7, X25                        // 6262150f7d0b
-       //TODO: VPERMT2B -17(BP)(SI*1), X13, K7, X25               // 6262150f7d8c35efffffff
-       //TODO: VPERMT2B Y14, Y2, K6, Y18                          // 62c26d2e7dd6
-       //TODO: VPERMT2B Y8, Y2, K6, Y18                           // 62c26d2e7dd0
-       //TODO: VPERMT2B Y20, Y2, K6, Y18                          // 62a26d2e7dd4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y2, K6, Y18                  // 62e26d2e7d94be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y2, K6, Y18                 // 62a26d2e7d9447f9ffffff
-       //TODO: VPERMT2B Y14, Y7, K6, Y18                          // 62c2452e7dd6
-       //TODO: VPERMT2B Y8, Y7, K6, Y18                           // 62c2452e7dd0
-       //TODO: VPERMT2B Y20, Y7, K6, Y18                          // 62a2452e7dd4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y7, K6, Y18                  // 62e2452e7d94be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y7, K6, Y18                 // 62a2452e7d9447f9ffffff
-       //TODO: VPERMT2B Y14, Y21, K6, Y18                         // 62c255267dd6
-       //TODO: VPERMT2B Y8, Y21, K6, Y18                          // 62c255267dd0
-       //TODO: VPERMT2B Y20, Y21, K6, Y18                         // 62a255267dd4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y21, K6, Y18                 // 62e255267d94be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y21, K6, Y18                // 62a255267d9447f9ffffff
-       //TODO: VPERMT2B Y14, Y2, K6, Y3                           // 62d26d2e7dde
-       //TODO: VPERMT2B Y8, Y2, K6, Y3                            // 62d26d2e7dd8
-       //TODO: VPERMT2B Y20, Y2, K6, Y3                           // 62b26d2e7ddc
-       //TODO: VPERMT2B 7(SI)(DI*4), Y2, K6, Y3                   // 62f26d2e7d9cbe07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y2, K6, Y3                  // 62b26d2e7d9c47f9ffffff
-       //TODO: VPERMT2B Y14, Y7, K6, Y3                           // 62d2452e7dde
-       //TODO: VPERMT2B Y8, Y7, K6, Y3                            // 62d2452e7dd8
-       //TODO: VPERMT2B Y20, Y7, K6, Y3                           // 62b2452e7ddc
-       //TODO: VPERMT2B 7(SI)(DI*4), Y7, K6, Y3                   // 62f2452e7d9cbe07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y7, K6, Y3                  // 62b2452e7d9c47f9ffffff
-       //TODO: VPERMT2B Y14, Y21, K6, Y3                          // 62d255267dde
-       //TODO: VPERMT2B Y8, Y21, K6, Y3                           // 62d255267dd8
-       //TODO: VPERMT2B Y20, Y21, K6, Y3                          // 62b255267ddc
-       //TODO: VPERMT2B 7(SI)(DI*4), Y21, K6, Y3                  // 62f255267d9cbe07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y21, K6, Y3                 // 62b255267d9c47f9ffffff
-       //TODO: VPERMT2B Y14, Y2, K6, Y24                          // 62426d2e7dc6
-       //TODO: VPERMT2B Y8, Y2, K6, Y24                           // 62426d2e7dc0
-       //TODO: VPERMT2B Y20, Y2, K6, Y24                          // 62226d2e7dc4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y2, K6, Y24                  // 62626d2e7d84be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y2, K6, Y24                 // 62226d2e7d8447f9ffffff
-       //TODO: VPERMT2B Y14, Y7, K6, Y24                          // 6242452e7dc6
-       //TODO: VPERMT2B Y8, Y7, K6, Y24                           // 6242452e7dc0
-       //TODO: VPERMT2B Y20, Y7, K6, Y24                          // 6222452e7dc4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y7, K6, Y24                  // 6262452e7d84be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y7, K6, Y24                 // 6222452e7d8447f9ffffff
-       //TODO: VPERMT2B Y14, Y21, K6, Y24                         // 624255267dc6
-       //TODO: VPERMT2B Y8, Y21, K6, Y24                          // 624255267dc0
-       //TODO: VPERMT2B Y20, Y21, K6, Y24                         // 622255267dc4
-       //TODO: VPERMT2B 7(SI)(DI*4), Y21, K6, Y24                 // 626255267d84be07000000
-       //TODO: VPERMT2B -7(DI)(R8*2), Y21, K6, Y24                // 622255267d8447f9ffffff
-       //TODO: VPERMT2B Z20, Z1, K3, Z6                           // 62b2754b7df4
-       //TODO: VPERMT2B Z9, Z1, K3, Z6                            // 62d2754b7df1
-       //TODO: VPERMT2B (CX), Z1, K3, Z6                          // 62f2754b7d31
-       //TODO: VPERMT2B 99(R15), Z1, K3, Z6                       // 62d2754b7db763000000
-       //TODO: VPERMT2B Z20, Z9, K3, Z6                           // 62b2354b7df4
-       //TODO: VPERMT2B Z9, Z9, K3, Z6                            // 62d2354b7df1
-       //TODO: VPERMT2B (CX), Z9, K3, Z6                          // 62f2354b7d31
-       //TODO: VPERMT2B 99(R15), Z9, K3, Z6                       // 62d2354b7db763000000
-       //TODO: VPERMT2B Z20, Z1, K3, Z9                           // 6232754b7dcc
-       //TODO: VPERMT2B Z9, Z1, K3, Z9                            // 6252754b7dc9
-       //TODO: VPERMT2B (CX), Z1, K3, Z9                          // 6272754b7d09
-       //TODO: VPERMT2B 99(R15), Z1, K3, Z9                       // 6252754b7d8f63000000
-       //TODO: VPERMT2B Z20, Z9, K3, Z9                           // 6232354b7dcc
-       //TODO: VPERMT2B Z9, Z9, K3, Z9                            // 6252354b7dc9
-       //TODO: VPERMT2B (CX), Z9, K3, Z9                          // 6272354b7d09
-       //TODO: VPERMT2B 99(R15), Z9, K3, Z9                       // 6252354b7d8f63000000
-       //TODO: VPMULTISHIFTQB X9, X24, K5, X7                     // 62d2bd0583f9
-       //TODO: VPMULTISHIFTQB X7, X24, K5, X7                     // 62f2bd0583ff
-       //TODO: VPMULTISHIFTQB X14, X24, K5, X7                    // 62d2bd0583fe
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X24, K5, X7           // 62f2bd0583bc2c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X24, K5, X7           // 62f2bd0583bcd1f9ffffff
-       //TODO: VPMULTISHIFTQB X9, X20, K5, X7                     // 62d2dd0583f9
-       //TODO: VPMULTISHIFTQB X7, X20, K5, X7                     // 62f2dd0583ff
-       //TODO: VPMULTISHIFTQB X14, X20, K5, X7                    // 62d2dd0583fe
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X20, K5, X7           // 62f2dd0583bc2c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X20, K5, X7           // 62f2dd0583bcd1f9ffffff
-       //TODO: VPMULTISHIFTQB X9, X7, K5, X7                      // 62d2c50d83f9
-       //TODO: VPMULTISHIFTQB X7, X7, K5, X7                      // 62f2c50d83ff
-       //TODO: VPMULTISHIFTQB X14, X7, K5, X7                     // 62d2c50d83fe
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X7, K5, X7            // 62f2c50d83bc2c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X7, K5, X7            // 62f2c50d83bcd1f9ffffff
-       //TODO: VPMULTISHIFTQB X9, X24, K5, X0                     // 62d2bd0583c1
-       //TODO: VPMULTISHIFTQB X7, X24, K5, X0                     // 62f2bd0583c7
-       //TODO: VPMULTISHIFTQB X14, X24, K5, X0                    // 62d2bd0583c6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X24, K5, X0           // 62f2bd0583842c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X24, K5, X0           // 62f2bd058384d1f9ffffff
-       //TODO: VPMULTISHIFTQB X9, X20, K5, X0                     // 62d2dd0583c1
-       //TODO: VPMULTISHIFTQB X7, X20, K5, X0                     // 62f2dd0583c7
-       //TODO: VPMULTISHIFTQB X14, X20, K5, X0                    // 62d2dd0583c6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X20, K5, X0           // 62f2dd0583842c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X20, K5, X0           // 62f2dd058384d1f9ffffff
-       //TODO: VPMULTISHIFTQB X9, X7, K5, X0                      // 62d2c50d83c1
-       //TODO: VPMULTISHIFTQB X7, X7, K5, X0                      // 62f2c50d83c7
-       //TODO: VPMULTISHIFTQB X14, X7, K5, X0                     // 62d2c50d83c6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*1), X7, K5, X0            // 62f2c50d83842c11000000
-       //TODO: VPMULTISHIFTQB -7(CX)(DX*8), X7, K5, X0            // 62f2c50d8384d1f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y30, K7, Y12                   // 62328d2783e0
-       //TODO: VPMULTISHIFTQB Y1, Y30, K7, Y12                    // 62728d2783e1
-       //TODO: VPMULTISHIFTQB Y30, Y30, K7, Y12                   // 62128d2783e6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y12          // 62728d2783a46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y12          // 62328d2783a487f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y26, K7, Y12                   // 6232ad2783e0
-       //TODO: VPMULTISHIFTQB Y1, Y26, K7, Y12                    // 6272ad2783e1
-       //TODO: VPMULTISHIFTQB Y30, Y26, K7, Y12                   // 6212ad2783e6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y12          // 6272ad2783a46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y12          // 6232ad2783a487f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y7, K7, Y12                    // 6232c52f83e0
-       //TODO: VPMULTISHIFTQB Y1, Y7, K7, Y12                     // 6272c52f83e1
-       //TODO: VPMULTISHIFTQB Y30, Y7, K7, Y12                    // 6212c52f83e6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y12           // 6272c52f83a46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y12           // 6232c52f83a487f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y30, K7, Y21                   // 62a28d2783e8
-       //TODO: VPMULTISHIFTQB Y1, Y30, K7, Y21                    // 62e28d2783e9
-       //TODO: VPMULTISHIFTQB Y30, Y30, K7, Y21                   // 62828d2783ee
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y21          // 62e28d2783ac6c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y21          // 62a28d2783ac87f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y26, K7, Y21                   // 62a2ad2783e8
-       //TODO: VPMULTISHIFTQB Y1, Y26, K7, Y21                    // 62e2ad2783e9
-       //TODO: VPMULTISHIFTQB Y30, Y26, K7, Y21                   // 6282ad2783ee
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y21          // 62e2ad2783ac6c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y21          // 62a2ad2783ac87f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y7, K7, Y21                    // 62a2c52f83e8
-       //TODO: VPMULTISHIFTQB Y1, Y7, K7, Y21                     // 62e2c52f83e9
-       //TODO: VPMULTISHIFTQB Y30, Y7, K7, Y21                    // 6282c52f83ee
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y21           // 62e2c52f83ac6c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y21           // 62a2c52f83ac87f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y30, K7, Y14                   // 62328d2783f0
-       //TODO: VPMULTISHIFTQB Y1, Y30, K7, Y14                    // 62728d2783f1
-       //TODO: VPMULTISHIFTQB Y30, Y30, K7, Y14                   // 62128d2783f6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y14          // 62728d2783b46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y14          // 62328d2783b487f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y26, K7, Y14                   // 6232ad2783f0
-       //TODO: VPMULTISHIFTQB Y1, Y26, K7, Y14                    // 6272ad2783f1
-       //TODO: VPMULTISHIFTQB Y30, Y26, K7, Y14                   // 6212ad2783f6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y14          // 6272ad2783b46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y14          // 6232ad2783b487f9ffffff
-       //TODO: VPMULTISHIFTQB Y16, Y7, K7, Y14                    // 6232c52f83f0
-       //TODO: VPMULTISHIFTQB Y1, Y7, K7, Y14                     // 6272c52f83f1
-       //TODO: VPMULTISHIFTQB Y30, Y7, K7, Y14                    // 6212c52f83f6
-       //TODO: VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y14           // 6272c52f83b46c11000000
-       //TODO: VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y14           // 6232c52f83b487f9ffffff
-       //TODO: VPMULTISHIFTQB Z7, Z2, K7, Z18                     // 62e2ed4f83d7
-       //TODO: VPMULTISHIFTQB Z13, Z2, K7, Z18                    // 62c2ed4f83d5
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*4), Z2, K7, Z18            // 62e2ed4f83948807000000
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*1), Z2, K7, Z18            // 62e2ed4f83940807000000
-       //TODO: VPMULTISHIFTQB Z7, Z21, K7, Z18                    // 62e2d54783d7
-       //TODO: VPMULTISHIFTQB Z13, Z21, K7, Z18                   // 62c2d54783d5
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*4), Z21, K7, Z18           // 62e2d54783948807000000
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*1), Z21, K7, Z18           // 62e2d54783940807000000
-       //TODO: VPMULTISHIFTQB Z7, Z2, K7, Z24                     // 6262ed4f83c7
-       //TODO: VPMULTISHIFTQB Z13, Z2, K7, Z24                    // 6242ed4f83c5
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*4), Z2, K7, Z24            // 6262ed4f83848807000000
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*1), Z2, K7, Z24            // 6262ed4f83840807000000
-       //TODO: VPMULTISHIFTQB Z7, Z21, K7, Z24                    // 6262d54783c7
-       //TODO: VPMULTISHIFTQB Z13, Z21, K7, Z24                   // 6242d54783c5
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*4), Z21, K7, Z24           // 6262d54783848807000000
-       //TODO: VPMULTISHIFTQB 7(AX)(CX*1), Z21, K7, Z24           // 6262d54783840807000000
+       VPERMB X26, X20, K1, X23                           // 62825d018dfa
+       VPERMB X19, X20, K1, X23                           // 62a25d018dfb
+       VPERMB X0, X20, K1, X23                            // 62e25d018df8
+       VPERMB 7(SI)(DI*4), X20, K1, X23                   // 62e25d018dbcbe07000000
+       VPERMB -7(DI)(R8*2), X20, K1, X23                  // 62a25d018dbc47f9ffffff
+       VPERMB X26, X2, K1, X23                            // 62826d098dfa
+       VPERMB X19, X2, K1, X23                            // 62a26d098dfb
+       VPERMB X0, X2, K1, X23                             // 62e26d098df8
+       VPERMB 7(SI)(DI*4), X2, K1, X23                    // 62e26d098dbcbe07000000
+       VPERMB -7(DI)(R8*2), X2, K1, X23                   // 62a26d098dbc47f9ffffff
+       VPERMB X26, X9, K1, X23                            // 628235098dfa
+       VPERMB X19, X9, K1, X23                            // 62a235098dfb
+       VPERMB X0, X9, K1, X23                             // 62e235098df8
+       VPERMB 7(SI)(DI*4), X9, K1, X23                    // 62e235098dbcbe07000000
+       VPERMB -7(DI)(R8*2), X9, K1, X23                   // 62a235098dbc47f9ffffff
+       VPERMB X26, X20, K1, X30                           // 62025d018df2
+       VPERMB X19, X20, K1, X30                           // 62225d018df3
+       VPERMB X0, X20, K1, X30                            // 62625d018df0
+       VPERMB 7(SI)(DI*4), X20, K1, X30                   // 62625d018db4be07000000
+       VPERMB -7(DI)(R8*2), X20, K1, X30                  // 62225d018db447f9ffffff
+       VPERMB X26, X2, K1, X30                            // 62026d098df2
+       VPERMB X19, X2, K1, X30                            // 62226d098df3
+       VPERMB X0, X2, K1, X30                             // 62626d098df0
+       VPERMB 7(SI)(DI*4), X2, K1, X30                    // 62626d098db4be07000000
+       VPERMB -7(DI)(R8*2), X2, K1, X30                   // 62226d098db447f9ffffff
+       VPERMB X26, X9, K1, X30                            // 620235098df2
+       VPERMB X19, X9, K1, X30                            // 622235098df3
+       VPERMB X0, X9, K1, X30                             // 626235098df0
+       VPERMB 7(SI)(DI*4), X9, K1, X30                    // 626235098db4be07000000
+       VPERMB -7(DI)(R8*2), X9, K1, X30                   // 622235098db447f9ffffff
+       VPERMB X26, X20, K1, X8                            // 62125d018dc2
+       VPERMB X19, X20, K1, X8                            // 62325d018dc3
+       VPERMB X0, X20, K1, X8                             // 62725d018dc0
+       VPERMB 7(SI)(DI*4), X20, K1, X8                    // 62725d018d84be07000000
+       VPERMB -7(DI)(R8*2), X20, K1, X8                   // 62325d018d8447f9ffffff
+       VPERMB X26, X2, K1, X8                             // 62126d098dc2
+       VPERMB X19, X2, K1, X8                             // 62326d098dc3
+       VPERMB X0, X2, K1, X8                              // 62726d098dc0
+       VPERMB 7(SI)(DI*4), X2, K1, X8                     // 62726d098d84be07000000
+       VPERMB -7(DI)(R8*2), X2, K1, X8                    // 62326d098d8447f9ffffff
+       VPERMB X26, X9, K1, X8                             // 621235098dc2
+       VPERMB X19, X9, K1, X8                             // 623235098dc3
+       VPERMB X0, X9, K1, X8                              // 627235098dc0
+       VPERMB 7(SI)(DI*4), X9, K1, X8                     // 627235098d84be07000000
+       VPERMB -7(DI)(R8*2), X9, K1, X8                    // 623235098d8447f9ffffff
+       VPERMB Y5, Y31, K7, Y22                            // 62e205278df5
+       VPERMB Y19, Y31, K7, Y22                           // 62a205278df3
+       VPERMB Y31, Y31, K7, Y22                           // 628205278df7
+       VPERMB 17(SP)(BP*1), Y31, K7, Y22                  // 62e205278db42c11000000
+       VPERMB -7(CX)(DX*8), Y31, K7, Y22                  // 62e205278db4d1f9ffffff
+       VPERMB Y5, Y5, K7, Y22                             // 62e2552f8df5
+       VPERMB Y19, Y5, K7, Y22                            // 62a2552f8df3
+       VPERMB Y31, Y5, K7, Y22                            // 6282552f8df7
+       VPERMB 17(SP)(BP*1), Y5, K7, Y22                   // 62e2552f8db42c11000000
+       VPERMB -7(CX)(DX*8), Y5, K7, Y22                   // 62e2552f8db4d1f9ffffff
+       VPERMB Y5, Y0, K7, Y22                             // 62e27d2f8df5
+       VPERMB Y19, Y0, K7, Y22                            // 62a27d2f8df3
+       VPERMB Y31, Y0, K7, Y22                            // 62827d2f8df7
+       VPERMB 17(SP)(BP*1), Y0, K7, Y22                   // 62e27d2f8db42c11000000
+       VPERMB -7(CX)(DX*8), Y0, K7, Y22                   // 62e27d2f8db4d1f9ffffff
+       VPERMB Y5, Y31, K7, Y9                             // 627205278dcd
+       VPERMB Y19, Y31, K7, Y9                            // 623205278dcb
+       VPERMB Y31, Y31, K7, Y9                            // 621205278dcf
+       VPERMB 17(SP)(BP*1), Y31, K7, Y9                   // 627205278d8c2c11000000
+       VPERMB -7(CX)(DX*8), Y31, K7, Y9                   // 627205278d8cd1f9ffffff
+       VPERMB Y5, Y5, K7, Y9                              // 6272552f8dcd
+       VPERMB Y19, Y5, K7, Y9                             // 6232552f8dcb
+       VPERMB Y31, Y5, K7, Y9                             // 6212552f8dcf
+       VPERMB 17(SP)(BP*1), Y5, K7, Y9                    // 6272552f8d8c2c11000000
+       VPERMB -7(CX)(DX*8), Y5, K7, Y9                    // 6272552f8d8cd1f9ffffff
+       VPERMB Y5, Y0, K7, Y9                              // 62727d2f8dcd
+       VPERMB Y19, Y0, K7, Y9                             // 62327d2f8dcb
+       VPERMB Y31, Y0, K7, Y9                             // 62127d2f8dcf
+       VPERMB 17(SP)(BP*1), Y0, K7, Y9                    // 62727d2f8d8c2c11000000
+       VPERMB -7(CX)(DX*8), Y0, K7, Y9                    // 62727d2f8d8cd1f9ffffff
+       VPERMB Y5, Y31, K7, Y23                            // 62e205278dfd
+       VPERMB Y19, Y31, K7, Y23                           // 62a205278dfb
+       VPERMB Y31, Y31, K7, Y23                           // 628205278dff
+       VPERMB 17(SP)(BP*1), Y31, K7, Y23                  // 62e205278dbc2c11000000
+       VPERMB -7(CX)(DX*8), Y31, K7, Y23                  // 62e205278dbcd1f9ffffff
+       VPERMB Y5, Y5, K7, Y23                             // 62e2552f8dfd
+       VPERMB Y19, Y5, K7, Y23                            // 62a2552f8dfb
+       VPERMB Y31, Y5, K7, Y23                            // 6282552f8dff
+       VPERMB 17(SP)(BP*1), Y5, K7, Y23                   // 62e2552f8dbc2c11000000
+       VPERMB -7(CX)(DX*8), Y5, K7, Y23                   // 62e2552f8dbcd1f9ffffff
+       VPERMB Y5, Y0, K7, Y23                             // 62e27d2f8dfd
+       VPERMB Y19, Y0, K7, Y23                            // 62a27d2f8dfb
+       VPERMB Y31, Y0, K7, Y23                            // 62827d2f8dff
+       VPERMB 17(SP)(BP*1), Y0, K7, Y23                   // 62e27d2f8dbc2c11000000
+       VPERMB -7(CX)(DX*8), Y0, K7, Y23                   // 62e27d2f8dbcd1f9ffffff
+       VPERMB Z3, Z8, K1, Z3                              // 62f23d498ddb
+       VPERMB Z27, Z8, K1, Z3                             // 62923d498ddb
+       VPERMB 7(AX), Z8, K1, Z3                           // 62f23d498d9807000000
+       VPERMB (DI), Z8, K1, Z3                            // 62f23d498d1f
+       VPERMB Z3, Z2, K1, Z3                              // 62f26d498ddb
+       VPERMB Z27, Z2, K1, Z3                             // 62926d498ddb
+       VPERMB 7(AX), Z2, K1, Z3                           // 62f26d498d9807000000
+       VPERMB (DI), Z2, K1, Z3                            // 62f26d498d1f
+       VPERMB Z3, Z8, K1, Z21                             // 62e23d498deb
+       VPERMB Z27, Z8, K1, Z21                            // 62823d498deb
+       VPERMB 7(AX), Z8, K1, Z21                          // 62e23d498da807000000
+       VPERMB (DI), Z8, K1, Z21                           // 62e23d498d2f
+       VPERMB Z3, Z2, K1, Z21                             // 62e26d498deb
+       VPERMB Z27, Z2, K1, Z21                            // 62826d498deb
+       VPERMB 7(AX), Z2, K1, Z21                          // 62e26d498da807000000
+       VPERMB (DI), Z2, K1, Z21                           // 62e26d498d2f
+       VPERMI2B X15, X8, K7, X31                          // 62423d0f75ff
+       VPERMI2B X0, X8, K7, X31                           // 62623d0f75f8
+       VPERMI2B X16, X8, K7, X31                          // 62223d0f75f8
+       VPERMI2B 17(SP), X8, K7, X31                       // 62623d0f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X8, K7, X31                // 62623d0f75bcb5efffffff
+       VPERMI2B X15, X1, K7, X31                          // 6242750f75ff
+       VPERMI2B X0, X1, K7, X31                           // 6262750f75f8
+       VPERMI2B X16, X1, K7, X31                          // 6222750f75f8
+       VPERMI2B 17(SP), X1, K7, X31                       // 6262750f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X1, K7, X31                // 6262750f75bcb5efffffff
+       VPERMI2B X15, X0, K7, X31                          // 62427d0f75ff
+       VPERMI2B X0, X0, K7, X31                           // 62627d0f75f8
+       VPERMI2B X16, X0, K7, X31                          // 62227d0f75f8
+       VPERMI2B 17(SP), X0, K7, X31                       // 62627d0f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X0, K7, X31                // 62627d0f75bcb5efffffff
+       VPERMI2B X15, X8, K7, X16                          // 62c23d0f75c7
+       VPERMI2B X0, X8, K7, X16                           // 62e23d0f75c0
+       VPERMI2B X16, X8, K7, X16                          // 62a23d0f75c0
+       VPERMI2B 17(SP), X8, K7, X16                       // 62e23d0f75842411000000
+       VPERMI2B -17(BP)(SI*4), X8, K7, X16                // 62e23d0f7584b5efffffff
+       VPERMI2B X15, X1, K7, X16                          // 62c2750f75c7
+       VPERMI2B X0, X1, K7, X16                           // 62e2750f75c0
+       VPERMI2B X16, X1, K7, X16                          // 62a2750f75c0
+       VPERMI2B 17(SP), X1, K7, X16                       // 62e2750f75842411000000
+       VPERMI2B -17(BP)(SI*4), X1, K7, X16                // 62e2750f7584b5efffffff
+       VPERMI2B X15, X0, K7, X16                          // 62c27d0f75c7
+       VPERMI2B X0, X0, K7, X16                           // 62e27d0f75c0
+       VPERMI2B X16, X0, K7, X16                          // 62a27d0f75c0
+       VPERMI2B 17(SP), X0, K7, X16                       // 62e27d0f75842411000000
+       VPERMI2B -17(BP)(SI*4), X0, K7, X16                // 62e27d0f7584b5efffffff
+       VPERMI2B X15, X8, K7, X7                           // 62d23d0f75ff
+       VPERMI2B X0, X8, K7, X7                            // 62f23d0f75f8
+       VPERMI2B X16, X8, K7, X7                           // 62b23d0f75f8
+       VPERMI2B 17(SP), X8, K7, X7                        // 62f23d0f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X8, K7, X7                 // 62f23d0f75bcb5efffffff
+       VPERMI2B X15, X1, K7, X7                           // 62d2750f75ff
+       VPERMI2B X0, X1, K7, X7                            // 62f2750f75f8
+       VPERMI2B X16, X1, K7, X7                           // 62b2750f75f8
+       VPERMI2B 17(SP), X1, K7, X7                        // 62f2750f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X1, K7, X7                 // 62f2750f75bcb5efffffff
+       VPERMI2B X15, X0, K7, X7                           // 62d27d0f75ff
+       VPERMI2B X0, X0, K7, X7                            // 62f27d0f75f8
+       VPERMI2B X16, X0, K7, X7                           // 62b27d0f75f8
+       VPERMI2B 17(SP), X0, K7, X7                        // 62f27d0f75bc2411000000
+       VPERMI2B -17(BP)(SI*4), X0, K7, X7                 // 62f27d0f75bcb5efffffff
+       VPERMI2B Y18, Y15, K2, Y2                          // 62b2052a75d2
+       VPERMI2B Y24, Y15, K2, Y2                          // 6292052a75d0
+       VPERMI2B Y9, Y15, K2, Y2                           // 62d2052a75d1
+       VPERMI2B 15(R8)(R14*1), Y15, K2, Y2                // 6292052a7594300f000000
+       VPERMI2B 15(R8)(R14*2), Y15, K2, Y2                // 6292052a7594700f000000
+       VPERMI2B Y18, Y22, K2, Y2                          // 62b24d2275d2
+       VPERMI2B Y24, Y22, K2, Y2                          // 62924d2275d0
+       VPERMI2B Y9, Y22, K2, Y2                           // 62d24d2275d1
+       VPERMI2B 15(R8)(R14*1), Y22, K2, Y2                // 62924d227594300f000000
+       VPERMI2B 15(R8)(R14*2), Y22, K2, Y2                // 62924d227594700f000000
+       VPERMI2B Y18, Y20, K2, Y2                          // 62b25d2275d2
+       VPERMI2B Y24, Y20, K2, Y2                          // 62925d2275d0
+       VPERMI2B Y9, Y20, K2, Y2                           // 62d25d2275d1
+       VPERMI2B 15(R8)(R14*1), Y20, K2, Y2                // 62925d227594300f000000
+       VPERMI2B 15(R8)(R14*2), Y20, K2, Y2                // 62925d227594700f000000
+       VPERMI2B Y18, Y15, K2, Y13                         // 6232052a75ea
+       VPERMI2B Y24, Y15, K2, Y13                         // 6212052a75e8
+       VPERMI2B Y9, Y15, K2, Y13                          // 6252052a75e9
+       VPERMI2B 15(R8)(R14*1), Y15, K2, Y13               // 6212052a75ac300f000000
+       VPERMI2B 15(R8)(R14*2), Y15, K2, Y13               // 6212052a75ac700f000000
+       VPERMI2B Y18, Y22, K2, Y13                         // 62324d2275ea
+       VPERMI2B Y24, Y22, K2, Y13                         // 62124d2275e8
+       VPERMI2B Y9, Y22, K2, Y13                          // 62524d2275e9
+       VPERMI2B 15(R8)(R14*1), Y22, K2, Y13               // 62124d2275ac300f000000
+       VPERMI2B 15(R8)(R14*2), Y22, K2, Y13               // 62124d2275ac700f000000
+       VPERMI2B Y18, Y20, K2, Y13                         // 62325d2275ea
+       VPERMI2B Y24, Y20, K2, Y13                         // 62125d2275e8
+       VPERMI2B Y9, Y20, K2, Y13                          // 62525d2275e9
+       VPERMI2B 15(R8)(R14*1), Y20, K2, Y13               // 62125d2275ac300f000000
+       VPERMI2B 15(R8)(R14*2), Y20, K2, Y13               // 62125d2275ac700f000000
+       VPERMI2B Y18, Y15, K2, Y27                         // 6222052a75da
+       VPERMI2B Y24, Y15, K2, Y27                         // 6202052a75d8
+       VPERMI2B Y9, Y15, K2, Y27                          // 6242052a75d9
+       VPERMI2B 15(R8)(R14*1), Y15, K2, Y27               // 6202052a759c300f000000
+       VPERMI2B 15(R8)(R14*2), Y15, K2, Y27               // 6202052a759c700f000000
+       VPERMI2B Y18, Y22, K2, Y27                         // 62224d2275da
+       VPERMI2B Y24, Y22, K2, Y27                         // 62024d2275d8
+       VPERMI2B Y9, Y22, K2, Y27                          // 62424d2275d9
+       VPERMI2B 15(R8)(R14*1), Y22, K2, Y27               // 62024d22759c300f000000
+       VPERMI2B 15(R8)(R14*2), Y22, K2, Y27               // 62024d22759c700f000000
+       VPERMI2B Y18, Y20, K2, Y27                         // 62225d2275da
+       VPERMI2B Y24, Y20, K2, Y27                         // 62025d2275d8
+       VPERMI2B Y9, Y20, K2, Y27                          // 62425d2275d9
+       VPERMI2B 15(R8)(R14*1), Y20, K2, Y27               // 62025d22759c300f000000
+       VPERMI2B 15(R8)(R14*2), Y20, K2, Y27               // 62025d22759c700f000000
+       VPERMI2B Z12, Z9, K4, Z3                           // 62d2354c75dc
+       VPERMI2B Z22, Z9, K4, Z3                           // 62b2354c75de
+       VPERMI2B -17(BP)(SI*8), Z9, K4, Z3                 // 62f2354c759cf5efffffff
+       VPERMI2B (R15), Z9, K4, Z3                         // 62d2354c751f
+       VPERMI2B Z12, Z19, K4, Z3                          // 62d2654475dc
+       VPERMI2B Z22, Z19, K4, Z3                          // 62b2654475de
+       VPERMI2B -17(BP)(SI*8), Z19, K4, Z3                // 62f26544759cf5efffffff
+       VPERMI2B (R15), Z19, K4, Z3                        // 62d26544751f
+       VPERMI2B Z12, Z9, K4, Z30                          // 6242354c75f4
+       VPERMI2B Z22, Z9, K4, Z30                          // 6222354c75f6
+       VPERMI2B -17(BP)(SI*8), Z9, K4, Z30                // 6262354c75b4f5efffffff
+       VPERMI2B (R15), Z9, K4, Z30                        // 6242354c7537
+       VPERMI2B Z12, Z19, K4, Z30                         // 6242654475f4
+       VPERMI2B Z22, Z19, K4, Z30                         // 6222654475f6
+       VPERMI2B -17(BP)(SI*8), Z19, K4, Z30               // 6262654475b4f5efffffff
+       VPERMI2B (R15), Z19, K4, Z30                       // 624265447537
+       VPERMT2B X2, X0, K7, X20                           // 62e27d0f7de2
+       VPERMT2B X8, X0, K7, X20                           // 62c27d0f7de0
+       VPERMT2B X9, X0, K7, X20                           // 62c27d0f7de1
+       VPERMT2B (BX), X0, K7, X20                         // 62e27d0f7d23
+       VPERMT2B -17(BP)(SI*1), X0, K7, X20                // 62e27d0f7da435efffffff
+       VPERMT2B X2, X9, K7, X20                           // 62e2350f7de2
+       VPERMT2B X8, X9, K7, X20                           // 62c2350f7de0
+       VPERMT2B X9, X9, K7, X20                           // 62c2350f7de1
+       VPERMT2B (BX), X9, K7, X20                         // 62e2350f7d23
+       VPERMT2B -17(BP)(SI*1), X9, K7, X20                // 62e2350f7da435efffffff
+       VPERMT2B X2, X13, K7, X20                          // 62e2150f7de2
+       VPERMT2B X8, X13, K7, X20                          // 62c2150f7de0
+       VPERMT2B X9, X13, K7, X20                          // 62c2150f7de1
+       VPERMT2B (BX), X13, K7, X20                        // 62e2150f7d23
+       VPERMT2B -17(BP)(SI*1), X13, K7, X20               // 62e2150f7da435efffffff
+       VPERMT2B X2, X0, K7, X5                            // 62f27d0f7dea
+       VPERMT2B X8, X0, K7, X5                            // 62d27d0f7de8
+       VPERMT2B X9, X0, K7, X5                            // 62d27d0f7de9
+       VPERMT2B (BX), X0, K7, X5                          // 62f27d0f7d2b
+       VPERMT2B -17(BP)(SI*1), X0, K7, X5                 // 62f27d0f7dac35efffffff
+       VPERMT2B X2, X9, K7, X5                            // 62f2350f7dea
+       VPERMT2B X8, X9, K7, X5                            // 62d2350f7de8
+       VPERMT2B X9, X9, K7, X5                            // 62d2350f7de9
+       VPERMT2B (BX), X9, K7, X5                          // 62f2350f7d2b
+       VPERMT2B -17(BP)(SI*1), X9, K7, X5                 // 62f2350f7dac35efffffff
+       VPERMT2B X2, X13, K7, X5                           // 62f2150f7dea
+       VPERMT2B X8, X13, K7, X5                           // 62d2150f7de8
+       VPERMT2B X9, X13, K7, X5                           // 62d2150f7de9
+       VPERMT2B (BX), X13, K7, X5                         // 62f2150f7d2b
+       VPERMT2B -17(BP)(SI*1), X13, K7, X5                // 62f2150f7dac35efffffff
+       VPERMT2B X2, X0, K7, X25                           // 62627d0f7dca
+       VPERMT2B X8, X0, K7, X25                           // 62427d0f7dc8
+       VPERMT2B X9, X0, K7, X25                           // 62427d0f7dc9
+       VPERMT2B (BX), X0, K7, X25                         // 62627d0f7d0b
+       VPERMT2B -17(BP)(SI*1), X0, K7, X25                // 62627d0f7d8c35efffffff
+       VPERMT2B X2, X9, K7, X25                           // 6262350f7dca
+       VPERMT2B X8, X9, K7, X25                           // 6242350f7dc8
+       VPERMT2B X9, X9, K7, X25                           // 6242350f7dc9
+       VPERMT2B (BX), X9, K7, X25                         // 6262350f7d0b
+       VPERMT2B -17(BP)(SI*1), X9, K7, X25                // 6262350f7d8c35efffffff
+       VPERMT2B X2, X13, K7, X25                          // 6262150f7dca
+       VPERMT2B X8, X13, K7, X25                          // 6242150f7dc8
+       VPERMT2B X9, X13, K7, X25                          // 6242150f7dc9
+       VPERMT2B (BX), X13, K7, X25                        // 6262150f7d0b
+       VPERMT2B -17(BP)(SI*1), X13, K7, X25               // 6262150f7d8c35efffffff
+       VPERMT2B Y14, Y2, K6, Y18                          // 62c26d2e7dd6
+       VPERMT2B Y8, Y2, K6, Y18                           // 62c26d2e7dd0
+       VPERMT2B Y20, Y2, K6, Y18                          // 62a26d2e7dd4
+       VPERMT2B 7(SI)(DI*4), Y2, K6, Y18                  // 62e26d2e7d94be07000000
+       VPERMT2B -7(DI)(R8*2), Y2, K6, Y18                 // 62a26d2e7d9447f9ffffff
+       VPERMT2B Y14, Y7, K6, Y18                          // 62c2452e7dd6
+       VPERMT2B Y8, Y7, K6, Y18                           // 62c2452e7dd0
+       VPERMT2B Y20, Y7, K6, Y18                          // 62a2452e7dd4
+       VPERMT2B 7(SI)(DI*4), Y7, K6, Y18                  // 62e2452e7d94be07000000
+       VPERMT2B -7(DI)(R8*2), Y7, K6, Y18                 // 62a2452e7d9447f9ffffff
+       VPERMT2B Y14, Y21, K6, Y18                         // 62c255267dd6
+       VPERMT2B Y8, Y21, K6, Y18                          // 62c255267dd0
+       VPERMT2B Y20, Y21, K6, Y18                         // 62a255267dd4
+       VPERMT2B 7(SI)(DI*4), Y21, K6, Y18                 // 62e255267d94be07000000
+       VPERMT2B -7(DI)(R8*2), Y21, K6, Y18                // 62a255267d9447f9ffffff
+       VPERMT2B Y14, Y2, K6, Y3                           // 62d26d2e7dde
+       VPERMT2B Y8, Y2, K6, Y3                            // 62d26d2e7dd8
+       VPERMT2B Y20, Y2, K6, Y3                           // 62b26d2e7ddc
+       VPERMT2B 7(SI)(DI*4), Y2, K6, Y3                   // 62f26d2e7d9cbe07000000
+       VPERMT2B -7(DI)(R8*2), Y2, K6, Y3                  // 62b26d2e7d9c47f9ffffff
+       VPERMT2B Y14, Y7, K6, Y3                           // 62d2452e7dde
+       VPERMT2B Y8, Y7, K6, Y3                            // 62d2452e7dd8
+       VPERMT2B Y20, Y7, K6, Y3                           // 62b2452e7ddc
+       VPERMT2B 7(SI)(DI*4), Y7, K6, Y3                   // 62f2452e7d9cbe07000000
+       VPERMT2B -7(DI)(R8*2), Y7, K6, Y3                  // 62b2452e7d9c47f9ffffff
+       VPERMT2B Y14, Y21, K6, Y3                          // 62d255267dde
+       VPERMT2B Y8, Y21, K6, Y3                           // 62d255267dd8
+       VPERMT2B Y20, Y21, K6, Y3                          // 62b255267ddc
+       VPERMT2B 7(SI)(DI*4), Y21, K6, Y3                  // 62f255267d9cbe07000000
+       VPERMT2B -7(DI)(R8*2), Y21, K6, Y3                 // 62b255267d9c47f9ffffff
+       VPERMT2B Y14, Y2, K6, Y24                          // 62426d2e7dc6
+       VPERMT2B Y8, Y2, K6, Y24                           // 62426d2e7dc0
+       VPERMT2B Y20, Y2, K6, Y24                          // 62226d2e7dc4
+       VPERMT2B 7(SI)(DI*4), Y2, K6, Y24                  // 62626d2e7d84be07000000
+       VPERMT2B -7(DI)(R8*2), Y2, K6, Y24                 // 62226d2e7d8447f9ffffff
+       VPERMT2B Y14, Y7, K6, Y24                          // 6242452e7dc6
+       VPERMT2B Y8, Y7, K6, Y24                           // 6242452e7dc0
+       VPERMT2B Y20, Y7, K6, Y24                          // 6222452e7dc4
+       VPERMT2B 7(SI)(DI*4), Y7, K6, Y24                  // 6262452e7d84be07000000
+       VPERMT2B -7(DI)(R8*2), Y7, K6, Y24                 // 6222452e7d8447f9ffffff
+       VPERMT2B Y14, Y21, K6, Y24                         // 624255267dc6
+       VPERMT2B Y8, Y21, K6, Y24                          // 624255267dc0
+       VPERMT2B Y20, Y21, K6, Y24                         // 622255267dc4
+       VPERMT2B 7(SI)(DI*4), Y21, K6, Y24                 // 626255267d84be07000000
+       VPERMT2B -7(DI)(R8*2), Y21, K6, Y24                // 622255267d8447f9ffffff
+       VPERMT2B Z20, Z1, K3, Z6                           // 62b2754b7df4
+       VPERMT2B Z9, Z1, K3, Z6                            // 62d2754b7df1
+       VPERMT2B (CX), Z1, K3, Z6                          // 62f2754b7d31
+       VPERMT2B 99(R15), Z1, K3, Z6                       // 62d2754b7db763000000
+       VPERMT2B Z20, Z9, K3, Z6                           // 62b2354b7df4
+       VPERMT2B Z9, Z9, K3, Z6                            // 62d2354b7df1
+       VPERMT2B (CX), Z9, K3, Z6                          // 62f2354b7d31
+       VPERMT2B 99(R15), Z9, K3, Z6                       // 62d2354b7db763000000
+       VPERMT2B Z20, Z1, K3, Z9                           // 6232754b7dcc
+       VPERMT2B Z9, Z1, K3, Z9                            // 6252754b7dc9
+       VPERMT2B (CX), Z1, K3, Z9                          // 6272754b7d09
+       VPERMT2B 99(R15), Z1, K3, Z9                       // 6252754b7d8f63000000
+       VPERMT2B Z20, Z9, K3, Z9                           // 6232354b7dcc
+       VPERMT2B Z9, Z9, K3, Z9                            // 6252354b7dc9
+       VPERMT2B (CX), Z9, K3, Z9                          // 6272354b7d09
+       VPERMT2B 99(R15), Z9, K3, Z9                       // 6252354b7d8f63000000
+       VPMULTISHIFTQB X9, X24, K5, X7                     // 62d2bd0583f9
+       VPMULTISHIFTQB X7, X24, K5, X7                     // 62f2bd0583ff
+       VPMULTISHIFTQB X14, X24, K5, X7                    // 62d2bd0583fe
+       VPMULTISHIFTQB 17(SP)(BP*1), X24, K5, X7           // 62f2bd0583bc2c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X24, K5, X7           // 62f2bd0583bcd1f9ffffff
+       VPMULTISHIFTQB X9, X20, K5, X7                     // 62d2dd0583f9
+       VPMULTISHIFTQB X7, X20, K5, X7                     // 62f2dd0583ff
+       VPMULTISHIFTQB X14, X20, K5, X7                    // 62d2dd0583fe
+       VPMULTISHIFTQB 17(SP)(BP*1), X20, K5, X7           // 62f2dd0583bc2c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X20, K5, X7           // 62f2dd0583bcd1f9ffffff
+       VPMULTISHIFTQB X9, X7, K5, X7                      // 62d2c50d83f9
+       VPMULTISHIFTQB X7, X7, K5, X7                      // 62f2c50d83ff
+       VPMULTISHIFTQB X14, X7, K5, X7                     // 62d2c50d83fe
+       VPMULTISHIFTQB 17(SP)(BP*1), X7, K5, X7            // 62f2c50d83bc2c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X7, K5, X7            // 62f2c50d83bcd1f9ffffff
+       VPMULTISHIFTQB X9, X24, K5, X0                     // 62d2bd0583c1
+       VPMULTISHIFTQB X7, X24, K5, X0                     // 62f2bd0583c7
+       VPMULTISHIFTQB X14, X24, K5, X0                    // 62d2bd0583c6
+       VPMULTISHIFTQB 17(SP)(BP*1), X24, K5, X0           // 62f2bd0583842c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X24, K5, X0           // 62f2bd058384d1f9ffffff
+       VPMULTISHIFTQB X9, X20, K5, X0                     // 62d2dd0583c1
+       VPMULTISHIFTQB X7, X20, K5, X0                     // 62f2dd0583c7
+       VPMULTISHIFTQB X14, X20, K5, X0                    // 62d2dd0583c6
+       VPMULTISHIFTQB 17(SP)(BP*1), X20, K5, X0           // 62f2dd0583842c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X20, K5, X0           // 62f2dd058384d1f9ffffff
+       VPMULTISHIFTQB X9, X7, K5, X0                      // 62d2c50d83c1
+       VPMULTISHIFTQB X7, X7, K5, X0                      // 62f2c50d83c7
+       VPMULTISHIFTQB X14, X7, K5, X0                     // 62d2c50d83c6
+       VPMULTISHIFTQB 17(SP)(BP*1), X7, K5, X0            // 62f2c50d83842c11000000
+       VPMULTISHIFTQB -7(CX)(DX*8), X7, K5, X0            // 62f2c50d8384d1f9ffffff
+       VPMULTISHIFTQB Y16, Y30, K7, Y12                   // 62328d2783e0
+       VPMULTISHIFTQB Y1, Y30, K7, Y12                    // 62728d2783e1
+       VPMULTISHIFTQB Y30, Y30, K7, Y12                   // 62128d2783e6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y12          // 62728d2783a46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y12          // 62328d2783a487f9ffffff
+       VPMULTISHIFTQB Y16, Y26, K7, Y12                   // 6232ad2783e0
+       VPMULTISHIFTQB Y1, Y26, K7, Y12                    // 6272ad2783e1
+       VPMULTISHIFTQB Y30, Y26, K7, Y12                   // 6212ad2783e6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y12          // 6272ad2783a46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y12          // 6232ad2783a487f9ffffff
+       VPMULTISHIFTQB Y16, Y7, K7, Y12                    // 6232c52f83e0
+       VPMULTISHIFTQB Y1, Y7, K7, Y12                     // 6272c52f83e1
+       VPMULTISHIFTQB Y30, Y7, K7, Y12                    // 6212c52f83e6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y12           // 6272c52f83a46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y12           // 6232c52f83a487f9ffffff
+       VPMULTISHIFTQB Y16, Y30, K7, Y21                   // 62a28d2783e8
+       VPMULTISHIFTQB Y1, Y30, K7, Y21                    // 62e28d2783e9
+       VPMULTISHIFTQB Y30, Y30, K7, Y21                   // 62828d2783ee
+       VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y21          // 62e28d2783ac6c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y21          // 62a28d2783ac87f9ffffff
+       VPMULTISHIFTQB Y16, Y26, K7, Y21                   // 62a2ad2783e8
+       VPMULTISHIFTQB Y1, Y26, K7, Y21                    // 62e2ad2783e9
+       VPMULTISHIFTQB Y30, Y26, K7, Y21                   // 6282ad2783ee
+       VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y21          // 62e2ad2783ac6c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y21          // 62a2ad2783ac87f9ffffff
+       VPMULTISHIFTQB Y16, Y7, K7, Y21                    // 62a2c52f83e8
+       VPMULTISHIFTQB Y1, Y7, K7, Y21                     // 62e2c52f83e9
+       VPMULTISHIFTQB Y30, Y7, K7, Y21                    // 6282c52f83ee
+       VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y21           // 62e2c52f83ac6c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y21           // 62a2c52f83ac87f9ffffff
+       VPMULTISHIFTQB Y16, Y30, K7, Y14                   // 62328d2783f0
+       VPMULTISHIFTQB Y1, Y30, K7, Y14                    // 62728d2783f1
+       VPMULTISHIFTQB Y30, Y30, K7, Y14                   // 62128d2783f6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y30, K7, Y14          // 62728d2783b46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y30, K7, Y14          // 62328d2783b487f9ffffff
+       VPMULTISHIFTQB Y16, Y26, K7, Y14                   // 6232ad2783f0
+       VPMULTISHIFTQB Y1, Y26, K7, Y14                    // 6272ad2783f1
+       VPMULTISHIFTQB Y30, Y26, K7, Y14                   // 6212ad2783f6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y26, K7, Y14          // 6272ad2783b46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y26, K7, Y14          // 6232ad2783b487f9ffffff
+       VPMULTISHIFTQB Y16, Y7, K7, Y14                    // 6232c52f83f0
+       VPMULTISHIFTQB Y1, Y7, K7, Y14                     // 6272c52f83f1
+       VPMULTISHIFTQB Y30, Y7, K7, Y14                    // 6212c52f83f6
+       VPMULTISHIFTQB 17(SP)(BP*2), Y7, K7, Y14           // 6272c52f83b46c11000000
+       VPMULTISHIFTQB -7(DI)(R8*4), Y7, K7, Y14           // 6232c52f83b487f9ffffff
+       VPMULTISHIFTQB Z7, Z2, K7, Z18                     // 62e2ed4f83d7
+       VPMULTISHIFTQB Z13, Z2, K7, Z18                    // 62c2ed4f83d5
+       VPMULTISHIFTQB 7(AX)(CX*4), Z2, K7, Z18            // 62e2ed4f83948807000000
+       VPMULTISHIFTQB 7(AX)(CX*1), Z2, K7, Z18            // 62e2ed4f83940807000000
+       VPMULTISHIFTQB Z7, Z21, K7, Z18                    // 62e2d54783d7
+       VPMULTISHIFTQB Z13, Z21, K7, Z18                   // 62c2d54783d5
+       VPMULTISHIFTQB 7(AX)(CX*4), Z21, K7, Z18           // 62e2d54783948807000000
+       VPMULTISHIFTQB 7(AX)(CX*1), Z21, K7, Z18           // 62e2d54783940807000000
+       VPMULTISHIFTQB Z7, Z2, K7, Z24                     // 6262ed4f83c7
+       VPMULTISHIFTQB Z13, Z2, K7, Z24                    // 6242ed4f83c5
+       VPMULTISHIFTQB 7(AX)(CX*4), Z2, K7, Z24            // 6262ed4f83848807000000
+       VPMULTISHIFTQB 7(AX)(CX*1), Z2, K7, Z24            // 6262ed4f83840807000000
+       VPMULTISHIFTQB Z7, Z21, K7, Z24                    // 6262d54783c7
+       VPMULTISHIFTQB Z13, Z21, K7, Z24                   // 6242d54783c5
+       VPMULTISHIFTQB 7(AX)(CX*4), Z21, K7, Z24           // 6262d54783848807000000
+       VPMULTISHIFTQB 7(AX)(CX*1), Z21, K7, Z24           // 6262d54783840807000000
        RET
index 9df487b2fce781ccb08f96accd7a6aaa973636b8..3f49fab161d86e9896ba9fbe11f3820ca9a9d06e 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_vbmi2(SB), NOSPLIT, $0
-       //TODO: VPCOMPRESSB X7, K1, X15                            // 62d27d0963ff
-       //TODO: VPCOMPRESSB X13, K1, X15                           // 62527d0963ef
-       //TODO: VPCOMPRESSB X8, K1, X15                            // 62527d0963c7
-       //TODO: VPCOMPRESSB X7, K1, X28                            // 62927d0963fc
-       //TODO: VPCOMPRESSB X13, K1, X28                           // 62127d0963ec
-       //TODO: VPCOMPRESSB X8, K1, X28                            // 62127d0963c4
-       //TODO: VPCOMPRESSB X7, K1, -7(CX)(DX*1)                   // 62f27d09637c11f9
-       //TODO: VPCOMPRESSB X13, K1, -7(CX)(DX*1)                  // 62727d09636c11f9
-       //TODO: VPCOMPRESSB X8, K1, -7(CX)(DX*1)                   // 62727d09634411f9
-       //TODO: VPCOMPRESSB X7, K1, -15(R14)(R15*4)                // 62927d09637cbef1
-       //TODO: VPCOMPRESSB X13, K1, -15(R14)(R15*4)               // 62127d09636cbef1
-       //TODO: VPCOMPRESSB X8, K1, -15(R14)(R15*4)                // 62127d096344bef1
-       //TODO: VPCOMPRESSB Y5, K1, Y8                             // 62d27d2963e8
-       //TODO: VPCOMPRESSB Y24, K1, Y8                            // 62427d2963c0
-       //TODO: VPCOMPRESSB Y21, K1, Y8                            // 62c27d2963e8
-       //TODO: VPCOMPRESSB Y5, K1, Y11                            // 62d27d2963eb
-       //TODO: VPCOMPRESSB Y24, K1, Y11                           // 62427d2963c3
-       //TODO: VPCOMPRESSB Y21, K1, Y11                           // 62c27d2963eb
-       //TODO: VPCOMPRESSB Y5, K1, Y24                            // 62927d2963e8
-       //TODO: VPCOMPRESSB Y24, K1, Y24                           // 62027d2963c0
-       //TODO: VPCOMPRESSB Y21, K1, Y24                           // 62827d2963e8
-       //TODO: VPCOMPRESSB Y5, K1, -17(BP)(SI*8)                  // 62f27d29636cf5ef
-       //TODO: VPCOMPRESSB Y24, K1, -17(BP)(SI*8)                 // 62627d296344f5ef
-       //TODO: VPCOMPRESSB Y21, K1, -17(BP)(SI*8)                 // 62e27d29636cf5ef
-       //TODO: VPCOMPRESSB Y5, K1, (R15)                          // 62d27d29632f
-       //TODO: VPCOMPRESSB Y24, K1, (R15)                         // 62427d296307
-       //TODO: VPCOMPRESSB Y21, K1, (R15)                         // 62c27d29632f
-       //TODO: VPCOMPRESSB Z2, K1, Z5                             // 62f27d4963d5
-       //TODO: VPCOMPRESSB Z2, K1, Z23                            // 62b27d4963d7
-       //TODO: VPCOMPRESSB Z2, K1, -17(BP)                        // 62f27d496355ef
-       //TODO: VPCOMPRESSB Z2, K1, -15(R14)(R15*8)                // 62927d496354fef1
-       //TODO: VPCOMPRESSW X20, K5, X20                           // 62a2fd0d63e4
-       //TODO: VPCOMPRESSW X16, K5, X20                           // 62a2fd0d63c4
-       //TODO: VPCOMPRESSW X12, K5, X20                           // 6232fd0d63e4
-       //TODO: VPCOMPRESSW X20, K5, X24                           // 6282fd0d63e0
-       //TODO: VPCOMPRESSW X16, K5, X24                           // 6282fd0d63c0
-       //TODO: VPCOMPRESSW X12, K5, X24                           // 6212fd0d63e0
-       //TODO: VPCOMPRESSW X20, K5, X7                            // 62e2fd0d63e7
-       //TODO: VPCOMPRESSW X16, K5, X7                            // 62e2fd0d63c7
-       //TODO: VPCOMPRESSW X12, K5, X7                            // 6272fd0d63e7
-       //TODO: VPCOMPRESSW X20, K5, 17(SP)(BP*2)                  // 62e2fd0d63a46c11000000
-       //TODO: VPCOMPRESSW X16, K5, 17(SP)(BP*2)                  // 62e2fd0d63846c11000000
-       //TODO: VPCOMPRESSW X12, K5, 17(SP)(BP*2)                  // 6272fd0d63a46c11000000
-       //TODO: VPCOMPRESSW X20, K5, -7(DI)(R8*4)                  // 62a2fd0d63a487f9ffffff
-       //TODO: VPCOMPRESSW X16, K5, -7(DI)(R8*4)                  // 62a2fd0d638487f9ffffff
-       //TODO: VPCOMPRESSW X12, K5, -7(DI)(R8*4)                  // 6232fd0d63a487f9ffffff
-       //TODO: VPCOMPRESSW Y18, K7, Y14                           // 62c2fd2f63d6
-       //TODO: VPCOMPRESSW Y3, K7, Y14                            // 62d2fd2f63de
-       //TODO: VPCOMPRESSW Y24, K7, Y14                           // 6242fd2f63c6
-       //TODO: VPCOMPRESSW Y18, K7, Y18                           // 62a2fd2f63d2
-       //TODO: VPCOMPRESSW Y3, K7, Y18                            // 62b2fd2f63da
-       //TODO: VPCOMPRESSW Y24, K7, Y18                           // 6222fd2f63c2
-       //TODO: VPCOMPRESSW Y18, K7, Y31                           // 6282fd2f63d7
-       //TODO: VPCOMPRESSW Y3, K7, Y31                            // 6292fd2f63df
-       //TODO: VPCOMPRESSW Y24, K7, Y31                           // 6202fd2f63c7
-       //TODO: VPCOMPRESSW Y18, K7, -7(DI)(R8*1)                  // 62a2fd2f639407f9ffffff
-       //TODO: VPCOMPRESSW Y3, K7, -7(DI)(R8*1)                   // 62b2fd2f639c07f9ffffff
-       //TODO: VPCOMPRESSW Y24, K7, -7(DI)(R8*1)                  // 6222fd2f638407f9ffffff
-       //TODO: VPCOMPRESSW Y18, K7, (SP)                          // 62e2fd2f631424
-       //TODO: VPCOMPRESSW Y3, K7, (SP)                           // 62f2fd2f631c24
-       //TODO: VPCOMPRESSW Y24, K7, (SP)                          // 6262fd2f630424
-       //TODO: VPCOMPRESSW Z3, K7, Z26                            // 6292fd4f63da
-       //TODO: VPCOMPRESSW Z0, K7, Z26                            // 6292fd4f63c2
-       //TODO: VPCOMPRESSW Z3, K7, Z3                             // 62f2fd4f63db
-       //TODO: VPCOMPRESSW Z0, K7, Z3                             // 62f2fd4f63c3
-       //TODO: VPCOMPRESSW Z3, K7, 15(R8)(R14*8)                  // 6292fd4f639cf00f000000
-       //TODO: VPCOMPRESSW Z0, K7, 15(R8)(R14*8)                  // 6292fd4f6384f00f000000
-       //TODO: VPCOMPRESSW Z3, K7, -15(R14)(R15*2)                // 6292fd4f639c7ef1ffffff
-       //TODO: VPCOMPRESSW Z0, K7, -15(R14)(R15*2)                // 6292fd4f63847ef1ffffff
-       //TODO: VPEXPANDB X16, K1, X6                              // 62b27d0962f0
-       //TODO: VPEXPANDB X28, K1, X6                              // 62927d0962f4
-       //TODO: VPEXPANDB X8, K1, X6                               // 62d27d0962f0
-       //TODO: VPEXPANDB 99(R15)(R15*4), K1, X6                   // 62927d096274bf63
-       //TODO: VPEXPANDB 15(DX), K1, X6                           // 62f27d0962720f
-       //TODO: VPEXPANDB X16, K1, X22                             // 62a27d0962f0
-       //TODO: VPEXPANDB X28, K1, X22                             // 62827d0962f4
-       //TODO: VPEXPANDB X8, K1, X22                              // 62c27d0962f0
-       //TODO: VPEXPANDB 99(R15)(R15*4), K1, X22                  // 62827d096274bf63
-       //TODO: VPEXPANDB 15(DX), K1, X22                          // 62e27d0962720f
-       //TODO: VPEXPANDB X16, K1, X12                             // 62327d0962e0
-       //TODO: VPEXPANDB X28, K1, X12                             // 62127d0962e4
-       //TODO: VPEXPANDB X8, K1, X12                              // 62527d0962e0
-       //TODO: VPEXPANDB 99(R15)(R15*4), K1, X12                  // 62127d096264bf63
-       //TODO: VPEXPANDB 15(DX), K1, X12                          // 62727d0962620f
-       //TODO: VPEXPANDB Y31, K1, Y27                             // 62027d2962df
-       //TODO: VPEXPANDB Y3, K1, Y27                              // 62627d2962db
-       //TODO: VPEXPANDB Y14, K1, Y27                             // 62427d2962de
-       //TODO: VPEXPANDB -7(DI)(R8*1), K1, Y27                    // 62227d29625c07f9
-       //TODO: VPEXPANDB (SP), K1, Y27                            // 62627d29621c24
-       //TODO: VPEXPANDB Y31, K1, Y0                              // 62927d2962c7
-       //TODO: VPEXPANDB Y3, K1, Y0                               // 62f27d2962c3
-       //TODO: VPEXPANDB Y14, K1, Y0                              // 62d27d2962c6
-       //TODO: VPEXPANDB -7(DI)(R8*1), K1, Y0                     // 62b27d29624407f9
-       //TODO: VPEXPANDB (SP), K1, Y0                             // 62f27d29620424
-       //TODO: VPEXPANDB Y31, K1, Y11                             // 62127d2962df
-       //TODO: VPEXPANDB Y3, K1, Y11                              // 62727d2962db
-       //TODO: VPEXPANDB Y14, K1, Y11                             // 62527d2962de
-       //TODO: VPEXPANDB -7(DI)(R8*1), K1, Y11                    // 62327d29625c07f9
-       //TODO: VPEXPANDB (SP), K1, Y11                            // 62727d29621c24
-       //TODO: VPEXPANDB Z14, K1, Z15                             // 62527d4962fe
-       //TODO: VPEXPANDB Z27, K1, Z15                             // 62127d4962fb
-       //TODO: VPEXPANDB 15(R8)(R14*8), K1, Z15                   // 62127d49627cf00f
-       //TODO: VPEXPANDB -15(R14)(R15*2), K1, Z15                 // 62127d49627c7ef1
-       //TODO: VPEXPANDB Z14, K1, Z12                             // 62527d4962e6
-       //TODO: VPEXPANDB Z27, K1, Z12                             // 62127d4962e3
-       //TODO: VPEXPANDB 15(R8)(R14*8), K1, Z12                   // 62127d496264f00f
-       //TODO: VPEXPANDB -15(R14)(R15*2), K1, Z12                 // 62127d4962647ef1
-       //TODO: VPEXPANDW X2, K5, X18                              // 62e2fd0d62d2
-       //TODO: VPEXPANDW X24, K5, X18                             // 6282fd0d62d0
-       //TODO: VPEXPANDW -7(CX)(DX*1), K5, X18                    // 62e2fd0d629411f9ffffff
-       //TODO: VPEXPANDW -15(R14)(R15*4), K5, X18                 // 6282fd0d6294bef1ffffff
-       //TODO: VPEXPANDW X2, K5, X11                              // 6272fd0d62da
-       //TODO: VPEXPANDW X24, K5, X11                             // 6212fd0d62d8
-       //TODO: VPEXPANDW -7(CX)(DX*1), K5, X11                    // 6272fd0d629c11f9ffffff
-       //TODO: VPEXPANDW -15(R14)(R15*4), K5, X11                 // 6212fd0d629cbef1ffffff
-       //TODO: VPEXPANDW X2, K5, X9                               // 6272fd0d62ca
-       //TODO: VPEXPANDW X24, K5, X9                              // 6212fd0d62c8
-       //TODO: VPEXPANDW -7(CX)(DX*1), K5, X9                     // 6272fd0d628c11f9ffffff
-       //TODO: VPEXPANDW -15(R14)(R15*4), K5, X9                  // 6212fd0d628cbef1ffffff
-       //TODO: VPEXPANDW Y5, K7, Y19                              // 62e2fd2f62dd
-       //TODO: VPEXPANDW Y16, K7, Y19                             // 62a2fd2f62d8
-       //TODO: VPEXPANDW Y2, K7, Y19                              // 62e2fd2f62da
-       //TODO: VPEXPANDW (AX), K7, Y19                            // 62e2fd2f6218
-       //TODO: VPEXPANDW 7(SI), K7, Y19                           // 62e2fd2f629e07000000
-       //TODO: VPEXPANDW Y5, K7, Y14                              // 6272fd2f62f5
-       //TODO: VPEXPANDW Y16, K7, Y14                             // 6232fd2f62f0
-       //TODO: VPEXPANDW Y2, K7, Y14                              // 6272fd2f62f2
-       //TODO: VPEXPANDW (AX), K7, Y14                            // 6272fd2f6230
-       //TODO: VPEXPANDW 7(SI), K7, Y14                           // 6272fd2f62b607000000
-       //TODO: VPEXPANDW Y5, K7, Y21                              // 62e2fd2f62ed
-       //TODO: VPEXPANDW Y16, K7, Y21                             // 62a2fd2f62e8
-       //TODO: VPEXPANDW Y2, K7, Y21                              // 62e2fd2f62ea
-       //TODO: VPEXPANDW (AX), K7, Y21                            // 62e2fd2f6228
-       //TODO: VPEXPANDW 7(SI), K7, Y21                           // 62e2fd2f62ae07000000
-       //TODO: VPEXPANDW Z26, K7, Z6                              // 6292fd4f62f2
-       //TODO: VPEXPANDW Z14, K7, Z6                              // 62d2fd4f62f6
-       //TODO: VPEXPANDW (SI), K7, Z6                             // 62f2fd4f6236
-       //TODO: VPEXPANDW 7(SI)(DI*2), K7, Z6                      // 62f2fd4f62b47e07000000
-       //TODO: VPEXPANDW Z26, K7, Z14                             // 6212fd4f62f2
-       //TODO: VPEXPANDW Z14, K7, Z14                             // 6252fd4f62f6
-       //TODO: VPEXPANDW (SI), K7, Z14                            // 6272fd4f6236
-       //TODO: VPEXPANDW 7(SI)(DI*2), K7, Z14                     // 6272fd4f62b47e07000000
-       //TODO: VPSHLDD $47, X8, X31, K4, X26                      // 6243050471d02f
-       //TODO: VPSHLDD $47, X1, X31, K4, X26                      // 6263050471d12f
-       //TODO: VPSHLDD $47, X0, X31, K4, X26                      // 6263050471d02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X31, K4, X26             // 626305047194be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X31, K4, X26            // 62230504719447f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X16, K4, X26                      // 62437d0471d02f
-       //TODO: VPSHLDD $47, X1, X16, K4, X26                      // 62637d0471d12f
-       //TODO: VPSHLDD $47, X0, X16, K4, X26                      // 62637d0471d02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X16, K4, X26             // 62637d047194be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X16, K4, X26            // 62237d04719447f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X7, K4, X26                       // 6243450c71d02f
-       //TODO: VPSHLDD $47, X1, X7, K4, X26                       // 6263450c71d12f
-       //TODO: VPSHLDD $47, X0, X7, K4, X26                       // 6263450c71d02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X7, K4, X26              // 6263450c7194be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X7, K4, X26             // 6223450c719447f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X31, K4, X19                      // 62c3050471d82f
-       //TODO: VPSHLDD $47, X1, X31, K4, X19                      // 62e3050471d92f
-       //TODO: VPSHLDD $47, X0, X31, K4, X19                      // 62e3050471d82f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X31, K4, X19             // 62e30504719cbe070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X31, K4, X19            // 62a30504719c47f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X16, K4, X19                      // 62c37d0471d82f
-       //TODO: VPSHLDD $47, X1, X16, K4, X19                      // 62e37d0471d92f
-       //TODO: VPSHLDD $47, X0, X16, K4, X19                      // 62e37d0471d82f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X16, K4, X19             // 62e37d04719cbe070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X16, K4, X19            // 62a37d04719c47f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X7, K4, X19                       // 62c3450c71d82f
-       //TODO: VPSHLDD $47, X1, X7, K4, X19                       // 62e3450c71d92f
-       //TODO: VPSHLDD $47, X0, X7, K4, X19                       // 62e3450c71d82f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X7, K4, X19              // 62e3450c719cbe070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X7, K4, X19             // 62a3450c719c47f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X31, K4, X0                       // 62d3050471c02f
-       //TODO: VPSHLDD $47, X1, X31, K4, X0                       // 62f3050471c12f
-       //TODO: VPSHLDD $47, X0, X31, K4, X0                       // 62f3050471c02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X31, K4, X0              // 62f305047184be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X31, K4, X0             // 62b30504718447f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X16, K4, X0                       // 62d37d0471c02f
-       //TODO: VPSHLDD $47, X1, X16, K4, X0                       // 62f37d0471c12f
-       //TODO: VPSHLDD $47, X0, X16, K4, X0                       // 62f37d0471c02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X16, K4, X0              // 62f37d047184be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X16, K4, X0             // 62b37d04718447f9ffffff2f
-       //TODO: VPSHLDD $47, X8, X7, K4, X0                        // 62d3450c71c02f
-       //TODO: VPSHLDD $47, X1, X7, K4, X0                        // 62f3450c71c12f
-       //TODO: VPSHLDD $47, X0, X7, K4, X0                        // 62f3450c71c02f
-       //TODO: VPSHLDD $47, 7(SI)(DI*4), X7, K4, X0               // 62f3450c7184be070000002f
-       //TODO: VPSHLDD $47, -7(DI)(R8*2), X7, K4, X0              // 62b3450c718447f9ffffff2f
-       //TODO: VPSHLDD $82, Y5, Y19, K1, Y3                       // 62f3652171dd52
-       //TODO: VPSHLDD $82, Y16, Y19, K1, Y3                      // 62b3652171d852
-       //TODO: VPSHLDD $82, Y2, Y19, K1, Y3                       // 62f3652171da52
-       //TODO: VPSHLDD $82, (AX), Y19, K1, Y3                     // 62f36521711852
-       //TODO: VPSHLDD $82, 7(SI), Y19, K1, Y3                    // 62f36521719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y14, K1, Y3                       // 62f30d2971dd52
-       //TODO: VPSHLDD $82, Y16, Y14, K1, Y3                      // 62b30d2971d852
-       //TODO: VPSHLDD $82, Y2, Y14, K1, Y3                       // 62f30d2971da52
-       //TODO: VPSHLDD $82, (AX), Y14, K1, Y3                     // 62f30d29711852
-       //TODO: VPSHLDD $82, 7(SI), Y14, K1, Y3                    // 62f30d29719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y21, K1, Y3                       // 62f3552171dd52
-       //TODO: VPSHLDD $82, Y16, Y21, K1, Y3                      // 62b3552171d852
-       //TODO: VPSHLDD $82, Y2, Y21, K1, Y3                       // 62f3552171da52
-       //TODO: VPSHLDD $82, (AX), Y21, K1, Y3                     // 62f35521711852
-       //TODO: VPSHLDD $82, 7(SI), Y21, K1, Y3                    // 62f35521719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y19, K1, Y19                      // 62e3652171dd52
-       //TODO: VPSHLDD $82, Y16, Y19, K1, Y19                     // 62a3652171d852
-       //TODO: VPSHLDD $82, Y2, Y19, K1, Y19                      // 62e3652171da52
-       //TODO: VPSHLDD $82, (AX), Y19, K1, Y19                    // 62e36521711852
-       //TODO: VPSHLDD $82, 7(SI), Y19, K1, Y19                   // 62e36521719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y14, K1, Y19                      // 62e30d2971dd52
-       //TODO: VPSHLDD $82, Y16, Y14, K1, Y19                     // 62a30d2971d852
-       //TODO: VPSHLDD $82, Y2, Y14, K1, Y19                      // 62e30d2971da52
-       //TODO: VPSHLDD $82, (AX), Y14, K1, Y19                    // 62e30d29711852
-       //TODO: VPSHLDD $82, 7(SI), Y14, K1, Y19                   // 62e30d29719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y21, K1, Y19                      // 62e3552171dd52
-       //TODO: VPSHLDD $82, Y16, Y21, K1, Y19                     // 62a3552171d852
-       //TODO: VPSHLDD $82, Y2, Y21, K1, Y19                      // 62e3552171da52
-       //TODO: VPSHLDD $82, (AX), Y21, K1, Y19                    // 62e35521711852
-       //TODO: VPSHLDD $82, 7(SI), Y21, K1, Y19                   // 62e35521719e0700000052
-       //TODO: VPSHLDD $82, Y5, Y19, K1, Y23                      // 62e3652171fd52
-       //TODO: VPSHLDD $82, Y16, Y19, K1, Y23                     // 62a3652171f852
-       //TODO: VPSHLDD $82, Y2, Y19, K1, Y23                      // 62e3652171fa52
-       //TODO: VPSHLDD $82, (AX), Y19, K1, Y23                    // 62e36521713852
-       //TODO: VPSHLDD $82, 7(SI), Y19, K1, Y23                   // 62e3652171be0700000052
-       //TODO: VPSHLDD $82, Y5, Y14, K1, Y23                      // 62e30d2971fd52
-       //TODO: VPSHLDD $82, Y16, Y14, K1, Y23                     // 62a30d2971f852
-       //TODO: VPSHLDD $82, Y2, Y14, K1, Y23                      // 62e30d2971fa52
-       //TODO: VPSHLDD $82, (AX), Y14, K1, Y23                    // 62e30d29713852
-       //TODO: VPSHLDD $82, 7(SI), Y14, K1, Y23                   // 62e30d2971be0700000052
-       //TODO: VPSHLDD $82, Y5, Y21, K1, Y23                      // 62e3552171fd52
-       //TODO: VPSHLDD $82, Y16, Y21, K1, Y23                     // 62a3552171f852
-       //TODO: VPSHLDD $82, Y2, Y21, K1, Y23                      // 62e3552171fa52
-       //TODO: VPSHLDD $82, (AX), Y21, K1, Y23                    // 62e35521713852
-       //TODO: VPSHLDD $82, 7(SI), Y21, K1, Y23                   // 62e3552171be0700000052
-       //TODO: VPSHLDD $126, Z27, Z2, K3, Z21                     // 62836d4b71eb7e
-       //TODO: VPSHLDD $126, Z25, Z2, K3, Z21                     // 62836d4b71e97e
-       //TODO: VPSHLDD $126, 17(SP)(BP*1), Z2, K3, Z21            // 62e36d4b71ac2c110000007e
-       //TODO: VPSHLDD $126, -7(CX)(DX*8), Z2, K3, Z21            // 62e36d4b71acd1f9ffffff7e
-       //TODO: VPSHLDD $126, Z27, Z7, K3, Z21                     // 6283454b71eb7e
-       //TODO: VPSHLDD $126, Z25, Z7, K3, Z21                     // 6283454b71e97e
-       //TODO: VPSHLDD $126, 17(SP)(BP*1), Z7, K3, Z21            // 62e3454b71ac2c110000007e
-       //TODO: VPSHLDD $126, -7(CX)(DX*8), Z7, K3, Z21            // 62e3454b71acd1f9ffffff7e
-       //TODO: VPSHLDD $126, Z27, Z2, K3, Z9                      // 62136d4b71cb7e
-       //TODO: VPSHLDD $126, Z25, Z2, K3, Z9                      // 62136d4b71c97e
-       //TODO: VPSHLDD $126, 17(SP)(BP*1), Z2, K3, Z9             // 62736d4b718c2c110000007e
-       //TODO: VPSHLDD $126, -7(CX)(DX*8), Z2, K3, Z9             // 62736d4b718cd1f9ffffff7e
-       //TODO: VPSHLDD $126, Z27, Z7, K3, Z9                      // 6213454b71cb7e
-       //TODO: VPSHLDD $126, Z25, Z7, K3, Z9                      // 6213454b71c97e
-       //TODO: VPSHLDD $126, 17(SP)(BP*1), Z7, K3, Z9             // 6273454b718c2c110000007e
-       //TODO: VPSHLDD $126, -7(CX)(DX*8), Z7, K3, Z9             // 6273454b718cd1f9ffffff7e
-       //TODO: VPSHLDQ $94, X22, X21, K4, X15                     // 6233d50471fe5e
-       //TODO: VPSHLDQ $94, X7, X21, K4, X15                      // 6273d50471ff5e
-       //TODO: VPSHLDQ $94, X19, X21, K4, X15                     // 6233d50471fb5e
-       //TODO: VPSHLDQ $94, 17(SP), X21, K4, X15                  // 6273d50471bc24110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X15           // 6273d50471bcb5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X0, K4, X15                      // 6233fd0c71fe5e
-       //TODO: VPSHLDQ $94, X7, X0, K4, X15                       // 6273fd0c71ff5e
-       //TODO: VPSHLDQ $94, X19, X0, K4, X15                      // 6233fd0c71fb5e
-       //TODO: VPSHLDQ $94, 17(SP), X0, K4, X15                   // 6273fd0c71bc24110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X15            // 6273fd0c71bcb5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X28, K4, X15                     // 62339d0471fe5e
-       //TODO: VPSHLDQ $94, X7, X28, K4, X15                      // 62739d0471ff5e
-       //TODO: VPSHLDQ $94, X19, X28, K4, X15                     // 62339d0471fb5e
-       //TODO: VPSHLDQ $94, 17(SP), X28, K4, X15                  // 62739d0471bc24110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X15           // 62739d0471bcb5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X21, K4, X0                      // 62b3d50471c65e
-       //TODO: VPSHLDQ $94, X7, X21, K4, X0                       // 62f3d50471c75e
-       //TODO: VPSHLDQ $94, X19, X21, K4, X0                      // 62b3d50471c35e
-       //TODO: VPSHLDQ $94, 17(SP), X21, K4, X0                   // 62f3d504718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X0            // 62f3d5047184b5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X0, K4, X0                       // 62b3fd0c71c65e
-       //TODO: VPSHLDQ $94, X7, X0, K4, X0                        // 62f3fd0c71c75e
-       //TODO: VPSHLDQ $94, X19, X0, K4, X0                       // 62b3fd0c71c35e
-       //TODO: VPSHLDQ $94, 17(SP), X0, K4, X0                    // 62f3fd0c718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X0             // 62f3fd0c7184b5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X28, K4, X0                      // 62b39d0471c65e
-       //TODO: VPSHLDQ $94, X7, X28, K4, X0                       // 62f39d0471c75e
-       //TODO: VPSHLDQ $94, X19, X28, K4, X0                      // 62b39d0471c35e
-       //TODO: VPSHLDQ $94, 17(SP), X28, K4, X0                   // 62f39d04718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X0            // 62f39d047184b5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X21, K4, X16                     // 62a3d50471c65e
-       //TODO: VPSHLDQ $94, X7, X21, K4, X16                      // 62e3d50471c75e
-       //TODO: VPSHLDQ $94, X19, X21, K4, X16                     // 62a3d50471c35e
-       //TODO: VPSHLDQ $94, 17(SP), X21, K4, X16                  // 62e3d504718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X16           // 62e3d5047184b5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X0, K4, X16                      // 62a3fd0c71c65e
-       //TODO: VPSHLDQ $94, X7, X0, K4, X16                       // 62e3fd0c71c75e
-       //TODO: VPSHLDQ $94, X19, X0, K4, X16                      // 62a3fd0c71c35e
-       //TODO: VPSHLDQ $94, 17(SP), X0, K4, X16                   // 62e3fd0c718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X16            // 62e3fd0c7184b5efffffff5e
-       //TODO: VPSHLDQ $94, X22, X28, K4, X16                     // 62a39d0471c65e
-       //TODO: VPSHLDQ $94, X7, X28, K4, X16                      // 62e39d0471c75e
-       //TODO: VPSHLDQ $94, X19, X28, K4, X16                     // 62a39d0471c35e
-       //TODO: VPSHLDQ $94, 17(SP), X28, K4, X16                  // 62e39d04718424110000005e
-       //TODO: VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X16           // 62e39d047184b5efffffff5e
-       //TODO: VPSHLDQ $121, Y19, Y31, K5, Y21                    // 62a3852571eb79
-       //TODO: VPSHLDQ $121, Y7, Y31, K5, Y21                     // 62e3852571ef79
-       //TODO: VPSHLDQ $121, Y6, Y31, K5, Y21                     // 62e3852571ee79
-       //TODO: VPSHLDQ $121, (BX), Y31, K5, Y21                   // 62e38525712b79
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y21          // 62e3852571ac35efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y6, K5, Y21                     // 62a3cd2d71eb79
-       //TODO: VPSHLDQ $121, Y7, Y6, K5, Y21                      // 62e3cd2d71ef79
-       //TODO: VPSHLDQ $121, Y6, Y6, K5, Y21                      // 62e3cd2d71ee79
-       //TODO: VPSHLDQ $121, (BX), Y6, K5, Y21                    // 62e3cd2d712b79
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y21           // 62e3cd2d71ac35efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y11, K5, Y21                    // 62a3a52d71eb79
-       //TODO: VPSHLDQ $121, Y7, Y11, K5, Y21                     // 62e3a52d71ef79
-       //TODO: VPSHLDQ $121, Y6, Y11, K5, Y21                     // 62e3a52d71ee79
-       //TODO: VPSHLDQ $121, (BX), Y11, K5, Y21                   // 62e3a52d712b79
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y21          // 62e3a52d71ac35efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y31, K5, Y20                    // 62a3852571e379
-       //TODO: VPSHLDQ $121, Y7, Y31, K5, Y20                     // 62e3852571e779
-       //TODO: VPSHLDQ $121, Y6, Y31, K5, Y20                     // 62e3852571e679
-       //TODO: VPSHLDQ $121, (BX), Y31, K5, Y20                   // 62e38525712379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y20          // 62e3852571a435efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y6, K5, Y20                     // 62a3cd2d71e379
-       //TODO: VPSHLDQ $121, Y7, Y6, K5, Y20                      // 62e3cd2d71e779
-       //TODO: VPSHLDQ $121, Y6, Y6, K5, Y20                      // 62e3cd2d71e679
-       //TODO: VPSHLDQ $121, (BX), Y6, K5, Y20                    // 62e3cd2d712379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y20           // 62e3cd2d71a435efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y11, K5, Y20                    // 62a3a52d71e379
-       //TODO: VPSHLDQ $121, Y7, Y11, K5, Y20                     // 62e3a52d71e779
-       //TODO: VPSHLDQ $121, Y6, Y11, K5, Y20                     // 62e3a52d71e679
-       //TODO: VPSHLDQ $121, (BX), Y11, K5, Y20                   // 62e3a52d712379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y20          // 62e3a52d71a435efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y31, K5, Y6                     // 62b3852571f379
-       //TODO: VPSHLDQ $121, Y7, Y31, K5, Y6                      // 62f3852571f779
-       //TODO: VPSHLDQ $121, Y6, Y31, K5, Y6                      // 62f3852571f679
-       //TODO: VPSHLDQ $121, (BX), Y31, K5, Y6                    // 62f38525713379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y6           // 62f3852571b435efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y6, K5, Y6                      // 62b3cd2d71f379
-       //TODO: VPSHLDQ $121, Y7, Y6, K5, Y6                       // 62f3cd2d71f779
-       //TODO: VPSHLDQ $121, Y6, Y6, K5, Y6                       // 62f3cd2d71f679
-       //TODO: VPSHLDQ $121, (BX), Y6, K5, Y6                     // 62f3cd2d713379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y6            // 62f3cd2d71b435efffffff79
-       //TODO: VPSHLDQ $121, Y19, Y11, K5, Y6                     // 62b3a52d71f379
-       //TODO: VPSHLDQ $121, Y7, Y11, K5, Y6                      // 62f3a52d71f779
-       //TODO: VPSHLDQ $121, Y6, Y11, K5, Y6                      // 62f3a52d71f679
-       //TODO: VPSHLDQ $121, (BX), Y11, K5, Y6                    // 62f3a52d713379
-       //TODO: VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y6           // 62f3a52d71b435efffffff79
-       //TODO: VPSHLDQ $13, Z3, Z27, K7, Z23                      // 62e3a54771fb0d
-       //TODO: VPSHLDQ $13, Z0, Z27, K7, Z23                      // 62e3a54771f80d
-       //TODO: VPSHLDQ $13, -17(BP)(SI*2), Z27, K7, Z23           // 62e3a54771bc75efffffff0d
-       //TODO: VPSHLDQ $13, 7(AX)(CX*2), Z27, K7, Z23             // 62e3a54771bc48070000000d
-       //TODO: VPSHLDQ $13, Z3, Z14, K7, Z23                      // 62e38d4f71fb0d
-       //TODO: VPSHLDQ $13, Z0, Z14, K7, Z23                      // 62e38d4f71f80d
-       //TODO: VPSHLDQ $13, -17(BP)(SI*2), Z14, K7, Z23           // 62e38d4f71bc75efffffff0d
-       //TODO: VPSHLDQ $13, 7(AX)(CX*2), Z14, K7, Z23             // 62e38d4f71bc48070000000d
-       //TODO: VPSHLDQ $13, Z3, Z27, K7, Z9                       // 6273a54771cb0d
-       //TODO: VPSHLDQ $13, Z0, Z27, K7, Z9                       // 6273a54771c80d
-       //TODO: VPSHLDQ $13, -17(BP)(SI*2), Z27, K7, Z9            // 6273a547718c75efffffff0d
-       //TODO: VPSHLDQ $13, 7(AX)(CX*2), Z27, K7, Z9              // 6273a547718c48070000000d
-       //TODO: VPSHLDQ $13, Z3, Z14, K7, Z9                       // 62738d4f71cb0d
-       //TODO: VPSHLDQ $13, Z0, Z14, K7, Z9                       // 62738d4f71c80d
-       //TODO: VPSHLDQ $13, -17(BP)(SI*2), Z14, K7, Z9            // 62738d4f718c75efffffff0d
-       //TODO: VPSHLDQ $13, 7(AX)(CX*2), Z14, K7, Z9              // 62738d4f718c48070000000d
-       //TODO: VPSHLDVD X15, X1, K7, X7                           // 62d2750f71ff
-       //TODO: VPSHLDVD X12, X1, K7, X7                           // 62d2750f71fc
-       //TODO: VPSHLDVD X0, X1, K7, X7                            // 62f2750f71f8
-       //TODO: VPSHLDVD 7(AX), X1, K7, X7                         // 62f2750f71b807000000
-       //TODO: VPSHLDVD (DI), X1, K7, X7                          // 62f2750f713f
-       //TODO: VPSHLDVD X15, X7, K7, X7                           // 62d2450f71ff
-       //TODO: VPSHLDVD X12, X7, K7, X7                           // 62d2450f71fc
-       //TODO: VPSHLDVD X0, X7, K7, X7                            // 62f2450f71f8
-       //TODO: VPSHLDVD 7(AX), X7, K7, X7                         // 62f2450f71b807000000
-       //TODO: VPSHLDVD (DI), X7, K7, X7                          // 62f2450f713f
-       //TODO: VPSHLDVD X15, X9, K7, X7                           // 62d2350f71ff
-       //TODO: VPSHLDVD X12, X9, K7, X7                           // 62d2350f71fc
-       //TODO: VPSHLDVD X0, X9, K7, X7                            // 62f2350f71f8
-       //TODO: VPSHLDVD 7(AX), X9, K7, X7                         // 62f2350f71b807000000
-       //TODO: VPSHLDVD (DI), X9, K7, X7                          // 62f2350f713f
-       //TODO: VPSHLDVD X15, X1, K7, X16                          // 62c2750f71c7
-       //TODO: VPSHLDVD X12, X1, K7, X16                          // 62c2750f71c4
-       //TODO: VPSHLDVD X0, X1, K7, X16                           // 62e2750f71c0
-       //TODO: VPSHLDVD 7(AX), X1, K7, X16                        // 62e2750f718007000000
-       //TODO: VPSHLDVD (DI), X1, K7, X16                         // 62e2750f7107
-       //TODO: VPSHLDVD X15, X7, K7, X16                          // 62c2450f71c7
-       //TODO: VPSHLDVD X12, X7, K7, X16                          // 62c2450f71c4
-       //TODO: VPSHLDVD X0, X7, K7, X16                           // 62e2450f71c0
-       //TODO: VPSHLDVD 7(AX), X7, K7, X16                        // 62e2450f718007000000
-       //TODO: VPSHLDVD (DI), X7, K7, X16                         // 62e2450f7107
-       //TODO: VPSHLDVD X15, X9, K7, X16                          // 62c2350f71c7
-       //TODO: VPSHLDVD X12, X9, K7, X16                          // 62c2350f71c4
-       //TODO: VPSHLDVD X0, X9, K7, X16                           // 62e2350f71c0
-       //TODO: VPSHLDVD 7(AX), X9, K7, X16                        // 62e2350f718007000000
-       //TODO: VPSHLDVD (DI), X9, K7, X16                         // 62e2350f7107
-       //TODO: VPSHLDVD X15, X1, K7, X31                          // 6242750f71ff
-       //TODO: VPSHLDVD X12, X1, K7, X31                          // 6242750f71fc
-       //TODO: VPSHLDVD X0, X1, K7, X31                           // 6262750f71f8
-       //TODO: VPSHLDVD 7(AX), X1, K7, X31                        // 6262750f71b807000000
-       //TODO: VPSHLDVD (DI), X1, K7, X31                         // 6262750f713f
-       //TODO: VPSHLDVD X15, X7, K7, X31                          // 6242450f71ff
-       //TODO: VPSHLDVD X12, X7, K7, X31                          // 6242450f71fc
-       //TODO: VPSHLDVD X0, X7, K7, X31                           // 6262450f71f8
-       //TODO: VPSHLDVD 7(AX), X7, K7, X31                        // 6262450f71b807000000
-       //TODO: VPSHLDVD (DI), X7, K7, X31                         // 6262450f713f
-       //TODO: VPSHLDVD X15, X9, K7, X31                          // 6242350f71ff
-       //TODO: VPSHLDVD X12, X9, K7, X31                          // 6242350f71fc
-       //TODO: VPSHLDVD X0, X9, K7, X31                           // 6262350f71f8
-       //TODO: VPSHLDVD 7(AX), X9, K7, X31                        // 6262350f71b807000000
-       //TODO: VPSHLDVD (DI), X9, K7, X31                         // 6262350f713f
-       //TODO: VPSHLDVD Y5, Y20, K6, Y0                           // 62f25d2671c5
-       //TODO: VPSHLDVD Y28, Y20, K6, Y0                          // 62925d2671c4
-       //TODO: VPSHLDVD Y7, Y20, K6, Y0                           // 62f25d2671c7
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y20, K6, Y0                // 62925d267184b00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y20, K6, Y0                 // 62f25d26718491f9ffffff
-       //TODO: VPSHLDVD Y5, Y12, K6, Y0                           // 62f21d2e71c5
-       //TODO: VPSHLDVD Y28, Y12, K6, Y0                          // 62921d2e71c4
-       //TODO: VPSHLDVD Y7, Y12, K6, Y0                           // 62f21d2e71c7
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y12, K6, Y0                // 62921d2e7184b00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y12, K6, Y0                 // 62f21d2e718491f9ffffff
-       //TODO: VPSHLDVD Y5, Y3, K6, Y0                            // 62f2652e71c5
-       //TODO: VPSHLDVD Y28, Y3, K6, Y0                           // 6292652e71c4
-       //TODO: VPSHLDVD Y7, Y3, K6, Y0                            // 62f2652e71c7
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y3, K6, Y0                 // 6292652e7184b00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y3, K6, Y0                  // 62f2652e718491f9ffffff
-       //TODO: VPSHLDVD Y5, Y20, K6, Y3                           // 62f25d2671dd
-       //TODO: VPSHLDVD Y28, Y20, K6, Y3                          // 62925d2671dc
-       //TODO: VPSHLDVD Y7, Y20, K6, Y3                           // 62f25d2671df
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y20, K6, Y3                // 62925d26719cb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y20, K6, Y3                 // 62f25d26719c91f9ffffff
-       //TODO: VPSHLDVD Y5, Y12, K6, Y3                           // 62f21d2e71dd
-       //TODO: VPSHLDVD Y28, Y12, K6, Y3                          // 62921d2e71dc
-       //TODO: VPSHLDVD Y7, Y12, K6, Y3                           // 62f21d2e71df
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y12, K6, Y3                // 62921d2e719cb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y12, K6, Y3                 // 62f21d2e719c91f9ffffff
-       //TODO: VPSHLDVD Y5, Y3, K6, Y3                            // 62f2652e71dd
-       //TODO: VPSHLDVD Y28, Y3, K6, Y3                           // 6292652e71dc
-       //TODO: VPSHLDVD Y7, Y3, K6, Y3                            // 62f2652e71df
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y3, K6, Y3                 // 6292652e719cb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y3, K6, Y3                  // 62f2652e719c91f9ffffff
-       //TODO: VPSHLDVD Y5, Y20, K6, Y5                           // 62f25d2671ed
-       //TODO: VPSHLDVD Y28, Y20, K6, Y5                          // 62925d2671ec
-       //TODO: VPSHLDVD Y7, Y20, K6, Y5                           // 62f25d2671ef
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y20, K6, Y5                // 62925d2671acb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y20, K6, Y5                 // 62f25d2671ac91f9ffffff
-       //TODO: VPSHLDVD Y5, Y12, K6, Y5                           // 62f21d2e71ed
-       //TODO: VPSHLDVD Y28, Y12, K6, Y5                          // 62921d2e71ec
-       //TODO: VPSHLDVD Y7, Y12, K6, Y5                           // 62f21d2e71ef
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y12, K6, Y5                // 62921d2e71acb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y12, K6, Y5                 // 62f21d2e71ac91f9ffffff
-       //TODO: VPSHLDVD Y5, Y3, K6, Y5                            // 62f2652e71ed
-       //TODO: VPSHLDVD Y28, Y3, K6, Y5                           // 6292652e71ec
-       //TODO: VPSHLDVD Y7, Y3, K6, Y5                            // 62f2652e71ef
-       //TODO: VPSHLDVD 15(R8)(R14*4), Y3, K6, Y5                 // 6292652e71acb00f000000
-       //TODO: VPSHLDVD -7(CX)(DX*4), Y3, K6, Y5                  // 62f2652e71ac91f9ffffff
-       //TODO: VPSHLDVD Z22, Z8, K3, Z14                          // 62323d4b71f6
-       //TODO: VPSHLDVD Z25, Z8, K3, Z14                          // 62123d4b71f1
-       //TODO: VPSHLDVD 15(R8)(R14*1), Z8, K3, Z14                // 62123d4b71b4300f000000
-       //TODO: VPSHLDVD 15(R8)(R14*2), Z8, K3, Z14                // 62123d4b71b4700f000000
-       //TODO: VPSHLDVD Z22, Z24, K3, Z14                         // 62323d4371f6
-       //TODO: VPSHLDVD Z25, Z24, K3, Z14                         // 62123d4371f1
-       //TODO: VPSHLDVD 15(R8)(R14*1), Z24, K3, Z14               // 62123d4371b4300f000000
-       //TODO: VPSHLDVD 15(R8)(R14*2), Z24, K3, Z14               // 62123d4371b4700f000000
-       //TODO: VPSHLDVD Z22, Z8, K3, Z7                           // 62b23d4b71fe
-       //TODO: VPSHLDVD Z25, Z8, K3, Z7                           // 62923d4b71f9
-       //TODO: VPSHLDVD 15(R8)(R14*1), Z8, K3, Z7                 // 62923d4b71bc300f000000
-       //TODO: VPSHLDVD 15(R8)(R14*2), Z8, K3, Z7                 // 62923d4b71bc700f000000
-       //TODO: VPSHLDVD Z22, Z24, K3, Z7                          // 62b23d4371fe
-       //TODO: VPSHLDVD Z25, Z24, K3, Z7                          // 62923d4371f9
-       //TODO: VPSHLDVD 15(R8)(R14*1), Z24, K3, Z7                // 62923d4371bc300f000000
-       //TODO: VPSHLDVD 15(R8)(R14*2), Z24, K3, Z7                // 62923d4371bc700f000000
-       //TODO: VPSHLDVQ X3, X17, K7, X12                          // 6272f50771e3
-       //TODO: VPSHLDVQ X26, X17, K7, X12                         // 6212f50771e2
-       //TODO: VPSHLDVQ X23, X17, K7, X12                         // 6232f50771e7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X17, K7, X12              // 6212f50771a43f63000000
-       //TODO: VPSHLDVQ (DX), X17, K7, X12                        // 6272f5077122
-       //TODO: VPSHLDVQ X3, X15, K7, X12                          // 6272850f71e3
-       //TODO: VPSHLDVQ X26, X15, K7, X12                         // 6212850f71e2
-       //TODO: VPSHLDVQ X23, X15, K7, X12                         // 6232850f71e7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X15, K7, X12              // 6212850f71a43f63000000
-       //TODO: VPSHLDVQ (DX), X15, K7, X12                        // 6272850f7122
-       //TODO: VPSHLDVQ X3, X8, K7, X12                           // 6272bd0f71e3
-       //TODO: VPSHLDVQ X26, X8, K7, X12                          // 6212bd0f71e2
-       //TODO: VPSHLDVQ X23, X8, K7, X12                          // 6232bd0f71e7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X8, K7, X12               // 6212bd0f71a43f63000000
-       //TODO: VPSHLDVQ (DX), X8, K7, X12                         // 6272bd0f7122
-       //TODO: VPSHLDVQ X3, X17, K7, X14                          // 6272f50771f3
-       //TODO: VPSHLDVQ X26, X17, K7, X14                         // 6212f50771f2
-       //TODO: VPSHLDVQ X23, X17, K7, X14                         // 6232f50771f7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X17, K7, X14              // 6212f50771b43f63000000
-       //TODO: VPSHLDVQ (DX), X17, K7, X14                        // 6272f5077132
-       //TODO: VPSHLDVQ X3, X15, K7, X14                          // 6272850f71f3
-       //TODO: VPSHLDVQ X26, X15, K7, X14                         // 6212850f71f2
-       //TODO: VPSHLDVQ X23, X15, K7, X14                         // 6232850f71f7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X15, K7, X14              // 6212850f71b43f63000000
-       //TODO: VPSHLDVQ (DX), X15, K7, X14                        // 6272850f7132
-       //TODO: VPSHLDVQ X3, X8, K7, X14                           // 6272bd0f71f3
-       //TODO: VPSHLDVQ X26, X8, K7, X14                          // 6212bd0f71f2
-       //TODO: VPSHLDVQ X23, X8, K7, X14                          // 6232bd0f71f7
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X8, K7, X14               // 6212bd0f71b43f63000000
-       //TODO: VPSHLDVQ (DX), X8, K7, X14                         // 6272bd0f7132
-       //TODO: VPSHLDVQ X3, X17, K7, X5                           // 62f2f50771eb
-       //TODO: VPSHLDVQ X26, X17, K7, X5                          // 6292f50771ea
-       //TODO: VPSHLDVQ X23, X17, K7, X5                          // 62b2f50771ef
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X17, K7, X5               // 6292f50771ac3f63000000
-       //TODO: VPSHLDVQ (DX), X17, K7, X5                         // 62f2f507712a
-       //TODO: VPSHLDVQ X3, X15, K7, X5                           // 62f2850f71eb
-       //TODO: VPSHLDVQ X26, X15, K7, X5                          // 6292850f71ea
-       //TODO: VPSHLDVQ X23, X15, K7, X5                          // 62b2850f71ef
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X15, K7, X5               // 6292850f71ac3f63000000
-       //TODO: VPSHLDVQ (DX), X15, K7, X5                         // 62f2850f712a
-       //TODO: VPSHLDVQ X3, X8, K7, X5                            // 62f2bd0f71eb
-       //TODO: VPSHLDVQ X26, X8, K7, X5                           // 6292bd0f71ea
-       //TODO: VPSHLDVQ X23, X8, K7, X5                           // 62b2bd0f71ef
-       //TODO: VPSHLDVQ 99(R15)(R15*1), X8, K7, X5                // 6292bd0f71ac3f63000000
-       //TODO: VPSHLDVQ (DX), X8, K7, X5                          // 62f2bd0f712a
-       //TODO: VPSHLDVQ Y17, Y12, K4, Y0                          // 62b29d2c71c1
-       //TODO: VPSHLDVQ Y7, Y12, K4, Y0                           // 62f29d2c71c7
-       //TODO: VPSHLDVQ Y9, Y12, K4, Y0                           // 62d29d2c71c1
-       //TODO: VPSHLDVQ (R8), Y12, K4, Y0                         // 62d29d2c7100
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y0                 // 62f29d2c71845a0f000000
-       //TODO: VPSHLDVQ Y17, Y1, K4, Y0                           // 62b2f52c71c1
-       //TODO: VPSHLDVQ Y7, Y1, K4, Y0                            // 62f2f52c71c7
-       //TODO: VPSHLDVQ Y9, Y1, K4, Y0                            // 62d2f52c71c1
-       //TODO: VPSHLDVQ (R8), Y1, K4, Y0                          // 62d2f52c7100
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y0                  // 62f2f52c71845a0f000000
-       //TODO: VPSHLDVQ Y17, Y14, K4, Y0                          // 62b28d2c71c1
-       //TODO: VPSHLDVQ Y7, Y14, K4, Y0                           // 62f28d2c71c7
-       //TODO: VPSHLDVQ Y9, Y14, K4, Y0                           // 62d28d2c71c1
-       //TODO: VPSHLDVQ (R8), Y14, K4, Y0                         // 62d28d2c7100
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y0                 // 62f28d2c71845a0f000000
-       //TODO: VPSHLDVQ Y17, Y12, K4, Y22                         // 62a29d2c71f1
-       //TODO: VPSHLDVQ Y7, Y12, K4, Y22                          // 62e29d2c71f7
-       //TODO: VPSHLDVQ Y9, Y12, K4, Y22                          // 62c29d2c71f1
-       //TODO: VPSHLDVQ (R8), Y12, K4, Y22                        // 62c29d2c7130
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y22                // 62e29d2c71b45a0f000000
-       //TODO: VPSHLDVQ Y17, Y1, K4, Y22                          // 62a2f52c71f1
-       //TODO: VPSHLDVQ Y7, Y1, K4, Y22                           // 62e2f52c71f7
-       //TODO: VPSHLDVQ Y9, Y1, K4, Y22                           // 62c2f52c71f1
-       //TODO: VPSHLDVQ (R8), Y1, K4, Y22                         // 62c2f52c7130
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y22                 // 62e2f52c71b45a0f000000
-       //TODO: VPSHLDVQ Y17, Y14, K4, Y22                         // 62a28d2c71f1
-       //TODO: VPSHLDVQ Y7, Y14, K4, Y22                          // 62e28d2c71f7
-       //TODO: VPSHLDVQ Y9, Y14, K4, Y22                          // 62c28d2c71f1
-       //TODO: VPSHLDVQ (R8), Y14, K4, Y22                        // 62c28d2c7130
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y22                // 62e28d2c71b45a0f000000
-       //TODO: VPSHLDVQ Y17, Y12, K4, Y13                         // 62329d2c71e9
-       //TODO: VPSHLDVQ Y7, Y12, K4, Y13                          // 62729d2c71ef
-       //TODO: VPSHLDVQ Y9, Y12, K4, Y13                          // 62529d2c71e9
-       //TODO: VPSHLDVQ (R8), Y12, K4, Y13                        // 62529d2c7128
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y13                // 62729d2c71ac5a0f000000
-       //TODO: VPSHLDVQ Y17, Y1, K4, Y13                          // 6232f52c71e9
-       //TODO: VPSHLDVQ Y7, Y1, K4, Y13                           // 6272f52c71ef
-       //TODO: VPSHLDVQ Y9, Y1, K4, Y13                           // 6252f52c71e9
-       //TODO: VPSHLDVQ (R8), Y1, K4, Y13                         // 6252f52c7128
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y13                 // 6272f52c71ac5a0f000000
-       //TODO: VPSHLDVQ Y17, Y14, K4, Y13                         // 62328d2c71e9
-       //TODO: VPSHLDVQ Y7, Y14, K4, Y13                          // 62728d2c71ef
-       //TODO: VPSHLDVQ Y9, Y14, K4, Y13                          // 62528d2c71e9
-       //TODO: VPSHLDVQ (R8), Y14, K4, Y13                        // 62528d2c7128
-       //TODO: VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y13                // 62728d2c71ac5a0f000000
-       //TODO: VPSHLDVQ Z0, Z6, K4, Z1                            // 62f2cd4c71c8
-       //TODO: VPSHLDVQ Z8, Z6, K4, Z1                            // 62d2cd4c71c8
-       //TODO: VPSHLDVQ (R14), Z6, K4, Z1                         // 62d2cd4c710e
-       //TODO: VPSHLDVQ -7(DI)(R8*8), Z6, K4, Z1                  // 62b2cd4c718cc7f9ffffff
-       //TODO: VPSHLDVQ Z0, Z2, K4, Z1                            // 62f2ed4c71c8
-       //TODO: VPSHLDVQ Z8, Z2, K4, Z1                            // 62d2ed4c71c8
-       //TODO: VPSHLDVQ (R14), Z2, K4, Z1                         // 62d2ed4c710e
-       //TODO: VPSHLDVQ -7(DI)(R8*8), Z2, K4, Z1                  // 62b2ed4c718cc7f9ffffff
-       //TODO: VPSHLDVQ Z0, Z6, K4, Z16                           // 62e2cd4c71c0
-       //TODO: VPSHLDVQ Z8, Z6, K4, Z16                           // 62c2cd4c71c0
-       //TODO: VPSHLDVQ (R14), Z6, K4, Z16                        // 62c2cd4c7106
-       //TODO: VPSHLDVQ -7(DI)(R8*8), Z6, K4, Z16                 // 62a2cd4c7184c7f9ffffff
-       //TODO: VPSHLDVQ Z0, Z2, K4, Z16                           // 62e2ed4c71c0
-       //TODO: VPSHLDVQ Z8, Z2, K4, Z16                           // 62c2ed4c71c0
-       //TODO: VPSHLDVQ (R14), Z2, K4, Z16                        // 62c2ed4c7106
-       //TODO: VPSHLDVQ -7(DI)(R8*8), Z2, K4, Z16                 // 62a2ed4c7184c7f9ffffff
-       //TODO: VPSHLDVW X18, X9, K7, X13                          // 6232b50f70ea
-       //TODO: VPSHLDVW X21, X9, K7, X13                          // 6232b50f70ed
-       //TODO: VPSHLDVW X1, X9, K7, X13                           // 6272b50f70e9
-       //TODO: VPSHLDVW -17(BP)(SI*8), X9, K7, X13                // 6272b50f70acf5efffffff
-       //TODO: VPSHLDVW (R15), X9, K7, X13                        // 6252b50f702f
-       //TODO: VPSHLDVW X18, X15, K7, X13                         // 6232850f70ea
-       //TODO: VPSHLDVW X21, X15, K7, X13                         // 6232850f70ed
-       //TODO: VPSHLDVW X1, X15, K7, X13                          // 6272850f70e9
-       //TODO: VPSHLDVW -17(BP)(SI*8), X15, K7, X13               // 6272850f70acf5efffffff
-       //TODO: VPSHLDVW (R15), X15, K7, X13                       // 6252850f702f
-       //TODO: VPSHLDVW X18, X26, K7, X13                         // 6232ad0770ea
-       //TODO: VPSHLDVW X21, X26, K7, X13                         // 6232ad0770ed
-       //TODO: VPSHLDVW X1, X26, K7, X13                          // 6272ad0770e9
-       //TODO: VPSHLDVW -17(BP)(SI*8), X26, K7, X13               // 6272ad0770acf5efffffff
-       //TODO: VPSHLDVW (R15), X26, K7, X13                       // 6252ad07702f
-       //TODO: VPSHLDVW X18, X9, K7, X28                          // 6222b50f70e2
-       //TODO: VPSHLDVW X21, X9, K7, X28                          // 6222b50f70e5
-       //TODO: VPSHLDVW X1, X9, K7, X28                           // 6262b50f70e1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X9, K7, X28                // 6262b50f70a4f5efffffff
-       //TODO: VPSHLDVW (R15), X9, K7, X28                        // 6242b50f7027
-       //TODO: VPSHLDVW X18, X15, K7, X28                         // 6222850f70e2
-       //TODO: VPSHLDVW X21, X15, K7, X28                         // 6222850f70e5
-       //TODO: VPSHLDVW X1, X15, K7, X28                          // 6262850f70e1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X15, K7, X28               // 6262850f70a4f5efffffff
-       //TODO: VPSHLDVW (R15), X15, K7, X28                       // 6242850f7027
-       //TODO: VPSHLDVW X18, X26, K7, X28                         // 6222ad0770e2
-       //TODO: VPSHLDVW X21, X26, K7, X28                         // 6222ad0770e5
-       //TODO: VPSHLDVW X1, X26, K7, X28                          // 6262ad0770e1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X26, K7, X28               // 6262ad0770a4f5efffffff
-       //TODO: VPSHLDVW (R15), X26, K7, X28                       // 6242ad077027
-       //TODO: VPSHLDVW X18, X9, K7, X24                          // 6222b50f70c2
-       //TODO: VPSHLDVW X21, X9, K7, X24                          // 6222b50f70c5
-       //TODO: VPSHLDVW X1, X9, K7, X24                           // 6262b50f70c1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X9, K7, X24                // 6262b50f7084f5efffffff
-       //TODO: VPSHLDVW (R15), X9, K7, X24                        // 6242b50f7007
-       //TODO: VPSHLDVW X18, X15, K7, X24                         // 6222850f70c2
-       //TODO: VPSHLDVW X21, X15, K7, X24                         // 6222850f70c5
-       //TODO: VPSHLDVW X1, X15, K7, X24                          // 6262850f70c1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X15, K7, X24               // 6262850f7084f5efffffff
-       //TODO: VPSHLDVW (R15), X15, K7, X24                       // 6242850f7007
-       //TODO: VPSHLDVW X18, X26, K7, X24                         // 6222ad0770c2
-       //TODO: VPSHLDVW X21, X26, K7, X24                         // 6222ad0770c5
-       //TODO: VPSHLDVW X1, X26, K7, X24                          // 6262ad0770c1
-       //TODO: VPSHLDVW -17(BP)(SI*8), X26, K7, X24               // 6262ad077084f5efffffff
-       //TODO: VPSHLDVW (R15), X26, K7, X24                       // 6242ad077007
-       //TODO: VPSHLDVW Y2, Y28, K2, Y31                          // 62629d2270fa
-       //TODO: VPSHLDVW Y21, Y28, K2, Y31                         // 62229d2270fd
-       //TODO: VPSHLDVW Y12, Y28, K2, Y31                         // 62429d2270fc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y28, K2, Y31                // 62629d2270bc2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y28, K2, Y31                // 62629d2270bcd1f9ffffff
-       //TODO: VPSHLDVW Y2, Y13, K2, Y31                          // 6262952a70fa
-       //TODO: VPSHLDVW Y21, Y13, K2, Y31                         // 6222952a70fd
-       //TODO: VPSHLDVW Y12, Y13, K2, Y31                         // 6242952a70fc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y13, K2, Y31                // 6262952a70bc2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y13, K2, Y31                // 6262952a70bcd1f9ffffff
-       //TODO: VPSHLDVW Y2, Y7, K2, Y31                           // 6262c52a70fa
-       //TODO: VPSHLDVW Y21, Y7, K2, Y31                          // 6222c52a70fd
-       //TODO: VPSHLDVW Y12, Y7, K2, Y31                          // 6242c52a70fc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y7, K2, Y31                 // 6262c52a70bc2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y7, K2, Y31                 // 6262c52a70bcd1f9ffffff
-       //TODO: VPSHLDVW Y2, Y28, K2, Y8                           // 62729d2270c2
-       //TODO: VPSHLDVW Y21, Y28, K2, Y8                          // 62329d2270c5
-       //TODO: VPSHLDVW Y12, Y28, K2, Y8                          // 62529d2270c4
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y28, K2, Y8                 // 62729d2270842c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y28, K2, Y8                 // 62729d227084d1f9ffffff
-       //TODO: VPSHLDVW Y2, Y13, K2, Y8                           // 6272952a70c2
-       //TODO: VPSHLDVW Y21, Y13, K2, Y8                          // 6232952a70c5
-       //TODO: VPSHLDVW Y12, Y13, K2, Y8                          // 6252952a70c4
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y13, K2, Y8                 // 6272952a70842c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y13, K2, Y8                 // 6272952a7084d1f9ffffff
-       //TODO: VPSHLDVW Y2, Y7, K2, Y8                            // 6272c52a70c2
-       //TODO: VPSHLDVW Y21, Y7, K2, Y8                           // 6232c52a70c5
-       //TODO: VPSHLDVW Y12, Y7, K2, Y8                           // 6252c52a70c4
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y7, K2, Y8                  // 6272c52a70842c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y7, K2, Y8                  // 6272c52a7084d1f9ffffff
-       //TODO: VPSHLDVW Y2, Y28, K2, Y1                           // 62f29d2270ca
-       //TODO: VPSHLDVW Y21, Y28, K2, Y1                          // 62b29d2270cd
-       //TODO: VPSHLDVW Y12, Y28, K2, Y1                          // 62d29d2270cc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y28, K2, Y1                 // 62f29d22708c2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y28, K2, Y1                 // 62f29d22708cd1f9ffffff
-       //TODO: VPSHLDVW Y2, Y13, K2, Y1                           // 62f2952a70ca
-       //TODO: VPSHLDVW Y21, Y13, K2, Y1                          // 62b2952a70cd
-       //TODO: VPSHLDVW Y12, Y13, K2, Y1                          // 62d2952a70cc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y13, K2, Y1                 // 62f2952a708c2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y13, K2, Y1                 // 62f2952a708cd1f9ffffff
-       //TODO: VPSHLDVW Y2, Y7, K2, Y1                            // 62f2c52a70ca
-       //TODO: VPSHLDVW Y21, Y7, K2, Y1                           // 62b2c52a70cd
-       //TODO: VPSHLDVW Y12, Y7, K2, Y1                           // 62d2c52a70cc
-       //TODO: VPSHLDVW 17(SP)(BP*1), Y7, K2, Y1                  // 62f2c52a708c2c11000000
-       //TODO: VPSHLDVW -7(CX)(DX*8), Y7, K2, Y1                  // 62f2c52a708cd1f9ffffff
-       //TODO: VPSHLDVW Z11, Z14, K5, Z15                         // 62528d4d70fb
-       //TODO: VPSHLDVW Z5, Z14, K5, Z15                          // 62728d4d70fd
-       //TODO: VPSHLDVW 99(R15)(R15*4), Z14, K5, Z15              // 62128d4d70bcbf63000000
-       //TODO: VPSHLDVW 15(DX), Z14, K5, Z15                      // 62728d4d70ba0f000000
-       //TODO: VPSHLDVW Z11, Z27, K5, Z15                         // 6252a54570fb
-       //TODO: VPSHLDVW Z5, Z27, K5, Z15                          // 6272a54570fd
-       //TODO: VPSHLDVW 99(R15)(R15*4), Z27, K5, Z15              // 6212a54570bcbf63000000
-       //TODO: VPSHLDVW 15(DX), Z27, K5, Z15                      // 6272a54570ba0f000000
-       //TODO: VPSHLDVW Z11, Z14, K5, Z12                         // 62528d4d70e3
-       //TODO: VPSHLDVW Z5, Z14, K5, Z12                          // 62728d4d70e5
-       //TODO: VPSHLDVW 99(R15)(R15*4), Z14, K5, Z12              // 62128d4d70a4bf63000000
-       //TODO: VPSHLDVW 15(DX), Z14, K5, Z12                      // 62728d4d70a20f000000
-       //TODO: VPSHLDVW Z11, Z27, K5, Z12                         // 6252a54570e3
-       //TODO: VPSHLDVW Z5, Z27, K5, Z12                          // 6272a54570e5
-       //TODO: VPSHLDVW 99(R15)(R15*4), Z27, K5, Z12              // 6212a54570a4bf63000000
-       //TODO: VPSHLDVW 15(DX), Z27, K5, Z12                      // 6272a54570a20f000000
-       //TODO: VPSHLDW $65, X24, X7, K3, X11                      // 6213c50b70d841
-       //TODO: VPSHLDW $65, X20, X7, K3, X11                      // 6233c50b70dc41
-       //TODO: VPSHLDW $65, X7, X7, K3, X11                       // 6273c50b70df41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X7, K3, X11              // 6273c50b709cfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X7, K3, X11                 // 6253c50b709ef1ffffff41
-       //TODO: VPSHLDW $65, X24, X0, K3, X11                      // 6213fd0b70d841
-       //TODO: VPSHLDW $65, X20, X0, K3, X11                      // 6233fd0b70dc41
-       //TODO: VPSHLDW $65, X7, X0, K3, X11                       // 6273fd0b70df41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X0, K3, X11              // 6273fd0b709cfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X0, K3, X11                 // 6253fd0b709ef1ffffff41
-       //TODO: VPSHLDW $65, X24, X7, K3, X31                      // 6203c50b70f841
-       //TODO: VPSHLDW $65, X20, X7, K3, X31                      // 6223c50b70fc41
-       //TODO: VPSHLDW $65, X7, X7, K3, X31                       // 6263c50b70ff41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X7, K3, X31              // 6263c50b70bcfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X7, K3, X31                 // 6243c50b70bef1ffffff41
-       //TODO: VPSHLDW $65, X24, X0, K3, X31                      // 6203fd0b70f841
-       //TODO: VPSHLDW $65, X20, X0, K3, X31                      // 6223fd0b70fc41
-       //TODO: VPSHLDW $65, X7, X0, K3, X31                       // 6263fd0b70ff41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X0, K3, X31              // 6263fd0b70bcfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X0, K3, X31                 // 6243fd0b70bef1ffffff41
-       //TODO: VPSHLDW $65, X24, X7, K3, X3                       // 6293c50b70d841
-       //TODO: VPSHLDW $65, X20, X7, K3, X3                       // 62b3c50b70dc41
-       //TODO: VPSHLDW $65, X7, X7, K3, X3                        // 62f3c50b70df41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X7, K3, X3               // 62f3c50b709cfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X7, K3, X3                  // 62d3c50b709ef1ffffff41
-       //TODO: VPSHLDW $65, X24, X0, K3, X3                       // 6293fd0b70d841
-       //TODO: VPSHLDW $65, X20, X0, K3, X3                       // 62b3fd0b70dc41
-       //TODO: VPSHLDW $65, X7, X0, K3, X3                        // 62f3fd0b70df41
-       //TODO: VPSHLDW $65, 7(SI)(DI*8), X0, K3, X3               // 62f3fd0b709cfe0700000041
-       //TODO: VPSHLDW $65, -15(R14), X0, K3, X3                  // 62d3fd0b709ef1ffffff41
-       //TODO: VPSHLDW $67, Y12, Y3, K4, Y9                       // 6253e52c70cc43
-       //TODO: VPSHLDW $67, Y21, Y3, K4, Y9                       // 6233e52c70cd43
-       //TODO: VPSHLDW $67, Y14, Y3, K4, Y9                       // 6253e52c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y3, K4, Y9             // 6273e52c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y3, K4, Y9               // 6273e52c708c480700000043
-       //TODO: VPSHLDW $67, Y12, Y2, K4, Y9                       // 6253ed2c70cc43
-       //TODO: VPSHLDW $67, Y21, Y2, K4, Y9                       // 6233ed2c70cd43
-       //TODO: VPSHLDW $67, Y14, Y2, K4, Y9                       // 6253ed2c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y2, K4, Y9             // 6273ed2c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y2, K4, Y9               // 6273ed2c708c480700000043
-       //TODO: VPSHLDW $67, Y12, Y9, K4, Y9                       // 6253b52c70cc43
-       //TODO: VPSHLDW $67, Y21, Y9, K4, Y9                       // 6233b52c70cd43
-       //TODO: VPSHLDW $67, Y14, Y9, K4, Y9                       // 6253b52c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y9, K4, Y9             // 6273b52c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y9, K4, Y9               // 6273b52c708c480700000043
-       //TODO: VPSHLDW $67, Y12, Y3, K4, Y1                       // 62d3e52c70cc43
-       //TODO: VPSHLDW $67, Y21, Y3, K4, Y1                       // 62b3e52c70cd43
-       //TODO: VPSHLDW $67, Y14, Y3, K4, Y1                       // 62d3e52c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y3, K4, Y1             // 62f3e52c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y3, K4, Y1               // 62f3e52c708c480700000043
-       //TODO: VPSHLDW $67, Y12, Y2, K4, Y1                       // 62d3ed2c70cc43
-       //TODO: VPSHLDW $67, Y21, Y2, K4, Y1                       // 62b3ed2c70cd43
-       //TODO: VPSHLDW $67, Y14, Y2, K4, Y1                       // 62d3ed2c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y2, K4, Y1             // 62f3ed2c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y2, K4, Y1               // 62f3ed2c708c480700000043
-       //TODO: VPSHLDW $67, Y12, Y9, K4, Y1                       // 62d3b52c70cc43
-       //TODO: VPSHLDW $67, Y21, Y9, K4, Y1                       // 62b3b52c70cd43
-       //TODO: VPSHLDW $67, Y14, Y9, K4, Y1                       // 62d3b52c70ce43
-       //TODO: VPSHLDW $67, -17(BP)(SI*2), Y9, K4, Y1             // 62f3b52c708c75efffffff43
-       //TODO: VPSHLDW $67, 7(AX)(CX*2), Y9, K4, Y1               // 62f3b52c708c480700000043
-       //TODO: VPSHLDW $127, Z2, Z5, K2, Z13                      // 6273d54a70ea7f
-       //TODO: VPSHLDW $127, (CX), Z5, K2, Z13                    // 6273d54a70297f
-       //TODO: VPSHLDW $127, 99(R15), Z5, K2, Z13                 // 6253d54a70af630000007f
-       //TODO: VPSHLDW $127, Z2, Z23, K2, Z13                     // 6273c54270ea7f
-       //TODO: VPSHLDW $127, (CX), Z23, K2, Z13                   // 6273c54270297f
-       //TODO: VPSHLDW $127, 99(R15), Z23, K2, Z13                // 6253c54270af630000007f
-       //TODO: VPSHLDW $127, Z2, Z5, K2, Z14                      // 6273d54a70f27f
-       //TODO: VPSHLDW $127, (CX), Z5, K2, Z14                    // 6273d54a70317f
-       //TODO: VPSHLDW $127, 99(R15), Z5, K2, Z14                 // 6253d54a70b7630000007f
-       //TODO: VPSHLDW $127, Z2, Z23, K2, Z14                     // 6273c54270f27f
-       //TODO: VPSHLDW $127, (CX), Z23, K2, Z14                   // 6273c54270317f
-       //TODO: VPSHLDW $127, 99(R15), Z23, K2, Z14                // 6253c54270b7630000007f
-       //TODO: VPSHRDD $0, X21, X5, K2, X9                        // 6233550a73cd00
-       //TODO: VPSHRDD $0, X1, X5, K2, X9                         // 6273550a73c900
-       //TODO: VPSHRDD $0, X11, X5, K2, X9                        // 6253550a73cb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X5, K2, X9                // 6273550a738c3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X5, K2, X9               // 6273550a738cda0f00000000
-       //TODO: VPSHRDD $0, X21, X31, K2, X9                       // 6233050273cd00
-       //TODO: VPSHRDD $0, X1, X31, K2, X9                        // 6273050273c900
-       //TODO: VPSHRDD $0, X11, X31, K2, X9                       // 6253050273cb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X31, K2, X9               // 62730502738c3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X31, K2, X9              // 62730502738cda0f00000000
-       //TODO: VPSHRDD $0, X21, X3, K2, X9                        // 6233650a73cd00
-       //TODO: VPSHRDD $0, X1, X3, K2, X9                         // 6273650a73c900
-       //TODO: VPSHRDD $0, X11, X3, K2, X9                        // 6253650a73cb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X3, K2, X9                // 6273650a738c3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X3, K2, X9               // 6273650a738cda0f00000000
-       //TODO: VPSHRDD $0, X21, X5, K2, X7                        // 62b3550a73fd00
-       //TODO: VPSHRDD $0, X1, X5, K2, X7                         // 62f3550a73f900
-       //TODO: VPSHRDD $0, X11, X5, K2, X7                        // 62d3550a73fb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X5, K2, X7                // 62f3550a73bc3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X5, K2, X7               // 62f3550a73bcda0f00000000
-       //TODO: VPSHRDD $0, X21, X31, K2, X7                       // 62b3050273fd00
-       //TODO: VPSHRDD $0, X1, X31, K2, X7                        // 62f3050273f900
-       //TODO: VPSHRDD $0, X11, X31, K2, X7                       // 62d3050273fb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X31, K2, X7               // 62f3050273bc3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X31, K2, X7              // 62f3050273bcda0f00000000
-       //TODO: VPSHRDD $0, X21, X3, K2, X7                        // 62b3650a73fd00
-       //TODO: VPSHRDD $0, X1, X3, K2, X7                         // 62f3650a73f900
-       //TODO: VPSHRDD $0, X11, X3, K2, X7                        // 62d3650a73fb00
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X3, K2, X7                // 62f3650a73bc3e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X3, K2, X7               // 62f3650a73bcda0f00000000
-       //TODO: VPSHRDD $0, X21, X5, K2, X14                       // 6233550a73f500
-       //TODO: VPSHRDD $0, X1, X5, K2, X14                        // 6273550a73f100
-       //TODO: VPSHRDD $0, X11, X5, K2, X14                       // 6253550a73f300
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X5, K2, X14               // 6273550a73b43e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X5, K2, X14              // 6273550a73b4da0f00000000
-       //TODO: VPSHRDD $0, X21, X31, K2, X14                      // 6233050273f500
-       //TODO: VPSHRDD $0, X1, X31, K2, X14                       // 6273050273f100
-       //TODO: VPSHRDD $0, X11, X31, K2, X14                      // 6253050273f300
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X31, K2, X14              // 6273050273b43e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X31, K2, X14             // 6273050273b4da0f00000000
-       //TODO: VPSHRDD $0, X21, X3, K2, X14                       // 6233650a73f500
-       //TODO: VPSHRDD $0, X1, X3, K2, X14                        // 6273650a73f100
-       //TODO: VPSHRDD $0, X11, X3, K2, X14                       // 6253650a73f300
-       //TODO: VPSHRDD $0, 7(SI)(DI*1), X3, K2, X14               // 6273650a73b43e0700000000
-       //TODO: VPSHRDD $0, 15(DX)(BX*8), X3, K2, X14              // 6273650a73b4da0f00000000
-       //TODO: VPSHRDD $97, Y31, Y16, K3, Y30                     // 62037d2373f761
-       //TODO: VPSHRDD $97, Y22, Y16, K3, Y30                     // 62237d2373f661
-       //TODO: VPSHRDD $97, Y6, Y16, K3, Y30                      // 62637d2373f661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y30           // 62037d2373b4300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y30           // 62037d2373b4700f00000061
-       //TODO: VPSHRDD $97, Y31, Y1, K3, Y30                      // 6203752b73f761
-       //TODO: VPSHRDD $97, Y22, Y1, K3, Y30                      // 6223752b73f661
-       //TODO: VPSHRDD $97, Y6, Y1, K3, Y30                       // 6263752b73f661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y30            // 6203752b73b4300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y30            // 6203752b73b4700f00000061
-       //TODO: VPSHRDD $97, Y31, Y30, K3, Y30                     // 62030d2373f761
-       //TODO: VPSHRDD $97, Y22, Y30, K3, Y30                     // 62230d2373f661
-       //TODO: VPSHRDD $97, Y6, Y30, K3, Y30                      // 62630d2373f661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y30           // 62030d2373b4300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y30           // 62030d2373b4700f00000061
-       //TODO: VPSHRDD $97, Y31, Y16, K3, Y26                     // 62037d2373d761
-       //TODO: VPSHRDD $97, Y22, Y16, K3, Y26                     // 62237d2373d661
-       //TODO: VPSHRDD $97, Y6, Y16, K3, Y26                      // 62637d2373d661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y26           // 62037d237394300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y26           // 62037d237394700f00000061
-       //TODO: VPSHRDD $97, Y31, Y1, K3, Y26                      // 6203752b73d761
-       //TODO: VPSHRDD $97, Y22, Y1, K3, Y26                      // 6223752b73d661
-       //TODO: VPSHRDD $97, Y6, Y1, K3, Y26                       // 6263752b73d661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y26            // 6203752b7394300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y26            // 6203752b7394700f00000061
-       //TODO: VPSHRDD $97, Y31, Y30, K3, Y26                     // 62030d2373d761
-       //TODO: VPSHRDD $97, Y22, Y30, K3, Y26                     // 62230d2373d661
-       //TODO: VPSHRDD $97, Y6, Y30, K3, Y26                      // 62630d2373d661
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y26           // 62030d237394300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y26           // 62030d237394700f00000061
-       //TODO: VPSHRDD $97, Y31, Y16, K3, Y7                      // 62937d2373ff61
-       //TODO: VPSHRDD $97, Y22, Y16, K3, Y7                      // 62b37d2373fe61
-       //TODO: VPSHRDD $97, Y6, Y16, K3, Y7                       // 62f37d2373fe61
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y7            // 62937d2373bc300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y7            // 62937d2373bc700f00000061
-       //TODO: VPSHRDD $97, Y31, Y1, K3, Y7                       // 6293752b73ff61
-       //TODO: VPSHRDD $97, Y22, Y1, K3, Y7                       // 62b3752b73fe61
-       //TODO: VPSHRDD $97, Y6, Y1, K3, Y7                        // 62f3752b73fe61
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y7             // 6293752b73bc300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y7             // 6293752b73bc700f00000061
-       //TODO: VPSHRDD $97, Y31, Y30, K3, Y7                      // 62930d2373ff61
-       //TODO: VPSHRDD $97, Y22, Y30, K3, Y7                      // 62b30d2373fe61
-       //TODO: VPSHRDD $97, Y6, Y30, K3, Y7                       // 62f30d2373fe61
-       //TODO: VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y7            // 62930d2373bc300f00000061
-       //TODO: VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y7            // 62930d2373bc700f00000061
-       //TODO: VPSHRDD $81, Z28, Z26, K3, Z6                      // 62932d4373f451
-       //TODO: VPSHRDD $81, Z6, Z26, K3, Z6                       // 62f32d4373f651
-       //TODO: VPSHRDD $81, 99(R15)(R15*2), Z26, K3, Z6           // 62932d4373b47f6300000051
-       //TODO: VPSHRDD $81, -7(DI), Z26, K3, Z6                   // 62f32d4373b7f9ffffff51
-       //TODO: VPSHRDD $81, Z28, Z14, K3, Z6                      // 62930d4b73f451
-       //TODO: VPSHRDD $81, Z6, Z14, K3, Z6                       // 62f30d4b73f651
-       //TODO: VPSHRDD $81, 99(R15)(R15*2), Z14, K3, Z6           // 62930d4b73b47f6300000051
-       //TODO: VPSHRDD $81, -7(DI), Z14, K3, Z6                   // 62f30d4b73b7f9ffffff51
-       //TODO: VPSHRDD $81, Z28, Z26, K3, Z14                     // 62132d4373f451
-       //TODO: VPSHRDD $81, Z6, Z26, K3, Z14                      // 62732d4373f651
-       //TODO: VPSHRDD $81, 99(R15)(R15*2), Z26, K3, Z14          // 62132d4373b47f6300000051
-       //TODO: VPSHRDD $81, -7(DI), Z26, K3, Z14                  // 62732d4373b7f9ffffff51
-       //TODO: VPSHRDD $81, Z28, Z14, K3, Z14                     // 62130d4b73f451
-       //TODO: VPSHRDD $81, Z6, Z14, K3, Z14                      // 62730d4b73f651
-       //TODO: VPSHRDD $81, 99(R15)(R15*2), Z14, K3, Z14          // 62130d4b73b47f6300000051
-       //TODO: VPSHRDD $81, -7(DI), Z14, K3, Z14                  // 62730d4b73b7f9ffffff51
-       //TODO: VPSHRDQ $42, X14, X16, K3, X13                     // 6253fd0373ee2a
-       //TODO: VPSHRDQ $42, X19, X16, K3, X13                     // 6233fd0373eb2a
-       //TODO: VPSHRDQ $42, X8, X16, K3, X13                      // 6253fd0373e82a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X13            // 6233fd0373ac07f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X16, K3, X13                    // 6273fd03732c242a
-       //TODO: VPSHRDQ $42, X14, X14, K3, X13                     // 62538d0b73ee2a
-       //TODO: VPSHRDQ $42, X19, X14, K3, X13                     // 62338d0b73eb2a
-       //TODO: VPSHRDQ $42, X8, X14, K3, X13                      // 62538d0b73e82a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X13            // 62338d0b73ac07f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X14, K3, X13                    // 62738d0b732c242a
-       //TODO: VPSHRDQ $42, X14, X11, K3, X13                     // 6253a50b73ee2a
-       //TODO: VPSHRDQ $42, X19, X11, K3, X13                     // 6233a50b73eb2a
-       //TODO: VPSHRDQ $42, X8, X11, K3, X13                      // 6253a50b73e82a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X13            // 6233a50b73ac07f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X11, K3, X13                    // 6273a50b732c242a
-       //TODO: VPSHRDQ $42, X14, X16, K3, X0                      // 62d3fd0373c62a
-       //TODO: VPSHRDQ $42, X19, X16, K3, X0                      // 62b3fd0373c32a
-       //TODO: VPSHRDQ $42, X8, X16, K3, X0                       // 62d3fd0373c02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X0             // 62b3fd03738407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X16, K3, X0                     // 62f3fd037304242a
-       //TODO: VPSHRDQ $42, X14, X14, K3, X0                      // 62d38d0b73c62a
-       //TODO: VPSHRDQ $42, X19, X14, K3, X0                      // 62b38d0b73c32a
-       //TODO: VPSHRDQ $42, X8, X14, K3, X0                       // 62d38d0b73c02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X0             // 62b38d0b738407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X14, K3, X0                     // 62f38d0b7304242a
-       //TODO: VPSHRDQ $42, X14, X11, K3, X0                      // 62d3a50b73c62a
-       //TODO: VPSHRDQ $42, X19, X11, K3, X0                      // 62b3a50b73c32a
-       //TODO: VPSHRDQ $42, X8, X11, K3, X0                       // 62d3a50b73c02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X0             // 62b3a50b738407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X11, K3, X0                     // 62f3a50b7304242a
-       //TODO: VPSHRDQ $42, X14, X16, K3, X30                     // 6243fd0373f62a
-       //TODO: VPSHRDQ $42, X19, X16, K3, X30                     // 6223fd0373f32a
-       //TODO: VPSHRDQ $42, X8, X16, K3, X30                      // 6243fd0373f02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X30            // 6223fd0373b407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X16, K3, X30                    // 6263fd037334242a
-       //TODO: VPSHRDQ $42, X14, X14, K3, X30                     // 62438d0b73f62a
-       //TODO: VPSHRDQ $42, X19, X14, K3, X30                     // 62238d0b73f32a
-       //TODO: VPSHRDQ $42, X8, X14, K3, X30                      // 62438d0b73f02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X30            // 62238d0b73b407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X14, K3, X30                    // 62638d0b7334242a
-       //TODO: VPSHRDQ $42, X14, X11, K3, X30                     // 6243a50b73f62a
-       //TODO: VPSHRDQ $42, X19, X11, K3, X30                     // 6223a50b73f32a
-       //TODO: VPSHRDQ $42, X8, X11, K3, X30                      // 6243a50b73f02a
-       //TODO: VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X30            // 6223a50b73b407f9ffffff2a
-       //TODO: VPSHRDQ $42, (SP), X11, K3, X30                    // 6263a50b7334242a
-       //TODO: VPSHRDQ $79, Y24, Y28, K2, Y21                     // 62839d2273e84f
-       //TODO: VPSHRDQ $79, Y13, Y28, K2, Y21                     // 62c39d2273ed4f
-       //TODO: VPSHRDQ $79, Y20, Y28, K2, Y21                     // 62a39d2273ec4f
-       //TODO: VPSHRDQ $79, (R14), Y28, K2, Y21                   // 62c39d22732e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y21            // 62a39d2273acc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y20, K2, Y21                     // 6283dd2273e84f
-       //TODO: VPSHRDQ $79, Y13, Y20, K2, Y21                     // 62c3dd2273ed4f
-       //TODO: VPSHRDQ $79, Y20, Y20, K2, Y21                     // 62a3dd2273ec4f
-       //TODO: VPSHRDQ $79, (R14), Y20, K2, Y21                   // 62c3dd22732e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y21            // 62a3dd2273acc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y14, K2, Y21                     // 62838d2a73e84f
-       //TODO: VPSHRDQ $79, Y13, Y14, K2, Y21                     // 62c38d2a73ed4f
-       //TODO: VPSHRDQ $79, Y20, Y14, K2, Y21                     // 62a38d2a73ec4f
-       //TODO: VPSHRDQ $79, (R14), Y14, K2, Y21                   // 62c38d2a732e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y21            // 62a38d2a73acc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y28, K2, Y7                      // 62939d2273f84f
-       //TODO: VPSHRDQ $79, Y13, Y28, K2, Y7                      // 62d39d2273fd4f
-       //TODO: VPSHRDQ $79, Y20, Y28, K2, Y7                      // 62b39d2273fc4f
-       //TODO: VPSHRDQ $79, (R14), Y28, K2, Y7                    // 62d39d22733e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y7             // 62b39d2273bcc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y20, K2, Y7                      // 6293dd2273f84f
-       //TODO: VPSHRDQ $79, Y13, Y20, K2, Y7                      // 62d3dd2273fd4f
-       //TODO: VPSHRDQ $79, Y20, Y20, K2, Y7                      // 62b3dd2273fc4f
-       //TODO: VPSHRDQ $79, (R14), Y20, K2, Y7                    // 62d3dd22733e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y7             // 62b3dd2273bcc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y14, K2, Y7                      // 62938d2a73f84f
-       //TODO: VPSHRDQ $79, Y13, Y14, K2, Y7                      // 62d38d2a73fd4f
-       //TODO: VPSHRDQ $79, Y20, Y14, K2, Y7                      // 62b38d2a73fc4f
-       //TODO: VPSHRDQ $79, (R14), Y14, K2, Y7                    // 62d38d2a733e4f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y7             // 62b38d2a73bcc7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y28, K2, Y0                      // 62939d2273c04f
-       //TODO: VPSHRDQ $79, Y13, Y28, K2, Y0                      // 62d39d2273c54f
-       //TODO: VPSHRDQ $79, Y20, Y28, K2, Y0                      // 62b39d2273c44f
-       //TODO: VPSHRDQ $79, (R14), Y28, K2, Y0                    // 62d39d2273064f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y0             // 62b39d227384c7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y20, K2, Y0                      // 6293dd2273c04f
-       //TODO: VPSHRDQ $79, Y13, Y20, K2, Y0                      // 62d3dd2273c54f
-       //TODO: VPSHRDQ $79, Y20, Y20, K2, Y0                      // 62b3dd2273c44f
-       //TODO: VPSHRDQ $79, (R14), Y20, K2, Y0                    // 62d3dd2273064f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y0             // 62b3dd227384c7f9ffffff4f
-       //TODO: VPSHRDQ $79, Y24, Y14, K2, Y0                      // 62938d2a73c04f
-       //TODO: VPSHRDQ $79, Y13, Y14, K2, Y0                      // 62d38d2a73c54f
-       //TODO: VPSHRDQ $79, Y20, Y14, K2, Y0                      // 62b38d2a73c44f
-       //TODO: VPSHRDQ $79, (R14), Y14, K2, Y0                    // 62d38d2a73064f
-       //TODO: VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y0             // 62b38d2a7384c7f9ffffff4f
-       //TODO: VPSHRDQ $64, Z3, Z26, K1, Z13                      // 6273ad4173eb40
-       //TODO: VPSHRDQ $64, Z0, Z26, K1, Z13                      // 6273ad4173e840
-       //TODO: VPSHRDQ $64, -7(CX)(DX*1), Z26, K1, Z13            // 6273ad4173ac11f9ffffff40
-       //TODO: VPSHRDQ $64, -15(R14)(R15*4), Z26, K1, Z13         // 6213ad4173acbef1ffffff40
-       //TODO: VPSHRDQ $64, Z3, Z3, K1, Z13                       // 6273e54973eb40
-       //TODO: VPSHRDQ $64, Z0, Z3, K1, Z13                       // 6273e54973e840
-       //TODO: VPSHRDQ $64, -7(CX)(DX*1), Z3, K1, Z13             // 6273e54973ac11f9ffffff40
-       //TODO: VPSHRDQ $64, -15(R14)(R15*4), Z3, K1, Z13          // 6213e54973acbef1ffffff40
-       //TODO: VPSHRDQ $64, Z3, Z26, K1, Z21                      // 62e3ad4173eb40
-       //TODO: VPSHRDQ $64, Z0, Z26, K1, Z21                      // 62e3ad4173e840
-       //TODO: VPSHRDQ $64, -7(CX)(DX*1), Z26, K1, Z21            // 62e3ad4173ac11f9ffffff40
-       //TODO: VPSHRDQ $64, -15(R14)(R15*4), Z26, K1, Z21         // 6283ad4173acbef1ffffff40
-       //TODO: VPSHRDQ $64, Z3, Z3, K1, Z21                       // 62e3e54973eb40
-       //TODO: VPSHRDQ $64, Z0, Z3, K1, Z21                       // 62e3e54973e840
-       //TODO: VPSHRDQ $64, -7(CX)(DX*1), Z3, K1, Z21             // 62e3e54973ac11f9ffffff40
-       //TODO: VPSHRDQ $64, -15(R14)(R15*4), Z3, K1, Z21          // 6283e54973acbef1ffffff40
-       //TODO: VPSHRDVD X23, X12, K2, X8                          // 62321d0a73c7
-       //TODO: VPSHRDVD X11, X12, K2, X8                          // 62521d0a73c3
-       //TODO: VPSHRDVD X31, X12, K2, X8                          // 62121d0a73c7
-       //TODO: VPSHRDVD -7(CX), X12, K2, X8                       // 62721d0a7381f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X12, K2, X8                 // 62721d0a73849a0f000000
-       //TODO: VPSHRDVD X23, X16, K2, X8                          // 62327d0273c7
-       //TODO: VPSHRDVD X11, X16, K2, X8                          // 62527d0273c3
-       //TODO: VPSHRDVD X31, X16, K2, X8                          // 62127d0273c7
-       //TODO: VPSHRDVD -7(CX), X16, K2, X8                       // 62727d027381f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X16, K2, X8                 // 62727d0273849a0f000000
-       //TODO: VPSHRDVD X23, X23, K2, X8                          // 6232450273c7
-       //TODO: VPSHRDVD X11, X23, K2, X8                          // 6252450273c3
-       //TODO: VPSHRDVD X31, X23, K2, X8                          // 6212450273c7
-       //TODO: VPSHRDVD -7(CX), X23, K2, X8                       // 627245027381f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X23, K2, X8                 // 6272450273849a0f000000
-       //TODO: VPSHRDVD X23, X12, K2, X26                         // 62221d0a73d7
-       //TODO: VPSHRDVD X11, X12, K2, X26                         // 62421d0a73d3
-       //TODO: VPSHRDVD X31, X12, K2, X26                         // 62021d0a73d7
-       //TODO: VPSHRDVD -7(CX), X12, K2, X26                      // 62621d0a7391f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X12, K2, X26                // 62621d0a73949a0f000000
-       //TODO: VPSHRDVD X23, X16, K2, X26                         // 62227d0273d7
-       //TODO: VPSHRDVD X11, X16, K2, X26                         // 62427d0273d3
-       //TODO: VPSHRDVD X31, X16, K2, X26                         // 62027d0273d7
-       //TODO: VPSHRDVD -7(CX), X16, K2, X26                      // 62627d027391f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X16, K2, X26                // 62627d0273949a0f000000
-       //TODO: VPSHRDVD X23, X23, K2, X26                         // 6222450273d7
-       //TODO: VPSHRDVD X11, X23, K2, X26                         // 6242450273d3
-       //TODO: VPSHRDVD X31, X23, K2, X26                         // 6202450273d7
-       //TODO: VPSHRDVD -7(CX), X23, K2, X26                      // 626245027391f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X23, K2, X26                // 6262450273949a0f000000
-       //TODO: VPSHRDVD X23, X12, K2, X23                         // 62a21d0a73ff
-       //TODO: VPSHRDVD X11, X12, K2, X23                         // 62c21d0a73fb
-       //TODO: VPSHRDVD X31, X12, K2, X23                         // 62821d0a73ff
-       //TODO: VPSHRDVD -7(CX), X12, K2, X23                      // 62e21d0a73b9f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X12, K2, X23                // 62e21d0a73bc9a0f000000
-       //TODO: VPSHRDVD X23, X16, K2, X23                         // 62a27d0273ff
-       //TODO: VPSHRDVD X11, X16, K2, X23                         // 62c27d0273fb
-       //TODO: VPSHRDVD X31, X16, K2, X23                         // 62827d0273ff
-       //TODO: VPSHRDVD -7(CX), X16, K2, X23                      // 62e27d0273b9f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X16, K2, X23                // 62e27d0273bc9a0f000000
-       //TODO: VPSHRDVD X23, X23, K2, X23                         // 62a2450273ff
-       //TODO: VPSHRDVD X11, X23, K2, X23                         // 62c2450273fb
-       //TODO: VPSHRDVD X31, X23, K2, X23                         // 6282450273ff
-       //TODO: VPSHRDVD -7(CX), X23, K2, X23                      // 62e2450273b9f9ffffff
-       //TODO: VPSHRDVD 15(DX)(BX*4), X23, K2, X23                // 62e2450273bc9a0f000000
-       //TODO: VPSHRDVD Y22, Y26, K1, Y14                         // 62322d2173f6
-       //TODO: VPSHRDVD Y3, Y26, K1, Y14                          // 62722d2173f3
-       //TODO: VPSHRDVD Y15, Y26, K1, Y14                         // 62522d2173f7
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y26, K1, Y14              // 62122d2173b4bf63000000
-       //TODO: VPSHRDVD 15(DX), Y26, K1, Y14                      // 62722d2173b20f000000
-       //TODO: VPSHRDVD Y22, Y30, K1, Y14                         // 62320d2173f6
-       //TODO: VPSHRDVD Y3, Y30, K1, Y14                          // 62720d2173f3
-       //TODO: VPSHRDVD Y15, Y30, K1, Y14                         // 62520d2173f7
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y30, K1, Y14              // 62120d2173b4bf63000000
-       //TODO: VPSHRDVD 15(DX), Y30, K1, Y14                      // 62720d2173b20f000000
-       //TODO: VPSHRDVD Y22, Y12, K1, Y14                         // 62321d2973f6
-       //TODO: VPSHRDVD Y3, Y12, K1, Y14                          // 62721d2973f3
-       //TODO: VPSHRDVD Y15, Y12, K1, Y14                         // 62521d2973f7
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y12, K1, Y14              // 62121d2973b4bf63000000
-       //TODO: VPSHRDVD 15(DX), Y12, K1, Y14                      // 62721d2973b20f000000
-       //TODO: VPSHRDVD Y22, Y26, K1, Y21                         // 62a22d2173ee
-       //TODO: VPSHRDVD Y3, Y26, K1, Y21                          // 62e22d2173eb
-       //TODO: VPSHRDVD Y15, Y26, K1, Y21                         // 62c22d2173ef
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y26, K1, Y21              // 62822d2173acbf63000000
-       //TODO: VPSHRDVD 15(DX), Y26, K1, Y21                      // 62e22d2173aa0f000000
-       //TODO: VPSHRDVD Y22, Y30, K1, Y21                         // 62a20d2173ee
-       //TODO: VPSHRDVD Y3, Y30, K1, Y21                          // 62e20d2173eb
-       //TODO: VPSHRDVD Y15, Y30, K1, Y21                         // 62c20d2173ef
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y30, K1, Y21              // 62820d2173acbf63000000
-       //TODO: VPSHRDVD 15(DX), Y30, K1, Y21                      // 62e20d2173aa0f000000
-       //TODO: VPSHRDVD Y22, Y12, K1, Y21                         // 62a21d2973ee
-       //TODO: VPSHRDVD Y3, Y12, K1, Y21                          // 62e21d2973eb
-       //TODO: VPSHRDVD Y15, Y12, K1, Y21                         // 62c21d2973ef
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y12, K1, Y21              // 62821d2973acbf63000000
-       //TODO: VPSHRDVD 15(DX), Y12, K1, Y21                      // 62e21d2973aa0f000000
-       //TODO: VPSHRDVD Y22, Y26, K1, Y1                          // 62b22d2173ce
-       //TODO: VPSHRDVD Y3, Y26, K1, Y1                           // 62f22d2173cb
-       //TODO: VPSHRDVD Y15, Y26, K1, Y1                          // 62d22d2173cf
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y26, K1, Y1               // 62922d21738cbf63000000
-       //TODO: VPSHRDVD 15(DX), Y26, K1, Y1                       // 62f22d21738a0f000000
-       //TODO: VPSHRDVD Y22, Y30, K1, Y1                          // 62b20d2173ce
-       //TODO: VPSHRDVD Y3, Y30, K1, Y1                           // 62f20d2173cb
-       //TODO: VPSHRDVD Y15, Y30, K1, Y1                          // 62d20d2173cf
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y30, K1, Y1               // 62920d21738cbf63000000
-       //TODO: VPSHRDVD 15(DX), Y30, K1, Y1                       // 62f20d21738a0f000000
-       //TODO: VPSHRDVD Y22, Y12, K1, Y1                          // 62b21d2973ce
-       //TODO: VPSHRDVD Y3, Y12, K1, Y1                           // 62f21d2973cb
-       //TODO: VPSHRDVD Y15, Y12, K1, Y1                          // 62d21d2973cf
-       //TODO: VPSHRDVD 99(R15)(R15*4), Y12, K1, Y1               // 62921d29738cbf63000000
-       //TODO: VPSHRDVD 15(DX), Y12, K1, Y1                       // 62f21d29738a0f000000
-       //TODO: VPSHRDVD Z3, Z11, K7, Z21                          // 62e2254f73eb
-       //TODO: VPSHRDVD Z12, Z11, K7, Z21                         // 62c2254f73ec
-       //TODO: VPSHRDVD 15(DX)(BX*1), Z11, K7, Z21                // 62e2254f73ac1a0f000000
-       //TODO: VPSHRDVD -7(CX)(DX*2), Z11, K7, Z21                // 62e2254f73ac51f9ffffff
-       //TODO: VPSHRDVD Z3, Z25, K7, Z21                          // 62e2354773eb
-       //TODO: VPSHRDVD Z12, Z25, K7, Z21                         // 62c2354773ec
-       //TODO: VPSHRDVD 15(DX)(BX*1), Z25, K7, Z21                // 62e2354773ac1a0f000000
-       //TODO: VPSHRDVD -7(CX)(DX*2), Z25, K7, Z21                // 62e2354773ac51f9ffffff
-       //TODO: VPSHRDVD Z3, Z11, K7, Z13                          // 6272254f73eb
-       //TODO: VPSHRDVD Z12, Z11, K7, Z13                         // 6252254f73ec
-       //TODO: VPSHRDVD 15(DX)(BX*1), Z11, K7, Z13                // 6272254f73ac1a0f000000
-       //TODO: VPSHRDVD -7(CX)(DX*2), Z11, K7, Z13                // 6272254f73ac51f9ffffff
-       //TODO: VPSHRDVD Z3, Z25, K7, Z13                          // 6272354773eb
-       //TODO: VPSHRDVD Z12, Z25, K7, Z13                         // 6252354773ec
-       //TODO: VPSHRDVD 15(DX)(BX*1), Z25, K7, Z13                // 6272354773ac1a0f000000
-       //TODO: VPSHRDVD -7(CX)(DX*2), Z25, K7, Z13                // 6272354773ac51f9ffffff
-       //TODO: VPSHRDVQ X20, X11, K1, X24                         // 6222a50973c4
-       //TODO: VPSHRDVQ X5, X11, K1, X24                          // 6262a50973c5
-       //TODO: VPSHRDVQ X25, X11, K1, X24                         // 6202a50973c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X11, K1, X24              // 6202a5097384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X11, K1, X24                 // 6262a5097384c807000000
-       //TODO: VPSHRDVQ X20, X23, K1, X24                         // 6222c50173c4
-       //TODO: VPSHRDVQ X5, X23, K1, X24                          // 6262c50173c5
-       //TODO: VPSHRDVQ X25, X23, K1, X24                         // 6202c50173c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X23, K1, X24              // 6202c5017384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X23, K1, X24                 // 6262c5017384c807000000
-       //TODO: VPSHRDVQ X20, X2, K1, X24                          // 6222ed0973c4
-       //TODO: VPSHRDVQ X5, X2, K1, X24                           // 6262ed0973c5
-       //TODO: VPSHRDVQ X25, X2, K1, X24                          // 6202ed0973c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X2, K1, X24               // 6202ed097384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X2, K1, X24                  // 6262ed097384c807000000
-       //TODO: VPSHRDVQ X20, X11, K1, X14                         // 6232a50973f4
-       //TODO: VPSHRDVQ X5, X11, K1, X14                          // 6272a50973f5
-       //TODO: VPSHRDVQ X25, X11, K1, X14                         // 6212a50973f1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X11, K1, X14              // 6212a50973b4ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X11, K1, X14                 // 6272a50973b4c807000000
-       //TODO: VPSHRDVQ X20, X23, K1, X14                         // 6232c50173f4
-       //TODO: VPSHRDVQ X5, X23, K1, X14                          // 6272c50173f5
-       //TODO: VPSHRDVQ X25, X23, K1, X14                         // 6212c50173f1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X23, K1, X14              // 6212c50173b4ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X23, K1, X14                 // 6272c50173b4c807000000
-       //TODO: VPSHRDVQ X20, X2, K1, X14                          // 6232ed0973f4
-       //TODO: VPSHRDVQ X5, X2, K1, X14                           // 6272ed0973f5
-       //TODO: VPSHRDVQ X25, X2, K1, X14                          // 6212ed0973f1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X2, K1, X14               // 6212ed0973b4ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X2, K1, X14                  // 6272ed0973b4c807000000
-       //TODO: VPSHRDVQ X20, X11, K1, X0                          // 62b2a50973c4
-       //TODO: VPSHRDVQ X5, X11, K1, X0                           // 62f2a50973c5
-       //TODO: VPSHRDVQ X25, X11, K1, X0                          // 6292a50973c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X11, K1, X0               // 6292a5097384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X11, K1, X0                  // 62f2a5097384c807000000
-       //TODO: VPSHRDVQ X20, X23, K1, X0                          // 62b2c50173c4
-       //TODO: VPSHRDVQ X5, X23, K1, X0                           // 62f2c50173c5
-       //TODO: VPSHRDVQ X25, X23, K1, X0                          // 6292c50173c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X23, K1, X0               // 6292c5017384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X23, K1, X0                  // 62f2c5017384c807000000
-       //TODO: VPSHRDVQ X20, X2, K1, X0                           // 62b2ed0973c4
-       //TODO: VPSHRDVQ X5, X2, K1, X0                            // 62f2ed0973c5
-       //TODO: VPSHRDVQ X25, X2, K1, X0                           // 6292ed0973c1
-       //TODO: VPSHRDVQ 99(R15)(R15*8), X2, K1, X0                // 6292ed097384ff63000000
-       //TODO: VPSHRDVQ 7(AX)(CX*8), X2, K1, X0                   // 62f2ed097384c807000000
-       //TODO: VPSHRDVQ Y21, Y5, K1, Y1                           // 62b2d52973cd
-       //TODO: VPSHRDVQ Y7, Y5, K1, Y1                            // 62f2d52973cf
-       //TODO: VPSHRDVQ Y30, Y5, K1, Y1                           // 6292d52973ce
-       //TODO: VPSHRDVQ (CX), Y5, K1, Y1                          // 62f2d5297309
-       //TODO: VPSHRDVQ 99(R15), Y5, K1, Y1                       // 62d2d529738f63000000
-       //TODO: VPSHRDVQ Y21, Y17, K1, Y1                          // 62b2f52173cd
-       //TODO: VPSHRDVQ Y7, Y17, K1, Y1                           // 62f2f52173cf
-       //TODO: VPSHRDVQ Y30, Y17, K1, Y1                          // 6292f52173ce
-       //TODO: VPSHRDVQ (CX), Y17, K1, Y1                         // 62f2f5217309
-       //TODO: VPSHRDVQ 99(R15), Y17, K1, Y1                      // 62d2f521738f63000000
-       //TODO: VPSHRDVQ Y21, Y13, K1, Y1                          // 62b2952973cd
-       //TODO: VPSHRDVQ Y7, Y13, K1, Y1                           // 62f2952973cf
-       //TODO: VPSHRDVQ Y30, Y13, K1, Y1                          // 6292952973ce
-       //TODO: VPSHRDVQ (CX), Y13, K1, Y1                         // 62f295297309
-       //TODO: VPSHRDVQ 99(R15), Y13, K1, Y1                      // 62d29529738f63000000
-       //TODO: VPSHRDVQ Y21, Y5, K1, Y27                          // 6222d52973dd
-       //TODO: VPSHRDVQ Y7, Y5, K1, Y27                           // 6262d52973df
-       //TODO: VPSHRDVQ Y30, Y5, K1, Y27                          // 6202d52973de
-       //TODO: VPSHRDVQ (CX), Y5, K1, Y27                         // 6262d5297319
-       //TODO: VPSHRDVQ 99(R15), Y5, K1, Y27                      // 6242d529739f63000000
-       //TODO: VPSHRDVQ Y21, Y17, K1, Y27                         // 6222f52173dd
-       //TODO: VPSHRDVQ Y7, Y17, K1, Y27                          // 6262f52173df
-       //TODO: VPSHRDVQ Y30, Y17, K1, Y27                         // 6202f52173de
-       //TODO: VPSHRDVQ (CX), Y17, K1, Y27                        // 6262f5217319
-       //TODO: VPSHRDVQ 99(R15), Y17, K1, Y27                     // 6242f521739f63000000
-       //TODO: VPSHRDVQ Y21, Y13, K1, Y27                         // 6222952973dd
-       //TODO: VPSHRDVQ Y7, Y13, K1, Y27                          // 6262952973df
-       //TODO: VPSHRDVQ Y30, Y13, K1, Y27                         // 6202952973de
-       //TODO: VPSHRDVQ (CX), Y13, K1, Y27                        // 626295297319
-       //TODO: VPSHRDVQ 99(R15), Y13, K1, Y27                     // 62429529739f63000000
-       //TODO: VPSHRDVQ Y21, Y5, K1, Y19                          // 62a2d52973dd
-       //TODO: VPSHRDVQ Y7, Y5, K1, Y19                           // 62e2d52973df
-       //TODO: VPSHRDVQ Y30, Y5, K1, Y19                          // 6282d52973de
-       //TODO: VPSHRDVQ (CX), Y5, K1, Y19                         // 62e2d5297319
-       //TODO: VPSHRDVQ 99(R15), Y5, K1, Y19                      // 62c2d529739f63000000
-       //TODO: VPSHRDVQ Y21, Y17, K1, Y19                         // 62a2f52173dd
-       //TODO: VPSHRDVQ Y7, Y17, K1, Y19                          // 62e2f52173df
-       //TODO: VPSHRDVQ Y30, Y17, K1, Y19                         // 6282f52173de
-       //TODO: VPSHRDVQ (CX), Y17, K1, Y19                        // 62e2f5217319
-       //TODO: VPSHRDVQ 99(R15), Y17, K1, Y19                     // 62c2f521739f63000000
-       //TODO: VPSHRDVQ Y21, Y13, K1, Y19                         // 62a2952973dd
-       //TODO: VPSHRDVQ Y7, Y13, K1, Y19                          // 62e2952973df
-       //TODO: VPSHRDVQ Y30, Y13, K1, Y19                         // 6282952973de
-       //TODO: VPSHRDVQ (CX), Y13, K1, Y19                        // 62e295297319
-       //TODO: VPSHRDVQ 99(R15), Y13, K1, Y19                     // 62c29529739f63000000
-       //TODO: VPSHRDVQ Z23, Z23, K1, Z27                         // 6222c54173df
-       //TODO: VPSHRDVQ Z6, Z23, K1, Z27                          // 6262c54173de
-       //TODO: VPSHRDVQ -17(BP), Z23, K1, Z27                     // 6262c541739defffffff
-       //TODO: VPSHRDVQ -15(R14)(R15*8), Z23, K1, Z27             // 6202c541739cfef1ffffff
-       //TODO: VPSHRDVQ Z23, Z5, K1, Z27                          // 6222d54973df
-       //TODO: VPSHRDVQ Z6, Z5, K1, Z27                           // 6262d54973de
-       //TODO: VPSHRDVQ -17(BP), Z5, K1, Z27                      // 6262d549739defffffff
-       //TODO: VPSHRDVQ -15(R14)(R15*8), Z5, K1, Z27              // 6202d549739cfef1ffffff
-       //TODO: VPSHRDVQ Z23, Z23, K1, Z15                         // 6232c54173ff
-       //TODO: VPSHRDVQ Z6, Z23, K1, Z15                          // 6272c54173fe
-       //TODO: VPSHRDVQ -17(BP), Z23, K1, Z15                     // 6272c54173bdefffffff
-       //TODO: VPSHRDVQ -15(R14)(R15*8), Z23, K1, Z15             // 6212c54173bcfef1ffffff
-       //TODO: VPSHRDVQ Z23, Z5, K1, Z15                          // 6232d54973ff
-       //TODO: VPSHRDVQ Z6, Z5, K1, Z15                           // 6272d54973fe
-       //TODO: VPSHRDVQ -17(BP), Z5, K1, Z15                      // 6272d54973bdefffffff
-       //TODO: VPSHRDVQ -15(R14)(R15*8), Z5, K1, Z15              // 6212d54973bcfef1ffffff
-       //TODO: VPSHRDVW X2, X2, K7, X0                            // 62f2ed0f72c2
-       //TODO: VPSHRDVW X31, X2, K7, X0                           // 6292ed0f72c7
-       //TODO: VPSHRDVW X11, X2, K7, X0                           // 62d2ed0f72c3
-       //TODO: VPSHRDVW (AX), X2, K7, X0                          // 62f2ed0f7200
-       //TODO: VPSHRDVW 7(SI), X2, K7, X0                         // 62f2ed0f728607000000
-       //TODO: VPSHRDVW X2, X8, K7, X0                            // 62f2bd0f72c2
-       //TODO: VPSHRDVW X31, X8, K7, X0                           // 6292bd0f72c7
-       //TODO: VPSHRDVW X11, X8, K7, X0                           // 62d2bd0f72c3
-       //TODO: VPSHRDVW (AX), X8, K7, X0                          // 62f2bd0f7200
-       //TODO: VPSHRDVW 7(SI), X8, K7, X0                         // 62f2bd0f728607000000
-       //TODO: VPSHRDVW X2, X9, K7, X0                            // 62f2b50f72c2
-       //TODO: VPSHRDVW X31, X9, K7, X0                           // 6292b50f72c7
-       //TODO: VPSHRDVW X11, X9, K7, X0                           // 62d2b50f72c3
-       //TODO: VPSHRDVW (AX), X9, K7, X0                          // 62f2b50f7200
-       //TODO: VPSHRDVW 7(SI), X9, K7, X0                         // 62f2b50f728607000000
-       //TODO: VPSHRDVW X2, X2, K7, X9                            // 6272ed0f72ca
-       //TODO: VPSHRDVW X31, X2, K7, X9                           // 6212ed0f72cf
-       //TODO: VPSHRDVW X11, X2, K7, X9                           // 6252ed0f72cb
-       //TODO: VPSHRDVW (AX), X2, K7, X9                          // 6272ed0f7208
-       //TODO: VPSHRDVW 7(SI), X2, K7, X9                         // 6272ed0f728e07000000
-       //TODO: VPSHRDVW X2, X8, K7, X9                            // 6272bd0f72ca
-       //TODO: VPSHRDVW X31, X8, K7, X9                           // 6212bd0f72cf
-       //TODO: VPSHRDVW X11, X8, K7, X9                           // 6252bd0f72cb
-       //TODO: VPSHRDVW (AX), X8, K7, X9                          // 6272bd0f7208
-       //TODO: VPSHRDVW 7(SI), X8, K7, X9                         // 6272bd0f728e07000000
-       //TODO: VPSHRDVW X2, X9, K7, X9                            // 6272b50f72ca
-       //TODO: VPSHRDVW X31, X9, K7, X9                           // 6212b50f72cf
-       //TODO: VPSHRDVW X11, X9, K7, X9                           // 6252b50f72cb
-       //TODO: VPSHRDVW (AX), X9, K7, X9                          // 6272b50f7208
-       //TODO: VPSHRDVW 7(SI), X9, K7, X9                         // 6272b50f728e07000000
-       //TODO: VPSHRDVW X2, X2, K7, X13                           // 6272ed0f72ea
-       //TODO: VPSHRDVW X31, X2, K7, X13                          // 6212ed0f72ef
-       //TODO: VPSHRDVW X11, X2, K7, X13                          // 6252ed0f72eb
-       //TODO: VPSHRDVW (AX), X2, K7, X13                         // 6272ed0f7228
-       //TODO: VPSHRDVW 7(SI), X2, K7, X13                        // 6272ed0f72ae07000000
-       //TODO: VPSHRDVW X2, X8, K7, X13                           // 6272bd0f72ea
-       //TODO: VPSHRDVW X31, X8, K7, X13                          // 6212bd0f72ef
-       //TODO: VPSHRDVW X11, X8, K7, X13                          // 6252bd0f72eb
-       //TODO: VPSHRDVW (AX), X8, K7, X13                         // 6272bd0f7228
-       //TODO: VPSHRDVW 7(SI), X8, K7, X13                        // 6272bd0f72ae07000000
-       //TODO: VPSHRDVW X2, X9, K7, X13                           // 6272b50f72ea
-       //TODO: VPSHRDVW X31, X9, K7, X13                          // 6212b50f72ef
-       //TODO: VPSHRDVW X11, X9, K7, X13                          // 6252b50f72eb
-       //TODO: VPSHRDVW (AX), X9, K7, X13                         // 6272b50f7228
-       //TODO: VPSHRDVW 7(SI), X9, K7, X13                        // 6272b50f72ae07000000
-       //TODO: VPSHRDVW Y5, Y8, K2, Y13                           // 6272bd2a72ed
-       //TODO: VPSHRDVW Y24, Y8, K2, Y13                          // 6212bd2a72e8
-       //TODO: VPSHRDVW Y21, Y8, K2, Y13                          // 6232bd2a72ed
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y8, K2, Y13               // 6212bd2a72ac7f63000000
-       //TODO: VPSHRDVW -7(DI), Y8, K2, Y13                       // 6272bd2a72aff9ffffff
-       //TODO: VPSHRDVW Y5, Y11, K2, Y13                          // 6272a52a72ed
-       //TODO: VPSHRDVW Y24, Y11, K2, Y13                         // 6212a52a72e8
-       //TODO: VPSHRDVW Y21, Y11, K2, Y13                         // 6232a52a72ed
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y11, K2, Y13              // 6212a52a72ac7f63000000
-       //TODO: VPSHRDVW -7(DI), Y11, K2, Y13                      // 6272a52a72aff9ffffff
-       //TODO: VPSHRDVW Y5, Y24, K2, Y13                          // 6272bd2272ed
-       //TODO: VPSHRDVW Y24, Y24, K2, Y13                         // 6212bd2272e8
-       //TODO: VPSHRDVW Y21, Y24, K2, Y13                         // 6232bd2272ed
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y24, K2, Y13              // 6212bd2272ac7f63000000
-       //TODO: VPSHRDVW -7(DI), Y24, K2, Y13                      // 6272bd2272aff9ffffff
-       //TODO: VPSHRDVW Y5, Y8, K2, Y18                           // 62e2bd2a72d5
-       //TODO: VPSHRDVW Y24, Y8, K2, Y18                          // 6282bd2a72d0
-       //TODO: VPSHRDVW Y21, Y8, K2, Y18                          // 62a2bd2a72d5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y8, K2, Y18               // 6282bd2a72947f63000000
-       //TODO: VPSHRDVW -7(DI), Y8, K2, Y18                       // 62e2bd2a7297f9ffffff
-       //TODO: VPSHRDVW Y5, Y11, K2, Y18                          // 62e2a52a72d5
-       //TODO: VPSHRDVW Y24, Y11, K2, Y18                         // 6282a52a72d0
-       //TODO: VPSHRDVW Y21, Y11, K2, Y18                         // 62a2a52a72d5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y11, K2, Y18              // 6282a52a72947f63000000
-       //TODO: VPSHRDVW -7(DI), Y11, K2, Y18                      // 62e2a52a7297f9ffffff
-       //TODO: VPSHRDVW Y5, Y24, K2, Y18                          // 62e2bd2272d5
-       //TODO: VPSHRDVW Y24, Y24, K2, Y18                         // 6282bd2272d0
-       //TODO: VPSHRDVW Y21, Y24, K2, Y18                         // 62a2bd2272d5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y24, K2, Y18              // 6282bd2272947f63000000
-       //TODO: VPSHRDVW -7(DI), Y24, K2, Y18                      // 62e2bd227297f9ffffff
-       //TODO: VPSHRDVW Y5, Y8, K2, Y24                           // 6262bd2a72c5
-       //TODO: VPSHRDVW Y24, Y8, K2, Y24                          // 6202bd2a72c0
-       //TODO: VPSHRDVW Y21, Y8, K2, Y24                          // 6222bd2a72c5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y8, K2, Y24               // 6202bd2a72847f63000000
-       //TODO: VPSHRDVW -7(DI), Y8, K2, Y24                       // 6262bd2a7287f9ffffff
-       //TODO: VPSHRDVW Y5, Y11, K2, Y24                          // 6262a52a72c5
-       //TODO: VPSHRDVW Y24, Y11, K2, Y24                         // 6202a52a72c0
-       //TODO: VPSHRDVW Y21, Y11, K2, Y24                         // 6222a52a72c5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y11, K2, Y24              // 6202a52a72847f63000000
-       //TODO: VPSHRDVW -7(DI), Y11, K2, Y24                      // 6262a52a7287f9ffffff
-       //TODO: VPSHRDVW Y5, Y24, K2, Y24                          // 6262bd2272c5
-       //TODO: VPSHRDVW Y24, Y24, K2, Y24                         // 6202bd2272c0
-       //TODO: VPSHRDVW Y21, Y24, K2, Y24                         // 6222bd2272c5
-       //TODO: VPSHRDVW 99(R15)(R15*2), Y24, K2, Y24              // 6202bd2272847f63000000
-       //TODO: VPSHRDVW -7(DI), Y24, K2, Y24                      // 6262bd227287f9ffffff
-       //TODO: VPSHRDVW Z16, Z21, K4, Z8                          // 6232d54472c0
-       //TODO: VPSHRDVW Z13, Z21, K4, Z8                          // 6252d54472c5
-       //TODO: VPSHRDVW 17(SP)(BP*2), Z21, K4, Z8                 // 6272d54472846c11000000
-       //TODO: VPSHRDVW -7(DI)(R8*4), Z21, K4, Z8                 // 6232d544728487f9ffffff
-       //TODO: VPSHRDVW Z16, Z5, K4, Z8                           // 6232d54c72c0
-       //TODO: VPSHRDVW Z13, Z5, K4, Z8                           // 6252d54c72c5
-       //TODO: VPSHRDVW 17(SP)(BP*2), Z5, K4, Z8                  // 6272d54c72846c11000000
-       //TODO: VPSHRDVW -7(DI)(R8*4), Z5, K4, Z8                  // 6232d54c728487f9ffffff
-       //TODO: VPSHRDVW Z16, Z21, K4, Z28                         // 6222d54472e0
-       //TODO: VPSHRDVW Z13, Z21, K4, Z28                         // 6242d54472e5
-       //TODO: VPSHRDVW 17(SP)(BP*2), Z21, K4, Z28                // 6262d54472a46c11000000
-       //TODO: VPSHRDVW -7(DI)(R8*4), Z21, K4, Z28                // 6222d54472a487f9ffffff
-       //TODO: VPSHRDVW Z16, Z5, K4, Z28                          // 6222d54c72e0
-       //TODO: VPSHRDVW Z13, Z5, K4, Z28                          // 6242d54c72e5
-       //TODO: VPSHRDVW 17(SP)(BP*2), Z5, K4, Z28                 // 6262d54c72a46c11000000
-       //TODO: VPSHRDVW -7(DI)(R8*4), Z5, K4, Z28                 // 6222d54c72a487f9ffffff
-       //TODO: VPSHRDW $27, X15, X0, K1, X22                      // 62c3fd0972f71b
-       //TODO: VPSHRDW $27, X11, X0, K1, X22                      // 62c3fd0972f31b
-       //TODO: VPSHRDW $27, X0, X0, K1, X22                       // 62e3fd0972f01b
-       //TODO: VPSHRDW $27, (BX), X0, K1, X22                     // 62e3fd0972331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X0, K1, X22            // 62e3fd0972b435efffffff1b
-       //TODO: VPSHRDW $27, X15, X17, K1, X22                     // 62c3f50172f71b
-       //TODO: VPSHRDW $27, X11, X17, K1, X22                     // 62c3f50172f31b
-       //TODO: VPSHRDW $27, X0, X17, K1, X22                      // 62e3f50172f01b
-       //TODO: VPSHRDW $27, (BX), X17, K1, X22                    // 62e3f50172331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X17, K1, X22           // 62e3f50172b435efffffff1b
-       //TODO: VPSHRDW $27, X15, X7, K1, X22                      // 62c3c50972f71b
-       //TODO: VPSHRDW $27, X11, X7, K1, X22                      // 62c3c50972f31b
-       //TODO: VPSHRDW $27, X0, X7, K1, X22                       // 62e3c50972f01b
-       //TODO: VPSHRDW $27, (BX), X7, K1, X22                     // 62e3c50972331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X7, K1, X22            // 62e3c50972b435efffffff1b
-       //TODO: VPSHRDW $27, X15, X0, K1, X5                       // 62d3fd0972ef1b
-       //TODO: VPSHRDW $27, X11, X0, K1, X5                       // 62d3fd0972eb1b
-       //TODO: VPSHRDW $27, X0, X0, K1, X5                        // 62f3fd0972e81b
-       //TODO: VPSHRDW $27, (BX), X0, K1, X5                      // 62f3fd09722b1b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X0, K1, X5             // 62f3fd0972ac35efffffff1b
-       //TODO: VPSHRDW $27, X15, X17, K1, X5                      // 62d3f50172ef1b
-       //TODO: VPSHRDW $27, X11, X17, K1, X5                      // 62d3f50172eb1b
-       //TODO: VPSHRDW $27, X0, X17, K1, X5                       // 62f3f50172e81b
-       //TODO: VPSHRDW $27, (BX), X17, K1, X5                     // 62f3f501722b1b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X17, K1, X5            // 62f3f50172ac35efffffff1b
-       //TODO: VPSHRDW $27, X15, X7, K1, X5                       // 62d3c50972ef1b
-       //TODO: VPSHRDW $27, X11, X7, K1, X5                       // 62d3c50972eb1b
-       //TODO: VPSHRDW $27, X0, X7, K1, X5                        // 62f3c50972e81b
-       //TODO: VPSHRDW $27, (BX), X7, K1, X5                      // 62f3c509722b1b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X7, K1, X5             // 62f3c50972ac35efffffff1b
-       //TODO: VPSHRDW $27, X15, X0, K1, X14                      // 6253fd0972f71b
-       //TODO: VPSHRDW $27, X11, X0, K1, X14                      // 6253fd0972f31b
-       //TODO: VPSHRDW $27, X0, X0, K1, X14                       // 6273fd0972f01b
-       //TODO: VPSHRDW $27, (BX), X0, K1, X14                     // 6273fd0972331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X0, K1, X14            // 6273fd0972b435efffffff1b
-       //TODO: VPSHRDW $27, X15, X17, K1, X14                     // 6253f50172f71b
-       //TODO: VPSHRDW $27, X11, X17, K1, X14                     // 6253f50172f31b
-       //TODO: VPSHRDW $27, X0, X17, K1, X14                      // 6273f50172f01b
-       //TODO: VPSHRDW $27, (BX), X17, K1, X14                    // 6273f50172331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X17, K1, X14           // 6273f50172b435efffffff1b
-       //TODO: VPSHRDW $27, X15, X7, K1, X14                      // 6253c50972f71b
-       //TODO: VPSHRDW $27, X11, X7, K1, X14                      // 6253c50972f31b
-       //TODO: VPSHRDW $27, X0, X7, K1, X14                       // 6273c50972f01b
-       //TODO: VPSHRDW $27, (BX), X7, K1, X14                     // 6273c50972331b
-       //TODO: VPSHRDW $27, -17(BP)(SI*1), X7, K1, X14            // 6273c50972b435efffffff1b
-       //TODO: VPSHRDW $47, Y7, Y9, K3, Y16                       // 62e3b52b72c72f
-       //TODO: VPSHRDW $47, Y6, Y9, K3, Y16                       // 62e3b52b72c62f
-       //TODO: VPSHRDW $47, Y26, Y9, K3, Y16                      // 6283b52b72c22f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y16             // 62e3b52b728411f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y16          // 6283b52b7284bef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y6, K3, Y16                       // 62e3cd2b72c72f
-       //TODO: VPSHRDW $47, Y6, Y6, K3, Y16                       // 62e3cd2b72c62f
-       //TODO: VPSHRDW $47, Y26, Y6, K3, Y16                      // 6283cd2b72c22f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y16             // 62e3cd2b728411f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y16          // 6283cd2b7284bef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y3, K3, Y16                       // 62e3e52b72c72f
-       //TODO: VPSHRDW $47, Y6, Y3, K3, Y16                       // 62e3e52b72c62f
-       //TODO: VPSHRDW $47, Y26, Y3, K3, Y16                      // 6283e52b72c22f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y16             // 62e3e52b728411f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y16          // 6283e52b7284bef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y9, K3, Y9                        // 6273b52b72cf2f
-       //TODO: VPSHRDW $47, Y6, Y9, K3, Y9                        // 6273b52b72ce2f
-       //TODO: VPSHRDW $47, Y26, Y9, K3, Y9                       // 6213b52b72ca2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y9              // 6273b52b728c11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y9           // 6213b52b728cbef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y6, K3, Y9                        // 6273cd2b72cf2f
-       //TODO: VPSHRDW $47, Y6, Y6, K3, Y9                        // 6273cd2b72ce2f
-       //TODO: VPSHRDW $47, Y26, Y6, K3, Y9                       // 6213cd2b72ca2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y9              // 6273cd2b728c11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y9           // 6213cd2b728cbef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y3, K3, Y9                        // 6273e52b72cf2f
-       //TODO: VPSHRDW $47, Y6, Y3, K3, Y9                        // 6273e52b72ce2f
-       //TODO: VPSHRDW $47, Y26, Y3, K3, Y9                       // 6213e52b72ca2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y9              // 6273e52b728c11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y9           // 6213e52b728cbef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y9, K3, Y13                       // 6273b52b72ef2f
-       //TODO: VPSHRDW $47, Y6, Y9, K3, Y13                       // 6273b52b72ee2f
-       //TODO: VPSHRDW $47, Y26, Y9, K3, Y13                      // 6213b52b72ea2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y13             // 6273b52b72ac11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y13          // 6213b52b72acbef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y6, K3, Y13                       // 6273cd2b72ef2f
-       //TODO: VPSHRDW $47, Y6, Y6, K3, Y13                       // 6273cd2b72ee2f
-       //TODO: VPSHRDW $47, Y26, Y6, K3, Y13                      // 6213cd2b72ea2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y13             // 6273cd2b72ac11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y13          // 6213cd2b72acbef1ffffff2f
-       //TODO: VPSHRDW $47, Y7, Y3, K3, Y13                       // 6273e52b72ef2f
-       //TODO: VPSHRDW $47, Y6, Y3, K3, Y13                       // 6273e52b72ee2f
-       //TODO: VPSHRDW $47, Y26, Y3, K3, Y13                      // 6213e52b72ea2f
-       //TODO: VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y13             // 6273e52b72ac11f9ffffff2f
-       //TODO: VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y13          // 6213e52b72acbef1ffffff2f
-       //TODO: VPSHRDW $82, Z6, Z22, K4, Z12                      // 6273cd4472e652
-       //TODO: VPSHRDW $82, Z8, Z22, K4, Z12                      // 6253cd4472e052
-       //TODO: VPSHRDW $82, 15(R8), Z22, K4, Z12                  // 6253cd4472a00f00000052
-       //TODO: VPSHRDW $82, (BP), Z22, K4, Z12                    // 6273cd4472650052
-       //TODO: VPSHRDW $82, Z6, Z11, K4, Z12                      // 6273a54c72e652
-       //TODO: VPSHRDW $82, Z8, Z11, K4, Z12                      // 6253a54c72e052
-       //TODO: VPSHRDW $82, 15(R8), Z11, K4, Z12                  // 6253a54c72a00f00000052
-       //TODO: VPSHRDW $82, (BP), Z11, K4, Z12                    // 6273a54c72650052
-       //TODO: VPSHRDW $82, Z6, Z22, K4, Z27                      // 6263cd4472de52
-       //TODO: VPSHRDW $82, Z8, Z22, K4, Z27                      // 6243cd4472d852
-       //TODO: VPSHRDW $82, 15(R8), Z22, K4, Z27                  // 6243cd4472980f00000052
-       //TODO: VPSHRDW $82, (BP), Z22, K4, Z27                    // 6263cd44725d0052
-       //TODO: VPSHRDW $82, Z6, Z11, K4, Z27                      // 6263a54c72de52
-       //TODO: VPSHRDW $82, Z8, Z11, K4, Z27                      // 6243a54c72d852
-       //TODO: VPSHRDW $82, 15(R8), Z11, K4, Z27                  // 6243a54c72980f00000052
-       //TODO: VPSHRDW $82, (BP), Z11, K4, Z27                    // 6263a54c725d0052
+       VPCOMPRESSB X7, K1, X15                            // 62d27d0963ff
+       VPCOMPRESSB X13, K1, X15                           // 62527d0963ef
+       VPCOMPRESSB X8, K1, X15                            // 62527d0963c7
+       VPCOMPRESSB X7, K1, X28                            // 62927d0963fc
+       VPCOMPRESSB X13, K1, X28                           // 62127d0963ec
+       VPCOMPRESSB X8, K1, X28                            // 62127d0963c4
+       VPCOMPRESSB X7, K1, -7(CX)(DX*1)                   // 62f27d09637c11f9
+       VPCOMPRESSB X13, K1, -7(CX)(DX*1)                  // 62727d09636c11f9
+       VPCOMPRESSB X8, K1, -7(CX)(DX*1)                   // 62727d09634411f9
+       VPCOMPRESSB X7, K1, -15(R14)(R15*4)                // 62927d09637cbef1
+       VPCOMPRESSB X13, K1, -15(R14)(R15*4)               // 62127d09636cbef1
+       VPCOMPRESSB X8, K1, -15(R14)(R15*4)                // 62127d096344bef1
+       VPCOMPRESSB Y5, K1, Y8                             // 62d27d2963e8
+       VPCOMPRESSB Y24, K1, Y8                            // 62427d2963c0
+       VPCOMPRESSB Y21, K1, Y8                            // 62c27d2963e8
+       VPCOMPRESSB Y5, K1, Y11                            // 62d27d2963eb
+       VPCOMPRESSB Y24, K1, Y11                           // 62427d2963c3
+       VPCOMPRESSB Y21, K1, Y11                           // 62c27d2963eb
+       VPCOMPRESSB Y5, K1, Y24                            // 62927d2963e8
+       VPCOMPRESSB Y24, K1, Y24                           // 62027d2963c0
+       VPCOMPRESSB Y21, K1, Y24                           // 62827d2963e8
+       VPCOMPRESSB Y5, K1, -17(BP)(SI*8)                  // 62f27d29636cf5ef
+       VPCOMPRESSB Y24, K1, -17(BP)(SI*8)                 // 62627d296344f5ef
+       VPCOMPRESSB Y21, K1, -17(BP)(SI*8)                 // 62e27d29636cf5ef
+       VPCOMPRESSB Y5, K1, (R15)                          // 62d27d29632f
+       VPCOMPRESSB Y24, K1, (R15)                         // 62427d296307
+       VPCOMPRESSB Y21, K1, (R15)                         // 62c27d29632f
+       VPCOMPRESSB Z2, K1, Z5                             // 62f27d4963d5
+       VPCOMPRESSB Z2, K1, Z23                            // 62b27d4963d7
+       VPCOMPRESSB Z2, K1, -17(BP)                        // 62f27d496355ef
+       VPCOMPRESSB Z2, K1, -15(R14)(R15*8)                // 62927d496354fef1
+       VPCOMPRESSW X20, K5, X20                           // 62a2fd0d63e4
+       VPCOMPRESSW X16, K5, X20                           // 62a2fd0d63c4
+       VPCOMPRESSW X12, K5, X20                           // 6232fd0d63e4
+       VPCOMPRESSW X20, K5, X24                           // 6282fd0d63e0
+       VPCOMPRESSW X16, K5, X24                           // 6282fd0d63c0
+       VPCOMPRESSW X12, K5, X24                           // 6212fd0d63e0
+       VPCOMPRESSW X20, K5, X7                            // 62e2fd0d63e7
+       VPCOMPRESSW X16, K5, X7                            // 62e2fd0d63c7
+       VPCOMPRESSW X12, K5, X7                            // 6272fd0d63e7
+       VPCOMPRESSW X20, K5, 17(SP)(BP*2)                  // 62e2fd0d63a46c11000000
+       VPCOMPRESSW X16, K5, 17(SP)(BP*2)                  // 62e2fd0d63846c11000000
+       VPCOMPRESSW X12, K5, 17(SP)(BP*2)                  // 6272fd0d63a46c11000000
+       VPCOMPRESSW X20, K5, -7(DI)(R8*4)                  // 62a2fd0d63a487f9ffffff
+       VPCOMPRESSW X16, K5, -7(DI)(R8*4)                  // 62a2fd0d638487f9ffffff
+       VPCOMPRESSW X12, K5, -7(DI)(R8*4)                  // 6232fd0d63a487f9ffffff
+       VPCOMPRESSW Y18, K7, Y14                           // 62c2fd2f63d6
+       VPCOMPRESSW Y3, K7, Y14                            // 62d2fd2f63de
+       VPCOMPRESSW Y24, K7, Y14                           // 6242fd2f63c6
+       VPCOMPRESSW Y18, K7, Y18                           // 62a2fd2f63d2
+       VPCOMPRESSW Y3, K7, Y18                            // 62b2fd2f63da
+       VPCOMPRESSW Y24, K7, Y18                           // 6222fd2f63c2
+       VPCOMPRESSW Y18, K7, Y31                           // 6282fd2f63d7
+       VPCOMPRESSW Y3, K7, Y31                            // 6292fd2f63df
+       VPCOMPRESSW Y24, K7, Y31                           // 6202fd2f63c7
+       VPCOMPRESSW Y18, K7, -7(DI)(R8*1)                  // 62a2fd2f639407f9ffffff
+       VPCOMPRESSW Y3, K7, -7(DI)(R8*1)                   // 62b2fd2f639c07f9ffffff
+       VPCOMPRESSW Y24, K7, -7(DI)(R8*1)                  // 6222fd2f638407f9ffffff
+       VPCOMPRESSW Y18, K7, (SP)                          // 62e2fd2f631424
+       VPCOMPRESSW Y3, K7, (SP)                           // 62f2fd2f631c24
+       VPCOMPRESSW Y24, K7, (SP)                          // 6262fd2f630424
+       VPCOMPRESSW Z3, K7, Z26                            // 6292fd4f63da
+       VPCOMPRESSW Z0, K7, Z26                            // 6292fd4f63c2
+       VPCOMPRESSW Z3, K7, Z3                             // 62f2fd4f63db
+       VPCOMPRESSW Z0, K7, Z3                             // 62f2fd4f63c3
+       VPCOMPRESSW Z3, K7, 15(R8)(R14*8)                  // 6292fd4f639cf00f000000
+       VPCOMPRESSW Z0, K7, 15(R8)(R14*8)                  // 6292fd4f6384f00f000000
+       VPCOMPRESSW Z3, K7, -15(R14)(R15*2)                // 6292fd4f639c7ef1ffffff
+       VPCOMPRESSW Z0, K7, -15(R14)(R15*2)                // 6292fd4f63847ef1ffffff
+       VPEXPANDB X16, K1, X6                              // 62b27d0962f0
+       VPEXPANDB X28, K1, X6                              // 62927d0962f4
+       VPEXPANDB X8, K1, X6                               // 62d27d0962f0
+       VPEXPANDB 99(R15)(R15*4), K1, X6                   // 62927d096274bf63
+       VPEXPANDB 15(DX), K1, X6                           // 62f27d0962720f
+       VPEXPANDB X16, K1, X22                             // 62a27d0962f0
+       VPEXPANDB X28, K1, X22                             // 62827d0962f4
+       VPEXPANDB X8, K1, X22                              // 62c27d0962f0
+       VPEXPANDB 99(R15)(R15*4), K1, X22                  // 62827d096274bf63
+       VPEXPANDB 15(DX), K1, X22                          // 62e27d0962720f
+       VPEXPANDB X16, K1, X12                             // 62327d0962e0
+       VPEXPANDB X28, K1, X12                             // 62127d0962e4
+       VPEXPANDB X8, K1, X12                              // 62527d0962e0
+       VPEXPANDB 99(R15)(R15*4), K1, X12                  // 62127d096264bf63
+       VPEXPANDB 15(DX), K1, X12                          // 62727d0962620f
+       VPEXPANDB Y31, K1, Y27                             // 62027d2962df
+       VPEXPANDB Y3, K1, Y27                              // 62627d2962db
+       VPEXPANDB Y14, K1, Y27                             // 62427d2962de
+       VPEXPANDB -7(DI)(R8*1), K1, Y27                    // 62227d29625c07f9
+       VPEXPANDB (SP), K1, Y27                            // 62627d29621c24
+       VPEXPANDB Y31, K1, Y0                              // 62927d2962c7
+       VPEXPANDB Y3, K1, Y0                               // 62f27d2962c3
+       VPEXPANDB Y14, K1, Y0                              // 62d27d2962c6
+       VPEXPANDB -7(DI)(R8*1), K1, Y0                     // 62b27d29624407f9
+       VPEXPANDB (SP), K1, Y0                             // 62f27d29620424
+       VPEXPANDB Y31, K1, Y11                             // 62127d2962df
+       VPEXPANDB Y3, K1, Y11                              // 62727d2962db
+       VPEXPANDB Y14, K1, Y11                             // 62527d2962de
+       VPEXPANDB -7(DI)(R8*1), K1, Y11                    // 62327d29625c07f9
+       VPEXPANDB (SP), K1, Y11                            // 62727d29621c24
+       VPEXPANDB Z14, K1, Z15                             // 62527d4962fe
+       VPEXPANDB Z27, K1, Z15                             // 62127d4962fb
+       VPEXPANDB 15(R8)(R14*8), K1, Z15                   // 62127d49627cf00f
+       VPEXPANDB -15(R14)(R15*2), K1, Z15                 // 62127d49627c7ef1
+       VPEXPANDB Z14, K1, Z12                             // 62527d4962e6
+       VPEXPANDB Z27, K1, Z12                             // 62127d4962e3
+       VPEXPANDB 15(R8)(R14*8), K1, Z12                   // 62127d496264f00f
+       VPEXPANDB -15(R14)(R15*2), K1, Z12                 // 62127d4962647ef1
+       VPEXPANDW X2, K5, X18                              // 62e2fd0d62d2
+       VPEXPANDW X24, K5, X18                             // 6282fd0d62d0
+       VPEXPANDW -7(CX)(DX*1), K5, X18                    // 62e2fd0d629411f9ffffff
+       VPEXPANDW -15(R14)(R15*4), K5, X18                 // 6282fd0d6294bef1ffffff
+       VPEXPANDW X2, K5, X11                              // 6272fd0d62da
+       VPEXPANDW X24, K5, X11                             // 6212fd0d62d8
+       VPEXPANDW -7(CX)(DX*1), K5, X11                    // 6272fd0d629c11f9ffffff
+       VPEXPANDW -15(R14)(R15*4), K5, X11                 // 6212fd0d629cbef1ffffff
+       VPEXPANDW X2, K5, X9                               // 6272fd0d62ca
+       VPEXPANDW X24, K5, X9                              // 6212fd0d62c8
+       VPEXPANDW -7(CX)(DX*1), K5, X9                     // 6272fd0d628c11f9ffffff
+       VPEXPANDW -15(R14)(R15*4), K5, X9                  // 6212fd0d628cbef1ffffff
+       VPEXPANDW Y5, K7, Y19                              // 62e2fd2f62dd
+       VPEXPANDW Y16, K7, Y19                             // 62a2fd2f62d8
+       VPEXPANDW Y2, K7, Y19                              // 62e2fd2f62da
+       VPEXPANDW (AX), K7, Y19                            // 62e2fd2f6218
+       VPEXPANDW 7(SI), K7, Y19                           // 62e2fd2f629e07000000
+       VPEXPANDW Y5, K7, Y14                              // 6272fd2f62f5
+       VPEXPANDW Y16, K7, Y14                             // 6232fd2f62f0
+       VPEXPANDW Y2, K7, Y14                              // 6272fd2f62f2
+       VPEXPANDW (AX), K7, Y14                            // 6272fd2f6230
+       VPEXPANDW 7(SI), K7, Y14                           // 6272fd2f62b607000000
+       VPEXPANDW Y5, K7, Y21                              // 62e2fd2f62ed
+       VPEXPANDW Y16, K7, Y21                             // 62a2fd2f62e8
+       VPEXPANDW Y2, K7, Y21                              // 62e2fd2f62ea
+       VPEXPANDW (AX), K7, Y21                            // 62e2fd2f6228
+       VPEXPANDW 7(SI), K7, Y21                           // 62e2fd2f62ae07000000
+       VPEXPANDW Z26, K7, Z6                              // 6292fd4f62f2
+       VPEXPANDW Z14, K7, Z6                              // 62d2fd4f62f6
+       VPEXPANDW (SI), K7, Z6                             // 62f2fd4f6236
+       VPEXPANDW 7(SI)(DI*2), K7, Z6                      // 62f2fd4f62b47e07000000
+       VPEXPANDW Z26, K7, Z14                             // 6212fd4f62f2
+       VPEXPANDW Z14, K7, Z14                             // 6252fd4f62f6
+       VPEXPANDW (SI), K7, Z14                            // 6272fd4f6236
+       VPEXPANDW 7(SI)(DI*2), K7, Z14                     // 6272fd4f62b47e07000000
+       VPSHLDD $47, X8, X31, K4, X26                      // 6243050471d02f
+       VPSHLDD $47, X1, X31, K4, X26                      // 6263050471d12f
+       VPSHLDD $47, X0, X31, K4, X26                      // 6263050471d02f
+       VPSHLDD $47, 7(SI)(DI*4), X31, K4, X26             // 626305047194be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X31, K4, X26            // 62230504719447f9ffffff2f
+       VPSHLDD $47, X8, X16, K4, X26                      // 62437d0471d02f
+       VPSHLDD $47, X1, X16, K4, X26                      // 62637d0471d12f
+       VPSHLDD $47, X0, X16, K4, X26                      // 62637d0471d02f
+       VPSHLDD $47, 7(SI)(DI*4), X16, K4, X26             // 62637d047194be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X16, K4, X26            // 62237d04719447f9ffffff2f
+       VPSHLDD $47, X8, X7, K4, X26                       // 6243450c71d02f
+       VPSHLDD $47, X1, X7, K4, X26                       // 6263450c71d12f
+       VPSHLDD $47, X0, X7, K4, X26                       // 6263450c71d02f
+       VPSHLDD $47, 7(SI)(DI*4), X7, K4, X26              // 6263450c7194be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X7, K4, X26             // 6223450c719447f9ffffff2f
+       VPSHLDD $47, X8, X31, K4, X19                      // 62c3050471d82f
+       VPSHLDD $47, X1, X31, K4, X19                      // 62e3050471d92f
+       VPSHLDD $47, X0, X31, K4, X19                      // 62e3050471d82f
+       VPSHLDD $47, 7(SI)(DI*4), X31, K4, X19             // 62e30504719cbe070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X31, K4, X19            // 62a30504719c47f9ffffff2f
+       VPSHLDD $47, X8, X16, K4, X19                      // 62c37d0471d82f
+       VPSHLDD $47, X1, X16, K4, X19                      // 62e37d0471d92f
+       VPSHLDD $47, X0, X16, K4, X19                      // 62e37d0471d82f
+       VPSHLDD $47, 7(SI)(DI*4), X16, K4, X19             // 62e37d04719cbe070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X16, K4, X19            // 62a37d04719c47f9ffffff2f
+       VPSHLDD $47, X8, X7, K4, X19                       // 62c3450c71d82f
+       VPSHLDD $47, X1, X7, K4, X19                       // 62e3450c71d92f
+       VPSHLDD $47, X0, X7, K4, X19                       // 62e3450c71d82f
+       VPSHLDD $47, 7(SI)(DI*4), X7, K4, X19              // 62e3450c719cbe070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X7, K4, X19             // 62a3450c719c47f9ffffff2f
+       VPSHLDD $47, X8, X31, K4, X0                       // 62d3050471c02f
+       VPSHLDD $47, X1, X31, K4, X0                       // 62f3050471c12f
+       VPSHLDD $47, X0, X31, K4, X0                       // 62f3050471c02f
+       VPSHLDD $47, 7(SI)(DI*4), X31, K4, X0              // 62f305047184be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X31, K4, X0             // 62b30504718447f9ffffff2f
+       VPSHLDD $47, X8, X16, K4, X0                       // 62d37d0471c02f
+       VPSHLDD $47, X1, X16, K4, X0                       // 62f37d0471c12f
+       VPSHLDD $47, X0, X16, K4, X0                       // 62f37d0471c02f
+       VPSHLDD $47, 7(SI)(DI*4), X16, K4, X0              // 62f37d047184be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X16, K4, X0             // 62b37d04718447f9ffffff2f
+       VPSHLDD $47, X8, X7, K4, X0                        // 62d3450c71c02f
+       VPSHLDD $47, X1, X7, K4, X0                        // 62f3450c71c12f
+       VPSHLDD $47, X0, X7, K4, X0                        // 62f3450c71c02f
+       VPSHLDD $47, 7(SI)(DI*4), X7, K4, X0               // 62f3450c7184be070000002f
+       VPSHLDD $47, -7(DI)(R8*2), X7, K4, X0              // 62b3450c718447f9ffffff2f
+       VPSHLDD $82, Y5, Y19, K1, Y3                       // 62f3652171dd52
+       VPSHLDD $82, Y16, Y19, K1, Y3                      // 62b3652171d852
+       VPSHLDD $82, Y2, Y19, K1, Y3                       // 62f3652171da52
+       VPSHLDD $82, (AX), Y19, K1, Y3                     // 62f36521711852
+       VPSHLDD $82, 7(SI), Y19, K1, Y3                    // 62f36521719e0700000052
+       VPSHLDD $82, Y5, Y14, K1, Y3                       // 62f30d2971dd52
+       VPSHLDD $82, Y16, Y14, K1, Y3                      // 62b30d2971d852
+       VPSHLDD $82, Y2, Y14, K1, Y3                       // 62f30d2971da52
+       VPSHLDD $82, (AX), Y14, K1, Y3                     // 62f30d29711852
+       VPSHLDD $82, 7(SI), Y14, K1, Y3                    // 62f30d29719e0700000052
+       VPSHLDD $82, Y5, Y21, K1, Y3                       // 62f3552171dd52
+       VPSHLDD $82, Y16, Y21, K1, Y3                      // 62b3552171d852
+       VPSHLDD $82, Y2, Y21, K1, Y3                       // 62f3552171da52
+       VPSHLDD $82, (AX), Y21, K1, Y3                     // 62f35521711852
+       VPSHLDD $82, 7(SI), Y21, K1, Y3                    // 62f35521719e0700000052
+       VPSHLDD $82, Y5, Y19, K1, Y19                      // 62e3652171dd52
+       VPSHLDD $82, Y16, Y19, K1, Y19                     // 62a3652171d852
+       VPSHLDD $82, Y2, Y19, K1, Y19                      // 62e3652171da52
+       VPSHLDD $82, (AX), Y19, K1, Y19                    // 62e36521711852
+       VPSHLDD $82, 7(SI), Y19, K1, Y19                   // 62e36521719e0700000052
+       VPSHLDD $82, Y5, Y14, K1, Y19                      // 62e30d2971dd52
+       VPSHLDD $82, Y16, Y14, K1, Y19                     // 62a30d2971d852
+       VPSHLDD $82, Y2, Y14, K1, Y19                      // 62e30d2971da52
+       VPSHLDD $82, (AX), Y14, K1, Y19                    // 62e30d29711852
+       VPSHLDD $82, 7(SI), Y14, K1, Y19                   // 62e30d29719e0700000052
+       VPSHLDD $82, Y5, Y21, K1, Y19                      // 62e3552171dd52
+       VPSHLDD $82, Y16, Y21, K1, Y19                     // 62a3552171d852
+       VPSHLDD $82, Y2, Y21, K1, Y19                      // 62e3552171da52
+       VPSHLDD $82, (AX), Y21, K1, Y19                    // 62e35521711852
+       VPSHLDD $82, 7(SI), Y21, K1, Y19                   // 62e35521719e0700000052
+       VPSHLDD $82, Y5, Y19, K1, Y23                      // 62e3652171fd52
+       VPSHLDD $82, Y16, Y19, K1, Y23                     // 62a3652171f852
+       VPSHLDD $82, Y2, Y19, K1, Y23                      // 62e3652171fa52
+       VPSHLDD $82, (AX), Y19, K1, Y23                    // 62e36521713852
+       VPSHLDD $82, 7(SI), Y19, K1, Y23                   // 62e3652171be0700000052
+       VPSHLDD $82, Y5, Y14, K1, Y23                      // 62e30d2971fd52
+       VPSHLDD $82, Y16, Y14, K1, Y23                     // 62a30d2971f852
+       VPSHLDD $82, Y2, Y14, K1, Y23                      // 62e30d2971fa52
+       VPSHLDD $82, (AX), Y14, K1, Y23                    // 62e30d29713852
+       VPSHLDD $82, 7(SI), Y14, K1, Y23                   // 62e30d2971be0700000052
+       VPSHLDD $82, Y5, Y21, K1, Y23                      // 62e3552171fd52
+       VPSHLDD $82, Y16, Y21, K1, Y23                     // 62a3552171f852
+       VPSHLDD $82, Y2, Y21, K1, Y23                      // 62e3552171fa52
+       VPSHLDD $82, (AX), Y21, K1, Y23                    // 62e35521713852
+       VPSHLDD $82, 7(SI), Y21, K1, Y23                   // 62e3552171be0700000052
+       VPSHLDD $126, Z27, Z2, K3, Z21                     // 62836d4b71eb7e
+       VPSHLDD $126, Z25, Z2, K3, Z21                     // 62836d4b71e97e
+       VPSHLDD $126, 17(SP)(BP*1), Z2, K3, Z21            // 62e36d4b71ac2c110000007e
+       VPSHLDD $126, -7(CX)(DX*8), Z2, K3, Z21            // 62e36d4b71acd1f9ffffff7e
+       VPSHLDD $126, Z27, Z7, K3, Z21                     // 6283454b71eb7e
+       VPSHLDD $126, Z25, Z7, K3, Z21                     // 6283454b71e97e
+       VPSHLDD $126, 17(SP)(BP*1), Z7, K3, Z21            // 62e3454b71ac2c110000007e
+       VPSHLDD $126, -7(CX)(DX*8), Z7, K3, Z21            // 62e3454b71acd1f9ffffff7e
+       VPSHLDD $126, Z27, Z2, K3, Z9                      // 62136d4b71cb7e
+       VPSHLDD $126, Z25, Z2, K3, Z9                      // 62136d4b71c97e
+       VPSHLDD $126, 17(SP)(BP*1), Z2, K3, Z9             // 62736d4b718c2c110000007e
+       VPSHLDD $126, -7(CX)(DX*8), Z2, K3, Z9             // 62736d4b718cd1f9ffffff7e
+       VPSHLDD $126, Z27, Z7, K3, Z9                      // 6213454b71cb7e
+       VPSHLDD $126, Z25, Z7, K3, Z9                      // 6213454b71c97e
+       VPSHLDD $126, 17(SP)(BP*1), Z7, K3, Z9             // 6273454b718c2c110000007e
+       VPSHLDD $126, -7(CX)(DX*8), Z7, K3, Z9             // 6273454b718cd1f9ffffff7e
+       VPSHLDQ $94, X22, X21, K4, X15                     // 6233d50471fe5e
+       VPSHLDQ $94, X7, X21, K4, X15                      // 6273d50471ff5e
+       VPSHLDQ $94, X19, X21, K4, X15                     // 6233d50471fb5e
+       VPSHLDQ $94, 17(SP), X21, K4, X15                  // 6273d50471bc24110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X15           // 6273d50471bcb5efffffff5e
+       VPSHLDQ $94, X22, X0, K4, X15                      // 6233fd0c71fe5e
+       VPSHLDQ $94, X7, X0, K4, X15                       // 6273fd0c71ff5e
+       VPSHLDQ $94, X19, X0, K4, X15                      // 6233fd0c71fb5e
+       VPSHLDQ $94, 17(SP), X0, K4, X15                   // 6273fd0c71bc24110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X15            // 6273fd0c71bcb5efffffff5e
+       VPSHLDQ $94, X22, X28, K4, X15                     // 62339d0471fe5e
+       VPSHLDQ $94, X7, X28, K4, X15                      // 62739d0471ff5e
+       VPSHLDQ $94, X19, X28, K4, X15                     // 62339d0471fb5e
+       VPSHLDQ $94, 17(SP), X28, K4, X15                  // 62739d0471bc24110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X15           // 62739d0471bcb5efffffff5e
+       VPSHLDQ $94, X22, X21, K4, X0                      // 62b3d50471c65e
+       VPSHLDQ $94, X7, X21, K4, X0                       // 62f3d50471c75e
+       VPSHLDQ $94, X19, X21, K4, X0                      // 62b3d50471c35e
+       VPSHLDQ $94, 17(SP), X21, K4, X0                   // 62f3d504718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X0            // 62f3d5047184b5efffffff5e
+       VPSHLDQ $94, X22, X0, K4, X0                       // 62b3fd0c71c65e
+       VPSHLDQ $94, X7, X0, K4, X0                        // 62f3fd0c71c75e
+       VPSHLDQ $94, X19, X0, K4, X0                       // 62b3fd0c71c35e
+       VPSHLDQ $94, 17(SP), X0, K4, X0                    // 62f3fd0c718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X0             // 62f3fd0c7184b5efffffff5e
+       VPSHLDQ $94, X22, X28, K4, X0                      // 62b39d0471c65e
+       VPSHLDQ $94, X7, X28, K4, X0                       // 62f39d0471c75e
+       VPSHLDQ $94, X19, X28, K4, X0                      // 62b39d0471c35e
+       VPSHLDQ $94, 17(SP), X28, K4, X0                   // 62f39d04718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X0            // 62f39d047184b5efffffff5e
+       VPSHLDQ $94, X22, X21, K4, X16                     // 62a3d50471c65e
+       VPSHLDQ $94, X7, X21, K4, X16                      // 62e3d50471c75e
+       VPSHLDQ $94, X19, X21, K4, X16                     // 62a3d50471c35e
+       VPSHLDQ $94, 17(SP), X21, K4, X16                  // 62e3d504718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X21, K4, X16           // 62e3d5047184b5efffffff5e
+       VPSHLDQ $94, X22, X0, K4, X16                      // 62a3fd0c71c65e
+       VPSHLDQ $94, X7, X0, K4, X16                       // 62e3fd0c71c75e
+       VPSHLDQ $94, X19, X0, K4, X16                      // 62a3fd0c71c35e
+       VPSHLDQ $94, 17(SP), X0, K4, X16                   // 62e3fd0c718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X0, K4, X16            // 62e3fd0c7184b5efffffff5e
+       VPSHLDQ $94, X22, X28, K4, X16                     // 62a39d0471c65e
+       VPSHLDQ $94, X7, X28, K4, X16                      // 62e39d0471c75e
+       VPSHLDQ $94, X19, X28, K4, X16                     // 62a39d0471c35e
+       VPSHLDQ $94, 17(SP), X28, K4, X16                  // 62e39d04718424110000005e
+       VPSHLDQ $94, -17(BP)(SI*4), X28, K4, X16           // 62e39d047184b5efffffff5e
+       VPSHLDQ $121, Y19, Y31, K5, Y21                    // 62a3852571eb79
+       VPSHLDQ $121, Y7, Y31, K5, Y21                     // 62e3852571ef79
+       VPSHLDQ $121, Y6, Y31, K5, Y21                     // 62e3852571ee79
+       VPSHLDQ $121, (BX), Y31, K5, Y21                   // 62e38525712b79
+       VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y21          // 62e3852571ac35efffffff79
+       VPSHLDQ $121, Y19, Y6, K5, Y21                     // 62a3cd2d71eb79
+       VPSHLDQ $121, Y7, Y6, K5, Y21                      // 62e3cd2d71ef79
+       VPSHLDQ $121, Y6, Y6, K5, Y21                      // 62e3cd2d71ee79
+       VPSHLDQ $121, (BX), Y6, K5, Y21                    // 62e3cd2d712b79
+       VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y21           // 62e3cd2d71ac35efffffff79
+       VPSHLDQ $121, Y19, Y11, K5, Y21                    // 62a3a52d71eb79
+       VPSHLDQ $121, Y7, Y11, K5, Y21                     // 62e3a52d71ef79
+       VPSHLDQ $121, Y6, Y11, K5, Y21                     // 62e3a52d71ee79
+       VPSHLDQ $121, (BX), Y11, K5, Y21                   // 62e3a52d712b79
+       VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y21          // 62e3a52d71ac35efffffff79
+       VPSHLDQ $121, Y19, Y31, K5, Y20                    // 62a3852571e379
+       VPSHLDQ $121, Y7, Y31, K5, Y20                     // 62e3852571e779
+       VPSHLDQ $121, Y6, Y31, K5, Y20                     // 62e3852571e679
+       VPSHLDQ $121, (BX), Y31, K5, Y20                   // 62e38525712379
+       VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y20          // 62e3852571a435efffffff79
+       VPSHLDQ $121, Y19, Y6, K5, Y20                     // 62a3cd2d71e379
+       VPSHLDQ $121, Y7, Y6, K5, Y20                      // 62e3cd2d71e779
+       VPSHLDQ $121, Y6, Y6, K5, Y20                      // 62e3cd2d71e679
+       VPSHLDQ $121, (BX), Y6, K5, Y20                    // 62e3cd2d712379
+       VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y20           // 62e3cd2d71a435efffffff79
+       VPSHLDQ $121, Y19, Y11, K5, Y20                    // 62a3a52d71e379
+       VPSHLDQ $121, Y7, Y11, K5, Y20                     // 62e3a52d71e779
+       VPSHLDQ $121, Y6, Y11, K5, Y20                     // 62e3a52d71e679
+       VPSHLDQ $121, (BX), Y11, K5, Y20                   // 62e3a52d712379
+       VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y20          // 62e3a52d71a435efffffff79
+       VPSHLDQ $121, Y19, Y31, K5, Y6                     // 62b3852571f379
+       VPSHLDQ $121, Y7, Y31, K5, Y6                      // 62f3852571f779
+       VPSHLDQ $121, Y6, Y31, K5, Y6                      // 62f3852571f679
+       VPSHLDQ $121, (BX), Y31, K5, Y6                    // 62f38525713379
+       VPSHLDQ $121, -17(BP)(SI*1), Y31, K5, Y6           // 62f3852571b435efffffff79
+       VPSHLDQ $121, Y19, Y6, K5, Y6                      // 62b3cd2d71f379
+       VPSHLDQ $121, Y7, Y6, K5, Y6                       // 62f3cd2d71f779
+       VPSHLDQ $121, Y6, Y6, K5, Y6                       // 62f3cd2d71f679
+       VPSHLDQ $121, (BX), Y6, K5, Y6                     // 62f3cd2d713379
+       VPSHLDQ $121, -17(BP)(SI*1), Y6, K5, Y6            // 62f3cd2d71b435efffffff79
+       VPSHLDQ $121, Y19, Y11, K5, Y6                     // 62b3a52d71f379
+       VPSHLDQ $121, Y7, Y11, K5, Y6                      // 62f3a52d71f779
+       VPSHLDQ $121, Y6, Y11, K5, Y6                      // 62f3a52d71f679
+       VPSHLDQ $121, (BX), Y11, K5, Y6                    // 62f3a52d713379
+       VPSHLDQ $121, -17(BP)(SI*1), Y11, K5, Y6           // 62f3a52d71b435efffffff79
+       VPSHLDQ $13, Z3, Z27, K7, Z23                      // 62e3a54771fb0d
+       VPSHLDQ $13, Z0, Z27, K7, Z23                      // 62e3a54771f80d
+       VPSHLDQ $13, -17(BP)(SI*2), Z27, K7, Z23           // 62e3a54771bc75efffffff0d
+       VPSHLDQ $13, 7(AX)(CX*2), Z27, K7, Z23             // 62e3a54771bc48070000000d
+       VPSHLDQ $13, Z3, Z14, K7, Z23                      // 62e38d4f71fb0d
+       VPSHLDQ $13, Z0, Z14, K7, Z23                      // 62e38d4f71f80d
+       VPSHLDQ $13, -17(BP)(SI*2), Z14, K7, Z23           // 62e38d4f71bc75efffffff0d
+       VPSHLDQ $13, 7(AX)(CX*2), Z14, K7, Z23             // 62e38d4f71bc48070000000d
+       VPSHLDQ $13, Z3, Z27, K7, Z9                       // 6273a54771cb0d
+       VPSHLDQ $13, Z0, Z27, K7, Z9                       // 6273a54771c80d
+       VPSHLDQ $13, -17(BP)(SI*2), Z27, K7, Z9            // 6273a547718c75efffffff0d
+       VPSHLDQ $13, 7(AX)(CX*2), Z27, K7, Z9              // 6273a547718c48070000000d
+       VPSHLDQ $13, Z3, Z14, K7, Z9                       // 62738d4f71cb0d
+       VPSHLDQ $13, Z0, Z14, K7, Z9                       // 62738d4f71c80d
+       VPSHLDQ $13, -17(BP)(SI*2), Z14, K7, Z9            // 62738d4f718c75efffffff0d
+       VPSHLDQ $13, 7(AX)(CX*2), Z14, K7, Z9              // 62738d4f718c48070000000d
+       VPSHLDVD X15, X1, K7, X7                           // 62d2750f71ff
+       VPSHLDVD X12, X1, K7, X7                           // 62d2750f71fc
+       VPSHLDVD X0, X1, K7, X7                            // 62f2750f71f8
+       VPSHLDVD 7(AX), X1, K7, X7                         // 62f2750f71b807000000
+       VPSHLDVD (DI), X1, K7, X7                          // 62f2750f713f
+       VPSHLDVD X15, X7, K7, X7                           // 62d2450f71ff
+       VPSHLDVD X12, X7, K7, X7                           // 62d2450f71fc
+       VPSHLDVD X0, X7, K7, X7                            // 62f2450f71f8
+       VPSHLDVD 7(AX), X7, K7, X7                         // 62f2450f71b807000000
+       VPSHLDVD (DI), X7, K7, X7                          // 62f2450f713f
+       VPSHLDVD X15, X9, K7, X7                           // 62d2350f71ff
+       VPSHLDVD X12, X9, K7, X7                           // 62d2350f71fc
+       VPSHLDVD X0, X9, K7, X7                            // 62f2350f71f8
+       VPSHLDVD 7(AX), X9, K7, X7                         // 62f2350f71b807000000
+       VPSHLDVD (DI), X9, K7, X7                          // 62f2350f713f
+       VPSHLDVD X15, X1, K7, X16                          // 62c2750f71c7
+       VPSHLDVD X12, X1, K7, X16                          // 62c2750f71c4
+       VPSHLDVD X0, X1, K7, X16                           // 62e2750f71c0
+       VPSHLDVD 7(AX), X1, K7, X16                        // 62e2750f718007000000
+       VPSHLDVD (DI), X1, K7, X16                         // 62e2750f7107
+       VPSHLDVD X15, X7, K7, X16                          // 62c2450f71c7
+       VPSHLDVD X12, X7, K7, X16                          // 62c2450f71c4
+       VPSHLDVD X0, X7, K7, X16                           // 62e2450f71c0
+       VPSHLDVD 7(AX), X7, K7, X16                        // 62e2450f718007000000
+       VPSHLDVD (DI), X7, K7, X16                         // 62e2450f7107
+       VPSHLDVD X15, X9, K7, X16                          // 62c2350f71c7
+       VPSHLDVD X12, X9, K7, X16                          // 62c2350f71c4
+       VPSHLDVD X0, X9, K7, X16                           // 62e2350f71c0
+       VPSHLDVD 7(AX), X9, K7, X16                        // 62e2350f718007000000
+       VPSHLDVD (DI), X9, K7, X16                         // 62e2350f7107
+       VPSHLDVD X15, X1, K7, X31                          // 6242750f71ff
+       VPSHLDVD X12, X1, K7, X31                          // 6242750f71fc
+       VPSHLDVD X0, X1, K7, X31                           // 6262750f71f8
+       VPSHLDVD 7(AX), X1, K7, X31                        // 6262750f71b807000000
+       VPSHLDVD (DI), X1, K7, X31                         // 6262750f713f
+       VPSHLDVD X15, X7, K7, X31                          // 6242450f71ff
+       VPSHLDVD X12, X7, K7, X31                          // 6242450f71fc
+       VPSHLDVD X0, X7, K7, X31                           // 6262450f71f8
+       VPSHLDVD 7(AX), X7, K7, X31                        // 6262450f71b807000000
+       VPSHLDVD (DI), X7, K7, X31                         // 6262450f713f
+       VPSHLDVD X15, X9, K7, X31                          // 6242350f71ff
+       VPSHLDVD X12, X9, K7, X31                          // 6242350f71fc
+       VPSHLDVD X0, X9, K7, X31                           // 6262350f71f8
+       VPSHLDVD 7(AX), X9, K7, X31                        // 6262350f71b807000000
+       VPSHLDVD (DI), X9, K7, X31                         // 6262350f713f
+       VPSHLDVD Y5, Y20, K6, Y0                           // 62f25d2671c5
+       VPSHLDVD Y28, Y20, K6, Y0                          // 62925d2671c4
+       VPSHLDVD Y7, Y20, K6, Y0                           // 62f25d2671c7
+       VPSHLDVD 15(R8)(R14*4), Y20, K6, Y0                // 62925d267184b00f000000
+       VPSHLDVD -7(CX)(DX*4), Y20, K6, Y0                 // 62f25d26718491f9ffffff
+       VPSHLDVD Y5, Y12, K6, Y0                           // 62f21d2e71c5
+       VPSHLDVD Y28, Y12, K6, Y0                          // 62921d2e71c4
+       VPSHLDVD Y7, Y12, K6, Y0                           // 62f21d2e71c7
+       VPSHLDVD 15(R8)(R14*4), Y12, K6, Y0                // 62921d2e7184b00f000000
+       VPSHLDVD -7(CX)(DX*4), Y12, K6, Y0                 // 62f21d2e718491f9ffffff
+       VPSHLDVD Y5, Y3, K6, Y0                            // 62f2652e71c5
+       VPSHLDVD Y28, Y3, K6, Y0                           // 6292652e71c4
+       VPSHLDVD Y7, Y3, K6, Y0                            // 62f2652e71c7
+       VPSHLDVD 15(R8)(R14*4), Y3, K6, Y0                 // 6292652e7184b00f000000
+       VPSHLDVD -7(CX)(DX*4), Y3, K6, Y0                  // 62f2652e718491f9ffffff
+       VPSHLDVD Y5, Y20, K6, Y3                           // 62f25d2671dd
+       VPSHLDVD Y28, Y20, K6, Y3                          // 62925d2671dc
+       VPSHLDVD Y7, Y20, K6, Y3                           // 62f25d2671df
+       VPSHLDVD 15(R8)(R14*4), Y20, K6, Y3                // 62925d26719cb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y20, K6, Y3                 // 62f25d26719c91f9ffffff
+       VPSHLDVD Y5, Y12, K6, Y3                           // 62f21d2e71dd
+       VPSHLDVD Y28, Y12, K6, Y3                          // 62921d2e71dc
+       VPSHLDVD Y7, Y12, K6, Y3                           // 62f21d2e71df
+       VPSHLDVD 15(R8)(R14*4), Y12, K6, Y3                // 62921d2e719cb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y12, K6, Y3                 // 62f21d2e719c91f9ffffff
+       VPSHLDVD Y5, Y3, K6, Y3                            // 62f2652e71dd
+       VPSHLDVD Y28, Y3, K6, Y3                           // 6292652e71dc
+       VPSHLDVD Y7, Y3, K6, Y3                            // 62f2652e71df
+       VPSHLDVD 15(R8)(R14*4), Y3, K6, Y3                 // 6292652e719cb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y3, K6, Y3                  // 62f2652e719c91f9ffffff
+       VPSHLDVD Y5, Y20, K6, Y5                           // 62f25d2671ed
+       VPSHLDVD Y28, Y20, K6, Y5                          // 62925d2671ec
+       VPSHLDVD Y7, Y20, K6, Y5                           // 62f25d2671ef
+       VPSHLDVD 15(R8)(R14*4), Y20, K6, Y5                // 62925d2671acb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y20, K6, Y5                 // 62f25d2671ac91f9ffffff
+       VPSHLDVD Y5, Y12, K6, Y5                           // 62f21d2e71ed
+       VPSHLDVD Y28, Y12, K6, Y5                          // 62921d2e71ec
+       VPSHLDVD Y7, Y12, K6, Y5                           // 62f21d2e71ef
+       VPSHLDVD 15(R8)(R14*4), Y12, K6, Y5                // 62921d2e71acb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y12, K6, Y5                 // 62f21d2e71ac91f9ffffff
+       VPSHLDVD Y5, Y3, K6, Y5                            // 62f2652e71ed
+       VPSHLDVD Y28, Y3, K6, Y5                           // 6292652e71ec
+       VPSHLDVD Y7, Y3, K6, Y5                            // 62f2652e71ef
+       VPSHLDVD 15(R8)(R14*4), Y3, K6, Y5                 // 6292652e71acb00f000000
+       VPSHLDVD -7(CX)(DX*4), Y3, K6, Y5                  // 62f2652e71ac91f9ffffff
+       VPSHLDVD Z22, Z8, K3, Z14                          // 62323d4b71f6
+       VPSHLDVD Z25, Z8, K3, Z14                          // 62123d4b71f1
+       VPSHLDVD 15(R8)(R14*1), Z8, K3, Z14                // 62123d4b71b4300f000000
+       VPSHLDVD 15(R8)(R14*2), Z8, K3, Z14                // 62123d4b71b4700f000000
+       VPSHLDVD Z22, Z24, K3, Z14                         // 62323d4371f6
+       VPSHLDVD Z25, Z24, K3, Z14                         // 62123d4371f1
+       VPSHLDVD 15(R8)(R14*1), Z24, K3, Z14               // 62123d4371b4300f000000
+       VPSHLDVD 15(R8)(R14*2), Z24, K3, Z14               // 62123d4371b4700f000000
+       VPSHLDVD Z22, Z8, K3, Z7                           // 62b23d4b71fe
+       VPSHLDVD Z25, Z8, K3, Z7                           // 62923d4b71f9
+       VPSHLDVD 15(R8)(R14*1), Z8, K3, Z7                 // 62923d4b71bc300f000000
+       VPSHLDVD 15(R8)(R14*2), Z8, K3, Z7                 // 62923d4b71bc700f000000
+       VPSHLDVD Z22, Z24, K3, Z7                          // 62b23d4371fe
+       VPSHLDVD Z25, Z24, K3, Z7                          // 62923d4371f9
+       VPSHLDVD 15(R8)(R14*1), Z24, K3, Z7                // 62923d4371bc300f000000
+       VPSHLDVD 15(R8)(R14*2), Z24, K3, Z7                // 62923d4371bc700f000000
+       VPSHLDVQ X3, X17, K7, X12                          // 6272f50771e3
+       VPSHLDVQ X26, X17, K7, X12                         // 6212f50771e2
+       VPSHLDVQ X23, X17, K7, X12                         // 6232f50771e7
+       VPSHLDVQ 99(R15)(R15*1), X17, K7, X12              // 6212f50771a43f63000000
+       VPSHLDVQ (DX), X17, K7, X12                        // 6272f5077122
+       VPSHLDVQ X3, X15, K7, X12                          // 6272850f71e3
+       VPSHLDVQ X26, X15, K7, X12                         // 6212850f71e2
+       VPSHLDVQ X23, X15, K7, X12                         // 6232850f71e7
+       VPSHLDVQ 99(R15)(R15*1), X15, K7, X12              // 6212850f71a43f63000000
+       VPSHLDVQ (DX), X15, K7, X12                        // 6272850f7122
+       VPSHLDVQ X3, X8, K7, X12                           // 6272bd0f71e3
+       VPSHLDVQ X26, X8, K7, X12                          // 6212bd0f71e2
+       VPSHLDVQ X23, X8, K7, X12                          // 6232bd0f71e7
+       VPSHLDVQ 99(R15)(R15*1), X8, K7, X12               // 6212bd0f71a43f63000000
+       VPSHLDVQ (DX), X8, K7, X12                         // 6272bd0f7122
+       VPSHLDVQ X3, X17, K7, X14                          // 6272f50771f3
+       VPSHLDVQ X26, X17, K7, X14                         // 6212f50771f2
+       VPSHLDVQ X23, X17, K7, X14                         // 6232f50771f7
+       VPSHLDVQ 99(R15)(R15*1), X17, K7, X14              // 6212f50771b43f63000000
+       VPSHLDVQ (DX), X17, K7, X14                        // 6272f5077132
+       VPSHLDVQ X3, X15, K7, X14                          // 6272850f71f3
+       VPSHLDVQ X26, X15, K7, X14                         // 6212850f71f2
+       VPSHLDVQ X23, X15, K7, X14                         // 6232850f71f7
+       VPSHLDVQ 99(R15)(R15*1), X15, K7, X14              // 6212850f71b43f63000000
+       VPSHLDVQ (DX), X15, K7, X14                        // 6272850f7132
+       VPSHLDVQ X3, X8, K7, X14                           // 6272bd0f71f3
+       VPSHLDVQ X26, X8, K7, X14                          // 6212bd0f71f2
+       VPSHLDVQ X23, X8, K7, X14                          // 6232bd0f71f7
+       VPSHLDVQ 99(R15)(R15*1), X8, K7, X14               // 6212bd0f71b43f63000000
+       VPSHLDVQ (DX), X8, K7, X14                         // 6272bd0f7132
+       VPSHLDVQ X3, X17, K7, X5                           // 62f2f50771eb
+       VPSHLDVQ X26, X17, K7, X5                          // 6292f50771ea
+       VPSHLDVQ X23, X17, K7, X5                          // 62b2f50771ef
+       VPSHLDVQ 99(R15)(R15*1), X17, K7, X5               // 6292f50771ac3f63000000
+       VPSHLDVQ (DX), X17, K7, X5                         // 62f2f507712a
+       VPSHLDVQ X3, X15, K7, X5                           // 62f2850f71eb
+       VPSHLDVQ X26, X15, K7, X5                          // 6292850f71ea
+       VPSHLDVQ X23, X15, K7, X5                          // 62b2850f71ef
+       VPSHLDVQ 99(R15)(R15*1), X15, K7, X5               // 6292850f71ac3f63000000
+       VPSHLDVQ (DX), X15, K7, X5                         // 62f2850f712a
+       VPSHLDVQ X3, X8, K7, X5                            // 62f2bd0f71eb
+       VPSHLDVQ X26, X8, K7, X5                           // 6292bd0f71ea
+       VPSHLDVQ X23, X8, K7, X5                           // 62b2bd0f71ef
+       VPSHLDVQ 99(R15)(R15*1), X8, K7, X5                // 6292bd0f71ac3f63000000
+       VPSHLDVQ (DX), X8, K7, X5                          // 62f2bd0f712a
+       VPSHLDVQ Y17, Y12, K4, Y0                          // 62b29d2c71c1
+       VPSHLDVQ Y7, Y12, K4, Y0                           // 62f29d2c71c7
+       VPSHLDVQ Y9, Y12, K4, Y0                           // 62d29d2c71c1
+       VPSHLDVQ (R8), Y12, K4, Y0                         // 62d29d2c7100
+       VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y0                 // 62f29d2c71845a0f000000
+       VPSHLDVQ Y17, Y1, K4, Y0                           // 62b2f52c71c1
+       VPSHLDVQ Y7, Y1, K4, Y0                            // 62f2f52c71c7
+       VPSHLDVQ Y9, Y1, K4, Y0                            // 62d2f52c71c1
+       VPSHLDVQ (R8), Y1, K4, Y0                          // 62d2f52c7100
+       VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y0                  // 62f2f52c71845a0f000000
+       VPSHLDVQ Y17, Y14, K4, Y0                          // 62b28d2c71c1
+       VPSHLDVQ Y7, Y14, K4, Y0                           // 62f28d2c71c7
+       VPSHLDVQ Y9, Y14, K4, Y0                           // 62d28d2c71c1
+       VPSHLDVQ (R8), Y14, K4, Y0                         // 62d28d2c7100
+       VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y0                 // 62f28d2c71845a0f000000
+       VPSHLDVQ Y17, Y12, K4, Y22                         // 62a29d2c71f1
+       VPSHLDVQ Y7, Y12, K4, Y22                          // 62e29d2c71f7
+       VPSHLDVQ Y9, Y12, K4, Y22                          // 62c29d2c71f1
+       VPSHLDVQ (R8), Y12, K4, Y22                        // 62c29d2c7130
+       VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y22                // 62e29d2c71b45a0f000000
+       VPSHLDVQ Y17, Y1, K4, Y22                          // 62a2f52c71f1
+       VPSHLDVQ Y7, Y1, K4, Y22                           // 62e2f52c71f7
+       VPSHLDVQ Y9, Y1, K4, Y22                           // 62c2f52c71f1
+       VPSHLDVQ (R8), Y1, K4, Y22                         // 62c2f52c7130
+       VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y22                 // 62e2f52c71b45a0f000000
+       VPSHLDVQ Y17, Y14, K4, Y22                         // 62a28d2c71f1
+       VPSHLDVQ Y7, Y14, K4, Y22                          // 62e28d2c71f7
+       VPSHLDVQ Y9, Y14, K4, Y22                          // 62c28d2c71f1
+       VPSHLDVQ (R8), Y14, K4, Y22                        // 62c28d2c7130
+       VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y22                // 62e28d2c71b45a0f000000
+       VPSHLDVQ Y17, Y12, K4, Y13                         // 62329d2c71e9
+       VPSHLDVQ Y7, Y12, K4, Y13                          // 62729d2c71ef
+       VPSHLDVQ Y9, Y12, K4, Y13                          // 62529d2c71e9
+       VPSHLDVQ (R8), Y12, K4, Y13                        // 62529d2c7128
+       VPSHLDVQ 15(DX)(BX*2), Y12, K4, Y13                // 62729d2c71ac5a0f000000
+       VPSHLDVQ Y17, Y1, K4, Y13                          // 6232f52c71e9
+       VPSHLDVQ Y7, Y1, K4, Y13                           // 6272f52c71ef
+       VPSHLDVQ Y9, Y1, K4, Y13                           // 6252f52c71e9
+       VPSHLDVQ (R8), Y1, K4, Y13                         // 6252f52c7128
+       VPSHLDVQ 15(DX)(BX*2), Y1, K4, Y13                 // 6272f52c71ac5a0f000000
+       VPSHLDVQ Y17, Y14, K4, Y13                         // 62328d2c71e9
+       VPSHLDVQ Y7, Y14, K4, Y13                          // 62728d2c71ef
+       VPSHLDVQ Y9, Y14, K4, Y13                          // 62528d2c71e9
+       VPSHLDVQ (R8), Y14, K4, Y13                        // 62528d2c7128
+       VPSHLDVQ 15(DX)(BX*2), Y14, K4, Y13                // 62728d2c71ac5a0f000000
+       VPSHLDVQ Z0, Z6, K4, Z1                            // 62f2cd4c71c8
+       VPSHLDVQ Z8, Z6, K4, Z1                            // 62d2cd4c71c8
+       VPSHLDVQ (R14), Z6, K4, Z1                         // 62d2cd4c710e
+       VPSHLDVQ -7(DI)(R8*8), Z6, K4, Z1                  // 62b2cd4c718cc7f9ffffff
+       VPSHLDVQ Z0, Z2, K4, Z1                            // 62f2ed4c71c8
+       VPSHLDVQ Z8, Z2, K4, Z1                            // 62d2ed4c71c8
+       VPSHLDVQ (R14), Z2, K4, Z1                         // 62d2ed4c710e
+       VPSHLDVQ -7(DI)(R8*8), Z2, K4, Z1                  // 62b2ed4c718cc7f9ffffff
+       VPSHLDVQ Z0, Z6, K4, Z16                           // 62e2cd4c71c0
+       VPSHLDVQ Z8, Z6, K4, Z16                           // 62c2cd4c71c0
+       VPSHLDVQ (R14), Z6, K4, Z16                        // 62c2cd4c7106
+       VPSHLDVQ -7(DI)(R8*8), Z6, K4, Z16                 // 62a2cd4c7184c7f9ffffff
+       VPSHLDVQ Z0, Z2, K4, Z16                           // 62e2ed4c71c0
+       VPSHLDVQ Z8, Z2, K4, Z16                           // 62c2ed4c71c0
+       VPSHLDVQ (R14), Z2, K4, Z16                        // 62c2ed4c7106
+       VPSHLDVQ -7(DI)(R8*8), Z2, K4, Z16                 // 62a2ed4c7184c7f9ffffff
+       VPSHLDVW X18, X9, K7, X13                          // 6232b50f70ea
+       VPSHLDVW X21, X9, K7, X13                          // 6232b50f70ed
+       VPSHLDVW X1, X9, K7, X13                           // 6272b50f70e9
+       VPSHLDVW -17(BP)(SI*8), X9, K7, X13                // 6272b50f70acf5efffffff
+       VPSHLDVW (R15), X9, K7, X13                        // 6252b50f702f
+       VPSHLDVW X18, X15, K7, X13                         // 6232850f70ea
+       VPSHLDVW X21, X15, K7, X13                         // 6232850f70ed
+       VPSHLDVW X1, X15, K7, X13                          // 6272850f70e9
+       VPSHLDVW -17(BP)(SI*8), X15, K7, X13               // 6272850f70acf5efffffff
+       VPSHLDVW (R15), X15, K7, X13                       // 6252850f702f
+       VPSHLDVW X18, X26, K7, X13                         // 6232ad0770ea
+       VPSHLDVW X21, X26, K7, X13                         // 6232ad0770ed
+       VPSHLDVW X1, X26, K7, X13                          // 6272ad0770e9
+       VPSHLDVW -17(BP)(SI*8), X26, K7, X13               // 6272ad0770acf5efffffff
+       VPSHLDVW (R15), X26, K7, X13                       // 6252ad07702f
+       VPSHLDVW X18, X9, K7, X28                          // 6222b50f70e2
+       VPSHLDVW X21, X9, K7, X28                          // 6222b50f70e5
+       VPSHLDVW X1, X9, K7, X28                           // 6262b50f70e1
+       VPSHLDVW -17(BP)(SI*8), X9, K7, X28                // 6262b50f70a4f5efffffff
+       VPSHLDVW (R15), X9, K7, X28                        // 6242b50f7027
+       VPSHLDVW X18, X15, K7, X28                         // 6222850f70e2
+       VPSHLDVW X21, X15, K7, X28                         // 6222850f70e5
+       VPSHLDVW X1, X15, K7, X28                          // 6262850f70e1
+       VPSHLDVW -17(BP)(SI*8), X15, K7, X28               // 6262850f70a4f5efffffff
+       VPSHLDVW (R15), X15, K7, X28                       // 6242850f7027
+       VPSHLDVW X18, X26, K7, X28                         // 6222ad0770e2
+       VPSHLDVW X21, X26, K7, X28                         // 6222ad0770e5
+       VPSHLDVW X1, X26, K7, X28                          // 6262ad0770e1
+       VPSHLDVW -17(BP)(SI*8), X26, K7, X28               // 6262ad0770a4f5efffffff
+       VPSHLDVW (R15), X26, K7, X28                       // 6242ad077027
+       VPSHLDVW X18, X9, K7, X24                          // 6222b50f70c2
+       VPSHLDVW X21, X9, K7, X24                          // 6222b50f70c5
+       VPSHLDVW X1, X9, K7, X24                           // 6262b50f70c1
+       VPSHLDVW -17(BP)(SI*8), X9, K7, X24                // 6262b50f7084f5efffffff
+       VPSHLDVW (R15), X9, K7, X24                        // 6242b50f7007
+       VPSHLDVW X18, X15, K7, X24                         // 6222850f70c2
+       VPSHLDVW X21, X15, K7, X24                         // 6222850f70c5
+       VPSHLDVW X1, X15, K7, X24                          // 6262850f70c1
+       VPSHLDVW -17(BP)(SI*8), X15, K7, X24               // 6262850f7084f5efffffff
+       VPSHLDVW (R15), X15, K7, X24                       // 6242850f7007
+       VPSHLDVW X18, X26, K7, X24                         // 6222ad0770c2
+       VPSHLDVW X21, X26, K7, X24                         // 6222ad0770c5
+       VPSHLDVW X1, X26, K7, X24                          // 6262ad0770c1
+       VPSHLDVW -17(BP)(SI*8), X26, K7, X24               // 6262ad077084f5efffffff
+       VPSHLDVW (R15), X26, K7, X24                       // 6242ad077007
+       VPSHLDVW Y2, Y28, K2, Y31                          // 62629d2270fa
+       VPSHLDVW Y21, Y28, K2, Y31                         // 62229d2270fd
+       VPSHLDVW Y12, Y28, K2, Y31                         // 62429d2270fc
+       VPSHLDVW 17(SP)(BP*1), Y28, K2, Y31                // 62629d2270bc2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y28, K2, Y31                // 62629d2270bcd1f9ffffff
+       VPSHLDVW Y2, Y13, K2, Y31                          // 6262952a70fa
+       VPSHLDVW Y21, Y13, K2, Y31                         // 6222952a70fd
+       VPSHLDVW Y12, Y13, K2, Y31                         // 6242952a70fc
+       VPSHLDVW 17(SP)(BP*1), Y13, K2, Y31                // 6262952a70bc2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y13, K2, Y31                // 6262952a70bcd1f9ffffff
+       VPSHLDVW Y2, Y7, K2, Y31                           // 6262c52a70fa
+       VPSHLDVW Y21, Y7, K2, Y31                          // 6222c52a70fd
+       VPSHLDVW Y12, Y7, K2, Y31                          // 6242c52a70fc
+       VPSHLDVW 17(SP)(BP*1), Y7, K2, Y31                 // 6262c52a70bc2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y7, K2, Y31                 // 6262c52a70bcd1f9ffffff
+       VPSHLDVW Y2, Y28, K2, Y8                           // 62729d2270c2
+       VPSHLDVW Y21, Y28, K2, Y8                          // 62329d2270c5
+       VPSHLDVW Y12, Y28, K2, Y8                          // 62529d2270c4
+       VPSHLDVW 17(SP)(BP*1), Y28, K2, Y8                 // 62729d2270842c11000000
+       VPSHLDVW -7(CX)(DX*8), Y28, K2, Y8                 // 62729d227084d1f9ffffff
+       VPSHLDVW Y2, Y13, K2, Y8                           // 6272952a70c2
+       VPSHLDVW Y21, Y13, K2, Y8                          // 6232952a70c5
+       VPSHLDVW Y12, Y13, K2, Y8                          // 6252952a70c4
+       VPSHLDVW 17(SP)(BP*1), Y13, K2, Y8                 // 6272952a70842c11000000
+       VPSHLDVW -7(CX)(DX*8), Y13, K2, Y8                 // 6272952a7084d1f9ffffff
+       VPSHLDVW Y2, Y7, K2, Y8                            // 6272c52a70c2
+       VPSHLDVW Y21, Y7, K2, Y8                           // 6232c52a70c5
+       VPSHLDVW Y12, Y7, K2, Y8                           // 6252c52a70c4
+       VPSHLDVW 17(SP)(BP*1), Y7, K2, Y8                  // 6272c52a70842c11000000
+       VPSHLDVW -7(CX)(DX*8), Y7, K2, Y8                  // 6272c52a7084d1f9ffffff
+       VPSHLDVW Y2, Y28, K2, Y1                           // 62f29d2270ca
+       VPSHLDVW Y21, Y28, K2, Y1                          // 62b29d2270cd
+       VPSHLDVW Y12, Y28, K2, Y1                          // 62d29d2270cc
+       VPSHLDVW 17(SP)(BP*1), Y28, K2, Y1                 // 62f29d22708c2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y28, K2, Y1                 // 62f29d22708cd1f9ffffff
+       VPSHLDVW Y2, Y13, K2, Y1                           // 62f2952a70ca
+       VPSHLDVW Y21, Y13, K2, Y1                          // 62b2952a70cd
+       VPSHLDVW Y12, Y13, K2, Y1                          // 62d2952a70cc
+       VPSHLDVW 17(SP)(BP*1), Y13, K2, Y1                 // 62f2952a708c2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y13, K2, Y1                 // 62f2952a708cd1f9ffffff
+       VPSHLDVW Y2, Y7, K2, Y1                            // 62f2c52a70ca
+       VPSHLDVW Y21, Y7, K2, Y1                           // 62b2c52a70cd
+       VPSHLDVW Y12, Y7, K2, Y1                           // 62d2c52a70cc
+       VPSHLDVW 17(SP)(BP*1), Y7, K2, Y1                  // 62f2c52a708c2c11000000
+       VPSHLDVW -7(CX)(DX*8), Y7, K2, Y1                  // 62f2c52a708cd1f9ffffff
+       VPSHLDVW Z11, Z14, K5, Z15                         // 62528d4d70fb
+       VPSHLDVW Z5, Z14, K5, Z15                          // 62728d4d70fd
+       VPSHLDVW 99(R15)(R15*4), Z14, K5, Z15              // 62128d4d70bcbf63000000
+       VPSHLDVW 15(DX), Z14, K5, Z15                      // 62728d4d70ba0f000000
+       VPSHLDVW Z11, Z27, K5, Z15                         // 6252a54570fb
+       VPSHLDVW Z5, Z27, K5, Z15                          // 6272a54570fd
+       VPSHLDVW 99(R15)(R15*4), Z27, K5, Z15              // 6212a54570bcbf63000000
+       VPSHLDVW 15(DX), Z27, K5, Z15                      // 6272a54570ba0f000000
+       VPSHLDVW Z11, Z14, K5, Z12                         // 62528d4d70e3
+       VPSHLDVW Z5, Z14, K5, Z12                          // 62728d4d70e5
+       VPSHLDVW 99(R15)(R15*4), Z14, K5, Z12              // 62128d4d70a4bf63000000
+       VPSHLDVW 15(DX), Z14, K5, Z12                      // 62728d4d70a20f000000
+       VPSHLDVW Z11, Z27, K5, Z12                         // 6252a54570e3
+       VPSHLDVW Z5, Z27, K5, Z12                          // 6272a54570e5
+       VPSHLDVW 99(R15)(R15*4), Z27, K5, Z12              // 6212a54570a4bf63000000
+       VPSHLDVW 15(DX), Z27, K5, Z12                      // 6272a54570a20f000000
+       VPSHLDW $65, X24, X7, K3, X11                      // 6213c50b70d841
+       VPSHLDW $65, X20, X7, K3, X11                      // 6233c50b70dc41
+       VPSHLDW $65, X7, X7, K3, X11                       // 6273c50b70df41
+       VPSHLDW $65, 7(SI)(DI*8), X7, K3, X11              // 6273c50b709cfe0700000041
+       VPSHLDW $65, -15(R14), X7, K3, X11                 // 6253c50b709ef1ffffff41
+       VPSHLDW $65, X24, X0, K3, X11                      // 6213fd0b70d841
+       VPSHLDW $65, X20, X0, K3, X11                      // 6233fd0b70dc41
+       VPSHLDW $65, X7, X0, K3, X11                       // 6273fd0b70df41
+       VPSHLDW $65, 7(SI)(DI*8), X0, K3, X11              // 6273fd0b709cfe0700000041
+       VPSHLDW $65, -15(R14), X0, K3, X11                 // 6253fd0b709ef1ffffff41
+       VPSHLDW $65, X24, X7, K3, X31                      // 6203c50b70f841
+       VPSHLDW $65, X20, X7, K3, X31                      // 6223c50b70fc41
+       VPSHLDW $65, X7, X7, K3, X31                       // 6263c50b70ff41
+       VPSHLDW $65, 7(SI)(DI*8), X7, K3, X31              // 6263c50b70bcfe0700000041
+       VPSHLDW $65, -15(R14), X7, K3, X31                 // 6243c50b70bef1ffffff41
+       VPSHLDW $65, X24, X0, K3, X31                      // 6203fd0b70f841
+       VPSHLDW $65, X20, X0, K3, X31                      // 6223fd0b70fc41
+       VPSHLDW $65, X7, X0, K3, X31                       // 6263fd0b70ff41
+       VPSHLDW $65, 7(SI)(DI*8), X0, K3, X31              // 6263fd0b70bcfe0700000041
+       VPSHLDW $65, -15(R14), X0, K3, X31                 // 6243fd0b70bef1ffffff41
+       VPSHLDW $65, X24, X7, K3, X3                       // 6293c50b70d841
+       VPSHLDW $65, X20, X7, K3, X3                       // 62b3c50b70dc41
+       VPSHLDW $65, X7, X7, K3, X3                        // 62f3c50b70df41
+       VPSHLDW $65, 7(SI)(DI*8), X7, K3, X3               // 62f3c50b709cfe0700000041
+       VPSHLDW $65, -15(R14), X7, K3, X3                  // 62d3c50b709ef1ffffff41
+       VPSHLDW $65, X24, X0, K3, X3                       // 6293fd0b70d841
+       VPSHLDW $65, X20, X0, K3, X3                       // 62b3fd0b70dc41
+       VPSHLDW $65, X7, X0, K3, X3                        // 62f3fd0b70df41
+       VPSHLDW $65, 7(SI)(DI*8), X0, K3, X3               // 62f3fd0b709cfe0700000041
+       VPSHLDW $65, -15(R14), X0, K3, X3                  // 62d3fd0b709ef1ffffff41
+       VPSHLDW $67, Y12, Y3, K4, Y9                       // 6253e52c70cc43
+       VPSHLDW $67, Y21, Y3, K4, Y9                       // 6233e52c70cd43
+       VPSHLDW $67, Y14, Y3, K4, Y9                       // 6253e52c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y3, K4, Y9             // 6273e52c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y3, K4, Y9               // 6273e52c708c480700000043
+       VPSHLDW $67, Y12, Y2, K4, Y9                       // 6253ed2c70cc43
+       VPSHLDW $67, Y21, Y2, K4, Y9                       // 6233ed2c70cd43
+       VPSHLDW $67, Y14, Y2, K4, Y9                       // 6253ed2c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y2, K4, Y9             // 6273ed2c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y2, K4, Y9               // 6273ed2c708c480700000043
+       VPSHLDW $67, Y12, Y9, K4, Y9                       // 6253b52c70cc43
+       VPSHLDW $67, Y21, Y9, K4, Y9                       // 6233b52c70cd43
+       VPSHLDW $67, Y14, Y9, K4, Y9                       // 6253b52c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y9, K4, Y9             // 6273b52c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y9, K4, Y9               // 6273b52c708c480700000043
+       VPSHLDW $67, Y12, Y3, K4, Y1                       // 62d3e52c70cc43
+       VPSHLDW $67, Y21, Y3, K4, Y1                       // 62b3e52c70cd43
+       VPSHLDW $67, Y14, Y3, K4, Y1                       // 62d3e52c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y3, K4, Y1             // 62f3e52c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y3, K4, Y1               // 62f3e52c708c480700000043
+       VPSHLDW $67, Y12, Y2, K4, Y1                       // 62d3ed2c70cc43
+       VPSHLDW $67, Y21, Y2, K4, Y1                       // 62b3ed2c70cd43
+       VPSHLDW $67, Y14, Y2, K4, Y1                       // 62d3ed2c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y2, K4, Y1             // 62f3ed2c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y2, K4, Y1               // 62f3ed2c708c480700000043
+       VPSHLDW $67, Y12, Y9, K4, Y1                       // 62d3b52c70cc43
+       VPSHLDW $67, Y21, Y9, K4, Y1                       // 62b3b52c70cd43
+       VPSHLDW $67, Y14, Y9, K4, Y1                       // 62d3b52c70ce43
+       VPSHLDW $67, -17(BP)(SI*2), Y9, K4, Y1             // 62f3b52c708c75efffffff43
+       VPSHLDW $67, 7(AX)(CX*2), Y9, K4, Y1               // 62f3b52c708c480700000043
+       VPSHLDW $127, Z2, Z5, K2, Z13                      // 6273d54a70ea7f
+       VPSHLDW $127, (CX), Z5, K2, Z13                    // 6273d54a70297f
+       VPSHLDW $127, 99(R15), Z5, K2, Z13                 // 6253d54a70af630000007f
+       VPSHLDW $127, Z2, Z23, K2, Z13                     // 6273c54270ea7f
+       VPSHLDW $127, (CX), Z23, K2, Z13                   // 6273c54270297f
+       VPSHLDW $127, 99(R15), Z23, K2, Z13                // 6253c54270af630000007f
+       VPSHLDW $127, Z2, Z5, K2, Z14                      // 6273d54a70f27f
+       VPSHLDW $127, (CX), Z5, K2, Z14                    // 6273d54a70317f
+       VPSHLDW $127, 99(R15), Z5, K2, Z14                 // 6253d54a70b7630000007f
+       VPSHLDW $127, Z2, Z23, K2, Z14                     // 6273c54270f27f
+       VPSHLDW $127, (CX), Z23, K2, Z14                   // 6273c54270317f
+       VPSHLDW $127, 99(R15), Z23, K2, Z14                // 6253c54270b7630000007f
+       VPSHRDD $0, X21, X5, K2, X9                        // 6233550a73cd00
+       VPSHRDD $0, X1, X5, K2, X9                         // 6273550a73c900
+       VPSHRDD $0, X11, X5, K2, X9                        // 6253550a73cb00
+       VPSHRDD $0, 7(SI)(DI*1), X5, K2, X9                // 6273550a738c3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X5, K2, X9               // 6273550a738cda0f00000000
+       VPSHRDD $0, X21, X31, K2, X9                       // 6233050273cd00
+       VPSHRDD $0, X1, X31, K2, X9                        // 6273050273c900
+       VPSHRDD $0, X11, X31, K2, X9                       // 6253050273cb00
+       VPSHRDD $0, 7(SI)(DI*1), X31, K2, X9               // 62730502738c3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X31, K2, X9              // 62730502738cda0f00000000
+       VPSHRDD $0, X21, X3, K2, X9                        // 6233650a73cd00
+       VPSHRDD $0, X1, X3, K2, X9                         // 6273650a73c900
+       VPSHRDD $0, X11, X3, K2, X9                        // 6253650a73cb00
+       VPSHRDD $0, 7(SI)(DI*1), X3, K2, X9                // 6273650a738c3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X3, K2, X9               // 6273650a738cda0f00000000
+       VPSHRDD $0, X21, X5, K2, X7                        // 62b3550a73fd00
+       VPSHRDD $0, X1, X5, K2, X7                         // 62f3550a73f900
+       VPSHRDD $0, X11, X5, K2, X7                        // 62d3550a73fb00
+       VPSHRDD $0, 7(SI)(DI*1), X5, K2, X7                // 62f3550a73bc3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X5, K2, X7               // 62f3550a73bcda0f00000000
+       VPSHRDD $0, X21, X31, K2, X7                       // 62b3050273fd00
+       VPSHRDD $0, X1, X31, K2, X7                        // 62f3050273f900
+       VPSHRDD $0, X11, X31, K2, X7                       // 62d3050273fb00
+       VPSHRDD $0, 7(SI)(DI*1), X31, K2, X7               // 62f3050273bc3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X31, K2, X7              // 62f3050273bcda0f00000000
+       VPSHRDD $0, X21, X3, K2, X7                        // 62b3650a73fd00
+       VPSHRDD $0, X1, X3, K2, X7                         // 62f3650a73f900
+       VPSHRDD $0, X11, X3, K2, X7                        // 62d3650a73fb00
+       VPSHRDD $0, 7(SI)(DI*1), X3, K2, X7                // 62f3650a73bc3e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X3, K2, X7               // 62f3650a73bcda0f00000000
+       VPSHRDD $0, X21, X5, K2, X14                       // 6233550a73f500
+       VPSHRDD $0, X1, X5, K2, X14                        // 6273550a73f100
+       VPSHRDD $0, X11, X5, K2, X14                       // 6253550a73f300
+       VPSHRDD $0, 7(SI)(DI*1), X5, K2, X14               // 6273550a73b43e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X5, K2, X14              // 6273550a73b4da0f00000000
+       VPSHRDD $0, X21, X31, K2, X14                      // 6233050273f500
+       VPSHRDD $0, X1, X31, K2, X14                       // 6273050273f100
+       VPSHRDD $0, X11, X31, K2, X14                      // 6253050273f300
+       VPSHRDD $0, 7(SI)(DI*1), X31, K2, X14              // 6273050273b43e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X31, K2, X14             // 6273050273b4da0f00000000
+       VPSHRDD $0, X21, X3, K2, X14                       // 6233650a73f500
+       VPSHRDD $0, X1, X3, K2, X14                        // 6273650a73f100
+       VPSHRDD $0, X11, X3, K2, X14                       // 6253650a73f300
+       VPSHRDD $0, 7(SI)(DI*1), X3, K2, X14               // 6273650a73b43e0700000000
+       VPSHRDD $0, 15(DX)(BX*8), X3, K2, X14              // 6273650a73b4da0f00000000
+       VPSHRDD $97, Y31, Y16, K3, Y30                     // 62037d2373f761
+       VPSHRDD $97, Y22, Y16, K3, Y30                     // 62237d2373f661
+       VPSHRDD $97, Y6, Y16, K3, Y30                      // 62637d2373f661
+       VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y30           // 62037d2373b4300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y30           // 62037d2373b4700f00000061
+       VPSHRDD $97, Y31, Y1, K3, Y30                      // 6203752b73f761
+       VPSHRDD $97, Y22, Y1, K3, Y30                      // 6223752b73f661
+       VPSHRDD $97, Y6, Y1, K3, Y30                       // 6263752b73f661
+       VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y30            // 6203752b73b4300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y30            // 6203752b73b4700f00000061
+       VPSHRDD $97, Y31, Y30, K3, Y30                     // 62030d2373f761
+       VPSHRDD $97, Y22, Y30, K3, Y30                     // 62230d2373f661
+       VPSHRDD $97, Y6, Y30, K3, Y30                      // 62630d2373f661
+       VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y30           // 62030d2373b4300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y30           // 62030d2373b4700f00000061
+       VPSHRDD $97, Y31, Y16, K3, Y26                     // 62037d2373d761
+       VPSHRDD $97, Y22, Y16, K3, Y26                     // 62237d2373d661
+       VPSHRDD $97, Y6, Y16, K3, Y26                      // 62637d2373d661
+       VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y26           // 62037d237394300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y26           // 62037d237394700f00000061
+       VPSHRDD $97, Y31, Y1, K3, Y26                      // 6203752b73d761
+       VPSHRDD $97, Y22, Y1, K3, Y26                      // 6223752b73d661
+       VPSHRDD $97, Y6, Y1, K3, Y26                       // 6263752b73d661
+       VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y26            // 6203752b7394300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y26            // 6203752b7394700f00000061
+       VPSHRDD $97, Y31, Y30, K3, Y26                     // 62030d2373d761
+       VPSHRDD $97, Y22, Y30, K3, Y26                     // 62230d2373d661
+       VPSHRDD $97, Y6, Y30, K3, Y26                      // 62630d2373d661
+       VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y26           // 62030d237394300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y26           // 62030d237394700f00000061
+       VPSHRDD $97, Y31, Y16, K3, Y7                      // 62937d2373ff61
+       VPSHRDD $97, Y22, Y16, K3, Y7                      // 62b37d2373fe61
+       VPSHRDD $97, Y6, Y16, K3, Y7                       // 62f37d2373fe61
+       VPSHRDD $97, 15(R8)(R14*1), Y16, K3, Y7            // 62937d2373bc300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y16, K3, Y7            // 62937d2373bc700f00000061
+       VPSHRDD $97, Y31, Y1, K3, Y7                       // 6293752b73ff61
+       VPSHRDD $97, Y22, Y1, K3, Y7                       // 62b3752b73fe61
+       VPSHRDD $97, Y6, Y1, K3, Y7                        // 62f3752b73fe61
+       VPSHRDD $97, 15(R8)(R14*1), Y1, K3, Y7             // 6293752b73bc300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y1, K3, Y7             // 6293752b73bc700f00000061
+       VPSHRDD $97, Y31, Y30, K3, Y7                      // 62930d2373ff61
+       VPSHRDD $97, Y22, Y30, K3, Y7                      // 62b30d2373fe61
+       VPSHRDD $97, Y6, Y30, K3, Y7                       // 62f30d2373fe61
+       VPSHRDD $97, 15(R8)(R14*1), Y30, K3, Y7            // 62930d2373bc300f00000061
+       VPSHRDD $97, 15(R8)(R14*2), Y30, K3, Y7            // 62930d2373bc700f00000061
+       VPSHRDD $81, Z28, Z26, K3, Z6                      // 62932d4373f451
+       VPSHRDD $81, Z6, Z26, K3, Z6                       // 62f32d4373f651
+       VPSHRDD $81, 99(R15)(R15*2), Z26, K3, Z6           // 62932d4373b47f6300000051
+       VPSHRDD $81, -7(DI), Z26, K3, Z6                   // 62f32d4373b7f9ffffff51
+       VPSHRDD $81, Z28, Z14, K3, Z6                      // 62930d4b73f451
+       VPSHRDD $81, Z6, Z14, K3, Z6                       // 62f30d4b73f651
+       VPSHRDD $81, 99(R15)(R15*2), Z14, K3, Z6           // 62930d4b73b47f6300000051
+       VPSHRDD $81, -7(DI), Z14, K3, Z6                   // 62f30d4b73b7f9ffffff51
+       VPSHRDD $81, Z28, Z26, K3, Z14                     // 62132d4373f451
+       VPSHRDD $81, Z6, Z26, K3, Z14                      // 62732d4373f651
+       VPSHRDD $81, 99(R15)(R15*2), Z26, K3, Z14          // 62132d4373b47f6300000051
+       VPSHRDD $81, -7(DI), Z26, K3, Z14                  // 62732d4373b7f9ffffff51
+       VPSHRDD $81, Z28, Z14, K3, Z14                     // 62130d4b73f451
+       VPSHRDD $81, Z6, Z14, K3, Z14                      // 62730d4b73f651
+       VPSHRDD $81, 99(R15)(R15*2), Z14, K3, Z14          // 62130d4b73b47f6300000051
+       VPSHRDD $81, -7(DI), Z14, K3, Z14                  // 62730d4b73b7f9ffffff51
+       VPSHRDQ $42, X14, X16, K3, X13                     // 6253fd0373ee2a
+       VPSHRDQ $42, X19, X16, K3, X13                     // 6233fd0373eb2a
+       VPSHRDQ $42, X8, X16, K3, X13                      // 6253fd0373e82a
+       VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X13            // 6233fd0373ac07f9ffffff2a
+       VPSHRDQ $42, (SP), X16, K3, X13                    // 6273fd03732c242a
+       VPSHRDQ $42, X14, X14, K3, X13                     // 62538d0b73ee2a
+       VPSHRDQ $42, X19, X14, K3, X13                     // 62338d0b73eb2a
+       VPSHRDQ $42, X8, X14, K3, X13                      // 62538d0b73e82a
+       VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X13            // 62338d0b73ac07f9ffffff2a
+       VPSHRDQ $42, (SP), X14, K3, X13                    // 62738d0b732c242a
+       VPSHRDQ $42, X14, X11, K3, X13                     // 6253a50b73ee2a
+       VPSHRDQ $42, X19, X11, K3, X13                     // 6233a50b73eb2a
+       VPSHRDQ $42, X8, X11, K3, X13                      // 6253a50b73e82a
+       VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X13            // 6233a50b73ac07f9ffffff2a
+       VPSHRDQ $42, (SP), X11, K3, X13                    // 6273a50b732c242a
+       VPSHRDQ $42, X14, X16, K3, X0                      // 62d3fd0373c62a
+       VPSHRDQ $42, X19, X16, K3, X0                      // 62b3fd0373c32a
+       VPSHRDQ $42, X8, X16, K3, X0                       // 62d3fd0373c02a
+       VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X0             // 62b3fd03738407f9ffffff2a
+       VPSHRDQ $42, (SP), X16, K3, X0                     // 62f3fd037304242a
+       VPSHRDQ $42, X14, X14, K3, X0                      // 62d38d0b73c62a
+       VPSHRDQ $42, X19, X14, K3, X0                      // 62b38d0b73c32a
+       VPSHRDQ $42, X8, X14, K3, X0                       // 62d38d0b73c02a
+       VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X0             // 62b38d0b738407f9ffffff2a
+       VPSHRDQ $42, (SP), X14, K3, X0                     // 62f38d0b7304242a
+       VPSHRDQ $42, X14, X11, K3, X0                      // 62d3a50b73c62a
+       VPSHRDQ $42, X19, X11, K3, X0                      // 62b3a50b73c32a
+       VPSHRDQ $42, X8, X11, K3, X0                       // 62d3a50b73c02a
+       VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X0             // 62b3a50b738407f9ffffff2a
+       VPSHRDQ $42, (SP), X11, K3, X0                     // 62f3a50b7304242a
+       VPSHRDQ $42, X14, X16, K3, X30                     // 6243fd0373f62a
+       VPSHRDQ $42, X19, X16, K3, X30                     // 6223fd0373f32a
+       VPSHRDQ $42, X8, X16, K3, X30                      // 6243fd0373f02a
+       VPSHRDQ $42, -7(DI)(R8*1), X16, K3, X30            // 6223fd0373b407f9ffffff2a
+       VPSHRDQ $42, (SP), X16, K3, X30                    // 6263fd037334242a
+       VPSHRDQ $42, X14, X14, K3, X30                     // 62438d0b73f62a
+       VPSHRDQ $42, X19, X14, K3, X30                     // 62238d0b73f32a
+       VPSHRDQ $42, X8, X14, K3, X30                      // 62438d0b73f02a
+       VPSHRDQ $42, -7(DI)(R8*1), X14, K3, X30            // 62238d0b73b407f9ffffff2a
+       VPSHRDQ $42, (SP), X14, K3, X30                    // 62638d0b7334242a
+       VPSHRDQ $42, X14, X11, K3, X30                     // 6243a50b73f62a
+       VPSHRDQ $42, X19, X11, K3, X30                     // 6223a50b73f32a
+       VPSHRDQ $42, X8, X11, K3, X30                      // 6243a50b73f02a
+       VPSHRDQ $42, -7(DI)(R8*1), X11, K3, X30            // 6223a50b73b407f9ffffff2a
+       VPSHRDQ $42, (SP), X11, K3, X30                    // 6263a50b7334242a
+       VPSHRDQ $79, Y24, Y28, K2, Y21                     // 62839d2273e84f
+       VPSHRDQ $79, Y13, Y28, K2, Y21                     // 62c39d2273ed4f
+       VPSHRDQ $79, Y20, Y28, K2, Y21                     // 62a39d2273ec4f
+       VPSHRDQ $79, (R14), Y28, K2, Y21                   // 62c39d22732e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y21            // 62a39d2273acc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y20, K2, Y21                     // 6283dd2273e84f
+       VPSHRDQ $79, Y13, Y20, K2, Y21                     // 62c3dd2273ed4f
+       VPSHRDQ $79, Y20, Y20, K2, Y21                     // 62a3dd2273ec4f
+       VPSHRDQ $79, (R14), Y20, K2, Y21                   // 62c3dd22732e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y21            // 62a3dd2273acc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y14, K2, Y21                     // 62838d2a73e84f
+       VPSHRDQ $79, Y13, Y14, K2, Y21                     // 62c38d2a73ed4f
+       VPSHRDQ $79, Y20, Y14, K2, Y21                     // 62a38d2a73ec4f
+       VPSHRDQ $79, (R14), Y14, K2, Y21                   // 62c38d2a732e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y21            // 62a38d2a73acc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y28, K2, Y7                      // 62939d2273f84f
+       VPSHRDQ $79, Y13, Y28, K2, Y7                      // 62d39d2273fd4f
+       VPSHRDQ $79, Y20, Y28, K2, Y7                      // 62b39d2273fc4f
+       VPSHRDQ $79, (R14), Y28, K2, Y7                    // 62d39d22733e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y7             // 62b39d2273bcc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y20, K2, Y7                      // 6293dd2273f84f
+       VPSHRDQ $79, Y13, Y20, K2, Y7                      // 62d3dd2273fd4f
+       VPSHRDQ $79, Y20, Y20, K2, Y7                      // 62b3dd2273fc4f
+       VPSHRDQ $79, (R14), Y20, K2, Y7                    // 62d3dd22733e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y7             // 62b3dd2273bcc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y14, K2, Y7                      // 62938d2a73f84f
+       VPSHRDQ $79, Y13, Y14, K2, Y7                      // 62d38d2a73fd4f
+       VPSHRDQ $79, Y20, Y14, K2, Y7                      // 62b38d2a73fc4f
+       VPSHRDQ $79, (R14), Y14, K2, Y7                    // 62d38d2a733e4f
+       VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y7             // 62b38d2a73bcc7f9ffffff4f
+       VPSHRDQ $79, Y24, Y28, K2, Y0                      // 62939d2273c04f
+       VPSHRDQ $79, Y13, Y28, K2, Y0                      // 62d39d2273c54f
+       VPSHRDQ $79, Y20, Y28, K2, Y0                      // 62b39d2273c44f
+       VPSHRDQ $79, (R14), Y28, K2, Y0                    // 62d39d2273064f
+       VPSHRDQ $79, -7(DI)(R8*8), Y28, K2, Y0             // 62b39d227384c7f9ffffff4f
+       VPSHRDQ $79, Y24, Y20, K2, Y0                      // 6293dd2273c04f
+       VPSHRDQ $79, Y13, Y20, K2, Y0                      // 62d3dd2273c54f
+       VPSHRDQ $79, Y20, Y20, K2, Y0                      // 62b3dd2273c44f
+       VPSHRDQ $79, (R14), Y20, K2, Y0                    // 62d3dd2273064f
+       VPSHRDQ $79, -7(DI)(R8*8), Y20, K2, Y0             // 62b3dd227384c7f9ffffff4f
+       VPSHRDQ $79, Y24, Y14, K2, Y0                      // 62938d2a73c04f
+       VPSHRDQ $79, Y13, Y14, K2, Y0                      // 62d38d2a73c54f
+       VPSHRDQ $79, Y20, Y14, K2, Y0                      // 62b38d2a73c44f
+       VPSHRDQ $79, (R14), Y14, K2, Y0                    // 62d38d2a73064f
+       VPSHRDQ $79, -7(DI)(R8*8), Y14, K2, Y0             // 62b38d2a7384c7f9ffffff4f
+       VPSHRDQ $64, Z3, Z26, K1, Z13                      // 6273ad4173eb40
+       VPSHRDQ $64, Z0, Z26, K1, Z13                      // 6273ad4173e840
+       VPSHRDQ $64, -7(CX)(DX*1), Z26, K1, Z13            // 6273ad4173ac11f9ffffff40
+       VPSHRDQ $64, -15(R14)(R15*4), Z26, K1, Z13         // 6213ad4173acbef1ffffff40
+       VPSHRDQ $64, Z3, Z3, K1, Z13                       // 6273e54973eb40
+       VPSHRDQ $64, Z0, Z3, K1, Z13                       // 6273e54973e840
+       VPSHRDQ $64, -7(CX)(DX*1), Z3, K1, Z13             // 6273e54973ac11f9ffffff40
+       VPSHRDQ $64, -15(R14)(R15*4), Z3, K1, Z13          // 6213e54973acbef1ffffff40
+       VPSHRDQ $64, Z3, Z26, K1, Z21                      // 62e3ad4173eb40
+       VPSHRDQ $64, Z0, Z26, K1, Z21                      // 62e3ad4173e840
+       VPSHRDQ $64, -7(CX)(DX*1), Z26, K1, Z21            // 62e3ad4173ac11f9ffffff40
+       VPSHRDQ $64, -15(R14)(R15*4), Z26, K1, Z21         // 6283ad4173acbef1ffffff40
+       VPSHRDQ $64, Z3, Z3, K1, Z21                       // 62e3e54973eb40
+       VPSHRDQ $64, Z0, Z3, K1, Z21                       // 62e3e54973e840
+       VPSHRDQ $64, -7(CX)(DX*1), Z3, K1, Z21             // 62e3e54973ac11f9ffffff40
+       VPSHRDQ $64, -15(R14)(R15*4), Z3, K1, Z21          // 6283e54973acbef1ffffff40
+       VPSHRDVD X23, X12, K2, X8                          // 62321d0a73c7
+       VPSHRDVD X11, X12, K2, X8                          // 62521d0a73c3
+       VPSHRDVD X31, X12, K2, X8                          // 62121d0a73c7
+       VPSHRDVD -7(CX), X12, K2, X8                       // 62721d0a7381f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X12, K2, X8                 // 62721d0a73849a0f000000
+       VPSHRDVD X23, X16, K2, X8                          // 62327d0273c7
+       VPSHRDVD X11, X16, K2, X8                          // 62527d0273c3
+       VPSHRDVD X31, X16, K2, X8                          // 62127d0273c7
+       VPSHRDVD -7(CX), X16, K2, X8                       // 62727d027381f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X16, K2, X8                 // 62727d0273849a0f000000
+       VPSHRDVD X23, X23, K2, X8                          // 6232450273c7
+       VPSHRDVD X11, X23, K2, X8                          // 6252450273c3
+       VPSHRDVD X31, X23, K2, X8                          // 6212450273c7
+       VPSHRDVD -7(CX), X23, K2, X8                       // 627245027381f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X23, K2, X8                 // 6272450273849a0f000000
+       VPSHRDVD X23, X12, K2, X26                         // 62221d0a73d7
+       VPSHRDVD X11, X12, K2, X26                         // 62421d0a73d3
+       VPSHRDVD X31, X12, K2, X26                         // 62021d0a73d7
+       VPSHRDVD -7(CX), X12, K2, X26                      // 62621d0a7391f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X12, K2, X26                // 62621d0a73949a0f000000
+       VPSHRDVD X23, X16, K2, X26                         // 62227d0273d7
+       VPSHRDVD X11, X16, K2, X26                         // 62427d0273d3
+       VPSHRDVD X31, X16, K2, X26                         // 62027d0273d7
+       VPSHRDVD -7(CX), X16, K2, X26                      // 62627d027391f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X16, K2, X26                // 62627d0273949a0f000000
+       VPSHRDVD X23, X23, K2, X26                         // 6222450273d7
+       VPSHRDVD X11, X23, K2, X26                         // 6242450273d3
+       VPSHRDVD X31, X23, K2, X26                         // 6202450273d7
+       VPSHRDVD -7(CX), X23, K2, X26                      // 626245027391f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X23, K2, X26                // 6262450273949a0f000000
+       VPSHRDVD X23, X12, K2, X23                         // 62a21d0a73ff
+       VPSHRDVD X11, X12, K2, X23                         // 62c21d0a73fb
+       VPSHRDVD X31, X12, K2, X23                         // 62821d0a73ff
+       VPSHRDVD -7(CX), X12, K2, X23                      // 62e21d0a73b9f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X12, K2, X23                // 62e21d0a73bc9a0f000000
+       VPSHRDVD X23, X16, K2, X23                         // 62a27d0273ff
+       VPSHRDVD X11, X16, K2, X23                         // 62c27d0273fb
+       VPSHRDVD X31, X16, K2, X23                         // 62827d0273ff
+       VPSHRDVD -7(CX), X16, K2, X23                      // 62e27d0273b9f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X16, K2, X23                // 62e27d0273bc9a0f000000
+       VPSHRDVD X23, X23, K2, X23                         // 62a2450273ff
+       VPSHRDVD X11, X23, K2, X23                         // 62c2450273fb
+       VPSHRDVD X31, X23, K2, X23                         // 6282450273ff
+       VPSHRDVD -7(CX), X23, K2, X23                      // 62e2450273b9f9ffffff
+       VPSHRDVD 15(DX)(BX*4), X23, K2, X23                // 62e2450273bc9a0f000000
+       VPSHRDVD Y22, Y26, K1, Y14                         // 62322d2173f6
+       VPSHRDVD Y3, Y26, K1, Y14                          // 62722d2173f3
+       VPSHRDVD Y15, Y26, K1, Y14                         // 62522d2173f7
+       VPSHRDVD 99(R15)(R15*4), Y26, K1, Y14              // 62122d2173b4bf63000000
+       VPSHRDVD 15(DX), Y26, K1, Y14                      // 62722d2173b20f000000
+       VPSHRDVD Y22, Y30, K1, Y14                         // 62320d2173f6
+       VPSHRDVD Y3, Y30, K1, Y14                          // 62720d2173f3
+       VPSHRDVD Y15, Y30, K1, Y14                         // 62520d2173f7
+       VPSHRDVD 99(R15)(R15*4), Y30, K1, Y14              // 62120d2173b4bf63000000
+       VPSHRDVD 15(DX), Y30, K1, Y14                      // 62720d2173b20f000000
+       VPSHRDVD Y22, Y12, K1, Y14                         // 62321d2973f6
+       VPSHRDVD Y3, Y12, K1, Y14                          // 62721d2973f3
+       VPSHRDVD Y15, Y12, K1, Y14                         // 62521d2973f7
+       VPSHRDVD 99(R15)(R15*4), Y12, K1, Y14              // 62121d2973b4bf63000000
+       VPSHRDVD 15(DX), Y12, K1, Y14                      // 62721d2973b20f000000
+       VPSHRDVD Y22, Y26, K1, Y21                         // 62a22d2173ee
+       VPSHRDVD Y3, Y26, K1, Y21                          // 62e22d2173eb
+       VPSHRDVD Y15, Y26, K1, Y21                         // 62c22d2173ef
+       VPSHRDVD 99(R15)(R15*4), Y26, K1, Y21              // 62822d2173acbf63000000
+       VPSHRDVD 15(DX), Y26, K1, Y21                      // 62e22d2173aa0f000000
+       VPSHRDVD Y22, Y30, K1, Y21                         // 62a20d2173ee
+       VPSHRDVD Y3, Y30, K1, Y21                          // 62e20d2173eb
+       VPSHRDVD Y15, Y30, K1, Y21                         // 62c20d2173ef
+       VPSHRDVD 99(R15)(R15*4), Y30, K1, Y21              // 62820d2173acbf63000000
+       VPSHRDVD 15(DX), Y30, K1, Y21                      // 62e20d2173aa0f000000
+       VPSHRDVD Y22, Y12, K1, Y21                         // 62a21d2973ee
+       VPSHRDVD Y3, Y12, K1, Y21                          // 62e21d2973eb
+       VPSHRDVD Y15, Y12, K1, Y21                         // 62c21d2973ef
+       VPSHRDVD 99(R15)(R15*4), Y12, K1, Y21              // 62821d2973acbf63000000
+       VPSHRDVD 15(DX), Y12, K1, Y21                      // 62e21d2973aa0f000000
+       VPSHRDVD Y22, Y26, K1, Y1                          // 62b22d2173ce
+       VPSHRDVD Y3, Y26, K1, Y1                           // 62f22d2173cb
+       VPSHRDVD Y15, Y26, K1, Y1                          // 62d22d2173cf
+       VPSHRDVD 99(R15)(R15*4), Y26, K1, Y1               // 62922d21738cbf63000000
+       VPSHRDVD 15(DX), Y26, K1, Y1                       // 62f22d21738a0f000000
+       VPSHRDVD Y22, Y30, K1, Y1                          // 62b20d2173ce
+       VPSHRDVD Y3, Y30, K1, Y1                           // 62f20d2173cb
+       VPSHRDVD Y15, Y30, K1, Y1                          // 62d20d2173cf
+       VPSHRDVD 99(R15)(R15*4), Y30, K1, Y1               // 62920d21738cbf63000000
+       VPSHRDVD 15(DX), Y30, K1, Y1                       // 62f20d21738a0f000000
+       VPSHRDVD Y22, Y12, K1, Y1                          // 62b21d2973ce
+       VPSHRDVD Y3, Y12, K1, Y1                           // 62f21d2973cb
+       VPSHRDVD Y15, Y12, K1, Y1                          // 62d21d2973cf
+       VPSHRDVD 99(R15)(R15*4), Y12, K1, Y1               // 62921d29738cbf63000000
+       VPSHRDVD 15(DX), Y12, K1, Y1                       // 62f21d29738a0f000000
+       VPSHRDVD Z3, Z11, K7, Z21                          // 62e2254f73eb
+       VPSHRDVD Z12, Z11, K7, Z21                         // 62c2254f73ec
+       VPSHRDVD 15(DX)(BX*1), Z11, K7, Z21                // 62e2254f73ac1a0f000000
+       VPSHRDVD -7(CX)(DX*2), Z11, K7, Z21                // 62e2254f73ac51f9ffffff
+       VPSHRDVD Z3, Z25, K7, Z21                          // 62e2354773eb
+       VPSHRDVD Z12, Z25, K7, Z21                         // 62c2354773ec
+       VPSHRDVD 15(DX)(BX*1), Z25, K7, Z21                // 62e2354773ac1a0f000000
+       VPSHRDVD -7(CX)(DX*2), Z25, K7, Z21                // 62e2354773ac51f9ffffff
+       VPSHRDVD Z3, Z11, K7, Z13                          // 6272254f73eb
+       VPSHRDVD Z12, Z11, K7, Z13                         // 6252254f73ec
+       VPSHRDVD 15(DX)(BX*1), Z11, K7, Z13                // 6272254f73ac1a0f000000
+       VPSHRDVD -7(CX)(DX*2), Z11, K7, Z13                // 6272254f73ac51f9ffffff
+       VPSHRDVD Z3, Z25, K7, Z13                          // 6272354773eb
+       VPSHRDVD Z12, Z25, K7, Z13                         // 6252354773ec
+       VPSHRDVD 15(DX)(BX*1), Z25, K7, Z13                // 6272354773ac1a0f000000
+       VPSHRDVD -7(CX)(DX*2), Z25, K7, Z13                // 6272354773ac51f9ffffff
+       VPSHRDVQ X20, X11, K1, X24                         // 6222a50973c4
+       VPSHRDVQ X5, X11, K1, X24                          // 6262a50973c5
+       VPSHRDVQ X25, X11, K1, X24                         // 6202a50973c1
+       VPSHRDVQ 99(R15)(R15*8), X11, K1, X24              // 6202a5097384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X11, K1, X24                 // 6262a5097384c807000000
+       VPSHRDVQ X20, X23, K1, X24                         // 6222c50173c4
+       VPSHRDVQ X5, X23, K1, X24                          // 6262c50173c5
+       VPSHRDVQ X25, X23, K1, X24                         // 6202c50173c1
+       VPSHRDVQ 99(R15)(R15*8), X23, K1, X24              // 6202c5017384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X23, K1, X24                 // 6262c5017384c807000000
+       VPSHRDVQ X20, X2, K1, X24                          // 6222ed0973c4
+       VPSHRDVQ X5, X2, K1, X24                           // 6262ed0973c5
+       VPSHRDVQ X25, X2, K1, X24                          // 6202ed0973c1
+       VPSHRDVQ 99(R15)(R15*8), X2, K1, X24               // 6202ed097384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X2, K1, X24                  // 6262ed097384c807000000
+       VPSHRDVQ X20, X11, K1, X14                         // 6232a50973f4
+       VPSHRDVQ X5, X11, K1, X14                          // 6272a50973f5
+       VPSHRDVQ X25, X11, K1, X14                         // 6212a50973f1
+       VPSHRDVQ 99(R15)(R15*8), X11, K1, X14              // 6212a50973b4ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X11, K1, X14                 // 6272a50973b4c807000000
+       VPSHRDVQ X20, X23, K1, X14                         // 6232c50173f4
+       VPSHRDVQ X5, X23, K1, X14                          // 6272c50173f5
+       VPSHRDVQ X25, X23, K1, X14                         // 6212c50173f1
+       VPSHRDVQ 99(R15)(R15*8), X23, K1, X14              // 6212c50173b4ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X23, K1, X14                 // 6272c50173b4c807000000
+       VPSHRDVQ X20, X2, K1, X14                          // 6232ed0973f4
+       VPSHRDVQ X5, X2, K1, X14                           // 6272ed0973f5
+       VPSHRDVQ X25, X2, K1, X14                          // 6212ed0973f1
+       VPSHRDVQ 99(R15)(R15*8), X2, K1, X14               // 6212ed0973b4ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X2, K1, X14                  // 6272ed0973b4c807000000
+       VPSHRDVQ X20, X11, K1, X0                          // 62b2a50973c4
+       VPSHRDVQ X5, X11, K1, X0                           // 62f2a50973c5
+       VPSHRDVQ X25, X11, K1, X0                          // 6292a50973c1
+       VPSHRDVQ 99(R15)(R15*8), X11, K1, X0               // 6292a5097384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X11, K1, X0                  // 62f2a5097384c807000000
+       VPSHRDVQ X20, X23, K1, X0                          // 62b2c50173c4
+       VPSHRDVQ X5, X23, K1, X0                           // 62f2c50173c5
+       VPSHRDVQ X25, X23, K1, X0                          // 6292c50173c1
+       VPSHRDVQ 99(R15)(R15*8), X23, K1, X0               // 6292c5017384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X23, K1, X0                  // 62f2c5017384c807000000
+       VPSHRDVQ X20, X2, K1, X0                           // 62b2ed0973c4
+       VPSHRDVQ X5, X2, K1, X0                            // 62f2ed0973c5
+       VPSHRDVQ X25, X2, K1, X0                           // 6292ed0973c1
+       VPSHRDVQ 99(R15)(R15*8), X2, K1, X0                // 6292ed097384ff63000000
+       VPSHRDVQ 7(AX)(CX*8), X2, K1, X0                   // 62f2ed097384c807000000
+       VPSHRDVQ Y21, Y5, K1, Y1                           // 62b2d52973cd
+       VPSHRDVQ Y7, Y5, K1, Y1                            // 62f2d52973cf
+       VPSHRDVQ Y30, Y5, K1, Y1                           // 6292d52973ce
+       VPSHRDVQ (CX), Y5, K1, Y1                          // 62f2d5297309
+       VPSHRDVQ 99(R15), Y5, K1, Y1                       // 62d2d529738f63000000
+       VPSHRDVQ Y21, Y17, K1, Y1                          // 62b2f52173cd
+       VPSHRDVQ Y7, Y17, K1, Y1                           // 62f2f52173cf
+       VPSHRDVQ Y30, Y17, K1, Y1                          // 6292f52173ce
+       VPSHRDVQ (CX), Y17, K1, Y1                         // 62f2f5217309
+       VPSHRDVQ 99(R15), Y17, K1, Y1                      // 62d2f521738f63000000
+       VPSHRDVQ Y21, Y13, K1, Y1                          // 62b2952973cd
+       VPSHRDVQ Y7, Y13, K1, Y1                           // 62f2952973cf
+       VPSHRDVQ Y30, Y13, K1, Y1                          // 6292952973ce
+       VPSHRDVQ (CX), Y13, K1, Y1                         // 62f295297309
+       VPSHRDVQ 99(R15), Y13, K1, Y1                      // 62d29529738f63000000
+       VPSHRDVQ Y21, Y5, K1, Y27                          // 6222d52973dd
+       VPSHRDVQ Y7, Y5, K1, Y27                           // 6262d52973df
+       VPSHRDVQ Y30, Y5, K1, Y27                          // 6202d52973de
+       VPSHRDVQ (CX), Y5, K1, Y27                         // 6262d5297319
+       VPSHRDVQ 99(R15), Y5, K1, Y27                      // 6242d529739f63000000
+       VPSHRDVQ Y21, Y17, K1, Y27                         // 6222f52173dd
+       VPSHRDVQ Y7, Y17, K1, Y27                          // 6262f52173df
+       VPSHRDVQ Y30, Y17, K1, Y27                         // 6202f52173de
+       VPSHRDVQ (CX), Y17, K1, Y27                        // 6262f5217319
+       VPSHRDVQ 99(R15), Y17, K1, Y27                     // 6242f521739f63000000
+       VPSHRDVQ Y21, Y13, K1, Y27                         // 6222952973dd
+       VPSHRDVQ Y7, Y13, K1, Y27                          // 6262952973df
+       VPSHRDVQ Y30, Y13, K1, Y27                         // 6202952973de
+       VPSHRDVQ (CX), Y13, K1, Y27                        // 626295297319
+       VPSHRDVQ 99(R15), Y13, K1, Y27                     // 62429529739f63000000
+       VPSHRDVQ Y21, Y5, K1, Y19                          // 62a2d52973dd
+       VPSHRDVQ Y7, Y5, K1, Y19                           // 62e2d52973df
+       VPSHRDVQ Y30, Y5, K1, Y19                          // 6282d52973de
+       VPSHRDVQ (CX), Y5, K1, Y19                         // 62e2d5297319
+       VPSHRDVQ 99(R15), Y5, K1, Y19                      // 62c2d529739f63000000
+       VPSHRDVQ Y21, Y17, K1, Y19                         // 62a2f52173dd
+       VPSHRDVQ Y7, Y17, K1, Y19                          // 62e2f52173df
+       VPSHRDVQ Y30, Y17, K1, Y19                         // 6282f52173de
+       VPSHRDVQ (CX), Y17, K1, Y19                        // 62e2f5217319
+       VPSHRDVQ 99(R15), Y17, K1, Y19                     // 62c2f521739f63000000
+       VPSHRDVQ Y21, Y13, K1, Y19                         // 62a2952973dd
+       VPSHRDVQ Y7, Y13, K1, Y19                          // 62e2952973df
+       VPSHRDVQ Y30, Y13, K1, Y19                         // 6282952973de
+       VPSHRDVQ (CX), Y13, K1, Y19                        // 62e295297319
+       VPSHRDVQ 99(R15), Y13, K1, Y19                     // 62c29529739f63000000
+       VPSHRDVQ Z23, Z23, K1, Z27                         // 6222c54173df
+       VPSHRDVQ Z6, Z23, K1, Z27                          // 6262c54173de
+       VPSHRDVQ -17(BP), Z23, K1, Z27                     // 6262c541739defffffff
+       VPSHRDVQ -15(R14)(R15*8), Z23, K1, Z27             // 6202c541739cfef1ffffff
+       VPSHRDVQ Z23, Z5, K1, Z27                          // 6222d54973df
+       VPSHRDVQ Z6, Z5, K1, Z27                           // 6262d54973de
+       VPSHRDVQ -17(BP), Z5, K1, Z27                      // 6262d549739defffffff
+       VPSHRDVQ -15(R14)(R15*8), Z5, K1, Z27              // 6202d549739cfef1ffffff
+       VPSHRDVQ Z23, Z23, K1, Z15                         // 6232c54173ff
+       VPSHRDVQ Z6, Z23, K1, Z15                          // 6272c54173fe
+       VPSHRDVQ -17(BP), Z23, K1, Z15                     // 6272c54173bdefffffff
+       VPSHRDVQ -15(R14)(R15*8), Z23, K1, Z15             // 6212c54173bcfef1ffffff
+       VPSHRDVQ Z23, Z5, K1, Z15                          // 6232d54973ff
+       VPSHRDVQ Z6, Z5, K1, Z15                           // 6272d54973fe
+       VPSHRDVQ -17(BP), Z5, K1, Z15                      // 6272d54973bdefffffff
+       VPSHRDVQ -15(R14)(R15*8), Z5, K1, Z15              // 6212d54973bcfef1ffffff
+       VPSHRDVW X2, X2, K7, X0                            // 62f2ed0f72c2
+       VPSHRDVW X31, X2, K7, X0                           // 6292ed0f72c7
+       VPSHRDVW X11, X2, K7, X0                           // 62d2ed0f72c3
+       VPSHRDVW (AX), X2, K7, X0                          // 62f2ed0f7200
+       VPSHRDVW 7(SI), X2, K7, X0                         // 62f2ed0f728607000000
+       VPSHRDVW X2, X8, K7, X0                            // 62f2bd0f72c2
+       VPSHRDVW X31, X8, K7, X0                           // 6292bd0f72c7
+       VPSHRDVW X11, X8, K7, X0                           // 62d2bd0f72c3
+       VPSHRDVW (AX), X8, K7, X0                          // 62f2bd0f7200
+       VPSHRDVW 7(SI), X8, K7, X0                         // 62f2bd0f728607000000
+       VPSHRDVW X2, X9, K7, X0                            // 62f2b50f72c2
+       VPSHRDVW X31, X9, K7, X0                           // 6292b50f72c7
+       VPSHRDVW X11, X9, K7, X0                           // 62d2b50f72c3
+       VPSHRDVW (AX), X9, K7, X0                          // 62f2b50f7200
+       VPSHRDVW 7(SI), X9, K7, X0                         // 62f2b50f728607000000
+       VPSHRDVW X2, X2, K7, X9                            // 6272ed0f72ca
+       VPSHRDVW X31, X2, K7, X9                           // 6212ed0f72cf
+       VPSHRDVW X11, X2, K7, X9                           // 6252ed0f72cb
+       VPSHRDVW (AX), X2, K7, X9                          // 6272ed0f7208
+       VPSHRDVW 7(SI), X2, K7, X9                         // 6272ed0f728e07000000
+       VPSHRDVW X2, X8, K7, X9                            // 6272bd0f72ca
+       VPSHRDVW X31, X8, K7, X9                           // 6212bd0f72cf
+       VPSHRDVW X11, X8, K7, X9                           // 6252bd0f72cb
+       VPSHRDVW (AX), X8, K7, X9                          // 6272bd0f7208
+       VPSHRDVW 7(SI), X8, K7, X9                         // 6272bd0f728e07000000
+       VPSHRDVW X2, X9, K7, X9                            // 6272b50f72ca
+       VPSHRDVW X31, X9, K7, X9                           // 6212b50f72cf
+       VPSHRDVW X11, X9, K7, X9                           // 6252b50f72cb
+       VPSHRDVW (AX), X9, K7, X9                          // 6272b50f7208
+       VPSHRDVW 7(SI), X9, K7, X9                         // 6272b50f728e07000000
+       VPSHRDVW X2, X2, K7, X13                           // 6272ed0f72ea
+       VPSHRDVW X31, X2, K7, X13                          // 6212ed0f72ef
+       VPSHRDVW X11, X2, K7, X13                          // 6252ed0f72eb
+       VPSHRDVW (AX), X2, K7, X13                         // 6272ed0f7228
+       VPSHRDVW 7(SI), X2, K7, X13                        // 6272ed0f72ae07000000
+       VPSHRDVW X2, X8, K7, X13                           // 6272bd0f72ea
+       VPSHRDVW X31, X8, K7, X13                          // 6212bd0f72ef
+       VPSHRDVW X11, X8, K7, X13                          // 6252bd0f72eb
+       VPSHRDVW (AX), X8, K7, X13                         // 6272bd0f7228
+       VPSHRDVW 7(SI), X8, K7, X13                        // 6272bd0f72ae07000000
+       VPSHRDVW X2, X9, K7, X13                           // 6272b50f72ea
+       VPSHRDVW X31, X9, K7, X13                          // 6212b50f72ef
+       VPSHRDVW X11, X9, K7, X13                          // 6252b50f72eb
+       VPSHRDVW (AX), X9, K7, X13                         // 6272b50f7228
+       VPSHRDVW 7(SI), X9, K7, X13                        // 6272b50f72ae07000000
+       VPSHRDVW Y5, Y8, K2, Y13                           // 6272bd2a72ed
+       VPSHRDVW Y24, Y8, K2, Y13                          // 6212bd2a72e8
+       VPSHRDVW Y21, Y8, K2, Y13                          // 6232bd2a72ed
+       VPSHRDVW 99(R15)(R15*2), Y8, K2, Y13               // 6212bd2a72ac7f63000000
+       VPSHRDVW -7(DI), Y8, K2, Y13                       // 6272bd2a72aff9ffffff
+       VPSHRDVW Y5, Y11, K2, Y13                          // 6272a52a72ed
+       VPSHRDVW Y24, Y11, K2, Y13                         // 6212a52a72e8
+       VPSHRDVW Y21, Y11, K2, Y13                         // 6232a52a72ed
+       VPSHRDVW 99(R15)(R15*2), Y11, K2, Y13              // 6212a52a72ac7f63000000
+       VPSHRDVW -7(DI), Y11, K2, Y13                      // 6272a52a72aff9ffffff
+       VPSHRDVW Y5, Y24, K2, Y13                          // 6272bd2272ed
+       VPSHRDVW Y24, Y24, K2, Y13                         // 6212bd2272e8
+       VPSHRDVW Y21, Y24, K2, Y13                         // 6232bd2272ed
+       VPSHRDVW 99(R15)(R15*2), Y24, K2, Y13              // 6212bd2272ac7f63000000
+       VPSHRDVW -7(DI), Y24, K2, Y13                      // 6272bd2272aff9ffffff
+       VPSHRDVW Y5, Y8, K2, Y18                           // 62e2bd2a72d5
+       VPSHRDVW Y24, Y8, K2, Y18                          // 6282bd2a72d0
+       VPSHRDVW Y21, Y8, K2, Y18                          // 62a2bd2a72d5
+       VPSHRDVW 99(R15)(R15*2), Y8, K2, Y18               // 6282bd2a72947f63000000
+       VPSHRDVW -7(DI), Y8, K2, Y18                       // 62e2bd2a7297f9ffffff
+       VPSHRDVW Y5, Y11, K2, Y18                          // 62e2a52a72d5
+       VPSHRDVW Y24, Y11, K2, Y18                         // 6282a52a72d0
+       VPSHRDVW Y21, Y11, K2, Y18                         // 62a2a52a72d5
+       VPSHRDVW 99(R15)(R15*2), Y11, K2, Y18              // 6282a52a72947f63000000
+       VPSHRDVW -7(DI), Y11, K2, Y18                      // 62e2a52a7297f9ffffff
+       VPSHRDVW Y5, Y24, K2, Y18                          // 62e2bd2272d5
+       VPSHRDVW Y24, Y24, K2, Y18                         // 6282bd2272d0
+       VPSHRDVW Y21, Y24, K2, Y18                         // 62a2bd2272d5
+       VPSHRDVW 99(R15)(R15*2), Y24, K2, Y18              // 6282bd2272947f63000000
+       VPSHRDVW -7(DI), Y24, K2, Y18                      // 62e2bd227297f9ffffff
+       VPSHRDVW Y5, Y8, K2, Y24                           // 6262bd2a72c5
+       VPSHRDVW Y24, Y8, K2, Y24                          // 6202bd2a72c0
+       VPSHRDVW Y21, Y8, K2, Y24                          // 6222bd2a72c5
+       VPSHRDVW 99(R15)(R15*2), Y8, K2, Y24               // 6202bd2a72847f63000000
+       VPSHRDVW -7(DI), Y8, K2, Y24                       // 6262bd2a7287f9ffffff
+       VPSHRDVW Y5, Y11, K2, Y24                          // 6262a52a72c5
+       VPSHRDVW Y24, Y11, K2, Y24                         // 6202a52a72c0
+       VPSHRDVW Y21, Y11, K2, Y24                         // 6222a52a72c5
+       VPSHRDVW 99(R15)(R15*2), Y11, K2, Y24              // 6202a52a72847f63000000
+       VPSHRDVW -7(DI), Y11, K2, Y24                      // 6262a52a7287f9ffffff
+       VPSHRDVW Y5, Y24, K2, Y24                          // 6262bd2272c5
+       VPSHRDVW Y24, Y24, K2, Y24                         // 6202bd2272c0
+       VPSHRDVW Y21, Y24, K2, Y24                         // 6222bd2272c5
+       VPSHRDVW 99(R15)(R15*2), Y24, K2, Y24              // 6202bd2272847f63000000
+       VPSHRDVW -7(DI), Y24, K2, Y24                      // 6262bd227287f9ffffff
+       VPSHRDVW Z16, Z21, K4, Z8                          // 6232d54472c0
+       VPSHRDVW Z13, Z21, K4, Z8                          // 6252d54472c5
+       VPSHRDVW 17(SP)(BP*2), Z21, K4, Z8                 // 6272d54472846c11000000
+       VPSHRDVW -7(DI)(R8*4), Z21, K4, Z8                 // 6232d544728487f9ffffff
+       VPSHRDVW Z16, Z5, K4, Z8                           // 6232d54c72c0
+       VPSHRDVW Z13, Z5, K4, Z8                           // 6252d54c72c5
+       VPSHRDVW 17(SP)(BP*2), Z5, K4, Z8                  // 6272d54c72846c11000000
+       VPSHRDVW -7(DI)(R8*4), Z5, K4, Z8                  // 6232d54c728487f9ffffff
+       VPSHRDVW Z16, Z21, K4, Z28                         // 6222d54472e0
+       VPSHRDVW Z13, Z21, K4, Z28                         // 6242d54472e5
+       VPSHRDVW 17(SP)(BP*2), Z21, K4, Z28                // 6262d54472a46c11000000
+       VPSHRDVW -7(DI)(R8*4), Z21, K4, Z28                // 6222d54472a487f9ffffff
+       VPSHRDVW Z16, Z5, K4, Z28                          // 6222d54c72e0
+       VPSHRDVW Z13, Z5, K4, Z28                          // 6242d54c72e5
+       VPSHRDVW 17(SP)(BP*2), Z5, K4, Z28                 // 6262d54c72a46c11000000
+       VPSHRDVW -7(DI)(R8*4), Z5, K4, Z28                 // 6222d54c72a487f9ffffff
+       VPSHRDW $27, X15, X0, K1, X22                      // 62c3fd0972f71b
+       VPSHRDW $27, X11, X0, K1, X22                      // 62c3fd0972f31b
+       VPSHRDW $27, X0, X0, K1, X22                       // 62e3fd0972f01b
+       VPSHRDW $27, (BX), X0, K1, X22                     // 62e3fd0972331b
+       VPSHRDW $27, -17(BP)(SI*1), X0, K1, X22            // 62e3fd0972b435efffffff1b
+       VPSHRDW $27, X15, X17, K1, X22                     // 62c3f50172f71b
+       VPSHRDW $27, X11, X17, K1, X22                     // 62c3f50172f31b
+       VPSHRDW $27, X0, X17, K1, X22                      // 62e3f50172f01b
+       VPSHRDW $27, (BX), X17, K1, X22                    // 62e3f50172331b
+       VPSHRDW $27, -17(BP)(SI*1), X17, K1, X22           // 62e3f50172b435efffffff1b
+       VPSHRDW $27, X15, X7, K1, X22                      // 62c3c50972f71b
+       VPSHRDW $27, X11, X7, K1, X22                      // 62c3c50972f31b
+       VPSHRDW $27, X0, X7, K1, X22                       // 62e3c50972f01b
+       VPSHRDW $27, (BX), X7, K1, X22                     // 62e3c50972331b
+       VPSHRDW $27, -17(BP)(SI*1), X7, K1, X22            // 62e3c50972b435efffffff1b
+       VPSHRDW $27, X15, X0, K1, X5                       // 62d3fd0972ef1b
+       VPSHRDW $27, X11, X0, K1, X5                       // 62d3fd0972eb1b
+       VPSHRDW $27, X0, X0, K1, X5                        // 62f3fd0972e81b
+       VPSHRDW $27, (BX), X0, K1, X5                      // 62f3fd09722b1b
+       VPSHRDW $27, -17(BP)(SI*1), X0, K1, X5             // 62f3fd0972ac35efffffff1b
+       VPSHRDW $27, X15, X17, K1, X5                      // 62d3f50172ef1b
+       VPSHRDW $27, X11, X17, K1, X5                      // 62d3f50172eb1b
+       VPSHRDW $27, X0, X17, K1, X5                       // 62f3f50172e81b
+       VPSHRDW $27, (BX), X17, K1, X5                     // 62f3f501722b1b
+       VPSHRDW $27, -17(BP)(SI*1), X17, K1, X5            // 62f3f50172ac35efffffff1b
+       VPSHRDW $27, X15, X7, K1, X5                       // 62d3c50972ef1b
+       VPSHRDW $27, X11, X7, K1, X5                       // 62d3c50972eb1b
+       VPSHRDW $27, X0, X7, K1, X5                        // 62f3c50972e81b
+       VPSHRDW $27, (BX), X7, K1, X5                      // 62f3c509722b1b
+       VPSHRDW $27, -17(BP)(SI*1), X7, K1, X5             // 62f3c50972ac35efffffff1b
+       VPSHRDW $27, X15, X0, K1, X14                      // 6253fd0972f71b
+       VPSHRDW $27, X11, X0, K1, X14                      // 6253fd0972f31b
+       VPSHRDW $27, X0, X0, K1, X14                       // 6273fd0972f01b
+       VPSHRDW $27, (BX), X0, K1, X14                     // 6273fd0972331b
+       VPSHRDW $27, -17(BP)(SI*1), X0, K1, X14            // 6273fd0972b435efffffff1b
+       VPSHRDW $27, X15, X17, K1, X14                     // 6253f50172f71b
+       VPSHRDW $27, X11, X17, K1, X14                     // 6253f50172f31b
+       VPSHRDW $27, X0, X17, K1, X14                      // 6273f50172f01b
+       VPSHRDW $27, (BX), X17, K1, X14                    // 6273f50172331b
+       VPSHRDW $27, -17(BP)(SI*1), X17, K1, X14           // 6273f50172b435efffffff1b
+       VPSHRDW $27, X15, X7, K1, X14                      // 6253c50972f71b
+       VPSHRDW $27, X11, X7, K1, X14                      // 6253c50972f31b
+       VPSHRDW $27, X0, X7, K1, X14                       // 6273c50972f01b
+       VPSHRDW $27, (BX), X7, K1, X14                     // 6273c50972331b
+       VPSHRDW $27, -17(BP)(SI*1), X7, K1, X14            // 6273c50972b435efffffff1b
+       VPSHRDW $47, Y7, Y9, K3, Y16                       // 62e3b52b72c72f
+       VPSHRDW $47, Y6, Y9, K3, Y16                       // 62e3b52b72c62f
+       VPSHRDW $47, Y26, Y9, K3, Y16                      // 6283b52b72c22f
+       VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y16             // 62e3b52b728411f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y16          // 6283b52b7284bef1ffffff2f
+       VPSHRDW $47, Y7, Y6, K3, Y16                       // 62e3cd2b72c72f
+       VPSHRDW $47, Y6, Y6, K3, Y16                       // 62e3cd2b72c62f
+       VPSHRDW $47, Y26, Y6, K3, Y16                      // 6283cd2b72c22f
+       VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y16             // 62e3cd2b728411f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y16          // 6283cd2b7284bef1ffffff2f
+       VPSHRDW $47, Y7, Y3, K3, Y16                       // 62e3e52b72c72f
+       VPSHRDW $47, Y6, Y3, K3, Y16                       // 62e3e52b72c62f
+       VPSHRDW $47, Y26, Y3, K3, Y16                      // 6283e52b72c22f
+       VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y16             // 62e3e52b728411f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y16          // 6283e52b7284bef1ffffff2f
+       VPSHRDW $47, Y7, Y9, K3, Y9                        // 6273b52b72cf2f
+       VPSHRDW $47, Y6, Y9, K3, Y9                        // 6273b52b72ce2f
+       VPSHRDW $47, Y26, Y9, K3, Y9                       // 6213b52b72ca2f
+       VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y9              // 6273b52b728c11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y9           // 6213b52b728cbef1ffffff2f
+       VPSHRDW $47, Y7, Y6, K3, Y9                        // 6273cd2b72cf2f
+       VPSHRDW $47, Y6, Y6, K3, Y9                        // 6273cd2b72ce2f
+       VPSHRDW $47, Y26, Y6, K3, Y9                       // 6213cd2b72ca2f
+       VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y9              // 6273cd2b728c11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y9           // 6213cd2b728cbef1ffffff2f
+       VPSHRDW $47, Y7, Y3, K3, Y9                        // 6273e52b72cf2f
+       VPSHRDW $47, Y6, Y3, K3, Y9                        // 6273e52b72ce2f
+       VPSHRDW $47, Y26, Y3, K3, Y9                       // 6213e52b72ca2f
+       VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y9              // 6273e52b728c11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y9           // 6213e52b728cbef1ffffff2f
+       VPSHRDW $47, Y7, Y9, K3, Y13                       // 6273b52b72ef2f
+       VPSHRDW $47, Y6, Y9, K3, Y13                       // 6273b52b72ee2f
+       VPSHRDW $47, Y26, Y9, K3, Y13                      // 6213b52b72ea2f
+       VPSHRDW $47, -7(CX)(DX*1), Y9, K3, Y13             // 6273b52b72ac11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y9, K3, Y13          // 6213b52b72acbef1ffffff2f
+       VPSHRDW $47, Y7, Y6, K3, Y13                       // 6273cd2b72ef2f
+       VPSHRDW $47, Y6, Y6, K3, Y13                       // 6273cd2b72ee2f
+       VPSHRDW $47, Y26, Y6, K3, Y13                      // 6213cd2b72ea2f
+       VPSHRDW $47, -7(CX)(DX*1), Y6, K3, Y13             // 6273cd2b72ac11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y6, K3, Y13          // 6213cd2b72acbef1ffffff2f
+       VPSHRDW $47, Y7, Y3, K3, Y13                       // 6273e52b72ef2f
+       VPSHRDW $47, Y6, Y3, K3, Y13                       // 6273e52b72ee2f
+       VPSHRDW $47, Y26, Y3, K3, Y13                      // 6213e52b72ea2f
+       VPSHRDW $47, -7(CX)(DX*1), Y3, K3, Y13             // 6273e52b72ac11f9ffffff2f
+       VPSHRDW $47, -15(R14)(R15*4), Y3, K3, Y13          // 6213e52b72acbef1ffffff2f
+       VPSHRDW $82, Z6, Z22, K4, Z12                      // 6273cd4472e652
+       VPSHRDW $82, Z8, Z22, K4, Z12                      // 6253cd4472e052
+       VPSHRDW $82, 15(R8), Z22, K4, Z12                  // 6253cd4472a00f00000052
+       VPSHRDW $82, (BP), Z22, K4, Z12                    // 6273cd4472650052
+       VPSHRDW $82, Z6, Z11, K4, Z12                      // 6273a54c72e652
+       VPSHRDW $82, Z8, Z11, K4, Z12                      // 6253a54c72e052
+       VPSHRDW $82, 15(R8), Z11, K4, Z12                  // 6253a54c72a00f00000052
+       VPSHRDW $82, (BP), Z11, K4, Z12                    // 6273a54c72650052
+       VPSHRDW $82, Z6, Z22, K4, Z27                      // 6263cd4472de52
+       VPSHRDW $82, Z8, Z22, K4, Z27                      // 6243cd4472d852
+       VPSHRDW $82, 15(R8), Z22, K4, Z27                  // 6243cd4472980f00000052
+       VPSHRDW $82, (BP), Z22, K4, Z27                    // 6263cd44725d0052
+       VPSHRDW $82, Z6, Z11, K4, Z27                      // 6263a54c72de52
+       VPSHRDW $82, Z8, Z11, K4, Z27                      // 6243a54c72d852
+       VPSHRDW $82, 15(R8), Z11, K4, Z27                  // 6243a54c72980f00000052
+       VPSHRDW $82, (BP), Z11, K4, Z27                    // 6263a54c725d0052
        RET
index d6562a48482a2b79cf414bd412244f17536f4cf1..ce450a5247aed4df46b7678c7933ac82640fedf7 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_vnni(SB), NOSPLIT, $0
-       //TODO: VPDPBUSD X15, X16, K2, X6                          // 62d27d0250f7
-       //TODO: VPDPBUSD X11, X16, K2, X6                          // 62d27d0250f3
-       //TODO: VPDPBUSD X1, X16, K2, X6                           // 62f27d0250f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X16, K2, X6              // 62927d0250b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X16, K2, X6                      // 62f27d0250b3f1ffffff
-       //TODO: VPDPBUSD X15, X28, K2, X6                          // 62d21d0250f7
-       //TODO: VPDPBUSD X11, X28, K2, X6                          // 62d21d0250f3
-       //TODO: VPDPBUSD X1, X28, K2, X6                           // 62f21d0250f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X28, K2, X6              // 62921d0250b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X28, K2, X6                      // 62f21d0250b3f1ffffff
-       //TODO: VPDPBUSD X15, X8, K2, X6                           // 62d23d0a50f7
-       //TODO: VPDPBUSD X11, X8, K2, X6                           // 62d23d0a50f3
-       //TODO: VPDPBUSD X1, X8, K2, X6                            // 62f23d0a50f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X8, K2, X6               // 62923d0a50b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X8, K2, X6                       // 62f23d0a50b3f1ffffff
-       //TODO: VPDPBUSD X15, X16, K2, X22                         // 62c27d0250f7
-       //TODO: VPDPBUSD X11, X16, K2, X22                         // 62c27d0250f3
-       //TODO: VPDPBUSD X1, X16, K2, X22                          // 62e27d0250f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X16, K2, X22             // 62827d0250b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X16, K2, X22                     // 62e27d0250b3f1ffffff
-       //TODO: VPDPBUSD X15, X28, K2, X22                         // 62c21d0250f7
-       //TODO: VPDPBUSD X11, X28, K2, X22                         // 62c21d0250f3
-       //TODO: VPDPBUSD X1, X28, K2, X22                          // 62e21d0250f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X28, K2, X22             // 62821d0250b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X28, K2, X22                     // 62e21d0250b3f1ffffff
-       //TODO: VPDPBUSD X15, X8, K2, X22                          // 62c23d0a50f7
-       //TODO: VPDPBUSD X11, X8, K2, X22                          // 62c23d0a50f3
-       //TODO: VPDPBUSD X1, X8, K2, X22                           // 62e23d0a50f1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X8, K2, X22              // 62823d0a50b43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X8, K2, X22                      // 62e23d0a50b3f1ffffff
-       //TODO: VPDPBUSD X15, X16, K2, X12                         // 62527d0250e7
-       //TODO: VPDPBUSD X11, X16, K2, X12                         // 62527d0250e3
-       //TODO: VPDPBUSD X1, X16, K2, X12                          // 62727d0250e1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X16, K2, X12             // 62127d0250a43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X16, K2, X12                     // 62727d0250a3f1ffffff
-       //TODO: VPDPBUSD X15, X28, K2, X12                         // 62521d0250e7
-       //TODO: VPDPBUSD X11, X28, K2, X12                         // 62521d0250e3
-       //TODO: VPDPBUSD X1, X28, K2, X12                          // 62721d0250e1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X28, K2, X12             // 62121d0250a43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X28, K2, X12                     // 62721d0250a3f1ffffff
-       //TODO: VPDPBUSD X15, X8, K2, X12                          // 62523d0a50e7
-       //TODO: VPDPBUSD X11, X8, K2, X12                          // 62523d0a50e3
-       //TODO: VPDPBUSD X1, X8, K2, X12                           // 62723d0a50e1
-       //TODO: VPDPBUSD -15(R14)(R15*1), X8, K2, X12              // 62123d0a50a43ef1ffffff
-       //TODO: VPDPBUSD -15(BX), X8, K2, X12                      // 62723d0a50a3f1ffffff
-       //TODO: VPDPBUSD Y11, Y28, K5, Y20                         // 62c21d2550e3
-       //TODO: VPDPBUSD Y27, Y28, K5, Y20                         // 62821d2550e3
-       //TODO: VPDPBUSD Y17, Y28, K5, Y20                         // 62a21d2550e1
-       //TODO: VPDPBUSD (AX), Y28, K5, Y20                        // 62e21d255020
-       //TODO: VPDPBUSD 7(SI), Y28, K5, Y20                       // 62e21d2550a607000000
-       //TODO: VPDPBUSD Y11, Y1, K5, Y20                          // 62c2752d50e3
-       //TODO: VPDPBUSD Y27, Y1, K5, Y20                          // 6282752d50e3
-       //TODO: VPDPBUSD Y17, Y1, K5, Y20                          // 62a2752d50e1
-       //TODO: VPDPBUSD (AX), Y1, K5, Y20                         // 62e2752d5020
-       //TODO: VPDPBUSD 7(SI), Y1, K5, Y20                        // 62e2752d50a607000000
-       //TODO: VPDPBUSD Y11, Y8, K5, Y20                          // 62c23d2d50e3
-       //TODO: VPDPBUSD Y27, Y8, K5, Y20                          // 62823d2d50e3
-       //TODO: VPDPBUSD Y17, Y8, K5, Y20                          // 62a23d2d50e1
-       //TODO: VPDPBUSD (AX), Y8, K5, Y20                         // 62e23d2d5020
-       //TODO: VPDPBUSD 7(SI), Y8, K5, Y20                        // 62e23d2d50a607000000
-       //TODO: VPDPBUSD Y11, Y28, K5, Y9                          // 62521d2550cb
-       //TODO: VPDPBUSD Y27, Y28, K5, Y9                          // 62121d2550cb
-       //TODO: VPDPBUSD Y17, Y28, K5, Y9                          // 62321d2550c9
-       //TODO: VPDPBUSD (AX), Y28, K5, Y9                         // 62721d255008
-       //TODO: VPDPBUSD 7(SI), Y28, K5, Y9                        // 62721d25508e07000000
-       //TODO: VPDPBUSD Y11, Y1, K5, Y9                           // 6252752d50cb
-       //TODO: VPDPBUSD Y27, Y1, K5, Y9                           // 6212752d50cb
-       //TODO: VPDPBUSD Y17, Y1, K5, Y9                           // 6232752d50c9
-       //TODO: VPDPBUSD (AX), Y1, K5, Y9                          // 6272752d5008
-       //TODO: VPDPBUSD 7(SI), Y1, K5, Y9                         // 6272752d508e07000000
-       //TODO: VPDPBUSD Y11, Y8, K5, Y9                           // 62523d2d50cb
-       //TODO: VPDPBUSD Y27, Y8, K5, Y9                           // 62123d2d50cb
-       //TODO: VPDPBUSD Y17, Y8, K5, Y9                           // 62323d2d50c9
-       //TODO: VPDPBUSD (AX), Y8, K5, Y9                          // 62723d2d5008
-       //TODO: VPDPBUSD 7(SI), Y8, K5, Y9                         // 62723d2d508e07000000
-       //TODO: VPDPBUSD Y11, Y28, K5, Y28                         // 62421d2550e3
-       //TODO: VPDPBUSD Y27, Y28, K5, Y28                         // 62021d2550e3
-       //TODO: VPDPBUSD Y17, Y28, K5, Y28                         // 62221d2550e1
-       //TODO: VPDPBUSD (AX), Y28, K5, Y28                        // 62621d255020
-       //TODO: VPDPBUSD 7(SI), Y28, K5, Y28                       // 62621d2550a607000000
-       //TODO: VPDPBUSD Y11, Y1, K5, Y28                          // 6242752d50e3
-       //TODO: VPDPBUSD Y27, Y1, K5, Y28                          // 6202752d50e3
-       //TODO: VPDPBUSD Y17, Y1, K5, Y28                          // 6222752d50e1
-       //TODO: VPDPBUSD (AX), Y1, K5, Y28                         // 6262752d5020
-       //TODO: VPDPBUSD 7(SI), Y1, K5, Y28                        // 6262752d50a607000000
-       //TODO: VPDPBUSD Y11, Y8, K5, Y28                          // 62423d2d50e3
-       //TODO: VPDPBUSD Y27, Y8, K5, Y28                          // 62023d2d50e3
-       //TODO: VPDPBUSD Y17, Y8, K5, Y28                          // 62223d2d50e1
-       //TODO: VPDPBUSD (AX), Y8, K5, Y28                         // 62623d2d5020
-       //TODO: VPDPBUSD 7(SI), Y8, K5, Y28                        // 62623d2d50a607000000
-       //TODO: VPDPBUSD Z8, Z23, K3, Z23                          // 62c2454350f8
-       //TODO: VPDPBUSD Z28, Z23, K3, Z23                         // 6282454350fc
-       //TODO: VPDPBUSD (SI), Z23, K3, Z23                        // 62e24543503e
-       //TODO: VPDPBUSD 7(SI)(DI*2), Z23, K3, Z23                 // 62e2454350bc7e07000000
-       //TODO: VPDPBUSD Z8, Z6, K3, Z23                           // 62c24d4b50f8
-       //TODO: VPDPBUSD Z28, Z6, K3, Z23                          // 62824d4b50fc
-       //TODO: VPDPBUSD (SI), Z6, K3, Z23                         // 62e24d4b503e
-       //TODO: VPDPBUSD 7(SI)(DI*2), Z6, K3, Z23                  // 62e24d4b50bc7e07000000
-       //TODO: VPDPBUSD Z8, Z23, K3, Z5                           // 62d2454350e8
-       //TODO: VPDPBUSD Z28, Z23, K3, Z5                          // 6292454350ec
-       //TODO: VPDPBUSD (SI), Z23, K3, Z5                         // 62f24543502e
-       //TODO: VPDPBUSD 7(SI)(DI*2), Z23, K3, Z5                  // 62f2454350ac7e07000000
-       //TODO: VPDPBUSD Z8, Z6, K3, Z5                            // 62d24d4b50e8
-       //TODO: VPDPBUSD Z28, Z6, K3, Z5                           // 62924d4b50ec
-       //TODO: VPDPBUSD (SI), Z6, K3, Z5                          // 62f24d4b502e
-       //TODO: VPDPBUSD 7(SI)(DI*2), Z6, K3, Z5                   // 62f24d4b50ac7e07000000
-       //TODO: VPDPBUSDS X25, X14, K4, X19                        // 62820d0c51d9
-       //TODO: VPDPBUSDS X11, X14, K4, X19                        // 62c20d0c51db
-       //TODO: VPDPBUSDS X17, X14, K4, X19                        // 62a20d0c51d9
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X14, K4, X19                // 62e20d0c519c8807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X14, K4, X19                // 62e20d0c519c0807000000
-       //TODO: VPDPBUSDS X25, X0, K4, X19                         // 62827d0c51d9
-       //TODO: VPDPBUSDS X11, X0, K4, X19                         // 62c27d0c51db
-       //TODO: VPDPBUSDS X17, X0, K4, X19                         // 62a27d0c51d9
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X0, K4, X19                 // 62e27d0c519c8807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X0, K4, X19                 // 62e27d0c519c0807000000
-       //TODO: VPDPBUSDS X25, X14, K4, X13                        // 62120d0c51e9
-       //TODO: VPDPBUSDS X11, X14, K4, X13                        // 62520d0c51eb
-       //TODO: VPDPBUSDS X17, X14, K4, X13                        // 62320d0c51e9
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X14, K4, X13                // 62720d0c51ac8807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X14, K4, X13                // 62720d0c51ac0807000000
-       //TODO: VPDPBUSDS X25, X0, K4, X13                         // 62127d0c51e9
-       //TODO: VPDPBUSDS X11, X0, K4, X13                         // 62527d0c51eb
-       //TODO: VPDPBUSDS X17, X0, K4, X13                         // 62327d0c51e9
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X0, K4, X13                 // 62727d0c51ac8807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X0, K4, X13                 // 62727d0c51ac0807000000
-       //TODO: VPDPBUSDS X25, X14, K4, X2                         // 62920d0c51d1
-       //TODO: VPDPBUSDS X11, X14, K4, X2                         // 62d20d0c51d3
-       //TODO: VPDPBUSDS X17, X14, K4, X2                         // 62b20d0c51d1
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X14, K4, X2                 // 62f20d0c51948807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X14, K4, X2                 // 62f20d0c51940807000000
-       //TODO: VPDPBUSDS X25, X0, K4, X2                          // 62927d0c51d1
-       //TODO: VPDPBUSDS X11, X0, K4, X2                          // 62d27d0c51d3
-       //TODO: VPDPBUSDS X17, X0, K4, X2                          // 62b27d0c51d1
-       //TODO: VPDPBUSDS 7(AX)(CX*4), X0, K4, X2                  // 62f27d0c51948807000000
-       //TODO: VPDPBUSDS 7(AX)(CX*1), X0, K4, X2                  // 62f27d0c51940807000000
-       //TODO: VPDPBUSDS Y28, Y26, K2, Y16                        // 62822d2251c4
-       //TODO: VPDPBUSDS Y1, Y26, K2, Y16                         // 62e22d2251c1
-       //TODO: VPDPBUSDS Y23, Y26, K2, Y16                        // 62a22d2251c7
-       //TODO: VPDPBUSDS (BX), Y26, K2, Y16                       // 62e22d225103
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y16              // 62e22d22518435efffffff
-       //TODO: VPDPBUSDS Y28, Y3, K2, Y16                         // 6282652a51c4
-       //TODO: VPDPBUSDS Y1, Y3, K2, Y16                          // 62e2652a51c1
-       //TODO: VPDPBUSDS Y23, Y3, K2, Y16                         // 62a2652a51c7
-       //TODO: VPDPBUSDS (BX), Y3, K2, Y16                        // 62e2652a5103
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y16               // 62e2652a518435efffffff
-       //TODO: VPDPBUSDS Y28, Y8, K2, Y16                         // 62823d2a51c4
-       //TODO: VPDPBUSDS Y1, Y8, K2, Y16                          // 62e23d2a51c1
-       //TODO: VPDPBUSDS Y23, Y8, K2, Y16                         // 62a23d2a51c7
-       //TODO: VPDPBUSDS (BX), Y8, K2, Y16                        // 62e23d2a5103
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y16               // 62e23d2a518435efffffff
-       //TODO: VPDPBUSDS Y28, Y26, K2, Y12                        // 62122d2251e4
-       //TODO: VPDPBUSDS Y1, Y26, K2, Y12                         // 62722d2251e1
-       //TODO: VPDPBUSDS Y23, Y26, K2, Y12                        // 62322d2251e7
-       //TODO: VPDPBUSDS (BX), Y26, K2, Y12                       // 62722d225123
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y12              // 62722d2251a435efffffff
-       //TODO: VPDPBUSDS Y28, Y3, K2, Y12                         // 6212652a51e4
-       //TODO: VPDPBUSDS Y1, Y3, K2, Y12                          // 6272652a51e1
-       //TODO: VPDPBUSDS Y23, Y3, K2, Y12                         // 6232652a51e7
-       //TODO: VPDPBUSDS (BX), Y3, K2, Y12                        // 6272652a5123
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y12               // 6272652a51a435efffffff
-       //TODO: VPDPBUSDS Y28, Y8, K2, Y12                         // 62123d2a51e4
-       //TODO: VPDPBUSDS Y1, Y8, K2, Y12                          // 62723d2a51e1
-       //TODO: VPDPBUSDS Y23, Y8, K2, Y12                         // 62323d2a51e7
-       //TODO: VPDPBUSDS (BX), Y8, K2, Y12                        // 62723d2a5123
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y12               // 62723d2a51a435efffffff
-       //TODO: VPDPBUSDS Y28, Y26, K2, Y6                         // 62922d2251f4
-       //TODO: VPDPBUSDS Y1, Y26, K2, Y6                          // 62f22d2251f1
-       //TODO: VPDPBUSDS Y23, Y26, K2, Y6                         // 62b22d2251f7
-       //TODO: VPDPBUSDS (BX), Y26, K2, Y6                        // 62f22d225133
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y6               // 62f22d2251b435efffffff
-       //TODO: VPDPBUSDS Y28, Y3, K2, Y6                          // 6292652a51f4
-       //TODO: VPDPBUSDS Y1, Y3, K2, Y6                           // 62f2652a51f1
-       //TODO: VPDPBUSDS Y23, Y3, K2, Y6                          // 62b2652a51f7
-       //TODO: VPDPBUSDS (BX), Y3, K2, Y6                         // 62f2652a5133
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y6                // 62f2652a51b435efffffff
-       //TODO: VPDPBUSDS Y28, Y8, K2, Y6                          // 62923d2a51f4
-       //TODO: VPDPBUSDS Y1, Y8, K2, Y6                           // 62f23d2a51f1
-       //TODO: VPDPBUSDS Y23, Y8, K2, Y6                          // 62b23d2a51f7
-       //TODO: VPDPBUSDS (BX), Y8, K2, Y6                         // 62f23d2a5133
-       //TODO: VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y6                // 62f23d2a51b435efffffff
-       //TODO: VPDPBUSDS Z12, Z16, K2, Z21                        // 62c27d4251ec
-       //TODO: VPDPBUSDS Z27, Z16, K2, Z21                        // 62827d4251eb
-       //TODO: VPDPBUSDS 17(SP)(BP*8), Z16, K2, Z21               // 62e27d4251acec11000000
-       //TODO: VPDPBUSDS 17(SP)(BP*4), Z16, K2, Z21               // 62e27d4251acac11000000
-       //TODO: VPDPBUSDS Z12, Z13, K2, Z21                        // 62c2154a51ec
-       //TODO: VPDPBUSDS Z27, Z13, K2, Z21                        // 6282154a51eb
-       //TODO: VPDPBUSDS 17(SP)(BP*8), Z13, K2, Z21               // 62e2154a51acec11000000
-       //TODO: VPDPBUSDS 17(SP)(BP*4), Z13, K2, Z21               // 62e2154a51acac11000000
-       //TODO: VPDPBUSDS Z12, Z16, K2, Z5                         // 62d27d4251ec
-       //TODO: VPDPBUSDS Z27, Z16, K2, Z5                         // 62927d4251eb
-       //TODO: VPDPBUSDS 17(SP)(BP*8), Z16, K2, Z5                // 62f27d4251acec11000000
-       //TODO: VPDPBUSDS 17(SP)(BP*4), Z16, K2, Z5                // 62f27d4251acac11000000
-       //TODO: VPDPBUSDS Z12, Z13, K2, Z5                         // 62d2154a51ec
-       //TODO: VPDPBUSDS Z27, Z13, K2, Z5                         // 6292154a51eb
-       //TODO: VPDPBUSDS 17(SP)(BP*8), Z13, K2, Z5                // 62f2154a51acec11000000
-       //TODO: VPDPBUSDS 17(SP)(BP*4), Z13, K2, Z5                // 62f2154a51acac11000000
-       //TODO: VPDPWSSD X2, X2, K3, X18                           // 62e26d0b52d2
-       //TODO: VPDPWSSD X27, X2, K3, X18                          // 62826d0b52d3
-       //TODO: VPDPWSSD X26, X2, K3, X18                          // 62826d0b52d2
-       //TODO: VPDPWSSD (SI), X2, K3, X18                         // 62e26d0b5216
-       //TODO: VPDPWSSD 7(SI)(DI*2), X2, K3, X18                  // 62e26d0b52947e07000000
-       //TODO: VPDPWSSD X2, X24, K3, X18                          // 62e23d0352d2
-       //TODO: VPDPWSSD X27, X24, K3, X18                         // 62823d0352d3
-       //TODO: VPDPWSSD X26, X24, K3, X18                         // 62823d0352d2
-       //TODO: VPDPWSSD (SI), X24, K3, X18                        // 62e23d035216
-       //TODO: VPDPWSSD 7(SI)(DI*2), X24, K3, X18                 // 62e23d0352947e07000000
-       //TODO: VPDPWSSD X2, X2, K3, X11                           // 62726d0b52da
-       //TODO: VPDPWSSD X27, X2, K3, X11                          // 62126d0b52db
-       //TODO: VPDPWSSD X26, X2, K3, X11                          // 62126d0b52da
-       //TODO: VPDPWSSD (SI), X2, K3, X11                         // 62726d0b521e
-       //TODO: VPDPWSSD 7(SI)(DI*2), X2, K3, X11                  // 62726d0b529c7e07000000
-       //TODO: VPDPWSSD X2, X24, K3, X11                          // 62723d0352da
-       //TODO: VPDPWSSD X27, X24, K3, X11                         // 62123d0352db
-       //TODO: VPDPWSSD X26, X24, K3, X11                         // 62123d0352da
-       //TODO: VPDPWSSD (SI), X24, K3, X11                        // 62723d03521e
-       //TODO: VPDPWSSD 7(SI)(DI*2), X24, K3, X11                 // 62723d03529c7e07000000
-       //TODO: VPDPWSSD X2, X2, K3, X9                            // 62726d0b52ca
-       //TODO: VPDPWSSD X27, X2, K3, X9                           // 62126d0b52cb
-       //TODO: VPDPWSSD X26, X2, K3, X9                           // 62126d0b52ca
-       //TODO: VPDPWSSD (SI), X2, K3, X9                          // 62726d0b520e
-       //TODO: VPDPWSSD 7(SI)(DI*2), X2, K3, X9                   // 62726d0b528c7e07000000
-       //TODO: VPDPWSSD X2, X24, K3, X9                           // 62723d0352ca
-       //TODO: VPDPWSSD X27, X24, K3, X9                          // 62123d0352cb
-       //TODO: VPDPWSSD X26, X24, K3, X9                          // 62123d0352ca
-       //TODO: VPDPWSSD (SI), X24, K3, X9                         // 62723d03520e
-       //TODO: VPDPWSSD 7(SI)(DI*2), X24, K3, X9                  // 62723d03528c7e07000000
-       //TODO: VPDPWSSD Y8, Y2, K3, Y14                           // 62526d2b52f0
-       //TODO: VPDPWSSD Y9, Y2, K3, Y14                           // 62526d2b52f1
-       //TODO: VPDPWSSD Y22, Y2, K3, Y14                          // 62326d2b52f6
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y2, K3, Y14                // 62126d2b52b4b00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y2, K3, Y14                 // 62726d2b52b491f9ffffff
-       //TODO: VPDPWSSD Y8, Y22, K3, Y14                          // 62524d2352f0
-       //TODO: VPDPWSSD Y9, Y22, K3, Y14                          // 62524d2352f1
-       //TODO: VPDPWSSD Y22, Y22, K3, Y14                         // 62324d2352f6
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y22, K3, Y14               // 62124d2352b4b00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y22, K3, Y14                // 62724d2352b491f9ffffff
-       //TODO: VPDPWSSD Y8, Y27, K3, Y14                          // 6252252352f0
-       //TODO: VPDPWSSD Y9, Y27, K3, Y14                          // 6252252352f1
-       //TODO: VPDPWSSD Y22, Y27, K3, Y14                         // 6232252352f6
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y27, K3, Y14               // 6212252352b4b00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y27, K3, Y14                // 6272252352b491f9ffffff
-       //TODO: VPDPWSSD Y8, Y2, K3, Y31                           // 62426d2b52f8
-       //TODO: VPDPWSSD Y9, Y2, K3, Y31                           // 62426d2b52f9
-       //TODO: VPDPWSSD Y22, Y2, K3, Y31                          // 62226d2b52fe
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y2, K3, Y31                // 62026d2b52bcb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y2, K3, Y31                 // 62626d2b52bc91f9ffffff
-       //TODO: VPDPWSSD Y8, Y22, K3, Y31                          // 62424d2352f8
-       //TODO: VPDPWSSD Y9, Y22, K3, Y31                          // 62424d2352f9
-       //TODO: VPDPWSSD Y22, Y22, K3, Y31                         // 62224d2352fe
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y22, K3, Y31               // 62024d2352bcb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y22, K3, Y31                // 62624d2352bc91f9ffffff
-       //TODO: VPDPWSSD Y8, Y27, K3, Y31                          // 6242252352f8
-       //TODO: VPDPWSSD Y9, Y27, K3, Y31                          // 6242252352f9
-       //TODO: VPDPWSSD Y22, Y27, K3, Y31                         // 6222252352fe
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y27, K3, Y31               // 6202252352bcb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y27, K3, Y31                // 6262252352bc91f9ffffff
-       //TODO: VPDPWSSD Y8, Y2, K3, Y25                           // 62426d2b52c8
-       //TODO: VPDPWSSD Y9, Y2, K3, Y25                           // 62426d2b52c9
-       //TODO: VPDPWSSD Y22, Y2, K3, Y25                          // 62226d2b52ce
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y2, K3, Y25                // 62026d2b528cb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y2, K3, Y25                 // 62626d2b528c91f9ffffff
-       //TODO: VPDPWSSD Y8, Y22, K3, Y25                          // 62424d2352c8
-       //TODO: VPDPWSSD Y9, Y22, K3, Y25                          // 62424d2352c9
-       //TODO: VPDPWSSD Y22, Y22, K3, Y25                         // 62224d2352ce
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y22, K3, Y25               // 62024d23528cb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y22, K3, Y25                // 62624d23528c91f9ffffff
-       //TODO: VPDPWSSD Y8, Y27, K3, Y25                          // 6242252352c8
-       //TODO: VPDPWSSD Y9, Y27, K3, Y25                          // 6242252352c9
-       //TODO: VPDPWSSD Y22, Y27, K3, Y25                         // 6222252352ce
-       //TODO: VPDPWSSD 15(R8)(R14*4), Y27, K3, Y25               // 62022523528cb00f000000
-       //TODO: VPDPWSSD -7(CX)(DX*4), Y27, K3, Y25                // 62622523528c91f9ffffff
-       //TODO: VPDPWSSD Z25, Z6, K3, Z22                          // 62824d4b52f1
-       //TODO: VPDPWSSD Z12, Z6, K3, Z22                          // 62c24d4b52f4
-       //TODO: VPDPWSSD 7(SI)(DI*4), Z6, K3, Z22                  // 62e24d4b52b4be07000000
-       //TODO: VPDPWSSD -7(DI)(R8*2), Z6, K3, Z22                 // 62a24d4b52b447f9ffffff
-       //TODO: VPDPWSSD Z25, Z8, K3, Z22                          // 62823d4b52f1
-       //TODO: VPDPWSSD Z12, Z8, K3, Z22                          // 62c23d4b52f4
-       //TODO: VPDPWSSD 7(SI)(DI*4), Z8, K3, Z22                  // 62e23d4b52b4be07000000
-       //TODO: VPDPWSSD -7(DI)(R8*2), Z8, K3, Z22                 // 62a23d4b52b447f9ffffff
-       //TODO: VPDPWSSD Z25, Z6, K3, Z11                          // 62124d4b52d9
-       //TODO: VPDPWSSD Z12, Z6, K3, Z11                          // 62524d4b52dc
-       //TODO: VPDPWSSD 7(SI)(DI*4), Z6, K3, Z11                  // 62724d4b529cbe07000000
-       //TODO: VPDPWSSD -7(DI)(R8*2), Z6, K3, Z11                 // 62324d4b529c47f9ffffff
-       //TODO: VPDPWSSD Z25, Z8, K3, Z11                          // 62123d4b52d9
-       //TODO: VPDPWSSD Z12, Z8, K3, Z11                          // 62523d4b52dc
-       //TODO: VPDPWSSD 7(SI)(DI*4), Z8, K3, Z11                  // 62723d4b529cbe07000000
-       //TODO: VPDPWSSD -7(DI)(R8*2), Z8, K3, Z11                 // 62323d4b529c47f9ffffff
-       //TODO: VPDPWSSDS X13, X11, K2, X22                        // 62c2250a53f5
-       //TODO: VPDPWSSDS X6, X11, K2, X22                         // 62e2250a53f6
-       //TODO: VPDPWSSDS X12, X11, K2, X22                        // 62c2250a53f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X11, K2, X22               // 62e2250a53b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X11, K2, X22               // 62e2250a53b4ac11000000
-       //TODO: VPDPWSSDS X13, X15, K2, X22                        // 62c2050a53f5
-       //TODO: VPDPWSSDS X6, X15, K2, X22                         // 62e2050a53f6
-       //TODO: VPDPWSSDS X12, X15, K2, X22                        // 62c2050a53f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X15, K2, X22               // 62e2050a53b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X15, K2, X22               // 62e2050a53b4ac11000000
-       //TODO: VPDPWSSDS X13, X30, K2, X22                        // 62c20d0253f5
-       //TODO: VPDPWSSDS X6, X30, K2, X22                         // 62e20d0253f6
-       //TODO: VPDPWSSDS X12, X30, K2, X22                        // 62c20d0253f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X30, K2, X22               // 62e20d0253b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X30, K2, X22               // 62e20d0253b4ac11000000
-       //TODO: VPDPWSSDS X13, X11, K2, X30                        // 6242250a53f5
-       //TODO: VPDPWSSDS X6, X11, K2, X30                         // 6262250a53f6
-       //TODO: VPDPWSSDS X12, X11, K2, X30                        // 6242250a53f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X11, K2, X30               // 6262250a53b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X11, K2, X30               // 6262250a53b4ac11000000
-       //TODO: VPDPWSSDS X13, X15, K2, X30                        // 6242050a53f5
-       //TODO: VPDPWSSDS X6, X15, K2, X30                         // 6262050a53f6
-       //TODO: VPDPWSSDS X12, X15, K2, X30                        // 6242050a53f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X15, K2, X30               // 6262050a53b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X15, K2, X30               // 6262050a53b4ac11000000
-       //TODO: VPDPWSSDS X13, X30, K2, X30                        // 62420d0253f5
-       //TODO: VPDPWSSDS X6, X30, K2, X30                         // 62620d0253f6
-       //TODO: VPDPWSSDS X12, X30, K2, X30                        // 62420d0253f4
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X30, K2, X30               // 62620d0253b4ec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X30, K2, X30               // 62620d0253b4ac11000000
-       //TODO: VPDPWSSDS X13, X11, K2, X3                         // 62d2250a53dd
-       //TODO: VPDPWSSDS X6, X11, K2, X3                          // 62f2250a53de
-       //TODO: VPDPWSSDS X12, X11, K2, X3                         // 62d2250a53dc
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X11, K2, X3                // 62f2250a539cec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X11, K2, X3                // 62f2250a539cac11000000
-       //TODO: VPDPWSSDS X13, X15, K2, X3                         // 62d2050a53dd
-       //TODO: VPDPWSSDS X6, X15, K2, X3                          // 62f2050a53de
-       //TODO: VPDPWSSDS X12, X15, K2, X3                         // 62d2050a53dc
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X15, K2, X3                // 62f2050a539cec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X15, K2, X3                // 62f2050a539cac11000000
-       //TODO: VPDPWSSDS X13, X30, K2, X3                         // 62d20d0253dd
-       //TODO: VPDPWSSDS X6, X30, K2, X3                          // 62f20d0253de
-       //TODO: VPDPWSSDS X12, X30, K2, X3                         // 62d20d0253dc
-       //TODO: VPDPWSSDS 17(SP)(BP*8), X30, K2, X3                // 62f20d02539cec11000000
-       //TODO: VPDPWSSDS 17(SP)(BP*4), X30, K2, X3                // 62f20d02539cac11000000
-       //TODO: VPDPWSSDS Y0, Y6, K1, Y9                           // 62724d2953c8
-       //TODO: VPDPWSSDS Y19, Y6, K1, Y9                          // 62324d2953cb
-       //TODO: VPDPWSSDS Y31, Y6, K1, Y9                          // 62124d2953cf
-       //TODO: VPDPWSSDS (R8), Y6, K1, Y9                         // 62524d295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y9                 // 62724d29538c5a0f000000
-       //TODO: VPDPWSSDS Y0, Y1, K1, Y9                           // 6272752953c8
-       //TODO: VPDPWSSDS Y19, Y1, K1, Y9                          // 6232752953cb
-       //TODO: VPDPWSSDS Y31, Y1, K1, Y9                          // 6212752953cf
-       //TODO: VPDPWSSDS (R8), Y1, K1, Y9                         // 625275295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y9                 // 62727529538c5a0f000000
-       //TODO: VPDPWSSDS Y0, Y9, K1, Y9                           // 6272352953c8
-       //TODO: VPDPWSSDS Y19, Y9, K1, Y9                          // 6232352953cb
-       //TODO: VPDPWSSDS Y31, Y9, K1, Y9                          // 6212352953cf
-       //TODO: VPDPWSSDS (R8), Y9, K1, Y9                         // 625235295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y9                 // 62723529538c5a0f000000
-       //TODO: VPDPWSSDS Y0, Y6, K1, Y14                          // 62724d2953f0
-       //TODO: VPDPWSSDS Y19, Y6, K1, Y14                         // 62324d2953f3
-       //TODO: VPDPWSSDS Y31, Y6, K1, Y14                         // 62124d2953f7
-       //TODO: VPDPWSSDS (R8), Y6, K1, Y14                        // 62524d295330
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y14                // 62724d2953b45a0f000000
-       //TODO: VPDPWSSDS Y0, Y1, K1, Y14                          // 6272752953f0
-       //TODO: VPDPWSSDS Y19, Y1, K1, Y14                         // 6232752953f3
-       //TODO: VPDPWSSDS Y31, Y1, K1, Y14                         // 6212752953f7
-       //TODO: VPDPWSSDS (R8), Y1, K1, Y14                        // 625275295330
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y14                // 6272752953b45a0f000000
-       //TODO: VPDPWSSDS Y0, Y9, K1, Y14                          // 6272352953f0
-       //TODO: VPDPWSSDS Y19, Y9, K1, Y14                         // 6232352953f3
-       //TODO: VPDPWSSDS Y31, Y9, K1, Y14                         // 6212352953f7
-       //TODO: VPDPWSSDS (R8), Y9, K1, Y14                        // 625235295330
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y14                // 6272352953b45a0f000000
-       //TODO: VPDPWSSDS Y0, Y6, K1, Y1                           // 62f24d2953c8
-       //TODO: VPDPWSSDS Y19, Y6, K1, Y1                          // 62b24d2953cb
-       //TODO: VPDPWSSDS Y31, Y6, K1, Y1                          // 62924d2953cf
-       //TODO: VPDPWSSDS (R8), Y6, K1, Y1                         // 62d24d295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y1                 // 62f24d29538c5a0f000000
-       //TODO: VPDPWSSDS Y0, Y1, K1, Y1                           // 62f2752953c8
-       //TODO: VPDPWSSDS Y19, Y1, K1, Y1                          // 62b2752953cb
-       //TODO: VPDPWSSDS Y31, Y1, K1, Y1                          // 6292752953cf
-       //TODO: VPDPWSSDS (R8), Y1, K1, Y1                         // 62d275295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y1                 // 62f27529538c5a0f000000
-       //TODO: VPDPWSSDS Y0, Y9, K1, Y1                           // 62f2352953c8
-       //TODO: VPDPWSSDS Y19, Y9, K1, Y1                          // 62b2352953cb
-       //TODO: VPDPWSSDS Y31, Y9, K1, Y1                          // 6292352953cf
-       //TODO: VPDPWSSDS (R8), Y9, K1, Y1                         // 62d235295308
-       //TODO: VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y1                 // 62f23529538c5a0f000000
-       //TODO: VPDPWSSDS Z6, Z9, K2, Z12                          // 6272354a53e6
-       //TODO: VPDPWSSDS Z25, Z9, K2, Z12                         // 6212354a53e1
-       //TODO: VPDPWSSDS 17(SP), Z9, K2, Z12                      // 6272354a53a42411000000
-       //TODO: VPDPWSSDS -17(BP)(SI*4), Z9, K2, Z12               // 6272354a53a4b5efffffff
-       //TODO: VPDPWSSDS Z6, Z12, K2, Z12                         // 62721d4a53e6
-       //TODO: VPDPWSSDS Z25, Z12, K2, Z12                        // 62121d4a53e1
-       //TODO: VPDPWSSDS 17(SP), Z12, K2, Z12                     // 62721d4a53a42411000000
-       //TODO: VPDPWSSDS -17(BP)(SI*4), Z12, K2, Z12              // 62721d4a53a4b5efffffff
-       //TODO: VPDPWSSDS Z6, Z9, K2, Z17                          // 62e2354a53ce
-       //TODO: VPDPWSSDS Z25, Z9, K2, Z17                         // 6282354a53c9
-       //TODO: VPDPWSSDS 17(SP), Z9, K2, Z17                      // 62e2354a538c2411000000
-       //TODO: VPDPWSSDS -17(BP)(SI*4), Z9, K2, Z17               // 62e2354a538cb5efffffff
-       //TODO: VPDPWSSDS Z6, Z12, K2, Z17                         // 62e21d4a53ce
-       //TODO: VPDPWSSDS Z25, Z12, K2, Z17                        // 62821d4a53c9
-       //TODO: VPDPWSSDS 17(SP), Z12, K2, Z17                     // 62e21d4a538c2411000000
-       //TODO: VPDPWSSDS -17(BP)(SI*4), Z12, K2, Z17              // 62e21d4a538cb5efffffff
+       VPDPBUSD X15, X16, K2, X6                          // 62d27d0250f7
+       VPDPBUSD X11, X16, K2, X6                          // 62d27d0250f3
+       VPDPBUSD X1, X16, K2, X6                           // 62f27d0250f1
+       VPDPBUSD -15(R14)(R15*1), X16, K2, X6              // 62927d0250b43ef1ffffff
+       VPDPBUSD -15(BX), X16, K2, X6                      // 62f27d0250b3f1ffffff
+       VPDPBUSD X15, X28, K2, X6                          // 62d21d0250f7
+       VPDPBUSD X11, X28, K2, X6                          // 62d21d0250f3
+       VPDPBUSD X1, X28, K2, X6                           // 62f21d0250f1
+       VPDPBUSD -15(R14)(R15*1), X28, K2, X6              // 62921d0250b43ef1ffffff
+       VPDPBUSD -15(BX), X28, K2, X6                      // 62f21d0250b3f1ffffff
+       VPDPBUSD X15, X8, K2, X6                           // 62d23d0a50f7
+       VPDPBUSD X11, X8, K2, X6                           // 62d23d0a50f3
+       VPDPBUSD X1, X8, K2, X6                            // 62f23d0a50f1
+       VPDPBUSD -15(R14)(R15*1), X8, K2, X6               // 62923d0a50b43ef1ffffff
+       VPDPBUSD -15(BX), X8, K2, X6                       // 62f23d0a50b3f1ffffff
+       VPDPBUSD X15, X16, K2, X22                         // 62c27d0250f7
+       VPDPBUSD X11, X16, K2, X22                         // 62c27d0250f3
+       VPDPBUSD X1, X16, K2, X22                          // 62e27d0250f1
+       VPDPBUSD -15(R14)(R15*1), X16, K2, X22             // 62827d0250b43ef1ffffff
+       VPDPBUSD -15(BX), X16, K2, X22                     // 62e27d0250b3f1ffffff
+       VPDPBUSD X15, X28, K2, X22                         // 62c21d0250f7
+       VPDPBUSD X11, X28, K2, X22                         // 62c21d0250f3
+       VPDPBUSD X1, X28, K2, X22                          // 62e21d0250f1
+       VPDPBUSD -15(R14)(R15*1), X28, K2, X22             // 62821d0250b43ef1ffffff
+       VPDPBUSD -15(BX), X28, K2, X22                     // 62e21d0250b3f1ffffff
+       VPDPBUSD X15, X8, K2, X22                          // 62c23d0a50f7
+       VPDPBUSD X11, X8, K2, X22                          // 62c23d0a50f3
+       VPDPBUSD X1, X8, K2, X22                           // 62e23d0a50f1
+       VPDPBUSD -15(R14)(R15*1), X8, K2, X22              // 62823d0a50b43ef1ffffff
+       VPDPBUSD -15(BX), X8, K2, X22                      // 62e23d0a50b3f1ffffff
+       VPDPBUSD X15, X16, K2, X12                         // 62527d0250e7
+       VPDPBUSD X11, X16, K2, X12                         // 62527d0250e3
+       VPDPBUSD X1, X16, K2, X12                          // 62727d0250e1
+       VPDPBUSD -15(R14)(R15*1), X16, K2, X12             // 62127d0250a43ef1ffffff
+       VPDPBUSD -15(BX), X16, K2, X12                     // 62727d0250a3f1ffffff
+       VPDPBUSD X15, X28, K2, X12                         // 62521d0250e7
+       VPDPBUSD X11, X28, K2, X12                         // 62521d0250e3
+       VPDPBUSD X1, X28, K2, X12                          // 62721d0250e1
+       VPDPBUSD -15(R14)(R15*1), X28, K2, X12             // 62121d0250a43ef1ffffff
+       VPDPBUSD -15(BX), X28, K2, X12                     // 62721d0250a3f1ffffff
+       VPDPBUSD X15, X8, K2, X12                          // 62523d0a50e7
+       VPDPBUSD X11, X8, K2, X12                          // 62523d0a50e3
+       VPDPBUSD X1, X8, K2, X12                           // 62723d0a50e1
+       VPDPBUSD -15(R14)(R15*1), X8, K2, X12              // 62123d0a50a43ef1ffffff
+       VPDPBUSD -15(BX), X8, K2, X12                      // 62723d0a50a3f1ffffff
+       VPDPBUSD Y11, Y28, K5, Y20                         // 62c21d2550e3
+       VPDPBUSD Y27, Y28, K5, Y20                         // 62821d2550e3
+       VPDPBUSD Y17, Y28, K5, Y20                         // 62a21d2550e1
+       VPDPBUSD (AX), Y28, K5, Y20                        // 62e21d255020
+       VPDPBUSD 7(SI), Y28, K5, Y20                       // 62e21d2550a607000000
+       VPDPBUSD Y11, Y1, K5, Y20                          // 62c2752d50e3
+       VPDPBUSD Y27, Y1, K5, Y20                          // 6282752d50e3
+       VPDPBUSD Y17, Y1, K5, Y20                          // 62a2752d50e1
+       VPDPBUSD (AX), Y1, K5, Y20                         // 62e2752d5020
+       VPDPBUSD 7(SI), Y1, K5, Y20                        // 62e2752d50a607000000
+       VPDPBUSD Y11, Y8, K5, Y20                          // 62c23d2d50e3
+       VPDPBUSD Y27, Y8, K5, Y20                          // 62823d2d50e3
+       VPDPBUSD Y17, Y8, K5, Y20                          // 62a23d2d50e1
+       VPDPBUSD (AX), Y8, K5, Y20                         // 62e23d2d5020
+       VPDPBUSD 7(SI), Y8, K5, Y20                        // 62e23d2d50a607000000
+       VPDPBUSD Y11, Y28, K5, Y9                          // 62521d2550cb
+       VPDPBUSD Y27, Y28, K5, Y9                          // 62121d2550cb
+       VPDPBUSD Y17, Y28, K5, Y9                          // 62321d2550c9
+       VPDPBUSD (AX), Y28, K5, Y9                         // 62721d255008
+       VPDPBUSD 7(SI), Y28, K5, Y9                        // 62721d25508e07000000
+       VPDPBUSD Y11, Y1, K5, Y9                           // 6252752d50cb
+       VPDPBUSD Y27, Y1, K5, Y9                           // 6212752d50cb
+       VPDPBUSD Y17, Y1, K5, Y9                           // 6232752d50c9
+       VPDPBUSD (AX), Y1, K5, Y9                          // 6272752d5008
+       VPDPBUSD 7(SI), Y1, K5, Y9                         // 6272752d508e07000000
+       VPDPBUSD Y11, Y8, K5, Y9                           // 62523d2d50cb
+       VPDPBUSD Y27, Y8, K5, Y9                           // 62123d2d50cb
+       VPDPBUSD Y17, Y8, K5, Y9                           // 62323d2d50c9
+       VPDPBUSD (AX), Y8, K5, Y9                          // 62723d2d5008
+       VPDPBUSD 7(SI), Y8, K5, Y9                         // 62723d2d508e07000000
+       VPDPBUSD Y11, Y28, K5, Y28                         // 62421d2550e3
+       VPDPBUSD Y27, Y28, K5, Y28                         // 62021d2550e3
+       VPDPBUSD Y17, Y28, K5, Y28                         // 62221d2550e1
+       VPDPBUSD (AX), Y28, K5, Y28                        // 62621d255020
+       VPDPBUSD 7(SI), Y28, K5, Y28                       // 62621d2550a607000000
+       VPDPBUSD Y11, Y1, K5, Y28                          // 6242752d50e3
+       VPDPBUSD Y27, Y1, K5, Y28                          // 6202752d50e3
+       VPDPBUSD Y17, Y1, K5, Y28                          // 6222752d50e1
+       VPDPBUSD (AX), Y1, K5, Y28                         // 6262752d5020
+       VPDPBUSD 7(SI), Y1, K5, Y28                        // 6262752d50a607000000
+       VPDPBUSD Y11, Y8, K5, Y28                          // 62423d2d50e3
+       VPDPBUSD Y27, Y8, K5, Y28                          // 62023d2d50e3
+       VPDPBUSD Y17, Y8, K5, Y28                          // 62223d2d50e1
+       VPDPBUSD (AX), Y8, K5, Y28                         // 62623d2d5020
+       VPDPBUSD 7(SI), Y8, K5, Y28                        // 62623d2d50a607000000
+       VPDPBUSD Z8, Z23, K3, Z23                          // 62c2454350f8
+       VPDPBUSD Z28, Z23, K3, Z23                         // 6282454350fc
+       VPDPBUSD (SI), Z23, K3, Z23                        // 62e24543503e
+       VPDPBUSD 7(SI)(DI*2), Z23, K3, Z23                 // 62e2454350bc7e07000000
+       VPDPBUSD Z8, Z6, K3, Z23                           // 62c24d4b50f8
+       VPDPBUSD Z28, Z6, K3, Z23                          // 62824d4b50fc
+       VPDPBUSD (SI), Z6, K3, Z23                         // 62e24d4b503e
+       VPDPBUSD 7(SI)(DI*2), Z6, K3, Z23                  // 62e24d4b50bc7e07000000
+       VPDPBUSD Z8, Z23, K3, Z5                           // 62d2454350e8
+       VPDPBUSD Z28, Z23, K3, Z5                          // 6292454350ec
+       VPDPBUSD (SI), Z23, K3, Z5                         // 62f24543502e
+       VPDPBUSD 7(SI)(DI*2), Z23, K3, Z5                  // 62f2454350ac7e07000000
+       VPDPBUSD Z8, Z6, K3, Z5                            // 62d24d4b50e8
+       VPDPBUSD Z28, Z6, K3, Z5                           // 62924d4b50ec
+       VPDPBUSD (SI), Z6, K3, Z5                          // 62f24d4b502e
+       VPDPBUSD 7(SI)(DI*2), Z6, K3, Z5                   // 62f24d4b50ac7e07000000
+       VPDPBUSDS X25, X14, K4, X19                        // 62820d0c51d9
+       VPDPBUSDS X11, X14, K4, X19                        // 62c20d0c51db
+       VPDPBUSDS X17, X14, K4, X19                        // 62a20d0c51d9
+       VPDPBUSDS 7(AX)(CX*4), X14, K4, X19                // 62e20d0c519c8807000000
+       VPDPBUSDS 7(AX)(CX*1), X14, K4, X19                // 62e20d0c519c0807000000
+       VPDPBUSDS X25, X0, K4, X19                         // 62827d0c51d9
+       VPDPBUSDS X11, X0, K4, X19                         // 62c27d0c51db
+       VPDPBUSDS X17, X0, K4, X19                         // 62a27d0c51d9
+       VPDPBUSDS 7(AX)(CX*4), X0, K4, X19                 // 62e27d0c519c8807000000
+       VPDPBUSDS 7(AX)(CX*1), X0, K4, X19                 // 62e27d0c519c0807000000
+       VPDPBUSDS X25, X14, K4, X13                        // 62120d0c51e9
+       VPDPBUSDS X11, X14, K4, X13                        // 62520d0c51eb
+       VPDPBUSDS X17, X14, K4, X13                        // 62320d0c51e9
+       VPDPBUSDS 7(AX)(CX*4), X14, K4, X13                // 62720d0c51ac8807000000
+       VPDPBUSDS 7(AX)(CX*1), X14, K4, X13                // 62720d0c51ac0807000000
+       VPDPBUSDS X25, X0, K4, X13                         // 62127d0c51e9
+       VPDPBUSDS X11, X0, K4, X13                         // 62527d0c51eb
+       VPDPBUSDS X17, X0, K4, X13                         // 62327d0c51e9
+       VPDPBUSDS 7(AX)(CX*4), X0, K4, X13                 // 62727d0c51ac8807000000
+       VPDPBUSDS 7(AX)(CX*1), X0, K4, X13                 // 62727d0c51ac0807000000
+       VPDPBUSDS X25, X14, K4, X2                         // 62920d0c51d1
+       VPDPBUSDS X11, X14, K4, X2                         // 62d20d0c51d3
+       VPDPBUSDS X17, X14, K4, X2                         // 62b20d0c51d1
+       VPDPBUSDS 7(AX)(CX*4), X14, K4, X2                 // 62f20d0c51948807000000
+       VPDPBUSDS 7(AX)(CX*1), X14, K4, X2                 // 62f20d0c51940807000000
+       VPDPBUSDS X25, X0, K4, X2                          // 62927d0c51d1
+       VPDPBUSDS X11, X0, K4, X2                          // 62d27d0c51d3
+       VPDPBUSDS X17, X0, K4, X2                          // 62b27d0c51d1
+       VPDPBUSDS 7(AX)(CX*4), X0, K4, X2                  // 62f27d0c51948807000000
+       VPDPBUSDS 7(AX)(CX*1), X0, K4, X2                  // 62f27d0c51940807000000
+       VPDPBUSDS Y28, Y26, K2, Y16                        // 62822d2251c4
+       VPDPBUSDS Y1, Y26, K2, Y16                         // 62e22d2251c1
+       VPDPBUSDS Y23, Y26, K2, Y16                        // 62a22d2251c7
+       VPDPBUSDS (BX), Y26, K2, Y16                       // 62e22d225103
+       VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y16              // 62e22d22518435efffffff
+       VPDPBUSDS Y28, Y3, K2, Y16                         // 6282652a51c4
+       VPDPBUSDS Y1, Y3, K2, Y16                          // 62e2652a51c1
+       VPDPBUSDS Y23, Y3, K2, Y16                         // 62a2652a51c7
+       VPDPBUSDS (BX), Y3, K2, Y16                        // 62e2652a5103
+       VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y16               // 62e2652a518435efffffff
+       VPDPBUSDS Y28, Y8, K2, Y16                         // 62823d2a51c4
+       VPDPBUSDS Y1, Y8, K2, Y16                          // 62e23d2a51c1
+       VPDPBUSDS Y23, Y8, K2, Y16                         // 62a23d2a51c7
+       VPDPBUSDS (BX), Y8, K2, Y16                        // 62e23d2a5103
+       VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y16               // 62e23d2a518435efffffff
+       VPDPBUSDS Y28, Y26, K2, Y12                        // 62122d2251e4
+       VPDPBUSDS Y1, Y26, K2, Y12                         // 62722d2251e1
+       VPDPBUSDS Y23, Y26, K2, Y12                        // 62322d2251e7
+       VPDPBUSDS (BX), Y26, K2, Y12                       // 62722d225123
+       VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y12              // 62722d2251a435efffffff
+       VPDPBUSDS Y28, Y3, K2, Y12                         // 6212652a51e4
+       VPDPBUSDS Y1, Y3, K2, Y12                          // 6272652a51e1
+       VPDPBUSDS Y23, Y3, K2, Y12                         // 6232652a51e7
+       VPDPBUSDS (BX), Y3, K2, Y12                        // 6272652a5123
+       VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y12               // 6272652a51a435efffffff
+       VPDPBUSDS Y28, Y8, K2, Y12                         // 62123d2a51e4
+       VPDPBUSDS Y1, Y8, K2, Y12                          // 62723d2a51e1
+       VPDPBUSDS Y23, Y8, K2, Y12                         // 62323d2a51e7
+       VPDPBUSDS (BX), Y8, K2, Y12                        // 62723d2a5123
+       VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y12               // 62723d2a51a435efffffff
+       VPDPBUSDS Y28, Y26, K2, Y6                         // 62922d2251f4
+       VPDPBUSDS Y1, Y26, K2, Y6                          // 62f22d2251f1
+       VPDPBUSDS Y23, Y26, K2, Y6                         // 62b22d2251f7
+       VPDPBUSDS (BX), Y26, K2, Y6                        // 62f22d225133
+       VPDPBUSDS -17(BP)(SI*1), Y26, K2, Y6               // 62f22d2251b435efffffff
+       VPDPBUSDS Y28, Y3, K2, Y6                          // 6292652a51f4
+       VPDPBUSDS Y1, Y3, K2, Y6                           // 62f2652a51f1
+       VPDPBUSDS Y23, Y3, K2, Y6                          // 62b2652a51f7
+       VPDPBUSDS (BX), Y3, K2, Y6                         // 62f2652a5133
+       VPDPBUSDS -17(BP)(SI*1), Y3, K2, Y6                // 62f2652a51b435efffffff
+       VPDPBUSDS Y28, Y8, K2, Y6                          // 62923d2a51f4
+       VPDPBUSDS Y1, Y8, K2, Y6                           // 62f23d2a51f1
+       VPDPBUSDS Y23, Y8, K2, Y6                          // 62b23d2a51f7
+       VPDPBUSDS (BX), Y8, K2, Y6                         // 62f23d2a5133
+       VPDPBUSDS -17(BP)(SI*1), Y8, K2, Y6                // 62f23d2a51b435efffffff
+       VPDPBUSDS Z12, Z16, K2, Z21                        // 62c27d4251ec
+       VPDPBUSDS Z27, Z16, K2, Z21                        // 62827d4251eb
+       VPDPBUSDS 17(SP)(BP*8), Z16, K2, Z21               // 62e27d4251acec11000000
+       VPDPBUSDS 17(SP)(BP*4), Z16, K2, Z21               // 62e27d4251acac11000000
+       VPDPBUSDS Z12, Z13, K2, Z21                        // 62c2154a51ec
+       VPDPBUSDS Z27, Z13, K2, Z21                        // 6282154a51eb
+       VPDPBUSDS 17(SP)(BP*8), Z13, K2, Z21               // 62e2154a51acec11000000
+       VPDPBUSDS 17(SP)(BP*4), Z13, K2, Z21               // 62e2154a51acac11000000
+       VPDPBUSDS Z12, Z16, K2, Z5                         // 62d27d4251ec
+       VPDPBUSDS Z27, Z16, K2, Z5                         // 62927d4251eb
+       VPDPBUSDS 17(SP)(BP*8), Z16, K2, Z5                // 62f27d4251acec11000000
+       VPDPBUSDS 17(SP)(BP*4), Z16, K2, Z5                // 62f27d4251acac11000000
+       VPDPBUSDS Z12, Z13, K2, Z5                         // 62d2154a51ec
+       VPDPBUSDS Z27, Z13, K2, Z5                         // 6292154a51eb
+       VPDPBUSDS 17(SP)(BP*8), Z13, K2, Z5                // 62f2154a51acec11000000
+       VPDPBUSDS 17(SP)(BP*4), Z13, K2, Z5                // 62f2154a51acac11000000
+       VPDPWSSD X2, X2, K3, X18                           // 62e26d0b52d2
+       VPDPWSSD X27, X2, K3, X18                          // 62826d0b52d3
+       VPDPWSSD X26, X2, K3, X18                          // 62826d0b52d2
+       VPDPWSSD (SI), X2, K3, X18                         // 62e26d0b5216
+       VPDPWSSD 7(SI)(DI*2), X2, K3, X18                  // 62e26d0b52947e07000000
+       VPDPWSSD X2, X24, K3, X18                          // 62e23d0352d2
+       VPDPWSSD X27, X24, K3, X18                         // 62823d0352d3
+       VPDPWSSD X26, X24, K3, X18                         // 62823d0352d2
+       VPDPWSSD (SI), X24, K3, X18                        // 62e23d035216
+       VPDPWSSD 7(SI)(DI*2), X24, K3, X18                 // 62e23d0352947e07000000
+       VPDPWSSD X2, X2, K3, X11                           // 62726d0b52da
+       VPDPWSSD X27, X2, K3, X11                          // 62126d0b52db
+       VPDPWSSD X26, X2, K3, X11                          // 62126d0b52da
+       VPDPWSSD (SI), X2, K3, X11                         // 62726d0b521e
+       VPDPWSSD 7(SI)(DI*2), X2, K3, X11                  // 62726d0b529c7e07000000
+       VPDPWSSD X2, X24, K3, X11                          // 62723d0352da
+       VPDPWSSD X27, X24, K3, X11                         // 62123d0352db
+       VPDPWSSD X26, X24, K3, X11                         // 62123d0352da
+       VPDPWSSD (SI), X24, K3, X11                        // 62723d03521e
+       VPDPWSSD 7(SI)(DI*2), X24, K3, X11                 // 62723d03529c7e07000000
+       VPDPWSSD X2, X2, K3, X9                            // 62726d0b52ca
+       VPDPWSSD X27, X2, K3, X9                           // 62126d0b52cb
+       VPDPWSSD X26, X2, K3, X9                           // 62126d0b52ca
+       VPDPWSSD (SI), X2, K3, X9                          // 62726d0b520e
+       VPDPWSSD 7(SI)(DI*2), X2, K3, X9                   // 62726d0b528c7e07000000
+       VPDPWSSD X2, X24, K3, X9                           // 62723d0352ca
+       VPDPWSSD X27, X24, K3, X9                          // 62123d0352cb
+       VPDPWSSD X26, X24, K3, X9                          // 62123d0352ca
+       VPDPWSSD (SI), X24, K3, X9                         // 62723d03520e
+       VPDPWSSD 7(SI)(DI*2), X24, K3, X9                  // 62723d03528c7e07000000
+       VPDPWSSD Y8, Y2, K3, Y14                           // 62526d2b52f0
+       VPDPWSSD Y9, Y2, K3, Y14                           // 62526d2b52f1
+       VPDPWSSD Y22, Y2, K3, Y14                          // 62326d2b52f6
+       VPDPWSSD 15(R8)(R14*4), Y2, K3, Y14                // 62126d2b52b4b00f000000
+       VPDPWSSD -7(CX)(DX*4), Y2, K3, Y14                 // 62726d2b52b491f9ffffff
+       VPDPWSSD Y8, Y22, K3, Y14                          // 62524d2352f0
+       VPDPWSSD Y9, Y22, K3, Y14                          // 62524d2352f1
+       VPDPWSSD Y22, Y22, K3, Y14                         // 62324d2352f6
+       VPDPWSSD 15(R8)(R14*4), Y22, K3, Y14               // 62124d2352b4b00f000000
+       VPDPWSSD -7(CX)(DX*4), Y22, K3, Y14                // 62724d2352b491f9ffffff
+       VPDPWSSD Y8, Y27, K3, Y14                          // 6252252352f0
+       VPDPWSSD Y9, Y27, K3, Y14                          // 6252252352f1
+       VPDPWSSD Y22, Y27, K3, Y14                         // 6232252352f6
+       VPDPWSSD 15(R8)(R14*4), Y27, K3, Y14               // 6212252352b4b00f000000
+       VPDPWSSD -7(CX)(DX*4), Y27, K3, Y14                // 6272252352b491f9ffffff
+       VPDPWSSD Y8, Y2, K3, Y31                           // 62426d2b52f8
+       VPDPWSSD Y9, Y2, K3, Y31                           // 62426d2b52f9
+       VPDPWSSD Y22, Y2, K3, Y31                          // 62226d2b52fe
+       VPDPWSSD 15(R8)(R14*4), Y2, K3, Y31                // 62026d2b52bcb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y2, K3, Y31                 // 62626d2b52bc91f9ffffff
+       VPDPWSSD Y8, Y22, K3, Y31                          // 62424d2352f8
+       VPDPWSSD Y9, Y22, K3, Y31                          // 62424d2352f9
+       VPDPWSSD Y22, Y22, K3, Y31                         // 62224d2352fe
+       VPDPWSSD 15(R8)(R14*4), Y22, K3, Y31               // 62024d2352bcb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y22, K3, Y31                // 62624d2352bc91f9ffffff
+       VPDPWSSD Y8, Y27, K3, Y31                          // 6242252352f8
+       VPDPWSSD Y9, Y27, K3, Y31                          // 6242252352f9
+       VPDPWSSD Y22, Y27, K3, Y31                         // 6222252352fe
+       VPDPWSSD 15(R8)(R14*4), Y27, K3, Y31               // 6202252352bcb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y27, K3, Y31                // 6262252352bc91f9ffffff
+       VPDPWSSD Y8, Y2, K3, Y25                           // 62426d2b52c8
+       VPDPWSSD Y9, Y2, K3, Y25                           // 62426d2b52c9
+       VPDPWSSD Y22, Y2, K3, Y25                          // 62226d2b52ce
+       VPDPWSSD 15(R8)(R14*4), Y2, K3, Y25                // 62026d2b528cb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y2, K3, Y25                 // 62626d2b528c91f9ffffff
+       VPDPWSSD Y8, Y22, K3, Y25                          // 62424d2352c8
+       VPDPWSSD Y9, Y22, K3, Y25                          // 62424d2352c9
+       VPDPWSSD Y22, Y22, K3, Y25                         // 62224d2352ce
+       VPDPWSSD 15(R8)(R14*4), Y22, K3, Y25               // 62024d23528cb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y22, K3, Y25                // 62624d23528c91f9ffffff
+       VPDPWSSD Y8, Y27, K3, Y25                          // 6242252352c8
+       VPDPWSSD Y9, Y27, K3, Y25                          // 6242252352c9
+       VPDPWSSD Y22, Y27, K3, Y25                         // 6222252352ce
+       VPDPWSSD 15(R8)(R14*4), Y27, K3, Y25               // 62022523528cb00f000000
+       VPDPWSSD -7(CX)(DX*4), Y27, K3, Y25                // 62622523528c91f9ffffff
+       VPDPWSSD Z25, Z6, K3, Z22                          // 62824d4b52f1
+       VPDPWSSD Z12, Z6, K3, Z22                          // 62c24d4b52f4
+       VPDPWSSD 7(SI)(DI*4), Z6, K3, Z22                  // 62e24d4b52b4be07000000
+       VPDPWSSD -7(DI)(R8*2), Z6, K3, Z22                 // 62a24d4b52b447f9ffffff
+       VPDPWSSD Z25, Z8, K3, Z22                          // 62823d4b52f1
+       VPDPWSSD Z12, Z8, K3, Z22                          // 62c23d4b52f4
+       VPDPWSSD 7(SI)(DI*4), Z8, K3, Z22                  // 62e23d4b52b4be07000000
+       VPDPWSSD -7(DI)(R8*2), Z8, K3, Z22                 // 62a23d4b52b447f9ffffff
+       VPDPWSSD Z25, Z6, K3, Z11                          // 62124d4b52d9
+       VPDPWSSD Z12, Z6, K3, Z11                          // 62524d4b52dc
+       VPDPWSSD 7(SI)(DI*4), Z6, K3, Z11                  // 62724d4b529cbe07000000
+       VPDPWSSD -7(DI)(R8*2), Z6, K3, Z11                 // 62324d4b529c47f9ffffff
+       VPDPWSSD Z25, Z8, K3, Z11                          // 62123d4b52d9
+       VPDPWSSD Z12, Z8, K3, Z11                          // 62523d4b52dc
+       VPDPWSSD 7(SI)(DI*4), Z8, K3, Z11                  // 62723d4b529cbe07000000
+       VPDPWSSD -7(DI)(R8*2), Z8, K3, Z11                 // 62323d4b529c47f9ffffff
+       VPDPWSSDS X13, X11, K2, X22                        // 62c2250a53f5
+       VPDPWSSDS X6, X11, K2, X22                         // 62e2250a53f6
+       VPDPWSSDS X12, X11, K2, X22                        // 62c2250a53f4
+       VPDPWSSDS 17(SP)(BP*8), X11, K2, X22               // 62e2250a53b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X11, K2, X22               // 62e2250a53b4ac11000000
+       VPDPWSSDS X13, X15, K2, X22                        // 62c2050a53f5
+       VPDPWSSDS X6, X15, K2, X22                         // 62e2050a53f6
+       VPDPWSSDS X12, X15, K2, X22                        // 62c2050a53f4
+       VPDPWSSDS 17(SP)(BP*8), X15, K2, X22               // 62e2050a53b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X15, K2, X22               // 62e2050a53b4ac11000000
+       VPDPWSSDS X13, X30, K2, X22                        // 62c20d0253f5
+       VPDPWSSDS X6, X30, K2, X22                         // 62e20d0253f6
+       VPDPWSSDS X12, X30, K2, X22                        // 62c20d0253f4
+       VPDPWSSDS 17(SP)(BP*8), X30, K2, X22               // 62e20d0253b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X30, K2, X22               // 62e20d0253b4ac11000000
+       VPDPWSSDS X13, X11, K2, X30                        // 6242250a53f5
+       VPDPWSSDS X6, X11, K2, X30                         // 6262250a53f6
+       VPDPWSSDS X12, X11, K2, X30                        // 6242250a53f4
+       VPDPWSSDS 17(SP)(BP*8), X11, K2, X30               // 6262250a53b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X11, K2, X30               // 6262250a53b4ac11000000
+       VPDPWSSDS X13, X15, K2, X30                        // 6242050a53f5
+       VPDPWSSDS X6, X15, K2, X30                         // 6262050a53f6
+       VPDPWSSDS X12, X15, K2, X30                        // 6242050a53f4
+       VPDPWSSDS 17(SP)(BP*8), X15, K2, X30               // 6262050a53b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X15, K2, X30               // 6262050a53b4ac11000000
+       VPDPWSSDS X13, X30, K2, X30                        // 62420d0253f5
+       VPDPWSSDS X6, X30, K2, X30                         // 62620d0253f6
+       VPDPWSSDS X12, X30, K2, X30                        // 62420d0253f4
+       VPDPWSSDS 17(SP)(BP*8), X30, K2, X30               // 62620d0253b4ec11000000
+       VPDPWSSDS 17(SP)(BP*4), X30, K2, X30               // 62620d0253b4ac11000000
+       VPDPWSSDS X13, X11, K2, X3                         // 62d2250a53dd
+       VPDPWSSDS X6, X11, K2, X3                          // 62f2250a53de
+       VPDPWSSDS X12, X11, K2, X3                         // 62d2250a53dc
+       VPDPWSSDS 17(SP)(BP*8), X11, K2, X3                // 62f2250a539cec11000000
+       VPDPWSSDS 17(SP)(BP*4), X11, K2, X3                // 62f2250a539cac11000000
+       VPDPWSSDS X13, X15, K2, X3                         // 62d2050a53dd
+       VPDPWSSDS X6, X15, K2, X3                          // 62f2050a53de
+       VPDPWSSDS X12, X15, K2, X3                         // 62d2050a53dc
+       VPDPWSSDS 17(SP)(BP*8), X15, K2, X3                // 62f2050a539cec11000000
+       VPDPWSSDS 17(SP)(BP*4), X15, K2, X3                // 62f2050a539cac11000000
+       VPDPWSSDS X13, X30, K2, X3                         // 62d20d0253dd
+       VPDPWSSDS X6, X30, K2, X3                          // 62f20d0253de
+       VPDPWSSDS X12, X30, K2, X3                         // 62d20d0253dc
+       VPDPWSSDS 17(SP)(BP*8), X30, K2, X3                // 62f20d02539cec11000000
+       VPDPWSSDS 17(SP)(BP*4), X30, K2, X3                // 62f20d02539cac11000000
+       VPDPWSSDS Y0, Y6, K1, Y9                           // 62724d2953c8
+       VPDPWSSDS Y19, Y6, K1, Y9                          // 62324d2953cb
+       VPDPWSSDS Y31, Y6, K1, Y9                          // 62124d2953cf
+       VPDPWSSDS (R8), Y6, K1, Y9                         // 62524d295308
+       VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y9                 // 62724d29538c5a0f000000
+       VPDPWSSDS Y0, Y1, K1, Y9                           // 6272752953c8
+       VPDPWSSDS Y19, Y1, K1, Y9                          // 6232752953cb
+       VPDPWSSDS Y31, Y1, K1, Y9                          // 6212752953cf
+       VPDPWSSDS (R8), Y1, K1, Y9                         // 625275295308
+       VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y9                 // 62727529538c5a0f000000
+       VPDPWSSDS Y0, Y9, K1, Y9                           // 6272352953c8
+       VPDPWSSDS Y19, Y9, K1, Y9                          // 6232352953cb
+       VPDPWSSDS Y31, Y9, K1, Y9                          // 6212352953cf
+       VPDPWSSDS (R8), Y9, K1, Y9                         // 625235295308
+       VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y9                 // 62723529538c5a0f000000
+       VPDPWSSDS Y0, Y6, K1, Y14                          // 62724d2953f0
+       VPDPWSSDS Y19, Y6, K1, Y14                         // 62324d2953f3
+       VPDPWSSDS Y31, Y6, K1, Y14                         // 62124d2953f7
+       VPDPWSSDS (R8), Y6, K1, Y14                        // 62524d295330
+       VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y14                // 62724d2953b45a0f000000
+       VPDPWSSDS Y0, Y1, K1, Y14                          // 6272752953f0
+       VPDPWSSDS Y19, Y1, K1, Y14                         // 6232752953f3
+       VPDPWSSDS Y31, Y1, K1, Y14                         // 6212752953f7
+       VPDPWSSDS (R8), Y1, K1, Y14                        // 625275295330
+       VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y14                // 6272752953b45a0f000000
+       VPDPWSSDS Y0, Y9, K1, Y14                          // 6272352953f0
+       VPDPWSSDS Y19, Y9, K1, Y14                         // 6232352953f3
+       VPDPWSSDS Y31, Y9, K1, Y14                         // 6212352953f7
+       VPDPWSSDS (R8), Y9, K1, Y14                        // 625235295330
+       VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y14                // 6272352953b45a0f000000
+       VPDPWSSDS Y0, Y6, K1, Y1                           // 62f24d2953c8
+       VPDPWSSDS Y19, Y6, K1, Y1                          // 62b24d2953cb
+       VPDPWSSDS Y31, Y6, K1, Y1                          // 62924d2953cf
+       VPDPWSSDS (R8), Y6, K1, Y1                         // 62d24d295308
+       VPDPWSSDS 15(DX)(BX*2), Y6, K1, Y1                 // 62f24d29538c5a0f000000
+       VPDPWSSDS Y0, Y1, K1, Y1                           // 62f2752953c8
+       VPDPWSSDS Y19, Y1, K1, Y1                          // 62b2752953cb
+       VPDPWSSDS Y31, Y1, K1, Y1                          // 6292752953cf
+       VPDPWSSDS (R8), Y1, K1, Y1                         // 62d275295308
+       VPDPWSSDS 15(DX)(BX*2), Y1, K1, Y1                 // 62f27529538c5a0f000000
+       VPDPWSSDS Y0, Y9, K1, Y1                           // 62f2352953c8
+       VPDPWSSDS Y19, Y9, K1, Y1                          // 62b2352953cb
+       VPDPWSSDS Y31, Y9, K1, Y1                          // 6292352953cf
+       VPDPWSSDS (R8), Y9, K1, Y1                         // 62d235295308
+       VPDPWSSDS 15(DX)(BX*2), Y9, K1, Y1                 // 62f23529538c5a0f000000
+       VPDPWSSDS Z6, Z9, K2, Z12                          // 6272354a53e6
+       VPDPWSSDS Z25, Z9, K2, Z12                         // 6212354a53e1
+       VPDPWSSDS 17(SP), Z9, K2, Z12                      // 6272354a53a42411000000
+       VPDPWSSDS -17(BP)(SI*4), Z9, K2, Z12               // 6272354a53a4b5efffffff
+       VPDPWSSDS Z6, Z12, K2, Z12                         // 62721d4a53e6
+       VPDPWSSDS Z25, Z12, K2, Z12                        // 62121d4a53e1
+       VPDPWSSDS 17(SP), Z12, K2, Z12                     // 62721d4a53a42411000000
+       VPDPWSSDS -17(BP)(SI*4), Z12, K2, Z12              // 62721d4a53a4b5efffffff
+       VPDPWSSDS Z6, Z9, K2, Z17                          // 62e2354a53ce
+       VPDPWSSDS Z25, Z9, K2, Z17                         // 6282354a53c9
+       VPDPWSSDS 17(SP), Z9, K2, Z17                      // 62e2354a538c2411000000
+       VPDPWSSDS -17(BP)(SI*4), Z9, K2, Z17               // 62e2354a538cb5efffffff
+       VPDPWSSDS Z6, Z12, K2, Z17                         // 62e21d4a53ce
+       VPDPWSSDS Z25, Z12, K2, Z17                        // 62821d4a53c9
+       VPDPWSSDS 17(SP), Z12, K2, Z17                     // 62e21d4a538c2411000000
+       VPDPWSSDS -17(BP)(SI*4), Z12, K2, Z17              // 62e21d4a538cb5efffffff
        RET
index 8ce47049eb2d89a4215f1bebce83f4a54a89a9da..d71faec10f5901a419ece1f7c6faea39f0cfc493 100644 (file)
@@ -3,80 +3,80 @@
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512_vpopcntdq(SB), NOSPLIT, $0
-       //TODO: VPOPCNTD X12, K2, X8                               // 62527d0a55c4
-       //TODO: VPOPCNTD X16, K2, X8                               // 62327d0a55c0
-       //TODO: VPOPCNTD X23, K2, X8                               // 62327d0a55c7
-       //TODO: VPOPCNTD (R14), K2, X8                             // 62527d0a5506
-       //TODO: VPOPCNTD -7(DI)(R8*8), K2, X8                      // 62327d0a5584c7f9ffffff
-       //TODO: VPOPCNTD X12, K2, X26                              // 62427d0a55d4
-       //TODO: VPOPCNTD X16, K2, X26                              // 62227d0a55d0
-       //TODO: VPOPCNTD X23, K2, X26                              // 62227d0a55d7
-       //TODO: VPOPCNTD (R14), K2, X26                            // 62427d0a5516
-       //TODO: VPOPCNTD -7(DI)(R8*8), K2, X26                     // 62227d0a5594c7f9ffffff
-       //TODO: VPOPCNTD X12, K2, X23                              // 62c27d0a55fc
-       //TODO: VPOPCNTD X16, K2, X23                              // 62a27d0a55f8
-       //TODO: VPOPCNTD X23, K2, X23                              // 62a27d0a55ff
-       //TODO: VPOPCNTD (R14), K2, X23                            // 62c27d0a553e
-       //TODO: VPOPCNTD -7(DI)(R8*8), K2, X23                     // 62a27d0a55bcc7f9ffffff
-       //TODO: VPOPCNTD Y22, K5, Y26                              // 62227d2d55d6
-       //TODO: VPOPCNTD Y3, K5, Y26                               // 62627d2d55d3
-       //TODO: VPOPCNTD Y15, K5, Y26                              // 62427d2d55d7
-       //TODO: VPOPCNTD -15(R14)(R15*1), K5, Y26                  // 62027d2d55943ef1ffffff
-       //TODO: VPOPCNTD -15(BX), K5, Y26                          // 62627d2d5593f1ffffff
-       //TODO: VPOPCNTD Y22, K5, Y30                              // 62227d2d55f6
-       //TODO: VPOPCNTD Y3, K5, Y30                               // 62627d2d55f3
-       //TODO: VPOPCNTD Y15, K5, Y30                              // 62427d2d55f7
-       //TODO: VPOPCNTD -15(R14)(R15*1), K5, Y30                  // 62027d2d55b43ef1ffffff
-       //TODO: VPOPCNTD -15(BX), K5, Y30                          // 62627d2d55b3f1ffffff
-       //TODO: VPOPCNTD Y22, K5, Y12                              // 62327d2d55e6
-       //TODO: VPOPCNTD Y3, K5, Y12                               // 62727d2d55e3
-       //TODO: VPOPCNTD Y15, K5, Y12                              // 62527d2d55e7
-       //TODO: VPOPCNTD -15(R14)(R15*1), K5, Y12                  // 62127d2d55a43ef1ffffff
-       //TODO: VPOPCNTD -15(BX), K5, Y12                          // 62727d2d55a3f1ffffff
-       //TODO: VPOPCNTD Z2, K3, Z22                               // 62e27d4b55f2
-       //TODO: VPOPCNTD Z31, K3, Z22                              // 62827d4b55f7
-       //TODO: VPOPCNTD 7(SI)(DI*4), K3, Z22                      // 62e27d4b55b4be07000000
-       //TODO: VPOPCNTD -7(DI)(R8*2), K3, Z22                     // 62a27d4b55b447f9ffffff
-       //TODO: VPOPCNTD Z2, K3, Z7                                // 62f27d4b55fa
-       //TODO: VPOPCNTD Z31, K3, Z7                               // 62927d4b55ff
-       //TODO: VPOPCNTD 7(SI)(DI*4), K3, Z7                       // 62f27d4b55bcbe07000000
-       //TODO: VPOPCNTD -7(DI)(R8*2), K3, Z7                      // 62b27d4b55bc47f9ffffff
-       //TODO: VPOPCNTQ X24, K4, X23                              // 6282fd0c55f8
-       //TODO: VPOPCNTQ X14, K4, X23                              // 62c2fd0c55fe
-       //TODO: VPOPCNTQ X0, K4, X23                               // 62e2fd0c55f8
-       //TODO: VPOPCNTQ 99(R15)(R15*4), K4, X23                   // 6282fd0c55bcbf63000000
-       //TODO: VPOPCNTQ 15(DX), K4, X23                           // 62e2fd0c55ba0f000000
-       //TODO: VPOPCNTQ X24, K4, X11                              // 6212fd0c55d8
-       //TODO: VPOPCNTQ X14, K4, X11                              // 6252fd0c55de
-       //TODO: VPOPCNTQ X0, K4, X11                               // 6272fd0c55d8
-       //TODO: VPOPCNTQ 99(R15)(R15*4), K4, X11                   // 6212fd0c559cbf63000000
-       //TODO: VPOPCNTQ 15(DX), K4, X11                           // 6272fd0c559a0f000000
-       //TODO: VPOPCNTQ X24, K4, X31                              // 6202fd0c55f8
-       //TODO: VPOPCNTQ X14, K4, X31                              // 6242fd0c55fe
-       //TODO: VPOPCNTQ X0, K4, X31                               // 6262fd0c55f8
-       //TODO: VPOPCNTQ 99(R15)(R15*4), K4, X31                   // 6202fd0c55bcbf63000000
-       //TODO: VPOPCNTQ 15(DX), K4, X31                           // 6262fd0c55ba0f000000
-       //TODO: VPOPCNTQ Y5, K2, Y1                                // 62f2fd2a55cd
-       //TODO: VPOPCNTQ Y17, K2, Y1                               // 62b2fd2a55c9
-       //TODO: VPOPCNTQ Y13, K2, Y1                               // 62d2fd2a55cd
-       //TODO: VPOPCNTQ 7(AX)(CX*4), K2, Y1                       // 62f2fd2a558c8807000000
-       //TODO: VPOPCNTQ 7(AX)(CX*1), K2, Y1                       // 62f2fd2a558c0807000000
-       //TODO: VPOPCNTQ Y5, K2, Y27                               // 6262fd2a55dd
-       //TODO: VPOPCNTQ Y17, K2, Y27                              // 6222fd2a55d9
-       //TODO: VPOPCNTQ Y13, K2, Y27                              // 6242fd2a55dd
-       //TODO: VPOPCNTQ 7(AX)(CX*4), K2, Y27                      // 6262fd2a559c8807000000
-       //TODO: VPOPCNTQ 7(AX)(CX*1), K2, Y27                      // 6262fd2a559c0807000000
-       //TODO: VPOPCNTQ Y5, K2, Y19                               // 62e2fd2a55dd
-       //TODO: VPOPCNTQ Y17, K2, Y19                              // 62a2fd2a55d9
-       //TODO: VPOPCNTQ Y13, K2, Y19                              // 62c2fd2a55dd
-       //TODO: VPOPCNTQ 7(AX)(CX*4), K2, Y19                      // 62e2fd2a559c8807000000
-       //TODO: VPOPCNTQ 7(AX)(CX*1), K2, Y19                      // 62e2fd2a559c0807000000
-       //TODO: VPOPCNTQ Z1, K2, Z20                               // 62e2fd4a55e1
-       //TODO: VPOPCNTQ Z3, K2, Z20                               // 62e2fd4a55e3
-       //TODO: VPOPCNTQ 17(SP), K2, Z20                           // 62e2fd4a55a42411000000
-       //TODO: VPOPCNTQ -17(BP)(SI*4), K2, Z20                    // 62e2fd4a55a4b5efffffff
-       //TODO: VPOPCNTQ Z1, K2, Z9                                // 6272fd4a55c9
-       //TODO: VPOPCNTQ Z3, K2, Z9                                // 6272fd4a55cb
-       //TODO: VPOPCNTQ 17(SP), K2, Z9                            // 6272fd4a558c2411000000
-       //TODO: VPOPCNTQ -17(BP)(SI*4), K2, Z9                     // 6272fd4a558cb5efffffff
+       VPOPCNTD X12, K2, X8                               // 62527d0a55c4
+       VPOPCNTD X16, K2, X8                               // 62327d0a55c0
+       VPOPCNTD X23, K2, X8                               // 62327d0a55c7
+       VPOPCNTD (R14), K2, X8                             // 62527d0a5506
+       VPOPCNTD -7(DI)(R8*8), K2, X8                      // 62327d0a5584c7f9ffffff
+       VPOPCNTD X12, K2, X26                              // 62427d0a55d4
+       VPOPCNTD X16, K2, X26                              // 62227d0a55d0
+       VPOPCNTD X23, K2, X26                              // 62227d0a55d7
+       VPOPCNTD (R14), K2, X26                            // 62427d0a5516
+       VPOPCNTD -7(DI)(R8*8), K2, X26                     // 62227d0a5594c7f9ffffff
+       VPOPCNTD X12, K2, X23                              // 62c27d0a55fc
+       VPOPCNTD X16, K2, X23                              // 62a27d0a55f8
+       VPOPCNTD X23, K2, X23                              // 62a27d0a55ff
+       VPOPCNTD (R14), K2, X23                            // 62c27d0a553e
+       VPOPCNTD -7(DI)(R8*8), K2, X23                     // 62a27d0a55bcc7f9ffffff
+       VPOPCNTD Y22, K5, Y26                              // 62227d2d55d6
+       VPOPCNTD Y3, K5, Y26                               // 62627d2d55d3
+       VPOPCNTD Y15, K5, Y26                              // 62427d2d55d7
+       VPOPCNTD -15(R14)(R15*1), K5, Y26                  // 62027d2d55943ef1ffffff
+       VPOPCNTD -15(BX), K5, Y26                          // 62627d2d5593f1ffffff
+       VPOPCNTD Y22, K5, Y30                              // 62227d2d55f6
+       VPOPCNTD Y3, K5, Y30                               // 62627d2d55f3
+       VPOPCNTD Y15, K5, Y30                              // 62427d2d55f7
+       VPOPCNTD -15(R14)(R15*1), K5, Y30                  // 62027d2d55b43ef1ffffff
+       VPOPCNTD -15(BX), K5, Y30                          // 62627d2d55b3f1ffffff
+       VPOPCNTD Y22, K5, Y12                              // 62327d2d55e6
+       VPOPCNTD Y3, K5, Y12                               // 62727d2d55e3
+       VPOPCNTD Y15, K5, Y12                              // 62527d2d55e7
+       VPOPCNTD -15(R14)(R15*1), K5, Y12                  // 62127d2d55a43ef1ffffff
+       VPOPCNTD -15(BX), K5, Y12                          // 62727d2d55a3f1ffffff
+       VPOPCNTD Z2, K3, Z22                               // 62e27d4b55f2
+       VPOPCNTD Z31, K3, Z22                              // 62827d4b55f7
+       VPOPCNTD 7(SI)(DI*4), K3, Z22                      // 62e27d4b55b4be07000000
+       VPOPCNTD -7(DI)(R8*2), K3, Z22                     // 62a27d4b55b447f9ffffff
+       VPOPCNTD Z2, K3, Z7                                // 62f27d4b55fa
+       VPOPCNTD Z31, K3, Z7                               // 62927d4b55ff
+       VPOPCNTD 7(SI)(DI*4), K3, Z7                       // 62f27d4b55bcbe07000000
+       VPOPCNTD -7(DI)(R8*2), K3, Z7                      // 62b27d4b55bc47f9ffffff
+       VPOPCNTQ X24, K4, X23                              // 6282fd0c55f8
+       VPOPCNTQ X14, K4, X23                              // 62c2fd0c55fe
+       VPOPCNTQ X0, K4, X23                               // 62e2fd0c55f8
+       VPOPCNTQ 99(R15)(R15*4), K4, X23                   // 6282fd0c55bcbf63000000
+       VPOPCNTQ 15(DX), K4, X23                           // 62e2fd0c55ba0f000000
+       VPOPCNTQ X24, K4, X11                              // 6212fd0c55d8
+       VPOPCNTQ X14, K4, X11                              // 6252fd0c55de
+       VPOPCNTQ X0, K4, X11                               // 6272fd0c55d8
+       VPOPCNTQ 99(R15)(R15*4), K4, X11                   // 6212fd0c559cbf63000000
+       VPOPCNTQ 15(DX), K4, X11                           // 6272fd0c559a0f000000
+       VPOPCNTQ X24, K4, X31                              // 6202fd0c55f8
+       VPOPCNTQ X14, K4, X31                              // 6242fd0c55fe
+       VPOPCNTQ X0, K4, X31                               // 6262fd0c55f8
+       VPOPCNTQ 99(R15)(R15*4), K4, X31                   // 6202fd0c55bcbf63000000
+       VPOPCNTQ 15(DX), K4, X31                           // 6262fd0c55ba0f000000
+       VPOPCNTQ Y5, K2, Y1                                // 62f2fd2a55cd
+       VPOPCNTQ Y17, K2, Y1                               // 62b2fd2a55c9
+       VPOPCNTQ Y13, K2, Y1                               // 62d2fd2a55cd
+       VPOPCNTQ 7(AX)(CX*4), K2, Y1                       // 62f2fd2a558c8807000000
+       VPOPCNTQ 7(AX)(CX*1), K2, Y1                       // 62f2fd2a558c0807000000
+       VPOPCNTQ Y5, K2, Y27                               // 6262fd2a55dd
+       VPOPCNTQ Y17, K2, Y27                              // 6222fd2a55d9
+       VPOPCNTQ Y13, K2, Y27                              // 6242fd2a55dd
+       VPOPCNTQ 7(AX)(CX*4), K2, Y27                      // 6262fd2a559c8807000000
+       VPOPCNTQ 7(AX)(CX*1), K2, Y27                      // 6262fd2a559c0807000000
+       VPOPCNTQ Y5, K2, Y19                               // 62e2fd2a55dd
+       VPOPCNTQ Y17, K2, Y19                              // 62a2fd2a55d9
+       VPOPCNTQ Y13, K2, Y19                              // 62c2fd2a55dd
+       VPOPCNTQ 7(AX)(CX*4), K2, Y19                      // 62e2fd2a559c8807000000
+       VPOPCNTQ 7(AX)(CX*1), K2, Y19                      // 62e2fd2a559c0807000000
+       VPOPCNTQ Z1, K2, Z20                               // 62e2fd4a55e1
+       VPOPCNTQ Z3, K2, Z20                               // 62e2fd4a55e3
+       VPOPCNTQ 17(SP), K2, Z20                           // 62e2fd4a55a42411000000
+       VPOPCNTQ -17(BP)(SI*4), K2, Z20                    // 62e2fd4a55a4b5efffffff
+       VPOPCNTQ Z1, K2, Z9                                // 6272fd4a55c9
+       VPOPCNTQ Z3, K2, Z9                                // 6272fd4a55cb
+       VPOPCNTQ 17(SP), K2, Z9                            // 6272fd4a558c2411000000
+       VPOPCNTQ -17(BP)(SI*4), K2, Z9                     // 6272fd4a558cb5efffffff
        RET
index 582df804ea5445ddddbde6af1482461636420c57..e1ffb72589e6b4a65d71b01221c9dac4cdfab653 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512bw(SB), NOSPLIT, $0
-       //TODO: KADDD K4, K7, K5                                   // c4e1c54aec
-       //TODO: KADDD K6, K7, K5                                   // c4e1c54aee
-       //TODO: KADDD K4, K6, K5                                   // c4e1cd4aec
-       //TODO: KADDD K6, K6, K5                                   // c4e1cd4aee
-       //TODO: KADDD K4, K7, K4                                   // c4e1c54ae4
-       //TODO: KADDD K6, K7, K4                                   // c4e1c54ae6
-       //TODO: KADDD K4, K6, K4                                   // c4e1cd4ae4
-       //TODO: KADDD K6, K6, K4                                   // c4e1cd4ae6
-       //TODO: KADDQ K4, K5, K0                                   // c4e1d44ac4
-       //TODO: KADDQ K6, K5, K0                                   // c4e1d44ac6
-       //TODO: KADDQ K4, K4, K0                                   // c4e1dc4ac4
-       //TODO: KADDQ K6, K4, K0                                   // c4e1dc4ac6
-       //TODO: KADDQ K4, K5, K7                                   // c4e1d44afc
-       //TODO: KADDQ K6, K5, K7                                   // c4e1d44afe
-       //TODO: KADDQ K4, K4, K7                                   // c4e1dc4afc
-       //TODO: KADDQ K6, K4, K7                                   // c4e1dc4afe
-       //TODO: KANDD K1, K6, K0                                   // c4e1cd41c1
-       //TODO: KANDD K5, K6, K0                                   // c4e1cd41c5
-       //TODO: KANDD K1, K5, K0                                   // c4e1d541c1
-       //TODO: KANDD K5, K5, K0                                   // c4e1d541c5
-       //TODO: KANDD K1, K6, K5                                   // c4e1cd41e9
-       //TODO: KANDD K5, K6, K5                                   // c4e1cd41ed
-       //TODO: KANDD K1, K5, K5                                   // c4e1d541e9
-       //TODO: KANDD K5, K5, K5                                   // c4e1d541ed
-       //TODO: KANDND K5, K0, K4                                  // c4e1fd42e5
-       //TODO: KANDND K4, K0, K4                                  // c4e1fd42e4
-       //TODO: KANDND K5, K7, K4                                  // c4e1c542e5
-       //TODO: KANDND K4, K7, K4                                  // c4e1c542e4
-       //TODO: KANDND K5, K0, K6                                  // c4e1fd42f5
-       //TODO: KANDND K4, K0, K6                                  // c4e1fd42f4
-       //TODO: KANDND K5, K7, K6                                  // c4e1c542f5
-       //TODO: KANDND K4, K7, K6                                  // c4e1c542f4
-       //TODO: KANDNQ K6, K1, K4                                  // c4e1f442e6
-       //TODO: KANDNQ K7, K1, K4                                  // c4e1f442e7
-       //TODO: KANDNQ K6, K3, K4                                  // c4e1e442e6
-       //TODO: KANDNQ K7, K3, K4                                  // c4e1e442e7
-       //TODO: KANDNQ K6, K1, K6                                  // c4e1f442f6
-       //TODO: KANDNQ K7, K1, K6                                  // c4e1f442f7
-       //TODO: KANDNQ K6, K3, K6                                  // c4e1e442f6
-       //TODO: KANDNQ K7, K3, K6                                  // c4e1e442f7
-       //TODO: KANDQ K6, K0, K2                                   // c4e1fc41d6
-       //TODO: KANDQ K5, K0, K2                                   // c4e1fc41d5
-       //TODO: KANDQ K6, K5, K2                                   // c4e1d441d6
-       //TODO: KANDQ K5, K5, K2                                   // c4e1d441d5
-       //TODO: KANDQ K6, K0, K7                                   // c4e1fc41fe
-       //TODO: KANDQ K5, K0, K7                                   // c4e1fc41fd
-       //TODO: KANDQ K6, K5, K7                                   // c4e1d441fe
-       //TODO: KANDQ K5, K5, K7                                   // c4e1d441fd
-       //TODO: KMOVD K1, 17(SP)                                   // c4e1f9914c2411
-       //TODO: KMOVD K3, 17(SP)                                   // c4e1f9915c2411
-       //TODO: KMOVD K1, -17(BP)(SI*4)                            // c4e1f9914cb5ef
-       //TODO: KMOVD K3, -17(BP)(SI*4)                            // c4e1f9915cb5ef
-       //TODO: KMOVD K6, R14                                      // c57b93f6
-       //TODO: KMOVD K7, R14                                      // c57b93f7
-       //TODO: KMOVD K6, AX                                       // c5fb93c6
-       //TODO: KMOVD K7, AX                                       // c5fb93c7
-       //TODO: KMOVD K4, K6                                       // c4e1f990f4
-       //TODO: KMOVD K6, K6                                       // c4e1f990f6
-       //TODO: KMOVD 7(AX), K6                                    // c4e1f9907007
-       //TODO: KMOVD (DI), K6                                     // c4e1f99037
-       //TODO: KMOVD K4, K4                                       // c4e1f990e4
-       //TODO: KMOVD K6, K4                                       // c4e1f990e6
-       //TODO: KMOVD 7(AX), K4                                    // c4e1f9906007
-       //TODO: KMOVD (DI), K4                                     // c4e1f99027
-       //TODO: KMOVD R9, K4                                       // c4c17b92e1
-       //TODO: KMOVD CX, K4                                       // c5fb92e1
-       //TODO: KMOVD R9, K5                                       // c4c17b92e9
-       //TODO: KMOVD CX, K5                                       // c5fb92e9
-       //TODO: KMOVQ K2, 17(SP)                                   // c4e1f891542411
-       //TODO: KMOVQ K7, 17(SP)                                   // c4e1f8917c2411
-       //TODO: KMOVQ K2, -17(BP)(SI*4)                            // c4e1f89154b5ef
-       //TODO: KMOVQ K7, -17(BP)(SI*4)                            // c4e1f8917cb5ef
-       //TODO: KMOVQ K0, DX                                       // c4e1fb93d0
-       //TODO: KMOVQ K5, DX                                       // c4e1fb93d5
-       //TODO: KMOVQ K0, BP                                       // c4e1fb93e8
-       //TODO: KMOVQ K5, BP                                       // c4e1fb93ed
-       //TODO: KMOVQ K1, K6                                       // c4e1f890f1
-       //TODO: KMOVQ K5, K6                                       // c4e1f890f5
-       //TODO: KMOVQ 7(AX), K6                                    // c4e1f8907007
-       //TODO: KMOVQ (DI), K6                                     // c4e1f89037
-       //TODO: KMOVQ K1, K5                                       // c4e1f890e9
-       //TODO: KMOVQ K5, K5                                       // c4e1f890ed
-       //TODO: KMOVQ 7(AX), K5                                    // c4e1f8906807
-       //TODO: KMOVQ (DI), K5                                     // c4e1f8902f
-       //TODO: KMOVQ R10, K3                                      // c4c1fb92da
-       //TODO: KMOVQ CX, K3                                       // c4e1fb92d9
-       //TODO: KMOVQ R10, K1                                      // c4c1fb92ca
-       //TODO: KMOVQ CX, K1                                       // c4e1fb92c9
-       //TODO: KNOTD K6, K6                                       // c4e1f944f6
-       //TODO: KNOTD K4, K6                                       // c4e1f944f4
-       //TODO: KNOTD K6, K7                                       // c4e1f944fe
-       //TODO: KNOTD K4, K7                                       // c4e1f944fc
-       //TODO: KNOTQ K4, K4                                       // c4e1f844e4
-       //TODO: KNOTQ K5, K4                                       // c4e1f844e5
-       //TODO: KNOTQ K4, K6                                       // c4e1f844f4
-       //TODO: KNOTQ K5, K6                                       // c4e1f844f5
-       //TODO: KORD K4, K7, K5                                    // c4e1c545ec
-       //TODO: KORD K6, K7, K5                                    // c4e1c545ee
-       //TODO: KORD K4, K6, K5                                    // c4e1cd45ec
-       //TODO: KORD K6, K6, K5                                    // c4e1cd45ee
-       //TODO: KORD K4, K7, K4                                    // c4e1c545e4
-       //TODO: KORD K6, K7, K4                                    // c4e1c545e6
-       //TODO: KORD K4, K6, K4                                    // c4e1cd45e4
-       //TODO: KORD K6, K6, K4                                    // c4e1cd45e6
-       //TODO: KORQ K4, K5, K0                                    // c4e1d445c4
-       //TODO: KORQ K6, K5, K0                                    // c4e1d445c6
-       //TODO: KORQ K4, K4, K0                                    // c4e1dc45c4
-       //TODO: KORQ K6, K4, K0                                    // c4e1dc45c6
-       //TODO: KORQ K4, K5, K7                                    // c4e1d445fc
-       //TODO: KORQ K6, K5, K7                                    // c4e1d445fe
-       //TODO: KORQ K4, K4, K7                                    // c4e1dc45fc
-       //TODO: KORQ K6, K4, K7                                    // c4e1dc45fe
-       //TODO: KORTESTD K4, K6                                    // c4e1f998f4
-       //TODO: KORTESTD K6, K6                                    // c4e1f998f6
-       //TODO: KORTESTD K4, K4                                    // c4e1f998e4
-       //TODO: KORTESTD K6, K4                                    // c4e1f998e6
-       //TODO: KORTESTQ K2, K4                                    // c4e1f898e2
-       //TODO: KORTESTQ K7, K4                                    // c4e1f898e7
-       //TODO: KORTESTQ K2, K5                                    // c4e1f898ea
-       //TODO: KORTESTQ K7, K5                                    // c4e1f898ef
-       //TODO: KSHIFTLD $0, K5, K0                                // c4e37933c500
-       //TODO: KSHIFTLD $0, K4, K0                                // c4e37933c400
-       //TODO: KSHIFTLD $0, K5, K7                                // c4e37933fd00
-       //TODO: KSHIFTLD $0, K4, K7                                // c4e37933fc00
-       //TODO: KSHIFTLQ $97, K1, K4                               // c4e3f933e161
-       //TODO: KSHIFTLQ $97, K3, K4                               // c4e3f933e361
-       //TODO: KSHIFTLQ $97, K1, K6                               // c4e3f933f161
-       //TODO: KSHIFTLQ $97, K3, K6                               // c4e3f933f361
-       //TODO: KSHIFTRD $79, K0, K2                               // c4e37931d04f
-       //TODO: KSHIFTRD $79, K5, K2                               // c4e37931d54f
-       //TODO: KSHIFTRD $79, K0, K7                               // c4e37931f84f
-       //TODO: KSHIFTRD $79, K5, K7                               // c4e37931fd4f
-       //TODO: KSHIFTRQ $64, K1, K6                               // c4e3f931f140
-       //TODO: KSHIFTRQ $64, K5, K6                               // c4e3f931f540
-       //TODO: KSHIFTRQ $64, K1, K5                               // c4e3f931e940
-       //TODO: KSHIFTRQ $64, K5, K5                               // c4e3f931ed40
-       //TODO: KTESTD K5, K0                                      // c4e1f999c5
-       //TODO: KTESTD K4, K0                                      // c4e1f999c4
-       //TODO: KTESTD K5, K7                                      // c4e1f999fd
-       //TODO: KTESTD K4, K7                                      // c4e1f999fc
-       //TODO: KTESTQ K1, K4                                      // c4e1f899e1
-       //TODO: KTESTQ K3, K4                                      // c4e1f899e3
-       //TODO: KTESTQ K1, K6                                      // c4e1f899f1
-       //TODO: KTESTQ K3, K6                                      // c4e1f899f3
-       //TODO: KUNPCKDQ K1, K6, K0                                // c4e1cc4bc1
-       //TODO: KUNPCKDQ K5, K6, K0                                // c4e1cc4bc5
-       //TODO: KUNPCKDQ K1, K5, K0                                // c4e1d44bc1
-       //TODO: KUNPCKDQ K5, K5, K0                                // c4e1d44bc5
-       //TODO: KUNPCKDQ K1, K6, K5                                // c4e1cc4be9
-       //TODO: KUNPCKDQ K5, K6, K5                                // c4e1cc4bed
-       //TODO: KUNPCKDQ K1, K5, K5                                // c4e1d44be9
-       //TODO: KUNPCKDQ K5, K5, K5                                // c4e1d44bed
-       //TODO: KUNPCKWD K7, K5, K3                                // c5d44bdf
-       //TODO: KUNPCKWD K6, K5, K3                                // c5d44bde
-       //TODO: KUNPCKWD K7, K4, K3                                // c5dc4bdf
-       //TODO: KUNPCKWD K6, K4, K3                                // c5dc4bde
-       //TODO: KUNPCKWD K7, K5, K1                                // c5d44bcf
-       //TODO: KUNPCKWD K6, K5, K1                                // c5d44bce
-       //TODO: KUNPCKWD K7, K4, K1                                // c5dc4bcf
-       //TODO: KUNPCKWD K6, K4, K1                                // c5dc4bce
-       //TODO: KXNORD K6, K1, K4                                  // c4e1f546e6
-       //TODO: KXNORD K7, K1, K4                                  // c4e1f546e7
-       //TODO: KXNORD K6, K3, K4                                  // c4e1e546e6
-       //TODO: KXNORD K7, K3, K4                                  // c4e1e546e7
-       //TODO: KXNORD K6, K1, K6                                  // c4e1f546f6
-       //TODO: KXNORD K7, K1, K6                                  // c4e1f546f7
-       //TODO: KXNORD K6, K3, K6                                  // c4e1e546f6
-       //TODO: KXNORD K7, K3, K6                                  // c4e1e546f7
-       //TODO: KXNORQ K4, K4, K6                                  // c4e1dc46f4
-       //TODO: KXNORQ K5, K4, K6                                  // c4e1dc46f5
-       //TODO: KXNORQ K4, K6, K6                                  // c4e1cc46f4
-       //TODO: KXNORQ K5, K6, K6                                  // c4e1cc46f5
-       //TODO: KXNORQ K4, K4, K4                                  // c4e1dc46e4
-       //TODO: KXNORQ K5, K4, K4                                  // c4e1dc46e5
-       //TODO: KXNORQ K4, K6, K4                                  // c4e1cc46e4
-       //TODO: KXNORQ K5, K6, K4                                  // c4e1cc46e5
-       //TODO: KXORD K0, K4, K7                                   // c4e1dd47f8
-       //TODO: KXORD K7, K4, K7                                   // c4e1dd47ff
-       //TODO: KXORD K0, K6, K7                                   // c4e1cd47f8
-       //TODO: KXORD K7, K6, K7                                   // c4e1cd47ff
-       //TODO: KXORD K0, K4, K6                                   // c4e1dd47f0
-       //TODO: KXORD K7, K4, K6                                   // c4e1dd47f7
-       //TODO: KXORD K0, K6, K6                                   // c4e1cd47f0
-       //TODO: KXORD K7, K6, K6                                   // c4e1cd47f7
-       //TODO: KXORQ K1, K4, K5                                   // c4e1dc47e9
-       //TODO: KXORQ K3, K4, K5                                   // c4e1dc47eb
-       //TODO: KXORQ K1, K6, K5                                   // c4e1cc47e9
-       //TODO: KXORQ K3, K6, K5                                   // c4e1cc47eb
-       //TODO: KXORQ K1, K4, K4                                   // c4e1dc47e1
-       //TODO: KXORQ K3, K4, K4                                   // c4e1dc47e3
-       //TODO: KXORQ K1, K6, K4                                   // c4e1cc47e1
-       //TODO: KXORQ K3, K6, K4                                   // c4e1cc47e3
-       //TODO: VDBPSADBW $65, X15, X17, K3, X5                    // 62d3750342ef41
-       //TODO: VDBPSADBW $65, 7(AX)(CX*4), X17, K3, X5            // 62f3750342ac880700000041
-       //TODO: VDBPSADBW $65, 7(AX)(CX*1), X17, K3, X5            // 62f3750342ac080700000041
-       //TODO: VDBPSADBW $67, Y17, Y5, K4, Y19                    // 62a3552c42d943
-       //TODO: VDBPSADBW $67, 99(R15)(R15*2), Y5, K4, Y19         // 6283552c429c7f6300000043
-       //TODO: VDBPSADBW $67, -7(DI), Y5, K4, Y19                 // 62e3552c429ff9ffffff43
-       //TODO: VDBPSADBW $127, Z3, Z5, K2, Z19                    // 62e3554a42db7f
-       //TODO: VDBPSADBW $127, Z5, Z5, K2, Z19                    // 62e3554a42dd7f
-       //TODO: VDBPSADBW $127, 17(SP)(BP*1), Z5, K2, Z19          // 62e3554a429c2c110000007f
-       //TODO: VDBPSADBW $127, -7(CX)(DX*8), Z5, K2, Z19          // 62e3554a429cd1f9ffffff7f
-       //TODO: VDBPSADBW $127, Z3, Z1, K2, Z19                    // 62e3754a42db7f
-       //TODO: VDBPSADBW $127, Z5, Z1, K2, Z19                    // 62e3754a42dd7f
-       //TODO: VDBPSADBW $127, 17(SP)(BP*1), Z1, K2, Z19          // 62e3754a429c2c110000007f
-       //TODO: VDBPSADBW $127, -7(CX)(DX*8), Z1, K2, Z19          // 62e3754a429cd1f9ffffff7f
-       //TODO: VDBPSADBW $127, Z3, Z5, K2, Z15                    // 6273554a42fb7f
-       //TODO: VDBPSADBW $127, Z5, Z5, K2, Z15                    // 6273554a42fd7f
-       //TODO: VDBPSADBW $127, 17(SP)(BP*1), Z5, K2, Z15          // 6273554a42bc2c110000007f
-       //TODO: VDBPSADBW $127, -7(CX)(DX*8), Z5, K2, Z15          // 6273554a42bcd1f9ffffff7f
-       //TODO: VDBPSADBW $127, Z3, Z1, K2, Z15                    // 6273754a42fb7f
-       //TODO: VDBPSADBW $127, Z5, Z1, K2, Z15                    // 6273754a42fd7f
-       //TODO: VDBPSADBW $127, 17(SP)(BP*1), Z1, K2, Z15          // 6273754a42bc2c110000007f
-       //TODO: VDBPSADBW $127, -7(CX)(DX*8), Z1, K2, Z15          // 6273754a42bcd1f9ffffff7f
-       //TODO: VMOVDQU16 X14, K1, X16                             // 6231ff097ff0
-       //TODO: VMOVDQU16 X14, K1, -17(BP)(SI*2)                   // 6271ff097fb475efffffff
-       //TODO: VMOVDQU16 X14, K1, 7(AX)(CX*2)                     // 6271ff097fb44807000000
-       //TODO: VMOVDQU16 X14, K1, X11                             // 6251ff097ff3
-       //TODO: VMOVDQU16 15(R8)(R14*1), K1, X11                   // 6211ff096f9c300f000000
-       //TODO: VMOVDQU16 15(R8)(R14*2), K1, X11                   // 6211ff096f9c700f000000
-       //TODO: VMOVDQU16 Y24, K7, Y18                             // 6221ff2f7fc2
-       //TODO: VMOVDQU16 Y24, K7, 7(SI)(DI*4)                     // 6261ff2f7f84be07000000
-       //TODO: VMOVDQU16 Y24, K7, -7(DI)(R8*2)                    // 6221ff2f7f8447f9ffffff
-       //TODO: VMOVDQU16 Y11, K2, Y8                              // 6251ff2a7fd8
-       //TODO: VMOVDQU16 17(SP), K2, Y8                           // 6271ff2a6f842411000000
-       //TODO: VMOVDQU16 -17(BP)(SI*4), K2, Y8                    // 6271ff2a6f84b5efffffff
-       //TODO: VMOVDQU16 Z6, K4, Z22                              // 62b1ff4c7ff6
-       //TODO: VMOVDQU16 Z8, K4, Z22                              // 6231ff4c7fc6
-       //TODO: VMOVDQU16 Z6, K4, Z11                              // 62d1ff4c7ff3
-       //TODO: VMOVDQU16 Z8, K4, Z11                              // 6251ff4c7fc3
-       //TODO: VMOVDQU16 Z6, K4, (CX)                             // 62f1ff4c7f31
-       //TODO: VMOVDQU16 Z8, K4, (CX)                             // 6271ff4c7f01
-       //TODO: VMOVDQU16 Z6, K4, 99(R15)                          // 62d1ff4c7fb763000000
-       //TODO: VMOVDQU16 Z8, K4, 99(R15)                          // 6251ff4c7f8763000000
-       //TODO: VMOVDQU16 Z12, K1, Z25                             // 6211ff497fe1
-       //TODO: VMOVDQU16 Z17, K1, Z25                             // 6281ff497fc9
-       //TODO: VMOVDQU16 99(R15)(R15*2), K1, Z25                  // 6201ff496f8c7f63000000
-       //TODO: VMOVDQU16 -7(DI), K1, Z25                          // 6261ff496f8ff9ffffff
-       //TODO: VMOVDQU16 Z12, K1, Z12                             // 6251ff497fe4
-       //TODO: VMOVDQU16 Z17, K1, Z12                             // 62c1ff497fcc
-       //TODO: VMOVDQU16 99(R15)(R15*2), K1, Z12                  // 6211ff496fa47f63000000
-       //TODO: VMOVDQU16 -7(DI), K1, Z12                          // 6271ff496fa7f9ffffff
-       //TODO: VMOVDQU8 X11, K5, X23                              // 62317f0d7fdf
-       //TODO: VMOVDQU8 X11, K5, -7(CX)(DX*1)                     // 62717f0d7f9c11f9ffffff
-       //TODO: VMOVDQU8 X11, K5, -15(R14)(R15*4)                  // 62117f0d7f9cbef1ffffff
-       //TODO: VMOVDQU8 X24, K3, X31                              // 62017f0b7fc7
-       //TODO: VMOVDQU8 15(DX)(BX*1), K3, X31                     // 62617f0b6fbc1a0f000000
-       //TODO: VMOVDQU8 -7(CX)(DX*2), K3, X31                     // 62617f0b6fbc51f9ffffff
-       //TODO: VMOVDQU8 Y3, K4, Y6                                // 62f17f2c7fde
-       //TODO: VMOVDQU8 Y3, K4, 7(SI)(DI*1)                       // 62f17f2c7f9c3e07000000
-       //TODO: VMOVDQU8 Y3, K4, 15(DX)(BX*8)                      // 62f17f2c7f9cda0f000000
-       //TODO: VMOVDQU8 Y6, K2, Y7                                // 62f17f2a7ff7
-       //TODO: VMOVDQU8 -7(DI)(R8*1), K2, Y7                      // 62b17f2a6fbc07f9ffffff
-       //TODO: VMOVDQU8 (SP), K2, Y7                              // 62f17f2a6f3c24
-       //TODO: VMOVDQU8 Z9, K2, Z3                                // 62717f4a7fcb
-       //TODO: VMOVDQU8 Z19, K2, Z3                               // 62e17f4a7fdb
-       //TODO: VMOVDQU8 Z9, K2, Z30                               // 62117f4a7fce
-       //TODO: VMOVDQU8 Z19, K2, Z30                              // 62817f4a7fde
-       //TODO: VMOVDQU8 Z9, K2, 15(R8)                            // 62517f4a7f880f000000
-       //TODO: VMOVDQU8 Z19, K2, 15(R8)                           // 62c17f4a7f980f000000
-       //TODO: VMOVDQU8 Z9, K2, (BP)                              // 62717f4a7f4d00
-       //TODO: VMOVDQU8 Z19, K2, (BP)                             // 62e17f4a7f5d00
-       //TODO: VMOVDQU8 Z11, K3, Z12                              // 62517f4b7fdc
-       //TODO: VMOVDQU8 Z5, K3, Z12                               // 62d17f4b7fec
-       //TODO: VMOVDQU8 15(R8)(R14*8), K3, Z12                    // 62117f4b6fa4f00f000000
-       //TODO: VMOVDQU8 -15(R14)(R15*2), K3, Z12                  // 62117f4b6fa47ef1ffffff
-       //TODO: VMOVDQU8 Z11, K3, Z22                              // 62317f4b7fde
-       //TODO: VMOVDQU8 Z5, K3, Z22                               // 62b17f4b7fee
-       //TODO: VMOVDQU8 15(R8)(R14*8), K3, Z22                    // 62817f4b6fb4f00f000000
-       //TODO: VMOVDQU8 -15(R14)(R15*2), K3, Z22                  // 62817f4b6fb47ef1ffffff
-       //TODO: VPABSB X22, K3, X6                                 // 62b27d0b1cf6 or 62b2fd0b1cf6
-       //TODO: VPABSB -7(CX), K3, X6                              // 62f27d0b1cb1f9ffffff or 62f2fd0b1cb1f9ffffff
-       //TODO: VPABSB 15(DX)(BX*4), K3, X6                        // 62f27d0b1cb49a0f000000 or 62f2fd0b1cb49a0f000000
-       //TODO: VPABSB Y27, K4, Y11                                // 62127d2c1cdb or 6212fd2c1cdb
-       //TODO: VPABSB 15(DX)(BX*1), K4, Y11                       // 62727d2c1c9c1a0f000000 or 6272fd2c1c9c1a0f000000
-       //TODO: VPABSB -7(CX)(DX*2), K4, Y11                       // 62727d2c1c9c51f9ffffff or 6272fd2c1c9c51f9ffffff
-       //TODO: VPABSB Z6, K5, Z21                                 // 62e27d4d1cee or 62e2fd4d1cee
-       //TODO: VPABSB Z9, K5, Z21                                 // 62c27d4d1ce9 or 62c2fd4d1ce9
-       //TODO: VPABSB (AX), K5, Z21                               // 62e27d4d1c28 or 62e2fd4d1c28
-       //TODO: VPABSB 7(SI), K5, Z21                              // 62e27d4d1cae07000000 or 62e2fd4d1cae07000000
-       //TODO: VPABSB Z6, K5, Z9                                  // 62727d4d1cce or 6272fd4d1cce
-       //TODO: VPABSB Z9, K5, Z9                                  // 62527d4d1cc9 or 6252fd4d1cc9
-       //TODO: VPABSB (AX), K5, Z9                                // 62727d4d1c08 or 6272fd4d1c08
-       //TODO: VPABSB 7(SI), K5, Z9                               // 62727d4d1c8e07000000 or 6272fd4d1c8e07000000
-       //TODO: VPABSW X11, K4, X15                                // 62527d0c1dfb or 6252fd0c1dfb
-       //TODO: VPABSW (BX), K4, X15                               // 62727d0c1d3b or 6272fd0c1d3b
-       //TODO: VPABSW -17(BP)(SI*1), K4, X15                      // 62727d0c1dbc35efffffff or 6272fd0c1dbc35efffffff
-       //TODO: VPABSW Y3, K7, Y26                                 // 62627d2f1dd3 or 6262fd2f1dd3
-       //TODO: VPABSW 15(R8), K7, Y26                             // 62427d2f1d900f000000 or 6242fd2f1d900f000000
-       //TODO: VPABSW (BP), K7, Y26                               // 62627d2f1d5500 or 6262fd2f1d5500
-       //TODO: VPABSW Z16, K2, Z7                                 // 62b27d4a1df8 or 62b2fd4a1df8
-       //TODO: VPABSW Z25, K2, Z7                                 // 62927d4a1df9 or 6292fd4a1df9
-       //TODO: VPABSW (R8), K2, Z7                                // 62d27d4a1d38 or 62d2fd4a1d38
-       //TODO: VPABSW 15(DX)(BX*2), K2, Z7                        // 62f27d4a1dbc5a0f000000 or 62f2fd4a1dbc5a0f000000
-       //TODO: VPABSW Z16, K2, Z21                                // 62a27d4a1de8 or 62a2fd4a1de8
-       //TODO: VPABSW Z25, K2, Z21                                // 62827d4a1de9 or 6282fd4a1de9
-       //TODO: VPABSW (R8), K2, Z21                               // 62c27d4a1d28 or 62c2fd4a1d28
-       //TODO: VPABSW 15(DX)(BX*2), K2, Z21                       // 62e27d4a1dac5a0f000000 or 62e2fd4a1dac5a0f000000
-       //TODO: VPACKSSDW X13, X19, K5, X1                         // 62d165056bcd
-       //TODO: VPACKSSDW 15(R8)(R14*4), X19, K5, X1               // 629165056b8cb00f000000
-       //TODO: VPACKSSDW -7(CX)(DX*4), X19, K5, X1                // 62f165056b8c91f9ffffff
-       //TODO: VPACKSSDW Y1, Y28, K3, Y8                          // 62711d236bc1
-       //TODO: VPACKSSDW 15(R8)(R14*8), Y28, K3, Y8               // 62111d236b84f00f000000
-       //TODO: VPACKSSDW -15(R14)(R15*2), Y28, K3, Y8             // 62111d236b847ef1ffffff
-       //TODO: VPACKSSDW Z21, Z12, K4, Z14                        // 62311d4c6bf5
-       //TODO: VPACKSSDW Z9, Z12, K4, Z14                         // 62511d4c6bf1
-       //TODO: VPACKSSDW 17(SP)(BP*1), Z12, K4, Z14               // 62711d4c6bb42c11000000
-       //TODO: VPACKSSDW -7(CX)(DX*8), Z12, K4, Z14               // 62711d4c6bb4d1f9ffffff
-       //TODO: VPACKSSDW Z21, Z13, K4, Z14                        // 6231154c6bf5
-       //TODO: VPACKSSDW Z9, Z13, K4, Z14                         // 6251154c6bf1
-       //TODO: VPACKSSDW 17(SP)(BP*1), Z13, K4, Z14               // 6271154c6bb42c11000000
-       //TODO: VPACKSSDW -7(CX)(DX*8), Z13, K4, Z14               // 6271154c6bb4d1f9ffffff
-       //TODO: VPACKSSDW Z21, Z12, K4, Z13                        // 62311d4c6bed
-       //TODO: VPACKSSDW Z9, Z12, K4, Z13                         // 62511d4c6be9
-       //TODO: VPACKSSDW 17(SP)(BP*1), Z12, K4, Z13               // 62711d4c6bac2c11000000
-       //TODO: VPACKSSDW -7(CX)(DX*8), Z12, K4, Z13               // 62711d4c6bacd1f9ffffff
-       //TODO: VPACKSSDW Z21, Z13, K4, Z13                        // 6231154c6bed
-       //TODO: VPACKSSDW Z9, Z13, K4, Z13                         // 6251154c6be9
-       //TODO: VPACKSSDW 17(SP)(BP*1), Z13, K4, Z13               // 6271154c6bac2c11000000
-       //TODO: VPACKSSDW -7(CX)(DX*8), Z13, K4, Z13               // 6271154c6bacd1f9ffffff
-       //TODO: VPACKSSWB X0, X14, K2, X2                          // 62f10d0a63d0 or 62f18d0a63d0
-       //TODO: VPACKSSWB (R8), X14, K2, X2                        // 62d10d0a6310 or 62d18d0a6310
-       //TODO: VPACKSSWB 15(DX)(BX*2), X14, K2, X2                // 62f10d0a63945a0f000000 or 62f18d0a63945a0f000000
-       //TODO: VPACKSSWB Y31, Y14, K2, Y23                        // 62810d2a63ff or 62818d2a63ff
-       //TODO: VPACKSSWB -15(R14)(R15*1), Y14, K2, Y23            // 62810d2a63bc3ef1ffffff or 62818d2a63bc3ef1ffffff
-       //TODO: VPACKSSWB -15(BX), Y14, K2, Y23                    // 62e10d2a63bbf1ffffff or 62e18d2a63bbf1ffffff
-       //TODO: VPACKSSWB Z23, Z27, K3, Z2                         // 62b1254363d7 or 62b1a54363d7
-       //TODO: VPACKSSWB Z9, Z27, K3, Z2                          // 62d1254363d1 or 62d1a54363d1
-       //TODO: VPACKSSWB -17(BP)(SI*2), Z27, K3, Z2               // 62f12543639475efffffff or 62f1a543639475efffffff
-       //TODO: VPACKSSWB 7(AX)(CX*2), Z27, K3, Z2                 // 62f1254363944807000000 or 62f1a54363944807000000
-       //TODO: VPACKSSWB Z23, Z25, K3, Z2                         // 62b1354363d7 or 62b1b54363d7
-       //TODO: VPACKSSWB Z9, Z25, K3, Z2                          // 62d1354363d1 or 62d1b54363d1
-       //TODO: VPACKSSWB -17(BP)(SI*2), Z25, K3, Z2               // 62f13543639475efffffff or 62f1b543639475efffffff
-       //TODO: VPACKSSWB 7(AX)(CX*2), Z25, K3, Z2                 // 62f1354363944807000000 or 62f1b54363944807000000
-       //TODO: VPACKSSWB Z23, Z27, K3, Z7                         // 62b1254363ff or 62b1a54363ff
-       //TODO: VPACKSSWB Z9, Z27, K3, Z7                          // 62d1254363f9 or 62d1a54363f9
-       //TODO: VPACKSSWB -17(BP)(SI*2), Z27, K3, Z7               // 62f1254363bc75efffffff or 62f1a54363bc75efffffff
-       //TODO: VPACKSSWB 7(AX)(CX*2), Z27, K3, Z7                 // 62f1254363bc4807000000 or 62f1a54363bc4807000000
-       //TODO: VPACKSSWB Z23, Z25, K3, Z7                         // 62b1354363ff or 62b1b54363ff
-       //TODO: VPACKSSWB Z9, Z25, K3, Z7                          // 62d1354363f9 or 62d1b54363f9
-       //TODO: VPACKSSWB -17(BP)(SI*2), Z25, K3, Z7               // 62f1354363bc75efffffff or 62f1b54363bc75efffffff
-       //TODO: VPACKSSWB 7(AX)(CX*2), Z25, K3, Z7                 // 62f1354363bc4807000000 or 62f1b54363bc4807000000
-       //TODO: VPACKUSDW X11, X25, K3, X0                         // 62d235032bc3
-       //TODO: VPACKUSDW 17(SP)(BP*1), X25, K3, X0                // 62f235032b842c11000000
-       //TODO: VPACKUSDW -7(CX)(DX*8), X25, K3, X0                // 62f235032b84d1f9ffffff
-       //TODO: VPACKUSDW Y22, Y2, K3, Y25                         // 62226d2b2bce
-       //TODO: VPACKUSDW 7(AX)(CX*4), Y2, K3, Y25                 // 62626d2b2b8c8807000000
-       //TODO: VPACKUSDW 7(AX)(CX*1), Y2, K3, Y25                 // 62626d2b2b8c0807000000
-       //TODO: VPACKUSDW Z14, Z3, K2, Z27                         // 6242654a2bde
-       //TODO: VPACKUSDW Z7, Z3, K2, Z27                          // 6262654a2bdf
-       //TODO: VPACKUSDW 15(R8)(R14*1), Z3, K2, Z27               // 6202654a2b9c300f000000
-       //TODO: VPACKUSDW 15(R8)(R14*2), Z3, K2, Z27               // 6202654a2b9c700f000000
-       //TODO: VPACKUSDW Z14, Z0, K2, Z27                         // 62427d4a2bde
-       //TODO: VPACKUSDW Z7, Z0, K2, Z27                          // 62627d4a2bdf
-       //TODO: VPACKUSDW 15(R8)(R14*1), Z0, K2, Z27               // 62027d4a2b9c300f000000
-       //TODO: VPACKUSDW 15(R8)(R14*2), Z0, K2, Z27               // 62027d4a2b9c700f000000
-       //TODO: VPACKUSDW Z14, Z3, K2, Z14                         // 6252654a2bf6
-       //TODO: VPACKUSDW Z7, Z3, K2, Z14                          // 6272654a2bf7
-       //TODO: VPACKUSDW 15(R8)(R14*1), Z3, K2, Z14               // 6212654a2bb4300f000000
-       //TODO: VPACKUSDW 15(R8)(R14*2), Z3, K2, Z14               // 6212654a2bb4700f000000
-       //TODO: VPACKUSDW Z14, Z0, K2, Z14                         // 62527d4a2bf6
-       //TODO: VPACKUSDW Z7, Z0, K2, Z14                          // 62727d4a2bf7
-       //TODO: VPACKUSDW 15(R8)(R14*1), Z0, K2, Z14               // 62127d4a2bb4300f000000
-       //TODO: VPACKUSDW 15(R8)(R14*2), Z0, K2, Z14               // 62127d4a2bb4700f000000
-       //TODO: VPACKUSWB X11, X18, K1, X17                        // 62c16d0167cb or 62c1ed0167cb
-       //TODO: VPACKUSWB -17(BP)(SI*2), X18, K1, X17              // 62e16d01678c75efffffff or 62e1ed01678c75efffffff
-       //TODO: VPACKUSWB 7(AX)(CX*2), X18, K1, X17                // 62e16d01678c4807000000 or 62e1ed01678c4807000000
-       //TODO: VPACKUSWB Y9, Y8, K2, Y27                          // 62413d2a67d9 or 6241bd2a67d9
-       //TODO: VPACKUSWB (SI), Y8, K2, Y27                        // 62613d2a671e or 6261bd2a671e
-       //TODO: VPACKUSWB 7(SI)(DI*2), Y8, K2, Y27                 // 62613d2a679c7e07000000 or 6261bd2a679c7e07000000
-       //TODO: VPACKUSWB Z1, Z22, K1, Z8                          // 62714d4167c1 or 6271cd4167c1
-       //TODO: VPACKUSWB Z16, Z22, K1, Z8                         // 62314d4167c0 or 6231cd4167c0
-       //TODO: VPACKUSWB (R14), Z22, K1, Z8                       // 62514d416706 or 6251cd416706
-       //TODO: VPACKUSWB -7(DI)(R8*8), Z22, K1, Z8                // 62314d416784c7f9ffffff or 6231cd416784c7f9ffffff
-       //TODO: VPACKUSWB Z1, Z25, K1, Z8                          // 6271354167c1 or 6271b54167c1
-       //TODO: VPACKUSWB Z16, Z25, K1, Z8                         // 6231354167c0 or 6231b54167c0
-       //TODO: VPACKUSWB (R14), Z25, K1, Z8                       // 625135416706 or 6251b5416706
-       //TODO: VPACKUSWB -7(DI)(R8*8), Z25, K1, Z8                // 623135416784c7f9ffffff or 6231b5416784c7f9ffffff
-       //TODO: VPACKUSWB Z1, Z22, K1, Z24                         // 62614d4167c1 or 6261cd4167c1
-       //TODO: VPACKUSWB Z16, Z22, K1, Z24                        // 62214d4167c0 or 6221cd4167c0
-       //TODO: VPACKUSWB (R14), Z22, K1, Z24                      // 62414d416706 or 6241cd416706
-       //TODO: VPACKUSWB -7(DI)(R8*8), Z22, K1, Z24               // 62214d416784c7f9ffffff or 6221cd416784c7f9ffffff
-       //TODO: VPACKUSWB Z1, Z25, K1, Z24                         // 6261354167c1 or 6261b54167c1
-       //TODO: VPACKUSWB Z16, Z25, K1, Z24                        // 6221354167c0 or 6221b54167c0
-       //TODO: VPACKUSWB (R14), Z25, K1, Z24                      // 624135416706 or 6241b5416706
-       //TODO: VPACKUSWB -7(DI)(R8*8), Z25, K1, Z24               // 622135416784c7f9ffffff or 6221b5416784c7f9ffffff
-       //TODO: VPADDB X24, X2, K7, X9                             // 62116d0ffcc8 or 6211ed0ffcc8
-       //TODO: VPADDB 15(R8)(R14*1), X2, K7, X9                   // 62116d0ffc8c300f000000 or 6211ed0ffc8c300f000000
-       //TODO: VPADDB 15(R8)(R14*2), X2, K7, X9                   // 62116d0ffc8c700f000000 or 6211ed0ffc8c700f000000
-       //TODO: VPADDB Y14, Y9, K1, Y22                            // 62c13529fcf6 or 62c1b529fcf6
-       //TODO: VPADDB 17(SP)(BP*8), Y9, K1, Y22                   // 62e13529fcb4ec11000000 or 62e1b529fcb4ec11000000
-       //TODO: VPADDB 17(SP)(BP*4), Y9, K1, Y22                   // 62e13529fcb4ac11000000 or 62e1b529fcb4ac11000000
-       //TODO: VPADDB Z15, Z0, K1, Z6                             // 62d17d49fcf7 or 62d1fd49fcf7
-       //TODO: VPADDB Z12, Z0, K1, Z6                             // 62d17d49fcf4 or 62d1fd49fcf4
-       //TODO: VPADDB 99(R15)(R15*4), Z0, K1, Z6                  // 62917d49fcb4bf63000000 or 6291fd49fcb4bf63000000
-       //TODO: VPADDB 15(DX), Z0, K1, Z6                          // 62f17d49fcb20f000000 or 62f1fd49fcb20f000000
-       //TODO: VPADDB Z15, Z8, K1, Z6                             // 62d13d49fcf7 or 62d1bd49fcf7
-       //TODO: VPADDB Z12, Z8, K1, Z6                             // 62d13d49fcf4 or 62d1bd49fcf4
-       //TODO: VPADDB 99(R15)(R15*4), Z8, K1, Z6                  // 62913d49fcb4bf63000000 or 6291bd49fcb4bf63000000
-       //TODO: VPADDB 15(DX), Z8, K1, Z6                          // 62f13d49fcb20f000000 or 62f1bd49fcb20f000000
-       //TODO: VPADDB Z15, Z0, K1, Z2                             // 62d17d49fcd7 or 62d1fd49fcd7
-       //TODO: VPADDB Z12, Z0, K1, Z2                             // 62d17d49fcd4 or 62d1fd49fcd4
-       //TODO: VPADDB 99(R15)(R15*4), Z0, K1, Z2                  // 62917d49fc94bf63000000 or 6291fd49fc94bf63000000
-       //TODO: VPADDB 15(DX), Z0, K1, Z2                          // 62f17d49fc920f000000 or 62f1fd49fc920f000000
-       //TODO: VPADDB Z15, Z8, K1, Z2                             // 62d13d49fcd7 or 62d1bd49fcd7
-       //TODO: VPADDB Z12, Z8, K1, Z2                             // 62d13d49fcd4 or 62d1bd49fcd4
-       //TODO: VPADDB 99(R15)(R15*4), Z8, K1, Z2                  // 62913d49fc94bf63000000 or 6291bd49fc94bf63000000
-       //TODO: VPADDB 15(DX), Z8, K1, Z2                          // 62f13d49fc920f000000 or 62f1bd49fc920f000000
-       //TODO: VPADDSB X15, X11, K4, X3                           // 62d1250cecdf or 62d1a50cecdf
-       //TODO: VPADDSB (CX), X11, K4, X3                          // 62f1250cec19 or 62f1a50cec19
-       //TODO: VPADDSB 99(R15), X11, K4, X3                       // 62d1250cec9f63000000 or 62d1a50cec9f63000000
-       //TODO: VPADDSB Y9, Y22, K5, Y31                           // 62414d25ecf9 or 6241cd25ecf9
-       //TODO: VPADDSB 7(AX), Y22, K5, Y31                        // 62614d25ecb807000000 or 6261cd25ecb807000000
-       //TODO: VPADDSB (DI), Y22, K5, Y31                         // 62614d25ec3f or 6261cd25ec3f
-       //TODO: VPADDSB Z13, Z28, K7, Z26                          // 62411d47ecd5 or 62419d47ecd5
-       //TODO: VPADDSB Z21, Z28, K7, Z26                          // 62211d47ecd5 or 62219d47ecd5
-       //TODO: VPADDSB -7(CX)(DX*1), Z28, K7, Z26                 // 62611d47ec9411f9ffffff or 62619d47ec9411f9ffffff
-       //TODO: VPADDSB -15(R14)(R15*4), Z28, K7, Z26              // 62011d47ec94bef1ffffff or 62019d47ec94bef1ffffff
-       //TODO: VPADDSB Z13, Z6, K7, Z26                           // 62414d4fecd5 or 6241cd4fecd5
-       //TODO: VPADDSB Z21, Z6, K7, Z26                           // 62214d4fecd5 or 6221cd4fecd5
-       //TODO: VPADDSB -7(CX)(DX*1), Z6, K7, Z26                  // 62614d4fec9411f9ffffff or 6261cd4fec9411f9ffffff
-       //TODO: VPADDSB -15(R14)(R15*4), Z6, K7, Z26               // 62014d4fec94bef1ffffff or 6201cd4fec94bef1ffffff
-       //TODO: VPADDSB Z13, Z28, K7, Z14                          // 62511d47ecf5 or 62519d47ecf5
-       //TODO: VPADDSB Z21, Z28, K7, Z14                          // 62311d47ecf5 or 62319d47ecf5
-       //TODO: VPADDSB -7(CX)(DX*1), Z28, K7, Z14                 // 62711d47ecb411f9ffffff or 62719d47ecb411f9ffffff
-       //TODO: VPADDSB -15(R14)(R15*4), Z28, K7, Z14              // 62111d47ecb4bef1ffffff or 62119d47ecb4bef1ffffff
-       //TODO: VPADDSB Z13, Z6, K7, Z14                           // 62514d4fecf5 or 6251cd4fecf5
-       //TODO: VPADDSB Z21, Z6, K7, Z14                           // 62314d4fecf5 or 6231cd4fecf5
-       //TODO: VPADDSB -7(CX)(DX*1), Z6, K7, Z14                  // 62714d4fecb411f9ffffff or 6271cd4fecb411f9ffffff
-       //TODO: VPADDSB -15(R14)(R15*4), Z6, K7, Z14               // 62114d4fecb4bef1ffffff or 6211cd4fecb4bef1ffffff
-       //TODO: VPADDSW X6, X13, K7, X30                           // 6261150fedf6 or 6261950fedf6
-       //TODO: VPADDSW 99(R15)(R15*2), X13, K7, X30               // 6201150fedb47f63000000 or 6201950fedb47f63000000
-       //TODO: VPADDSW -7(DI), X13, K7, X30                       // 6261150fedb7f9ffffff or 6261950fedb7f9ffffff
-       //TODO: VPADDSW Y5, Y31, K6, Y23                           // 62e10526edfd or 62e18526edfd
-       //TODO: VPADDSW 99(R15)(R15*1), Y31, K6, Y23               // 62810526edbc3f63000000 or 62818526edbc3f63000000
-       //TODO: VPADDSW (DX), Y31, K6, Y23                         // 62e10526ed3a or 62e18526ed3a
-       //TODO: VPADDSW Z21, Z3, K3, Z26                           // 6221654bedd5 or 6221e54bedd5
-       //TODO: VPADDSW Z13, Z3, K3, Z26                           // 6241654bedd5 or 6241e54bedd5
-       //TODO: VPADDSW 15(DX)(BX*1), Z3, K3, Z26                  // 6261654bed941a0f000000 or 6261e54bed941a0f000000
-       //TODO: VPADDSW -7(CX)(DX*2), Z3, K3, Z26                  // 6261654bed9451f9ffffff or 6261e54bed9451f9ffffff
-       //TODO: VPADDSW Z21, Z0, K3, Z26                           // 62217d4bedd5 or 6221fd4bedd5
-       //TODO: VPADDSW Z13, Z0, K3, Z26                           // 62417d4bedd5 or 6241fd4bedd5
-       //TODO: VPADDSW 15(DX)(BX*1), Z0, K3, Z26                  // 62617d4bed941a0f000000 or 6261fd4bed941a0f000000
-       //TODO: VPADDSW -7(CX)(DX*2), Z0, K3, Z26                  // 62617d4bed9451f9ffffff or 6261fd4bed9451f9ffffff
-       //TODO: VPADDSW Z21, Z3, K3, Z3                            // 62b1654beddd or 62b1e54beddd
-       //TODO: VPADDSW Z13, Z3, K3, Z3                            // 62d1654beddd or 62d1e54beddd
-       //TODO: VPADDSW 15(DX)(BX*1), Z3, K3, Z3                   // 62f1654bed9c1a0f000000 or 62f1e54bed9c1a0f000000
-       //TODO: VPADDSW -7(CX)(DX*2), Z3, K3, Z3                   // 62f1654bed9c51f9ffffff or 62f1e54bed9c51f9ffffff
-       //TODO: VPADDSW Z21, Z0, K3, Z3                            // 62b17d4beddd or 62b1fd4beddd
-       //TODO: VPADDSW Z13, Z0, K3, Z3                            // 62d17d4beddd or 62d1fd4beddd
-       //TODO: VPADDSW 15(DX)(BX*1), Z0, K3, Z3                   // 62f17d4bed9c1a0f000000 or 62f1fd4bed9c1a0f000000
-       //TODO: VPADDSW -7(CX)(DX*2), Z0, K3, Z3                   // 62f17d4bed9c51f9ffffff or 62f1fd4bed9c51f9ffffff
-       //TODO: VPADDUSB X30, X23, K7, X12                         // 62114507dce6 or 6211c507dce6
-       //TODO: VPADDUSB -7(CX)(DX*1), X23, K7, X12                // 62714507dca411f9ffffff or 6271c507dca411f9ffffff
-       //TODO: VPADDUSB -15(R14)(R15*4), X23, K7, X12             // 62114507dca4bef1ffffff or 6211c507dca4bef1ffffff
-       //TODO: VPADDUSB Y19, Y5, K4, Y0                           // 62b1552cdcc3 or 62b1d52cdcc3
-       //TODO: VPADDUSB -17(BP)(SI*8), Y5, K4, Y0                 // 62f1552cdc84f5efffffff or 62f1d52cdc84f5efffffff
-       //TODO: VPADDUSB (R15), Y5, K4, Y0                         // 62d1552cdc07 or 62d1d52cdc07
-       //TODO: VPADDUSB Z27, Z3, K4, Z11                          // 6211654cdcdb or 6211e54cdcdb
-       //TODO: VPADDUSB Z15, Z3, K4, Z11                          // 6251654cdcdf or 6251e54cdcdf
-       //TODO: VPADDUSB -17(BP), Z3, K4, Z11                      // 6271654cdc9defffffff or 6271e54cdc9defffffff
-       //TODO: VPADDUSB -15(R14)(R15*8), Z3, K4, Z11              // 6211654cdc9cfef1ffffff or 6211e54cdc9cfef1ffffff
-       //TODO: VPADDUSB Z27, Z12, K4, Z11                         // 62111d4cdcdb or 62119d4cdcdb
-       //TODO: VPADDUSB Z15, Z12, K4, Z11                         // 62511d4cdcdf or 62519d4cdcdf
-       //TODO: VPADDUSB -17(BP), Z12, K4, Z11                     // 62711d4cdc9defffffff or 62719d4cdc9defffffff
-       //TODO: VPADDUSB -15(R14)(R15*8), Z12, K4, Z11             // 62111d4cdc9cfef1ffffff or 62119d4cdc9cfef1ffffff
-       //TODO: VPADDUSB Z27, Z3, K4, Z25                          // 6201654cdccb or 6201e54cdccb
-       //TODO: VPADDUSB Z15, Z3, K4, Z25                          // 6241654cdccf or 6241e54cdccf
-       //TODO: VPADDUSB -17(BP), Z3, K4, Z25                      // 6261654cdc8defffffff or 6261e54cdc8defffffff
-       //TODO: VPADDUSB -15(R14)(R15*8), Z3, K4, Z25              // 6201654cdc8cfef1ffffff or 6201e54cdc8cfef1ffffff
-       //TODO: VPADDUSB Z27, Z12, K4, Z25                         // 62011d4cdccb or 62019d4cdccb
-       //TODO: VPADDUSB Z15, Z12, K4, Z25                         // 62411d4cdccf or 62419d4cdccf
-       //TODO: VPADDUSB -17(BP), Z12, K4, Z25                     // 62611d4cdc8defffffff or 62619d4cdc8defffffff
-       //TODO: VPADDUSB -15(R14)(R15*8), Z12, K4, Z25             // 62011d4cdc8cfef1ffffff or 62019d4cdc8cfef1ffffff
-       //TODO: VPADDUSW X2, X20, K7, X8                           // 62715d07ddc2 or 6271dd07ddc2
-       //TODO: VPADDUSW 15(DX)(BX*1), X20, K7, X8                 // 62715d07dd841a0f000000 or 6271dd07dd841a0f000000
-       //TODO: VPADDUSW -7(CX)(DX*2), X20, K7, X8                 // 62715d07dd8451f9ffffff or 6271dd07dd8451f9ffffff
-       //TODO: VPADDUSW Y2, Y28, K2, Y31                          // 62611d22ddfa or 62619d22ddfa
-       //TODO: VPADDUSW 7(SI)(DI*8), Y28, K2, Y31                 // 62611d22ddbcfe07000000 or 62619d22ddbcfe07000000
-       //TODO: VPADDUSW -15(R14), Y28, K2, Y31                    // 62411d22ddbef1ffffff or 62419d22ddbef1ffffff
-       //TODO: VPADDUSW Z8, Z23, K5, Z23                          // 62c14545ddf8 or 62c1c545ddf8
-       //TODO: VPADDUSW Z28, Z23, K5, Z23                         // 62814545ddfc or 6281c545ddfc
-       //TODO: VPADDUSW 17(SP)(BP*2), Z23, K5, Z23                // 62e14545ddbc6c11000000 or 62e1c545ddbc6c11000000
-       //TODO: VPADDUSW -7(DI)(R8*4), Z23, K5, Z23                // 62a14545ddbc87f9ffffff or 62a1c545ddbc87f9ffffff
-       //TODO: VPADDUSW Z8, Z6, K5, Z23                           // 62c14d4dddf8 or 62c1cd4dddf8
-       //TODO: VPADDUSW Z28, Z6, K5, Z23                          // 62814d4dddfc or 6281cd4dddfc
-       //TODO: VPADDUSW 17(SP)(BP*2), Z6, K5, Z23                 // 62e14d4dddbc6c11000000 or 62e1cd4dddbc6c11000000
-       //TODO: VPADDUSW -7(DI)(R8*4), Z6, K5, Z23                 // 62a14d4dddbc87f9ffffff or 62a1cd4dddbc87f9ffffff
-       //TODO: VPADDUSW Z8, Z23, K5, Z5                           // 62d14545dde8 or 62d1c545dde8
-       //TODO: VPADDUSW Z28, Z23, K5, Z5                          // 62914545ddec or 6291c545ddec
-       //TODO: VPADDUSW 17(SP)(BP*2), Z23, K5, Z5                 // 62f14545ddac6c11000000 or 62f1c545ddac6c11000000
-       //TODO: VPADDUSW -7(DI)(R8*4), Z23, K5, Z5                 // 62b14545ddac87f9ffffff or 62b1c545ddac87f9ffffff
-       //TODO: VPADDUSW Z8, Z6, K5, Z5                            // 62d14d4ddde8 or 62d1cd4ddde8
-       //TODO: VPADDUSW Z28, Z6, K5, Z5                           // 62914d4dddec or 6291cd4dddec
-       //TODO: VPADDUSW 17(SP)(BP*2), Z6, K5, Z5                  // 62f14d4dddac6c11000000 or 62f1cd4dddac6c11000000
-       //TODO: VPADDUSW -7(DI)(R8*4), Z6, K5, Z5                  // 62b14d4dddac87f9ffffff or 62b1cd4dddac87f9ffffff
-       //TODO: VPADDW X19, X26, K3, X9                            // 62312d03fdcb or 6231ad03fdcb
-       //TODO: VPADDW -17(BP), X26, K3, X9                        // 62712d03fd8defffffff or 6271ad03fd8defffffff
-       //TODO: VPADDW -15(R14)(R15*8), X26, K3, X9                // 62112d03fd8cfef1ffffff or 6211ad03fd8cfef1ffffff
-       //TODO: VPADDW Y0, Y27, K4, Y24                            // 62612524fdc0 or 6261a524fdc0
-       //TODO: VPADDW 7(SI)(DI*1), Y27, K4, Y24                   // 62612524fd843e07000000 or 6261a524fd843e07000000
-       //TODO: VPADDW 15(DX)(BX*8), Y27, K4, Y24                  // 62612524fd84da0f000000 or 6261a524fd84da0f000000
-       //TODO: VPADDW Z12, Z16, K2, Z21                           // 62c17d42fdec or 62c1fd42fdec
-       //TODO: VPADDW Z27, Z16, K2, Z21                           // 62817d42fdeb or 6281fd42fdeb
-       //TODO: VPADDW 15(R8), Z16, K2, Z21                        // 62c17d42fda80f000000 or 62c1fd42fda80f000000
-       //TODO: VPADDW (BP), Z16, K2, Z21                          // 62e17d42fd6d00 or 62e1fd42fd6d00
-       //TODO: VPADDW Z12, Z13, K2, Z21                           // 62c1154afdec or 62c1954afdec
-       //TODO: VPADDW Z27, Z13, K2, Z21                           // 6281154afdeb or 6281954afdeb
-       //TODO: VPADDW 15(R8), Z13, K2, Z21                        // 62c1154afda80f000000 or 62c1954afda80f000000
-       //TODO: VPADDW (BP), Z13, K2, Z21                          // 62e1154afd6d00 or 62e1954afd6d00
-       //TODO: VPADDW Z12, Z16, K2, Z5                            // 62d17d42fdec or 62d1fd42fdec
-       //TODO: VPADDW Z27, Z16, K2, Z5                            // 62917d42fdeb or 6291fd42fdeb
-       //TODO: VPADDW 15(R8), Z16, K2, Z5                         // 62d17d42fda80f000000 or 62d1fd42fda80f000000
-       //TODO: VPADDW (BP), Z16, K2, Z5                           // 62f17d42fd6d00 or 62f1fd42fd6d00
-       //TODO: VPADDW Z12, Z13, K2, Z5                            // 62d1154afdec or 62d1954afdec
-       //TODO: VPADDW Z27, Z13, K2, Z5                            // 6291154afdeb or 6291954afdeb
-       //TODO: VPADDW 15(R8), Z13, K2, Z5                         // 62d1154afda80f000000 or 62d1954afda80f000000
-       //TODO: VPADDW (BP), Z13, K2, Z5                           // 62f1154afd6d00 or 62f1954afd6d00
-       //TODO: VPALIGNR $13, X16, X31, K2, X0                     // 62b305020fc00d or 62b385020fc00d
-       //TODO: VPALIGNR $13, 17(SP)(BP*2), X31, K2, X0            // 62f305020f846c110000000d or 62f385020f846c110000000d
-       //TODO: VPALIGNR $13, -7(DI)(R8*4), X31, K2, X0            // 62b305020f8487f9ffffff0d or 62b385020f8487f9ffffff0d
-       //TODO: VPALIGNR $65, Y3, Y31, K3, Y11                     // 627305230fdb41 or 627385230fdb41
-       //TODO: VPALIGNR $65, -7(DI)(R8*1), Y31, K3, Y11           // 623305230f9c07f9ffffff41 or 623385230f9c07f9ffffff41
-       //TODO: VPALIGNR $65, (SP), Y31, K3, Y11                   // 627305230f1c2441 or 627385230f1c2441
-       //TODO: VPALIGNR $67, Z25, Z6, K3, Z22                     // 62834d4b0ff143 or 6283cd4b0ff143
-       //TODO: VPALIGNR $67, Z12, Z6, K3, Z22                     // 62c34d4b0ff443 or 62c3cd4b0ff443
-       //TODO: VPALIGNR $67, 15(R8)(R14*8), Z6, K3, Z22           // 62834d4b0fb4f00f00000043 or 6283cd4b0fb4f00f00000043
-       //TODO: VPALIGNR $67, -15(R14)(R15*2), Z6, K3, Z22         // 62834d4b0fb47ef1ffffff43 or 6283cd4b0fb47ef1ffffff43
-       //TODO: VPALIGNR $67, Z25, Z8, K3, Z22                     // 62833d4b0ff143 or 6283bd4b0ff143
-       //TODO: VPALIGNR $67, Z12, Z8, K3, Z22                     // 62c33d4b0ff443 or 62c3bd4b0ff443
-       //TODO: VPALIGNR $67, 15(R8)(R14*8), Z8, K3, Z22           // 62833d4b0fb4f00f00000043 or 6283bd4b0fb4f00f00000043
-       //TODO: VPALIGNR $67, -15(R14)(R15*2), Z8, K3, Z22         // 62833d4b0fb47ef1ffffff43 or 6283bd4b0fb47ef1ffffff43
-       //TODO: VPALIGNR $67, Z25, Z6, K3, Z11                     // 62134d4b0fd943 or 6213cd4b0fd943
-       //TODO: VPALIGNR $67, Z12, Z6, K3, Z11                     // 62534d4b0fdc43 or 6253cd4b0fdc43
-       //TODO: VPALIGNR $67, 15(R8)(R14*8), Z6, K3, Z11           // 62134d4b0f9cf00f00000043 or 6213cd4b0f9cf00f00000043
-       //TODO: VPALIGNR $67, -15(R14)(R15*2), Z6, K3, Z11         // 62134d4b0f9c7ef1ffffff43 or 6213cd4b0f9c7ef1ffffff43
-       //TODO: VPALIGNR $67, Z25, Z8, K3, Z11                     // 62133d4b0fd943 or 6213bd4b0fd943
-       //TODO: VPALIGNR $67, Z12, Z8, K3, Z11                     // 62533d4b0fdc43 or 6253bd4b0fdc43
-       //TODO: VPALIGNR $67, 15(R8)(R14*8), Z8, K3, Z11           // 62133d4b0f9cf00f00000043 or 6213bd4b0f9cf00f00000043
-       //TODO: VPALIGNR $67, -15(R14)(R15*2), Z8, K3, Z11         // 62133d4b0f9c7ef1ffffff43 or 6213bd4b0f9c7ef1ffffff43
-       //TODO: VPAVGB X16, X7, K1, X19                            // 62a14509e0d8 or 62a1c509e0d8
-       //TODO: VPAVGB (SI), X7, K1, X19                           // 62e14509e01e or 62e1c509e01e
-       //TODO: VPAVGB 7(SI)(DI*2), X7, K1, X19                    // 62e14509e09c7e07000000 or 62e1c509e09c7e07000000
-       //TODO: VPAVGB Y14, Y19, K3, Y23                           // 62c16523e0fe or 62c1e523e0fe
-       //TODO: VPAVGB 15(R8)(R14*4), Y19, K3, Y23                 // 62816523e0bcb00f000000 or 6281e523e0bcb00f000000
-       //TODO: VPAVGB -7(CX)(DX*4), Y19, K3, Y23                  // 62e16523e0bc91f9ffffff or 62e1e523e0bc91f9ffffff
-       //TODO: VPAVGB Z2, Z18, K4, Z11                            // 62716d44e0da or 6271ed44e0da
-       //TODO: VPAVGB Z21, Z18, K4, Z11                           // 62316d44e0dd or 6231ed44e0dd
-       //TODO: VPAVGB 7(SI)(DI*4), Z18, K4, Z11                   // 62716d44e09cbe07000000 or 6271ed44e09cbe07000000
-       //TODO: VPAVGB -7(DI)(R8*2), Z18, K4, Z11                  // 62316d44e09c47f9ffffff or 6231ed44e09c47f9ffffff
-       //TODO: VPAVGB Z2, Z24, K4, Z11                            // 62713d44e0da or 6271bd44e0da
-       //TODO: VPAVGB Z21, Z24, K4, Z11                           // 62313d44e0dd or 6231bd44e0dd
-       //TODO: VPAVGB 7(SI)(DI*4), Z24, K4, Z11                   // 62713d44e09cbe07000000 or 6271bd44e09cbe07000000
-       //TODO: VPAVGB -7(DI)(R8*2), Z24, K4, Z11                  // 62313d44e09c47f9ffffff or 6231bd44e09c47f9ffffff
-       //TODO: VPAVGB Z2, Z18, K4, Z5                             // 62f16d44e0ea or 62f1ed44e0ea
-       //TODO: VPAVGB Z21, Z18, K4, Z5                            // 62b16d44e0ed or 62b1ed44e0ed
-       //TODO: VPAVGB 7(SI)(DI*4), Z18, K4, Z5                    // 62f16d44e0acbe07000000 or 62f1ed44e0acbe07000000
-       //TODO: VPAVGB -7(DI)(R8*2), Z18, K4, Z5                   // 62b16d44e0ac47f9ffffff or 62b1ed44e0ac47f9ffffff
-       //TODO: VPAVGB Z2, Z24, K4, Z5                             // 62f13d44e0ea or 62f1bd44e0ea
-       //TODO: VPAVGB Z21, Z24, K4, Z5                            // 62b13d44e0ed or 62b1bd44e0ed
-       //TODO: VPAVGB 7(SI)(DI*4), Z24, K4, Z5                    // 62f13d44e0acbe07000000 or 62f1bd44e0acbe07000000
-       //TODO: VPAVGB -7(DI)(R8*2), Z24, K4, Z5                   // 62b13d44e0ac47f9ffffff or 62b1bd44e0ac47f9ffffff
-       //TODO: VPAVGW X7, X1, K5, X31                             // 6261750de3ff or 6261f50de3ff
-       //TODO: VPAVGW 17(SP)(BP*8), X1, K5, X31                   // 6261750de3bcec11000000 or 6261f50de3bcec11000000
-       //TODO: VPAVGW 17(SP)(BP*4), X1, K5, X31                   // 6261750de3bcac11000000 or 6261f50de3bcac11000000
-       //TODO: VPAVGW Y16, Y5, K7, Y21                            // 62a1552fe3e8 or 62a1d52fe3e8
-       //TODO: VPAVGW (R8), Y5, K7, Y21                           // 62c1552fe328 or 62c1d52fe328
-       //TODO: VPAVGW 15(DX)(BX*2), Y5, K7, Y21                   // 62e1552fe3ac5a0f000000 or 62e1d52fe3ac5a0f000000
-       //TODO: VPAVGW Z6, Z6, K7, Z7                              // 62f14d4fe3fe or 62f1cd4fe3fe
-       //TODO: VPAVGW Z22, Z6, K7, Z7                             // 62b14d4fe3fe or 62b1cd4fe3fe
-       //TODO: VPAVGW 17(SP), Z6, K7, Z7                          // 62f14d4fe3bc2411000000 or 62f1cd4fe3bc2411000000
-       //TODO: VPAVGW -17(BP)(SI*4), Z6, K7, Z7                   // 62f14d4fe3bcb5efffffff or 62f1cd4fe3bcb5efffffff
-       //TODO: VPAVGW Z6, Z16, K7, Z7                             // 62f17d47e3fe or 62f1fd47e3fe
-       //TODO: VPAVGW Z22, Z16, K7, Z7                            // 62b17d47e3fe or 62b1fd47e3fe
-       //TODO: VPAVGW 17(SP), Z16, K7, Z7                         // 62f17d47e3bc2411000000 or 62f1fd47e3bc2411000000
-       //TODO: VPAVGW -17(BP)(SI*4), Z16, K7, Z7                  // 62f17d47e3bcb5efffffff or 62f1fd47e3bcb5efffffff
-       //TODO: VPAVGW Z6, Z6, K7, Z13                             // 62714d4fe3ee or 6271cd4fe3ee
-       //TODO: VPAVGW Z22, Z6, K7, Z13                            // 62314d4fe3ee or 6231cd4fe3ee
-       //TODO: VPAVGW 17(SP), Z6, K7, Z13                         // 62714d4fe3ac2411000000 or 6271cd4fe3ac2411000000
-       //TODO: VPAVGW -17(BP)(SI*4), Z6, K7, Z13                  // 62714d4fe3acb5efffffff or 6271cd4fe3acb5efffffff
-       //TODO: VPAVGW Z6, Z16, K7, Z13                            // 62717d47e3ee or 6271fd47e3ee
-       //TODO: VPAVGW Z22, Z16, K7, Z13                           // 62317d47e3ee or 6231fd47e3ee
-       //TODO: VPAVGW 17(SP), Z16, K7, Z13                        // 62717d47e3ac2411000000 or 6271fd47e3ac2411000000
-       //TODO: VPAVGW -17(BP)(SI*4), Z16, K7, Z13                 // 62717d47e3acb5efffffff or 6271fd47e3acb5efffffff
-       //TODO: VPBLENDMB X12, X15, K6, X9                         // 6252050e66cc
-       //TODO: VPBLENDMB 7(SI)(DI*4), X15, K6, X9                 // 6272050e668cbe07000000
-       //TODO: VPBLENDMB -7(DI)(R8*2), X15, K6, X9                // 6232050e668c47f9ffffff
-       //TODO: VPBLENDMB Y20, Y21, K3, Y2                         // 62b2552366d4
-       //TODO: VPBLENDMB 17(SP)(BP*1), Y21, K3, Y2                // 62f2552366942c11000000
-       //TODO: VPBLENDMB -7(CX)(DX*8), Y21, K3, Y2                // 62f255236694d1f9ffffff
-       //TODO: VPBLENDMB Z18, Z13, K7, Z1                         // 62b2154f66ca
-       //TODO: VPBLENDMB Z8, Z13, K7, Z1                          // 62d2154f66c8
-       //TODO: VPBLENDMB 7(AX), Z13, K7, Z1                       // 62f2154f668807000000
-       //TODO: VPBLENDMB (DI), Z13, K7, Z1                        // 62f2154f660f
-       //TODO: VPBLENDMB Z18, Z13, K7, Z15                        // 6232154f66fa
-       //TODO: VPBLENDMB Z8, Z13, K7, Z15                         // 6252154f66f8
-       //TODO: VPBLENDMB 7(AX), Z13, K7, Z15                      // 6272154f66b807000000
-       //TODO: VPBLENDMB (DI), Z13, K7, Z15                       // 6272154f663f
-       //TODO: VPBLENDMW X26, X3, K4, X8                          // 6212e50c66c2
-       //TODO: VPBLENDMW 99(R15)(R15*1), X3, K4, X8               // 6212e50c66843f63000000
-       //TODO: VPBLENDMW (DX), X3, K4, X8                         // 6272e50c6602
-       //TODO: VPBLENDMW Y3, Y0, K2, Y6                           // 62f2fd2a66f3
-       //TODO: VPBLENDMW (R14), Y0, K2, Y6                        // 62d2fd2a6636
-       //TODO: VPBLENDMW -7(DI)(R8*8), Y0, K2, Y6                 // 62b2fd2a66b4c7f9ffffff
-       //TODO: VPBLENDMW Z15, Z3, K2, Z14                         // 6252e54a66f7
-       //TODO: VPBLENDMW Z30, Z3, K2, Z14                         // 6212e54a66f6
-       //TODO: VPBLENDMW 7(SI)(DI*8), Z3, K2, Z14                 // 6272e54a66b4fe07000000
-       //TODO: VPBLENDMW -15(R14), Z3, K2, Z14                    // 6252e54a66b6f1ffffff
-       //TODO: VPBLENDMW Z15, Z12, K2, Z14                        // 62529d4a66f7
-       //TODO: VPBLENDMW Z30, Z12, K2, Z14                        // 62129d4a66f6
-       //TODO: VPBLENDMW 7(SI)(DI*8), Z12, K2, Z14                // 62729d4a66b4fe07000000
-       //TODO: VPBLENDMW -15(R14), Z12, K2, Z14                   // 62529d4a66b6f1ffffff
-       //TODO: VPBLENDMW Z15, Z3, K2, Z28                         // 6242e54a66e7
-       //TODO: VPBLENDMW Z30, Z3, K2, Z28                         // 6202e54a66e6
-       //TODO: VPBLENDMW 7(SI)(DI*8), Z3, K2, Z28                 // 6262e54a66a4fe07000000
-       //TODO: VPBLENDMW -15(R14), Z3, K2, Z28                    // 6242e54a66a6f1ffffff
-       //TODO: VPBLENDMW Z15, Z12, K2, Z28                        // 62429d4a66e7
-       //TODO: VPBLENDMW Z30, Z12, K2, Z28                        // 62029d4a66e6
-       //TODO: VPBLENDMW 7(SI)(DI*8), Z12, K2, Z28                // 62629d4a66a4fe07000000
-       //TODO: VPBLENDMW -15(R14), Z12, K2, Z28                   // 62429d4a66a6f1ffffff
-       //TODO: VPBROADCASTB CX, K3, X23                           // 62e27d0b7af9
-       //TODO: VPBROADCASTB SP, K3, X23                           // 62e27d0b7afc
-       //TODO: VPBROADCASTB R14, K3, Y5                           // 62d27d2b7aee
-       //TODO: VPBROADCASTB AX, K3, Y5                            // 62f27d2b7ae8
-       //TODO: VPBROADCASTB R9, K3, Z19                           // 62c27d4b7ad9
-       //TODO: VPBROADCASTB CX, K3, Z19                           // 62e27d4b7ad9
-       //TODO: VPBROADCASTB R9, K3, Z15                           // 62527d4b7af9
-       //TODO: VPBROADCASTB CX, K3, Z15                           // 62727d4b7af9
-       //TODO: VPBROADCASTB X28, K2, X13                          // 62127d0a78ec
-       //TODO: VPBROADCASTB 99(R15)(R15*1), K2, X13               // 62127d0a786c3f63
-       //TODO: VPBROADCASTB (DX), K2, X13                         // 62727d0a782a
-       //TODO: VPBROADCASTB X24, K1, Y20                          // 62827d2978e0
-       //TODO: VPBROADCASTB -17(BP)(SI*8), K1, Y20                // 62e27d297864f5ef
-       //TODO: VPBROADCASTB (R15), K1, Y20                        // 62c27d297827
-       //TODO: VPBROADCASTB X9, K2, Z5                            // 62d27d4a78e9
-       //TODO: VPBROADCASTB 7(SI)(DI*8), K2, Z5                   // 62f27d4a786cfe07
-       //TODO: VPBROADCASTB -15(R14), K2, Z5                      // 62d27d4a786ef1
-       //TODO: VPBROADCASTB X9, K2, Z1                            // 62d27d4a78c9
-       //TODO: VPBROADCASTB 7(SI)(DI*8), K2, Z1                   // 62f27d4a784cfe07
-       //TODO: VPBROADCASTB -15(R14), K2, Z1                      // 62d27d4a784ef1
-       //TODO: VPBROADCASTW R14, K7, X20                          // 62c27d0f7be6
-       //TODO: VPBROADCASTW AX, K7, X20                           // 62e27d0f7be0
-       //TODO: VPBROADCASTW R9, K7, Y22                           // 62c27d2f7bf1
-       //TODO: VPBROADCASTW CX, K7, Y22                           // 62e27d2f7bf1
-       //TODO: VPBROADCASTW SP, K6, Z0                            // 62f27d4e7bc4
-       //TODO: VPBROADCASTW R14, K6, Z0                           // 62d27d4e7bc6
-       //TODO: VPBROADCASTW SP, K6, Z11                           // 62727d4e7bdc
-       //TODO: VPBROADCASTW R14, K6, Z11                          // 62527d4e7bde
-       //TODO: VPBROADCASTW X9, K3, X7                            // 62d27d0b79f9
-       //TODO: VPBROADCASTW 99(R15)(R15*1), K3, X7                // 62927d0b79bc3f63000000
-       //TODO: VPBROADCASTW (DX), K3, X7                          // 62f27d0b793a
-       //TODO: VPBROADCASTW X7, K7, Y13                           // 62727d2f79ef
-       //TODO: VPBROADCASTW -17(BP)(SI*8), K7, Y13                // 62727d2f79acf5efffffff
-       //TODO: VPBROADCASTW (R15), K7, Y13                        // 62527d2f792f
-       //TODO: VPBROADCASTW X14, K4, Z0                           // 62d27d4c79c6
-       //TODO: VPBROADCASTW 7(SI)(DI*8), K4, Z0                   // 62f27d4c7984fe07000000
-       //TODO: VPBROADCASTW -15(R14), K4, Z0                      // 62d27d4c7986f1ffffff
-       //TODO: VPBROADCASTW X14, K4, Z25                          // 62427d4c79ce
-       //TODO: VPBROADCASTW 7(SI)(DI*8), K4, Z25                  // 62627d4c798cfe07000000
-       //TODO: VPBROADCASTW -15(R14), K4, Z25                     // 62427d4c798ef1ffffff
-       //TODO: VPCMPB $81, X1, X21, K4, K5                        // 62f355043fe951
-       //TODO: VPCMPB $81, 7(SI)(DI*8), X21, K4, K5               // 62f355043facfe0700000051
-       //TODO: VPCMPB $81, -15(R14), X21, K4, K5                  // 62d355043faef1ffffff51
-       //TODO: VPCMPB $81, X1, X21, K4, K4                        // 62f355043fe151
-       //TODO: VPCMPB $81, 7(SI)(DI*8), X21, K4, K4               // 62f355043fa4fe0700000051
-       //TODO: VPCMPB $81, -15(R14), X21, K4, K4                  // 62d355043fa6f1ffffff51
-       //TODO: VPCMPB $42, Y7, Y17, K7, K4                        // 62f375273fe72a
-       //TODO: VPCMPB $42, (CX), Y17, K7, K4                      // 62f375273f212a
-       //TODO: VPCMPB $42, 99(R15), Y17, K7, K4                   // 62d375273fa7630000002a
-       //TODO: VPCMPB $42, Y7, Y17, K7, K6                        // 62f375273ff72a
-       //TODO: VPCMPB $42, (CX), Y17, K7, K6                      // 62f375273f312a
-       //TODO: VPCMPB $42, 99(R15), Y17, K7, K6                   // 62d375273fb7630000002a
-       //TODO: VPCMPB $79, Z9, Z9, K2, K1                         // 62d3354a3fc94f
-       //TODO: VPCMPB $79, Z28, Z9, K2, K1                        // 6293354a3fcc4f
-       //TODO: VPCMPB $79, -7(DI)(R8*1), Z9, K2, K1               // 62b3354a3f8c07f9ffffff4f
-       //TODO: VPCMPB $79, (SP), Z9, K2, K1                       // 62f3354a3f0c244f
-       //TODO: VPCMPB $79, Z9, Z25, K2, K1                        // 62d335423fc94f
-       //TODO: VPCMPB $79, Z28, Z25, K2, K1                       // 629335423fcc4f
-       //TODO: VPCMPB $79, -7(DI)(R8*1), Z25, K2, K1              // 62b335423f8c07f9ffffff4f
-       //TODO: VPCMPB $79, (SP), Z25, K2, K1                      // 62f335423f0c244f
-       //TODO: VPCMPB $79, Z9, Z9, K2, K3                         // 62d3354a3fd94f
-       //TODO: VPCMPB $79, Z28, Z9, K2, K3                        // 6293354a3fdc4f
-       //TODO: VPCMPB $79, -7(DI)(R8*1), Z9, K2, K3               // 62b3354a3f9c07f9ffffff4f
-       //TODO: VPCMPB $79, (SP), Z9, K2, K3                       // 62f3354a3f1c244f
-       //TODO: VPCMPB $79, Z9, Z25, K2, K3                        // 62d335423fd94f
-       //TODO: VPCMPB $79, Z28, Z25, K2, K3                       // 629335423fdc4f
-       //TODO: VPCMPB $79, -7(DI)(R8*1), Z25, K2, K3              // 62b335423f9c07f9ffffff4f
-       //TODO: VPCMPB $79, (SP), Z25, K2, K3                      // 62f335423f1c244f
-       //TODO: VPCMPEQB X30, X0, K2, K4                           // 62917d0a74e6 or 6291fd0a74e6
-       //TODO: VPCMPEQB -7(DI)(R8*1), X0, K2, K4                  // 62b17d0a74a407f9ffffff or 62b1fd0a74a407f9ffffff
-       //TODO: VPCMPEQB (SP), X0, K2, K4                          // 62f17d0a742424 or 62f1fd0a742424
-       //TODO: VPCMPEQB X30, X0, K2, K5                           // 62917d0a74ee or 6291fd0a74ee
-       //TODO: VPCMPEQB -7(DI)(R8*1), X0, K2, K5                  // 62b17d0a74ac07f9ffffff or 62b1fd0a74ac07f9ffffff
-       //TODO: VPCMPEQB (SP), X0, K2, K5                          // 62f17d0a742c24 or 62f1fd0a742c24
-       //TODO: VPCMPEQB Y1, Y8, K2, K2                            // 62f13d2a74d1 or 62f1bd2a74d1
-       //TODO: VPCMPEQB -7(CX)(DX*1), Y8, K2, K2                  // 62f13d2a749411f9ffffff or 62f1bd2a749411f9ffffff
-       //TODO: VPCMPEQB -15(R14)(R15*4), Y8, K2, K2               // 62913d2a7494bef1ffffff or 6291bd2a7494bef1ffffff
-       //TODO: VPCMPEQB Y1, Y8, K2, K7                            // 62f13d2a74f9 or 62f1bd2a74f9
-       //TODO: VPCMPEQB -7(CX)(DX*1), Y8, K2, K7                  // 62f13d2a74bc11f9ffffff or 62f1bd2a74bc11f9ffffff
-       //TODO: VPCMPEQB -15(R14)(R15*4), Y8, K2, K7               // 62913d2a74bcbef1ffffff or 6291bd2a74bcbef1ffffff
-       //TODO: VPCMPEQB Z31, Z17, K3, K0                          // 6291754374c7 or 6291f54374c7
-       //TODO: VPCMPEQB Z0, Z17, K3, K0                           // 62f1754374c0 or 62f1f54374c0
-       //TODO: VPCMPEQB 99(R15)(R15*8), Z17, K3, K0               // 629175437484ff63000000 or 6291f5437484ff63000000
-       //TODO: VPCMPEQB 7(AX)(CX*8), Z17, K3, K0                  // 62f175437484c807000000 or 62f1f5437484c807000000
-       //TODO: VPCMPEQB Z31, Z23, K3, K0                          // 6291454374c7 or 6291c54374c7
-       //TODO: VPCMPEQB Z0, Z23, K3, K0                           // 62f1454374c0 or 62f1c54374c0
-       //TODO: VPCMPEQB 99(R15)(R15*8), Z23, K3, K0               // 629145437484ff63000000 or 6291c5437484ff63000000
-       //TODO: VPCMPEQB 7(AX)(CX*8), Z23, K3, K0                  // 62f145437484c807000000 or 62f1c5437484c807000000
-       //TODO: VPCMPEQB Z31, Z17, K3, K5                          // 6291754374ef or 6291f54374ef
-       //TODO: VPCMPEQB Z0, Z17, K3, K5                           // 62f1754374e8 or 62f1f54374e8
-       //TODO: VPCMPEQB 99(R15)(R15*8), Z17, K3, K5               // 6291754374acff63000000 or 6291f54374acff63000000
-       //TODO: VPCMPEQB 7(AX)(CX*8), Z17, K3, K5                  // 62f1754374acc807000000 or 62f1f54374acc807000000
-       //TODO: VPCMPEQB Z31, Z23, K3, K5                          // 6291454374ef or 6291c54374ef
-       //TODO: VPCMPEQB Z0, Z23, K3, K5                           // 62f1454374e8 or 62f1c54374e8
-       //TODO: VPCMPEQB 99(R15)(R15*8), Z23, K3, K5               // 6291454374acff63000000 or 6291c54374acff63000000
-       //TODO: VPCMPEQB 7(AX)(CX*8), Z23, K3, K5                  // 62f1454374acc807000000 or 62f1c54374acc807000000
-       //TODO: VPCMPEQW X8, X19, K7, K0                           // 62d1650775c0 or 62d1e50775c0
-       //TODO: VPCMPEQW (AX), X19, K7, K0                         // 62f165077500 or 62f1e5077500
-       //TODO: VPCMPEQW 7(SI), X19, K7, K0                        // 62f16507758607000000 or 62f1e507758607000000
-       //TODO: VPCMPEQW X8, X19, K7, K7                           // 62d1650775f8 or 62d1e50775f8
-       //TODO: VPCMPEQW (AX), X19, K7, K7                         // 62f165077538 or 62f1e5077538
-       //TODO: VPCMPEQW 7(SI), X19, K7, K7                        // 62f1650775be07000000 or 62f1e50775be07000000
-       //TODO: VPCMPEQW Y12, Y21, K1, K5                          // 62d1552175ec or 62d1d52175ec
-       //TODO: VPCMPEQW 17(SP)(BP*2), Y21, K1, K5                 // 62f1552175ac6c11000000 or 62f1d52175ac6c11000000
-       //TODO: VPCMPEQW -7(DI)(R8*4), Y21, K1, K5                 // 62b1552175ac87f9ffffff or 62b1d52175ac87f9ffffff
-       //TODO: VPCMPEQW Y12, Y21, K1, K4                          // 62d1552175e4 or 62d1d52175e4
-       //TODO: VPCMPEQW 17(SP)(BP*2), Y21, K1, K4                 // 62f1552175a46c11000000 or 62f1d52175a46c11000000
-       //TODO: VPCMPEQW -7(DI)(R8*4), Y21, K1, K4                 // 62b1552175a487f9ffffff or 62b1d52175a487f9ffffff
-       //TODO: VPCMPEQW Z26, Z30, K1, K4                          // 62910d4175e2 or 62918d4175e2
-       //TODO: VPCMPEQW Z22, Z30, K1, K4                          // 62b10d4175e6 or 62b18d4175e6
-       //TODO: VPCMPEQW 15(R8)(R14*4), Z30, K1, K4                // 62910d4175a4b00f000000 or 62918d4175a4b00f000000
-       //TODO: VPCMPEQW -7(CX)(DX*4), Z30, K1, K4                 // 62f10d4175a491f9ffffff or 62f18d4175a491f9ffffff
-       //TODO: VPCMPEQW Z26, Z5, K1, K4                           // 6291554975e2 or 6291d54975e2
-       //TODO: VPCMPEQW Z22, Z5, K1, K4                           // 62b1554975e6 or 62b1d54975e6
-       //TODO: VPCMPEQW 15(R8)(R14*4), Z5, K1, K4                 // 6291554975a4b00f000000 or 6291d54975a4b00f000000
-       //TODO: VPCMPEQW -7(CX)(DX*4), Z5, K1, K4                  // 62f1554975a491f9ffffff or 62f1d54975a491f9ffffff
-       //TODO: VPCMPEQW Z26, Z30, K1, K6                          // 62910d4175f2 or 62918d4175f2
-       //TODO: VPCMPEQW Z22, Z30, K1, K6                          // 62b10d4175f6 or 62b18d4175f6
-       //TODO: VPCMPEQW 15(R8)(R14*4), Z30, K1, K6                // 62910d4175b4b00f000000 or 62918d4175b4b00f000000
-       //TODO: VPCMPEQW -7(CX)(DX*4), Z30, K1, K6                 // 62f10d4175b491f9ffffff or 62f18d4175b491f9ffffff
-       //TODO: VPCMPEQW Z26, Z5, K1, K6                           // 6291554975f2 or 6291d54975f2
-       //TODO: VPCMPEQW Z22, Z5, K1, K6                           // 62b1554975f6 or 62b1d54975f6
-       //TODO: VPCMPEQW 15(R8)(R14*4), Z5, K1, K6                 // 6291554975b4b00f000000 or 6291d54975b4b00f000000
-       //TODO: VPCMPEQW -7(CX)(DX*4), Z5, K1, K6                  // 62f1554975b491f9ffffff or 62f1d54975b491f9ffffff
-       //TODO: VPCMPGTB X26, X8, K1, K1                           // 62913d0964ca or 6291bd0964ca
-       //TODO: VPCMPGTB (BX), X8, K1, K1                          // 62f13d09640b or 62f1bd09640b
-       //TODO: VPCMPGTB -17(BP)(SI*1), X8, K1, K1                 // 62f13d09648c35efffffff or 62f1bd09648c35efffffff
-       //TODO: VPCMPGTB X26, X8, K1, K3                           // 62913d0964da or 6291bd0964da
-       //TODO: VPCMPGTB (BX), X8, K1, K3                          // 62f13d09641b or 62f1bd09641b
-       //TODO: VPCMPGTB -17(BP)(SI*1), X8, K1, K3                 // 62f13d09649c35efffffff or 62f1bd09649c35efffffff
-       //TODO: VPCMPGTB Y1, Y9, K7, K6                            // 62f1352f64f1 or 62f1b52f64f1
-       //TODO: VPCMPGTB 15(R8), Y9, K7, K6                        // 62d1352f64b00f000000 or 62d1b52f64b00f000000
-       //TODO: VPCMPGTB (BP), Y9, K7, K6                          // 62f1352f647500 or 62f1b52f647500
-       //TODO: VPCMPGTB Y1, Y9, K7, K7                            // 62f1352f64f9 or 62f1b52f64f9
-       //TODO: VPCMPGTB 15(R8), Y9, K7, K7                        // 62d1352f64b80f000000 or 62d1b52f64b80f000000
-       //TODO: VPCMPGTB (BP), Y9, K7, K7                          // 62f1352f647d00 or 62f1b52f647d00
-       //TODO: VPCMPGTB Z16, Z7, K2, K6                           // 62b1454a64f0 or 62b1c54a64f0
-       //TODO: VPCMPGTB Z25, Z7, K2, K6                           // 6291454a64f1 or 6291c54a64f1
-       //TODO: VPCMPGTB (R8), Z7, K2, K6                          // 62d1454a6430 or 62d1c54a6430
-       //TODO: VPCMPGTB 15(DX)(BX*2), Z7, K2, K6                  // 62f1454a64b45a0f000000 or 62f1c54a64b45a0f000000
-       //TODO: VPCMPGTB Z16, Z21, K2, K6                          // 62b1554264f0 or 62b1d54264f0
-       //TODO: VPCMPGTB Z25, Z21, K2, K6                          // 6291554264f1 or 6291d54264f1
-       //TODO: VPCMPGTB (R8), Z21, K2, K6                         // 62d155426430 or 62d1d5426430
-       //TODO: VPCMPGTB 15(DX)(BX*2), Z21, K2, K6                 // 62f1554264b45a0f000000 or 62f1d54264b45a0f000000
-       //TODO: VPCMPGTB Z16, Z7, K2, K4                           // 62b1454a64e0 or 62b1c54a64e0
-       //TODO: VPCMPGTB Z25, Z7, K2, K4                           // 6291454a64e1 or 6291c54a64e1
-       //TODO: VPCMPGTB (R8), Z7, K2, K4                          // 62d1454a6420 or 62d1c54a6420
-       //TODO: VPCMPGTB 15(DX)(BX*2), Z7, K2, K4                  // 62f1454a64a45a0f000000 or 62f1c54a64a45a0f000000
-       //TODO: VPCMPGTB Z16, Z21, K2, K4                          // 62b1554264e0 or 62b1d54264e0
-       //TODO: VPCMPGTB Z25, Z21, K2, K4                          // 6291554264e1 or 6291d54264e1
-       //TODO: VPCMPGTB (R8), Z21, K2, K4                         // 62d155426420 or 62d1d5426420
-       //TODO: VPCMPGTB 15(DX)(BX*2), Z21, K2, K4                 // 62f1554264a45a0f000000 or 62f1d54264a45a0f000000
-       //TODO: VPCMPGTW X11, X23, K7, K3                          // 62d1450765db or 62d1c50765db
-       //TODO: VPCMPGTW 17(SP)(BP*1), X23, K7, K3                 // 62f14507659c2c11000000 or 62f1c507659c2c11000000
-       //TODO: VPCMPGTW -7(CX)(DX*8), X23, K7, K3                 // 62f14507659cd1f9ffffff or 62f1c507659cd1f9ffffff
-       //TODO: VPCMPGTW X11, X23, K7, K1                          // 62d1450765cb or 62d1c50765cb
-       //TODO: VPCMPGTW 17(SP)(BP*1), X23, K7, K1                 // 62f14507658c2c11000000 or 62f1c507658c2c11000000
-       //TODO: VPCMPGTW -7(CX)(DX*8), X23, K7, K1                 // 62f14507658cd1f9ffffff or 62f1c507658cd1f9ffffff
-       //TODO: VPCMPGTW Y21, Y12, K6, K5                          // 62b11d2e65ed or 62b19d2e65ed
-       //TODO: VPCMPGTW 7(AX)(CX*4), Y12, K6, K5                  // 62f11d2e65ac8807000000 or 62f19d2e65ac8807000000
-       //TODO: VPCMPGTW 7(AX)(CX*1), Y12, K6, K5                  // 62f11d2e65ac0807000000 or 62f19d2e65ac0807000000
-       //TODO: VPCMPGTW Y21, Y12, K6, K4                          // 62b11d2e65e5 or 62b19d2e65e5
-       //TODO: VPCMPGTW 7(AX)(CX*4), Y12, K6, K4                  // 62f11d2e65a48807000000 or 62f19d2e65a48807000000
-       //TODO: VPCMPGTW 7(AX)(CX*1), Y12, K6, K4                  // 62f11d2e65a40807000000 or 62f19d2e65a40807000000
-       //TODO: VPCMPGTW Z23, Z27, K3, K7                          // 62b1254365ff or 62b1a54365ff
-       //TODO: VPCMPGTW Z9, Z27, K3, K7                           // 62d1254365f9 or 62d1a54365f9
-       //TODO: VPCMPGTW 15(R8)(R14*1), Z27, K3, K7                // 6291254365bc300f000000 or 6291a54365bc300f000000
-       //TODO: VPCMPGTW 15(R8)(R14*2), Z27, K3, K7                // 6291254365bc700f000000 or 6291a54365bc700f000000
-       //TODO: VPCMPGTW Z23, Z25, K3, K7                          // 62b1354365ff or 62b1b54365ff
-       //TODO: VPCMPGTW Z9, Z25, K3, K7                           // 62d1354365f9 or 62d1b54365f9
-       //TODO: VPCMPGTW 15(R8)(R14*1), Z25, K3, K7                // 6291354365bc300f000000 or 6291b54365bc300f000000
-       //TODO: VPCMPGTW 15(R8)(R14*2), Z25, K3, K7                // 6291354365bc700f000000 or 6291b54365bc700f000000
-       //TODO: VPCMPGTW Z23, Z27, K3, K6                          // 62b1254365f7 or 62b1a54365f7
-       //TODO: VPCMPGTW Z9, Z27, K3, K6                           // 62d1254365f1 or 62d1a54365f1
-       //TODO: VPCMPGTW 15(R8)(R14*1), Z27, K3, K6                // 6291254365b4300f000000 or 6291a54365b4300f000000
-       //TODO: VPCMPGTW 15(R8)(R14*2), Z27, K3, K6                // 6291254365b4700f000000 or 6291a54365b4700f000000
-       //TODO: VPCMPGTW Z23, Z25, K3, K6                          // 62b1354365f7 or 62b1b54365f7
-       //TODO: VPCMPGTW Z9, Z25, K3, K6                           // 62d1354365f1 or 62d1b54365f1
-       //TODO: VPCMPGTW 15(R8)(R14*1), Z25, K3, K6                // 6291354365b4300f000000 or 6291b54365b4300f000000
-       //TODO: VPCMPGTW 15(R8)(R14*2), Z25, K3, K6                // 6291354365b4700f000000 or 6291b54365b4700f000000
-       //TODO: VPCMPUB $121, X0, X14, K7, K4                      // 62f30d0f3ee079
-       //TODO: VPCMPUB $121, 15(R8)(R14*1), X14, K7, K4           // 62930d0f3ea4300f00000079
-       //TODO: VPCMPUB $121, 15(R8)(R14*2), X14, K7, K4           // 62930d0f3ea4700f00000079
-       //TODO: VPCMPUB $121, X0, X14, K7, K6                      // 62f30d0f3ef079
-       //TODO: VPCMPUB $121, 15(R8)(R14*1), X14, K7, K6           // 62930d0f3eb4300f00000079
-       //TODO: VPCMPUB $121, 15(R8)(R14*2), X14, K7, K6           // 62930d0f3eb4700f00000079
-       //TODO: VPCMPUB $13, Y7, Y26, K2, K1                       // 62f32d223ecf0d
-       //TODO: VPCMPUB $13, 17(SP)(BP*8), Y26, K2, K1             // 62f32d223e8cec110000000d
-       //TODO: VPCMPUB $13, 17(SP)(BP*4), Y26, K2, K1             // 62f32d223e8cac110000000d
-       //TODO: VPCMPUB $13, Y7, Y26, K2, K3                       // 62f32d223edf0d
-       //TODO: VPCMPUB $13, 17(SP)(BP*8), Y26, K2, K3             // 62f32d223e9cec110000000d
-       //TODO: VPCMPUB $13, 17(SP)(BP*4), Y26, K2, K3             // 62f32d223e9cac110000000d
-       //TODO: VPCMPUB $65, Z8, Z14, K5, K6                       // 62d30d4d3ef041
-       //TODO: VPCMPUB $65, Z24, Z14, K5, K6                      // 62930d4d3ef041
-       //TODO: VPCMPUB $65, 99(R15)(R15*4), Z14, K5, K6           // 62930d4d3eb4bf6300000041
-       //TODO: VPCMPUB $65, 15(DX), Z14, K5, K6                   // 62f30d4d3eb20f00000041
-       //TODO: VPCMPUB $65, Z8, Z7, K5, K6                        // 62d3454d3ef041
-       //TODO: VPCMPUB $65, Z24, Z7, K5, K6                       // 6293454d3ef041
-       //TODO: VPCMPUB $65, 99(R15)(R15*4), Z7, K5, K6            // 6293454d3eb4bf6300000041
-       //TODO: VPCMPUB $65, 15(DX), Z7, K5, K6                    // 62f3454d3eb20f00000041
-       //TODO: VPCMPUB $65, Z8, Z14, K5, K7                       // 62d30d4d3ef841
-       //TODO: VPCMPUB $65, Z24, Z14, K5, K7                      // 62930d4d3ef841
-       //TODO: VPCMPUB $65, 99(R15)(R15*4), Z14, K5, K7           // 62930d4d3ebcbf6300000041
-       //TODO: VPCMPUB $65, 15(DX), Z14, K5, K7                   // 62f30d4d3eba0f00000041
-       //TODO: VPCMPUB $65, Z8, Z7, K5, K7                        // 62d3454d3ef841
-       //TODO: VPCMPUB $65, Z24, Z7, K5, K7                       // 6293454d3ef841
-       //TODO: VPCMPUB $65, 99(R15)(R15*4), Z7, K5, K7            // 6293454d3ebcbf6300000041
-       //TODO: VPCMPUB $65, 15(DX), Z7, K5, K7                    // 62f3454d3eba0f00000041
-       //TODO: VPCMPUW $79, X25, X5, K3, K1                       // 6293d50b3ec94f
-       //TODO: VPCMPUW $79, (CX), X5, K3, K1                      // 62f3d50b3e094f
-       //TODO: VPCMPUW $79, 99(R15), X5, K3, K1                   // 62d3d50b3e8f630000004f
-       //TODO: VPCMPUW $79, X25, X5, K3, K5                       // 6293d50b3ee94f
-       //TODO: VPCMPUW $79, (CX), X5, K3, K5                      // 62f3d50b3e294f
-       //TODO: VPCMPUW $79, 99(R15), X5, K3, K5                   // 62d3d50b3eaf630000004f
-       //TODO: VPCMPUW $64, Y6, Y22, K2, K3                       // 62f3cd223ede40
-       //TODO: VPCMPUW $64, 7(AX), Y22, K2, K3                    // 62f3cd223e980700000040
-       //TODO: VPCMPUW $64, (DI), Y22, K2, K3                     // 62f3cd223e1f40
-       //TODO: VPCMPUW $64, Y6, Y22, K2, K1                       // 62f3cd223ece40
-       //TODO: VPCMPUW $64, 7(AX), Y22, K2, K1                    // 62f3cd223e880700000040
-       //TODO: VPCMPUW $64, (DI), Y22, K2, K1                     // 62f3cd223e0f40
-       //TODO: VPCMPUW $27, Z14, Z15, K1, K5                      // 62d385493eee1b
-       //TODO: VPCMPUW $27, Z27, Z15, K1, K5                      // 629385493eeb1b
-       //TODO: VPCMPUW $27, -7(CX)(DX*1), Z15, K1, K5             // 62f385493eac11f9ffffff1b
-       //TODO: VPCMPUW $27, -15(R14)(R15*4), Z15, K1, K5          // 629385493eacbef1ffffff1b
-       //TODO: VPCMPUW $27, Z14, Z12, K1, K5                      // 62d39d493eee1b
-       //TODO: VPCMPUW $27, Z27, Z12, K1, K5                      // 62939d493eeb1b
-       //TODO: VPCMPUW $27, -7(CX)(DX*1), Z12, K1, K5             // 62f39d493eac11f9ffffff1b
-       //TODO: VPCMPUW $27, -15(R14)(R15*4), Z12, K1, K5          // 62939d493eacbef1ffffff1b
-       //TODO: VPCMPUW $27, Z14, Z15, K1, K4                      // 62d385493ee61b
-       //TODO: VPCMPUW $27, Z27, Z15, K1, K4                      // 629385493ee31b
-       //TODO: VPCMPUW $27, -7(CX)(DX*1), Z15, K1, K4             // 62f385493ea411f9ffffff1b
-       //TODO: VPCMPUW $27, -15(R14)(R15*4), Z15, K1, K4          // 629385493ea4bef1ffffff1b
-       //TODO: VPCMPUW $27, Z14, Z12, K1, K4                      // 62d39d493ee61b
-       //TODO: VPCMPUW $27, Z27, Z12, K1, K4                      // 62939d493ee31b
-       //TODO: VPCMPUW $27, -7(CX)(DX*1), Z12, K1, K4             // 62f39d493ea411f9ffffff1b
-       //TODO: VPCMPUW $27, -15(R14)(R15*4), Z12, K1, K4          // 62939d493ea4bef1ffffff1b
-       //TODO: VPCMPW $47, X9, X0, K2, K7                         // 62d3fd0a3ff92f
-       //TODO: VPCMPW $47, 99(R15)(R15*2), X0, K2, K7             // 6293fd0a3fbc7f630000002f
-       //TODO: VPCMPW $47, -7(DI), X0, K2, K7                     // 62f3fd0a3fbff9ffffff2f
-       //TODO: VPCMPW $47, X9, X0, K2, K6                         // 62d3fd0a3ff12f
-       //TODO: VPCMPW $47, 99(R15)(R15*2), X0, K2, K6             // 6293fd0a3fb47f630000002f
-       //TODO: VPCMPW $47, -7(DI), X0, K2, K6                     // 62f3fd0a3fb7f9ffffff2f
-       //TODO: VPCMPW $82, Y7, Y21, K1, K4                        // 62f3d5213fe752
-       //TODO: VPCMPW $82, 99(R15)(R15*1), Y21, K1, K4            // 6293d5213fa43f6300000052
-       //TODO: VPCMPW $82, (DX), Y21, K1, K4                      // 62f3d5213f2252
-       //TODO: VPCMPW $82, Y7, Y21, K1, K6                        // 62f3d5213ff752
-       //TODO: VPCMPW $82, 99(R15)(R15*1), Y21, K1, K6            // 6293d5213fb43f6300000052
-       //TODO: VPCMPW $82, (DX), Y21, K1, K6                      // 62f3d5213f3252
-       //TODO: VPCMPW $126, Z13, Z11, K7, K0                      // 62d3a54f3fc57e
-       //TODO: VPCMPW $126, Z14, Z11, K7, K0                      // 62d3a54f3fc67e
-       //TODO: VPCMPW $126, 15(DX)(BX*1), Z11, K7, K0             // 62f3a54f3f841a0f0000007e
-       //TODO: VPCMPW $126, -7(CX)(DX*2), Z11, K7, K0             // 62f3a54f3f8451f9ffffff7e
-       //TODO: VPCMPW $126, Z13, Z5, K7, K0                       // 62d3d54f3fc57e
-       //TODO: VPCMPW $126, Z14, Z5, K7, K0                       // 62d3d54f3fc67e
-       //TODO: VPCMPW $126, 15(DX)(BX*1), Z5, K7, K0              // 62f3d54f3f841a0f0000007e
-       //TODO: VPCMPW $126, -7(CX)(DX*2), Z5, K7, K0              // 62f3d54f3f8451f9ffffff7e
-       //TODO: VPCMPW $126, Z13, Z11, K7, K7                      // 62d3a54f3ffd7e
-       //TODO: VPCMPW $126, Z14, Z11, K7, K7                      // 62d3a54f3ffe7e
-       //TODO: VPCMPW $126, 15(DX)(BX*1), Z11, K7, K7             // 62f3a54f3fbc1a0f0000007e
-       //TODO: VPCMPW $126, -7(CX)(DX*2), Z11, K7, K7             // 62f3a54f3fbc51f9ffffff7e
-       //TODO: VPCMPW $126, Z13, Z5, K7, K7                       // 62d3d54f3ffd7e
-       //TODO: VPCMPW $126, Z14, Z5, K7, K7                       // 62d3d54f3ffe7e
-       //TODO: VPCMPW $126, 15(DX)(BX*1), Z5, K7, K7              // 62f3d54f3fbc1a0f0000007e
-       //TODO: VPCMPW $126, -7(CX)(DX*2), Z5, K7, K7              // 62f3d54f3fbc51f9ffffff7e
-       //TODO: VPERMI2W X16, X20, K2, X7                          // 62b2dd0275f8
-       //TODO: VPERMI2W 7(SI)(DI*1), X20, K2, X7                  // 62f2dd0275bc3e07000000
-       //TODO: VPERMI2W 15(DX)(BX*8), X20, K2, X7                 // 62f2dd0275bcda0f000000
-       //TODO: VPERMI2W Y18, Y14, K5, Y12                         // 62328d2d75e2
-       //TODO: VPERMI2W -7(CX)(DX*1), Y14, K5, Y12                // 62728d2d75a411f9ffffff
-       //TODO: VPERMI2W -15(R14)(R15*4), Y14, K5, Y12             // 62128d2d75a4bef1ffffff
-       //TODO: VPERMI2W Z28, Z12, K3, Z1                          // 62929d4b75cc
-       //TODO: VPERMI2W Z13, Z12, K3, Z1                          // 62d29d4b75cd
-       //TODO: VPERMI2W 99(R15)(R15*8), Z12, K3, Z1               // 62929d4b758cff63000000
-       //TODO: VPERMI2W 7(AX)(CX*8), Z12, K3, Z1                  // 62f29d4b758cc807000000
-       //TODO: VPERMI2W Z28, Z16, K3, Z1                          // 6292fd4375cc
-       //TODO: VPERMI2W Z13, Z16, K3, Z1                          // 62d2fd4375cd
-       //TODO: VPERMI2W 99(R15)(R15*8), Z16, K3, Z1               // 6292fd43758cff63000000
-       //TODO: VPERMI2W 7(AX)(CX*8), Z16, K3, Z1                  // 62f2fd43758cc807000000
-       //TODO: VPERMI2W Z28, Z12, K3, Z3                          // 62929d4b75dc
-       //TODO: VPERMI2W Z13, Z12, K3, Z3                          // 62d29d4b75dd
-       //TODO: VPERMI2W 99(R15)(R15*8), Z12, K3, Z3               // 62929d4b759cff63000000
-       //TODO: VPERMI2W 7(AX)(CX*8), Z12, K3, Z3                  // 62f29d4b759cc807000000
-       //TODO: VPERMI2W Z28, Z16, K3, Z3                          // 6292fd4375dc
-       //TODO: VPERMI2W Z13, Z16, K3, Z3                          // 62d2fd4375dd
-       //TODO: VPERMI2W 99(R15)(R15*8), Z16, K3, Z3               // 6292fd43759cff63000000
-       //TODO: VPERMI2W 7(AX)(CX*8), Z16, K3, Z3                  // 62f2fd43759cc807000000
-       //TODO: VPERMT2W X0, X0, K3, X14                           // 6272fd0b7df0
-       //TODO: VPERMT2W 15(R8)(R14*1), X0, K3, X14                // 6212fd0b7db4300f000000
-       //TODO: VPERMT2W 15(R8)(R14*2), X0, K3, X14                // 6212fd0b7db4700f000000
-       //TODO: VPERMT2W Y8, Y27, K2, Y22                          // 62c2a5227df0
-       //TODO: VPERMT2W 7(SI)(DI*8), Y27, K2, Y22                 // 62e2a5227db4fe07000000
-       //TODO: VPERMT2W -15(R14), Y27, K2, Y22                    // 62c2a5227db6f1ffffff
-       //TODO: VPERMT2W Z22, Z8, K1, Z14                          // 6232bd497df6
-       //TODO: VPERMT2W Z25, Z8, K1, Z14                          // 6212bd497df1
-       //TODO: VPERMT2W 17(SP)(BP*2), Z8, K1, Z14                 // 6272bd497db46c11000000
-       //TODO: VPERMT2W -7(DI)(R8*4), Z8, K1, Z14                 // 6232bd497db487f9ffffff
-       //TODO: VPERMT2W Z22, Z24, K1, Z14                         // 6232bd417df6
-       //TODO: VPERMT2W Z25, Z24, K1, Z14                         // 6212bd417df1
-       //TODO: VPERMT2W 17(SP)(BP*2), Z24, K1, Z14                // 6272bd417db46c11000000
-       //TODO: VPERMT2W -7(DI)(R8*4), Z24, K1, Z14                // 6232bd417db487f9ffffff
-       //TODO: VPERMT2W Z22, Z8, K1, Z7                           // 62b2bd497dfe
-       //TODO: VPERMT2W Z25, Z8, K1, Z7                           // 6292bd497df9
-       //TODO: VPERMT2W 17(SP)(BP*2), Z8, K1, Z7                  // 62f2bd497dbc6c11000000
-       //TODO: VPERMT2W -7(DI)(R8*4), Z8, K1, Z7                  // 62b2bd497dbc87f9ffffff
-       //TODO: VPERMT2W Z22, Z24, K1, Z7                          // 62b2bd417dfe
-       //TODO: VPERMT2W Z25, Z24, K1, Z7                          // 6292bd417df9
-       //TODO: VPERMT2W 17(SP)(BP*2), Z24, K1, Z7                 // 62f2bd417dbc6c11000000
-       //TODO: VPERMT2W -7(DI)(R8*4), Z24, K1, Z7                 // 62b2bd417dbc87f9ffffff
-       //TODO: VPERMW X17, X11, K2, X25                           // 6222a50a8dc9
-       //TODO: VPERMW (R14), X11, K2, X25                         // 6242a50a8d0e
-       //TODO: VPERMW -7(DI)(R8*8), X11, K2, X25                  // 6222a50a8d8cc7f9ffffff
-       //TODO: VPERMW Y9, Y22, K1, Y9                             // 6252cd218dc9
-       //TODO: VPERMW 7(SI)(DI*1), Y22, K1, Y9                    // 6272cd218d8c3e07000000
-       //TODO: VPERMW 15(DX)(BX*8), Y22, K1, Y9                   // 6272cd218d8cda0f000000
-       //TODO: VPERMW Z0, Z6, K7, Z1                              // 62f2cd4f8dc8
-       //TODO: VPERMW Z8, Z6, K7, Z1                              // 62d2cd4f8dc8
-       //TODO: VPERMW 15(R8), Z6, K7, Z1                          // 62d2cd4f8d880f000000
-       //TODO: VPERMW (BP), Z6, K7, Z1                            // 62f2cd4f8d4d00
-       //TODO: VPERMW Z0, Z2, K7, Z1                              // 62f2ed4f8dc8
-       //TODO: VPERMW Z8, Z2, K7, Z1                              // 62d2ed4f8dc8
-       //TODO: VPERMW 15(R8), Z2, K7, Z1                          // 62d2ed4f8d880f000000
-       //TODO: VPERMW (BP), Z2, K7, Z1                            // 62f2ed4f8d4d00
-       //TODO: VPERMW Z0, Z6, K7, Z16                             // 62e2cd4f8dc0
-       //TODO: VPERMW Z8, Z6, K7, Z16                             // 62c2cd4f8dc0
-       //TODO: VPERMW 15(R8), Z6, K7, Z16                         // 62c2cd4f8d800f000000
-       //TODO: VPERMW (BP), Z6, K7, Z16                           // 62e2cd4f8d4500
-       //TODO: VPERMW Z0, Z2, K7, Z16                             // 62e2ed4f8dc0
-       //TODO: VPERMW Z8, Z2, K7, Z16                             // 62c2ed4f8dc0
-       //TODO: VPERMW 15(R8), Z2, K7, Z16                         // 62c2ed4f8d800f000000
-       //TODO: VPERMW (BP), Z2, K7, Z16                           // 62e2ed4f8d4500
-       //TODO: VPEXTRB $79, X26, AX                               // 62637d0814d04f or 6263fd0814d04f
-       //TODO: VPEXTRB $79, X26, R9                               // 62437d0814d14f or 6243fd0814d14f
-       //TODO: VPEXTRB $79, X26, 7(SI)(DI*1)                      // 62637d0814543e074f or 6263fd0814543e074f
-       //TODO: VPEXTRB $79, X26, 15(DX)(BX*8)                     // 62637d081454da0f4f or 6263fd081454da0f4f
-       //TODO: VPMADDUBSW X21, X16, K2, X0                        // 62b27d0204c5 or 62b2fd0204c5
-       //TODO: VPMADDUBSW 15(R8)(R14*8), X16, K2, X0              // 62927d020484f00f000000 or 6292fd020484f00f000000
-       //TODO: VPMADDUBSW -15(R14)(R15*2), X16, K2, X0            // 62927d0204847ef1ffffff or 6292fd0204847ef1ffffff
-       //TODO: VPMADDUBSW Y3, Y31, K4, Y11                        // 6272052404db or 6272852404db
-       //TODO: VPMADDUBSW -17(BP)(SI*2), Y31, K4, Y11             // 62720524049c75efffffff or 62728524049c75efffffff
-       //TODO: VPMADDUBSW 7(AX)(CX*2), Y31, K4, Y11               // 62720524049c4807000000 or 62728524049c4807000000
-       //TODO: VPMADDUBSW Z6, Z22, K1, Z12                        // 62724d4104e6 or 6272cd4104e6
-       //TODO: VPMADDUBSW Z8, Z22, K1, Z12                        // 62524d4104e0 or 6252cd4104e0
-       //TODO: VPMADDUBSW 99(R15)(R15*1), Z22, K1, Z12            // 62124d4104a43f63000000 or 6212cd4104a43f63000000
-       //TODO: VPMADDUBSW (DX), Z22, K1, Z12                      // 62724d410422 or 6272cd410422
-       //TODO: VPMADDUBSW Z6, Z11, K1, Z12                        // 6272254904e6 or 6272a54904e6
-       //TODO: VPMADDUBSW Z8, Z11, K1, Z12                        // 6252254904e0 or 6252a54904e0
-       //TODO: VPMADDUBSW 99(R15)(R15*1), Z11, K1, Z12            // 6212254904a43f63000000 or 6212a54904a43f63000000
-       //TODO: VPMADDUBSW (DX), Z11, K1, Z12                      // 627225490422 or 6272a5490422
-       //TODO: VPMADDUBSW Z6, Z22, K1, Z27                        // 62624d4104de or 6262cd4104de
-       //TODO: VPMADDUBSW Z8, Z22, K1, Z27                        // 62424d4104d8 or 6242cd4104d8
-       //TODO: VPMADDUBSW 99(R15)(R15*1), Z22, K1, Z27            // 62024d41049c3f63000000 or 6202cd41049c3f63000000
-       //TODO: VPMADDUBSW (DX), Z22, K1, Z27                      // 62624d41041a or 6262cd41041a
-       //TODO: VPMADDUBSW Z6, Z11, K1, Z27                        // 6262254904de or 6262a54904de
-       //TODO: VPMADDUBSW Z8, Z11, K1, Z27                        // 6242254904d8 or 6242a54904d8
-       //TODO: VPMADDUBSW 99(R15)(R15*1), Z11, K1, Z27            // 62022549049c3f63000000 or 6202a549049c3f63000000
-       //TODO: VPMADDUBSW (DX), Z11, K1, Z27                      // 62622549041a or 6262a549041a
-       //TODO: VPMADDWD X22, X28, K3, X0                          // 62b11d03f5c6 or 62b19d03f5c6
-       //TODO: VPMADDWD -15(R14)(R15*1), X28, K3, X0              // 62911d03f5843ef1ffffff or 62919d03f5843ef1ffffff
-       //TODO: VPMADDWD -15(BX), X28, K3, X0                      // 62f11d03f583f1ffffff or 62f19d03f583f1ffffff
-       //TODO: VPMADDWD Y13, Y2, K4, Y14                          // 62516d2cf5f5 or 6251ed2cf5f5
-       //TODO: VPMADDWD 15(R8)(R14*1), Y2, K4, Y14                // 62116d2cf5b4300f000000 or 6211ed2cf5b4300f000000
-       //TODO: VPMADDWD 15(R8)(R14*2), Y2, K4, Y14                // 62116d2cf5b4700f000000 or 6211ed2cf5b4700f000000
-       //TODO: VPMADDWD Z9, Z12, K5, Z25                          // 62411d4df5c9 or 62419d4df5c9
-       //TODO: VPMADDWD Z12, Z12, K5, Z25                         // 62411d4df5cc or 62419d4df5cc
-       //TODO: VPMADDWD -17(BP)(SI*8), Z12, K5, Z25               // 62611d4df58cf5efffffff or 62619d4df58cf5efffffff
-       //TODO: VPMADDWD (R15), Z12, K5, Z25                       // 62411d4df50f or 62419d4df50f
-       //TODO: VPMADDWD Z9, Z17, K5, Z25                          // 62417545f5c9 or 6241f545f5c9
-       //TODO: VPMADDWD Z12, Z17, K5, Z25                         // 62417545f5cc or 6241f545f5cc
-       //TODO: VPMADDWD -17(BP)(SI*8), Z17, K5, Z25               // 62617545f58cf5efffffff or 6261f545f58cf5efffffff
-       //TODO: VPMADDWD (R15), Z17, K5, Z25                       // 62417545f50f or 6241f545f50f
-       //TODO: VPMADDWD Z9, Z12, K5, Z12                          // 62511d4df5e1 or 62519d4df5e1
-       //TODO: VPMADDWD Z12, Z12, K5, Z12                         // 62511d4df5e4 or 62519d4df5e4
-       //TODO: VPMADDWD -17(BP)(SI*8), Z12, K5, Z12               // 62711d4df5a4f5efffffff or 62719d4df5a4f5efffffff
-       //TODO: VPMADDWD (R15), Z12, K5, Z12                       // 62511d4df527 or 62519d4df527
-       //TODO: VPMADDWD Z9, Z17, K5, Z12                          // 62517545f5e1 or 6251f545f5e1
-       //TODO: VPMADDWD Z12, Z17, K5, Z12                         // 62517545f5e4 or 6251f545f5e4
-       //TODO: VPMADDWD -17(BP)(SI*8), Z17, K5, Z12               // 62717545f5a4f5efffffff or 6271f545f5a4f5efffffff
-       //TODO: VPMADDWD (R15), Z17, K5, Z12                       // 62517545f527 or 6251f545f527
-       //TODO: VPMAXSB X7, X19, K7, X7                            // 62f265073cff or 62f2e5073cff
-       //TODO: VPMAXSB 7(AX)(CX*4), X19, K7, X7                   // 62f265073cbc8807000000 or 62f2e5073cbc8807000000
-       //TODO: VPMAXSB 7(AX)(CX*1), X19, K7, X7                   // 62f265073cbc0807000000 or 62f2e5073cbc0807000000
-       //TODO: VPMAXSB Y22, Y15, K7, Y27                          // 6222052f3cde or 6222852f3cde
-       //TODO: VPMAXSB (R14), Y15, K7, Y27                        // 6242052f3c1e or 6242852f3c1e
-       //TODO: VPMAXSB -7(DI)(R8*8), Y15, K7, Y27                 // 6222052f3c9cc7f9ffffff or 6222852f3c9cc7f9ffffff
-       //TODO: VPMAXSB Z8, Z3, K6, Z6                             // 62d2654e3cf0 or 62d2e54e3cf0
-       //TODO: VPMAXSB Z2, Z3, K6, Z6                             // 62f2654e3cf2 or 62f2e54e3cf2
-       //TODO: VPMAXSB 7(SI)(DI*8), Z3, K6, Z6                    // 62f2654e3cb4fe07000000 or 62f2e54e3cb4fe07000000
-       //TODO: VPMAXSB -15(R14), Z3, K6, Z6                       // 62d2654e3cb6f1ffffff or 62d2e54e3cb6f1ffffff
-       //TODO: VPMAXSB Z8, Z21, K6, Z6                            // 62d255463cf0 or 62d2d5463cf0
-       //TODO: VPMAXSB Z2, Z21, K6, Z6                            // 62f255463cf2 or 62f2d5463cf2
-       //TODO: VPMAXSB 7(SI)(DI*8), Z21, K6, Z6                   // 62f255463cb4fe07000000 or 62f2d5463cb4fe07000000
-       //TODO: VPMAXSB -15(R14), Z21, K6, Z6                      // 62d255463cb6f1ffffff or 62d2d5463cb6f1ffffff
-       //TODO: VPMAXSB Z8, Z3, K6, Z25                            // 6242654e3cc8 or 6242e54e3cc8
-       //TODO: VPMAXSB Z2, Z3, K6, Z25                            // 6262654e3cca or 6262e54e3cca
-       //TODO: VPMAXSB 7(SI)(DI*8), Z3, K6, Z25                   // 6262654e3c8cfe07000000 or 6262e54e3c8cfe07000000
-       //TODO: VPMAXSB -15(R14), Z3, K6, Z25                      // 6242654e3c8ef1ffffff or 6242e54e3c8ef1ffffff
-       //TODO: VPMAXSB Z8, Z21, K6, Z25                           // 624255463cc8 or 6242d5463cc8
-       //TODO: VPMAXSB Z2, Z21, K6, Z25                           // 626255463cca or 6262d5463cca
-       //TODO: VPMAXSB 7(SI)(DI*8), Z21, K6, Z25                  // 626255463c8cfe07000000 or 6262d5463c8cfe07000000
-       //TODO: VPMAXSB -15(R14), Z21, K6, Z25                     // 624255463c8ef1ffffff or 6242d5463c8ef1ffffff
-       //TODO: VPMAXSW X12, X0, K5, X12                           // 62517d0deee4 or 6251fd0deee4
-       //TODO: VPMAXSW 7(SI)(DI*4), X0, K5, X12                   // 62717d0deea4be07000000 or 6271fd0deea4be07000000
-       //TODO: VPMAXSW -7(DI)(R8*2), X0, K5, X12                  // 62317d0deea447f9ffffff or 6231fd0deea447f9ffffff
-       //TODO: VPMAXSW Y14, Y19, K3, Y23                          // 62c16523eefe or 62c1e523eefe
-       //TODO: VPMAXSW 99(R15)(R15*2), Y19, K3, Y23               // 62816523eebc7f63000000 or 6281e523eebc7f63000000
-       //TODO: VPMAXSW -7(DI), Y19, K3, Y23                       // 62e16523eebff9ffffff or 62e1e523eebff9ffffff
-       //TODO: VPMAXSW Z18, Z11, K4, Z12                          // 6231254ceee2 or 6231a54ceee2
-       //TODO: VPMAXSW Z24, Z11, K4, Z12                          // 6211254ceee0 or 6211a54ceee0
-       //TODO: VPMAXSW -7(CX), Z11, K4, Z12                       // 6271254ceea1f9ffffff or 6271a54ceea1f9ffffff
-       //TODO: VPMAXSW 15(DX)(BX*4), Z11, K4, Z12                 // 6271254ceea49a0f000000 or 6271a54ceea49a0f000000
-       //TODO: VPMAXSW Z18, Z5, K4, Z12                           // 6231554ceee2 or 6231d54ceee2
-       //TODO: VPMAXSW Z24, Z5, K4, Z12                           // 6211554ceee0 or 6211d54ceee0
-       //TODO: VPMAXSW -7(CX), Z5, K4, Z12                        // 6271554ceea1f9ffffff or 6271d54ceea1f9ffffff
-       //TODO: VPMAXSW 15(DX)(BX*4), Z5, K4, Z12                  // 6271554ceea49a0f000000 or 6271d54ceea49a0f000000
-       //TODO: VPMAXSW Z18, Z11, K4, Z22                          // 62a1254ceef2 or 62a1a54ceef2
-       //TODO: VPMAXSW Z24, Z11, K4, Z22                          // 6281254ceef0 or 6281a54ceef0
-       //TODO: VPMAXSW -7(CX), Z11, K4, Z22                       // 62e1254ceeb1f9ffffff or 62e1a54ceeb1f9ffffff
-       //TODO: VPMAXSW 15(DX)(BX*4), Z11, K4, Z22                 // 62e1254ceeb49a0f000000 or 62e1a54ceeb49a0f000000
-       //TODO: VPMAXSW Z18, Z5, K4, Z22                           // 62a1554ceef2 or 62a1d54ceef2
-       //TODO: VPMAXSW Z24, Z5, K4, Z22                           // 6281554ceef0 or 6281d54ceef0
-       //TODO: VPMAXSW -7(CX), Z5, K4, Z22                        // 62e1554ceeb1f9ffffff or 62e1d54ceeb1f9ffffff
-       //TODO: VPMAXSW 15(DX)(BX*4), Z5, K4, Z22                  // 62e1554ceeb49a0f000000 or 62e1d54ceeb49a0f000000
-       //TODO: VPMAXUB X17, X5, K2, X14                           // 6231550adef1 or 6231d50adef1
-       //TODO: VPMAXUB 17(SP), X5, K2, X14                        // 6271550adeb42411000000 or 6271d50adeb42411000000
-       //TODO: VPMAXUB -17(BP)(SI*4), X5, K2, X14                 // 6271550adeb4b5efffffff or 6271d50adeb4b5efffffff
-       //TODO: VPMAXUB Y16, Y5, K2, Y21                           // 62a1552adee8 or 62a1d52adee8
-       //TODO: VPMAXUB -7(CX)(DX*1), Y5, K2, Y21                  // 62e1552adeac11f9ffffff or 62e1d52adeac11f9ffffff
-       //TODO: VPMAXUB -15(R14)(R15*4), Y5, K2, Y21               // 6281552adeacbef1ffffff or 6281d52adeacbef1ffffff
-       //TODO: VPMAXUB Z6, Z7, K3, Z2                             // 62f1454bded6 or 62f1c54bded6
-       //TODO: VPMAXUB Z16, Z7, K3, Z2                            // 62b1454bded0 or 62b1c54bded0
-       //TODO: VPMAXUB 99(R15)(R15*8), Z7, K3, Z2                 // 6291454bde94ff63000000 or 6291c54bde94ff63000000
-       //TODO: VPMAXUB 7(AX)(CX*8), Z7, K3, Z2                    // 62f1454bde94c807000000 or 62f1c54bde94c807000000
-       //TODO: VPMAXUB Z6, Z13, K3, Z2                            // 62f1154bded6 or 62f1954bded6
-       //TODO: VPMAXUB Z16, Z13, K3, Z2                           // 62b1154bded0 or 62b1954bded0
-       //TODO: VPMAXUB 99(R15)(R15*8), Z13, K3, Z2                // 6291154bde94ff63000000 or 6291954bde94ff63000000
-       //TODO: VPMAXUB 7(AX)(CX*8), Z13, K3, Z2                   // 62f1154bde94c807000000 or 62f1954bde94c807000000
-       //TODO: VPMAXUB Z6, Z7, K3, Z21                            // 62e1454bdeee or 62e1c54bdeee
-       //TODO: VPMAXUB Z16, Z7, K3, Z21                           // 62a1454bdee8 or 62a1c54bdee8
-       //TODO: VPMAXUB 99(R15)(R15*8), Z7, K3, Z21                // 6281454bdeacff63000000 or 6281c54bdeacff63000000
-       //TODO: VPMAXUB 7(AX)(CX*8), Z7, K3, Z21                   // 62e1454bdeacc807000000 or 62e1c54bdeacc807000000
-       //TODO: VPMAXUB Z6, Z13, K3, Z21                           // 62e1154bdeee or 62e1954bdeee
-       //TODO: VPMAXUB Z16, Z13, K3, Z21                          // 62a1154bdee8 or 62a1954bdee8
-       //TODO: VPMAXUB 99(R15)(R15*8), Z13, K3, Z21               // 6281154bdeacff63000000 or 6281954bdeacff63000000
-       //TODO: VPMAXUB 7(AX)(CX*8), Z13, K3, Z21                  // 62e1154bdeacc807000000 or 62e1954bdeacc807000000
-       //TODO: VPMAXUW X9, X24, K7, X28                           // 62423d073ee1 or 6242bd073ee1
-       //TODO: VPMAXUW -17(BP)(SI*8), X24, K7, X28                // 62623d073ea4f5efffffff or 6262bd073ea4f5efffffff
-       //TODO: VPMAXUW (R15), X24, K7, X28                        // 62423d073e27 or 6242bd073e27
-       //TODO: VPMAXUW Y7, Y19, K1, Y11                           // 627265213edf or 6272e5213edf
-       //TODO: VPMAXUW 17(SP)(BP*2), Y19, K1, Y11                 // 627265213e9c6c11000000 or 6272e5213e9c6c11000000
-       //TODO: VPMAXUW -7(DI)(R8*4), Y19, K1, Y11                 // 623265213e9c87f9ffffff or 6232e5213e9c87f9ffffff
-       //TODO: VPMAXUW Z12, Z1, K1, Z20                           // 62c275493ee4 or 62c2f5493ee4
-       //TODO: VPMAXUW Z16, Z1, K1, Z20                           // 62a275493ee0 or 62a2f5493ee0
-       //TODO: VPMAXUW 15(R8)(R14*4), Z1, K1, Z20                 // 628275493ea4b00f000000 or 6282f5493ea4b00f000000
-       //TODO: VPMAXUW -7(CX)(DX*4), Z1, K1, Z20                  // 62e275493ea491f9ffffff or 62e2f5493ea491f9ffffff
-       //TODO: VPMAXUW Z12, Z3, K1, Z20                           // 62c265493ee4 or 62c2e5493ee4
-       //TODO: VPMAXUW Z16, Z3, K1, Z20                           // 62a265493ee0 or 62a2e5493ee0
-       //TODO: VPMAXUW 15(R8)(R14*4), Z3, K1, Z20                 // 628265493ea4b00f000000 or 6282e5493ea4b00f000000
-       //TODO: VPMAXUW -7(CX)(DX*4), Z3, K1, Z20                  // 62e265493ea491f9ffffff or 62e2e5493ea491f9ffffff
-       //TODO: VPMAXUW Z12, Z1, K1, Z9                            // 625275493ecc or 6252f5493ecc
-       //TODO: VPMAXUW Z16, Z1, K1, Z9                            // 623275493ec8 or 6232f5493ec8
-       //TODO: VPMAXUW 15(R8)(R14*4), Z1, K1, Z9                  // 621275493e8cb00f000000 or 6212f5493e8cb00f000000
-       //TODO: VPMAXUW -7(CX)(DX*4), Z1, K1, Z9                   // 627275493e8c91f9ffffff or 6272f5493e8c91f9ffffff
-       //TODO: VPMAXUW Z12, Z3, K1, Z9                            // 625265493ecc or 6252e5493ecc
-       //TODO: VPMAXUW Z16, Z3, K1, Z9                            // 623265493ec8 or 6232e5493ec8
-       //TODO: VPMAXUW 15(R8)(R14*4), Z3, K1, Z9                  // 621265493e8cb00f000000 or 6212e5493e8cb00f000000
-       //TODO: VPMAXUW -7(CX)(DX*4), Z3, K1, Z9                   // 627265493e8c91f9ffffff or 6272e5493e8c91f9ffffff
-       //TODO: VPMINSB X18, X26, K1, X15                          // 62322d0138fa or 6232ad0138fa
-       //TODO: VPMINSB 7(SI)(DI*8), X26, K1, X15                  // 62722d0138bcfe07000000 or 6272ad0138bcfe07000000
-       //TODO: VPMINSB -15(R14), X26, K1, X15                     // 62522d0138bef1ffffff or 6252ad0138bef1ffffff
-       //TODO: VPMINSB Y3, Y0, K7, Y6                             // 62f27d2f38f3 or 62f2fd2f38f3
-       //TODO: VPMINSB 15(R8), Y0, K7, Y6                         // 62d27d2f38b00f000000 or 62d2fd2f38b00f000000
-       //TODO: VPMINSB (BP), Y0, K7, Y6                           // 62f27d2f387500 or 62f2fd2f387500
-       //TODO: VPMINSB Z3, Z14, K2, Z28                           // 62620d4a38e3 or 62628d4a38e3
-       //TODO: VPMINSB Z12, Z14, K2, Z28                          // 62420d4a38e4 or 62428d4a38e4
-       //TODO: VPMINSB (R8), Z14, K2, Z28                         // 62420d4a3820 or 62428d4a3820
-       //TODO: VPMINSB 15(DX)(BX*2), Z14, K2, Z28                 // 62620d4a38a45a0f000000 or 62628d4a38a45a0f000000
-       //TODO: VPMINSB Z3, Z28, K2, Z28                           // 62621d4238e3 or 62629d4238e3
-       //TODO: VPMINSB Z12, Z28, K2, Z28                          // 62421d4238e4 or 62429d4238e4
-       //TODO: VPMINSB (R8), Z28, K2, Z28                         // 62421d423820 or 62429d423820
-       //TODO: VPMINSB 15(DX)(BX*2), Z28, K2, Z28                 // 62621d4238a45a0f000000 or 62629d4238a45a0f000000
-       //TODO: VPMINSB Z3, Z14, K2, Z13                           // 62720d4a38eb or 62728d4a38eb
-       //TODO: VPMINSB Z12, Z14, K2, Z13                          // 62520d4a38ec or 62528d4a38ec
-       //TODO: VPMINSB (R8), Z14, K2, Z13                         // 62520d4a3828 or 62528d4a3828
-       //TODO: VPMINSB 15(DX)(BX*2), Z14, K2, Z13                 // 62720d4a38ac5a0f000000 or 62728d4a38ac5a0f000000
-       //TODO: VPMINSB Z3, Z28, K2, Z13                           // 62721d4238eb or 62729d4238eb
-       //TODO: VPMINSB Z12, Z28, K2, Z13                          // 62521d4238ec or 62529d4238ec
-       //TODO: VPMINSB (R8), Z28, K2, Z13                         // 62521d423828 or 62529d423828
-       //TODO: VPMINSB 15(DX)(BX*2), Z28, K2, Z13                 // 62721d4238ac5a0f000000 or 62729d4238ac5a0f000000
-       //TODO: VPMINSW X24, X0, K7, X0                            // 62917d0feac0 or 6291fd0feac0
-       //TODO: VPMINSW -7(CX), X0, K7, X0                         // 62f17d0fea81f9ffffff or 62f1fd0fea81f9ffffff
-       //TODO: VPMINSW 15(DX)(BX*4), X0, K7, X0                   // 62f17d0fea849a0f000000 or 62f1fd0fea849a0f000000
-       //TODO: VPMINSW Y22, Y0, K6, Y7                            // 62b17d2eeafe or 62b1fd2eeafe
-       //TODO: VPMINSW 7(AX)(CX*4), Y0, K6, Y7                    // 62f17d2eeabc8807000000 or 62f1fd2eeabc8807000000
-       //TODO: VPMINSW 7(AX)(CX*1), Y0, K6, Y7                    // 62f17d2eeabc0807000000 or 62f1fd2eeabc0807000000
-       //TODO: VPMINSW Z23, Z20, K3, Z16                          // 62a15d43eac7 or 62a1dd43eac7
-       //TODO: VPMINSW Z19, Z20, K3, Z16                          // 62a15d43eac3 or 62a1dd43eac3
-       //TODO: VPMINSW 15(R8)(R14*1), Z20, K3, Z16                // 62815d43ea84300f000000 or 6281dd43ea84300f000000
-       //TODO: VPMINSW 15(R8)(R14*2), Z20, K3, Z16                // 62815d43ea84700f000000 or 6281dd43ea84700f000000
-       //TODO: VPMINSW Z23, Z0, K3, Z16                           // 62a17d4beac7 or 62a1fd4beac7
-       //TODO: VPMINSW Z19, Z0, K3, Z16                           // 62a17d4beac3 or 62a1fd4beac3
-       //TODO: VPMINSW 15(R8)(R14*1), Z0, K3, Z16                 // 62817d4bea84300f000000 or 6281fd4bea84300f000000
-       //TODO: VPMINSW 15(R8)(R14*2), Z0, K3, Z16                 // 62817d4bea84700f000000 or 6281fd4bea84700f000000
-       //TODO: VPMINSW Z23, Z20, K3, Z9                           // 62315d43eacf or 6231dd43eacf
-       //TODO: VPMINSW Z19, Z20, K3, Z9                           // 62315d43eacb or 6231dd43eacb
-       //TODO: VPMINSW 15(R8)(R14*1), Z20, K3, Z9                 // 62115d43ea8c300f000000 or 6211dd43ea8c300f000000
-       //TODO: VPMINSW 15(R8)(R14*2), Z20, K3, Z9                 // 62115d43ea8c700f000000 or 6211dd43ea8c700f000000
-       //TODO: VPMINSW Z23, Z0, K3, Z9                            // 62317d4beacf or 6231fd4beacf
-       //TODO: VPMINSW Z19, Z0, K3, Z9                            // 62317d4beacb or 6231fd4beacb
-       //TODO: VPMINSW 15(R8)(R14*1), Z0, K3, Z9                  // 62117d4bea8c300f000000 or 6211fd4bea8c300f000000
-       //TODO: VPMINSW 15(R8)(R14*2), Z0, K3, Z9                  // 62117d4bea8c700f000000 or 6211fd4bea8c700f000000
-       //TODO: VPMINUB X9, X7, K7, X20                            // 62c1450fdae1 or 62c1c50fdae1
-       //TODO: VPMINUB 99(R15)(R15*8), X7, K7, X20                // 6281450fdaa4ff63000000 or 6281c50fdaa4ff63000000
-       //TODO: VPMINUB 7(AX)(CX*8), X7, K7, X20                   // 62e1450fdaa4c807000000 or 62e1c50fdaa4c807000000
-       //TODO: VPMINUB Y1, Y12, K4, Y13                           // 62711d2cdae9 or 62719d2cdae9
-       //TODO: VPMINUB (SI), Y12, K4, Y13                         // 62711d2cda2e or 62719d2cda2e
-       //TODO: VPMINUB 7(SI)(DI*2), Y12, K4, Y13                  // 62711d2cdaac7e07000000 or 62719d2cdaac7e07000000
-       //TODO: VPMINUB Z24, Z0, K4, Z0                            // 62917d4cdac0 or 6291fd4cdac0
-       //TODO: VPMINUB Z12, Z0, K4, Z0                            // 62d17d4cdac4 or 62d1fd4cdac4
-       //TODO: VPMINUB (R14), Z0, K4, Z0                          // 62d17d4cda06 or 62d1fd4cda06
-       //TODO: VPMINUB -7(DI)(R8*8), Z0, K4, Z0                   // 62b17d4cda84c7f9ffffff or 62b1fd4cda84c7f9ffffff
-       //TODO: VPMINUB Z24, Z25, K4, Z0                           // 62913544dac0 or 6291b544dac0
-       //TODO: VPMINUB Z12, Z25, K4, Z0                           // 62d13544dac4 or 62d1b544dac4
-       //TODO: VPMINUB (R14), Z25, K4, Z0                         // 62d13544da06 or 62d1b544da06
-       //TODO: VPMINUB -7(DI)(R8*8), Z25, K4, Z0                  // 62b13544da84c7f9ffffff or 62b1b544da84c7f9ffffff
-       //TODO: VPMINUB Z24, Z0, K4, Z11                           // 62117d4cdad8 or 6211fd4cdad8
-       //TODO: VPMINUB Z12, Z0, K4, Z11                           // 62517d4cdadc or 6251fd4cdadc
-       //TODO: VPMINUB (R14), Z0, K4, Z11                         // 62517d4cda1e or 6251fd4cda1e
-       //TODO: VPMINUB -7(DI)(R8*8), Z0, K4, Z11                  // 62317d4cda9cc7f9ffffff or 6231fd4cda9cc7f9ffffff
-       //TODO: VPMINUB Z24, Z25, K4, Z11                          // 62113544dad8 or 6211b544dad8
-       //TODO: VPMINUB Z12, Z25, K4, Z11                          // 62513544dadc or 6251b544dadc
-       //TODO: VPMINUB (R14), Z25, K4, Z11                        // 62513544da1e or 6251b544da1e
-       //TODO: VPMINUB -7(DI)(R8*8), Z25, K4, Z11                 // 62313544da9cc7f9ffffff or 6231b544da9cc7f9ffffff
-       //TODO: VPMINUW X13, X11, K2, X1                           // 62d2250a3acd or 62d2a50a3acd
-       //TODO: VPMINUW 15(R8)(R14*4), X11, K2, X1                 // 6292250a3a8cb00f000000 or 6292a50a3a8cb00f000000
-       //TODO: VPMINUW -7(CX)(DX*4), X11, K2, X1                  // 62f2250a3a8c91f9ffffff or 62f2a50a3a8c91f9ffffff
-       //TODO: VPMINUW Y13, Y28, K3, Y1                           // 62d21d233acd or 62d29d233acd
-       //TODO: VPMINUW 17(SP), Y28, K3, Y1                        // 62f21d233a8c2411000000 or 62f29d233a8c2411000000
-       //TODO: VPMINUW -17(BP)(SI*4), Y28, K3, Y1                 // 62f21d233a8cb5efffffff or 62f29d233a8cb5efffffff
-       //TODO: VPMINUW Z21, Z31, K3, Z17                          // 62a205433acd or 62a285433acd
-       //TODO: VPMINUW Z9, Z31, K3, Z17                           // 62c205433ac9 or 62c285433ac9
-       //TODO: VPMINUW 99(R15)(R15*2), Z31, K3, Z17               // 628205433a8c7f63000000 or 628285433a8c7f63000000
-       //TODO: VPMINUW -7(DI), Z31, K3, Z17                       // 62e205433a8ff9ffffff or 62e285433a8ff9ffffff
-       //TODO: VPMINUW Z21, Z0, K3, Z17                           // 62a27d4b3acd or 62a2fd4b3acd
-       //TODO: VPMINUW Z9, Z0, K3, Z17                            // 62c27d4b3ac9 or 62c2fd4b3ac9
-       //TODO: VPMINUW 99(R15)(R15*2), Z0, K3, Z17                // 62827d4b3a8c7f63000000 or 6282fd4b3a8c7f63000000
-       //TODO: VPMINUW -7(DI), Z0, K3, Z17                        // 62e27d4b3a8ff9ffffff or 62e2fd4b3a8ff9ffffff
-       //TODO: VPMINUW Z21, Z31, K3, Z23                          // 62a205433afd or 62a285433afd
-       //TODO: VPMINUW Z9, Z31, K3, Z23                           // 62c205433af9 or 62c285433af9
-       //TODO: VPMINUW 99(R15)(R15*2), Z31, K3, Z23               // 628205433abc7f63000000 or 628285433abc7f63000000
-       //TODO: VPMINUW -7(DI), Z31, K3, Z23                       // 62e205433abff9ffffff or 62e285433abff9ffffff
-       //TODO: VPMINUW Z21, Z0, K3, Z23                           // 62a27d4b3afd or 62a2fd4b3afd
-       //TODO: VPMINUW Z9, Z0, K3, Z23                            // 62c27d4b3af9 or 62c2fd4b3af9
-       //TODO: VPMINUW 99(R15)(R15*2), Z0, K3, Z23                // 62827d4b3abc7f63000000 or 6282fd4b3abc7f63000000
-       //TODO: VPMINUW -7(DI), Z0, K3, Z23                        // 62e27d4b3abff9ffffff or 62e2fd4b3abff9ffffff
-       //TODO: VPMOVB2M X0, K5                                    // 62f27e0829e8
-       //TODO: VPMOVB2M X0, K4                                    // 62f27e0829e0
-       //TODO: VPMOVB2M Y7, K4                                    // 62f27e2829e7
-       //TODO: VPMOVB2M Y7, K6                                    // 62f27e2829f7
-       //TODO: VPMOVB2M Z6, K1                                    // 62f27e4829ce
-       //TODO: VPMOVB2M Z9, K1                                    // 62d27e4829c9
-       //TODO: VPMOVB2M Z6, K3                                    // 62f27e4829de
-       //TODO: VPMOVB2M Z9, K3                                    // 62d27e4829d9
-       //TODO: VPMOVM2B K4, X26                                   // 62627e0828d4
-       //TODO: VPMOVM2B K5, X26                                   // 62627e0828d5
-       //TODO: VPMOVM2B K2, Y1                                    // 62f27e2828ca
-       //TODO: VPMOVM2B K7, Y1                                    // 62f27e2828cf
-       //TODO: VPMOVM2B K0, Z26                                   // 62627e4828d0
-       //TODO: VPMOVM2B K5, Z26                                   // 62627e4828d5
-       //TODO: VPMOVM2B K0, Z22                                   // 62e27e4828f0
-       //TODO: VPMOVM2B K5, Z22                                   // 62e27e4828f5
-       //TODO: VPMOVM2W K0, X16                                   // 62e2fe0828c0
-       //TODO: VPMOVM2W K7, X16                                   // 62e2fe0828c7
-       //TODO: VPMOVM2W K5, Y2                                    // 62f2fe2828d5
-       //TODO: VPMOVM2W K4, Y2                                    // 62f2fe2828d4
-       //TODO: VPMOVM2W K4, Z14                                   // 6272fe4828f4
-       //TODO: VPMOVM2W K6, Z14                                   // 6272fe4828f6
-       //TODO: VPMOVM2W K4, Z13                                   // 6272fe4828ec
-       //TODO: VPMOVM2W K6, Z13                                   // 6272fe4828ee
-       //TODO: VPMOVSWB X18, K3, X0                               // 62e27e0b20d0
-       //TODO: VPMOVSWB X18, K3, -7(CX)                           // 62e27e0b2091f9ffffff
-       //TODO: VPMOVSWB X18, K3, 15(DX)(BX*4)                     // 62e27e0b20949a0f000000
-       //TODO: VPMOVSWB Y6, K3, X8                                // 62d27e2b20f0
-       //TODO: VPMOVSWB Y6, K3, -7(CX)(DX*1)                      // 62f27e2b20b411f9ffffff
-       //TODO: VPMOVSWB Y6, K3, -15(R14)(R15*4)                   // 62927e2b20b4bef1ffffff
-       //TODO: VPMOVSWB Z22, K3, Y21                              // 62a27e4b20f5
-       //TODO: VPMOVSWB Z25, K3, Y21                              // 62227e4b20cd
-       //TODO: VPMOVSWB Z22, K3, 7(SI)(DI*1)                      // 62e27e4b20b43e07000000
-       //TODO: VPMOVSWB Z25, K3, 7(SI)(DI*1)                      // 62627e4b208c3e07000000
-       //TODO: VPMOVSWB Z22, K3, 15(DX)(BX*8)                     // 62e27e4b20b4da0f000000
-       //TODO: VPMOVSWB Z25, K3, 15(DX)(BX*8)                     // 62627e4b208cda0f000000
-       //TODO: VPMOVSXBW X13, K1, Y28                             // 62427d2920e5 or 6242fd2920e5
-       //TODO: VPMOVSXBW -17(BP), K1, Y28                         // 62627d2920a5efffffff or 6262fd2920a5efffffff
-       //TODO: VPMOVSXBW -15(R14)(R15*8), K1, Y28                 // 62027d2920a4fef1ffffff or 6202fd2920a4fef1ffffff
-       //TODO: VPMOVSXBW X24, K1, X8                              // 62127d0920c0 or 6212fd0920c0
-       //TODO: VPMOVSXBW (BX), K1, X8                             // 62727d092003 or 6272fd092003
-       //TODO: VPMOVSXBW -17(BP)(SI*1), K1, X8                    // 62727d09208435efffffff or 6272fd09208435efffffff
-       //TODO: VPMOVSXBW Y20, K7, Z0                              // 62b27d4f20c4 or 62b2fd4f20c4
-       //TODO: VPMOVSXBW -7(DI)(R8*1), K7, Z0                     // 62b27d4f208407f9ffffff or 62b2fd4f208407f9ffffff
-       //TODO: VPMOVSXBW (SP), K7, Z0                             // 62f27d4f200424 or 62f2fd4f200424
-       //TODO: VPMOVSXBW Y20, K7, Z8                              // 62327d4f20c4 or 6232fd4f20c4
-       //TODO: VPMOVSXBW -7(DI)(R8*1), K7, Z8                     // 62327d4f208407f9ffffff or 6232fd4f208407f9ffffff
-       //TODO: VPMOVSXBW (SP), K7, Z8                             // 62727d4f200424 or 6272fd4f200424
-       //TODO: VPMOVUSWB X6, K1, X6                               // 62f27e0910f6
-       //TODO: VPMOVUSWB X6, K1, 99(R15)(R15*2)                   // 62927e0910b47f63000000
-       //TODO: VPMOVUSWB X6, K1, -7(DI)                           // 62f27e0910b7f9ffffff
-       //TODO: VPMOVUSWB Y15, K2, X22                             // 62327e2a10fe
-       //TODO: VPMOVUSWB Y15, K2, 7(SI)(DI*4)                     // 62727e2a10bcbe07000000
-       //TODO: VPMOVUSWB Y15, K2, -7(DI)(R8*2)                    // 62327e2a10bc47f9ffffff
-       //TODO: VPMOVUSWB Z28, K1, Y1                              // 62627e4910e1
-       //TODO: VPMOVUSWB Z6, K1, Y1                               // 62f27e4910f1
-       //TODO: VPMOVUSWB Z28, K1, 15(R8)(R14*4)                   // 62027e4910a4b00f000000
-       //TODO: VPMOVUSWB Z6, K1, 15(R8)(R14*4)                    // 62927e4910b4b00f000000
-       //TODO: VPMOVUSWB Z28, K1, -7(CX)(DX*4)                    // 62627e4910a491f9ffffff
-       //TODO: VPMOVUSWB Z6, K1, -7(CX)(DX*4)                     // 62f27e4910b491f9ffffff
-       //TODO: VPMOVW2M X12, K4                                   // 62d2fe0829e4
-       //TODO: VPMOVW2M X12, K6                                   // 62d2fe0829f4
-       //TODO: VPMOVW2M Y27, K4                                   // 6292fe2829e3
-       //TODO: VPMOVW2M Y27, K5                                   // 6292fe2829eb
-       //TODO: VPMOVW2M Z13, K2                                   // 62d2fe4829d5
-       //TODO: VPMOVW2M Z21, K2                                   // 62b2fe4829d5
-       //TODO: VPMOVW2M Z13, K7                                   // 62d2fe4829fd
-       //TODO: VPMOVW2M Z21, K7                                   // 62b2fe4829fd
-       //TODO: VPMOVWB X28, K7, X16                               // 62227e0f30e0
-       //TODO: VPMOVWB X28, K7, -7(CX)(DX*1)                      // 62627e0f30a411f9ffffff
-       //TODO: VPMOVWB X28, K7, -15(R14)(R15*4)                   // 62027e0f30a4bef1ffffff
-       //TODO: VPMOVWB Y19, K1, X8                                // 62c27e2930d8
-       //TODO: VPMOVWB Y19, K1, 17(SP)                            // 62e27e29309c2411000000
-       //TODO: VPMOVWB Y19, K1, -17(BP)(SI*4)                     // 62e27e29309cb5efffffff
-       //TODO: VPMOVWB Z26, K1, Y5                                // 62627e4930d5
-       //TODO: VPMOVWB Z3, K1, Y5                                 // 62f27e4930dd
-       //TODO: VPMOVWB Z26, K1, (R8)                              // 62427e493010
-       //TODO: VPMOVWB Z3, K1, (R8)                               // 62d27e493018
-       //TODO: VPMOVWB Z26, K1, 15(DX)(BX*2)                      // 62627e4930945a0f000000
-       //TODO: VPMOVWB Z3, K1, 15(DX)(BX*2)                       // 62f27e49309c5a0f000000
-       //TODO: VPMOVZXBW X0, K4, Y21                              // 62e27d2c30e8 or 62e2fd2c30e8
-       //TODO: VPMOVZXBW 99(R15)(R15*1), K4, Y21                  // 62827d2c30ac3f63000000 or 6282fd2c30ac3f63000000
-       //TODO: VPMOVZXBW (DX), K4, Y21                            // 62e27d2c302a or 62e2fd2c302a
-       //TODO: VPMOVZXBW X11, K5, X25                             // 62427d0d30cb or 6242fd0d30cb
-       //TODO: VPMOVZXBW 17(SP)(BP*2), K5, X25                    // 62627d0d308c6c11000000 or 6262fd0d308c6c11000000
-       //TODO: VPMOVZXBW -7(DI)(R8*4), K5, X25                    // 62227d0d308c87f9ffffff or 6222fd0d308c87f9ffffff
-       //TODO: VPMOVZXBW Y7, K7, Z11                              // 62727d4f30df or 6272fd4f30df
-       //TODO: VPMOVZXBW 17(SP)(BP*1), K7, Z11                    // 62727d4f309c2c11000000 or 6272fd4f309c2c11000000
-       //TODO: VPMOVZXBW -7(CX)(DX*8), K7, Z11                    // 62727d4f309cd1f9ffffff or 6272fd4f309cd1f9ffffff
-       //TODO: VPMOVZXBW Y7, K7, Z25                              // 62627d4f30cf or 6262fd4f30cf
-       //TODO: VPMOVZXBW 17(SP)(BP*1), K7, Z25                    // 62627d4f308c2c11000000 or 6262fd4f308c2c11000000
-       //TODO: VPMOVZXBW -7(CX)(DX*8), K7, Z25                    // 62627d4f308cd1f9ffffff or 6262fd4f308cd1f9ffffff
-       //TODO: VPMULHRSW X30, X15, K2, X11                        // 6212050a0bde or 6212850a0bde
-       //TODO: VPMULHRSW -7(CX), X15, K2, X11                     // 6272050a0b99f9ffffff or 6272850a0b99f9ffffff
-       //TODO: VPMULHRSW 15(DX)(BX*4), X15, K2, X11               // 6272050a0b9c9a0f000000 or 6272850a0b9c9a0f000000
-       //TODO: VPMULHRSW Y16, Y21, K3, Y24                        // 622255230bc0 or 6222d5230bc0
-       //TODO: VPMULHRSW 99(R15)(R15*4), Y21, K3, Y24             // 620255230b84bf63000000 or 6202d5230b84bf63000000
-       //TODO: VPMULHRSW 15(DX), Y21, K3, Y24                     // 626255230b820f000000 or 6262d5230b820f000000
-       //TODO: VPMULHRSW Z22, Z12, K3, Z16                        // 62a21d4b0bc6 or 62a29d4b0bc6
-       //TODO: VPMULHRSW Z11, Z12, K3, Z16                        // 62c21d4b0bc3 or 62c29d4b0bc3
-       //TODO: VPMULHRSW 15(DX)(BX*1), Z12, K3, Z16               // 62e21d4b0b841a0f000000 or 62e29d4b0b841a0f000000
-       //TODO: VPMULHRSW -7(CX)(DX*2), Z12, K3, Z16               // 62e21d4b0b8451f9ffffff or 62e29d4b0b8451f9ffffff
-       //TODO: VPMULHRSW Z22, Z27, K3, Z16                        // 62a225430bc6 or 62a2a5430bc6
-       //TODO: VPMULHRSW Z11, Z27, K3, Z16                        // 62c225430bc3 or 62c2a5430bc3
-       //TODO: VPMULHRSW 15(DX)(BX*1), Z27, K3, Z16               // 62e225430b841a0f000000 or 62e2a5430b841a0f000000
-       //TODO: VPMULHRSW -7(CX)(DX*2), Z27, K3, Z16               // 62e225430b8451f9ffffff or 62e2a5430b8451f9ffffff
-       //TODO: VPMULHRSW Z22, Z12, K3, Z13                        // 62321d4b0bee or 62329d4b0bee
-       //TODO: VPMULHRSW Z11, Z12, K3, Z13                        // 62521d4b0beb or 62529d4b0beb
-       //TODO: VPMULHRSW 15(DX)(BX*1), Z12, K3, Z13               // 62721d4b0bac1a0f000000 or 62729d4b0bac1a0f000000
-       //TODO: VPMULHRSW -7(CX)(DX*2), Z12, K3, Z13               // 62721d4b0bac51f9ffffff or 62729d4b0bac51f9ffffff
-       //TODO: VPMULHRSW Z22, Z27, K3, Z13                        // 623225430bee or 6232a5430bee
-       //TODO: VPMULHRSW Z11, Z27, K3, Z13                        // 625225430beb or 6252a5430beb
-       //TODO: VPMULHRSW 15(DX)(BX*1), Z27, K3, Z13               // 627225430bac1a0f000000 or 6272a5430bac1a0f000000
-       //TODO: VPMULHRSW -7(CX)(DX*2), Z27, K3, Z13               // 627225430bac51f9ffffff or 6272a5430bac51f9ffffff
-       //TODO: VPMULHUW X12, X6, K3, X13                          // 62514d0be4ec or 6251cd0be4ec
-       //TODO: VPMULHUW 99(R15)(R15*8), X6, K3, X13               // 62114d0be4acff63000000 or 6211cd0be4acff63000000
-       //TODO: VPMULHUW 7(AX)(CX*8), X6, K3, X13                  // 62714d0be4acc807000000 or 6271cd0be4acc807000000
-       //TODO: VPMULHUW Y9, Y13, K2, Y9                           // 6251152ae4c9 or 6251952ae4c9
-       //TODO: VPMULHUW (CX), Y13, K2, Y9                         // 6271152ae409 or 6271952ae409
-       //TODO: VPMULHUW 99(R15), Y13, K2, Y9                      // 6251152ae48f63000000 or 6251952ae48f63000000
-       //TODO: VPMULHUW Z12, Z25, K1, Z6                          // 62d13541e4f4 or 62d1b541e4f4
-       //TODO: VPMULHUW Z17, Z25, K1, Z6                          // 62b13541e4f1 or 62b1b541e4f1
-       //TODO: VPMULHUW -17(BP), Z25, K1, Z6                      // 62f13541e4b5efffffff or 62f1b541e4b5efffffff
-       //TODO: VPMULHUW -15(R14)(R15*8), Z25, K1, Z6              // 62913541e4b4fef1ffffff or 6291b541e4b4fef1ffffff
-       //TODO: VPMULHUW Z12, Z12, K1, Z6                          // 62d11d49e4f4 or 62d19d49e4f4
-       //TODO: VPMULHUW Z17, Z12, K1, Z6                          // 62b11d49e4f1 or 62b19d49e4f1
-       //TODO: VPMULHUW -17(BP), Z12, K1, Z6                      // 62f11d49e4b5efffffff or 62f19d49e4b5efffffff
-       //TODO: VPMULHUW -15(R14)(R15*8), Z12, K1, Z6              // 62911d49e4b4fef1ffffff or 62919d49e4b4fef1ffffff
-       //TODO: VPMULHUW Z12, Z25, K1, Z8                          // 62513541e4c4 or 6251b541e4c4
-       //TODO: VPMULHUW Z17, Z25, K1, Z8                          // 62313541e4c1 or 6231b541e4c1
-       //TODO: VPMULHUW -17(BP), Z25, K1, Z8                      // 62713541e485efffffff or 6271b541e485efffffff
-       //TODO: VPMULHUW -15(R14)(R15*8), Z25, K1, Z8              // 62113541e484fef1ffffff or 6211b541e484fef1ffffff
-       //TODO: VPMULHUW Z12, Z12, K1, Z8                          // 62511d49e4c4 or 62519d49e4c4
-       //TODO: VPMULHUW Z17, Z12, K1, Z8                          // 62311d49e4c1 or 62319d49e4c1
-       //TODO: VPMULHUW -17(BP), Z12, K1, Z8                      // 62711d49e485efffffff or 62719d49e485efffffff
-       //TODO: VPMULHUW -15(R14)(R15*8), Z12, K1, Z8              // 62111d49e484fef1ffffff or 62119d49e484fef1ffffff
-       //TODO: VPMULHW X8, X30, K2, X23                           // 62c10d02e5f8 or 62c18d02e5f8
-       //TODO: VPMULHW (AX), X30, K2, X23                         // 62e10d02e538 or 62e18d02e538
-       //TODO: VPMULHW 7(SI), X30, K2, X23                        // 62e10d02e5be07000000 or 62e18d02e5be07000000
-       //TODO: VPMULHW Y7, Y3, K1, Y6                             // 62f16529e5f7 or 62f1e529e5f7
-       //TODO: VPMULHW 99(R15)(R15*2), Y3, K1, Y6                 // 62916529e5b47f63000000 or 6291e529e5b47f63000000
-       //TODO: VPMULHW -7(DI), Y3, K1, Y6                         // 62f16529e5b7f9ffffff or 62f1e529e5b7f9ffffff
-       //TODO: VPMULHW Z3, Z6, K7, Z9                             // 62714d4fe5cb or 6271cd4fe5cb
-       //TODO: VPMULHW Z21, Z6, K7, Z9                            // 62314d4fe5cd or 6231cd4fe5cd
-       //TODO: VPMULHW 17(SP)(BP*2), Z6, K7, Z9                   // 62714d4fe58c6c11000000 or 6271cd4fe58c6c11000000
-       //TODO: VPMULHW -7(DI)(R8*4), Z6, K7, Z9                   // 62314d4fe58c87f9ffffff or 6231cd4fe58c87f9ffffff
-       //TODO: VPMULHW Z3, Z25, K7, Z9                            // 62713547e5cb or 6271b547e5cb
-       //TODO: VPMULHW Z21, Z25, K7, Z9                           // 62313547e5cd or 6231b547e5cd
-       //TODO: VPMULHW 17(SP)(BP*2), Z25, K7, Z9                  // 62713547e58c6c11000000 or 6271b547e58c6c11000000
-       //TODO: VPMULHW -7(DI)(R8*4), Z25, K7, Z9                  // 62313547e58c87f9ffffff or 6231b547e58c87f9ffffff
-       //TODO: VPMULHW Z3, Z6, K7, Z12                            // 62714d4fe5e3 or 6271cd4fe5e3
-       //TODO: VPMULHW Z21, Z6, K7, Z12                           // 62314d4fe5e5 or 6231cd4fe5e5
-       //TODO: VPMULHW 17(SP)(BP*2), Z6, K7, Z12                  // 62714d4fe5a46c11000000 or 6271cd4fe5a46c11000000
-       //TODO: VPMULHW -7(DI)(R8*4), Z6, K7, Z12                  // 62314d4fe5a487f9ffffff or 6231cd4fe5a487f9ffffff
-       //TODO: VPMULHW Z3, Z25, K7, Z12                           // 62713547e5e3 or 6271b547e5e3
-       //TODO: VPMULHW Z21, Z25, K7, Z12                          // 62313547e5e5 or 6231b547e5e5
-       //TODO: VPMULHW 17(SP)(BP*2), Z25, K7, Z12                 // 62713547e5a46c11000000 or 6271b547e5a46c11000000
-       //TODO: VPMULHW -7(DI)(R8*4), Z25, K7, Z12                 // 62313547e5a487f9ffffff or 6231b547e5a487f9ffffff
-       //TODO: VPMULLW X7, X16, K1, X31                           // 62617d01d5ff or 6261fd01d5ff
-       //TODO: VPMULLW (R8), X16, K1, X31                         // 62417d01d538 or 6241fd01d538
-       //TODO: VPMULLW 15(DX)(BX*2), X16, K1, X31                 // 62617d01d5bc5a0f000000 or 6261fd01d5bc5a0f000000
-       //TODO: VPMULLW Y18, Y31, K3, Y18                          // 62a10523d5d2 or 62a18523d5d2
-       //TODO: VPMULLW -17(BP), Y31, K3, Y18                      // 62e10523d595efffffff or 62e18523d595efffffff
-       //TODO: VPMULLW -15(R14)(R15*8), Y31, K3, Y18              // 62810523d594fef1ffffff or 62818523d594fef1ffffff
-       //TODO: VPMULLW Z11, Z12, K4, Z9                           // 62511d4cd5cb or 62519d4cd5cb
-       //TODO: VPMULLW Z5, Z12, K4, Z9                            // 62711d4cd5cd or 62719d4cd5cd
-       //TODO: VPMULLW -15(R14)(R15*1), Z12, K4, Z9               // 62111d4cd58c3ef1ffffff or 62119d4cd58c3ef1ffffff
-       //TODO: VPMULLW -15(BX), Z12, K4, Z9                       // 62711d4cd58bf1ffffff or 62719d4cd58bf1ffffff
-       //TODO: VPMULLW Z11, Z22, K4, Z9                           // 62514d44d5cb or 6251cd44d5cb
-       //TODO: VPMULLW Z5, Z22, K4, Z9                            // 62714d44d5cd or 6271cd44d5cd
-       //TODO: VPMULLW -15(R14)(R15*1), Z22, K4, Z9               // 62114d44d58c3ef1ffffff or 6211cd44d58c3ef1ffffff
-       //TODO: VPMULLW -15(BX), Z22, K4, Z9                       // 62714d44d58bf1ffffff or 6271cd44d58bf1ffffff
-       //TODO: VPMULLW Z11, Z12, K4, Z19                          // 62c11d4cd5db or 62c19d4cd5db
-       //TODO: VPMULLW Z5, Z12, K4, Z19                           // 62e11d4cd5dd or 62e19d4cd5dd
-       //TODO: VPMULLW -15(R14)(R15*1), Z12, K4, Z19              // 62811d4cd59c3ef1ffffff or 62819d4cd59c3ef1ffffff
-       //TODO: VPMULLW -15(BX), Z12, K4, Z19                      // 62e11d4cd59bf1ffffff or 62e19d4cd59bf1ffffff
-       //TODO: VPMULLW Z11, Z22, K4, Z19                          // 62c14d44d5db or 62c1cd44d5db
-       //TODO: VPMULLW Z5, Z22, K4, Z19                           // 62e14d44d5dd or 62e1cd44d5dd
-       //TODO: VPMULLW -15(R14)(R15*1), Z22, K4, Z19              // 62814d44d59c3ef1ffffff or 6281cd44d59c3ef1ffffff
-       //TODO: VPMULLW -15(BX), Z22, K4, Z19                      // 62e14d44d59bf1ffffff or 62e1cd44d59bf1ffffff
-       //TODO: VPSADBW X7, X3, X31                                // 62616508f6ff or 6261e508f6ff
-       //TODO: VPSADBW 17(SP)(BP*8), X3, X31                      // 62616508f6bcec11000000 or 6261e508f6bcec11000000
-       //TODO: VPSADBW 17(SP)(BP*4), X3, X31                      // 62616508f6bcac11000000 or 6261e508f6bcac11000000
-       //TODO: VPSADBW Y14, Y9, Y22                               // 62c13528f6f6 or 62c1b528f6f6
-       //TODO: VPSADBW 99(R15)(R15*8), Y9, Y22                    // 62813528f6b4ff63000000 or 6281b528f6b4ff63000000
-       //TODO: VPSADBW 7(AX)(CX*8), Y9, Y22                       // 62e13528f6b4c807000000 or 62e1b528f6b4c807000000
-       //TODO: VPSADBW Z7, Z26, Z30                               // 62612d40f6f7 or 6261ad40f6f7
-       //TODO: VPSADBW Z21, Z26, Z30                              // 62212d40f6f5 or 6221ad40f6f5
-       //TODO: VPSADBW (R8), Z26, Z30                             // 62412d40f630 or 6241ad40f630
-       //TODO: VPSADBW 15(DX)(BX*2), Z26, Z30                     // 62612d40f6b45a0f000000 or 6261ad40f6b45a0f000000
-       //TODO: VPSADBW Z7, Z22, Z30                               // 62614d40f6f7 or 6261cd40f6f7
-       //TODO: VPSADBW Z21, Z22, Z30                              // 62214d40f6f5 or 6221cd40f6f5
-       //TODO: VPSADBW (R8), Z22, Z30                             // 62414d40f630 or 6241cd40f630
-       //TODO: VPSADBW 15(DX)(BX*2), Z22, Z30                     // 62614d40f6b45a0f000000 or 6261cd40f6b45a0f000000
-       //TODO: VPSADBW Z7, Z26, Z5                                // 62f12d40f6ef or 62f1ad40f6ef
-       //TODO: VPSADBW Z21, Z26, Z5                               // 62b12d40f6ed or 62b1ad40f6ed
-       //TODO: VPSADBW (R8), Z26, Z5                              // 62d12d40f628 or 62d1ad40f628
-       //TODO: VPSADBW 15(DX)(BX*2), Z26, Z5                      // 62f12d40f6ac5a0f000000 or 62f1ad40f6ac5a0f000000
-       //TODO: VPSADBW Z7, Z22, Z5                                // 62f14d40f6ef or 62f1cd40f6ef
-       //TODO: VPSADBW Z21, Z22, Z5                               // 62b14d40f6ed or 62b1cd40f6ed
-       //TODO: VPSADBW (R8), Z22, Z5                              // 62d14d40f628 or 62d1cd40f628
-       //TODO: VPSADBW 15(DX)(BX*2), Z22, Z5                      // 62f14d40f6ac5a0f000000 or 62f1cd40f6ac5a0f000000
-       //TODO: VPSHUFB X13, X9, K5, X0                            // 62d2350d00c5 or 62d2b50d00c5
-       //TODO: VPSHUFB 15(R8)(R14*4), X9, K5, X0                  // 6292350d0084b00f000000 or 6292b50d0084b00f000000
-       //TODO: VPSHUFB -7(CX)(DX*4), X9, K5, X0                   // 62f2350d008491f9ffffff or 62f2b50d008491f9ffffff
-       //TODO: VPSHUFB Y2, Y16, K7, Y5                            // 62f27d2700ea or 62f2fd2700ea
-       //TODO: VPSHUFB 15(DX)(BX*1), Y16, K7, Y5                  // 62f27d2700ac1a0f000000 or 62f2fd2700ac1a0f000000
-       //TODO: VPSHUFB -7(CX)(DX*2), Y16, K7, Y5                  // 62f27d2700ac51f9ffffff or 62f2fd2700ac51f9ffffff
-       //TODO: VPSHUFB Z9, Z12, K7, Z25                           // 62421d4f00c9 or 62429d4f00c9
-       //TODO: VPSHUFB Z12, Z12, K7, Z25                          // 62421d4f00cc or 62429d4f00cc
-       //TODO: VPSHUFB 15(R8)(R14*8), Z12, K7, Z25                // 62021d4f008cf00f000000 or 62029d4f008cf00f000000
-       //TODO: VPSHUFB -15(R14)(R15*2), Z12, K7, Z25              // 62021d4f008c7ef1ffffff or 62029d4f008c7ef1ffffff
-       //TODO: VPSHUFB Z9, Z17, K7, Z25                           // 6242754700c9 or 6242f54700c9
-       //TODO: VPSHUFB Z12, Z17, K7, Z25                          // 6242754700cc or 6242f54700cc
-       //TODO: VPSHUFB 15(R8)(R14*8), Z17, K7, Z25                // 62027547008cf00f000000 or 6202f547008cf00f000000
-       //TODO: VPSHUFB -15(R14)(R15*2), Z17, K7, Z25              // 62027547008c7ef1ffffff or 6202f547008c7ef1ffffff
-       //TODO: VPSHUFB Z9, Z12, K7, Z12                           // 62521d4f00e1 or 62529d4f00e1
-       //TODO: VPSHUFB Z12, Z12, K7, Z12                          // 62521d4f00e4 or 62529d4f00e4
-       //TODO: VPSHUFB 15(R8)(R14*8), Z12, K7, Z12                // 62121d4f00a4f00f000000 or 62129d4f00a4f00f000000
-       //TODO: VPSHUFB -15(R14)(R15*2), Z12, K7, Z12              // 62121d4f00a47ef1ffffff or 62129d4f00a47ef1ffffff
-       //TODO: VPSHUFB Z9, Z17, K7, Z12                           // 6252754700e1 or 6252f54700e1
-       //TODO: VPSHUFB Z12, Z17, K7, Z12                          // 6252754700e4 or 6252f54700e4
-       //TODO: VPSHUFB 15(R8)(R14*8), Z17, K7, Z12                // 6212754700a4f00f000000 or 6212f54700a4f00f000000
-       //TODO: VPSHUFB -15(R14)(R15*2), Z17, K7, Z12              // 6212754700a47ef1ffffff or 6212f54700a47ef1ffffff
-       //TODO: VPSHUFHW $13, X11, K2, X31                         // 62417e0a70fb0d or 6241fe0a70fb0d
-       //TODO: VPSHUFHW $13, -17(BP)(SI*2), K2, X31               // 62617e0a70bc75efffffff0d or 6261fe0a70bc75efffffff0d
-       //TODO: VPSHUFHW $13, 7(AX)(CX*2), K2, X31                 // 62617e0a70bc48070000000d or 6261fe0a70bc48070000000d
-       //TODO: VPSHUFHW $65, Y11, K5, Y6                          // 62d17e2d70f341 or 62d1fe2d70f341
-       //TODO: VPSHUFHW $65, 15(R8), K5, Y6                       // 62d17e2d70b00f00000041 or 62d1fe2d70b00f00000041
-       //TODO: VPSHUFHW $65, (BP), K5, Y6                         // 62f17e2d70750041 or 62f1fe2d70750041
-       //TODO: VPSHUFHW $67, Z0, K3, Z7                           // 62f17e4b70f843 or 62f1fe4b70f843
-       //TODO: VPSHUFHW $67, Z6, K3, Z7                           // 62f17e4b70fe43 or 62f1fe4b70fe43
-       //TODO: VPSHUFHW $67, (SI), K3, Z7                         // 62f17e4b703e43 or 62f1fe4b703e43
-       //TODO: VPSHUFHW $67, 7(SI)(DI*2), K3, Z7                  // 62f17e4b70bc7e0700000043 or 62f1fe4b70bc7e0700000043
-       //TODO: VPSHUFHW $67, Z0, K3, Z9                           // 62717e4b70c843 or 6271fe4b70c843
-       //TODO: VPSHUFHW $67, Z6, K3, Z9                           // 62717e4b70ce43 or 6271fe4b70ce43
-       //TODO: VPSHUFHW $67, (SI), K3, Z9                         // 62717e4b700e43 or 6271fe4b700e43
-       //TODO: VPSHUFHW $67, 7(SI)(DI*2), K3, Z9                  // 62717e4b708c7e0700000043 or 6271fe4b708c7e0700000043
-       //TODO: VPSHUFLW $127, X5, K4, X22                         // 62e17f0c70f57f or 62e1ff0c70f57f
-       //TODO: VPSHUFLW $127, 15(R8)(R14*1), K4, X22              // 62817f0c70b4300f0000007f or 6281ff0c70b4300f0000007f
-       //TODO: VPSHUFLW $127, 15(R8)(R14*2), K4, X22              // 62817f0c70b4700f0000007f or 6281ff0c70b4700f0000007f
-       //TODO: VPSHUFLW $0, Y7, K2, Y19                           // 62e17f2a70df00 or 62e1ff2a70df00
-       //TODO: VPSHUFLW $0, 15(R8)(R14*8), K2, Y19                // 62817f2a709cf00f00000000 or 6281ff2a709cf00f00000000
-       //TODO: VPSHUFLW $0, -15(R14)(R15*2), K2, Y19              // 62817f2a709c7ef1ffffff00 or 6281ff2a709c7ef1ffffff00
-       //TODO: VPSHUFLW $97, Z3, K2, Z20                          // 62e17f4a70e361 or 62e1ff4a70e361
-       //TODO: VPSHUFLW $97, Z30, K2, Z20                         // 62817f4a70e661 or 6281ff4a70e661
-       //TODO: VPSHUFLW $97, 17(SP)(BP*8), K2, Z20                // 62e17f4a70a4ec1100000061 or 62e1ff4a70a4ec1100000061
-       //TODO: VPSHUFLW $97, 17(SP)(BP*4), K2, Z20                // 62e17f4a70a4ac1100000061 or 62e1ff4a70a4ac1100000061
-       //TODO: VPSHUFLW $97, Z3, K2, Z28                          // 62617f4a70e361 or 6261ff4a70e361
-       //TODO: VPSHUFLW $97, Z30, K2, Z28                         // 62017f4a70e661 or 6201ff4a70e661
-       //TODO: VPSHUFLW $97, 17(SP)(BP*8), K2, Z28                // 62617f4a70a4ec1100000061 or 6261ff4a70a4ec1100000061
-       //TODO: VPSHUFLW $97, 17(SP)(BP*4), K2, Z28                // 62617f4a70a4ac1100000061 or 6261ff4a70a4ac1100000061
-       //TODO: VPSLLDQ $64, X8, X18                               // 62d16d0073f840 or 62d1ed0073f840
-       //TODO: VPSLLDQ $64, -7(CX)(DX*1), X18                     // 62f16d0073bc11f9ffffff40 or 62f1ed0073bc11f9ffffff40
-       //TODO: VPSLLDQ $64, -15(R14)(R15*4), X18                  // 62916d0073bcbef1ffffff40 or 6291ed0073bcbef1ffffff40
-       //TODO: VPSLLDQ $27, Y12, Y20                              // 62d15d2073fc1b or 62d1dd2073fc1b
-       //TODO: VPSLLDQ $27, 7(AX)(CX*4), Y20                      // 62f15d2073bc88070000001b or 62f1dd2073bc88070000001b
-       //TODO: VPSLLDQ $27, 7(AX)(CX*1), Y20                      // 62f15d2073bc08070000001b or 62f1dd2073bc08070000001b
-       //TODO: VPSLLDQ $47, Z7, Z2                                // 62f16d4873ff2f or 62f1ed4873ff2f
-       //TODO: VPSLLDQ $47, Z13, Z2                               // 62d16d4873fd2f or 62d1ed4873fd2f
-       //TODO: VPSLLDQ $47, 17(SP), Z2                            // 62f16d4873bc24110000002f or 62f1ed4873bc24110000002f
-       //TODO: VPSLLDQ $47, -17(BP)(SI*4), Z2                     // 62f16d4873bcb5efffffff2f or 62f1ed4873bcb5efffffff2f
-       //TODO: VPSLLDQ $47, Z7, Z21                               // 62f1554073ff2f or 62f1d54073ff2f
-       //TODO: VPSLLDQ $47, Z13, Z21                              // 62d1554073fd2f or 62d1d54073fd2f
-       //TODO: VPSLLDQ $47, 17(SP), Z21                           // 62f1554073bc24110000002f or 62f1d54073bc24110000002f
-       //TODO: VPSLLDQ $47, -17(BP)(SI*4), Z21                    // 62f1554073bcb5efffffff2f or 62f1d54073bcb5efffffff2f
-       //TODO: VPSLLVW X11, X1, K7, X22                           // 62c2f50f12f3
-       //TODO: VPSLLVW 7(AX)(CX*4), X1, K7, X22                   // 62e2f50f12b48807000000
-       //TODO: VPSLLVW 7(AX)(CX*1), X1, K7, X22                   // 62e2f50f12b40807000000
-       //TODO: VPSLLVW Y9, Y7, K7, Y17                            // 62c2c52f12c9
-       //TODO: VPSLLVW 17(SP), Y7, K7, Y17                        // 62e2c52f128c2411000000
-       //TODO: VPSLLVW -17(BP)(SI*4), Y7, K7, Y17                 // 62e2c52f128cb5efffffff
-       //TODO: VPSLLVW Z3, Z14, K6, Z28                           // 62628d4e12e3
-       //TODO: VPSLLVW Z12, Z14, K6, Z28                          // 62428d4e12e4
-       //TODO: VPSLLVW 7(SI)(DI*8), Z14, K6, Z28                  // 62628d4e12a4fe07000000
-       //TODO: VPSLLVW -15(R14), Z14, K6, Z28                     // 62428d4e12a6f1ffffff
-       //TODO: VPSLLVW Z3, Z28, K6, Z28                           // 62629d4612e3
-       //TODO: VPSLLVW Z12, Z28, K6, Z28                          // 62429d4612e4
-       //TODO: VPSLLVW 7(SI)(DI*8), Z28, K6, Z28                  // 62629d4612a4fe07000000
-       //TODO: VPSLLVW -15(R14), Z28, K6, Z28                     // 62429d4612a6f1ffffff
-       //TODO: VPSLLVW Z3, Z14, K6, Z13                           // 62728d4e12eb
-       //TODO: VPSLLVW Z12, Z14, K6, Z13                          // 62528d4e12ec
-       //TODO: VPSLLVW 7(SI)(DI*8), Z14, K6, Z13                  // 62728d4e12acfe07000000
-       //TODO: VPSLLVW -15(R14), Z14, K6, Z13                     // 62528d4e12aef1ffffff
-       //TODO: VPSLLVW Z3, Z28, K6, Z13                           // 62729d4612eb
-       //TODO: VPSLLVW Z12, Z28, K6, Z13                          // 62529d4612ec
-       //TODO: VPSLLVW 7(SI)(DI*8), Z28, K6, Z13                  // 62729d4612acfe07000000
-       //TODO: VPSLLVW -15(R14), Z28, K6, Z13                     // 62529d4612aef1ffffff
-       //TODO: VPSLLW $121, X7, K3, X6                            // 62f14d0b71f779 or 62f1cd0b71f779
-       //TODO: VPSLLW $121, (SI), K3, X6                          // 62f14d0b713679 or 62f1cd0b713679
-       //TODO: VPSLLW $121, 7(SI)(DI*2), K3, X6                   // 62f14d0b71b47e0700000079 or 62f1cd0b71b47e0700000079
-       //TODO: VPSLLW $13, Y8, K7, Y31                            // 62d1052771f00d or 62d1852771f00d
-       //TODO: VPSLLW $13, 7(AX), K7, Y31                         // 62f1052771b0070000000d or 62f1852771b0070000000d
-       //TODO: VPSLLW $13, (DI), K7, Y31                          // 62f1052771370d or 62f1852771370d
-       //TODO: VPSLLW $65, Z19, K4, Z15                           // 62b1054c71f341 or 62b1854c71f341
-       //TODO: VPSLLW $65, Z15, K4, Z15                           // 62d1054c71f741 or 62d1854c71f741
-       //TODO: VPSLLW $65, 7(SI)(DI*1), K4, Z15                   // 62f1054c71b43e0700000041 or 62f1854c71b43e0700000041
-       //TODO: VPSLLW $65, 15(DX)(BX*8), K4, Z15                  // 62f1054c71b4da0f00000041 or 62f1854c71b4da0f00000041
-       //TODO: VPSLLW $65, Z19, K4, Z30                           // 62b10d4471f341 or 62b18d4471f341
-       //TODO: VPSLLW $65, Z15, K4, Z30                           // 62d10d4471f741 or 62d18d4471f741
-       //TODO: VPSLLW $65, 7(SI)(DI*1), K4, Z30                   // 62f10d4471b43e0700000041 or 62f18d4471b43e0700000041
-       //TODO: VPSLLW $65, 15(DX)(BX*8), K4, Z30                  // 62f10d4471b4da0f00000041 or 62f18d4471b4da0f00000041
-       //TODO: VPSLLW X3, X31, K4, X8                             // 62710504f1c3 or 62718504f1c3
-       //TODO: VPSLLW 17(SP)(BP*8), X31, K4, X8                   // 62710504f184ec11000000 or 62718504f184ec11000000
-       //TODO: VPSLLW 17(SP)(BP*4), X31, K4, X8                   // 62710504f184ac11000000 or 62718504f184ac11000000
-       //TODO: VPSLLW X28, Y28, K7, Y1                            // 62911d27f1cc or 62919d27f1cc
-       //TODO: VPSLLW 7(SI)(DI*4), Y28, K7, Y1                    // 62f11d27f18cbe07000000 or 62f19d27f18cbe07000000
-       //TODO: VPSLLW -7(DI)(R8*2), Y28, K7, Y1                   // 62b11d27f18c47f9ffffff or 62b19d27f18c47f9ffffff
-       //TODO: VPSLLW X20, Z3, K2, Z5                             // 62b1654af1ec or 62b1e54af1ec
-       //TODO: VPSLLW 17(SP), Z3, K2, Z5                          // 62f1654af1ac2411000000 or 62f1e54af1ac2411000000
-       //TODO: VPSLLW -17(BP)(SI*4), Z3, K2, Z5                   // 62f1654af1acb5efffffff or 62f1e54af1acb5efffffff
-       //TODO: VPSLLW X20, Z5, K2, Z5                             // 62b1554af1ec or 62b1d54af1ec
-       //TODO: VPSLLW 17(SP), Z5, K2, Z5                          // 62f1554af1ac2411000000 or 62f1d54af1ac2411000000
-       //TODO: VPSLLW -17(BP)(SI*4), Z5, K2, Z5                   // 62f1554af1acb5efffffff or 62f1d54af1acb5efffffff
-       //TODO: VPSLLW X20, Z3, K2, Z1                             // 62b1654af1cc or 62b1e54af1cc
-       //TODO: VPSLLW 17(SP), Z3, K2, Z1                          // 62f1654af18c2411000000 or 62f1e54af18c2411000000
-       //TODO: VPSLLW -17(BP)(SI*4), Z3, K2, Z1                   // 62f1654af18cb5efffffff or 62f1e54af18cb5efffffff
-       //TODO: VPSLLW X20, Z5, K2, Z1                             // 62b1554af1cc or 62b1d54af1cc
-       //TODO: VPSLLW 17(SP), Z5, K2, Z1                          // 62f1554af18c2411000000 or 62f1d54af18c2411000000
-       //TODO: VPSLLW -17(BP)(SI*4), Z5, K2, Z1                   // 62f1554af18cb5efffffff or 62f1d54af18cb5efffffff
-       //TODO: VPSRAVW X8, X28, K4, X16                           // 62c29d0411c0
-       //TODO: VPSRAVW 15(R8)(R14*4), X28, K4, X16                // 62829d041184b00f000000
-       //TODO: VPSRAVW -7(CX)(DX*4), X28, K4, X16                 // 62e29d04118491f9ffffff
-       //TODO: VPSRAVW Y7, Y26, K1, Y30                           // 6262ad2111f7
-       //TODO: VPSRAVW -7(DI)(R8*1), Y26, K1, Y30                 // 6222ad2111b407f9ffffff
-       //TODO: VPSRAVW (SP), Y26, K1, Y30                         // 6262ad21113424
-       //TODO: VPSRAVW Z21, Z31, K3, Z17                          // 62a2854311cd
-       //TODO: VPSRAVW Z9, Z31, K3, Z17                           // 62c2854311c9
-       //TODO: VPSRAVW (BX), Z31, K3, Z17                         // 62e28543110b
-       //TODO: VPSRAVW -17(BP)(SI*1), Z31, K3, Z17                // 62e28543118c35efffffff
-       //TODO: VPSRAVW Z21, Z0, K3, Z17                           // 62a2fd4b11cd
-       //TODO: VPSRAVW Z9, Z0, K3, Z17                            // 62c2fd4b11c9
-       //TODO: VPSRAVW (BX), Z0, K3, Z17                          // 62e2fd4b110b
-       //TODO: VPSRAVW -17(BP)(SI*1), Z0, K3, Z17                 // 62e2fd4b118c35efffffff
-       //TODO: VPSRAVW Z21, Z31, K3, Z23                          // 62a2854311fd
-       //TODO: VPSRAVW Z9, Z31, K3, Z23                           // 62c2854311f9
-       //TODO: VPSRAVW (BX), Z31, K3, Z23                         // 62e28543113b
-       //TODO: VPSRAVW -17(BP)(SI*1), Z31, K3, Z23                // 62e2854311bc35efffffff
-       //TODO: VPSRAVW Z21, Z0, K3, Z23                           // 62a2fd4b11fd
-       //TODO: VPSRAVW Z9, Z0, K3, Z23                            // 62c2fd4b11f9
-       //TODO: VPSRAVW (BX), Z0, K3, Z23                          // 62e2fd4b113b
-       //TODO: VPSRAVW -17(BP)(SI*1), Z0, K3, Z23                 // 62e2fd4b11bc35efffffff
-       //TODO: VPSRAW $79, X11, K4, X15                           // 62d1050c71e34f or 62d1850c71e34f
-       //TODO: VPSRAW $79, (R8), K4, X15                          // 62d1050c71204f or 62d1850c71204f
-       //TODO: VPSRAW $79, 15(DX)(BX*2), K4, X15                  // 62f1050c71a45a0f0000004f or 62f1850c71a45a0f0000004f
-       //TODO: VPSRAW $64, Y1, K5, Y16                            // 62f17d2571e140 or 62f1fd2571e140
-       //TODO: VPSRAW $64, -7(CX), K5, Y16                        // 62f17d2571a1f9ffffff40 or 62f1fd2571a1f9ffffff40
-       //TODO: VPSRAW $64, 15(DX)(BX*4), K5, Y16                  // 62f17d2571a49a0f00000040 or 62f1fd2571a49a0f00000040
-       //TODO: VPSRAW $27, Z1, K7, Z6                             // 62f14d4f71e11b or 62f1cd4f71e11b
-       //TODO: VPSRAW $27, Z9, K7, Z6                             // 62d14d4f71e11b or 62d1cd4f71e11b
-       //TODO: VPSRAW $27, 15(R8)(R14*4), K7, Z6                  // 62914d4f71a4b00f0000001b or 6291cd4f71a4b00f0000001b
-       //TODO: VPSRAW $27, -7(CX)(DX*4), K7, Z6                   // 62f14d4f71a491f9ffffff1b or 62f1cd4f71a491f9ffffff1b
-       //TODO: VPSRAW $27, Z1, K7, Z9                             // 62f1354f71e11b or 62f1b54f71e11b
-       //TODO: VPSRAW $27, Z9, K7, Z9                             // 62d1354f71e11b or 62d1b54f71e11b
-       //TODO: VPSRAW $27, 15(R8)(R14*4), K7, Z9                  // 6291354f71a4b00f0000001b or 6291b54f71a4b00f0000001b
-       //TODO: VPSRAW $27, -7(CX)(DX*4), K7, Z9                   // 62f1354f71a491f9ffffff1b or 62f1b54f71a491f9ffffff1b
-       //TODO: VPSRAW X13, X19, K7, X1                            // 62d16507e1cd or 62d1e507e1cd
-       //TODO: VPSRAW 17(SP)(BP*1), X19, K7, X1                   // 62f16507e18c2c11000000 or 62f1e507e18c2c11000000
-       //TODO: VPSRAW -7(CX)(DX*8), X19, K7, X1                   // 62f16507e18cd1f9ffffff or 62f1e507e18cd1f9ffffff
-       //TODO: VPSRAW X2, Y31, K6, Y30                            // 62610526e1f2 or 62618526e1f2
-       //TODO: VPSRAW -17(BP)(SI*2), Y31, K6, Y30                 // 62610526e1b475efffffff or 62618526e1b475efffffff
-       //TODO: VPSRAW 7(AX)(CX*2), Y31, K6, Y30                   // 62610526e1b44807000000 or 62618526e1b44807000000
-       //TODO: VPSRAW X14, Z30, K3, Z20                           // 62c10d43e1e6 or 62c18d43e1e6
-       //TODO: VPSRAW 15(R8)(R14*1), Z30, K3, Z20                 // 62810d43e1a4300f000000 or 62818d43e1a4300f000000
-       //TODO: VPSRAW 15(R8)(R14*2), Z30, K3, Z20                 // 62810d43e1a4700f000000 or 62818d43e1a4700f000000
-       //TODO: VPSRAW X14, Z5, K3, Z20                            // 62c1554be1e6 or 62c1d54be1e6
-       //TODO: VPSRAW 15(R8)(R14*1), Z5, K3, Z20                  // 6281554be1a4300f000000 or 6281d54be1a4300f000000
-       //TODO: VPSRAW 15(R8)(R14*2), Z5, K3, Z20                  // 6281554be1a4700f000000 or 6281d54be1a4700f000000
-       //TODO: VPSRAW X14, Z30, K3, Z9                            // 62510d43e1ce or 62518d43e1ce
-       //TODO: VPSRAW 15(R8)(R14*1), Z30, K3, Z9                  // 62110d43e18c300f000000 or 62118d43e18c300f000000
-       //TODO: VPSRAW 15(R8)(R14*2), Z30, K3, Z9                  // 62110d43e18c700f000000 or 62118d43e18c700f000000
-       //TODO: VPSRAW X14, Z5, K3, Z9                             // 6251554be1ce or 6251d54be1ce
-       //TODO: VPSRAW 15(R8)(R14*1), Z5, K3, Z9                   // 6211554be18c300f000000 or 6211d54be18c300f000000
-       //TODO: VPSRAW 15(R8)(R14*2), Z5, K3, Z9                   // 6211554be18c700f000000 or 6211d54be18c700f000000
-       //TODO: VPSRLDQ $94, -7(CX)(DX*1), X9                      // 62f13508739c11f9ffffff5e or 62f1b508739c11f9ffffff5e
-       //TODO: VPSRLDQ $94, -15(R14)(R15*4), X9                   // 62913508739cbef1ffffff5e or 6291b508739cbef1ffffff5e
-       //TODO: VPSRLDQ $121, Y28, Y0                              // 62917d2873dc79 or 6291fd2873dc79
-       //TODO: VPSRLDQ $121, (AX), Y0                             // 62f17d28731879 or 62f1fd28731879
-       //TODO: VPSRLDQ $121, 7(SI), Y0                            // 62f17d28739e0700000079 or 62f1fd28739e0700000079
-       //TODO: VPSRLDQ $13, Z21, Z12                              // 62b11d4873dd0d or 62b19d4873dd0d
-       //TODO: VPSRLDQ $13, Z9, Z12                               // 62d11d4873d90d or 62d19d4873d90d
-       //TODO: VPSRLDQ $13, 17(SP)(BP*1), Z12                     // 62f11d48739c2c110000000d or 62f19d48739c2c110000000d
-       //TODO: VPSRLDQ $13, -7(CX)(DX*8), Z12                     // 62f11d48739cd1f9ffffff0d or 62f19d48739cd1f9ffffff0d
-       //TODO: VPSRLDQ $13, Z21, Z13                              // 62b1154873dd0d or 62b1954873dd0d
-       //TODO: VPSRLDQ $13, Z9, Z13                               // 62d1154873d90d or 62d1954873d90d
-       //TODO: VPSRLDQ $13, 17(SP)(BP*1), Z13                     // 62f11548739c2c110000000d or 62f19548739c2c110000000d
-       //TODO: VPSRLDQ $13, -7(CX)(DX*8), Z13                     // 62f11548739cd1f9ffffff0d or 62f19548739cd1f9ffffff0d
-       //TODO: VPSRLVW X30, X23, K1, X12                          // 6212c50110e6
-       //TODO: VPSRLVW 7(AX)(CX*4), X23, K1, X12                  // 6272c50110a48807000000
-       //TODO: VPSRLVW 7(AX)(CX*1), X23, K1, X12                  // 6272c50110a40807000000
-       //TODO: VPSRLVW Y3, Y22, K1, Y12                           // 6272cd2110e3
-       //TODO: VPSRLVW 17(SP)(BP*1), Y22, K1, Y12                 // 6272cd2110a42c11000000
-       //TODO: VPSRLVW -7(CX)(DX*8), Y22, K1, Y12                 // 6272cd2110a4d1f9ffffff
-       //TODO: VPSRLVW Z14, Z15, K1, Z0                           // 62d2854910c6
-       //TODO: VPSRLVW Z27, Z15, K1, Z0                           // 6292854910c3
-       //TODO: VPSRLVW 99(R15)(R15*4), Z15, K1, Z0                // 629285491084bf63000000
-       //TODO: VPSRLVW 15(DX), Z15, K1, Z0                        // 62f2854910820f000000
-       //TODO: VPSRLVW Z14, Z12, K1, Z0                           // 62d29d4910c6
-       //TODO: VPSRLVW Z27, Z12, K1, Z0                           // 62929d4910c3
-       //TODO: VPSRLVW 99(R15)(R15*4), Z12, K1, Z0                // 62929d491084bf63000000
-       //TODO: VPSRLVW 15(DX), Z12, K1, Z0                        // 62f29d4910820f000000
-       //TODO: VPSRLVW Z14, Z15, K1, Z8                           // 6252854910c6
-       //TODO: VPSRLVW Z27, Z15, K1, Z8                           // 6212854910c3
-       //TODO: VPSRLVW 99(R15)(R15*4), Z15, K1, Z8                // 621285491084bf63000000
-       //TODO: VPSRLVW 15(DX), Z15, K1, Z8                        // 6272854910820f000000
-       //TODO: VPSRLVW Z14, Z12, K1, Z8                           // 62529d4910c6
-       //TODO: VPSRLVW Z27, Z12, K1, Z8                           // 62129d4910c3
-       //TODO: VPSRLVW 99(R15)(R15*4), Z12, K1, Z8                // 62129d491084bf63000000
-       //TODO: VPSRLVW 15(DX), Z12, K1, Z8                        // 62729d4910820f000000
-       //TODO: VPSRLW $0, X20, K7, X8                             // 62b13d0f71d400 or 62b1bd0f71d400
-       //TODO: VPSRLW $0, (SI), K7, X8                            // 62f13d0f711600 or 62f1bd0f711600
-       //TODO: VPSRLW $0, 7(SI)(DI*2), K7, X8                     // 62f13d0f71947e0700000000 or 62f1bd0f71947e0700000000
-       //TODO: VPSRLW $97, Y1, K2, Y15                            // 62f1052a71d161 or 62f1852a71d161
-       //TODO: VPSRLW $97, -17(BP)(SI*2), K2, Y15                 // 62f1052a719475efffffff61 or 62f1852a719475efffffff61
-       //TODO: VPSRLW $97, 7(AX)(CX*2), K2, Y15                   // 62f1052a7194480700000061 or 62f1852a7194480700000061
-       //TODO: VPSRLW $81, Z13, K4, Z11                           // 62d1254c71d551 or 62d1a54c71d551
-       //TODO: VPSRLW $81, Z14, K4, Z11                           // 62d1254c71d651 or 62d1a54c71d651
-       //TODO: VPSRLW $81, (CX), K4, Z11                          // 62f1254c711151 or 62f1a54c711151
-       //TODO: VPSRLW $81, 99(R15), K4, Z11                       // 62d1254c71976300000051 or 62d1a54c71976300000051
-       //TODO: VPSRLW $81, Z13, K4, Z5                            // 62d1554c71d551 or 62d1d54c71d551
-       //TODO: VPSRLW $81, Z14, K4, Z5                            // 62d1554c71d651 or 62d1d54c71d651
-       //TODO: VPSRLW $81, (CX), K4, Z5                           // 62f1554c711151 or 62f1d54c711151
-       //TODO: VPSRLW $81, 99(R15), K4, Z5                        // 62d1554c71976300000051 or 62d1d54c71976300000051
-       //TODO: VPSRLW X26, X9, K1, X2                             // 62913509d1d2 or 6291b509d1d2
-       //TODO: VPSRLW 17(SP)(BP*8), X9, K1, X2                    // 62f13509d194ec11000000 or 62f1b509d194ec11000000
-       //TODO: VPSRLW 17(SP)(BP*4), X9, K1, X2                    // 62f13509d194ac11000000 or 62f1b509d194ac11000000
-       //TODO: VPSRLW X19, Y19, K3, Y27                           // 62216523d1db or 6221e523d1db
-       //TODO: VPSRLW 7(SI)(DI*4), Y19, K3, Y27                   // 62616523d19cbe07000000 or 6261e523d19cbe07000000
-       //TODO: VPSRLW -7(DI)(R8*2), Y19, K3, Y27                  // 62216523d19c47f9ffffff or 6221e523d19c47f9ffffff
-       //TODO: VPSRLW X0, Z2, K4, Z5                              // 62f16d4cd1e8 or 62f1ed4cd1e8
-       //TODO: VPSRLW 17(SP), Z2, K4, Z5                          // 62f16d4cd1ac2411000000 or 62f1ed4cd1ac2411000000
-       //TODO: VPSRLW -17(BP)(SI*4), Z2, K4, Z5                   // 62f16d4cd1acb5efffffff or 62f1ed4cd1acb5efffffff
-       //TODO: VPSRLW X0, Z2, K4, Z23                             // 62e16d4cd1f8 or 62e1ed4cd1f8
-       //TODO: VPSRLW 17(SP), Z2, K4, Z23                         // 62e16d4cd1bc2411000000 or 62e1ed4cd1bc2411000000
-       //TODO: VPSRLW -17(BP)(SI*4), Z2, K4, Z23                  // 62e16d4cd1bcb5efffffff or 62e1ed4cd1bcb5efffffff
-       //TODO: VPSUBB X7, X16, K5, X31                            // 62617d05f8ff or 6261fd05f8ff
-       //TODO: VPSUBB 7(AX), X16, K5, X31                         // 62617d05f8b807000000 or 6261fd05f8b807000000
-       //TODO: VPSUBB (DI), X16, K5, X31                          // 62617d05f83f or 6261fd05f83f
-       //TODO: VPSUBB Y13, Y17, K7, Y5                            // 62d17527f8ed or 62d1f527f8ed
-       //TODO: VPSUBB 15(R8)(R14*1), Y17, K7, Y5                  // 62917527f8ac300f000000 or 6291f527f8ac300f000000
-       //TODO: VPSUBB 15(R8)(R14*2), Y17, K7, Y5                  // 62917527f8ac700f000000 or 6291f527f8ac700f000000
-       //TODO: VPSUBB Z28, Z26, K7, Z6                            // 62912d47f8f4 or 6291ad47f8f4
-       //TODO: VPSUBB Z6, Z26, K7, Z6                             // 62f12d47f8f6 or 62f1ad47f8f6
-       //TODO: VPSUBB 99(R15)(R15*2), Z26, K7, Z6                 // 62912d47f8b47f63000000 or 6291ad47f8b47f63000000
-       //TODO: VPSUBB -7(DI), Z26, K7, Z6                         // 62f12d47f8b7f9ffffff or 62f1ad47f8b7f9ffffff
-       //TODO: VPSUBB Z28, Z14, K7, Z6                            // 62910d4ff8f4 or 62918d4ff8f4
-       //TODO: VPSUBB Z6, Z14, K7, Z6                             // 62f10d4ff8f6 or 62f18d4ff8f6
-       //TODO: VPSUBB 99(R15)(R15*2), Z14, K7, Z6                 // 62910d4ff8b47f63000000 or 62918d4ff8b47f63000000
-       //TODO: VPSUBB -7(DI), Z14, K7, Z6                         // 62f10d4ff8b7f9ffffff or 62f18d4ff8b7f9ffffff
-       //TODO: VPSUBB Z28, Z26, K7, Z14                           // 62112d47f8f4 or 6211ad47f8f4
-       //TODO: VPSUBB Z6, Z26, K7, Z14                            // 62712d47f8f6 or 6271ad47f8f6
-       //TODO: VPSUBB 99(R15)(R15*2), Z26, K7, Z14                // 62112d47f8b47f63000000 or 6211ad47f8b47f63000000
-       //TODO: VPSUBB -7(DI), Z26, K7, Z14                        // 62712d47f8b7f9ffffff or 6271ad47f8b7f9ffffff
-       //TODO: VPSUBB Z28, Z14, K7, Z14                           // 62110d4ff8f4 or 62118d4ff8f4
-       //TODO: VPSUBB Z6, Z14, K7, Z14                            // 62710d4ff8f6 or 62718d4ff8f6
-       //TODO: VPSUBB 99(R15)(R15*2), Z14, K7, Z14                // 62110d4ff8b47f63000000 or 62118d4ff8b47f63000000
-       //TODO: VPSUBB -7(DI), Z14, K7, Z14                        // 62710d4ff8b7f9ffffff or 62718d4ff8b7f9ffffff
-       //TODO: VPSUBSB X28, X0, K2, X21                           // 62817d0ae8ec or 6281fd0ae8ec
-       //TODO: VPSUBSB 7(SI)(DI*8), X0, K2, X21                   // 62e17d0ae8acfe07000000 or 62e1fd0ae8acfe07000000
-       //TODO: VPSUBSB -15(R14), X0, K2, X21                      // 62c17d0ae8aef1ffffff or 62c1fd0ae8aef1ffffff
-       //TODO: VPSUBSB Y24, Y11, K5, Y8                           // 6211252de8c0 or 6211a52de8c0
-       //TODO: VPSUBSB (CX), Y11, K5, Y8                          // 6271252de801 or 6271a52de801
-       //TODO: VPSUBSB 99(R15), Y11, K5, Y8                       // 6251252de88763000000 or 6251a52de88763000000
-       //TODO: VPSUBSB Z23, Z23, K3, Z27                          // 62214543e8df or 6221c543e8df
-       //TODO: VPSUBSB Z6, Z23, K3, Z27                           // 62614543e8de or 6261c543e8de
-       //TODO: VPSUBSB -17(BP), Z23, K3, Z27                      // 62614543e89defffffff or 6261c543e89defffffff
-       //TODO: VPSUBSB -15(R14)(R15*8), Z23, K3, Z27              // 62014543e89cfef1ffffff or 6201c543e89cfef1ffffff
-       //TODO: VPSUBSB Z23, Z5, K3, Z27                           // 6221554be8df or 6221d54be8df
-       //TODO: VPSUBSB Z6, Z5, K3, Z27                            // 6261554be8de or 6261d54be8de
-       //TODO: VPSUBSB -17(BP), Z5, K3, Z27                       // 6261554be89defffffff or 6261d54be89defffffff
-       //TODO: VPSUBSB -15(R14)(R15*8), Z5, K3, Z27               // 6201554be89cfef1ffffff or 6201d54be89cfef1ffffff
-       //TODO: VPSUBSB Z23, Z23, K3, Z15                          // 62314543e8ff or 6231c543e8ff
-       //TODO: VPSUBSB Z6, Z23, K3, Z15                           // 62714543e8fe or 6271c543e8fe
-       //TODO: VPSUBSB -17(BP), Z23, K3, Z15                      // 62714543e8bdefffffff or 6271c543e8bdefffffff
-       //TODO: VPSUBSB -15(R14)(R15*8), Z23, K3, Z15              // 62114543e8bcfef1ffffff or 6211c543e8bcfef1ffffff
-       //TODO: VPSUBSB Z23, Z5, K3, Z15                           // 6231554be8ff or 6231d54be8ff
-       //TODO: VPSUBSB Z6, Z5, K3, Z15                            // 6271554be8fe or 6271d54be8fe
-       //TODO: VPSUBSB -17(BP), Z5, K3, Z15                       // 6271554be8bdefffffff or 6271d54be8bdefffffff
-       //TODO: VPSUBSB -15(R14)(R15*8), Z5, K3, Z15               // 6211554be8bcfef1ffffff or 6211d54be8bcfef1ffffff
-       //TODO: VPSUBSW X19, X7, K4, X22                           // 62a1450ce9f3 or 62a1c50ce9f3
-       //TODO: VPSUBSW 7(SI)(DI*1), X7, K4, X22                   // 62e1450ce9b43e07000000 or 62e1c50ce9b43e07000000
-       //TODO: VPSUBSW 15(DX)(BX*8), X7, K4, X22                  // 62e1450ce9b4da0f000000 or 62e1c50ce9b4da0f000000
-       //TODO: VPSUBSW Y21, Y24, K2, Y5                           // 62b13d22e9ed or 62b1bd22e9ed
-       //TODO: VPSUBSW 99(R15)(R15*2), Y24, K2, Y5                // 62913d22e9ac7f63000000 or 6291bd22e9ac7f63000000
-       //TODO: VPSUBSW -7(DI), Y24, K2, Y5                        // 62f13d22e9aff9ffffff or 62f1bd22e9aff9ffffff
-       //TODO: VPSUBSW Z16, Z21, K2, Z8                           // 62315542e9c0 or 6231d542e9c0
-       //TODO: VPSUBSW Z13, Z21, K2, Z8                           // 62515542e9c5 or 6251d542e9c5
-       //TODO: VPSUBSW 17(SP)(BP*2), Z21, K2, Z8                  // 62715542e9846c11000000 or 6271d542e9846c11000000
-       //TODO: VPSUBSW -7(DI)(R8*4), Z21, K2, Z8                  // 62315542e98487f9ffffff or 6231d542e98487f9ffffff
-       //TODO: VPSUBSW Z16, Z5, K2, Z8                            // 6231554ae9c0 or 6231d54ae9c0
-       //TODO: VPSUBSW Z13, Z5, K2, Z8                            // 6251554ae9c5 or 6251d54ae9c5
-       //TODO: VPSUBSW 17(SP)(BP*2), Z5, K2, Z8                   // 6271554ae9846c11000000 or 6271d54ae9846c11000000
-       //TODO: VPSUBSW -7(DI)(R8*4), Z5, K2, Z8                   // 6231554ae98487f9ffffff or 6231d54ae98487f9ffffff
-       //TODO: VPSUBSW Z16, Z21, K2, Z28                          // 62215542e9e0 or 6221d542e9e0
-       //TODO: VPSUBSW Z13, Z21, K2, Z28                          // 62415542e9e5 or 6241d542e9e5
-       //TODO: VPSUBSW 17(SP)(BP*2), Z21, K2, Z28                 // 62615542e9a46c11000000 or 6261d542e9a46c11000000
-       //TODO: VPSUBSW -7(DI)(R8*4), Z21, K2, Z28                 // 62215542e9a487f9ffffff or 6221d542e9a487f9ffffff
-       //TODO: VPSUBSW Z16, Z5, K2, Z28                           // 6221554ae9e0 or 6221d54ae9e0
-       //TODO: VPSUBSW Z13, Z5, K2, Z28                           // 6241554ae9e5 or 6241d54ae9e5
-       //TODO: VPSUBSW 17(SP)(BP*2), Z5, K2, Z28                  // 6261554ae9a46c11000000 or 6261d54ae9a46c11000000
-       //TODO: VPSUBSW -7(DI)(R8*4), Z5, K2, Z28                  // 6221554ae9a487f9ffffff or 6221d54ae9a487f9ffffff
-       //TODO: VPSUBUSB X31, X16, K3, X7                          // 62917d03d8ff or 6291fd03d8ff
-       //TODO: VPSUBUSB -7(DI)(R8*1), X16, K3, X7                 // 62b17d03d8bc07f9ffffff or 62b1fd03d8bc07f9ffffff
-       //TODO: VPSUBUSB (SP), X16, K3, X7                         // 62f17d03d83c24 or 62f1fd03d83c24
-       //TODO: VPSUBUSB Y13, Y9, K3, Y16                          // 62c1352bd8c5 or 62c1b52bd8c5
-       //TODO: VPSUBUSB -7(CX)(DX*1), Y9, K3, Y16                 // 62e1352bd88411f9ffffff or 62e1b52bd88411f9ffffff
-       //TODO: VPSUBUSB -15(R14)(R15*4), Y9, K3, Y16              // 6281352bd884bef1ffffff or 6281b52bd884bef1ffffff
-       //TODO: VPSUBUSB Z6, Z22, K3, Z12                          // 62714d43d8e6 or 6271cd43d8e6
-       //TODO: VPSUBUSB Z8, Z22, K3, Z12                          // 62514d43d8e0 or 6251cd43d8e0
-       //TODO: VPSUBUSB 15(R8), Z22, K3, Z12                      // 62514d43d8a00f000000 or 6251cd43d8a00f000000
-       //TODO: VPSUBUSB (BP), Z22, K3, Z12                        // 62714d43d86500 or 6271cd43d86500
-       //TODO: VPSUBUSB Z6, Z11, K3, Z12                          // 6271254bd8e6 or 6271a54bd8e6
-       //TODO: VPSUBUSB Z8, Z11, K3, Z12                          // 6251254bd8e0 or 6251a54bd8e0
-       //TODO: VPSUBUSB 15(R8), Z11, K3, Z12                      // 6251254bd8a00f000000 or 6251a54bd8a00f000000
-       //TODO: VPSUBUSB (BP), Z11, K3, Z12                        // 6271254bd86500 or 6271a54bd86500
-       //TODO: VPSUBUSB Z6, Z22, K3, Z27                          // 62614d43d8de or 6261cd43d8de
-       //TODO: VPSUBUSB Z8, Z22, K3, Z27                          // 62414d43d8d8 or 6241cd43d8d8
-       //TODO: VPSUBUSB 15(R8), Z22, K3, Z27                      // 62414d43d8980f000000 or 6241cd43d8980f000000
-       //TODO: VPSUBUSB (BP), Z22, K3, Z27                        // 62614d43d85d00 or 6261cd43d85d00
-       //TODO: VPSUBUSB Z6, Z11, K3, Z27                          // 6261254bd8de or 6261a54bd8de
-       //TODO: VPSUBUSB Z8, Z11, K3, Z27                          // 6241254bd8d8 or 6241a54bd8d8
-       //TODO: VPSUBUSB 15(R8), Z11, K3, Z27                      // 6241254bd8980f000000 or 6241a54bd8980f000000
-       //TODO: VPSUBUSB (BP), Z11, K3, Z27                        // 6261254bd85d00 or 6261a54bd85d00
-       //TODO: VPSUBUSW X9, X7, K2, X1                            // 62d1450ad9c9 or 62d1c50ad9c9
-       //TODO: VPSUBUSW -7(CX), X7, K2, X1                        // 62f1450ad989f9ffffff or 62f1c50ad989f9ffffff
-       //TODO: VPSUBUSW 15(DX)(BX*4), X7, K2, X1                  // 62f1450ad98c9a0f000000 or 62f1c50ad98c9a0f000000
-       //TODO: VPSUBUSW Y3, Y6, K1, Y9                            // 62714d29d9cb or 6271cd29d9cb
-       //TODO: VPSUBUSW 15(DX)(BX*1), Y6, K1, Y9                  // 62714d29d98c1a0f000000 or 6271cd29d98c1a0f000000
-       //TODO: VPSUBUSW -7(CX)(DX*2), Y6, K1, Y9                  // 62714d29d98c51f9ffffff or 6271cd29d98c51f9ffffff
-       //TODO: VPSUBUSW Z9, Z12, K2, Z25                          // 62411d4ad9c9 or 62419d4ad9c9
-       //TODO: VPSUBUSW Z12, Z12, K2, Z25                         // 62411d4ad9cc or 62419d4ad9cc
-       //TODO: VPSUBUSW 15(R8)(R14*8), Z12, K2, Z25               // 62011d4ad98cf00f000000 or 62019d4ad98cf00f000000
-       //TODO: VPSUBUSW -15(R14)(R15*2), Z12, K2, Z25             // 62011d4ad98c7ef1ffffff or 62019d4ad98c7ef1ffffff
-       //TODO: VPSUBUSW Z9, Z17, K2, Z25                          // 62417542d9c9 or 6241f542d9c9
-       //TODO: VPSUBUSW Z12, Z17, K2, Z25                         // 62417542d9cc or 6241f542d9cc
-       //TODO: VPSUBUSW 15(R8)(R14*8), Z17, K2, Z25               // 62017542d98cf00f000000 or 6201f542d98cf00f000000
-       //TODO: VPSUBUSW -15(R14)(R15*2), Z17, K2, Z25             // 62017542d98c7ef1ffffff or 6201f542d98c7ef1ffffff
-       //TODO: VPSUBUSW Z9, Z12, K2, Z12                          // 62511d4ad9e1 or 62519d4ad9e1
-       //TODO: VPSUBUSW Z12, Z12, K2, Z12                         // 62511d4ad9e4 or 62519d4ad9e4
-       //TODO: VPSUBUSW 15(R8)(R14*8), Z12, K2, Z12               // 62111d4ad9a4f00f000000 or 62119d4ad9a4f00f000000
-       //TODO: VPSUBUSW -15(R14)(R15*2), Z12, K2, Z12             // 62111d4ad9a47ef1ffffff or 62119d4ad9a47ef1ffffff
-       //TODO: VPSUBUSW Z9, Z17, K2, Z12                          // 62517542d9e1 or 6251f542d9e1
-       //TODO: VPSUBUSW Z12, Z17, K2, Z12                         // 62517542d9e4 or 6251f542d9e4
-       //TODO: VPSUBUSW 15(R8)(R14*8), Z17, K2, Z12               // 62117542d9a4f00f000000 or 6211f542d9a4f00f000000
-       //TODO: VPSUBUSW -15(R14)(R15*2), Z17, K2, Z12             // 62117542d9a47ef1ffffff or 6211f542d9a47ef1ffffff
-       //TODO: VPSUBW X0, X12, K1, X15                            // 62711d09f9f8 or 62719d09f9f8
-       //TODO: VPSUBW 99(R15)(R15*8), X12, K1, X15                // 62111d09f9bcff63000000 or 62119d09f9bcff63000000
-       //TODO: VPSUBW 7(AX)(CX*8), X12, K1, X15                   // 62711d09f9bcc807000000 or 62719d09f9bcc807000000
-       //TODO: VPSUBW Y26, Y6, K7, Y7                             // 62914d2ff9fa or 6291cd2ff9fa
-       //TODO: VPSUBW -17(BP), Y6, K7, Y7                         // 62f14d2ff9bdefffffff or 62f1cd2ff9bdefffffff
-       //TODO: VPSUBW -15(R14)(R15*8), Y6, K7, Y7                 // 62914d2ff9bcfef1ffffff or 6291cd2ff9bcfef1ffffff
-       //TODO: VPSUBW Z8, Z3, K1, Z6                              // 62d16549f9f0 or 62d1e549f9f0
-       //TODO: VPSUBW Z2, Z3, K1, Z6                              // 62f16549f9f2 or 62f1e549f9f2
-       //TODO: VPSUBW -15(R14)(R15*1), Z3, K1, Z6                 // 62916549f9b43ef1ffffff or 6291e549f9b43ef1ffffff
-       //TODO: VPSUBW -15(BX), Z3, K1, Z6                         // 62f16549f9b3f1ffffff or 62f1e549f9b3f1ffffff
-       //TODO: VPSUBW Z8, Z21, K1, Z6                             // 62d15541f9f0 or 62d1d541f9f0
-       //TODO: VPSUBW Z2, Z21, K1, Z6                             // 62f15541f9f2 or 62f1d541f9f2
-       //TODO: VPSUBW -15(R14)(R15*1), Z21, K1, Z6                // 62915541f9b43ef1ffffff or 6291d541f9b43ef1ffffff
-       //TODO: VPSUBW -15(BX), Z21, K1, Z6                        // 62f15541f9b3f1ffffff or 62f1d541f9b3f1ffffff
-       //TODO: VPSUBW Z8, Z3, K1, Z25                             // 62416549f9c8 or 6241e549f9c8
-       //TODO: VPSUBW Z2, Z3, K1, Z25                             // 62616549f9ca or 6261e549f9ca
-       //TODO: VPSUBW -15(R14)(R15*1), Z3, K1, Z25                // 62016549f98c3ef1ffffff or 6201e549f98c3ef1ffffff
-       //TODO: VPSUBW -15(BX), Z3, K1, Z25                        // 62616549f98bf1ffffff or 6261e549f98bf1ffffff
-       //TODO: VPSUBW Z8, Z21, K1, Z25                            // 62415541f9c8 or 6241d541f9c8
-       //TODO: VPSUBW Z2, Z21, K1, Z25                            // 62615541f9ca or 6261d541f9ca
-       //TODO: VPSUBW -15(R14)(R15*1), Z21, K1, Z25               // 62015541f98c3ef1ffffff or 6201d541f98c3ef1ffffff
-       //TODO: VPSUBW -15(BX), Z21, K1, Z25                       // 62615541f98bf1ffffff or 6261d541f98bf1ffffff
-       //TODO: VPTESTMB X26, X3, K3, K3                           // 6292650b26da
-       //TODO: VPTESTMB 15(R8)(R14*4), X3, K3, K3                 // 6292650b269cb00f000000
-       //TODO: VPTESTMB -7(CX)(DX*4), X3, K3, K3                  // 62f2650b269c91f9ffffff
-       //TODO: VPTESTMB X26, X3, K3, K1                           // 6292650b26ca
-       //TODO: VPTESTMB 15(R8)(R14*4), X3, K3, K1                 // 6292650b268cb00f000000
-       //TODO: VPTESTMB -7(CX)(DX*4), X3, K3, K1                  // 62f2650b268c91f9ffffff
-       //TODO: VPTESTMB Y3, Y18, K4, K5                           // 62f26d2426eb
-       //TODO: VPTESTMB 15(R8)(R14*8), Y18, K4, K5                // 62926d2426acf00f000000
-       //TODO: VPTESTMB -15(R14)(R15*2), Y18, K4, K5              // 62926d2426ac7ef1ffffff
-       //TODO: VPTESTMB Y3, Y18, K4, K4                           // 62f26d2426e3
-       //TODO: VPTESTMB 15(R8)(R14*8), Y18, K4, K4                // 62926d2426a4f00f000000
-       //TODO: VPTESTMB -15(R14)(R15*2), Y18, K4, K4              // 62926d2426a47ef1ffffff
-       //TODO: VPTESTMB Z11, Z12, K5, K7                          // 62d21d4d26fb
-       //TODO: VPTESTMB Z5, Z12, K5, K7                           // 62f21d4d26fd
-       //TODO: VPTESTMB 17(SP)(BP*8), Z12, K5, K7                 // 62f21d4d26bcec11000000
-       //TODO: VPTESTMB 17(SP)(BP*4), Z12, K5, K7                 // 62f21d4d26bcac11000000
-       //TODO: VPTESTMB Z11, Z22, K5, K7                          // 62d24d4526fb
-       //TODO: VPTESTMB Z5, Z22, K5, K7                           // 62f24d4526fd
-       //TODO: VPTESTMB 17(SP)(BP*8), Z22, K5, K7                 // 62f24d4526bcec11000000
-       //TODO: VPTESTMB 17(SP)(BP*4), Z22, K5, K7                 // 62f24d4526bcac11000000
-       //TODO: VPTESTMB Z11, Z12, K5, K6                          // 62d21d4d26f3
-       //TODO: VPTESTMB Z5, Z12, K5, K6                           // 62f21d4d26f5
-       //TODO: VPTESTMB 17(SP)(BP*8), Z12, K5, K6                 // 62f21d4d26b4ec11000000
-       //TODO: VPTESTMB 17(SP)(BP*4), Z12, K5, K6                 // 62f21d4d26b4ac11000000
-       //TODO: VPTESTMB Z11, Z22, K5, K6                          // 62d24d4526f3
-       //TODO: VPTESTMB Z5, Z22, K5, K6                           // 62f24d4526f5
-       //TODO: VPTESTMB 17(SP)(BP*8), Z22, K5, K6                 // 62f24d4526b4ec11000000
-       //TODO: VPTESTMB 17(SP)(BP*4), Z22, K5, K6                 // 62f24d4526b4ac11000000
-       //TODO: VPTESTMW X15, X9, K4, K6                           // 62d2b50c26f7
-       //TODO: VPTESTMW -17(BP)(SI*2), X9, K4, K6                 // 62f2b50c26b475efffffff
-       //TODO: VPTESTMW 7(AX)(CX*2), X9, K4, K6                   // 62f2b50c26b44807000000
-       //TODO: VPTESTMW X15, X9, K4, K4                           // 62d2b50c26e7
-       //TODO: VPTESTMW -17(BP)(SI*2), X9, K4, K4                 // 62f2b50c26a475efffffff
-       //TODO: VPTESTMW 7(AX)(CX*2), X9, K4, K4                   // 62f2b50c26a44807000000
-       //TODO: VPTESTMW Y8, Y14, K7, K4                           // 62d28d2f26e0
-       //TODO: VPTESTMW (SI), Y14, K7, K4                         // 62f28d2f2626
-       //TODO: VPTESTMW 7(SI)(DI*2), Y14, K7, K4                  // 62f28d2f26a47e07000000
-       //TODO: VPTESTMW Y8, Y14, K7, K6                           // 62d28d2f26f0
-       //TODO: VPTESTMW (SI), Y14, K7, K6                         // 62f28d2f2636
-       //TODO: VPTESTMW 7(SI)(DI*2), Y14, K7, K6                  // 62f28d2f26b47e07000000
-       //TODO: VPTESTMW Z1, Z6, K2, K4                            // 62f2cd4a26e1
-       //TODO: VPTESTMW Z15, Z6, K2, K4                           // 62d2cd4a26e7
-       //TODO: VPTESTMW 7(AX), Z6, K2, K4                         // 62f2cd4a26a007000000
-       //TODO: VPTESTMW (DI), Z6, K2, K4                          // 62f2cd4a2627
-       //TODO: VPTESTMW Z1, Z22, K2, K4                           // 62f2cd4226e1
-       //TODO: VPTESTMW Z15, Z22, K2, K4                          // 62d2cd4226e7
-       //TODO: VPTESTMW 7(AX), Z22, K2, K4                        // 62f2cd4226a007000000
-       //TODO: VPTESTMW (DI), Z22, K2, K4                         // 62f2cd422627
-       //TODO: VPTESTMW Z1, Z6, K2, K5                            // 62f2cd4a26e9
-       //TODO: VPTESTMW Z15, Z6, K2, K5                           // 62d2cd4a26ef
-       //TODO: VPTESTMW 7(AX), Z6, K2, K5                         // 62f2cd4a26a807000000
-       //TODO: VPTESTMW (DI), Z6, K2, K5                          // 62f2cd4a262f
-       //TODO: VPTESTMW Z1, Z22, K2, K5                           // 62f2cd4226e9
-       //TODO: VPTESTMW Z15, Z22, K2, K5                          // 62d2cd4226ef
-       //TODO: VPTESTMW 7(AX), Z22, K2, K5                        // 62f2cd4226a807000000
-       //TODO: VPTESTMW (DI), Z22, K2, K5                         // 62f2cd42262f
-       //TODO: VPTESTNMB X18, X26, K5, K2                         // 62b22e0526d2
-       //TODO: VPTESTNMB 15(R8)(R14*1), X26, K5, K2               // 62922e052694300f000000
-       //TODO: VPTESTNMB 15(R8)(R14*2), X26, K5, K2               // 62922e052694700f000000
-       //TODO: VPTESTNMB X18, X26, K5, K7                         // 62b22e0526fa
-       //TODO: VPTESTNMB 15(R8)(R14*1), X26, K5, K7               // 62922e0526bc300f000000
-       //TODO: VPTESTNMB 15(R8)(R14*2), X26, K5, K7               // 62922e0526bc700f000000
-       //TODO: VPTESTNMB Y11, Y20, K3, K0                         // 62d25e2326c3
-       //TODO: VPTESTNMB 17(SP)(BP*8), Y20, K3, K0                // 62f25e232684ec11000000
-       //TODO: VPTESTNMB 17(SP)(BP*4), Y20, K3, K0                // 62f25e232684ac11000000
-       //TODO: VPTESTNMB Y11, Y20, K3, K5                         // 62d25e2326eb
-       //TODO: VPTESTNMB 17(SP)(BP*8), Y20, K3, K5                // 62f25e2326acec11000000
-       //TODO: VPTESTNMB 17(SP)(BP*4), Y20, K3, K5                // 62f25e2326acac11000000
-       //TODO: VPTESTNMB Z18, Z13, K4, K6                         // 62b2164c26f2
-       //TODO: VPTESTNMB Z8, Z13, K4, K6                          // 62d2164c26f0
-       //TODO: VPTESTNMB 99(R15)(R15*1), Z13, K4, K6              // 6292164c26b43f63000000
-       //TODO: VPTESTNMB (DX), Z13, K4, K6                        // 62f2164c2632
-       //TODO: VPTESTNMB Z18, Z13, K4, K5                         // 62b2164c26ea
-       //TODO: VPTESTNMB Z8, Z13, K4, K5                          // 62d2164c26e8
-       //TODO: VPTESTNMB 99(R15)(R15*1), Z13, K4, K5              // 6292164c26ac3f63000000
-       //TODO: VPTESTNMB (DX), Z13, K4, K5                        // 62f2164c262a
-       //TODO: VPTESTNMW X7, X3, K1, K5                           // 62f2e60926ef
-       //TODO: VPTESTNMW (CX), X3, K1, K5                         // 62f2e6092629
-       //TODO: VPTESTNMW 99(R15), X3, K1, K5                      // 62d2e60926af63000000
-       //TODO: VPTESTNMW X7, X3, K1, K4                           // 62f2e60926e7
-       //TODO: VPTESTNMW (CX), X3, K1, K4                         // 62f2e6092621
-       //TODO: VPTESTNMW 99(R15), X3, K1, K4                      // 62d2e60926a763000000
-       //TODO: VPTESTNMW Y20, Y20, K2, K4                         // 62b2de2226e4
-       //TODO: VPTESTNMW 7(AX), Y20, K2, K4                       // 62f2de2226a007000000
-       //TODO: VPTESTNMW (DI), Y20, K2, K4                        // 62f2de222627
-       //TODO: VPTESTNMW Y20, Y20, K2, K6                         // 62b2de2226f4
-       //TODO: VPTESTNMW 7(AX), Y20, K2, K6                       // 62f2de2226b007000000
-       //TODO: VPTESTNMW (DI), Y20, K2, K6                        // 62f2de222637
-       //TODO: VPTESTNMW Z28, Z12, K1, K1                         // 62929e4926cc
-       //TODO: VPTESTNMW Z13, Z12, K1, K1                         // 62d29e4926cd
-       //TODO: VPTESTNMW 7(SI)(DI*1), Z12, K1, K1                 // 62f29e49268c3e07000000
-       //TODO: VPTESTNMW 15(DX)(BX*8), Z12, K1, K1                // 62f29e49268cda0f000000
-       //TODO: VPTESTNMW Z28, Z16, K1, K1                         // 6292fe4126cc
-       //TODO: VPTESTNMW Z13, Z16, K1, K1                         // 62d2fe4126cd
-       //TODO: VPTESTNMW 7(SI)(DI*1), Z16, K1, K1                 // 62f2fe41268c3e07000000
-       //TODO: VPTESTNMW 15(DX)(BX*8), Z16, K1, K1                // 62f2fe41268cda0f000000
-       //TODO: VPTESTNMW Z28, Z12, K1, K3                         // 62929e4926dc
-       //TODO: VPTESTNMW Z13, Z12, K1, K3                         // 62d29e4926dd
-       //TODO: VPTESTNMW 7(SI)(DI*1), Z12, K1, K3                 // 62f29e49269c3e07000000
-       //TODO: VPTESTNMW 15(DX)(BX*8), Z12, K1, K3                // 62f29e49269cda0f000000
-       //TODO: VPTESTNMW Z28, Z16, K1, K3                         // 6292fe4126dc
-       //TODO: VPTESTNMW Z13, Z16, K1, K3                         // 62d2fe4126dd
-       //TODO: VPTESTNMW 7(SI)(DI*1), Z16, K1, K3                 // 62f2fe41269c3e07000000
-       //TODO: VPTESTNMW 15(DX)(BX*8), Z16, K1, K3                // 62f2fe41269cda0f000000
-       //TODO: VPUNPCKHBW X24, X0, K7, X0                         // 62917d0f68c0 or 6291fd0f68c0
-       //TODO: VPUNPCKHBW 99(R15)(R15*2), X0, K7, X0              // 62917d0f68847f63000000 or 6291fd0f68847f63000000
-       //TODO: VPUNPCKHBW -7(DI), X0, K7, X0                      // 62f17d0f6887f9ffffff or 62f1fd0f6887f9ffffff
-       //TODO: VPUNPCKHBW Y28, Y28, K1, Y9                        // 62111d2168cc or 62119d2168cc
-       //TODO: VPUNPCKHBW 99(R15)(R15*1), Y28, K1, Y9             // 62111d21688c3f63000000 or 62119d21688c3f63000000
-       //TODO: VPUNPCKHBW (DX), Y28, K1, Y9                       // 62711d21680a or 62719d21680a
-       //TODO: VPUNPCKHBW Z15, Z3, K1, Z14                        // 6251654968f7 or 6251e54968f7
-       //TODO: VPUNPCKHBW Z30, Z3, K1, Z14                        // 6211654968f6 or 6211e54968f6
-       //TODO: VPUNPCKHBW -7(DI)(R8*1), Z3, K1, Z14               // 6231654968b407f9ffffff or 6231e54968b407f9ffffff
-       //TODO: VPUNPCKHBW (SP), Z3, K1, Z14                       // 62716549683424 or 6271e549683424
-       //TODO: VPUNPCKHBW Z15, Z12, K1, Z14                       // 62511d4968f7 or 62519d4968f7
-       //TODO: VPUNPCKHBW Z30, Z12, K1, Z14                       // 62111d4968f6 or 62119d4968f6
-       //TODO: VPUNPCKHBW -7(DI)(R8*1), Z12, K1, Z14              // 62311d4968b407f9ffffff or 62319d4968b407f9ffffff
-       //TODO: VPUNPCKHBW (SP), Z12, K1, Z14                      // 62711d49683424 or 62719d49683424
-       //TODO: VPUNPCKHBW Z15, Z3, K1, Z28                        // 6241654968e7 or 6241e54968e7
-       //TODO: VPUNPCKHBW Z30, Z3, K1, Z28                        // 6201654968e6 or 6201e54968e6
-       //TODO: VPUNPCKHBW -7(DI)(R8*1), Z3, K1, Z28               // 6221654968a407f9ffffff or 6221e54968a407f9ffffff
-       //TODO: VPUNPCKHBW (SP), Z3, K1, Z28                       // 62616549682424 or 6261e549682424
-       //TODO: VPUNPCKHBW Z15, Z12, K1, Z28                       // 62411d4968e7 or 62419d4968e7
-       //TODO: VPUNPCKHBW Z30, Z12, K1, Z28                       // 62011d4968e6 or 62019d4968e6
-       //TODO: VPUNPCKHBW -7(DI)(R8*1), Z12, K1, Z28              // 62211d4968a407f9ffffff or 62219d4968a407f9ffffff
-       //TODO: VPUNPCKHBW (SP), Z12, K1, Z28                      // 62611d49682424 or 62619d49682424
-       //TODO: VPUNPCKHWD X21, X3, K4, X31                        // 6221650c69fd or 6221e50c69fd
-       //TODO: VPUNPCKHWD -17(BP), X3, K4, X31                    // 6261650c69bdefffffff or 6261e50c69bdefffffff
-       //TODO: VPUNPCKHWD -15(R14)(R15*8), X3, K4, X31            // 6201650c69bcfef1ffffff or 6201e50c69bcfef1ffffff
-       //TODO: VPUNPCKHWD Y26, Y6, K5, Y12                        // 62114d2d69e2 or 6211cd2d69e2
-       //TODO: VPUNPCKHWD 7(SI)(DI*1), Y6, K5, Y12                // 62714d2d69a43e07000000 or 6271cd2d69a43e07000000
-       //TODO: VPUNPCKHWD 15(DX)(BX*8), Y6, K5, Y12               // 62714d2d69a4da0f000000 or 6271cd2d69a4da0f000000
-       //TODO: VPUNPCKHWD Z0, Z23, K7, Z20                        // 62e1454769e0 or 62e1c54769e0
-       //TODO: VPUNPCKHWD Z11, Z23, K7, Z20                       // 62c1454769e3 or 62c1c54769e3
-       //TODO: VPUNPCKHWD (AX), Z23, K7, Z20                      // 62e145476920 or 62e1c5476920
-       //TODO: VPUNPCKHWD 7(SI), Z23, K7, Z20                     // 62e1454769a607000000 or 62e1c54769a607000000
-       //TODO: VPUNPCKHWD Z0, Z19, K7, Z20                        // 62e1654769e0 or 62e1e54769e0
-       //TODO: VPUNPCKHWD Z11, Z19, K7, Z20                       // 62c1654769e3 or 62c1e54769e3
-       //TODO: VPUNPCKHWD (AX), Z19, K7, Z20                      // 62e165476920 or 62e1e5476920
-       //TODO: VPUNPCKHWD 7(SI), Z19, K7, Z20                     // 62e1654769a607000000 or 62e1e54769a607000000
-       //TODO: VPUNPCKHWD Z0, Z23, K7, Z0                         // 62f1454769c0 or 62f1c54769c0
-       //TODO: VPUNPCKHWD Z11, Z23, K7, Z0                        // 62d1454769c3 or 62d1c54769c3
-       //TODO: VPUNPCKHWD (AX), Z23, K7, Z0                       // 62f145476900 or 62f1c5476900
-       //TODO: VPUNPCKHWD 7(SI), Z23, K7, Z0                      // 62f14547698607000000 or 62f1c547698607000000
-       //TODO: VPUNPCKHWD Z0, Z19, K7, Z0                         // 62f1654769c0 or 62f1e54769c0
-       //TODO: VPUNPCKHWD Z11, Z19, K7, Z0                        // 62d1654769c3 or 62d1e54769c3
-       //TODO: VPUNPCKHWD (AX), Z19, K7, Z0                       // 62f165476900 or 62f1e5476900
-       //TODO: VPUNPCKHWD 7(SI), Z19, K7, Z0                      // 62f16547698607000000 or 62f1e547698607000000
-       //TODO: VPUNPCKLBW X13, X11, K7, X1                        // 62d1250f60cd or 62d1a50f60cd
-       //TODO: VPUNPCKLBW 17(SP)(BP*2), X11, K7, X1               // 62f1250f608c6c11000000 or 62f1a50f608c6c11000000
-       //TODO: VPUNPCKLBW -7(DI)(R8*4), X11, K7, X1               // 62b1250f608c87f9ffffff or 62b1a50f608c87f9ffffff
-       //TODO: VPUNPCKLBW Y28, Y8, K6, Y3                         // 62913d2e60dc or 6291bd2e60dc
-       //TODO: VPUNPCKLBW -7(DI)(R8*1), Y8, K6, Y3                // 62b13d2e609c07f9ffffff or 62b1bd2e609c07f9ffffff
-       //TODO: VPUNPCKLBW (SP), Y8, K6, Y3                        // 62f13d2e601c24 or 62f1bd2e601c24
-       //TODO: VPUNPCKLBW Z0, Z24, K3, Z0                         // 62f13d4360c0 or 62f1bd4360c0
-       //TODO: VPUNPCKLBW Z26, Z24, K3, Z0                        // 62913d4360c2 or 6291bd4360c2
-       //TODO: VPUNPCKLBW (BX), Z24, K3, Z0                       // 62f13d436003 or 62f1bd436003
-       //TODO: VPUNPCKLBW -17(BP)(SI*1), Z24, K3, Z0              // 62f13d43608435efffffff or 62f1bd43608435efffffff
-       //TODO: VPUNPCKLBW Z0, Z12, K3, Z0                         // 62f11d4b60c0 or 62f19d4b60c0
-       //TODO: VPUNPCKLBW Z26, Z12, K3, Z0                        // 62911d4b60c2 or 62919d4b60c2
-       //TODO: VPUNPCKLBW (BX), Z12, K3, Z0                       // 62f11d4b6003 or 62f19d4b6003
-       //TODO: VPUNPCKLBW -17(BP)(SI*1), Z12, K3, Z0              // 62f11d4b608435efffffff or 62f19d4b608435efffffff
-       //TODO: VPUNPCKLBW Z0, Z24, K3, Z25                        // 62613d4360c8 or 6261bd4360c8
-       //TODO: VPUNPCKLBW Z26, Z24, K3, Z25                       // 62013d4360ca or 6201bd4360ca
-       //TODO: VPUNPCKLBW (BX), Z24, K3, Z25                      // 62613d43600b or 6261bd43600b
-       //TODO: VPUNPCKLBW -17(BP)(SI*1), Z24, K3, Z25             // 62613d43608c35efffffff or 6261bd43608c35efffffff
-       //TODO: VPUNPCKLBW Z0, Z12, K3, Z25                        // 62611d4b60c8 or 62619d4b60c8
-       //TODO: VPUNPCKLBW Z26, Z12, K3, Z25                       // 62011d4b60ca or 62019d4b60ca
-       //TODO: VPUNPCKLBW (BX), Z12, K3, Z25                      // 62611d4b600b or 62619d4b600b
-       //TODO: VPUNPCKLBW -17(BP)(SI*1), Z12, K3, Z25             // 62611d4b608c35efffffff or 62619d4b608c35efffffff
-       //TODO: VPUNPCKLWD X8, X8, K3, X19                         // 62c13d0b61d8 or 62c1bd0b61d8
-       //TODO: VPUNPCKLWD -15(R14)(R15*1), X8, K3, X19            // 62813d0b619c3ef1ffffff or 6281bd0b619c3ef1ffffff
-       //TODO: VPUNPCKLWD -15(BX), X8, K3, X19                    // 62e13d0b619bf1ffffff or 62e1bd0b619bf1ffffff
-       //TODO: VPUNPCKLWD Y8, Y27, K4, Y22                        // 62c1252461f0 or 62c1a52461f0
-       //TODO: VPUNPCKLWD (AX), Y27, K4, Y22                      // 62e125246130 or 62e1a5246130
-       //TODO: VPUNPCKLWD 7(SI), Y27, K4, Y22                     // 62e1252461b607000000 or 62e1a52461b607000000
-       //TODO: VPUNPCKLWD Z6, Z21, K2, Z31                        // 6261554261fe or 6261d54261fe
-       //TODO: VPUNPCKLWD Z9, Z21, K2, Z31                        // 6241554261f9 or 6241d54261f9
-       //TODO: VPUNPCKLWD 17(SP)(BP*1), Z21, K2, Z31              // 6261554261bc2c11000000 or 6261d54261bc2c11000000
-       //TODO: VPUNPCKLWD -7(CX)(DX*8), Z21, K2, Z31              // 6261554261bcd1f9ffffff or 6261d54261bcd1f9ffffff
-       //TODO: VPUNPCKLWD Z6, Z9, K2, Z31                         // 6261354a61fe or 6261b54a61fe
-       //TODO: VPUNPCKLWD Z9, Z9, K2, Z31                         // 6241354a61f9 or 6241b54a61f9
-       //TODO: VPUNPCKLWD 17(SP)(BP*1), Z9, K2, Z31               // 6261354a61bc2c11000000 or 6261b54a61bc2c11000000
-       //TODO: VPUNPCKLWD -7(CX)(DX*8), Z9, K2, Z31               // 6261354a61bcd1f9ffffff or 6261b54a61bcd1f9ffffff
-       //TODO: VPUNPCKLWD Z6, Z21, K2, Z0                         // 62f1554261c6 or 62f1d54261c6
-       //TODO: VPUNPCKLWD Z9, Z21, K2, Z0                         // 62d1554261c1 or 62d1d54261c1
-       //TODO: VPUNPCKLWD 17(SP)(BP*1), Z21, K2, Z0               // 62f1554261842c11000000 or 62f1d54261842c11000000
-       //TODO: VPUNPCKLWD -7(CX)(DX*8), Z21, K2, Z0               // 62f155426184d1f9ffffff or 62f1d5426184d1f9ffffff
-       //TODO: VPUNPCKLWD Z6, Z9, K2, Z0                          // 62f1354a61c6 or 62f1b54a61c6
-       //TODO: VPUNPCKLWD Z9, Z9, K2, Z0                          // 62d1354a61c1 or 62d1b54a61c1
-       //TODO: VPUNPCKLWD 17(SP)(BP*1), Z9, K2, Z0                // 62f1354a61842c11000000 or 62f1b54a61842c11000000
-       //TODO: VPUNPCKLWD -7(CX)(DX*8), Z9, K2, Z0                // 62f1354a6184d1f9ffffff or 62f1b54a6184d1f9ffffff
+       KADDD K4, K7, K5                                   // c4e1c54aec
+       KADDD K6, K7, K5                                   // c4e1c54aee
+       KADDD K4, K6, K5                                   // c4e1cd4aec
+       KADDD K6, K6, K5                                   // c4e1cd4aee
+       KADDD K4, K7, K4                                   // c4e1c54ae4
+       KADDD K6, K7, K4                                   // c4e1c54ae6
+       KADDD K4, K6, K4                                   // c4e1cd4ae4
+       KADDD K6, K6, K4                                   // c4e1cd4ae6
+       KADDQ K4, K5, K0                                   // c4e1d44ac4
+       KADDQ K6, K5, K0                                   // c4e1d44ac6
+       KADDQ K4, K4, K0                                   // c4e1dc4ac4
+       KADDQ K6, K4, K0                                   // c4e1dc4ac6
+       KADDQ K4, K5, K7                                   // c4e1d44afc
+       KADDQ K6, K5, K7                                   // c4e1d44afe
+       KADDQ K4, K4, K7                                   // c4e1dc4afc
+       KADDQ K6, K4, K7                                   // c4e1dc4afe
+       KANDD K1, K6, K0                                   // c4e1cd41c1
+       KANDD K5, K6, K0                                   // c4e1cd41c5
+       KANDD K1, K5, K0                                   // c4e1d541c1
+       KANDD K5, K5, K0                                   // c4e1d541c5
+       KANDD K1, K6, K5                                   // c4e1cd41e9
+       KANDD K5, K6, K5                                   // c4e1cd41ed
+       KANDD K1, K5, K5                                   // c4e1d541e9
+       KANDD K5, K5, K5                                   // c4e1d541ed
+       KANDND K5, K0, K4                                  // c4e1fd42e5
+       KANDND K4, K0, K4                                  // c4e1fd42e4
+       KANDND K5, K7, K4                                  // c4e1c542e5
+       KANDND K4, K7, K4                                  // c4e1c542e4
+       KANDND K5, K0, K6                                  // c4e1fd42f5
+       KANDND K4, K0, K6                                  // c4e1fd42f4
+       KANDND K5, K7, K6                                  // c4e1c542f5
+       KANDND K4, K7, K6                                  // c4e1c542f4
+       KANDNQ K6, K1, K4                                  // c4e1f442e6
+       KANDNQ K7, K1, K4                                  // c4e1f442e7
+       KANDNQ K6, K3, K4                                  // c4e1e442e6
+       KANDNQ K7, K3, K4                                  // c4e1e442e7
+       KANDNQ K6, K1, K6                                  // c4e1f442f6
+       KANDNQ K7, K1, K6                                  // c4e1f442f7
+       KANDNQ K6, K3, K6                                  // c4e1e442f6
+       KANDNQ K7, K3, K6                                  // c4e1e442f7
+       KANDQ K6, K0, K2                                   // c4e1fc41d6
+       KANDQ K5, K0, K2                                   // c4e1fc41d5
+       KANDQ K6, K5, K2                                   // c4e1d441d6
+       KANDQ K5, K5, K2                                   // c4e1d441d5
+       KANDQ K6, K0, K7                                   // c4e1fc41fe
+       KANDQ K5, K0, K7                                   // c4e1fc41fd
+       KANDQ K6, K5, K7                                   // c4e1d441fe
+       KANDQ K5, K5, K7                                   // c4e1d441fd
+       KMOVD K1, 17(SP)                                   // c4e1f9914c2411
+       KMOVD K3, 17(SP)                                   // c4e1f9915c2411
+       KMOVD K1, -17(BP)(SI*4)                            // c4e1f9914cb5ef
+       KMOVD K3, -17(BP)(SI*4)                            // c4e1f9915cb5ef
+       KMOVD K6, R14                                      // c57b93f6
+       KMOVD K7, R14                                      // c57b93f7
+       KMOVD K6, AX                                       // c5fb93c6
+       KMOVD K7, AX                                       // c5fb93c7
+       KMOVD K4, K6                                       // c4e1f990f4
+       KMOVD K6, K6                                       // c4e1f990f6
+       KMOVD 7(AX), K6                                    // c4e1f9907007
+       KMOVD (DI), K6                                     // c4e1f99037
+       KMOVD K4, K4                                       // c4e1f990e4
+       KMOVD K6, K4                                       // c4e1f990e6
+       KMOVD 7(AX), K4                                    // c4e1f9906007
+       KMOVD (DI), K4                                     // c4e1f99027
+       KMOVD R9, K4                                       // c4c17b92e1
+       KMOVD CX, K4                                       // c5fb92e1
+       KMOVD R9, K5                                       // c4c17b92e9
+       KMOVD CX, K5                                       // c5fb92e9
+       KMOVQ K2, 17(SP)                                   // c4e1f891542411
+       KMOVQ K7, 17(SP)                                   // c4e1f8917c2411
+       KMOVQ K2, -17(BP)(SI*4)                            // c4e1f89154b5ef
+       KMOVQ K7, -17(BP)(SI*4)                            // c4e1f8917cb5ef
+       KMOVQ K0, DX                                       // c4e1fb93d0
+       KMOVQ K5, DX                                       // c4e1fb93d5
+       KMOVQ K0, BP                                       // c4e1fb93e8
+       KMOVQ K5, BP                                       // c4e1fb93ed
+       KMOVQ K1, K6                                       // c4e1f890f1
+       KMOVQ K5, K6                                       // c4e1f890f5
+       KMOVQ 7(AX), K6                                    // c4e1f8907007
+       KMOVQ (DI), K6                                     // c4e1f89037
+       KMOVQ K1, K5                                       // c4e1f890e9
+       KMOVQ K5, K5                                       // c4e1f890ed
+       KMOVQ 7(AX), K5                                    // c4e1f8906807
+       KMOVQ (DI), K5                                     // c4e1f8902f
+       KMOVQ R10, K3                                      // c4c1fb92da
+       KMOVQ CX, K3                                       // c4e1fb92d9
+       KMOVQ R10, K1                                      // c4c1fb92ca
+       KMOVQ CX, K1                                       // c4e1fb92c9
+       KNOTD K6, K6                                       // c4e1f944f6
+       KNOTD K4, K6                                       // c4e1f944f4
+       KNOTD K6, K7                                       // c4e1f944fe
+       KNOTD K4, K7                                       // c4e1f944fc
+       KNOTQ K4, K4                                       // c4e1f844e4
+       KNOTQ K5, K4                                       // c4e1f844e5
+       KNOTQ K4, K6                                       // c4e1f844f4
+       KNOTQ K5, K6                                       // c4e1f844f5
+       KORD K4, K7, K5                                    // c4e1c545ec
+       KORD K6, K7, K5                                    // c4e1c545ee
+       KORD K4, K6, K5                                    // c4e1cd45ec
+       KORD K6, K6, K5                                    // c4e1cd45ee
+       KORD K4, K7, K4                                    // c4e1c545e4
+       KORD K6, K7, K4                                    // c4e1c545e6
+       KORD K4, K6, K4                                    // c4e1cd45e4
+       KORD K6, K6, K4                                    // c4e1cd45e6
+       KORQ K4, K5, K0                                    // c4e1d445c4
+       KORQ K6, K5, K0                                    // c4e1d445c6
+       KORQ K4, K4, K0                                    // c4e1dc45c4
+       KORQ K6, K4, K0                                    // c4e1dc45c6
+       KORQ K4, K5, K7                                    // c4e1d445fc
+       KORQ K6, K5, K7                                    // c4e1d445fe
+       KORQ K4, K4, K7                                    // c4e1dc45fc
+       KORQ K6, K4, K7                                    // c4e1dc45fe
+       KORTESTD K4, K6                                    // c4e1f998f4
+       KORTESTD K6, K6                                    // c4e1f998f6
+       KORTESTD K4, K4                                    // c4e1f998e4
+       KORTESTD K6, K4                                    // c4e1f998e6
+       KORTESTQ K2, K4                                    // c4e1f898e2
+       KORTESTQ K7, K4                                    // c4e1f898e7
+       KORTESTQ K2, K5                                    // c4e1f898ea
+       KORTESTQ K7, K5                                    // c4e1f898ef
+       KSHIFTLD $0, K5, K0                                // c4e37933c500
+       KSHIFTLD $0, K4, K0                                // c4e37933c400
+       KSHIFTLD $0, K5, K7                                // c4e37933fd00
+       KSHIFTLD $0, K4, K7                                // c4e37933fc00
+       KSHIFTLQ $97, K1, K4                               // c4e3f933e161
+       KSHIFTLQ $97, K3, K4                               // c4e3f933e361
+       KSHIFTLQ $97, K1, K6                               // c4e3f933f161
+       KSHIFTLQ $97, K3, K6                               // c4e3f933f361
+       KSHIFTRD $79, K0, K2                               // c4e37931d04f
+       KSHIFTRD $79, K5, K2                               // c4e37931d54f
+       KSHIFTRD $79, K0, K7                               // c4e37931f84f
+       KSHIFTRD $79, K5, K7                               // c4e37931fd4f
+       KSHIFTRQ $64, K1, K6                               // c4e3f931f140
+       KSHIFTRQ $64, K5, K6                               // c4e3f931f540
+       KSHIFTRQ $64, K1, K5                               // c4e3f931e940
+       KSHIFTRQ $64, K5, K5                               // c4e3f931ed40
+       KTESTD K5, K0                                      // c4e1f999c5
+       KTESTD K4, K0                                      // c4e1f999c4
+       KTESTD K5, K7                                      // c4e1f999fd
+       KTESTD K4, K7                                      // c4e1f999fc
+       KTESTQ K1, K4                                      // c4e1f899e1
+       KTESTQ K3, K4                                      // c4e1f899e3
+       KTESTQ K1, K6                                      // c4e1f899f1
+       KTESTQ K3, K6                                      // c4e1f899f3
+       KUNPCKDQ K1, K6, K0                                // c4e1cc4bc1
+       KUNPCKDQ K5, K6, K0                                // c4e1cc4bc5
+       KUNPCKDQ K1, K5, K0                                // c4e1d44bc1
+       KUNPCKDQ K5, K5, K0                                // c4e1d44bc5
+       KUNPCKDQ K1, K6, K5                                // c4e1cc4be9
+       KUNPCKDQ K5, K6, K5                                // c4e1cc4bed
+       KUNPCKDQ K1, K5, K5                                // c4e1d44be9
+       KUNPCKDQ K5, K5, K5                                // c4e1d44bed
+       KUNPCKWD K7, K5, K3                                // c5d44bdf
+       KUNPCKWD K6, K5, K3                                // c5d44bde
+       KUNPCKWD K7, K4, K3                                // c5dc4bdf
+       KUNPCKWD K6, K4, K3                                // c5dc4bde
+       KUNPCKWD K7, K5, K1                                // c5d44bcf
+       KUNPCKWD K6, K5, K1                                // c5d44bce
+       KUNPCKWD K7, K4, K1                                // c5dc4bcf
+       KUNPCKWD K6, K4, K1                                // c5dc4bce
+       KXNORD K6, K1, K4                                  // c4e1f546e6
+       KXNORD K7, K1, K4                                  // c4e1f546e7
+       KXNORD K6, K3, K4                                  // c4e1e546e6
+       KXNORD K7, K3, K4                                  // c4e1e546e7
+       KXNORD K6, K1, K6                                  // c4e1f546f6
+       KXNORD K7, K1, K6                                  // c4e1f546f7
+       KXNORD K6, K3, K6                                  // c4e1e546f6
+       KXNORD K7, K3, K6                                  // c4e1e546f7
+       KXNORQ K4, K4, K6                                  // c4e1dc46f4
+       KXNORQ K5, K4, K6                                  // c4e1dc46f5
+       KXNORQ K4, K6, K6                                  // c4e1cc46f4
+       KXNORQ K5, K6, K6                                  // c4e1cc46f5
+       KXNORQ K4, K4, K4                                  // c4e1dc46e4
+       KXNORQ K5, K4, K4                                  // c4e1dc46e5
+       KXNORQ K4, K6, K4                                  // c4e1cc46e4
+       KXNORQ K5, K6, K4                                  // c4e1cc46e5
+       KXORD K0, K4, K7                                   // c4e1dd47f8
+       KXORD K7, K4, K7                                   // c4e1dd47ff
+       KXORD K0, K6, K7                                   // c4e1cd47f8
+       KXORD K7, K6, K7                                   // c4e1cd47ff
+       KXORD K0, K4, K6                                   // c4e1dd47f0
+       KXORD K7, K4, K6                                   // c4e1dd47f7
+       KXORD K0, K6, K6                                   // c4e1cd47f0
+       KXORD K7, K6, K6                                   // c4e1cd47f7
+       KXORQ K1, K4, K5                                   // c4e1dc47e9
+       KXORQ K3, K4, K5                                   // c4e1dc47eb
+       KXORQ K1, K6, K5                                   // c4e1cc47e9
+       KXORQ K3, K6, K5                                   // c4e1cc47eb
+       KXORQ K1, K4, K4                                   // c4e1dc47e1
+       KXORQ K3, K4, K4                                   // c4e1dc47e3
+       KXORQ K1, K6, K4                                   // c4e1cc47e1
+       KXORQ K3, K6, K4                                   // c4e1cc47e3
+       VDBPSADBW $65, X15, X17, K3, X5                    // 62d3750342ef41
+       VDBPSADBW $65, 7(AX)(CX*4), X17, K3, X5            // 62f3750342ac880700000041
+       VDBPSADBW $65, 7(AX)(CX*1), X17, K3, X5            // 62f3750342ac080700000041
+       VDBPSADBW $67, Y17, Y5, K4, Y19                    // 62a3552c42d943
+       VDBPSADBW $67, 99(R15)(R15*2), Y5, K4, Y19         // 6283552c429c7f6300000043
+       VDBPSADBW $67, -7(DI), Y5, K4, Y19                 // 62e3552c429ff9ffffff43
+       VDBPSADBW $127, Z3, Z5, K2, Z19                    // 62e3554a42db7f
+       VDBPSADBW $127, Z5, Z5, K2, Z19                    // 62e3554a42dd7f
+       VDBPSADBW $127, 17(SP)(BP*1), Z5, K2, Z19          // 62e3554a429c2c110000007f
+       VDBPSADBW $127, -7(CX)(DX*8), Z5, K2, Z19          // 62e3554a429cd1f9ffffff7f
+       VDBPSADBW $127, Z3, Z1, K2, Z19                    // 62e3754a42db7f
+       VDBPSADBW $127, Z5, Z1, K2, Z19                    // 62e3754a42dd7f
+       VDBPSADBW $127, 17(SP)(BP*1), Z1, K2, Z19          // 62e3754a429c2c110000007f
+       VDBPSADBW $127, -7(CX)(DX*8), Z1, K2, Z19          // 62e3754a429cd1f9ffffff7f
+       VDBPSADBW $127, Z3, Z5, K2, Z15                    // 6273554a42fb7f
+       VDBPSADBW $127, Z5, Z5, K2, Z15                    // 6273554a42fd7f
+       VDBPSADBW $127, 17(SP)(BP*1), Z5, K2, Z15          // 6273554a42bc2c110000007f
+       VDBPSADBW $127, -7(CX)(DX*8), Z5, K2, Z15          // 6273554a42bcd1f9ffffff7f
+       VDBPSADBW $127, Z3, Z1, K2, Z15                    // 6273754a42fb7f
+       VDBPSADBW $127, Z5, Z1, K2, Z15                    // 6273754a42fd7f
+       VDBPSADBW $127, 17(SP)(BP*1), Z1, K2, Z15          // 6273754a42bc2c110000007f
+       VDBPSADBW $127, -7(CX)(DX*8), Z1, K2, Z15          // 6273754a42bcd1f9ffffff7f
+       VMOVDQU16 X14, K1, X16                             // 6231ff097ff0
+       VMOVDQU16 X14, K1, -17(BP)(SI*2)                   // 6271ff097fb475efffffff
+       VMOVDQU16 X14, K1, 7(AX)(CX*2)                     // 6271ff097fb44807000000
+       VMOVDQU16 X14, K1, X11                             // 6251ff097ff3
+       VMOVDQU16 15(R8)(R14*1), K1, X11                   // 6211ff096f9c300f000000
+       VMOVDQU16 15(R8)(R14*2), K1, X11                   // 6211ff096f9c700f000000
+       VMOVDQU16 Y24, K7, Y18                             // 6221ff2f7fc2
+       VMOVDQU16 Y24, K7, 7(SI)(DI*4)                     // 6261ff2f7f84be07000000
+       VMOVDQU16 Y24, K7, -7(DI)(R8*2)                    // 6221ff2f7f8447f9ffffff
+       VMOVDQU16 Y11, K2, Y8                              // 6251ff2a7fd8
+       VMOVDQU16 17(SP), K2, Y8                           // 6271ff2a6f842411000000
+       VMOVDQU16 -17(BP)(SI*4), K2, Y8                    // 6271ff2a6f84b5efffffff
+       VMOVDQU16 Z6, K4, Z22                              // 62b1ff4c7ff6
+       VMOVDQU16 Z8, K4, Z22                              // 6231ff4c7fc6
+       VMOVDQU16 Z6, K4, Z11                              // 62d1ff4c7ff3
+       VMOVDQU16 Z8, K4, Z11                              // 6251ff4c7fc3
+       VMOVDQU16 Z6, K4, (CX)                             // 62f1ff4c7f31
+       VMOVDQU16 Z8, K4, (CX)                             // 6271ff4c7f01
+       VMOVDQU16 Z6, K4, 99(R15)                          // 62d1ff4c7fb763000000
+       VMOVDQU16 Z8, K4, 99(R15)                          // 6251ff4c7f8763000000
+       VMOVDQU16 Z12, K1, Z25                             // 6211ff497fe1
+       VMOVDQU16 Z17, K1, Z25                             // 6281ff497fc9
+       VMOVDQU16 99(R15)(R15*2), K1, Z25                  // 6201ff496f8c7f63000000
+       VMOVDQU16 -7(DI), K1, Z25                          // 6261ff496f8ff9ffffff
+       VMOVDQU16 Z12, K1, Z12                             // 6251ff497fe4
+       VMOVDQU16 Z17, K1, Z12                             // 62c1ff497fcc
+       VMOVDQU16 99(R15)(R15*2), K1, Z12                  // 6211ff496fa47f63000000
+       VMOVDQU16 -7(DI), K1, Z12                          // 6271ff496fa7f9ffffff
+       VMOVDQU8 X11, K5, X23                              // 62317f0d7fdf
+       VMOVDQU8 X11, K5, -7(CX)(DX*1)                     // 62717f0d7f9c11f9ffffff
+       VMOVDQU8 X11, K5, -15(R14)(R15*4)                  // 62117f0d7f9cbef1ffffff
+       VMOVDQU8 X24, K3, X31                              // 62017f0b7fc7
+       VMOVDQU8 15(DX)(BX*1), K3, X31                     // 62617f0b6fbc1a0f000000
+       VMOVDQU8 -7(CX)(DX*2), K3, X31                     // 62617f0b6fbc51f9ffffff
+       VMOVDQU8 Y3, K4, Y6                                // 62f17f2c7fde
+       VMOVDQU8 Y3, K4, 7(SI)(DI*1)                       // 62f17f2c7f9c3e07000000
+       VMOVDQU8 Y3, K4, 15(DX)(BX*8)                      // 62f17f2c7f9cda0f000000
+       VMOVDQU8 Y6, K2, Y7                                // 62f17f2a7ff7
+       VMOVDQU8 -7(DI)(R8*1), K2, Y7                      // 62b17f2a6fbc07f9ffffff
+       VMOVDQU8 (SP), K2, Y7                              // 62f17f2a6f3c24
+       VMOVDQU8 Z9, K2, Z3                                // 62717f4a7fcb
+       VMOVDQU8 Z19, K2, Z3                               // 62e17f4a7fdb
+       VMOVDQU8 Z9, K2, Z30                               // 62117f4a7fce
+       VMOVDQU8 Z19, K2, Z30                              // 62817f4a7fde
+       VMOVDQU8 Z9, K2, 15(R8)                            // 62517f4a7f880f000000
+       VMOVDQU8 Z19, K2, 15(R8)                           // 62c17f4a7f980f000000
+       VMOVDQU8 Z9, K2, (BP)                              // 62717f4a7f4d00
+       VMOVDQU8 Z19, K2, (BP)                             // 62e17f4a7f5d00
+       VMOVDQU8 Z11, K3, Z12                              // 62517f4b7fdc
+       VMOVDQU8 Z5, K3, Z12                               // 62d17f4b7fec
+       VMOVDQU8 15(R8)(R14*8), K3, Z12                    // 62117f4b6fa4f00f000000
+       VMOVDQU8 -15(R14)(R15*2), K3, Z12                  // 62117f4b6fa47ef1ffffff
+       VMOVDQU8 Z11, K3, Z22                              // 62317f4b7fde
+       VMOVDQU8 Z5, K3, Z22                               // 62b17f4b7fee
+       VMOVDQU8 15(R8)(R14*8), K3, Z22                    // 62817f4b6fb4f00f000000
+       VMOVDQU8 -15(R14)(R15*2), K3, Z22                  // 62817f4b6fb47ef1ffffff
+       VPABSB X22, K3, X6                                 // 62b27d0b1cf6 or 62b2fd0b1cf6
+       VPABSB -7(CX), K3, X6                              // 62f27d0b1cb1f9ffffff or 62f2fd0b1cb1f9ffffff
+       VPABSB 15(DX)(BX*4), K3, X6                        // 62f27d0b1cb49a0f000000 or 62f2fd0b1cb49a0f000000
+       VPABSB Y27, K4, Y11                                // 62127d2c1cdb or 6212fd2c1cdb
+       VPABSB 15(DX)(BX*1), K4, Y11                       // 62727d2c1c9c1a0f000000 or 6272fd2c1c9c1a0f000000
+       VPABSB -7(CX)(DX*2), K4, Y11                       // 62727d2c1c9c51f9ffffff or 6272fd2c1c9c51f9ffffff
+       VPABSB Z6, K5, Z21                                 // 62e27d4d1cee or 62e2fd4d1cee
+       VPABSB Z9, K5, Z21                                 // 62c27d4d1ce9 or 62c2fd4d1ce9
+       VPABSB (AX), K5, Z21                               // 62e27d4d1c28 or 62e2fd4d1c28
+       VPABSB 7(SI), K5, Z21                              // 62e27d4d1cae07000000 or 62e2fd4d1cae07000000
+       VPABSB Z6, K5, Z9                                  // 62727d4d1cce or 6272fd4d1cce
+       VPABSB Z9, K5, Z9                                  // 62527d4d1cc9 or 6252fd4d1cc9
+       VPABSB (AX), K5, Z9                                // 62727d4d1c08 or 6272fd4d1c08
+       VPABSB 7(SI), K5, Z9                               // 62727d4d1c8e07000000 or 6272fd4d1c8e07000000
+       VPABSW X11, K4, X15                                // 62527d0c1dfb or 6252fd0c1dfb
+       VPABSW (BX), K4, X15                               // 62727d0c1d3b or 6272fd0c1d3b
+       VPABSW -17(BP)(SI*1), K4, X15                      // 62727d0c1dbc35efffffff or 6272fd0c1dbc35efffffff
+       VPABSW Y3, K7, Y26                                 // 62627d2f1dd3 or 6262fd2f1dd3
+       VPABSW 15(R8), K7, Y26                             // 62427d2f1d900f000000 or 6242fd2f1d900f000000
+       VPABSW (BP), K7, Y26                               // 62627d2f1d5500 or 6262fd2f1d5500
+       VPABSW Z16, K2, Z7                                 // 62b27d4a1df8 or 62b2fd4a1df8
+       VPABSW Z25, K2, Z7                                 // 62927d4a1df9 or 6292fd4a1df9
+       VPABSW (R8), K2, Z7                                // 62d27d4a1d38 or 62d2fd4a1d38
+       VPABSW 15(DX)(BX*2), K2, Z7                        // 62f27d4a1dbc5a0f000000 or 62f2fd4a1dbc5a0f000000
+       VPABSW Z16, K2, Z21                                // 62a27d4a1de8 or 62a2fd4a1de8
+       VPABSW Z25, K2, Z21                                // 62827d4a1de9 or 6282fd4a1de9
+       VPABSW (R8), K2, Z21                               // 62c27d4a1d28 or 62c2fd4a1d28
+       VPABSW 15(DX)(BX*2), K2, Z21                       // 62e27d4a1dac5a0f000000 or 62e2fd4a1dac5a0f000000
+       VPACKSSDW X13, X19, K5, X1                         // 62d165056bcd
+       VPACKSSDW 15(R8)(R14*4), X19, K5, X1               // 629165056b8cb00f000000
+       VPACKSSDW -7(CX)(DX*4), X19, K5, X1                // 62f165056b8c91f9ffffff
+       VPACKSSDW Y1, Y28, K3, Y8                          // 62711d236bc1
+       VPACKSSDW 15(R8)(R14*8), Y28, K3, Y8               // 62111d236b84f00f000000
+       VPACKSSDW -15(R14)(R15*2), Y28, K3, Y8             // 62111d236b847ef1ffffff
+       VPACKSSDW Z21, Z12, K4, Z14                        // 62311d4c6bf5
+       VPACKSSDW Z9, Z12, K4, Z14                         // 62511d4c6bf1
+       VPACKSSDW 17(SP)(BP*1), Z12, K4, Z14               // 62711d4c6bb42c11000000
+       VPACKSSDW -7(CX)(DX*8), Z12, K4, Z14               // 62711d4c6bb4d1f9ffffff
+       VPACKSSDW Z21, Z13, K4, Z14                        // 6231154c6bf5
+       VPACKSSDW Z9, Z13, K4, Z14                         // 6251154c6bf1
+       VPACKSSDW 17(SP)(BP*1), Z13, K4, Z14               // 6271154c6bb42c11000000
+       VPACKSSDW -7(CX)(DX*8), Z13, K4, Z14               // 6271154c6bb4d1f9ffffff
+       VPACKSSDW Z21, Z12, K4, Z13                        // 62311d4c6bed
+       VPACKSSDW Z9, Z12, K4, Z13                         // 62511d4c6be9
+       VPACKSSDW 17(SP)(BP*1), Z12, K4, Z13               // 62711d4c6bac2c11000000
+       VPACKSSDW -7(CX)(DX*8), Z12, K4, Z13               // 62711d4c6bacd1f9ffffff
+       VPACKSSDW Z21, Z13, K4, Z13                        // 6231154c6bed
+       VPACKSSDW Z9, Z13, K4, Z13                         // 6251154c6be9
+       VPACKSSDW 17(SP)(BP*1), Z13, K4, Z13               // 6271154c6bac2c11000000
+       VPACKSSDW -7(CX)(DX*8), Z13, K4, Z13               // 6271154c6bacd1f9ffffff
+       VPACKSSWB X0, X14, K2, X2                          // 62f10d0a63d0 or 62f18d0a63d0
+       VPACKSSWB (R8), X14, K2, X2                        // 62d10d0a6310 or 62d18d0a6310
+       VPACKSSWB 15(DX)(BX*2), X14, K2, X2                // 62f10d0a63945a0f000000 or 62f18d0a63945a0f000000
+       VPACKSSWB Y31, Y14, K2, Y23                        // 62810d2a63ff or 62818d2a63ff
+       VPACKSSWB -15(R14)(R15*1), Y14, K2, Y23            // 62810d2a63bc3ef1ffffff or 62818d2a63bc3ef1ffffff
+       VPACKSSWB -15(BX), Y14, K2, Y23                    // 62e10d2a63bbf1ffffff or 62e18d2a63bbf1ffffff
+       VPACKSSWB Z23, Z27, K3, Z2                         // 62b1254363d7 or 62b1a54363d7
+       VPACKSSWB Z9, Z27, K3, Z2                          // 62d1254363d1 or 62d1a54363d1
+       VPACKSSWB -17(BP)(SI*2), Z27, K3, Z2               // 62f12543639475efffffff or 62f1a543639475efffffff
+       VPACKSSWB 7(AX)(CX*2), Z27, K3, Z2                 // 62f1254363944807000000 or 62f1a54363944807000000
+       VPACKSSWB Z23, Z25, K3, Z2                         // 62b1354363d7 or 62b1b54363d7
+       VPACKSSWB Z9, Z25, K3, Z2                          // 62d1354363d1 or 62d1b54363d1
+       VPACKSSWB -17(BP)(SI*2), Z25, K3, Z2               // 62f13543639475efffffff or 62f1b543639475efffffff
+       VPACKSSWB 7(AX)(CX*2), Z25, K3, Z2                 // 62f1354363944807000000 or 62f1b54363944807000000
+       VPACKSSWB Z23, Z27, K3, Z7                         // 62b1254363ff or 62b1a54363ff
+       VPACKSSWB Z9, Z27, K3, Z7                          // 62d1254363f9 or 62d1a54363f9
+       VPACKSSWB -17(BP)(SI*2), Z27, K3, Z7               // 62f1254363bc75efffffff or 62f1a54363bc75efffffff
+       VPACKSSWB 7(AX)(CX*2), Z27, K3, Z7                 // 62f1254363bc4807000000 or 62f1a54363bc4807000000
+       VPACKSSWB Z23, Z25, K3, Z7                         // 62b1354363ff or 62b1b54363ff
+       VPACKSSWB Z9, Z25, K3, Z7                          // 62d1354363f9 or 62d1b54363f9
+       VPACKSSWB -17(BP)(SI*2), Z25, K3, Z7               // 62f1354363bc75efffffff or 62f1b54363bc75efffffff
+       VPACKSSWB 7(AX)(CX*2), Z25, K3, Z7                 // 62f1354363bc4807000000 or 62f1b54363bc4807000000
+       VPACKUSDW X11, X25, K3, X0                         // 62d235032bc3
+       VPACKUSDW 17(SP)(BP*1), X25, K3, X0                // 62f235032b842c11000000
+       VPACKUSDW -7(CX)(DX*8), X25, K3, X0                // 62f235032b84d1f9ffffff
+       VPACKUSDW Y22, Y2, K3, Y25                         // 62226d2b2bce
+       VPACKUSDW 7(AX)(CX*4), Y2, K3, Y25                 // 62626d2b2b8c8807000000
+       VPACKUSDW 7(AX)(CX*1), Y2, K3, Y25                 // 62626d2b2b8c0807000000
+       VPACKUSDW Z14, Z3, K2, Z27                         // 6242654a2bde
+       VPACKUSDW Z7, Z3, K2, Z27                          // 6262654a2bdf
+       VPACKUSDW 15(R8)(R14*1), Z3, K2, Z27               // 6202654a2b9c300f000000
+       VPACKUSDW 15(R8)(R14*2), Z3, K2, Z27               // 6202654a2b9c700f000000
+       VPACKUSDW Z14, Z0, K2, Z27                         // 62427d4a2bde
+       VPACKUSDW Z7, Z0, K2, Z27                          // 62627d4a2bdf
+       VPACKUSDW 15(R8)(R14*1), Z0, K2, Z27               // 62027d4a2b9c300f000000
+       VPACKUSDW 15(R8)(R14*2), Z0, K2, Z27               // 62027d4a2b9c700f000000
+       VPACKUSDW Z14, Z3, K2, Z14                         // 6252654a2bf6
+       VPACKUSDW Z7, Z3, K2, Z14                          // 6272654a2bf7
+       VPACKUSDW 15(R8)(R14*1), Z3, K2, Z14               // 6212654a2bb4300f000000
+       VPACKUSDW 15(R8)(R14*2), Z3, K2, Z14               // 6212654a2bb4700f000000
+       VPACKUSDW Z14, Z0, K2, Z14                         // 62527d4a2bf6
+       VPACKUSDW Z7, Z0, K2, Z14                          // 62727d4a2bf7
+       VPACKUSDW 15(R8)(R14*1), Z0, K2, Z14               // 62127d4a2bb4300f000000
+       VPACKUSDW 15(R8)(R14*2), Z0, K2, Z14               // 62127d4a2bb4700f000000
+       VPACKUSWB X11, X18, K1, X17                        // 62c16d0167cb or 62c1ed0167cb
+       VPACKUSWB -17(BP)(SI*2), X18, K1, X17              // 62e16d01678c75efffffff or 62e1ed01678c75efffffff
+       VPACKUSWB 7(AX)(CX*2), X18, K1, X17                // 62e16d01678c4807000000 or 62e1ed01678c4807000000
+       VPACKUSWB Y9, Y8, K2, Y27                          // 62413d2a67d9 or 6241bd2a67d9
+       VPACKUSWB (SI), Y8, K2, Y27                        // 62613d2a671e or 6261bd2a671e
+       VPACKUSWB 7(SI)(DI*2), Y8, K2, Y27                 // 62613d2a679c7e07000000 or 6261bd2a679c7e07000000
+       VPACKUSWB Z1, Z22, K1, Z8                          // 62714d4167c1 or 6271cd4167c1
+       VPACKUSWB Z16, Z22, K1, Z8                         // 62314d4167c0 or 6231cd4167c0
+       VPACKUSWB (R14), Z22, K1, Z8                       // 62514d416706 or 6251cd416706
+       VPACKUSWB -7(DI)(R8*8), Z22, K1, Z8                // 62314d416784c7f9ffffff or 6231cd416784c7f9ffffff
+       VPACKUSWB Z1, Z25, K1, Z8                          // 6271354167c1 or 6271b54167c1
+       VPACKUSWB Z16, Z25, K1, Z8                         // 6231354167c0 or 6231b54167c0
+       VPACKUSWB (R14), Z25, K1, Z8                       // 625135416706 or 6251b5416706
+       VPACKUSWB -7(DI)(R8*8), Z25, K1, Z8                // 623135416784c7f9ffffff or 6231b5416784c7f9ffffff
+       VPACKUSWB Z1, Z22, K1, Z24                         // 62614d4167c1 or 6261cd4167c1
+       VPACKUSWB Z16, Z22, K1, Z24                        // 62214d4167c0 or 6221cd4167c0
+       VPACKUSWB (R14), Z22, K1, Z24                      // 62414d416706 or 6241cd416706
+       VPACKUSWB -7(DI)(R8*8), Z22, K1, Z24               // 62214d416784c7f9ffffff or 6221cd416784c7f9ffffff
+       VPACKUSWB Z1, Z25, K1, Z24                         // 6261354167c1 or 6261b54167c1
+       VPACKUSWB Z16, Z25, K1, Z24                        // 6221354167c0 or 6221b54167c0
+       VPACKUSWB (R14), Z25, K1, Z24                      // 624135416706 or 6241b5416706
+       VPACKUSWB -7(DI)(R8*8), Z25, K1, Z24               // 622135416784c7f9ffffff or 6221b5416784c7f9ffffff
+       VPADDB X24, X2, K7, X9                             // 62116d0ffcc8 or 6211ed0ffcc8
+       VPADDB 15(R8)(R14*1), X2, K7, X9                   // 62116d0ffc8c300f000000 or 6211ed0ffc8c300f000000
+       VPADDB 15(R8)(R14*2), X2, K7, X9                   // 62116d0ffc8c700f000000 or 6211ed0ffc8c700f000000
+       VPADDB Y14, Y9, K1, Y22                            // 62c13529fcf6 or 62c1b529fcf6
+       VPADDB 17(SP)(BP*8), Y9, K1, Y22                   // 62e13529fcb4ec11000000 or 62e1b529fcb4ec11000000
+       VPADDB 17(SP)(BP*4), Y9, K1, Y22                   // 62e13529fcb4ac11000000 or 62e1b529fcb4ac11000000
+       VPADDB Z15, Z0, K1, Z6                             // 62d17d49fcf7 or 62d1fd49fcf7
+       VPADDB Z12, Z0, K1, Z6                             // 62d17d49fcf4 or 62d1fd49fcf4
+       VPADDB 99(R15)(R15*4), Z0, K1, Z6                  // 62917d49fcb4bf63000000 or 6291fd49fcb4bf63000000
+       VPADDB 15(DX), Z0, K1, Z6                          // 62f17d49fcb20f000000 or 62f1fd49fcb20f000000
+       VPADDB Z15, Z8, K1, Z6                             // 62d13d49fcf7 or 62d1bd49fcf7
+       VPADDB Z12, Z8, K1, Z6                             // 62d13d49fcf4 or 62d1bd49fcf4
+       VPADDB 99(R15)(R15*4), Z8, K1, Z6                  // 62913d49fcb4bf63000000 or 6291bd49fcb4bf63000000
+       VPADDB 15(DX), Z8, K1, Z6                          // 62f13d49fcb20f000000 or 62f1bd49fcb20f000000
+       VPADDB Z15, Z0, K1, Z2                             // 62d17d49fcd7 or 62d1fd49fcd7
+       VPADDB Z12, Z0, K1, Z2                             // 62d17d49fcd4 or 62d1fd49fcd4
+       VPADDB 99(R15)(R15*4), Z0, K1, Z2                  // 62917d49fc94bf63000000 or 6291fd49fc94bf63000000
+       VPADDB 15(DX), Z0, K1, Z2                          // 62f17d49fc920f000000 or 62f1fd49fc920f000000
+       VPADDB Z15, Z8, K1, Z2                             // 62d13d49fcd7 or 62d1bd49fcd7
+       VPADDB Z12, Z8, K1, Z2                             // 62d13d49fcd4 or 62d1bd49fcd4
+       VPADDB 99(R15)(R15*4), Z8, K1, Z2                  // 62913d49fc94bf63000000 or 6291bd49fc94bf63000000
+       VPADDB 15(DX), Z8, K1, Z2                          // 62f13d49fc920f000000 or 62f1bd49fc920f000000
+       VPADDSB X15, X11, K4, X3                           // 62d1250cecdf or 62d1a50cecdf
+       VPADDSB (CX), X11, K4, X3                          // 62f1250cec19 or 62f1a50cec19
+       VPADDSB 99(R15), X11, K4, X3                       // 62d1250cec9f63000000 or 62d1a50cec9f63000000
+       VPADDSB Y9, Y22, K5, Y31                           // 62414d25ecf9 or 6241cd25ecf9
+       VPADDSB 7(AX), Y22, K5, Y31                        // 62614d25ecb807000000 or 6261cd25ecb807000000
+       VPADDSB (DI), Y22, K5, Y31                         // 62614d25ec3f or 6261cd25ec3f
+       VPADDSB Z13, Z28, K7, Z26                          // 62411d47ecd5 or 62419d47ecd5
+       VPADDSB Z21, Z28, K7, Z26                          // 62211d47ecd5 or 62219d47ecd5
+       VPADDSB -7(CX)(DX*1), Z28, K7, Z26                 // 62611d47ec9411f9ffffff or 62619d47ec9411f9ffffff
+       VPADDSB -15(R14)(R15*4), Z28, K7, Z26              // 62011d47ec94bef1ffffff or 62019d47ec94bef1ffffff
+       VPADDSB Z13, Z6, K7, Z26                           // 62414d4fecd5 or 6241cd4fecd5
+       VPADDSB Z21, Z6, K7, Z26                           // 62214d4fecd5 or 6221cd4fecd5
+       VPADDSB -7(CX)(DX*1), Z6, K7, Z26                  // 62614d4fec9411f9ffffff or 6261cd4fec9411f9ffffff
+       VPADDSB -15(R14)(R15*4), Z6, K7, Z26               // 62014d4fec94bef1ffffff or 6201cd4fec94bef1ffffff
+       VPADDSB Z13, Z28, K7, Z14                          // 62511d47ecf5 or 62519d47ecf5
+       VPADDSB Z21, Z28, K7, Z14                          // 62311d47ecf5 or 62319d47ecf5
+       VPADDSB -7(CX)(DX*1), Z28, K7, Z14                 // 62711d47ecb411f9ffffff or 62719d47ecb411f9ffffff
+       VPADDSB -15(R14)(R15*4), Z28, K7, Z14              // 62111d47ecb4bef1ffffff or 62119d47ecb4bef1ffffff
+       VPADDSB Z13, Z6, K7, Z14                           // 62514d4fecf5 or 6251cd4fecf5
+       VPADDSB Z21, Z6, K7, Z14                           // 62314d4fecf5 or 6231cd4fecf5
+       VPADDSB -7(CX)(DX*1), Z6, K7, Z14                  // 62714d4fecb411f9ffffff or 6271cd4fecb411f9ffffff
+       VPADDSB -15(R14)(R15*4), Z6, K7, Z14               // 62114d4fecb4bef1ffffff or 6211cd4fecb4bef1ffffff
+       VPADDSW X6, X13, K7, X30                           // 6261150fedf6 or 6261950fedf6
+       VPADDSW 99(R15)(R15*2), X13, K7, X30               // 6201150fedb47f63000000 or 6201950fedb47f63000000
+       VPADDSW -7(DI), X13, K7, X30                       // 6261150fedb7f9ffffff or 6261950fedb7f9ffffff
+       VPADDSW Y5, Y31, K6, Y23                           // 62e10526edfd or 62e18526edfd
+       VPADDSW 99(R15)(R15*1), Y31, K6, Y23               // 62810526edbc3f63000000 or 62818526edbc3f63000000
+       VPADDSW (DX), Y31, K6, Y23                         // 62e10526ed3a or 62e18526ed3a
+       VPADDSW Z21, Z3, K3, Z26                           // 6221654bedd5 or 6221e54bedd5
+       VPADDSW Z13, Z3, K3, Z26                           // 6241654bedd5 or 6241e54bedd5
+       VPADDSW 15(DX)(BX*1), Z3, K3, Z26                  // 6261654bed941a0f000000 or 6261e54bed941a0f000000
+       VPADDSW -7(CX)(DX*2), Z3, K3, Z26                  // 6261654bed9451f9ffffff or 6261e54bed9451f9ffffff
+       VPADDSW Z21, Z0, K3, Z26                           // 62217d4bedd5 or 6221fd4bedd5
+       VPADDSW Z13, Z0, K3, Z26                           // 62417d4bedd5 or 6241fd4bedd5
+       VPADDSW 15(DX)(BX*1), Z0, K3, Z26                  // 62617d4bed941a0f000000 or 6261fd4bed941a0f000000
+       VPADDSW -7(CX)(DX*2), Z0, K3, Z26                  // 62617d4bed9451f9ffffff or 6261fd4bed9451f9ffffff
+       VPADDSW Z21, Z3, K3, Z3                            // 62b1654beddd or 62b1e54beddd
+       VPADDSW Z13, Z3, K3, Z3                            // 62d1654beddd or 62d1e54beddd
+       VPADDSW 15(DX)(BX*1), Z3, K3, Z3                   // 62f1654bed9c1a0f000000 or 62f1e54bed9c1a0f000000
+       VPADDSW -7(CX)(DX*2), Z3, K3, Z3                   // 62f1654bed9c51f9ffffff or 62f1e54bed9c51f9ffffff
+       VPADDSW Z21, Z0, K3, Z3                            // 62b17d4beddd or 62b1fd4beddd
+       VPADDSW Z13, Z0, K3, Z3                            // 62d17d4beddd or 62d1fd4beddd
+       VPADDSW 15(DX)(BX*1), Z0, K3, Z3                   // 62f17d4bed9c1a0f000000 or 62f1fd4bed9c1a0f000000
+       VPADDSW -7(CX)(DX*2), Z0, K3, Z3                   // 62f17d4bed9c51f9ffffff or 62f1fd4bed9c51f9ffffff
+       VPADDUSB X30, X23, K7, X12                         // 62114507dce6 or 6211c507dce6
+       VPADDUSB -7(CX)(DX*1), X23, K7, X12                // 62714507dca411f9ffffff or 6271c507dca411f9ffffff
+       VPADDUSB -15(R14)(R15*4), X23, K7, X12             // 62114507dca4bef1ffffff or 6211c507dca4bef1ffffff
+       VPADDUSB Y19, Y5, K4, Y0                           // 62b1552cdcc3 or 62b1d52cdcc3
+       VPADDUSB -17(BP)(SI*8), Y5, K4, Y0                 // 62f1552cdc84f5efffffff or 62f1d52cdc84f5efffffff
+       VPADDUSB (R15), Y5, K4, Y0                         // 62d1552cdc07 or 62d1d52cdc07
+       VPADDUSB Z27, Z3, K4, Z11                          // 6211654cdcdb or 6211e54cdcdb
+       VPADDUSB Z15, Z3, K4, Z11                          // 6251654cdcdf or 6251e54cdcdf
+       VPADDUSB -17(BP), Z3, K4, Z11                      // 6271654cdc9defffffff or 6271e54cdc9defffffff
+       VPADDUSB -15(R14)(R15*8), Z3, K4, Z11              // 6211654cdc9cfef1ffffff or 6211e54cdc9cfef1ffffff
+       VPADDUSB Z27, Z12, K4, Z11                         // 62111d4cdcdb or 62119d4cdcdb
+       VPADDUSB Z15, Z12, K4, Z11                         // 62511d4cdcdf or 62519d4cdcdf
+       VPADDUSB -17(BP), Z12, K4, Z11                     // 62711d4cdc9defffffff or 62719d4cdc9defffffff
+       VPADDUSB -15(R14)(R15*8), Z12, K4, Z11             // 62111d4cdc9cfef1ffffff or 62119d4cdc9cfef1ffffff
+       VPADDUSB Z27, Z3, K4, Z25                          // 6201654cdccb or 6201e54cdccb
+       VPADDUSB Z15, Z3, K4, Z25                          // 6241654cdccf or 6241e54cdccf
+       VPADDUSB -17(BP), Z3, K4, Z25                      // 6261654cdc8defffffff or 6261e54cdc8defffffff
+       VPADDUSB -15(R14)(R15*8), Z3, K4, Z25              // 6201654cdc8cfef1ffffff or 6201e54cdc8cfef1ffffff
+       VPADDUSB Z27, Z12, K4, Z25                         // 62011d4cdccb or 62019d4cdccb
+       VPADDUSB Z15, Z12, K4, Z25                         // 62411d4cdccf or 62419d4cdccf
+       VPADDUSB -17(BP), Z12, K4, Z25                     // 62611d4cdc8defffffff or 62619d4cdc8defffffff
+       VPADDUSB -15(R14)(R15*8), Z12, K4, Z25             // 62011d4cdc8cfef1ffffff or 62019d4cdc8cfef1ffffff
+       VPADDUSW X2, X20, K7, X8                           // 62715d07ddc2 or 6271dd07ddc2
+       VPADDUSW 15(DX)(BX*1), X20, K7, X8                 // 62715d07dd841a0f000000 or 6271dd07dd841a0f000000
+       VPADDUSW -7(CX)(DX*2), X20, K7, X8                 // 62715d07dd8451f9ffffff or 6271dd07dd8451f9ffffff
+       VPADDUSW Y2, Y28, K2, Y31                          // 62611d22ddfa or 62619d22ddfa
+       VPADDUSW 7(SI)(DI*8), Y28, K2, Y31                 // 62611d22ddbcfe07000000 or 62619d22ddbcfe07000000
+       VPADDUSW -15(R14), Y28, K2, Y31                    // 62411d22ddbef1ffffff or 62419d22ddbef1ffffff
+       VPADDUSW Z8, Z23, K5, Z23                          // 62c14545ddf8 or 62c1c545ddf8
+       VPADDUSW Z28, Z23, K5, Z23                         // 62814545ddfc or 6281c545ddfc
+       VPADDUSW 17(SP)(BP*2), Z23, K5, Z23                // 62e14545ddbc6c11000000 or 62e1c545ddbc6c11000000
+       VPADDUSW -7(DI)(R8*4), Z23, K5, Z23                // 62a14545ddbc87f9ffffff or 62a1c545ddbc87f9ffffff
+       VPADDUSW Z8, Z6, K5, Z23                           // 62c14d4dddf8 or 62c1cd4dddf8
+       VPADDUSW Z28, Z6, K5, Z23                          // 62814d4dddfc or 6281cd4dddfc
+       VPADDUSW 17(SP)(BP*2), Z6, K5, Z23                 // 62e14d4dddbc6c11000000 or 62e1cd4dddbc6c11000000
+       VPADDUSW -7(DI)(R8*4), Z6, K5, Z23                 // 62a14d4dddbc87f9ffffff or 62a1cd4dddbc87f9ffffff
+       VPADDUSW Z8, Z23, K5, Z5                           // 62d14545dde8 or 62d1c545dde8
+       VPADDUSW Z28, Z23, K5, Z5                          // 62914545ddec or 6291c545ddec
+       VPADDUSW 17(SP)(BP*2), Z23, K5, Z5                 // 62f14545ddac6c11000000 or 62f1c545ddac6c11000000
+       VPADDUSW -7(DI)(R8*4), Z23, K5, Z5                 // 62b14545ddac87f9ffffff or 62b1c545ddac87f9ffffff
+       VPADDUSW Z8, Z6, K5, Z5                            // 62d14d4ddde8 or 62d1cd4ddde8
+       VPADDUSW Z28, Z6, K5, Z5                           // 62914d4dddec or 6291cd4dddec
+       VPADDUSW 17(SP)(BP*2), Z6, K5, Z5                  // 62f14d4dddac6c11000000 or 62f1cd4dddac6c11000000
+       VPADDUSW -7(DI)(R8*4), Z6, K5, Z5                  // 62b14d4dddac87f9ffffff or 62b1cd4dddac87f9ffffff
+       VPADDW X19, X26, K3, X9                            // 62312d03fdcb or 6231ad03fdcb
+       VPADDW -17(BP), X26, K3, X9                        // 62712d03fd8defffffff or 6271ad03fd8defffffff
+       VPADDW -15(R14)(R15*8), X26, K3, X9                // 62112d03fd8cfef1ffffff or 6211ad03fd8cfef1ffffff
+       VPADDW Y0, Y27, K4, Y24                            // 62612524fdc0 or 6261a524fdc0
+       VPADDW 7(SI)(DI*1), Y27, K4, Y24                   // 62612524fd843e07000000 or 6261a524fd843e07000000
+       VPADDW 15(DX)(BX*8), Y27, K4, Y24                  // 62612524fd84da0f000000 or 6261a524fd84da0f000000
+       VPADDW Z12, Z16, K2, Z21                           // 62c17d42fdec or 62c1fd42fdec
+       VPADDW Z27, Z16, K2, Z21                           // 62817d42fdeb or 6281fd42fdeb
+       VPADDW 15(R8), Z16, K2, Z21                        // 62c17d42fda80f000000 or 62c1fd42fda80f000000
+       VPADDW (BP), Z16, K2, Z21                          // 62e17d42fd6d00 or 62e1fd42fd6d00
+       VPADDW Z12, Z13, K2, Z21                           // 62c1154afdec or 62c1954afdec
+       VPADDW Z27, Z13, K2, Z21                           // 6281154afdeb or 6281954afdeb
+       VPADDW 15(R8), Z13, K2, Z21                        // 62c1154afda80f000000 or 62c1954afda80f000000
+       VPADDW (BP), Z13, K2, Z21                          // 62e1154afd6d00 or 62e1954afd6d00
+       VPADDW Z12, Z16, K2, Z5                            // 62d17d42fdec or 62d1fd42fdec
+       VPADDW Z27, Z16, K2, Z5                            // 62917d42fdeb or 6291fd42fdeb
+       VPADDW 15(R8), Z16, K2, Z5                         // 62d17d42fda80f000000 or 62d1fd42fda80f000000
+       VPADDW (BP), Z16, K2, Z5                           // 62f17d42fd6d00 or 62f1fd42fd6d00
+       VPADDW Z12, Z13, K2, Z5                            // 62d1154afdec or 62d1954afdec
+       VPADDW Z27, Z13, K2, Z5                            // 6291154afdeb or 6291954afdeb
+       VPADDW 15(R8), Z13, K2, Z5                         // 62d1154afda80f000000 or 62d1954afda80f000000
+       VPADDW (BP), Z13, K2, Z5                           // 62f1154afd6d00 or 62f1954afd6d00
+       VPALIGNR $13, X16, X31, K2, X0                     // 62b305020fc00d or 62b385020fc00d
+       VPALIGNR $13, 17(SP)(BP*2), X31, K2, X0            // 62f305020f846c110000000d or 62f385020f846c110000000d
+       VPALIGNR $13, -7(DI)(R8*4), X31, K2, X0            // 62b305020f8487f9ffffff0d or 62b385020f8487f9ffffff0d
+       VPALIGNR $65, Y3, Y31, K3, Y11                     // 627305230fdb41 or 627385230fdb41
+       VPALIGNR $65, -7(DI)(R8*1), Y31, K3, Y11           // 623305230f9c07f9ffffff41 or 623385230f9c07f9ffffff41
+       VPALIGNR $65, (SP), Y31, K3, Y11                   // 627305230f1c2441 or 627385230f1c2441
+       VPALIGNR $67, Z25, Z6, K3, Z22                     // 62834d4b0ff143 or 6283cd4b0ff143
+       VPALIGNR $67, Z12, Z6, K3, Z22                     // 62c34d4b0ff443 or 62c3cd4b0ff443
+       VPALIGNR $67, 15(R8)(R14*8), Z6, K3, Z22           // 62834d4b0fb4f00f00000043 or 6283cd4b0fb4f00f00000043
+       VPALIGNR $67, -15(R14)(R15*2), Z6, K3, Z22         // 62834d4b0fb47ef1ffffff43 or 6283cd4b0fb47ef1ffffff43
+       VPALIGNR $67, Z25, Z8, K3, Z22                     // 62833d4b0ff143 or 6283bd4b0ff143
+       VPALIGNR $67, Z12, Z8, K3, Z22                     // 62c33d4b0ff443 or 62c3bd4b0ff443
+       VPALIGNR $67, 15(R8)(R14*8), Z8, K3, Z22           // 62833d4b0fb4f00f00000043 or 6283bd4b0fb4f00f00000043
+       VPALIGNR $67, -15(R14)(R15*2), Z8, K3, Z22         // 62833d4b0fb47ef1ffffff43 or 6283bd4b0fb47ef1ffffff43
+       VPALIGNR $67, Z25, Z6, K3, Z11                     // 62134d4b0fd943 or 6213cd4b0fd943
+       VPALIGNR $67, Z12, Z6, K3, Z11                     // 62534d4b0fdc43 or 6253cd4b0fdc43
+       VPALIGNR $67, 15(R8)(R14*8), Z6, K3, Z11           // 62134d4b0f9cf00f00000043 or 6213cd4b0f9cf00f00000043
+       VPALIGNR $67, -15(R14)(R15*2), Z6, K3, Z11         // 62134d4b0f9c7ef1ffffff43 or 6213cd4b0f9c7ef1ffffff43
+       VPALIGNR $67, Z25, Z8, K3, Z11                     // 62133d4b0fd943 or 6213bd4b0fd943
+       VPALIGNR $67, Z12, Z8, K3, Z11                     // 62533d4b0fdc43 or 6253bd4b0fdc43
+       VPALIGNR $67, 15(R8)(R14*8), Z8, K3, Z11           // 62133d4b0f9cf00f00000043 or 6213bd4b0f9cf00f00000043
+       VPALIGNR $67, -15(R14)(R15*2), Z8, K3, Z11         // 62133d4b0f9c7ef1ffffff43 or 6213bd4b0f9c7ef1ffffff43
+       VPAVGB X16, X7, K1, X19                            // 62a14509e0d8 or 62a1c509e0d8
+       VPAVGB (SI), X7, K1, X19                           // 62e14509e01e or 62e1c509e01e
+       VPAVGB 7(SI)(DI*2), X7, K1, X19                    // 62e14509e09c7e07000000 or 62e1c509e09c7e07000000
+       VPAVGB Y14, Y19, K3, Y23                           // 62c16523e0fe or 62c1e523e0fe
+       VPAVGB 15(R8)(R14*4), Y19, K3, Y23                 // 62816523e0bcb00f000000 or 6281e523e0bcb00f000000
+       VPAVGB -7(CX)(DX*4), Y19, K3, Y23                  // 62e16523e0bc91f9ffffff or 62e1e523e0bc91f9ffffff
+       VPAVGB Z2, Z18, K4, Z11                            // 62716d44e0da or 6271ed44e0da
+       VPAVGB Z21, Z18, K4, Z11                           // 62316d44e0dd or 6231ed44e0dd
+       VPAVGB 7(SI)(DI*4), Z18, K4, Z11                   // 62716d44e09cbe07000000 or 6271ed44e09cbe07000000
+       VPAVGB -7(DI)(R8*2), Z18, K4, Z11                  // 62316d44e09c47f9ffffff or 6231ed44e09c47f9ffffff
+       VPAVGB Z2, Z24, K4, Z11                            // 62713d44e0da or 6271bd44e0da
+       VPAVGB Z21, Z24, K4, Z11                           // 62313d44e0dd or 6231bd44e0dd
+       VPAVGB 7(SI)(DI*4), Z24, K4, Z11                   // 62713d44e09cbe07000000 or 6271bd44e09cbe07000000
+       VPAVGB -7(DI)(R8*2), Z24, K4, Z11                  // 62313d44e09c47f9ffffff or 6231bd44e09c47f9ffffff
+       VPAVGB Z2, Z18, K4, Z5                             // 62f16d44e0ea or 62f1ed44e0ea
+       VPAVGB Z21, Z18, K4, Z5                            // 62b16d44e0ed or 62b1ed44e0ed
+       VPAVGB 7(SI)(DI*4), Z18, K4, Z5                    // 62f16d44e0acbe07000000 or 62f1ed44e0acbe07000000
+       VPAVGB -7(DI)(R8*2), Z18, K4, Z5                   // 62b16d44e0ac47f9ffffff or 62b1ed44e0ac47f9ffffff
+       VPAVGB Z2, Z24, K4, Z5                             // 62f13d44e0ea or 62f1bd44e0ea
+       VPAVGB Z21, Z24, K4, Z5                            // 62b13d44e0ed or 62b1bd44e0ed
+       VPAVGB 7(SI)(DI*4), Z24, K4, Z5                    // 62f13d44e0acbe07000000 or 62f1bd44e0acbe07000000
+       VPAVGB -7(DI)(R8*2), Z24, K4, Z5                   // 62b13d44e0ac47f9ffffff or 62b1bd44e0ac47f9ffffff
+       VPAVGW X7, X1, K5, X31                             // 6261750de3ff or 6261f50de3ff
+       VPAVGW 17(SP)(BP*8), X1, K5, X31                   // 6261750de3bcec11000000 or 6261f50de3bcec11000000
+       VPAVGW 17(SP)(BP*4), X1, K5, X31                   // 6261750de3bcac11000000 or 6261f50de3bcac11000000
+       VPAVGW Y16, Y5, K7, Y21                            // 62a1552fe3e8 or 62a1d52fe3e8
+       VPAVGW (R8), Y5, K7, Y21                           // 62c1552fe328 or 62c1d52fe328
+       VPAVGW 15(DX)(BX*2), Y5, K7, Y21                   // 62e1552fe3ac5a0f000000 or 62e1d52fe3ac5a0f000000
+       VPAVGW Z6, Z6, K7, Z7                              // 62f14d4fe3fe or 62f1cd4fe3fe
+       VPAVGW Z22, Z6, K7, Z7                             // 62b14d4fe3fe or 62b1cd4fe3fe
+       VPAVGW 17(SP), Z6, K7, Z7                          // 62f14d4fe3bc2411000000 or 62f1cd4fe3bc2411000000
+       VPAVGW -17(BP)(SI*4), Z6, K7, Z7                   // 62f14d4fe3bcb5efffffff or 62f1cd4fe3bcb5efffffff
+       VPAVGW Z6, Z16, K7, Z7                             // 62f17d47e3fe or 62f1fd47e3fe
+       VPAVGW Z22, Z16, K7, Z7                            // 62b17d47e3fe or 62b1fd47e3fe
+       VPAVGW 17(SP), Z16, K7, Z7                         // 62f17d47e3bc2411000000 or 62f1fd47e3bc2411000000
+       VPAVGW -17(BP)(SI*4), Z16, K7, Z7                  // 62f17d47e3bcb5efffffff or 62f1fd47e3bcb5efffffff
+       VPAVGW Z6, Z6, K7, Z13                             // 62714d4fe3ee or 6271cd4fe3ee
+       VPAVGW Z22, Z6, K7, Z13                            // 62314d4fe3ee or 6231cd4fe3ee
+       VPAVGW 17(SP), Z6, K7, Z13                         // 62714d4fe3ac2411000000 or 6271cd4fe3ac2411000000
+       VPAVGW -17(BP)(SI*4), Z6, K7, Z13                  // 62714d4fe3acb5efffffff or 6271cd4fe3acb5efffffff
+       VPAVGW Z6, Z16, K7, Z13                            // 62717d47e3ee or 6271fd47e3ee
+       VPAVGW Z22, Z16, K7, Z13                           // 62317d47e3ee or 6231fd47e3ee
+       VPAVGW 17(SP), Z16, K7, Z13                        // 62717d47e3ac2411000000 or 6271fd47e3ac2411000000
+       VPAVGW -17(BP)(SI*4), Z16, K7, Z13                 // 62717d47e3acb5efffffff or 6271fd47e3acb5efffffff
+       VPBLENDMB X12, X15, K6, X9                         // 6252050e66cc
+       VPBLENDMB 7(SI)(DI*4), X15, K6, X9                 // 6272050e668cbe07000000
+       VPBLENDMB -7(DI)(R8*2), X15, K6, X9                // 6232050e668c47f9ffffff
+       VPBLENDMB Y20, Y21, K3, Y2                         // 62b2552366d4
+       VPBLENDMB 17(SP)(BP*1), Y21, K3, Y2                // 62f2552366942c11000000
+       VPBLENDMB -7(CX)(DX*8), Y21, K3, Y2                // 62f255236694d1f9ffffff
+       VPBLENDMB Z18, Z13, K7, Z1                         // 62b2154f66ca
+       VPBLENDMB Z8, Z13, K7, Z1                          // 62d2154f66c8
+       VPBLENDMB 7(AX), Z13, K7, Z1                       // 62f2154f668807000000
+       VPBLENDMB (DI), Z13, K7, Z1                        // 62f2154f660f
+       VPBLENDMB Z18, Z13, K7, Z15                        // 6232154f66fa
+       VPBLENDMB Z8, Z13, K7, Z15                         // 6252154f66f8
+       VPBLENDMB 7(AX), Z13, K7, Z15                      // 6272154f66b807000000
+       VPBLENDMB (DI), Z13, K7, Z15                       // 6272154f663f
+       VPBLENDMW X26, X3, K4, X8                          // 6212e50c66c2
+       VPBLENDMW 99(R15)(R15*1), X3, K4, X8               // 6212e50c66843f63000000
+       VPBLENDMW (DX), X3, K4, X8                         // 6272e50c6602
+       VPBLENDMW Y3, Y0, K2, Y6                           // 62f2fd2a66f3
+       VPBLENDMW (R14), Y0, K2, Y6                        // 62d2fd2a6636
+       VPBLENDMW -7(DI)(R8*8), Y0, K2, Y6                 // 62b2fd2a66b4c7f9ffffff
+       VPBLENDMW Z15, Z3, K2, Z14                         // 6252e54a66f7
+       VPBLENDMW Z30, Z3, K2, Z14                         // 6212e54a66f6
+       VPBLENDMW 7(SI)(DI*8), Z3, K2, Z14                 // 6272e54a66b4fe07000000
+       VPBLENDMW -15(R14), Z3, K2, Z14                    // 6252e54a66b6f1ffffff
+       VPBLENDMW Z15, Z12, K2, Z14                        // 62529d4a66f7
+       VPBLENDMW Z30, Z12, K2, Z14                        // 62129d4a66f6
+       VPBLENDMW 7(SI)(DI*8), Z12, K2, Z14                // 62729d4a66b4fe07000000
+       VPBLENDMW -15(R14), Z12, K2, Z14                   // 62529d4a66b6f1ffffff
+       VPBLENDMW Z15, Z3, K2, Z28                         // 6242e54a66e7
+       VPBLENDMW Z30, Z3, K2, Z28                         // 6202e54a66e6
+       VPBLENDMW 7(SI)(DI*8), Z3, K2, Z28                 // 6262e54a66a4fe07000000
+       VPBLENDMW -15(R14), Z3, K2, Z28                    // 6242e54a66a6f1ffffff
+       VPBLENDMW Z15, Z12, K2, Z28                        // 62429d4a66e7
+       VPBLENDMW Z30, Z12, K2, Z28                        // 62029d4a66e6
+       VPBLENDMW 7(SI)(DI*8), Z12, K2, Z28                // 62629d4a66a4fe07000000
+       VPBLENDMW -15(R14), Z12, K2, Z28                   // 62429d4a66a6f1ffffff
+       VPBROADCASTB CX, K3, X23                           // 62e27d0b7af9
+       VPBROADCASTB SP, K3, X23                           // 62e27d0b7afc
+       VPBROADCASTB R14, K3, Y5                           // 62d27d2b7aee
+       VPBROADCASTB AX, K3, Y5                            // 62f27d2b7ae8
+       VPBROADCASTB R9, K3, Z19                           // 62c27d4b7ad9
+       VPBROADCASTB CX, K3, Z19                           // 62e27d4b7ad9
+       VPBROADCASTB R9, K3, Z15                           // 62527d4b7af9
+       VPBROADCASTB CX, K3, Z15                           // 62727d4b7af9
+       VPBROADCASTB X28, K2, X13                          // 62127d0a78ec
+       VPBROADCASTB 99(R15)(R15*1), K2, X13               // 62127d0a786c3f63
+       VPBROADCASTB (DX), K2, X13                         // 62727d0a782a
+       VPBROADCASTB X24, K1, Y20                          // 62827d2978e0
+       VPBROADCASTB -17(BP)(SI*8), K1, Y20                // 62e27d297864f5ef
+       VPBROADCASTB (R15), K1, Y20                        // 62c27d297827
+       VPBROADCASTB X9, K2, Z5                            // 62d27d4a78e9
+       VPBROADCASTB 7(SI)(DI*8), K2, Z5                   // 62f27d4a786cfe07
+       VPBROADCASTB -15(R14), K2, Z5                      // 62d27d4a786ef1
+       VPBROADCASTB X9, K2, Z1                            // 62d27d4a78c9
+       VPBROADCASTB 7(SI)(DI*8), K2, Z1                   // 62f27d4a784cfe07
+       VPBROADCASTB -15(R14), K2, Z1                      // 62d27d4a784ef1
+       VPBROADCASTW R14, K7, X20                          // 62c27d0f7be6
+       VPBROADCASTW AX, K7, X20                           // 62e27d0f7be0
+       VPBROADCASTW R9, K7, Y22                           // 62c27d2f7bf1
+       VPBROADCASTW CX, K7, Y22                           // 62e27d2f7bf1
+       VPBROADCASTW SP, K6, Z0                            // 62f27d4e7bc4
+       VPBROADCASTW R14, K6, Z0                           // 62d27d4e7bc6
+       VPBROADCASTW SP, K6, Z11                           // 62727d4e7bdc
+       VPBROADCASTW R14, K6, Z11                          // 62527d4e7bde
+       VPBROADCASTW X9, K3, X7                            // 62d27d0b79f9
+       VPBROADCASTW 99(R15)(R15*1), K3, X7                // 62927d0b79bc3f63000000
+       VPBROADCASTW (DX), K3, X7                          // 62f27d0b793a
+       VPBROADCASTW X7, K7, Y13                           // 62727d2f79ef
+       VPBROADCASTW -17(BP)(SI*8), K7, Y13                // 62727d2f79acf5efffffff
+       VPBROADCASTW (R15), K7, Y13                        // 62527d2f792f
+       VPBROADCASTW X14, K4, Z0                           // 62d27d4c79c6
+       VPBROADCASTW 7(SI)(DI*8), K4, Z0                   // 62f27d4c7984fe07000000
+       VPBROADCASTW -15(R14), K4, Z0                      // 62d27d4c7986f1ffffff
+       VPBROADCASTW X14, K4, Z25                          // 62427d4c79ce
+       VPBROADCASTW 7(SI)(DI*8), K4, Z25                  // 62627d4c798cfe07000000
+       VPBROADCASTW -15(R14), K4, Z25                     // 62427d4c798ef1ffffff
+       VPCMPB $81, X1, X21, K4, K5                        // 62f355043fe951
+       VPCMPB $81, 7(SI)(DI*8), X21, K4, K5               // 62f355043facfe0700000051
+       VPCMPB $81, -15(R14), X21, K4, K5                  // 62d355043faef1ffffff51
+       VPCMPB $81, X1, X21, K4, K4                        // 62f355043fe151
+       VPCMPB $81, 7(SI)(DI*8), X21, K4, K4               // 62f355043fa4fe0700000051
+       VPCMPB $81, -15(R14), X21, K4, K4                  // 62d355043fa6f1ffffff51
+       VPCMPB $42, Y7, Y17, K7, K4                        // 62f375273fe72a
+       VPCMPB $42, (CX), Y17, K7, K4                      // 62f375273f212a
+       VPCMPB $42, 99(R15), Y17, K7, K4                   // 62d375273fa7630000002a
+       VPCMPB $42, Y7, Y17, K7, K6                        // 62f375273ff72a
+       VPCMPB $42, (CX), Y17, K7, K6                      // 62f375273f312a
+       VPCMPB $42, 99(R15), Y17, K7, K6                   // 62d375273fb7630000002a
+       VPCMPB $79, Z9, Z9, K2, K1                         // 62d3354a3fc94f
+       VPCMPB $79, Z28, Z9, K2, K1                        // 6293354a3fcc4f
+       VPCMPB $79, -7(DI)(R8*1), Z9, K2, K1               // 62b3354a3f8c07f9ffffff4f
+       VPCMPB $79, (SP), Z9, K2, K1                       // 62f3354a3f0c244f
+       VPCMPB $79, Z9, Z25, K2, K1                        // 62d335423fc94f
+       VPCMPB $79, Z28, Z25, K2, K1                       // 629335423fcc4f
+       VPCMPB $79, -7(DI)(R8*1), Z25, K2, K1              // 62b335423f8c07f9ffffff4f
+       VPCMPB $79, (SP), Z25, K2, K1                      // 62f335423f0c244f
+       VPCMPB $79, Z9, Z9, K2, K3                         // 62d3354a3fd94f
+       VPCMPB $79, Z28, Z9, K2, K3                        // 6293354a3fdc4f
+       VPCMPB $79, -7(DI)(R8*1), Z9, K2, K3               // 62b3354a3f9c07f9ffffff4f
+       VPCMPB $79, (SP), Z9, K2, K3                       // 62f3354a3f1c244f
+       VPCMPB $79, Z9, Z25, K2, K3                        // 62d335423fd94f
+       VPCMPB $79, Z28, Z25, K2, K3                       // 629335423fdc4f
+       VPCMPB $79, -7(DI)(R8*1), Z25, K2, K3              // 62b335423f9c07f9ffffff4f
+       VPCMPB $79, (SP), Z25, K2, K3                      // 62f335423f1c244f
+       VPCMPEQB X30, X0, K2, K4                           // 62917d0a74e6 or 6291fd0a74e6
+       VPCMPEQB -7(DI)(R8*1), X0, K2, K4                  // 62b17d0a74a407f9ffffff or 62b1fd0a74a407f9ffffff
+       VPCMPEQB (SP), X0, K2, K4                          // 62f17d0a742424 or 62f1fd0a742424
+       VPCMPEQB X30, X0, K2, K5                           // 62917d0a74ee or 6291fd0a74ee
+       VPCMPEQB -7(DI)(R8*1), X0, K2, K5                  // 62b17d0a74ac07f9ffffff or 62b1fd0a74ac07f9ffffff
+       VPCMPEQB (SP), X0, K2, K5                          // 62f17d0a742c24 or 62f1fd0a742c24
+       VPCMPEQB Y1, Y8, K2, K2                            // 62f13d2a74d1 or 62f1bd2a74d1
+       VPCMPEQB -7(CX)(DX*1), Y8, K2, K2                  // 62f13d2a749411f9ffffff or 62f1bd2a749411f9ffffff
+       VPCMPEQB -15(R14)(R15*4), Y8, K2, K2               // 62913d2a7494bef1ffffff or 6291bd2a7494bef1ffffff
+       VPCMPEQB Y1, Y8, K2, K7                            // 62f13d2a74f9 or 62f1bd2a74f9
+       VPCMPEQB -7(CX)(DX*1), Y8, K2, K7                  // 62f13d2a74bc11f9ffffff or 62f1bd2a74bc11f9ffffff
+       VPCMPEQB -15(R14)(R15*4), Y8, K2, K7               // 62913d2a74bcbef1ffffff or 6291bd2a74bcbef1ffffff
+       VPCMPEQB Z31, Z17, K3, K0                          // 6291754374c7 or 6291f54374c7
+       VPCMPEQB Z0, Z17, K3, K0                           // 62f1754374c0 or 62f1f54374c0
+       VPCMPEQB 99(R15)(R15*8), Z17, K3, K0               // 629175437484ff63000000 or 6291f5437484ff63000000
+       VPCMPEQB 7(AX)(CX*8), Z17, K3, K0                  // 62f175437484c807000000 or 62f1f5437484c807000000
+       VPCMPEQB Z31, Z23, K3, K0                          // 6291454374c7 or 6291c54374c7
+       VPCMPEQB Z0, Z23, K3, K0                           // 62f1454374c0 or 62f1c54374c0
+       VPCMPEQB 99(R15)(R15*8), Z23, K3, K0               // 629145437484ff63000000 or 6291c5437484ff63000000
+       VPCMPEQB 7(AX)(CX*8), Z23, K3, K0                  // 62f145437484c807000000 or 62f1c5437484c807000000
+       VPCMPEQB Z31, Z17, K3, K5                          // 6291754374ef or 6291f54374ef
+       VPCMPEQB Z0, Z17, K3, K5                           // 62f1754374e8 or 62f1f54374e8
+       VPCMPEQB 99(R15)(R15*8), Z17, K3, K5               // 6291754374acff63000000 or 6291f54374acff63000000
+       VPCMPEQB 7(AX)(CX*8), Z17, K3, K5                  // 62f1754374acc807000000 or 62f1f54374acc807000000
+       VPCMPEQB Z31, Z23, K3, K5                          // 6291454374ef or 6291c54374ef
+       VPCMPEQB Z0, Z23, K3, K5                           // 62f1454374e8 or 62f1c54374e8
+       VPCMPEQB 99(R15)(R15*8), Z23, K3, K5               // 6291454374acff63000000 or 6291c54374acff63000000
+       VPCMPEQB 7(AX)(CX*8), Z23, K3, K5                  // 62f1454374acc807000000 or 62f1c54374acc807000000
+       VPCMPEQW X8, X19, K7, K0                           // 62d1650775c0 or 62d1e50775c0
+       VPCMPEQW (AX), X19, K7, K0                         // 62f165077500 or 62f1e5077500
+       VPCMPEQW 7(SI), X19, K7, K0                        // 62f16507758607000000 or 62f1e507758607000000
+       VPCMPEQW X8, X19, K7, K7                           // 62d1650775f8 or 62d1e50775f8
+       VPCMPEQW (AX), X19, K7, K7                         // 62f165077538 or 62f1e5077538
+       VPCMPEQW 7(SI), X19, K7, K7                        // 62f1650775be07000000 or 62f1e50775be07000000
+       VPCMPEQW Y12, Y21, K1, K5                          // 62d1552175ec or 62d1d52175ec
+       VPCMPEQW 17(SP)(BP*2), Y21, K1, K5                 // 62f1552175ac6c11000000 or 62f1d52175ac6c11000000
+       VPCMPEQW -7(DI)(R8*4), Y21, K1, K5                 // 62b1552175ac87f9ffffff or 62b1d52175ac87f9ffffff
+       VPCMPEQW Y12, Y21, K1, K4                          // 62d1552175e4 or 62d1d52175e4
+       VPCMPEQW 17(SP)(BP*2), Y21, K1, K4                 // 62f1552175a46c11000000 or 62f1d52175a46c11000000
+       VPCMPEQW -7(DI)(R8*4), Y21, K1, K4                 // 62b1552175a487f9ffffff or 62b1d52175a487f9ffffff
+       VPCMPEQW Z26, Z30, K1, K4                          // 62910d4175e2 or 62918d4175e2
+       VPCMPEQW Z22, Z30, K1, K4                          // 62b10d4175e6 or 62b18d4175e6
+       VPCMPEQW 15(R8)(R14*4), Z30, K1, K4                // 62910d4175a4b00f000000 or 62918d4175a4b00f000000
+       VPCMPEQW -7(CX)(DX*4), Z30, K1, K4                 // 62f10d4175a491f9ffffff or 62f18d4175a491f9ffffff
+       VPCMPEQW Z26, Z5, K1, K4                           // 6291554975e2 or 6291d54975e2
+       VPCMPEQW Z22, Z5, K1, K4                           // 62b1554975e6 or 62b1d54975e6
+       VPCMPEQW 15(R8)(R14*4), Z5, K1, K4                 // 6291554975a4b00f000000 or 6291d54975a4b00f000000
+       VPCMPEQW -7(CX)(DX*4), Z5, K1, K4                  // 62f1554975a491f9ffffff or 62f1d54975a491f9ffffff
+       VPCMPEQW Z26, Z30, K1, K6                          // 62910d4175f2 or 62918d4175f2
+       VPCMPEQW Z22, Z30, K1, K6                          // 62b10d4175f6 or 62b18d4175f6
+       VPCMPEQW 15(R8)(R14*4), Z30, K1, K6                // 62910d4175b4b00f000000 or 62918d4175b4b00f000000
+       VPCMPEQW -7(CX)(DX*4), Z30, K1, K6                 // 62f10d4175b491f9ffffff or 62f18d4175b491f9ffffff
+       VPCMPEQW Z26, Z5, K1, K6                           // 6291554975f2 or 6291d54975f2
+       VPCMPEQW Z22, Z5, K1, K6                           // 62b1554975f6 or 62b1d54975f6
+       VPCMPEQW 15(R8)(R14*4), Z5, K1, K6                 // 6291554975b4b00f000000 or 6291d54975b4b00f000000
+       VPCMPEQW -7(CX)(DX*4), Z5, K1, K6                  // 62f1554975b491f9ffffff or 62f1d54975b491f9ffffff
+       VPCMPGTB X26, X8, K1, K1                           // 62913d0964ca or 6291bd0964ca
+       VPCMPGTB (BX), X8, K1, K1                          // 62f13d09640b or 62f1bd09640b
+       VPCMPGTB -17(BP)(SI*1), X8, K1, K1                 // 62f13d09648c35efffffff or 62f1bd09648c35efffffff
+       VPCMPGTB X26, X8, K1, K3                           // 62913d0964da or 6291bd0964da
+       VPCMPGTB (BX), X8, K1, K3                          // 62f13d09641b or 62f1bd09641b
+       VPCMPGTB -17(BP)(SI*1), X8, K1, K3                 // 62f13d09649c35efffffff or 62f1bd09649c35efffffff
+       VPCMPGTB Y1, Y9, K7, K6                            // 62f1352f64f1 or 62f1b52f64f1
+       VPCMPGTB 15(R8), Y9, K7, K6                        // 62d1352f64b00f000000 or 62d1b52f64b00f000000
+       VPCMPGTB (BP), Y9, K7, K6                          // 62f1352f647500 or 62f1b52f647500
+       VPCMPGTB Y1, Y9, K7, K7                            // 62f1352f64f9 or 62f1b52f64f9
+       VPCMPGTB 15(R8), Y9, K7, K7                        // 62d1352f64b80f000000 or 62d1b52f64b80f000000
+       VPCMPGTB (BP), Y9, K7, K7                          // 62f1352f647d00 or 62f1b52f647d00
+       VPCMPGTB Z16, Z7, K2, K6                           // 62b1454a64f0 or 62b1c54a64f0
+       VPCMPGTB Z25, Z7, K2, K6                           // 6291454a64f1 or 6291c54a64f1
+       VPCMPGTB (R8), Z7, K2, K6                          // 62d1454a6430 or 62d1c54a6430
+       VPCMPGTB 15(DX)(BX*2), Z7, K2, K6                  // 62f1454a64b45a0f000000 or 62f1c54a64b45a0f000000
+       VPCMPGTB Z16, Z21, K2, K6                          // 62b1554264f0 or 62b1d54264f0
+       VPCMPGTB Z25, Z21, K2, K6                          // 6291554264f1 or 6291d54264f1
+       VPCMPGTB (R8), Z21, K2, K6                         // 62d155426430 or 62d1d5426430
+       VPCMPGTB 15(DX)(BX*2), Z21, K2, K6                 // 62f1554264b45a0f000000 or 62f1d54264b45a0f000000
+       VPCMPGTB Z16, Z7, K2, K4                           // 62b1454a64e0 or 62b1c54a64e0
+       VPCMPGTB Z25, Z7, K2, K4                           // 6291454a64e1 or 6291c54a64e1
+       VPCMPGTB (R8), Z7, K2, K4                          // 62d1454a6420 or 62d1c54a6420
+       VPCMPGTB 15(DX)(BX*2), Z7, K2, K4                  // 62f1454a64a45a0f000000 or 62f1c54a64a45a0f000000
+       VPCMPGTB Z16, Z21, K2, K4                          // 62b1554264e0 or 62b1d54264e0
+       VPCMPGTB Z25, Z21, K2, K4                          // 6291554264e1 or 6291d54264e1
+       VPCMPGTB (R8), Z21, K2, K4                         // 62d155426420 or 62d1d5426420
+       VPCMPGTB 15(DX)(BX*2), Z21, K2, K4                 // 62f1554264a45a0f000000 or 62f1d54264a45a0f000000
+       VPCMPGTW X11, X23, K7, K3                          // 62d1450765db or 62d1c50765db
+       VPCMPGTW 17(SP)(BP*1), X23, K7, K3                 // 62f14507659c2c11000000 or 62f1c507659c2c11000000
+       VPCMPGTW -7(CX)(DX*8), X23, K7, K3                 // 62f14507659cd1f9ffffff or 62f1c507659cd1f9ffffff
+       VPCMPGTW X11, X23, K7, K1                          // 62d1450765cb or 62d1c50765cb
+       VPCMPGTW 17(SP)(BP*1), X23, K7, K1                 // 62f14507658c2c11000000 or 62f1c507658c2c11000000
+       VPCMPGTW -7(CX)(DX*8), X23, K7, K1                 // 62f14507658cd1f9ffffff or 62f1c507658cd1f9ffffff
+       VPCMPGTW Y21, Y12, K6, K5                          // 62b11d2e65ed or 62b19d2e65ed
+       VPCMPGTW 7(AX)(CX*4), Y12, K6, K5                  // 62f11d2e65ac8807000000 or 62f19d2e65ac8807000000
+       VPCMPGTW 7(AX)(CX*1), Y12, K6, K5                  // 62f11d2e65ac0807000000 or 62f19d2e65ac0807000000
+       VPCMPGTW Y21, Y12, K6, K4                          // 62b11d2e65e5 or 62b19d2e65e5
+       VPCMPGTW 7(AX)(CX*4), Y12, K6, K4                  // 62f11d2e65a48807000000 or 62f19d2e65a48807000000
+       VPCMPGTW 7(AX)(CX*1), Y12, K6, K4                  // 62f11d2e65a40807000000 or 62f19d2e65a40807000000
+       VPCMPGTW Z23, Z27, K3, K7                          // 62b1254365ff or 62b1a54365ff
+       VPCMPGTW Z9, Z27, K3, K7                           // 62d1254365f9 or 62d1a54365f9
+       VPCMPGTW 15(R8)(R14*1), Z27, K3, K7                // 6291254365bc300f000000 or 6291a54365bc300f000000
+       VPCMPGTW 15(R8)(R14*2), Z27, K3, K7                // 6291254365bc700f000000 or 6291a54365bc700f000000
+       VPCMPGTW Z23, Z25, K3, K7                          // 62b1354365ff or 62b1b54365ff
+       VPCMPGTW Z9, Z25, K3, K7                           // 62d1354365f9 or 62d1b54365f9
+       VPCMPGTW 15(R8)(R14*1), Z25, K3, K7                // 6291354365bc300f000000 or 6291b54365bc300f000000
+       VPCMPGTW 15(R8)(R14*2), Z25, K3, K7                // 6291354365bc700f000000 or 6291b54365bc700f000000
+       VPCMPGTW Z23, Z27, K3, K6                          // 62b1254365f7 or 62b1a54365f7
+       VPCMPGTW Z9, Z27, K3, K6                           // 62d1254365f1 or 62d1a54365f1
+       VPCMPGTW 15(R8)(R14*1), Z27, K3, K6                // 6291254365b4300f000000 or 6291a54365b4300f000000
+       VPCMPGTW 15(R8)(R14*2), Z27, K3, K6                // 6291254365b4700f000000 or 6291a54365b4700f000000
+       VPCMPGTW Z23, Z25, K3, K6                          // 62b1354365f7 or 62b1b54365f7
+       VPCMPGTW Z9, Z25, K3, K6                           // 62d1354365f1 or 62d1b54365f1
+       VPCMPGTW 15(R8)(R14*1), Z25, K3, K6                // 6291354365b4300f000000 or 6291b54365b4300f000000
+       VPCMPGTW 15(R8)(R14*2), Z25, K3, K6                // 6291354365b4700f000000 or 6291b54365b4700f000000
+       VPCMPUB $121, X0, X14, K7, K4                      // 62f30d0f3ee079
+       VPCMPUB $121, 15(R8)(R14*1), X14, K7, K4           // 62930d0f3ea4300f00000079
+       VPCMPUB $121, 15(R8)(R14*2), X14, K7, K4           // 62930d0f3ea4700f00000079
+       VPCMPUB $121, X0, X14, K7, K6                      // 62f30d0f3ef079
+       VPCMPUB $121, 15(R8)(R14*1), X14, K7, K6           // 62930d0f3eb4300f00000079
+       VPCMPUB $121, 15(R8)(R14*2), X14, K7, K6           // 62930d0f3eb4700f00000079
+       VPCMPUB $13, Y7, Y26, K2, K1                       // 62f32d223ecf0d
+       VPCMPUB $13, 17(SP)(BP*8), Y26, K2, K1             // 62f32d223e8cec110000000d
+       VPCMPUB $13, 17(SP)(BP*4), Y26, K2, K1             // 62f32d223e8cac110000000d
+       VPCMPUB $13, Y7, Y26, K2, K3                       // 62f32d223edf0d
+       VPCMPUB $13, 17(SP)(BP*8), Y26, K2, K3             // 62f32d223e9cec110000000d
+       VPCMPUB $13, 17(SP)(BP*4), Y26, K2, K3             // 62f32d223e9cac110000000d
+       VPCMPUB $65, Z8, Z14, K5, K6                       // 62d30d4d3ef041
+       VPCMPUB $65, Z24, Z14, K5, K6                      // 62930d4d3ef041
+       VPCMPUB $65, 99(R15)(R15*4), Z14, K5, K6           // 62930d4d3eb4bf6300000041
+       VPCMPUB $65, 15(DX), Z14, K5, K6                   // 62f30d4d3eb20f00000041
+       VPCMPUB $65, Z8, Z7, K5, K6                        // 62d3454d3ef041
+       VPCMPUB $65, Z24, Z7, K5, K6                       // 6293454d3ef041
+       VPCMPUB $65, 99(R15)(R15*4), Z7, K5, K6            // 6293454d3eb4bf6300000041
+       VPCMPUB $65, 15(DX), Z7, K5, K6                    // 62f3454d3eb20f00000041
+       VPCMPUB $65, Z8, Z14, K5, K7                       // 62d30d4d3ef841
+       VPCMPUB $65, Z24, Z14, K5, K7                      // 62930d4d3ef841
+       VPCMPUB $65, 99(R15)(R15*4), Z14, K5, K7           // 62930d4d3ebcbf6300000041
+       VPCMPUB $65, 15(DX), Z14, K5, K7                   // 62f30d4d3eba0f00000041
+       VPCMPUB $65, Z8, Z7, K5, K7                        // 62d3454d3ef841
+       VPCMPUB $65, Z24, Z7, K5, K7                       // 6293454d3ef841
+       VPCMPUB $65, 99(R15)(R15*4), Z7, K5, K7            // 6293454d3ebcbf6300000041
+       VPCMPUB $65, 15(DX), Z7, K5, K7                    // 62f3454d3eba0f00000041
+       VPCMPUW $79, X25, X5, K3, K1                       // 6293d50b3ec94f
+       VPCMPUW $79, (CX), X5, K3, K1                      // 62f3d50b3e094f
+       VPCMPUW $79, 99(R15), X5, K3, K1                   // 62d3d50b3e8f630000004f
+       VPCMPUW $79, X25, X5, K3, K5                       // 6293d50b3ee94f
+       VPCMPUW $79, (CX), X5, K3, K5                      // 62f3d50b3e294f
+       VPCMPUW $79, 99(R15), X5, K3, K5                   // 62d3d50b3eaf630000004f
+       VPCMPUW $64, Y6, Y22, K2, K3                       // 62f3cd223ede40
+       VPCMPUW $64, 7(AX), Y22, K2, K3                    // 62f3cd223e980700000040
+       VPCMPUW $64, (DI), Y22, K2, K3                     // 62f3cd223e1f40
+       VPCMPUW $64, Y6, Y22, K2, K1                       // 62f3cd223ece40
+       VPCMPUW $64, 7(AX), Y22, K2, K1                    // 62f3cd223e880700000040
+       VPCMPUW $64, (DI), Y22, K2, K1                     // 62f3cd223e0f40
+       VPCMPUW $27, Z14, Z15, K1, K5                      // 62d385493eee1b
+       VPCMPUW $27, Z27, Z15, K1, K5                      // 629385493eeb1b
+       VPCMPUW $27, -7(CX)(DX*1), Z15, K1, K5             // 62f385493eac11f9ffffff1b
+       VPCMPUW $27, -15(R14)(R15*4), Z15, K1, K5          // 629385493eacbef1ffffff1b
+       VPCMPUW $27, Z14, Z12, K1, K5                      // 62d39d493eee1b
+       VPCMPUW $27, Z27, Z12, K1, K5                      // 62939d493eeb1b
+       VPCMPUW $27, -7(CX)(DX*1), Z12, K1, K5             // 62f39d493eac11f9ffffff1b
+       VPCMPUW $27, -15(R14)(R15*4), Z12, K1, K5          // 62939d493eacbef1ffffff1b
+       VPCMPUW $27, Z14, Z15, K1, K4                      // 62d385493ee61b
+       VPCMPUW $27, Z27, Z15, K1, K4                      // 629385493ee31b
+       VPCMPUW $27, -7(CX)(DX*1), Z15, K1, K4             // 62f385493ea411f9ffffff1b
+       VPCMPUW $27, -15(R14)(R15*4), Z15, K1, K4          // 629385493ea4bef1ffffff1b
+       VPCMPUW $27, Z14, Z12, K1, K4                      // 62d39d493ee61b
+       VPCMPUW $27, Z27, Z12, K1, K4                      // 62939d493ee31b
+       VPCMPUW $27, -7(CX)(DX*1), Z12, K1, K4             // 62f39d493ea411f9ffffff1b
+       VPCMPUW $27, -15(R14)(R15*4), Z12, K1, K4          // 62939d493ea4bef1ffffff1b
+       VPCMPW $47, X9, X0, K2, K7                         // 62d3fd0a3ff92f
+       VPCMPW $47, 99(R15)(R15*2), X0, K2, K7             // 6293fd0a3fbc7f630000002f
+       VPCMPW $47, -7(DI), X0, K2, K7                     // 62f3fd0a3fbff9ffffff2f
+       VPCMPW $47, X9, X0, K2, K6                         // 62d3fd0a3ff12f
+       VPCMPW $47, 99(R15)(R15*2), X0, K2, K6             // 6293fd0a3fb47f630000002f
+       VPCMPW $47, -7(DI), X0, K2, K6                     // 62f3fd0a3fb7f9ffffff2f
+       VPCMPW $82, Y7, Y21, K1, K4                        // 62f3d5213fe752
+       VPCMPW $82, 99(R15)(R15*1), Y21, K1, K4            // 6293d5213fa43f6300000052
+       VPCMPW $82, (DX), Y21, K1, K4                      // 62f3d5213f2252
+       VPCMPW $82, Y7, Y21, K1, K6                        // 62f3d5213ff752
+       VPCMPW $82, 99(R15)(R15*1), Y21, K1, K6            // 6293d5213fb43f6300000052
+       VPCMPW $82, (DX), Y21, K1, K6                      // 62f3d5213f3252
+       VPCMPW $126, Z13, Z11, K7, K0                      // 62d3a54f3fc57e
+       VPCMPW $126, Z14, Z11, K7, K0                      // 62d3a54f3fc67e
+       VPCMPW $126, 15(DX)(BX*1), Z11, K7, K0             // 62f3a54f3f841a0f0000007e
+       VPCMPW $126, -7(CX)(DX*2), Z11, K7, K0             // 62f3a54f3f8451f9ffffff7e
+       VPCMPW $126, Z13, Z5, K7, K0                       // 62d3d54f3fc57e
+       VPCMPW $126, Z14, Z5, K7, K0                       // 62d3d54f3fc67e
+       VPCMPW $126, 15(DX)(BX*1), Z5, K7, K0              // 62f3d54f3f841a0f0000007e
+       VPCMPW $126, -7(CX)(DX*2), Z5, K7, K0              // 62f3d54f3f8451f9ffffff7e
+       VPCMPW $126, Z13, Z11, K7, K7                      // 62d3a54f3ffd7e
+       VPCMPW $126, Z14, Z11, K7, K7                      // 62d3a54f3ffe7e
+       VPCMPW $126, 15(DX)(BX*1), Z11, K7, K7             // 62f3a54f3fbc1a0f0000007e
+       VPCMPW $126, -7(CX)(DX*2), Z11, K7, K7             // 62f3a54f3fbc51f9ffffff7e
+       VPCMPW $126, Z13, Z5, K7, K7                       // 62d3d54f3ffd7e
+       VPCMPW $126, Z14, Z5, K7, K7                       // 62d3d54f3ffe7e
+       VPCMPW $126, 15(DX)(BX*1), Z5, K7, K7              // 62f3d54f3fbc1a0f0000007e
+       VPCMPW $126, -7(CX)(DX*2), Z5, K7, K7              // 62f3d54f3fbc51f9ffffff7e
+       VPERMI2W X16, X20, K2, X7                          // 62b2dd0275f8
+       VPERMI2W 7(SI)(DI*1), X20, K2, X7                  // 62f2dd0275bc3e07000000
+       VPERMI2W 15(DX)(BX*8), X20, K2, X7                 // 62f2dd0275bcda0f000000
+       VPERMI2W Y18, Y14, K5, Y12                         // 62328d2d75e2
+       VPERMI2W -7(CX)(DX*1), Y14, K5, Y12                // 62728d2d75a411f9ffffff
+       VPERMI2W -15(R14)(R15*4), Y14, K5, Y12             // 62128d2d75a4bef1ffffff
+       VPERMI2W Z28, Z12, K3, Z1                          // 62929d4b75cc
+       VPERMI2W Z13, Z12, K3, Z1                          // 62d29d4b75cd
+       VPERMI2W 99(R15)(R15*8), Z12, K3, Z1               // 62929d4b758cff63000000
+       VPERMI2W 7(AX)(CX*8), Z12, K3, Z1                  // 62f29d4b758cc807000000
+       VPERMI2W Z28, Z16, K3, Z1                          // 6292fd4375cc
+       VPERMI2W Z13, Z16, K3, Z1                          // 62d2fd4375cd
+       VPERMI2W 99(R15)(R15*8), Z16, K3, Z1               // 6292fd43758cff63000000
+       VPERMI2W 7(AX)(CX*8), Z16, K3, Z1                  // 62f2fd43758cc807000000
+       VPERMI2W Z28, Z12, K3, Z3                          // 62929d4b75dc
+       VPERMI2W Z13, Z12, K3, Z3                          // 62d29d4b75dd
+       VPERMI2W 99(R15)(R15*8), Z12, K3, Z3               // 62929d4b759cff63000000
+       VPERMI2W 7(AX)(CX*8), Z12, K3, Z3                  // 62f29d4b759cc807000000
+       VPERMI2W Z28, Z16, K3, Z3                          // 6292fd4375dc
+       VPERMI2W Z13, Z16, K3, Z3                          // 62d2fd4375dd
+       VPERMI2W 99(R15)(R15*8), Z16, K3, Z3               // 6292fd43759cff63000000
+       VPERMI2W 7(AX)(CX*8), Z16, K3, Z3                  // 62f2fd43759cc807000000
+       VPERMT2W X0, X0, K3, X14                           // 6272fd0b7df0
+       VPERMT2W 15(R8)(R14*1), X0, K3, X14                // 6212fd0b7db4300f000000
+       VPERMT2W 15(R8)(R14*2), X0, K3, X14                // 6212fd0b7db4700f000000
+       VPERMT2W Y8, Y27, K2, Y22                          // 62c2a5227df0
+       VPERMT2W 7(SI)(DI*8), Y27, K2, Y22                 // 62e2a5227db4fe07000000
+       VPERMT2W -15(R14), Y27, K2, Y22                    // 62c2a5227db6f1ffffff
+       VPERMT2W Z22, Z8, K1, Z14                          // 6232bd497df6
+       VPERMT2W Z25, Z8, K1, Z14                          // 6212bd497df1
+       VPERMT2W 17(SP)(BP*2), Z8, K1, Z14                 // 6272bd497db46c11000000
+       VPERMT2W -7(DI)(R8*4), Z8, K1, Z14                 // 6232bd497db487f9ffffff
+       VPERMT2W Z22, Z24, K1, Z14                         // 6232bd417df6
+       VPERMT2W Z25, Z24, K1, Z14                         // 6212bd417df1
+       VPERMT2W 17(SP)(BP*2), Z24, K1, Z14                // 6272bd417db46c11000000
+       VPERMT2W -7(DI)(R8*4), Z24, K1, Z14                // 6232bd417db487f9ffffff
+       VPERMT2W Z22, Z8, K1, Z7                           // 62b2bd497dfe
+       VPERMT2W Z25, Z8, K1, Z7                           // 6292bd497df9
+       VPERMT2W 17(SP)(BP*2), Z8, K1, Z7                  // 62f2bd497dbc6c11000000
+       VPERMT2W -7(DI)(R8*4), Z8, K1, Z7                  // 62b2bd497dbc87f9ffffff
+       VPERMT2W Z22, Z24, K1, Z7                          // 62b2bd417dfe
+       VPERMT2W Z25, Z24, K1, Z7                          // 6292bd417df9
+       VPERMT2W 17(SP)(BP*2), Z24, K1, Z7                 // 62f2bd417dbc6c11000000
+       VPERMT2W -7(DI)(R8*4), Z24, K1, Z7                 // 62b2bd417dbc87f9ffffff
+       VPERMW X17, X11, K2, X25                           // 6222a50a8dc9
+       VPERMW (R14), X11, K2, X25                         // 6242a50a8d0e
+       VPERMW -7(DI)(R8*8), X11, K2, X25                  // 6222a50a8d8cc7f9ffffff
+       VPERMW Y9, Y22, K1, Y9                             // 6252cd218dc9
+       VPERMW 7(SI)(DI*1), Y22, K1, Y9                    // 6272cd218d8c3e07000000
+       VPERMW 15(DX)(BX*8), Y22, K1, Y9                   // 6272cd218d8cda0f000000
+       VPERMW Z0, Z6, K7, Z1                              // 62f2cd4f8dc8
+       VPERMW Z8, Z6, K7, Z1                              // 62d2cd4f8dc8
+       VPERMW 15(R8), Z6, K7, Z1                          // 62d2cd4f8d880f000000
+       VPERMW (BP), Z6, K7, Z1                            // 62f2cd4f8d4d00
+       VPERMW Z0, Z2, K7, Z1                              // 62f2ed4f8dc8
+       VPERMW Z8, Z2, K7, Z1                              // 62d2ed4f8dc8
+       VPERMW 15(R8), Z2, K7, Z1                          // 62d2ed4f8d880f000000
+       VPERMW (BP), Z2, K7, Z1                            // 62f2ed4f8d4d00
+       VPERMW Z0, Z6, K7, Z16                             // 62e2cd4f8dc0
+       VPERMW Z8, Z6, K7, Z16                             // 62c2cd4f8dc0
+       VPERMW 15(R8), Z6, K7, Z16                         // 62c2cd4f8d800f000000
+       VPERMW (BP), Z6, K7, Z16                           // 62e2cd4f8d4500
+       VPERMW Z0, Z2, K7, Z16                             // 62e2ed4f8dc0
+       VPERMW Z8, Z2, K7, Z16                             // 62c2ed4f8dc0
+       VPERMW 15(R8), Z2, K7, Z16                         // 62c2ed4f8d800f000000
+       VPERMW (BP), Z2, K7, Z16                           // 62e2ed4f8d4500
+       VPEXTRB $79, X26, AX                               // 62637d0814d04f or 6263fd0814d04f
+       VPEXTRB $79, X26, R9                               // 62437d0814d14f or 6243fd0814d14f
+       VPEXTRB $79, X26, 7(SI)(DI*1)                      // 62637d0814543e074f or 6263fd0814543e074f
+       VPEXTRB $79, X26, 15(DX)(BX*8)                     // 62637d081454da0f4f or 6263fd081454da0f4f
+       VPMADDUBSW X21, X16, K2, X0                        // 62b27d0204c5 or 62b2fd0204c5
+       VPMADDUBSW 15(R8)(R14*8), X16, K2, X0              // 62927d020484f00f000000 or 6292fd020484f00f000000
+       VPMADDUBSW -15(R14)(R15*2), X16, K2, X0            // 62927d0204847ef1ffffff or 6292fd0204847ef1ffffff
+       VPMADDUBSW Y3, Y31, K4, Y11                        // 6272052404db or 6272852404db
+       VPMADDUBSW -17(BP)(SI*2), Y31, K4, Y11             // 62720524049c75efffffff or 62728524049c75efffffff
+       VPMADDUBSW 7(AX)(CX*2), Y31, K4, Y11               // 62720524049c4807000000 or 62728524049c4807000000
+       VPMADDUBSW Z6, Z22, K1, Z12                        // 62724d4104e6 or 6272cd4104e6
+       VPMADDUBSW Z8, Z22, K1, Z12                        // 62524d4104e0 or 6252cd4104e0
+       VPMADDUBSW 99(R15)(R15*1), Z22, K1, Z12            // 62124d4104a43f63000000 or 6212cd4104a43f63000000
+       VPMADDUBSW (DX), Z22, K1, Z12                      // 62724d410422 or 6272cd410422
+       VPMADDUBSW Z6, Z11, K1, Z12                        // 6272254904e6 or 6272a54904e6
+       VPMADDUBSW Z8, Z11, K1, Z12                        // 6252254904e0 or 6252a54904e0
+       VPMADDUBSW 99(R15)(R15*1), Z11, K1, Z12            // 6212254904a43f63000000 or 6212a54904a43f63000000
+       VPMADDUBSW (DX), Z11, K1, Z12                      // 627225490422 or 6272a5490422
+       VPMADDUBSW Z6, Z22, K1, Z27                        // 62624d4104de or 6262cd4104de
+       VPMADDUBSW Z8, Z22, K1, Z27                        // 62424d4104d8 or 6242cd4104d8
+       VPMADDUBSW 99(R15)(R15*1), Z22, K1, Z27            // 62024d41049c3f63000000 or 6202cd41049c3f63000000
+       VPMADDUBSW (DX), Z22, K1, Z27                      // 62624d41041a or 6262cd41041a
+       VPMADDUBSW Z6, Z11, K1, Z27                        // 6262254904de or 6262a54904de
+       VPMADDUBSW Z8, Z11, K1, Z27                        // 6242254904d8 or 6242a54904d8
+       VPMADDUBSW 99(R15)(R15*1), Z11, K1, Z27            // 62022549049c3f63000000 or 6202a549049c3f63000000
+       VPMADDUBSW (DX), Z11, K1, Z27                      // 62622549041a or 6262a549041a
+       VPMADDWD X22, X28, K3, X0                          // 62b11d03f5c6 or 62b19d03f5c6
+       VPMADDWD -15(R14)(R15*1), X28, K3, X0              // 62911d03f5843ef1ffffff or 62919d03f5843ef1ffffff
+       VPMADDWD -15(BX), X28, K3, X0                      // 62f11d03f583f1ffffff or 62f19d03f583f1ffffff
+       VPMADDWD Y13, Y2, K4, Y14                          // 62516d2cf5f5 or 6251ed2cf5f5
+       VPMADDWD 15(R8)(R14*1), Y2, K4, Y14                // 62116d2cf5b4300f000000 or 6211ed2cf5b4300f000000
+       VPMADDWD 15(R8)(R14*2), Y2, K4, Y14                // 62116d2cf5b4700f000000 or 6211ed2cf5b4700f000000
+       VPMADDWD Z9, Z12, K5, Z25                          // 62411d4df5c9 or 62419d4df5c9
+       VPMADDWD Z12, Z12, K5, Z25                         // 62411d4df5cc or 62419d4df5cc
+       VPMADDWD -17(BP)(SI*8), Z12, K5, Z25               // 62611d4df58cf5efffffff or 62619d4df58cf5efffffff
+       VPMADDWD (R15), Z12, K5, Z25                       // 62411d4df50f or 62419d4df50f
+       VPMADDWD Z9, Z17, K5, Z25                          // 62417545f5c9 or 6241f545f5c9
+       VPMADDWD Z12, Z17, K5, Z25                         // 62417545f5cc or 6241f545f5cc
+       VPMADDWD -17(BP)(SI*8), Z17, K5, Z25               // 62617545f58cf5efffffff or 6261f545f58cf5efffffff
+       VPMADDWD (R15), Z17, K5, Z25                       // 62417545f50f or 6241f545f50f
+       VPMADDWD Z9, Z12, K5, Z12                          // 62511d4df5e1 or 62519d4df5e1
+       VPMADDWD Z12, Z12, K5, Z12                         // 62511d4df5e4 or 62519d4df5e4
+       VPMADDWD -17(BP)(SI*8), Z12, K5, Z12               // 62711d4df5a4f5efffffff or 62719d4df5a4f5efffffff
+       VPMADDWD (R15), Z12, K5, Z12                       // 62511d4df527 or 62519d4df527
+       VPMADDWD Z9, Z17, K5, Z12                          // 62517545f5e1 or 6251f545f5e1
+       VPMADDWD Z12, Z17, K5, Z12                         // 62517545f5e4 or 6251f545f5e4
+       VPMADDWD -17(BP)(SI*8), Z17, K5, Z12               // 62717545f5a4f5efffffff or 6271f545f5a4f5efffffff
+       VPMADDWD (R15), Z17, K5, Z12                       // 62517545f527 or 6251f545f527
+       VPMAXSB X7, X19, K7, X7                            // 62f265073cff or 62f2e5073cff
+       VPMAXSB 7(AX)(CX*4), X19, K7, X7                   // 62f265073cbc8807000000 or 62f2e5073cbc8807000000
+       VPMAXSB 7(AX)(CX*1), X19, K7, X7                   // 62f265073cbc0807000000 or 62f2e5073cbc0807000000
+       VPMAXSB Y22, Y15, K7, Y27                          // 6222052f3cde or 6222852f3cde
+       VPMAXSB (R14), Y15, K7, Y27                        // 6242052f3c1e or 6242852f3c1e
+       VPMAXSB -7(DI)(R8*8), Y15, K7, Y27                 // 6222052f3c9cc7f9ffffff or 6222852f3c9cc7f9ffffff
+       VPMAXSB Z8, Z3, K6, Z6                             // 62d2654e3cf0 or 62d2e54e3cf0
+       VPMAXSB Z2, Z3, K6, Z6                             // 62f2654e3cf2 or 62f2e54e3cf2
+       VPMAXSB 7(SI)(DI*8), Z3, K6, Z6                    // 62f2654e3cb4fe07000000 or 62f2e54e3cb4fe07000000
+       VPMAXSB -15(R14), Z3, K6, Z6                       // 62d2654e3cb6f1ffffff or 62d2e54e3cb6f1ffffff
+       VPMAXSB Z8, Z21, K6, Z6                            // 62d255463cf0 or 62d2d5463cf0
+       VPMAXSB Z2, Z21, K6, Z6                            // 62f255463cf2 or 62f2d5463cf2
+       VPMAXSB 7(SI)(DI*8), Z21, K6, Z6                   // 62f255463cb4fe07000000 or 62f2d5463cb4fe07000000
+       VPMAXSB -15(R14), Z21, K6, Z6                      // 62d255463cb6f1ffffff or 62d2d5463cb6f1ffffff
+       VPMAXSB Z8, Z3, K6, Z25                            // 6242654e3cc8 or 6242e54e3cc8
+       VPMAXSB Z2, Z3, K6, Z25                            // 6262654e3cca or 6262e54e3cca
+       VPMAXSB 7(SI)(DI*8), Z3, K6, Z25                   // 6262654e3c8cfe07000000 or 6262e54e3c8cfe07000000
+       VPMAXSB -15(R14), Z3, K6, Z25                      // 6242654e3c8ef1ffffff or 6242e54e3c8ef1ffffff
+       VPMAXSB Z8, Z21, K6, Z25                           // 624255463cc8 or 6242d5463cc8
+       VPMAXSB Z2, Z21, K6, Z25                           // 626255463cca or 6262d5463cca
+       VPMAXSB 7(SI)(DI*8), Z21, K6, Z25                  // 626255463c8cfe07000000 or 6262d5463c8cfe07000000
+       VPMAXSB -15(R14), Z21, K6, Z25                     // 624255463c8ef1ffffff or 6242d5463c8ef1ffffff
+       VPMAXSW X12, X0, K5, X12                           // 62517d0deee4 or 6251fd0deee4
+       VPMAXSW 7(SI)(DI*4), X0, K5, X12                   // 62717d0deea4be07000000 or 6271fd0deea4be07000000
+       VPMAXSW -7(DI)(R8*2), X0, K5, X12                  // 62317d0deea447f9ffffff or 6231fd0deea447f9ffffff
+       VPMAXSW Y14, Y19, K3, Y23                          // 62c16523eefe or 62c1e523eefe
+       VPMAXSW 99(R15)(R15*2), Y19, K3, Y23               // 62816523eebc7f63000000 or 6281e523eebc7f63000000
+       VPMAXSW -7(DI), Y19, K3, Y23                       // 62e16523eebff9ffffff or 62e1e523eebff9ffffff
+       VPMAXSW Z18, Z11, K4, Z12                          // 6231254ceee2 or 6231a54ceee2
+       VPMAXSW Z24, Z11, K4, Z12                          // 6211254ceee0 or 6211a54ceee0
+       VPMAXSW -7(CX), Z11, K4, Z12                       // 6271254ceea1f9ffffff or 6271a54ceea1f9ffffff
+       VPMAXSW 15(DX)(BX*4), Z11, K4, Z12                 // 6271254ceea49a0f000000 or 6271a54ceea49a0f000000
+       VPMAXSW Z18, Z5, K4, Z12                           // 6231554ceee2 or 6231d54ceee2
+       VPMAXSW Z24, Z5, K4, Z12                           // 6211554ceee0 or 6211d54ceee0
+       VPMAXSW -7(CX), Z5, K4, Z12                        // 6271554ceea1f9ffffff or 6271d54ceea1f9ffffff
+       VPMAXSW 15(DX)(BX*4), Z5, K4, Z12                  // 6271554ceea49a0f000000 or 6271d54ceea49a0f000000
+       VPMAXSW Z18, Z11, K4, Z22                          // 62a1254ceef2 or 62a1a54ceef2
+       VPMAXSW Z24, Z11, K4, Z22                          // 6281254ceef0 or 6281a54ceef0
+       VPMAXSW -7(CX), Z11, K4, Z22                       // 62e1254ceeb1f9ffffff or 62e1a54ceeb1f9ffffff
+       VPMAXSW 15(DX)(BX*4), Z11, K4, Z22                 // 62e1254ceeb49a0f000000 or 62e1a54ceeb49a0f000000
+       VPMAXSW Z18, Z5, K4, Z22                           // 62a1554ceef2 or 62a1d54ceef2
+       VPMAXSW Z24, Z5, K4, Z22                           // 6281554ceef0 or 6281d54ceef0
+       VPMAXSW -7(CX), Z5, K4, Z22                        // 62e1554ceeb1f9ffffff or 62e1d54ceeb1f9ffffff
+       VPMAXSW 15(DX)(BX*4), Z5, K4, Z22                  // 62e1554ceeb49a0f000000 or 62e1d54ceeb49a0f000000
+       VPMAXUB X17, X5, K2, X14                           // 6231550adef1 or 6231d50adef1
+       VPMAXUB 17(SP), X5, K2, X14                        // 6271550adeb42411000000 or 6271d50adeb42411000000
+       VPMAXUB -17(BP)(SI*4), X5, K2, X14                 // 6271550adeb4b5efffffff or 6271d50adeb4b5efffffff
+       VPMAXUB Y16, Y5, K2, Y21                           // 62a1552adee8 or 62a1d52adee8
+       VPMAXUB -7(CX)(DX*1), Y5, K2, Y21                  // 62e1552adeac11f9ffffff or 62e1d52adeac11f9ffffff
+       VPMAXUB -15(R14)(R15*4), Y5, K2, Y21               // 6281552adeacbef1ffffff or 6281d52adeacbef1ffffff
+       VPMAXUB Z6, Z7, K3, Z2                             // 62f1454bded6 or 62f1c54bded6
+       VPMAXUB Z16, Z7, K3, Z2                            // 62b1454bded0 or 62b1c54bded0
+       VPMAXUB 99(R15)(R15*8), Z7, K3, Z2                 // 6291454bde94ff63000000 or 6291c54bde94ff63000000
+       VPMAXUB 7(AX)(CX*8), Z7, K3, Z2                    // 62f1454bde94c807000000 or 62f1c54bde94c807000000
+       VPMAXUB Z6, Z13, K3, Z2                            // 62f1154bded6 or 62f1954bded6
+       VPMAXUB Z16, Z13, K3, Z2                           // 62b1154bded0 or 62b1954bded0
+       VPMAXUB 99(R15)(R15*8), Z13, K3, Z2                // 6291154bde94ff63000000 or 6291954bde94ff63000000
+       VPMAXUB 7(AX)(CX*8), Z13, K3, Z2                   // 62f1154bde94c807000000 or 62f1954bde94c807000000
+       VPMAXUB Z6, Z7, K3, Z21                            // 62e1454bdeee or 62e1c54bdeee
+       VPMAXUB Z16, Z7, K3, Z21                           // 62a1454bdee8 or 62a1c54bdee8
+       VPMAXUB 99(R15)(R15*8), Z7, K3, Z21                // 6281454bdeacff63000000 or 6281c54bdeacff63000000
+       VPMAXUB 7(AX)(CX*8), Z7, K3, Z21                   // 62e1454bdeacc807000000 or 62e1c54bdeacc807000000
+       VPMAXUB Z6, Z13, K3, Z21                           // 62e1154bdeee or 62e1954bdeee
+       VPMAXUB Z16, Z13, K3, Z21                          // 62a1154bdee8 or 62a1954bdee8
+       VPMAXUB 99(R15)(R15*8), Z13, K3, Z21               // 6281154bdeacff63000000 or 6281954bdeacff63000000
+       VPMAXUB 7(AX)(CX*8), Z13, K3, Z21                  // 62e1154bdeacc807000000 or 62e1954bdeacc807000000
+       VPMAXUW X9, X24, K7, X28                           // 62423d073ee1 or 6242bd073ee1
+       VPMAXUW -17(BP)(SI*8), X24, K7, X28                // 62623d073ea4f5efffffff or 6262bd073ea4f5efffffff
+       VPMAXUW (R15), X24, K7, X28                        // 62423d073e27 or 6242bd073e27
+       VPMAXUW Y7, Y19, K1, Y11                           // 627265213edf or 6272e5213edf
+       VPMAXUW 17(SP)(BP*2), Y19, K1, Y11                 // 627265213e9c6c11000000 or 6272e5213e9c6c11000000
+       VPMAXUW -7(DI)(R8*4), Y19, K1, Y11                 // 623265213e9c87f9ffffff or 6232e5213e9c87f9ffffff
+       VPMAXUW Z12, Z1, K1, Z20                           // 62c275493ee4 or 62c2f5493ee4
+       VPMAXUW Z16, Z1, K1, Z20                           // 62a275493ee0 or 62a2f5493ee0
+       VPMAXUW 15(R8)(R14*4), Z1, K1, Z20                 // 628275493ea4b00f000000 or 6282f5493ea4b00f000000
+       VPMAXUW -7(CX)(DX*4), Z1, K1, Z20                  // 62e275493ea491f9ffffff or 62e2f5493ea491f9ffffff
+       VPMAXUW Z12, Z3, K1, Z20                           // 62c265493ee4 or 62c2e5493ee4
+       VPMAXUW Z16, Z3, K1, Z20                           // 62a265493ee0 or 62a2e5493ee0
+       VPMAXUW 15(R8)(R14*4), Z3, K1, Z20                 // 628265493ea4b00f000000 or 6282e5493ea4b00f000000
+       VPMAXUW -7(CX)(DX*4), Z3, K1, Z20                  // 62e265493ea491f9ffffff or 62e2e5493ea491f9ffffff
+       VPMAXUW Z12, Z1, K1, Z9                            // 625275493ecc or 6252f5493ecc
+       VPMAXUW Z16, Z1, K1, Z9                            // 623275493ec8 or 6232f5493ec8
+       VPMAXUW 15(R8)(R14*4), Z1, K1, Z9                  // 621275493e8cb00f000000 or 6212f5493e8cb00f000000
+       VPMAXUW -7(CX)(DX*4), Z1, K1, Z9                   // 627275493e8c91f9ffffff or 6272f5493e8c91f9ffffff
+       VPMAXUW Z12, Z3, K1, Z9                            // 625265493ecc or 6252e5493ecc
+       VPMAXUW Z16, Z3, K1, Z9                            // 623265493ec8 or 6232e5493ec8
+       VPMAXUW 15(R8)(R14*4), Z3, K1, Z9                  // 621265493e8cb00f000000 or 6212e5493e8cb00f000000
+       VPMAXUW -7(CX)(DX*4), Z3, K1, Z9                   // 627265493e8c91f9ffffff or 6272e5493e8c91f9ffffff
+       VPMINSB X18, X26, K1, X15                          // 62322d0138fa or 6232ad0138fa
+       VPMINSB 7(SI)(DI*8), X26, K1, X15                  // 62722d0138bcfe07000000 or 6272ad0138bcfe07000000
+       VPMINSB -15(R14), X26, K1, X15                     // 62522d0138bef1ffffff or 6252ad0138bef1ffffff
+       VPMINSB Y3, Y0, K7, Y6                             // 62f27d2f38f3 or 62f2fd2f38f3
+       VPMINSB 15(R8), Y0, K7, Y6                         // 62d27d2f38b00f000000 or 62d2fd2f38b00f000000
+       VPMINSB (BP), Y0, K7, Y6                           // 62f27d2f387500 or 62f2fd2f387500
+       VPMINSB Z3, Z14, K2, Z28                           // 62620d4a38e3 or 62628d4a38e3
+       VPMINSB Z12, Z14, K2, Z28                          // 62420d4a38e4 or 62428d4a38e4
+       VPMINSB (R8), Z14, K2, Z28                         // 62420d4a3820 or 62428d4a3820
+       VPMINSB 15(DX)(BX*2), Z14, K2, Z28                 // 62620d4a38a45a0f000000 or 62628d4a38a45a0f000000
+       VPMINSB Z3, Z28, K2, Z28                           // 62621d4238e3 or 62629d4238e3
+       VPMINSB Z12, Z28, K2, Z28                          // 62421d4238e4 or 62429d4238e4
+       VPMINSB (R8), Z28, K2, Z28                         // 62421d423820 or 62429d423820
+       VPMINSB 15(DX)(BX*2), Z28, K2, Z28                 // 62621d4238a45a0f000000 or 62629d4238a45a0f000000
+       VPMINSB Z3, Z14, K2, Z13                           // 62720d4a38eb or 62728d4a38eb
+       VPMINSB Z12, Z14, K2, Z13                          // 62520d4a38ec or 62528d4a38ec
+       VPMINSB (R8), Z14, K2, Z13                         // 62520d4a3828 or 62528d4a3828
+       VPMINSB 15(DX)(BX*2), Z14, K2, Z13                 // 62720d4a38ac5a0f000000 or 62728d4a38ac5a0f000000
+       VPMINSB Z3, Z28, K2, Z13                           // 62721d4238eb or 62729d4238eb
+       VPMINSB Z12, Z28, K2, Z13                          // 62521d4238ec or 62529d4238ec
+       VPMINSB (R8), Z28, K2, Z13                         // 62521d423828 or 62529d423828
+       VPMINSB 15(DX)(BX*2), Z28, K2, Z13                 // 62721d4238ac5a0f000000 or 62729d4238ac5a0f000000
+       VPMINSW X24, X0, K7, X0                            // 62917d0feac0 or 6291fd0feac0
+       VPMINSW -7(CX), X0, K7, X0                         // 62f17d0fea81f9ffffff or 62f1fd0fea81f9ffffff
+       VPMINSW 15(DX)(BX*4), X0, K7, X0                   // 62f17d0fea849a0f000000 or 62f1fd0fea849a0f000000
+       VPMINSW Y22, Y0, K6, Y7                            // 62b17d2eeafe or 62b1fd2eeafe
+       VPMINSW 7(AX)(CX*4), Y0, K6, Y7                    // 62f17d2eeabc8807000000 or 62f1fd2eeabc8807000000
+       VPMINSW 7(AX)(CX*1), Y0, K6, Y7                    // 62f17d2eeabc0807000000 or 62f1fd2eeabc0807000000
+       VPMINSW Z23, Z20, K3, Z16                          // 62a15d43eac7 or 62a1dd43eac7
+       VPMINSW Z19, Z20, K3, Z16                          // 62a15d43eac3 or 62a1dd43eac3
+       VPMINSW 15(R8)(R14*1), Z20, K3, Z16                // 62815d43ea84300f000000 or 6281dd43ea84300f000000
+       VPMINSW 15(R8)(R14*2), Z20, K3, Z16                // 62815d43ea84700f000000 or 6281dd43ea84700f000000
+       VPMINSW Z23, Z0, K3, Z16                           // 62a17d4beac7 or 62a1fd4beac7
+       VPMINSW Z19, Z0, K3, Z16                           // 62a17d4beac3 or 62a1fd4beac3
+       VPMINSW 15(R8)(R14*1), Z0, K3, Z16                 // 62817d4bea84300f000000 or 6281fd4bea84300f000000
+       VPMINSW 15(R8)(R14*2), Z0, K3, Z16                 // 62817d4bea84700f000000 or 6281fd4bea84700f000000
+       VPMINSW Z23, Z20, K3, Z9                           // 62315d43eacf or 6231dd43eacf
+       VPMINSW Z19, Z20, K3, Z9                           // 62315d43eacb or 6231dd43eacb
+       VPMINSW 15(R8)(R14*1), Z20, K3, Z9                 // 62115d43ea8c300f000000 or 6211dd43ea8c300f000000
+       VPMINSW 15(R8)(R14*2), Z20, K3, Z9                 // 62115d43ea8c700f000000 or 6211dd43ea8c700f000000
+       VPMINSW Z23, Z0, K3, Z9                            // 62317d4beacf or 6231fd4beacf
+       VPMINSW Z19, Z0, K3, Z9                            // 62317d4beacb or 6231fd4beacb
+       VPMINSW 15(R8)(R14*1), Z0, K3, Z9                  // 62117d4bea8c300f000000 or 6211fd4bea8c300f000000
+       VPMINSW 15(R8)(R14*2), Z0, K3, Z9                  // 62117d4bea8c700f000000 or 6211fd4bea8c700f000000
+       VPMINUB X9, X7, K7, X20                            // 62c1450fdae1 or 62c1c50fdae1
+       VPMINUB 99(R15)(R15*8), X7, K7, X20                // 6281450fdaa4ff63000000 or 6281c50fdaa4ff63000000
+       VPMINUB 7(AX)(CX*8), X7, K7, X20                   // 62e1450fdaa4c807000000 or 62e1c50fdaa4c807000000
+       VPMINUB Y1, Y12, K4, Y13                           // 62711d2cdae9 or 62719d2cdae9
+       VPMINUB (SI), Y12, K4, Y13                         // 62711d2cda2e or 62719d2cda2e
+       VPMINUB 7(SI)(DI*2), Y12, K4, Y13                  // 62711d2cdaac7e07000000 or 62719d2cdaac7e07000000
+       VPMINUB Z24, Z0, K4, Z0                            // 62917d4cdac0 or 6291fd4cdac0
+       VPMINUB Z12, Z0, K4, Z0                            // 62d17d4cdac4 or 62d1fd4cdac4
+       VPMINUB (R14), Z0, K4, Z0                          // 62d17d4cda06 or 62d1fd4cda06
+       VPMINUB -7(DI)(R8*8), Z0, K4, Z0                   // 62b17d4cda84c7f9ffffff or 62b1fd4cda84c7f9ffffff
+       VPMINUB Z24, Z25, K4, Z0                           // 62913544dac0 or 6291b544dac0
+       VPMINUB Z12, Z25, K4, Z0                           // 62d13544dac4 or 62d1b544dac4
+       VPMINUB (R14), Z25, K4, Z0                         // 62d13544da06 or 62d1b544da06
+       VPMINUB -7(DI)(R8*8), Z25, K4, Z0                  // 62b13544da84c7f9ffffff or 62b1b544da84c7f9ffffff
+       VPMINUB Z24, Z0, K4, Z11                           // 62117d4cdad8 or 6211fd4cdad8
+       VPMINUB Z12, Z0, K4, Z11                           // 62517d4cdadc or 6251fd4cdadc
+       VPMINUB (R14), Z0, K4, Z11                         // 62517d4cda1e or 6251fd4cda1e
+       VPMINUB -7(DI)(R8*8), Z0, K4, Z11                  // 62317d4cda9cc7f9ffffff or 6231fd4cda9cc7f9ffffff
+       VPMINUB Z24, Z25, K4, Z11                          // 62113544dad8 or 6211b544dad8
+       VPMINUB Z12, Z25, K4, Z11                          // 62513544dadc or 6251b544dadc
+       VPMINUB (R14), Z25, K4, Z11                        // 62513544da1e or 6251b544da1e
+       VPMINUB -7(DI)(R8*8), Z25, K4, Z11                 // 62313544da9cc7f9ffffff or 6231b544da9cc7f9ffffff
+       VPMINUW X13, X11, K2, X1                           // 62d2250a3acd or 62d2a50a3acd
+       VPMINUW 15(R8)(R14*4), X11, K2, X1                 // 6292250a3a8cb00f000000 or 6292a50a3a8cb00f000000
+       VPMINUW -7(CX)(DX*4), X11, K2, X1                  // 62f2250a3a8c91f9ffffff or 62f2a50a3a8c91f9ffffff
+       VPMINUW Y13, Y28, K3, Y1                           // 62d21d233acd or 62d29d233acd
+       VPMINUW 17(SP), Y28, K3, Y1                        // 62f21d233a8c2411000000 or 62f29d233a8c2411000000
+       VPMINUW -17(BP)(SI*4), Y28, K3, Y1                 // 62f21d233a8cb5efffffff or 62f29d233a8cb5efffffff
+       VPMINUW Z21, Z31, K3, Z17                          // 62a205433acd or 62a285433acd
+       VPMINUW Z9, Z31, K3, Z17                           // 62c205433ac9 or 62c285433ac9
+       VPMINUW 99(R15)(R15*2), Z31, K3, Z17               // 628205433a8c7f63000000 or 628285433a8c7f63000000
+       VPMINUW -7(DI), Z31, K3, Z17                       // 62e205433a8ff9ffffff or 62e285433a8ff9ffffff
+       VPMINUW Z21, Z0, K3, Z17                           // 62a27d4b3acd or 62a2fd4b3acd
+       VPMINUW Z9, Z0, K3, Z17                            // 62c27d4b3ac9 or 62c2fd4b3ac9
+       VPMINUW 99(R15)(R15*2), Z0, K3, Z17                // 62827d4b3a8c7f63000000 or 6282fd4b3a8c7f63000000
+       VPMINUW -7(DI), Z0, K3, Z17                        // 62e27d4b3a8ff9ffffff or 62e2fd4b3a8ff9ffffff
+       VPMINUW Z21, Z31, K3, Z23                          // 62a205433afd or 62a285433afd
+       VPMINUW Z9, Z31, K3, Z23                           // 62c205433af9 or 62c285433af9
+       VPMINUW 99(R15)(R15*2), Z31, K3, Z23               // 628205433abc7f63000000 or 628285433abc7f63000000
+       VPMINUW -7(DI), Z31, K3, Z23                       // 62e205433abff9ffffff or 62e285433abff9ffffff
+       VPMINUW Z21, Z0, K3, Z23                           // 62a27d4b3afd or 62a2fd4b3afd
+       VPMINUW Z9, Z0, K3, Z23                            // 62c27d4b3af9 or 62c2fd4b3af9
+       VPMINUW 99(R15)(R15*2), Z0, K3, Z23                // 62827d4b3abc7f63000000 or 6282fd4b3abc7f63000000
+       VPMINUW -7(DI), Z0, K3, Z23                        // 62e27d4b3abff9ffffff or 62e2fd4b3abff9ffffff
+       VPMOVB2M X0, K5                                    // 62f27e0829e8
+       VPMOVB2M X0, K4                                    // 62f27e0829e0
+       VPMOVB2M Y7, K4                                    // 62f27e2829e7
+       VPMOVB2M Y7, K6                                    // 62f27e2829f7
+       VPMOVB2M Z6, K1                                    // 62f27e4829ce
+       VPMOVB2M Z9, K1                                    // 62d27e4829c9
+       VPMOVB2M Z6, K3                                    // 62f27e4829de
+       VPMOVB2M Z9, K3                                    // 62d27e4829d9
+       VPMOVM2B K4, X26                                   // 62627e0828d4
+       VPMOVM2B K5, X26                                   // 62627e0828d5
+       VPMOVM2B K2, Y1                                    // 62f27e2828ca
+       VPMOVM2B K7, Y1                                    // 62f27e2828cf
+       VPMOVM2B K0, Z26                                   // 62627e4828d0
+       VPMOVM2B K5, Z26                                   // 62627e4828d5
+       VPMOVM2B K0, Z22                                   // 62e27e4828f0
+       VPMOVM2B K5, Z22                                   // 62e27e4828f5
+       VPMOVM2W K0, X16                                   // 62e2fe0828c0
+       VPMOVM2W K7, X16                                   // 62e2fe0828c7
+       VPMOVM2W K5, Y2                                    // 62f2fe2828d5
+       VPMOVM2W K4, Y2                                    // 62f2fe2828d4
+       VPMOVM2W K4, Z14                                   // 6272fe4828f4
+       VPMOVM2W K6, Z14                                   // 6272fe4828f6
+       VPMOVM2W K4, Z13                                   // 6272fe4828ec
+       VPMOVM2W K6, Z13                                   // 6272fe4828ee
+       VPMOVSWB X18, K3, X0                               // 62e27e0b20d0
+       VPMOVSWB X18, K3, -7(CX)                           // 62e27e0b2091f9ffffff
+       VPMOVSWB X18, K3, 15(DX)(BX*4)                     // 62e27e0b20949a0f000000
+       VPMOVSWB Y6, K3, X8                                // 62d27e2b20f0
+       VPMOVSWB Y6, K3, -7(CX)(DX*1)                      // 62f27e2b20b411f9ffffff
+       VPMOVSWB Y6, K3, -15(R14)(R15*4)                   // 62927e2b20b4bef1ffffff
+       VPMOVSWB Z22, K3, Y21                              // 62a27e4b20f5
+       VPMOVSWB Z25, K3, Y21                              // 62227e4b20cd
+       VPMOVSWB Z22, K3, 7(SI)(DI*1)                      // 62e27e4b20b43e07000000
+       VPMOVSWB Z25, K3, 7(SI)(DI*1)                      // 62627e4b208c3e07000000
+       VPMOVSWB Z22, K3, 15(DX)(BX*8)                     // 62e27e4b20b4da0f000000
+       VPMOVSWB Z25, K3, 15(DX)(BX*8)                     // 62627e4b208cda0f000000
+       VPMOVSXBW X13, K1, Y28                             // 62427d2920e5 or 6242fd2920e5
+       VPMOVSXBW -17(BP), K1, Y28                         // 62627d2920a5efffffff or 6262fd2920a5efffffff
+       VPMOVSXBW -15(R14)(R15*8), K1, Y28                 // 62027d2920a4fef1ffffff or 6202fd2920a4fef1ffffff
+       VPMOVSXBW X24, K1, X8                              // 62127d0920c0 or 6212fd0920c0
+       VPMOVSXBW (BX), K1, X8                             // 62727d092003 or 6272fd092003
+       VPMOVSXBW -17(BP)(SI*1), K1, X8                    // 62727d09208435efffffff or 6272fd09208435efffffff
+       VPMOVSXBW Y20, K7, Z0                              // 62b27d4f20c4 or 62b2fd4f20c4
+       VPMOVSXBW -7(DI)(R8*1), K7, Z0                     // 62b27d4f208407f9ffffff or 62b2fd4f208407f9ffffff
+       VPMOVSXBW (SP), K7, Z0                             // 62f27d4f200424 or 62f2fd4f200424
+       VPMOVSXBW Y20, K7, Z8                              // 62327d4f20c4 or 6232fd4f20c4
+       VPMOVSXBW -7(DI)(R8*1), K7, Z8                     // 62327d4f208407f9ffffff or 6232fd4f208407f9ffffff
+       VPMOVSXBW (SP), K7, Z8                             // 62727d4f200424 or 6272fd4f200424
+       VPMOVUSWB X6, K1, X6                               // 62f27e0910f6
+       VPMOVUSWB X6, K1, 99(R15)(R15*2)                   // 62927e0910b47f63000000
+       VPMOVUSWB X6, K1, -7(DI)                           // 62f27e0910b7f9ffffff
+       VPMOVUSWB Y15, K2, X22                             // 62327e2a10fe
+       VPMOVUSWB Y15, K2, 7(SI)(DI*4)                     // 62727e2a10bcbe07000000
+       VPMOVUSWB Y15, K2, -7(DI)(R8*2)                    // 62327e2a10bc47f9ffffff
+       VPMOVUSWB Z28, K1, Y1                              // 62627e4910e1
+       VPMOVUSWB Z6, K1, Y1                               // 62f27e4910f1
+       VPMOVUSWB Z28, K1, 15(R8)(R14*4)                   // 62027e4910a4b00f000000
+       VPMOVUSWB Z6, K1, 15(R8)(R14*4)                    // 62927e4910b4b00f000000
+       VPMOVUSWB Z28, K1, -7(CX)(DX*4)                    // 62627e4910a491f9ffffff
+       VPMOVUSWB Z6, K1, -7(CX)(DX*4)                     // 62f27e4910b491f9ffffff
+       VPMOVW2M X12, K4                                   // 62d2fe0829e4
+       VPMOVW2M X12, K6                                   // 62d2fe0829f4
+       VPMOVW2M Y27, K4                                   // 6292fe2829e3
+       VPMOVW2M Y27, K5                                   // 6292fe2829eb
+       VPMOVW2M Z13, K2                                   // 62d2fe4829d5
+       VPMOVW2M Z21, K2                                   // 62b2fe4829d5
+       VPMOVW2M Z13, K7                                   // 62d2fe4829fd
+       VPMOVW2M Z21, K7                                   // 62b2fe4829fd
+       VPMOVWB X28, K7, X16                               // 62227e0f30e0
+       VPMOVWB X28, K7, -7(CX)(DX*1)                      // 62627e0f30a411f9ffffff
+       VPMOVWB X28, K7, -15(R14)(R15*4)                   // 62027e0f30a4bef1ffffff
+       VPMOVWB Y19, K1, X8                                // 62c27e2930d8
+       VPMOVWB Y19, K1, 17(SP)                            // 62e27e29309c2411000000
+       VPMOVWB Y19, K1, -17(BP)(SI*4)                     // 62e27e29309cb5efffffff
+       VPMOVWB Z26, K1, Y5                                // 62627e4930d5
+       VPMOVWB Z3, K1, Y5                                 // 62f27e4930dd
+       VPMOVWB Z26, K1, (R8)                              // 62427e493010
+       VPMOVWB Z3, K1, (R8)                               // 62d27e493018
+       VPMOVWB Z26, K1, 15(DX)(BX*2)                      // 62627e4930945a0f000000
+       VPMOVWB Z3, K1, 15(DX)(BX*2)                       // 62f27e49309c5a0f000000
+       VPMOVZXBW X0, K4, Y21                              // 62e27d2c30e8 or 62e2fd2c30e8
+       VPMOVZXBW 99(R15)(R15*1), K4, Y21                  // 62827d2c30ac3f63000000 or 6282fd2c30ac3f63000000
+       VPMOVZXBW (DX), K4, Y21                            // 62e27d2c302a or 62e2fd2c302a
+       VPMOVZXBW X11, K5, X25                             // 62427d0d30cb or 6242fd0d30cb
+       VPMOVZXBW 17(SP)(BP*2), K5, X25                    // 62627d0d308c6c11000000 or 6262fd0d308c6c11000000
+       VPMOVZXBW -7(DI)(R8*4), K5, X25                    // 62227d0d308c87f9ffffff or 6222fd0d308c87f9ffffff
+       VPMOVZXBW Y7, K7, Z11                              // 62727d4f30df or 6272fd4f30df
+       VPMOVZXBW 17(SP)(BP*1), K7, Z11                    // 62727d4f309c2c11000000 or 6272fd4f309c2c11000000
+       VPMOVZXBW -7(CX)(DX*8), K7, Z11                    // 62727d4f309cd1f9ffffff or 6272fd4f309cd1f9ffffff
+       VPMOVZXBW Y7, K7, Z25                              // 62627d4f30cf or 6262fd4f30cf
+       VPMOVZXBW 17(SP)(BP*1), K7, Z25                    // 62627d4f308c2c11000000 or 6262fd4f308c2c11000000
+       VPMOVZXBW -7(CX)(DX*8), K7, Z25                    // 62627d4f308cd1f9ffffff or 6262fd4f308cd1f9ffffff
+       VPMULHRSW X30, X15, K2, X11                        // 6212050a0bde or 6212850a0bde
+       VPMULHRSW -7(CX), X15, K2, X11                     // 6272050a0b99f9ffffff or 6272850a0b99f9ffffff
+       VPMULHRSW 15(DX)(BX*4), X15, K2, X11               // 6272050a0b9c9a0f000000 or 6272850a0b9c9a0f000000
+       VPMULHRSW Y16, Y21, K3, Y24                        // 622255230bc0 or 6222d5230bc0
+       VPMULHRSW 99(R15)(R15*4), Y21, K3, Y24             // 620255230b84bf63000000 or 6202d5230b84bf63000000
+       VPMULHRSW 15(DX), Y21, K3, Y24                     // 626255230b820f000000 or 6262d5230b820f000000
+       VPMULHRSW Z22, Z12, K3, Z16                        // 62a21d4b0bc6 or 62a29d4b0bc6
+       VPMULHRSW Z11, Z12, K3, Z16                        // 62c21d4b0bc3 or 62c29d4b0bc3
+       VPMULHRSW 15(DX)(BX*1), Z12, K3, Z16               // 62e21d4b0b841a0f000000 or 62e29d4b0b841a0f000000
+       VPMULHRSW -7(CX)(DX*2), Z12, K3, Z16               // 62e21d4b0b8451f9ffffff or 62e29d4b0b8451f9ffffff
+       VPMULHRSW Z22, Z27, K3, Z16                        // 62a225430bc6 or 62a2a5430bc6
+       VPMULHRSW Z11, Z27, K3, Z16                        // 62c225430bc3 or 62c2a5430bc3
+       VPMULHRSW 15(DX)(BX*1), Z27, K3, Z16               // 62e225430b841a0f000000 or 62e2a5430b841a0f000000
+       VPMULHRSW -7(CX)(DX*2), Z27, K3, Z16               // 62e225430b8451f9ffffff or 62e2a5430b8451f9ffffff
+       VPMULHRSW Z22, Z12, K3, Z13                        // 62321d4b0bee or 62329d4b0bee
+       VPMULHRSW Z11, Z12, K3, Z13                        // 62521d4b0beb or 62529d4b0beb
+       VPMULHRSW 15(DX)(BX*1), Z12, K3, Z13               // 62721d4b0bac1a0f000000 or 62729d4b0bac1a0f000000
+       VPMULHRSW -7(CX)(DX*2), Z12, K3, Z13               // 62721d4b0bac51f9ffffff or 62729d4b0bac51f9ffffff
+       VPMULHRSW Z22, Z27, K3, Z13                        // 623225430bee or 6232a5430bee
+       VPMULHRSW Z11, Z27, K3, Z13                        // 625225430beb or 6252a5430beb
+       VPMULHRSW 15(DX)(BX*1), Z27, K3, Z13               // 627225430bac1a0f000000 or 6272a5430bac1a0f000000
+       VPMULHRSW -7(CX)(DX*2), Z27, K3, Z13               // 627225430bac51f9ffffff or 6272a5430bac51f9ffffff
+       VPMULHUW X12, X6, K3, X13                          // 62514d0be4ec or 6251cd0be4ec
+       VPMULHUW 99(R15)(R15*8), X6, K3, X13               // 62114d0be4acff63000000 or 6211cd0be4acff63000000
+       VPMULHUW 7(AX)(CX*8), X6, K3, X13                  // 62714d0be4acc807000000 or 6271cd0be4acc807000000
+       VPMULHUW Y9, Y13, K2, Y9                           // 6251152ae4c9 or 6251952ae4c9
+       VPMULHUW (CX), Y13, K2, Y9                         // 6271152ae409 or 6271952ae409
+       VPMULHUW 99(R15), Y13, K2, Y9                      // 6251152ae48f63000000 or 6251952ae48f63000000
+       VPMULHUW Z12, Z25, K1, Z6                          // 62d13541e4f4 or 62d1b541e4f4
+       VPMULHUW Z17, Z25, K1, Z6                          // 62b13541e4f1 or 62b1b541e4f1
+       VPMULHUW -17(BP), Z25, K1, Z6                      // 62f13541e4b5efffffff or 62f1b541e4b5efffffff
+       VPMULHUW -15(R14)(R15*8), Z25, K1, Z6              // 62913541e4b4fef1ffffff or 6291b541e4b4fef1ffffff
+       VPMULHUW Z12, Z12, K1, Z6                          // 62d11d49e4f4 or 62d19d49e4f4
+       VPMULHUW Z17, Z12, K1, Z6                          // 62b11d49e4f1 or 62b19d49e4f1
+       VPMULHUW -17(BP), Z12, K1, Z6                      // 62f11d49e4b5efffffff or 62f19d49e4b5efffffff
+       VPMULHUW -15(R14)(R15*8), Z12, K1, Z6              // 62911d49e4b4fef1ffffff or 62919d49e4b4fef1ffffff
+       VPMULHUW Z12, Z25, K1, Z8                          // 62513541e4c4 or 6251b541e4c4
+       VPMULHUW Z17, Z25, K1, Z8                          // 62313541e4c1 or 6231b541e4c1
+       VPMULHUW -17(BP), Z25, K1, Z8                      // 62713541e485efffffff or 6271b541e485efffffff
+       VPMULHUW -15(R14)(R15*8), Z25, K1, Z8              // 62113541e484fef1ffffff or 6211b541e484fef1ffffff
+       VPMULHUW Z12, Z12, K1, Z8                          // 62511d49e4c4 or 62519d49e4c4
+       VPMULHUW Z17, Z12, K1, Z8                          // 62311d49e4c1 or 62319d49e4c1
+       VPMULHUW -17(BP), Z12, K1, Z8                      // 62711d49e485efffffff or 62719d49e485efffffff
+       VPMULHUW -15(R14)(R15*8), Z12, K1, Z8              // 62111d49e484fef1ffffff or 62119d49e484fef1ffffff
+       VPMULHW X8, X30, K2, X23                           // 62c10d02e5f8 or 62c18d02e5f8
+       VPMULHW (AX), X30, K2, X23                         // 62e10d02e538 or 62e18d02e538
+       VPMULHW 7(SI), X30, K2, X23                        // 62e10d02e5be07000000 or 62e18d02e5be07000000
+       VPMULHW Y7, Y3, K1, Y6                             // 62f16529e5f7 or 62f1e529e5f7
+       VPMULHW 99(R15)(R15*2), Y3, K1, Y6                 // 62916529e5b47f63000000 or 6291e529e5b47f63000000
+       VPMULHW -7(DI), Y3, K1, Y6                         // 62f16529e5b7f9ffffff or 62f1e529e5b7f9ffffff
+       VPMULHW Z3, Z6, K7, Z9                             // 62714d4fe5cb or 6271cd4fe5cb
+       VPMULHW Z21, Z6, K7, Z9                            // 62314d4fe5cd or 6231cd4fe5cd
+       VPMULHW 17(SP)(BP*2), Z6, K7, Z9                   // 62714d4fe58c6c11000000 or 6271cd4fe58c6c11000000
+       VPMULHW -7(DI)(R8*4), Z6, K7, Z9                   // 62314d4fe58c87f9ffffff or 6231cd4fe58c87f9ffffff
+       VPMULHW Z3, Z25, K7, Z9                            // 62713547e5cb or 6271b547e5cb
+       VPMULHW Z21, Z25, K7, Z9                           // 62313547e5cd or 6231b547e5cd
+       VPMULHW 17(SP)(BP*2), Z25, K7, Z9                  // 62713547e58c6c11000000 or 6271b547e58c6c11000000
+       VPMULHW -7(DI)(R8*4), Z25, K7, Z9                  // 62313547e58c87f9ffffff or 6231b547e58c87f9ffffff
+       VPMULHW Z3, Z6, K7, Z12                            // 62714d4fe5e3 or 6271cd4fe5e3
+       VPMULHW Z21, Z6, K7, Z12                           // 62314d4fe5e5 or 6231cd4fe5e5
+       VPMULHW 17(SP)(BP*2), Z6, K7, Z12                  // 62714d4fe5a46c11000000 or 6271cd4fe5a46c11000000
+       VPMULHW -7(DI)(R8*4), Z6, K7, Z12                  // 62314d4fe5a487f9ffffff or 6231cd4fe5a487f9ffffff
+       VPMULHW Z3, Z25, K7, Z12                           // 62713547e5e3 or 6271b547e5e3
+       VPMULHW Z21, Z25, K7, Z12                          // 62313547e5e5 or 6231b547e5e5
+       VPMULHW 17(SP)(BP*2), Z25, K7, Z12                 // 62713547e5a46c11000000 or 6271b547e5a46c11000000
+       VPMULHW -7(DI)(R8*4), Z25, K7, Z12                 // 62313547e5a487f9ffffff or 6231b547e5a487f9ffffff
+       VPMULLW X7, X16, K1, X31                           // 62617d01d5ff or 6261fd01d5ff
+       VPMULLW (R8), X16, K1, X31                         // 62417d01d538 or 6241fd01d538
+       VPMULLW 15(DX)(BX*2), X16, K1, X31                 // 62617d01d5bc5a0f000000 or 6261fd01d5bc5a0f000000
+       VPMULLW Y18, Y31, K3, Y18                          // 62a10523d5d2 or 62a18523d5d2
+       VPMULLW -17(BP), Y31, K3, Y18                      // 62e10523d595efffffff or 62e18523d595efffffff
+       VPMULLW -15(R14)(R15*8), Y31, K3, Y18              // 62810523d594fef1ffffff or 62818523d594fef1ffffff
+       VPMULLW Z11, Z12, K4, Z9                           // 62511d4cd5cb or 62519d4cd5cb
+       VPMULLW Z5, Z12, K4, Z9                            // 62711d4cd5cd or 62719d4cd5cd
+       VPMULLW -15(R14)(R15*1), Z12, K4, Z9               // 62111d4cd58c3ef1ffffff or 62119d4cd58c3ef1ffffff
+       VPMULLW -15(BX), Z12, K4, Z9                       // 62711d4cd58bf1ffffff or 62719d4cd58bf1ffffff
+       VPMULLW Z11, Z22, K4, Z9                           // 62514d44d5cb or 6251cd44d5cb
+       VPMULLW Z5, Z22, K4, Z9                            // 62714d44d5cd or 6271cd44d5cd
+       VPMULLW -15(R14)(R15*1), Z22, K4, Z9               // 62114d44d58c3ef1ffffff or 6211cd44d58c3ef1ffffff
+       VPMULLW -15(BX), Z22, K4, Z9                       // 62714d44d58bf1ffffff or 6271cd44d58bf1ffffff
+       VPMULLW Z11, Z12, K4, Z19                          // 62c11d4cd5db or 62c19d4cd5db
+       VPMULLW Z5, Z12, K4, Z19                           // 62e11d4cd5dd or 62e19d4cd5dd
+       VPMULLW -15(R14)(R15*1), Z12, K4, Z19              // 62811d4cd59c3ef1ffffff or 62819d4cd59c3ef1ffffff
+       VPMULLW -15(BX), Z12, K4, Z19                      // 62e11d4cd59bf1ffffff or 62e19d4cd59bf1ffffff
+       VPMULLW Z11, Z22, K4, Z19                          // 62c14d44d5db or 62c1cd44d5db
+       VPMULLW Z5, Z22, K4, Z19                           // 62e14d44d5dd or 62e1cd44d5dd
+       VPMULLW -15(R14)(R15*1), Z22, K4, Z19              // 62814d44d59c3ef1ffffff or 6281cd44d59c3ef1ffffff
+       VPMULLW -15(BX), Z22, K4, Z19                      // 62e14d44d59bf1ffffff or 62e1cd44d59bf1ffffff
+       VPSADBW X7, X3, X31                                // 62616508f6ff or 6261e508f6ff
+       VPSADBW 17(SP)(BP*8), X3, X31                      // 62616508f6bcec11000000 or 6261e508f6bcec11000000
+       VPSADBW 17(SP)(BP*4), X3, X31                      // 62616508f6bcac11000000 or 6261e508f6bcac11000000
+       VPSADBW Y14, Y9, Y22                               // 62c13528f6f6 or 62c1b528f6f6
+       VPSADBW 99(R15)(R15*8), Y9, Y22                    // 62813528f6b4ff63000000 or 6281b528f6b4ff63000000
+       VPSADBW 7(AX)(CX*8), Y9, Y22                       // 62e13528f6b4c807000000 or 62e1b528f6b4c807000000
+       VPSADBW Z7, Z26, Z30                               // 62612d40f6f7 or 6261ad40f6f7
+       VPSADBW Z21, Z26, Z30                              // 62212d40f6f5 or 6221ad40f6f5
+       VPSADBW (R8), Z26, Z30                             // 62412d40f630 or 6241ad40f630
+       VPSADBW 15(DX)(BX*2), Z26, Z30                     // 62612d40f6b45a0f000000 or 6261ad40f6b45a0f000000
+       VPSADBW Z7, Z22, Z30                               // 62614d40f6f7 or 6261cd40f6f7
+       VPSADBW Z21, Z22, Z30                              // 62214d40f6f5 or 6221cd40f6f5
+       VPSADBW (R8), Z22, Z30                             // 62414d40f630 or 6241cd40f630
+       VPSADBW 15(DX)(BX*2), Z22, Z30                     // 62614d40f6b45a0f000000 or 6261cd40f6b45a0f000000
+       VPSADBW Z7, Z26, Z5                                // 62f12d40f6ef or 62f1ad40f6ef
+       VPSADBW Z21, Z26, Z5                               // 62b12d40f6ed or 62b1ad40f6ed
+       VPSADBW (R8), Z26, Z5                              // 62d12d40f628 or 62d1ad40f628
+       VPSADBW 15(DX)(BX*2), Z26, Z5                      // 62f12d40f6ac5a0f000000 or 62f1ad40f6ac5a0f000000
+       VPSADBW Z7, Z22, Z5                                // 62f14d40f6ef or 62f1cd40f6ef
+       VPSADBW Z21, Z22, Z5                               // 62b14d40f6ed or 62b1cd40f6ed
+       VPSADBW (R8), Z22, Z5                              // 62d14d40f628 or 62d1cd40f628
+       VPSADBW 15(DX)(BX*2), Z22, Z5                      // 62f14d40f6ac5a0f000000 or 62f1cd40f6ac5a0f000000
+       VPSHUFB X13, X9, K5, X0                            // 62d2350d00c5 or 62d2b50d00c5
+       VPSHUFB 15(R8)(R14*4), X9, K5, X0                  // 6292350d0084b00f000000 or 6292b50d0084b00f000000
+       VPSHUFB -7(CX)(DX*4), X9, K5, X0                   // 62f2350d008491f9ffffff or 62f2b50d008491f9ffffff
+       VPSHUFB Y2, Y16, K7, Y5                            // 62f27d2700ea or 62f2fd2700ea
+       VPSHUFB 15(DX)(BX*1), Y16, K7, Y5                  // 62f27d2700ac1a0f000000 or 62f2fd2700ac1a0f000000
+       VPSHUFB -7(CX)(DX*2), Y16, K7, Y5                  // 62f27d2700ac51f9ffffff or 62f2fd2700ac51f9ffffff
+       VPSHUFB Z9, Z12, K7, Z25                           // 62421d4f00c9 or 62429d4f00c9
+       VPSHUFB Z12, Z12, K7, Z25                          // 62421d4f00cc or 62429d4f00cc
+       VPSHUFB 15(R8)(R14*8), Z12, K7, Z25                // 62021d4f008cf00f000000 or 62029d4f008cf00f000000
+       VPSHUFB -15(R14)(R15*2), Z12, K7, Z25              // 62021d4f008c7ef1ffffff or 62029d4f008c7ef1ffffff
+       VPSHUFB Z9, Z17, K7, Z25                           // 6242754700c9 or 6242f54700c9
+       VPSHUFB Z12, Z17, K7, Z25                          // 6242754700cc or 6242f54700cc
+       VPSHUFB 15(R8)(R14*8), Z17, K7, Z25                // 62027547008cf00f000000 or 6202f547008cf00f000000
+       VPSHUFB -15(R14)(R15*2), Z17, K7, Z25              // 62027547008c7ef1ffffff or 6202f547008c7ef1ffffff
+       VPSHUFB Z9, Z12, K7, Z12                           // 62521d4f00e1 or 62529d4f00e1
+       VPSHUFB Z12, Z12, K7, Z12                          // 62521d4f00e4 or 62529d4f00e4
+       VPSHUFB 15(R8)(R14*8), Z12, K7, Z12                // 62121d4f00a4f00f000000 or 62129d4f00a4f00f000000
+       VPSHUFB -15(R14)(R15*2), Z12, K7, Z12              // 62121d4f00a47ef1ffffff or 62129d4f00a47ef1ffffff
+       VPSHUFB Z9, Z17, K7, Z12                           // 6252754700e1 or 6252f54700e1
+       VPSHUFB Z12, Z17, K7, Z12                          // 6252754700e4 or 6252f54700e4
+       VPSHUFB 15(R8)(R14*8), Z17, K7, Z12                // 6212754700a4f00f000000 or 6212f54700a4f00f000000
+       VPSHUFB -15(R14)(R15*2), Z17, K7, Z12              // 6212754700a47ef1ffffff or 6212f54700a47ef1ffffff
+       VPSHUFHW $13, X11, K2, X31                         // 62417e0a70fb0d or 6241fe0a70fb0d
+       VPSHUFHW $13, -17(BP)(SI*2), K2, X31               // 62617e0a70bc75efffffff0d or 6261fe0a70bc75efffffff0d
+       VPSHUFHW $13, 7(AX)(CX*2), K2, X31                 // 62617e0a70bc48070000000d or 6261fe0a70bc48070000000d
+       VPSHUFHW $65, Y11, K5, Y6                          // 62d17e2d70f341 or 62d1fe2d70f341
+       VPSHUFHW $65, 15(R8), K5, Y6                       // 62d17e2d70b00f00000041 or 62d1fe2d70b00f00000041
+       VPSHUFHW $65, (BP), K5, Y6                         // 62f17e2d70750041 or 62f1fe2d70750041
+       VPSHUFHW $67, Z0, K3, Z7                           // 62f17e4b70f843 or 62f1fe4b70f843
+       VPSHUFHW $67, Z6, K3, Z7                           // 62f17e4b70fe43 or 62f1fe4b70fe43
+       VPSHUFHW $67, (SI), K3, Z7                         // 62f17e4b703e43 or 62f1fe4b703e43
+       VPSHUFHW $67, 7(SI)(DI*2), K3, Z7                  // 62f17e4b70bc7e0700000043 or 62f1fe4b70bc7e0700000043
+       VPSHUFHW $67, Z0, K3, Z9                           // 62717e4b70c843 or 6271fe4b70c843
+       VPSHUFHW $67, Z6, K3, Z9                           // 62717e4b70ce43 or 6271fe4b70ce43
+       VPSHUFHW $67, (SI), K3, Z9                         // 62717e4b700e43 or 6271fe4b700e43
+       VPSHUFHW $67, 7(SI)(DI*2), K3, Z9                  // 62717e4b708c7e0700000043 or 6271fe4b708c7e0700000043
+       VPSHUFLW $127, X5, K4, X22                         // 62e17f0c70f57f or 62e1ff0c70f57f
+       VPSHUFLW $127, 15(R8)(R14*1), K4, X22              // 62817f0c70b4300f0000007f or 6281ff0c70b4300f0000007f
+       VPSHUFLW $127, 15(R8)(R14*2), K4, X22              // 62817f0c70b4700f0000007f or 6281ff0c70b4700f0000007f
+       VPSHUFLW $0, Y7, K2, Y19                           // 62e17f2a70df00 or 62e1ff2a70df00
+       VPSHUFLW $0, 15(R8)(R14*8), K2, Y19                // 62817f2a709cf00f00000000 or 6281ff2a709cf00f00000000
+       VPSHUFLW $0, -15(R14)(R15*2), K2, Y19              // 62817f2a709c7ef1ffffff00 or 6281ff2a709c7ef1ffffff00
+       VPSHUFLW $97, Z3, K2, Z20                          // 62e17f4a70e361 or 62e1ff4a70e361
+       VPSHUFLW $97, Z30, K2, Z20                         // 62817f4a70e661 or 6281ff4a70e661
+       VPSHUFLW $97, 17(SP)(BP*8), K2, Z20                // 62e17f4a70a4ec1100000061 or 62e1ff4a70a4ec1100000061
+       VPSHUFLW $97, 17(SP)(BP*4), K2, Z20                // 62e17f4a70a4ac1100000061 or 62e1ff4a70a4ac1100000061
+       VPSHUFLW $97, Z3, K2, Z28                          // 62617f4a70e361 or 6261ff4a70e361
+       VPSHUFLW $97, Z30, K2, Z28                         // 62017f4a70e661 or 6201ff4a70e661
+       VPSHUFLW $97, 17(SP)(BP*8), K2, Z28                // 62617f4a70a4ec1100000061 or 6261ff4a70a4ec1100000061
+       VPSHUFLW $97, 17(SP)(BP*4), K2, Z28                // 62617f4a70a4ac1100000061 or 6261ff4a70a4ac1100000061
+       VPSLLDQ $64, X8, X18                               // 62d16d0073f840 or 62d1ed0073f840
+       VPSLLDQ $64, -7(CX)(DX*1), X18                     // 62f16d0073bc11f9ffffff40 or 62f1ed0073bc11f9ffffff40
+       VPSLLDQ $64, -15(R14)(R15*4), X18                  // 62916d0073bcbef1ffffff40 or 6291ed0073bcbef1ffffff40
+       VPSLLDQ $27, Y12, Y20                              // 62d15d2073fc1b or 62d1dd2073fc1b
+       VPSLLDQ $27, 7(AX)(CX*4), Y20                      // 62f15d2073bc88070000001b or 62f1dd2073bc88070000001b
+       VPSLLDQ $27, 7(AX)(CX*1), Y20                      // 62f15d2073bc08070000001b or 62f1dd2073bc08070000001b
+       VPSLLDQ $47, Z7, Z2                                // 62f16d4873ff2f or 62f1ed4873ff2f
+       VPSLLDQ $47, Z13, Z2                               // 62d16d4873fd2f or 62d1ed4873fd2f
+       VPSLLDQ $47, 17(SP), Z2                            // 62f16d4873bc24110000002f or 62f1ed4873bc24110000002f
+       VPSLLDQ $47, -17(BP)(SI*4), Z2                     // 62f16d4873bcb5efffffff2f or 62f1ed4873bcb5efffffff2f
+       VPSLLDQ $47, Z7, Z21                               // 62f1554073ff2f or 62f1d54073ff2f
+       VPSLLDQ $47, Z13, Z21                              // 62d1554073fd2f or 62d1d54073fd2f
+       VPSLLDQ $47, 17(SP), Z21                           // 62f1554073bc24110000002f or 62f1d54073bc24110000002f
+       VPSLLDQ $47, -17(BP)(SI*4), Z21                    // 62f1554073bcb5efffffff2f or 62f1d54073bcb5efffffff2f
+       VPSLLVW X11, X1, K7, X22                           // 62c2f50f12f3
+       VPSLLVW 7(AX)(CX*4), X1, K7, X22                   // 62e2f50f12b48807000000
+       VPSLLVW 7(AX)(CX*1), X1, K7, X22                   // 62e2f50f12b40807000000
+       VPSLLVW Y9, Y7, K7, Y17                            // 62c2c52f12c9
+       VPSLLVW 17(SP), Y7, K7, Y17                        // 62e2c52f128c2411000000
+       VPSLLVW -17(BP)(SI*4), Y7, K7, Y17                 // 62e2c52f128cb5efffffff
+       VPSLLVW Z3, Z14, K6, Z28                           // 62628d4e12e3
+       VPSLLVW Z12, Z14, K6, Z28                          // 62428d4e12e4
+       VPSLLVW 7(SI)(DI*8), Z14, K6, Z28                  // 62628d4e12a4fe07000000
+       VPSLLVW -15(R14), Z14, K6, Z28                     // 62428d4e12a6f1ffffff
+       VPSLLVW Z3, Z28, K6, Z28                           // 62629d4612e3
+       VPSLLVW Z12, Z28, K6, Z28                          // 62429d4612e4
+       VPSLLVW 7(SI)(DI*8), Z28, K6, Z28                  // 62629d4612a4fe07000000
+       VPSLLVW -15(R14), Z28, K6, Z28                     // 62429d4612a6f1ffffff
+       VPSLLVW Z3, Z14, K6, Z13                           // 62728d4e12eb
+       VPSLLVW Z12, Z14, K6, Z13                          // 62528d4e12ec
+       VPSLLVW 7(SI)(DI*8), Z14, K6, Z13                  // 62728d4e12acfe07000000
+       VPSLLVW -15(R14), Z14, K6, Z13                     // 62528d4e12aef1ffffff
+       VPSLLVW Z3, Z28, K6, Z13                           // 62729d4612eb
+       VPSLLVW Z12, Z28, K6, Z13                          // 62529d4612ec
+       VPSLLVW 7(SI)(DI*8), Z28, K6, Z13                  // 62729d4612acfe07000000
+       VPSLLVW -15(R14), Z28, K6, Z13                     // 62529d4612aef1ffffff
+       VPSLLW $121, X7, K3, X6                            // 62f14d0b71f779 or 62f1cd0b71f779
+       VPSLLW $121, (SI), K3, X6                          // 62f14d0b713679 or 62f1cd0b713679
+       VPSLLW $121, 7(SI)(DI*2), K3, X6                   // 62f14d0b71b47e0700000079 or 62f1cd0b71b47e0700000079
+       VPSLLW $13, Y8, K7, Y31                            // 62d1052771f00d or 62d1852771f00d
+       VPSLLW $13, 7(AX), K7, Y31                         // 62f1052771b0070000000d or 62f1852771b0070000000d
+       VPSLLW $13, (DI), K7, Y31                          // 62f1052771370d or 62f1852771370d
+       VPSLLW $65, Z19, K4, Z15                           // 62b1054c71f341 or 62b1854c71f341
+       VPSLLW $65, Z15, K4, Z15                           // 62d1054c71f741 or 62d1854c71f741
+       VPSLLW $65, 7(SI)(DI*1), K4, Z15                   // 62f1054c71b43e0700000041 or 62f1854c71b43e0700000041
+       VPSLLW $65, 15(DX)(BX*8), K4, Z15                  // 62f1054c71b4da0f00000041 or 62f1854c71b4da0f00000041
+       VPSLLW $65, Z19, K4, Z30                           // 62b10d4471f341 or 62b18d4471f341
+       VPSLLW $65, Z15, K4, Z30                           // 62d10d4471f741 or 62d18d4471f741
+       VPSLLW $65, 7(SI)(DI*1), K4, Z30                   // 62f10d4471b43e0700000041 or 62f18d4471b43e0700000041
+       VPSLLW $65, 15(DX)(BX*8), K4, Z30                  // 62f10d4471b4da0f00000041 or 62f18d4471b4da0f00000041
+       VPSLLW X3, X31, K4, X8                             // 62710504f1c3 or 62718504f1c3
+       VPSLLW 17(SP)(BP*8), X31, K4, X8                   // 62710504f184ec11000000 or 62718504f184ec11000000
+       VPSLLW 17(SP)(BP*4), X31, K4, X8                   // 62710504f184ac11000000 or 62718504f184ac11000000
+       VPSLLW X28, Y28, K7, Y1                            // 62911d27f1cc or 62919d27f1cc
+       VPSLLW 7(SI)(DI*4), Y28, K7, Y1                    // 62f11d27f18cbe07000000 or 62f19d27f18cbe07000000
+       VPSLLW -7(DI)(R8*2), Y28, K7, Y1                   // 62b11d27f18c47f9ffffff or 62b19d27f18c47f9ffffff
+       VPSLLW X20, Z3, K2, Z5                             // 62b1654af1ec or 62b1e54af1ec
+       VPSLLW 17(SP), Z3, K2, Z5                          // 62f1654af1ac2411000000 or 62f1e54af1ac2411000000
+       VPSLLW -17(BP)(SI*4), Z3, K2, Z5                   // 62f1654af1acb5efffffff or 62f1e54af1acb5efffffff
+       VPSLLW X20, Z5, K2, Z5                             // 62b1554af1ec or 62b1d54af1ec
+       VPSLLW 17(SP), Z5, K2, Z5                          // 62f1554af1ac2411000000 or 62f1d54af1ac2411000000
+       VPSLLW -17(BP)(SI*4), Z5, K2, Z5                   // 62f1554af1acb5efffffff or 62f1d54af1acb5efffffff
+       VPSLLW X20, Z3, K2, Z1                             // 62b1654af1cc or 62b1e54af1cc
+       VPSLLW 17(SP), Z3, K2, Z1                          // 62f1654af18c2411000000 or 62f1e54af18c2411000000
+       VPSLLW -17(BP)(SI*4), Z3, K2, Z1                   // 62f1654af18cb5efffffff or 62f1e54af18cb5efffffff
+       VPSLLW X20, Z5, K2, Z1                             // 62b1554af1cc or 62b1d54af1cc
+       VPSLLW 17(SP), Z5, K2, Z1                          // 62f1554af18c2411000000 or 62f1d54af18c2411000000
+       VPSLLW -17(BP)(SI*4), Z5, K2, Z1                   // 62f1554af18cb5efffffff or 62f1d54af18cb5efffffff
+       VPSRAVW X8, X28, K4, X16                           // 62c29d0411c0
+       VPSRAVW 15(R8)(R14*4), X28, K4, X16                // 62829d041184b00f000000
+       VPSRAVW -7(CX)(DX*4), X28, K4, X16                 // 62e29d04118491f9ffffff
+       VPSRAVW Y7, Y26, K1, Y30                           // 6262ad2111f7
+       VPSRAVW -7(DI)(R8*1), Y26, K1, Y30                 // 6222ad2111b407f9ffffff
+       VPSRAVW (SP), Y26, K1, Y30                         // 6262ad21113424
+       VPSRAVW Z21, Z31, K3, Z17                          // 62a2854311cd
+       VPSRAVW Z9, Z31, K3, Z17                           // 62c2854311c9
+       VPSRAVW (BX), Z31, K3, Z17                         // 62e28543110b
+       VPSRAVW -17(BP)(SI*1), Z31, K3, Z17                // 62e28543118c35efffffff
+       VPSRAVW Z21, Z0, K3, Z17                           // 62a2fd4b11cd
+       VPSRAVW Z9, Z0, K3, Z17                            // 62c2fd4b11c9
+       VPSRAVW (BX), Z0, K3, Z17                          // 62e2fd4b110b
+       VPSRAVW -17(BP)(SI*1), Z0, K3, Z17                 // 62e2fd4b118c35efffffff
+       VPSRAVW Z21, Z31, K3, Z23                          // 62a2854311fd
+       VPSRAVW Z9, Z31, K3, Z23                           // 62c2854311f9
+       VPSRAVW (BX), Z31, K3, Z23                         // 62e28543113b
+       VPSRAVW -17(BP)(SI*1), Z31, K3, Z23                // 62e2854311bc35efffffff
+       VPSRAVW Z21, Z0, K3, Z23                           // 62a2fd4b11fd
+       VPSRAVW Z9, Z0, K3, Z23                            // 62c2fd4b11f9
+       VPSRAVW (BX), Z0, K3, Z23                          // 62e2fd4b113b
+       VPSRAVW -17(BP)(SI*1), Z0, K3, Z23                 // 62e2fd4b11bc35efffffff
+       VPSRAW $79, X11, K4, X15                           // 62d1050c71e34f or 62d1850c71e34f
+       VPSRAW $79, (R8), K4, X15                          // 62d1050c71204f or 62d1850c71204f
+       VPSRAW $79, 15(DX)(BX*2), K4, X15                  // 62f1050c71a45a0f0000004f or 62f1850c71a45a0f0000004f
+       VPSRAW $64, Y1, K5, Y16                            // 62f17d2571e140 or 62f1fd2571e140
+       VPSRAW $64, -7(CX), K5, Y16                        // 62f17d2571a1f9ffffff40 or 62f1fd2571a1f9ffffff40
+       VPSRAW $64, 15(DX)(BX*4), K5, Y16                  // 62f17d2571a49a0f00000040 or 62f1fd2571a49a0f00000040
+       VPSRAW $27, Z1, K7, Z6                             // 62f14d4f71e11b or 62f1cd4f71e11b
+       VPSRAW $27, Z9, K7, Z6                             // 62d14d4f71e11b or 62d1cd4f71e11b
+       VPSRAW $27, 15(R8)(R14*4), K7, Z6                  // 62914d4f71a4b00f0000001b or 6291cd4f71a4b00f0000001b
+       VPSRAW $27, -7(CX)(DX*4), K7, Z6                   // 62f14d4f71a491f9ffffff1b or 62f1cd4f71a491f9ffffff1b
+       VPSRAW $27, Z1, K7, Z9                             // 62f1354f71e11b or 62f1b54f71e11b
+       VPSRAW $27, Z9, K7, Z9                             // 62d1354f71e11b or 62d1b54f71e11b
+       VPSRAW $27, 15(R8)(R14*4), K7, Z9                  // 6291354f71a4b00f0000001b or 6291b54f71a4b00f0000001b
+       VPSRAW $27, -7(CX)(DX*4), K7, Z9                   // 62f1354f71a491f9ffffff1b or 62f1b54f71a491f9ffffff1b
+       VPSRAW X13, X19, K7, X1                            // 62d16507e1cd or 62d1e507e1cd
+       VPSRAW 17(SP)(BP*1), X19, K7, X1                   // 62f16507e18c2c11000000 or 62f1e507e18c2c11000000
+       VPSRAW -7(CX)(DX*8), X19, K7, X1                   // 62f16507e18cd1f9ffffff or 62f1e507e18cd1f9ffffff
+       VPSRAW X2, Y31, K6, Y30                            // 62610526e1f2 or 62618526e1f2
+       VPSRAW -17(BP)(SI*2), Y31, K6, Y30                 // 62610526e1b475efffffff or 62618526e1b475efffffff
+       VPSRAW 7(AX)(CX*2), Y31, K6, Y30                   // 62610526e1b44807000000 or 62618526e1b44807000000
+       VPSRAW X14, Z30, K3, Z20                           // 62c10d43e1e6 or 62c18d43e1e6
+       VPSRAW 15(R8)(R14*1), Z30, K3, Z20                 // 62810d43e1a4300f000000 or 62818d43e1a4300f000000
+       VPSRAW 15(R8)(R14*2), Z30, K3, Z20                 // 62810d43e1a4700f000000 or 62818d43e1a4700f000000
+       VPSRAW X14, Z5, K3, Z20                            // 62c1554be1e6 or 62c1d54be1e6
+       VPSRAW 15(R8)(R14*1), Z5, K3, Z20                  // 6281554be1a4300f000000 or 6281d54be1a4300f000000
+       VPSRAW 15(R8)(R14*2), Z5, K3, Z20                  // 6281554be1a4700f000000 or 6281d54be1a4700f000000
+       VPSRAW X14, Z30, K3, Z9                            // 62510d43e1ce or 62518d43e1ce
+       VPSRAW 15(R8)(R14*1), Z30, K3, Z9                  // 62110d43e18c300f000000 or 62118d43e18c300f000000
+       VPSRAW 15(R8)(R14*2), Z30, K3, Z9                  // 62110d43e18c700f000000 or 62118d43e18c700f000000
+       VPSRAW X14, Z5, K3, Z9                             // 6251554be1ce or 6251d54be1ce
+       VPSRAW 15(R8)(R14*1), Z5, K3, Z9                   // 6211554be18c300f000000 or 6211d54be18c300f000000
+       VPSRAW 15(R8)(R14*2), Z5, K3, Z9                   // 6211554be18c700f000000 or 6211d54be18c700f000000
+       VPSRLDQ $94, -7(CX)(DX*1), X9                      // 62f13508739c11f9ffffff5e or 62f1b508739c11f9ffffff5e
+       VPSRLDQ $94, -15(R14)(R15*4), X9                   // 62913508739cbef1ffffff5e or 6291b508739cbef1ffffff5e
+       VPSRLDQ $121, Y28, Y0                              // 62917d2873dc79 or 6291fd2873dc79
+       VPSRLDQ $121, (AX), Y0                             // 62f17d28731879 or 62f1fd28731879
+       VPSRLDQ $121, 7(SI), Y0                            // 62f17d28739e0700000079 or 62f1fd28739e0700000079
+       VPSRLDQ $13, Z21, Z12                              // 62b11d4873dd0d or 62b19d4873dd0d
+       VPSRLDQ $13, Z9, Z12                               // 62d11d4873d90d or 62d19d4873d90d
+       VPSRLDQ $13, 17(SP)(BP*1), Z12                     // 62f11d48739c2c110000000d or 62f19d48739c2c110000000d
+       VPSRLDQ $13, -7(CX)(DX*8), Z12                     // 62f11d48739cd1f9ffffff0d or 62f19d48739cd1f9ffffff0d
+       VPSRLDQ $13, Z21, Z13                              // 62b1154873dd0d or 62b1954873dd0d
+       VPSRLDQ $13, Z9, Z13                               // 62d1154873d90d or 62d1954873d90d
+       VPSRLDQ $13, 17(SP)(BP*1), Z13                     // 62f11548739c2c110000000d or 62f19548739c2c110000000d
+       VPSRLDQ $13, -7(CX)(DX*8), Z13                     // 62f11548739cd1f9ffffff0d or 62f19548739cd1f9ffffff0d
+       VPSRLVW X30, X23, K1, X12                          // 6212c50110e6
+       VPSRLVW 7(AX)(CX*4), X23, K1, X12                  // 6272c50110a48807000000
+       VPSRLVW 7(AX)(CX*1), X23, K1, X12                  // 6272c50110a40807000000
+       VPSRLVW Y3, Y22, K1, Y12                           // 6272cd2110e3
+       VPSRLVW 17(SP)(BP*1), Y22, K1, Y12                 // 6272cd2110a42c11000000
+       VPSRLVW -7(CX)(DX*8), Y22, K1, Y12                 // 6272cd2110a4d1f9ffffff
+       VPSRLVW Z14, Z15, K1, Z0                           // 62d2854910c6
+       VPSRLVW Z27, Z15, K1, Z0                           // 6292854910c3
+       VPSRLVW 99(R15)(R15*4), Z15, K1, Z0                // 629285491084bf63000000
+       VPSRLVW 15(DX), Z15, K1, Z0                        // 62f2854910820f000000
+       VPSRLVW Z14, Z12, K1, Z0                           // 62d29d4910c6
+       VPSRLVW Z27, Z12, K1, Z0                           // 62929d4910c3
+       VPSRLVW 99(R15)(R15*4), Z12, K1, Z0                // 62929d491084bf63000000
+       VPSRLVW 15(DX), Z12, K1, Z0                        // 62f29d4910820f000000
+       VPSRLVW Z14, Z15, K1, Z8                           // 6252854910c6
+       VPSRLVW Z27, Z15, K1, Z8                           // 6212854910c3
+       VPSRLVW 99(R15)(R15*4), Z15, K1, Z8                // 621285491084bf63000000
+       VPSRLVW 15(DX), Z15, K1, Z8                        // 6272854910820f000000
+       VPSRLVW Z14, Z12, K1, Z8                           // 62529d4910c6
+       VPSRLVW Z27, Z12, K1, Z8                           // 62129d4910c3
+       VPSRLVW 99(R15)(R15*4), Z12, K1, Z8                // 62129d491084bf63000000
+       VPSRLVW 15(DX), Z12, K1, Z8                        // 62729d4910820f000000
+       VPSRLW $0, X20, K7, X8                             // 62b13d0f71d400 or 62b1bd0f71d400
+       VPSRLW $0, (SI), K7, X8                            // 62f13d0f711600 or 62f1bd0f711600
+       VPSRLW $0, 7(SI)(DI*2), K7, X8                     // 62f13d0f71947e0700000000 or 62f1bd0f71947e0700000000
+       VPSRLW $97, Y1, K2, Y15                            // 62f1052a71d161 or 62f1852a71d161
+       VPSRLW $97, -17(BP)(SI*2), K2, Y15                 // 62f1052a719475efffffff61 or 62f1852a719475efffffff61
+       VPSRLW $97, 7(AX)(CX*2), K2, Y15                   // 62f1052a7194480700000061 or 62f1852a7194480700000061
+       VPSRLW $81, Z13, K4, Z11                           // 62d1254c71d551 or 62d1a54c71d551
+       VPSRLW $81, Z14, K4, Z11                           // 62d1254c71d651 or 62d1a54c71d651
+       VPSRLW $81, (CX), K4, Z11                          // 62f1254c711151 or 62f1a54c711151
+       VPSRLW $81, 99(R15), K4, Z11                       // 62d1254c71976300000051 or 62d1a54c71976300000051
+       VPSRLW $81, Z13, K4, Z5                            // 62d1554c71d551 or 62d1d54c71d551
+       VPSRLW $81, Z14, K4, Z5                            // 62d1554c71d651 or 62d1d54c71d651
+       VPSRLW $81, (CX), K4, Z5                           // 62f1554c711151 or 62f1d54c711151
+       VPSRLW $81, 99(R15), K4, Z5                        // 62d1554c71976300000051 or 62d1d54c71976300000051
+       VPSRLW X26, X9, K1, X2                             // 62913509d1d2 or 6291b509d1d2
+       VPSRLW 17(SP)(BP*8), X9, K1, X2                    // 62f13509d194ec11000000 or 62f1b509d194ec11000000
+       VPSRLW 17(SP)(BP*4), X9, K1, X2                    // 62f13509d194ac11000000 or 62f1b509d194ac11000000
+       VPSRLW X19, Y19, K3, Y27                           // 62216523d1db or 6221e523d1db
+       VPSRLW 7(SI)(DI*4), Y19, K3, Y27                   // 62616523d19cbe07000000 or 6261e523d19cbe07000000
+       VPSRLW -7(DI)(R8*2), Y19, K3, Y27                  // 62216523d19c47f9ffffff or 6221e523d19c47f9ffffff
+       VPSRLW X0, Z2, K4, Z5                              // 62f16d4cd1e8 or 62f1ed4cd1e8
+       VPSRLW 17(SP), Z2, K4, Z5                          // 62f16d4cd1ac2411000000 or 62f1ed4cd1ac2411000000
+       VPSRLW -17(BP)(SI*4), Z2, K4, Z5                   // 62f16d4cd1acb5efffffff or 62f1ed4cd1acb5efffffff
+       VPSRLW X0, Z2, K4, Z23                             // 62e16d4cd1f8 or 62e1ed4cd1f8
+       VPSRLW 17(SP), Z2, K4, Z23                         // 62e16d4cd1bc2411000000 or 62e1ed4cd1bc2411000000
+       VPSRLW -17(BP)(SI*4), Z2, K4, Z23                  // 62e16d4cd1bcb5efffffff or 62e1ed4cd1bcb5efffffff
+       VPSUBB X7, X16, K5, X31                            // 62617d05f8ff or 6261fd05f8ff
+       VPSUBB 7(AX), X16, K5, X31                         // 62617d05f8b807000000 or 6261fd05f8b807000000
+       VPSUBB (DI), X16, K5, X31                          // 62617d05f83f or 6261fd05f83f
+       VPSUBB Y13, Y17, K7, Y5                            // 62d17527f8ed or 62d1f527f8ed
+       VPSUBB 15(R8)(R14*1), Y17, K7, Y5                  // 62917527f8ac300f000000 or 6291f527f8ac300f000000
+       VPSUBB 15(R8)(R14*2), Y17, K7, Y5                  // 62917527f8ac700f000000 or 6291f527f8ac700f000000
+       VPSUBB Z28, Z26, K7, Z6                            // 62912d47f8f4 or 6291ad47f8f4
+       VPSUBB Z6, Z26, K7, Z6                             // 62f12d47f8f6 or 62f1ad47f8f6
+       VPSUBB 99(R15)(R15*2), Z26, K7, Z6                 // 62912d47f8b47f63000000 or 6291ad47f8b47f63000000
+       VPSUBB -7(DI), Z26, K7, Z6                         // 62f12d47f8b7f9ffffff or 62f1ad47f8b7f9ffffff
+       VPSUBB Z28, Z14, K7, Z6                            // 62910d4ff8f4 or 62918d4ff8f4
+       VPSUBB Z6, Z14, K7, Z6                             // 62f10d4ff8f6 or 62f18d4ff8f6
+       VPSUBB 99(R15)(R15*2), Z14, K7, Z6                 // 62910d4ff8b47f63000000 or 62918d4ff8b47f63000000
+       VPSUBB -7(DI), Z14, K7, Z6                         // 62f10d4ff8b7f9ffffff or 62f18d4ff8b7f9ffffff
+       VPSUBB Z28, Z26, K7, Z14                           // 62112d47f8f4 or 6211ad47f8f4
+       VPSUBB Z6, Z26, K7, Z14                            // 62712d47f8f6 or 6271ad47f8f6
+       VPSUBB 99(R15)(R15*2), Z26, K7, Z14                // 62112d47f8b47f63000000 or 6211ad47f8b47f63000000
+       VPSUBB -7(DI), Z26, K7, Z14                        // 62712d47f8b7f9ffffff or 6271ad47f8b7f9ffffff
+       VPSUBB Z28, Z14, K7, Z14                           // 62110d4ff8f4 or 62118d4ff8f4
+       VPSUBB Z6, Z14, K7, Z14                            // 62710d4ff8f6 or 62718d4ff8f6
+       VPSUBB 99(R15)(R15*2), Z14, K7, Z14                // 62110d4ff8b47f63000000 or 62118d4ff8b47f63000000
+       VPSUBB -7(DI), Z14, K7, Z14                        // 62710d4ff8b7f9ffffff or 62718d4ff8b7f9ffffff
+       VPSUBSB X28, X0, K2, X21                           // 62817d0ae8ec or 6281fd0ae8ec
+       VPSUBSB 7(SI)(DI*8), X0, K2, X21                   // 62e17d0ae8acfe07000000 or 62e1fd0ae8acfe07000000
+       VPSUBSB -15(R14), X0, K2, X21                      // 62c17d0ae8aef1ffffff or 62c1fd0ae8aef1ffffff
+       VPSUBSB Y24, Y11, K5, Y8                           // 6211252de8c0 or 6211a52de8c0
+       VPSUBSB (CX), Y11, K5, Y8                          // 6271252de801 or 6271a52de801
+       VPSUBSB 99(R15), Y11, K5, Y8                       // 6251252de88763000000 or 6251a52de88763000000
+       VPSUBSB Z23, Z23, K3, Z27                          // 62214543e8df or 6221c543e8df
+       VPSUBSB Z6, Z23, K3, Z27                           // 62614543e8de or 6261c543e8de
+       VPSUBSB -17(BP), Z23, K3, Z27                      // 62614543e89defffffff or 6261c543e89defffffff
+       VPSUBSB -15(R14)(R15*8), Z23, K3, Z27              // 62014543e89cfef1ffffff or 6201c543e89cfef1ffffff
+       VPSUBSB Z23, Z5, K3, Z27                           // 6221554be8df or 6221d54be8df
+       VPSUBSB Z6, Z5, K3, Z27                            // 6261554be8de or 6261d54be8de
+       VPSUBSB -17(BP), Z5, K3, Z27                       // 6261554be89defffffff or 6261d54be89defffffff
+       VPSUBSB -15(R14)(R15*8), Z5, K3, Z27               // 6201554be89cfef1ffffff or 6201d54be89cfef1ffffff
+       VPSUBSB Z23, Z23, K3, Z15                          // 62314543e8ff or 6231c543e8ff
+       VPSUBSB Z6, Z23, K3, Z15                           // 62714543e8fe or 6271c543e8fe
+       VPSUBSB -17(BP), Z23, K3, Z15                      // 62714543e8bdefffffff or 6271c543e8bdefffffff
+       VPSUBSB -15(R14)(R15*8), Z23, K3, Z15              // 62114543e8bcfef1ffffff or 6211c543e8bcfef1ffffff
+       VPSUBSB Z23, Z5, K3, Z15                           // 6231554be8ff or 6231d54be8ff
+       VPSUBSB Z6, Z5, K3, Z15                            // 6271554be8fe or 6271d54be8fe
+       VPSUBSB -17(BP), Z5, K3, Z15                       // 6271554be8bdefffffff or 6271d54be8bdefffffff
+       VPSUBSB -15(R14)(R15*8), Z5, K3, Z15               // 6211554be8bcfef1ffffff or 6211d54be8bcfef1ffffff
+       VPSUBSW X19, X7, K4, X22                           // 62a1450ce9f3 or 62a1c50ce9f3
+       VPSUBSW 7(SI)(DI*1), X7, K4, X22                   // 62e1450ce9b43e07000000 or 62e1c50ce9b43e07000000
+       VPSUBSW 15(DX)(BX*8), X7, K4, X22                  // 62e1450ce9b4da0f000000 or 62e1c50ce9b4da0f000000
+       VPSUBSW Y21, Y24, K2, Y5                           // 62b13d22e9ed or 62b1bd22e9ed
+       VPSUBSW 99(R15)(R15*2), Y24, K2, Y5                // 62913d22e9ac7f63000000 or 6291bd22e9ac7f63000000
+       VPSUBSW -7(DI), Y24, K2, Y5                        // 62f13d22e9aff9ffffff or 62f1bd22e9aff9ffffff
+       VPSUBSW Z16, Z21, K2, Z8                           // 62315542e9c0 or 6231d542e9c0
+       VPSUBSW Z13, Z21, K2, Z8                           // 62515542e9c5 or 6251d542e9c5
+       VPSUBSW 17(SP)(BP*2), Z21, K2, Z8                  // 62715542e9846c11000000 or 6271d542e9846c11000000
+       VPSUBSW -7(DI)(R8*4), Z21, K2, Z8                  // 62315542e98487f9ffffff or 6231d542e98487f9ffffff
+       VPSUBSW Z16, Z5, K2, Z8                            // 6231554ae9c0 or 6231d54ae9c0
+       VPSUBSW Z13, Z5, K2, Z8                            // 6251554ae9c5 or 6251d54ae9c5
+       VPSUBSW 17(SP)(BP*2), Z5, K2, Z8                   // 6271554ae9846c11000000 or 6271d54ae9846c11000000
+       VPSUBSW -7(DI)(R8*4), Z5, K2, Z8                   // 6231554ae98487f9ffffff or 6231d54ae98487f9ffffff
+       VPSUBSW Z16, Z21, K2, Z28                          // 62215542e9e0 or 6221d542e9e0
+       VPSUBSW Z13, Z21, K2, Z28                          // 62415542e9e5 or 6241d542e9e5
+       VPSUBSW 17(SP)(BP*2), Z21, K2, Z28                 // 62615542e9a46c11000000 or 6261d542e9a46c11000000
+       VPSUBSW -7(DI)(R8*4), Z21, K2, Z28                 // 62215542e9a487f9ffffff or 6221d542e9a487f9ffffff
+       VPSUBSW Z16, Z5, K2, Z28                           // 6221554ae9e0 or 6221d54ae9e0
+       VPSUBSW Z13, Z5, K2, Z28                           // 6241554ae9e5 or 6241d54ae9e5
+       VPSUBSW 17(SP)(BP*2), Z5, K2, Z28                  // 6261554ae9a46c11000000 or 6261d54ae9a46c11000000
+       VPSUBSW -7(DI)(R8*4), Z5, K2, Z28                  // 6221554ae9a487f9ffffff or 6221d54ae9a487f9ffffff
+       VPSUBUSB X31, X16, K3, X7                          // 62917d03d8ff or 6291fd03d8ff
+       VPSUBUSB -7(DI)(R8*1), X16, K3, X7                 // 62b17d03d8bc07f9ffffff or 62b1fd03d8bc07f9ffffff
+       VPSUBUSB (SP), X16, K3, X7                         // 62f17d03d83c24 or 62f1fd03d83c24
+       VPSUBUSB Y13, Y9, K3, Y16                          // 62c1352bd8c5 or 62c1b52bd8c5
+       VPSUBUSB -7(CX)(DX*1), Y9, K3, Y16                 // 62e1352bd88411f9ffffff or 62e1b52bd88411f9ffffff
+       VPSUBUSB -15(R14)(R15*4), Y9, K3, Y16              // 6281352bd884bef1ffffff or 6281b52bd884bef1ffffff
+       VPSUBUSB Z6, Z22, K3, Z12                          // 62714d43d8e6 or 6271cd43d8e6
+       VPSUBUSB Z8, Z22, K3, Z12                          // 62514d43d8e0 or 6251cd43d8e0
+       VPSUBUSB 15(R8), Z22, K3, Z12                      // 62514d43d8a00f000000 or 6251cd43d8a00f000000
+       VPSUBUSB (BP), Z22, K3, Z12                        // 62714d43d86500 or 6271cd43d86500
+       VPSUBUSB Z6, Z11, K3, Z12                          // 6271254bd8e6 or 6271a54bd8e6
+       VPSUBUSB Z8, Z11, K3, Z12                          // 6251254bd8e0 or 6251a54bd8e0
+       VPSUBUSB 15(R8), Z11, K3, Z12                      // 6251254bd8a00f000000 or 6251a54bd8a00f000000
+       VPSUBUSB (BP), Z11, K3, Z12                        // 6271254bd86500 or 6271a54bd86500
+       VPSUBUSB Z6, Z22, K3, Z27                          // 62614d43d8de or 6261cd43d8de
+       VPSUBUSB Z8, Z22, K3, Z27                          // 62414d43d8d8 or 6241cd43d8d8
+       VPSUBUSB 15(R8), Z22, K3, Z27                      // 62414d43d8980f000000 or 6241cd43d8980f000000
+       VPSUBUSB (BP), Z22, K3, Z27                        // 62614d43d85d00 or 6261cd43d85d00
+       VPSUBUSB Z6, Z11, K3, Z27                          // 6261254bd8de or 6261a54bd8de
+       VPSUBUSB Z8, Z11, K3, Z27                          // 6241254bd8d8 or 6241a54bd8d8
+       VPSUBUSB 15(R8), Z11, K3, Z27                      // 6241254bd8980f000000 or 6241a54bd8980f000000
+       VPSUBUSB (BP), Z11, K3, Z27                        // 6261254bd85d00 or 6261a54bd85d00
+       VPSUBUSW X9, X7, K2, X1                            // 62d1450ad9c9 or 62d1c50ad9c9
+       VPSUBUSW -7(CX), X7, K2, X1                        // 62f1450ad989f9ffffff or 62f1c50ad989f9ffffff
+       VPSUBUSW 15(DX)(BX*4), X7, K2, X1                  // 62f1450ad98c9a0f000000 or 62f1c50ad98c9a0f000000
+       VPSUBUSW Y3, Y6, K1, Y9                            // 62714d29d9cb or 6271cd29d9cb
+       VPSUBUSW 15(DX)(BX*1), Y6, K1, Y9                  // 62714d29d98c1a0f000000 or 6271cd29d98c1a0f000000
+       VPSUBUSW -7(CX)(DX*2), Y6, K1, Y9                  // 62714d29d98c51f9ffffff or 6271cd29d98c51f9ffffff
+       VPSUBUSW Z9, Z12, K2, Z25                          // 62411d4ad9c9 or 62419d4ad9c9
+       VPSUBUSW Z12, Z12, K2, Z25                         // 62411d4ad9cc or 62419d4ad9cc
+       VPSUBUSW 15(R8)(R14*8), Z12, K2, Z25               // 62011d4ad98cf00f000000 or 62019d4ad98cf00f000000
+       VPSUBUSW -15(R14)(R15*2), Z12, K2, Z25             // 62011d4ad98c7ef1ffffff or 62019d4ad98c7ef1ffffff
+       VPSUBUSW Z9, Z17, K2, Z25                          // 62417542d9c9 or 6241f542d9c9
+       VPSUBUSW Z12, Z17, K2, Z25                         // 62417542d9cc or 6241f542d9cc
+       VPSUBUSW 15(R8)(R14*8), Z17, K2, Z25               // 62017542d98cf00f000000 or 6201f542d98cf00f000000
+       VPSUBUSW -15(R14)(R15*2), Z17, K2, Z25             // 62017542d98c7ef1ffffff or 6201f542d98c7ef1ffffff
+       VPSUBUSW Z9, Z12, K2, Z12                          // 62511d4ad9e1 or 62519d4ad9e1
+       VPSUBUSW Z12, Z12, K2, Z12                         // 62511d4ad9e4 or 62519d4ad9e4
+       VPSUBUSW 15(R8)(R14*8), Z12, K2, Z12               // 62111d4ad9a4f00f000000 or 62119d4ad9a4f00f000000
+       VPSUBUSW -15(R14)(R15*2), Z12, K2, Z12             // 62111d4ad9a47ef1ffffff or 62119d4ad9a47ef1ffffff
+       VPSUBUSW Z9, Z17, K2, Z12                          // 62517542d9e1 or 6251f542d9e1
+       VPSUBUSW Z12, Z17, K2, Z12                         // 62517542d9e4 or 6251f542d9e4
+       VPSUBUSW 15(R8)(R14*8), Z17, K2, Z12               // 62117542d9a4f00f000000 or 6211f542d9a4f00f000000
+       VPSUBUSW -15(R14)(R15*2), Z17, K2, Z12             // 62117542d9a47ef1ffffff or 6211f542d9a47ef1ffffff
+       VPSUBW X0, X12, K1, X15                            // 62711d09f9f8 or 62719d09f9f8
+       VPSUBW 99(R15)(R15*8), X12, K1, X15                // 62111d09f9bcff63000000 or 62119d09f9bcff63000000
+       VPSUBW 7(AX)(CX*8), X12, K1, X15                   // 62711d09f9bcc807000000 or 62719d09f9bcc807000000
+       VPSUBW Y26, Y6, K7, Y7                             // 62914d2ff9fa or 6291cd2ff9fa
+       VPSUBW -17(BP), Y6, K7, Y7                         // 62f14d2ff9bdefffffff or 62f1cd2ff9bdefffffff
+       VPSUBW -15(R14)(R15*8), Y6, K7, Y7                 // 62914d2ff9bcfef1ffffff or 6291cd2ff9bcfef1ffffff
+       VPSUBW Z8, Z3, K1, Z6                              // 62d16549f9f0 or 62d1e549f9f0
+       VPSUBW Z2, Z3, K1, Z6                              // 62f16549f9f2 or 62f1e549f9f2
+       VPSUBW -15(R14)(R15*1), Z3, K1, Z6                 // 62916549f9b43ef1ffffff or 6291e549f9b43ef1ffffff
+       VPSUBW -15(BX), Z3, K1, Z6                         // 62f16549f9b3f1ffffff or 62f1e549f9b3f1ffffff
+       VPSUBW Z8, Z21, K1, Z6                             // 62d15541f9f0 or 62d1d541f9f0
+       VPSUBW Z2, Z21, K1, Z6                             // 62f15541f9f2 or 62f1d541f9f2
+       VPSUBW -15(R14)(R15*1), Z21, K1, Z6                // 62915541f9b43ef1ffffff or 6291d541f9b43ef1ffffff
+       VPSUBW -15(BX), Z21, K1, Z6                        // 62f15541f9b3f1ffffff or 62f1d541f9b3f1ffffff
+       VPSUBW Z8, Z3, K1, Z25                             // 62416549f9c8 or 6241e549f9c8
+       VPSUBW Z2, Z3, K1, Z25                             // 62616549f9ca or 6261e549f9ca
+       VPSUBW -15(R14)(R15*1), Z3, K1, Z25                // 62016549f98c3ef1ffffff or 6201e549f98c3ef1ffffff
+       VPSUBW -15(BX), Z3, K1, Z25                        // 62616549f98bf1ffffff or 6261e549f98bf1ffffff
+       VPSUBW Z8, Z21, K1, Z25                            // 62415541f9c8 or 6241d541f9c8
+       VPSUBW Z2, Z21, K1, Z25                            // 62615541f9ca or 6261d541f9ca
+       VPSUBW -15(R14)(R15*1), Z21, K1, Z25               // 62015541f98c3ef1ffffff or 6201d541f98c3ef1ffffff
+       VPSUBW -15(BX), Z21, K1, Z25                       // 62615541f98bf1ffffff or 6261d541f98bf1ffffff
+       VPTESTMB X26, X3, K3, K3                           // 6292650b26da
+       VPTESTMB 15(R8)(R14*4), X3, K3, K3                 // 6292650b269cb00f000000
+       VPTESTMB -7(CX)(DX*4), X3, K3, K3                  // 62f2650b269c91f9ffffff
+       VPTESTMB X26, X3, K3, K1                           // 6292650b26ca
+       VPTESTMB 15(R8)(R14*4), X3, K3, K1                 // 6292650b268cb00f000000
+       VPTESTMB -7(CX)(DX*4), X3, K3, K1                  // 62f2650b268c91f9ffffff
+       VPTESTMB Y3, Y18, K4, K5                           // 62f26d2426eb
+       VPTESTMB 15(R8)(R14*8), Y18, K4, K5                // 62926d2426acf00f000000
+       VPTESTMB -15(R14)(R15*2), Y18, K4, K5              // 62926d2426ac7ef1ffffff
+       VPTESTMB Y3, Y18, K4, K4                           // 62f26d2426e3
+       VPTESTMB 15(R8)(R14*8), Y18, K4, K4                // 62926d2426a4f00f000000
+       VPTESTMB -15(R14)(R15*2), Y18, K4, K4              // 62926d2426a47ef1ffffff
+       VPTESTMB Z11, Z12, K5, K7                          // 62d21d4d26fb
+       VPTESTMB Z5, Z12, K5, K7                           // 62f21d4d26fd
+       VPTESTMB 17(SP)(BP*8), Z12, K5, K7                 // 62f21d4d26bcec11000000
+       VPTESTMB 17(SP)(BP*4), Z12, K5, K7                 // 62f21d4d26bcac11000000
+       VPTESTMB Z11, Z22, K5, K7                          // 62d24d4526fb
+       VPTESTMB Z5, Z22, K5, K7                           // 62f24d4526fd
+       VPTESTMB 17(SP)(BP*8), Z22, K5, K7                 // 62f24d4526bcec11000000
+       VPTESTMB 17(SP)(BP*4), Z22, K5, K7                 // 62f24d4526bcac11000000
+       VPTESTMB Z11, Z12, K5, K6                          // 62d21d4d26f3
+       VPTESTMB Z5, Z12, K5, K6                           // 62f21d4d26f5
+       VPTESTMB 17(SP)(BP*8), Z12, K5, K6                 // 62f21d4d26b4ec11000000
+       VPTESTMB 17(SP)(BP*4), Z12, K5, K6                 // 62f21d4d26b4ac11000000
+       VPTESTMB Z11, Z22, K5, K6                          // 62d24d4526f3
+       VPTESTMB Z5, Z22, K5, K6                           // 62f24d4526f5
+       VPTESTMB 17(SP)(BP*8), Z22, K5, K6                 // 62f24d4526b4ec11000000
+       VPTESTMB 17(SP)(BP*4), Z22, K5, K6                 // 62f24d4526b4ac11000000
+       VPTESTMW X15, X9, K4, K6                           // 62d2b50c26f7
+       VPTESTMW -17(BP)(SI*2), X9, K4, K6                 // 62f2b50c26b475efffffff
+       VPTESTMW 7(AX)(CX*2), X9, K4, K6                   // 62f2b50c26b44807000000
+       VPTESTMW X15, X9, K4, K4                           // 62d2b50c26e7
+       VPTESTMW -17(BP)(SI*2), X9, K4, K4                 // 62f2b50c26a475efffffff
+       VPTESTMW 7(AX)(CX*2), X9, K4, K4                   // 62f2b50c26a44807000000
+       VPTESTMW Y8, Y14, K7, K4                           // 62d28d2f26e0
+       VPTESTMW (SI), Y14, K7, K4                         // 62f28d2f2626
+       VPTESTMW 7(SI)(DI*2), Y14, K7, K4                  // 62f28d2f26a47e07000000
+       VPTESTMW Y8, Y14, K7, K6                           // 62d28d2f26f0
+       VPTESTMW (SI), Y14, K7, K6                         // 62f28d2f2636
+       VPTESTMW 7(SI)(DI*2), Y14, K7, K6                  // 62f28d2f26b47e07000000
+       VPTESTMW Z1, Z6, K2, K4                            // 62f2cd4a26e1
+       VPTESTMW Z15, Z6, K2, K4                           // 62d2cd4a26e7
+       VPTESTMW 7(AX), Z6, K2, K4                         // 62f2cd4a26a007000000
+       VPTESTMW (DI), Z6, K2, K4                          // 62f2cd4a2627
+       VPTESTMW Z1, Z22, K2, K4                           // 62f2cd4226e1
+       VPTESTMW Z15, Z22, K2, K4                          // 62d2cd4226e7
+       VPTESTMW 7(AX), Z22, K2, K4                        // 62f2cd4226a007000000
+       VPTESTMW (DI), Z22, K2, K4                         // 62f2cd422627
+       VPTESTMW Z1, Z6, K2, K5                            // 62f2cd4a26e9
+       VPTESTMW Z15, Z6, K2, K5                           // 62d2cd4a26ef
+       VPTESTMW 7(AX), Z6, K2, K5                         // 62f2cd4a26a807000000
+       VPTESTMW (DI), Z6, K2, K5                          // 62f2cd4a262f
+       VPTESTMW Z1, Z22, K2, K5                           // 62f2cd4226e9
+       VPTESTMW Z15, Z22, K2, K5                          // 62d2cd4226ef
+       VPTESTMW 7(AX), Z22, K2, K5                        // 62f2cd4226a807000000
+       VPTESTMW (DI), Z22, K2, K5                         // 62f2cd42262f
+       VPTESTNMB X18, X26, K5, K2                         // 62b22e0526d2
+       VPTESTNMB 15(R8)(R14*1), X26, K5, K2               // 62922e052694300f000000
+       VPTESTNMB 15(R8)(R14*2), X26, K5, K2               // 62922e052694700f000000
+       VPTESTNMB X18, X26, K5, K7                         // 62b22e0526fa
+       VPTESTNMB 15(R8)(R14*1), X26, K5, K7               // 62922e0526bc300f000000
+       VPTESTNMB 15(R8)(R14*2), X26, K5, K7               // 62922e0526bc700f000000
+       VPTESTNMB Y11, Y20, K3, K0                         // 62d25e2326c3
+       VPTESTNMB 17(SP)(BP*8), Y20, K3, K0                // 62f25e232684ec11000000
+       VPTESTNMB 17(SP)(BP*4), Y20, K3, K0                // 62f25e232684ac11000000
+       VPTESTNMB Y11, Y20, K3, K5                         // 62d25e2326eb
+       VPTESTNMB 17(SP)(BP*8), Y20, K3, K5                // 62f25e2326acec11000000
+       VPTESTNMB 17(SP)(BP*4), Y20, K3, K5                // 62f25e2326acac11000000
+       VPTESTNMB Z18, Z13, K4, K6                         // 62b2164c26f2
+       VPTESTNMB Z8, Z13, K4, K6                          // 62d2164c26f0
+       VPTESTNMB 99(R15)(R15*1), Z13, K4, K6              // 6292164c26b43f63000000
+       VPTESTNMB (DX), Z13, K4, K6                        // 62f2164c2632
+       VPTESTNMB Z18, Z13, K4, K5                         // 62b2164c26ea
+       VPTESTNMB Z8, Z13, K4, K5                          // 62d2164c26e8
+       VPTESTNMB 99(R15)(R15*1), Z13, K4, K5              // 6292164c26ac3f63000000
+       VPTESTNMB (DX), Z13, K4, K5                        // 62f2164c262a
+       VPTESTNMW X7, X3, K1, K5                           // 62f2e60926ef
+       VPTESTNMW (CX), X3, K1, K5                         // 62f2e6092629
+       VPTESTNMW 99(R15), X3, K1, K5                      // 62d2e60926af63000000
+       VPTESTNMW X7, X3, K1, K4                           // 62f2e60926e7
+       VPTESTNMW (CX), X3, K1, K4                         // 62f2e6092621
+       VPTESTNMW 99(R15), X3, K1, K4                      // 62d2e60926a763000000
+       VPTESTNMW Y20, Y20, K2, K4                         // 62b2de2226e4
+       VPTESTNMW 7(AX), Y20, K2, K4                       // 62f2de2226a007000000
+       VPTESTNMW (DI), Y20, K2, K4                        // 62f2de222627
+       VPTESTNMW Y20, Y20, K2, K6                         // 62b2de2226f4
+       VPTESTNMW 7(AX), Y20, K2, K6                       // 62f2de2226b007000000
+       VPTESTNMW (DI), Y20, K2, K6                        // 62f2de222637
+       VPTESTNMW Z28, Z12, K1, K1                         // 62929e4926cc
+       VPTESTNMW Z13, Z12, K1, K1                         // 62d29e4926cd
+       VPTESTNMW 7(SI)(DI*1), Z12, K1, K1                 // 62f29e49268c3e07000000
+       VPTESTNMW 15(DX)(BX*8), Z12, K1, K1                // 62f29e49268cda0f000000
+       VPTESTNMW Z28, Z16, K1, K1                         // 6292fe4126cc
+       VPTESTNMW Z13, Z16, K1, K1                         // 62d2fe4126cd
+       VPTESTNMW 7(SI)(DI*1), Z16, K1, K1                 // 62f2fe41268c3e07000000
+       VPTESTNMW 15(DX)(BX*8), Z16, K1, K1                // 62f2fe41268cda0f000000
+       VPTESTNMW Z28, Z12, K1, K3                         // 62929e4926dc
+       VPTESTNMW Z13, Z12, K1, K3                         // 62d29e4926dd
+       VPTESTNMW 7(SI)(DI*1), Z12, K1, K3                 // 62f29e49269c3e07000000
+       VPTESTNMW 15(DX)(BX*8), Z12, K1, K3                // 62f29e49269cda0f000000
+       VPTESTNMW Z28, Z16, K1, K3                         // 6292fe4126dc
+       VPTESTNMW Z13, Z16, K1, K3                         // 62d2fe4126dd
+       VPTESTNMW 7(SI)(DI*1), Z16, K1, K3                 // 62f2fe41269c3e07000000
+       VPTESTNMW 15(DX)(BX*8), Z16, K1, K3                // 62f2fe41269cda0f000000
+       VPUNPCKHBW X24, X0, K7, X0                         // 62917d0f68c0 or 6291fd0f68c0
+       VPUNPCKHBW 99(R15)(R15*2), X0, K7, X0              // 62917d0f68847f63000000 or 6291fd0f68847f63000000
+       VPUNPCKHBW -7(DI), X0, K7, X0                      // 62f17d0f6887f9ffffff or 62f1fd0f6887f9ffffff
+       VPUNPCKHBW Y28, Y28, K1, Y9                        // 62111d2168cc or 62119d2168cc
+       VPUNPCKHBW 99(R15)(R15*1), Y28, K1, Y9             // 62111d21688c3f63000000 or 62119d21688c3f63000000
+       VPUNPCKHBW (DX), Y28, K1, Y9                       // 62711d21680a or 62719d21680a
+       VPUNPCKHBW Z15, Z3, K1, Z14                        // 6251654968f7 or 6251e54968f7
+       VPUNPCKHBW Z30, Z3, K1, Z14                        // 6211654968f6 or 6211e54968f6
+       VPUNPCKHBW -7(DI)(R8*1), Z3, K1, Z14               // 6231654968b407f9ffffff or 6231e54968b407f9ffffff
+       VPUNPCKHBW (SP), Z3, K1, Z14                       // 62716549683424 or 6271e549683424
+       VPUNPCKHBW Z15, Z12, K1, Z14                       // 62511d4968f7 or 62519d4968f7
+       VPUNPCKHBW Z30, Z12, K1, Z14                       // 62111d4968f6 or 62119d4968f6
+       VPUNPCKHBW -7(DI)(R8*1), Z12, K1, Z14              // 62311d4968b407f9ffffff or 62319d4968b407f9ffffff
+       VPUNPCKHBW (SP), Z12, K1, Z14                      // 62711d49683424 or 62719d49683424
+       VPUNPCKHBW Z15, Z3, K1, Z28                        // 6241654968e7 or 6241e54968e7
+       VPUNPCKHBW Z30, Z3, K1, Z28                        // 6201654968e6 or 6201e54968e6
+       VPUNPCKHBW -7(DI)(R8*1), Z3, K1, Z28               // 6221654968a407f9ffffff or 6221e54968a407f9ffffff
+       VPUNPCKHBW (SP), Z3, K1, Z28                       // 62616549682424 or 6261e549682424
+       VPUNPCKHBW Z15, Z12, K1, Z28                       // 62411d4968e7 or 62419d4968e7
+       VPUNPCKHBW Z30, Z12, K1, Z28                       // 62011d4968e6 or 62019d4968e6
+       VPUNPCKHBW -7(DI)(R8*1), Z12, K1, Z28              // 62211d4968a407f9ffffff or 62219d4968a407f9ffffff
+       VPUNPCKHBW (SP), Z12, K1, Z28                      // 62611d49682424 or 62619d49682424
+       VPUNPCKHWD X21, X3, K4, X31                        // 6221650c69fd or 6221e50c69fd
+       VPUNPCKHWD -17(BP), X3, K4, X31                    // 6261650c69bdefffffff or 6261e50c69bdefffffff
+       VPUNPCKHWD -15(R14)(R15*8), X3, K4, X31            // 6201650c69bcfef1ffffff or 6201e50c69bcfef1ffffff
+       VPUNPCKHWD Y26, Y6, K5, Y12                        // 62114d2d69e2 or 6211cd2d69e2
+       VPUNPCKHWD 7(SI)(DI*1), Y6, K5, Y12                // 62714d2d69a43e07000000 or 6271cd2d69a43e07000000
+       VPUNPCKHWD 15(DX)(BX*8), Y6, K5, Y12               // 62714d2d69a4da0f000000 or 6271cd2d69a4da0f000000
+       VPUNPCKHWD Z0, Z23, K7, Z20                        // 62e1454769e0 or 62e1c54769e0
+       VPUNPCKHWD Z11, Z23, K7, Z20                       // 62c1454769e3 or 62c1c54769e3
+       VPUNPCKHWD (AX), Z23, K7, Z20                      // 62e145476920 or 62e1c5476920
+       VPUNPCKHWD 7(SI), Z23, K7, Z20                     // 62e1454769a607000000 or 62e1c54769a607000000
+       VPUNPCKHWD Z0, Z19, K7, Z20                        // 62e1654769e0 or 62e1e54769e0
+       VPUNPCKHWD Z11, Z19, K7, Z20                       // 62c1654769e3 or 62c1e54769e3
+       VPUNPCKHWD (AX), Z19, K7, Z20                      // 62e165476920 or 62e1e5476920
+       VPUNPCKHWD 7(SI), Z19, K7, Z20                     // 62e1654769a607000000 or 62e1e54769a607000000
+       VPUNPCKHWD Z0, Z23, K7, Z0                         // 62f1454769c0 or 62f1c54769c0
+       VPUNPCKHWD Z11, Z23, K7, Z0                        // 62d1454769c3 or 62d1c54769c3
+       VPUNPCKHWD (AX), Z23, K7, Z0                       // 62f145476900 or 62f1c5476900
+       VPUNPCKHWD 7(SI), Z23, K7, Z0                      // 62f14547698607000000 or 62f1c547698607000000
+       VPUNPCKHWD Z0, Z19, K7, Z0                         // 62f1654769c0 or 62f1e54769c0
+       VPUNPCKHWD Z11, Z19, K7, Z0                        // 62d1654769c3 or 62d1e54769c3
+       VPUNPCKHWD (AX), Z19, K7, Z0                       // 62f165476900 or 62f1e5476900
+       VPUNPCKHWD 7(SI), Z19, K7, Z0                      // 62f16547698607000000 or 62f1e547698607000000
+       VPUNPCKLBW X13, X11, K7, X1                        // 62d1250f60cd or 62d1a50f60cd
+       VPUNPCKLBW 17(SP)(BP*2), X11, K7, X1               // 62f1250f608c6c11000000 or 62f1a50f608c6c11000000
+       VPUNPCKLBW -7(DI)(R8*4), X11, K7, X1               // 62b1250f608c87f9ffffff or 62b1a50f608c87f9ffffff
+       VPUNPCKLBW Y28, Y8, K6, Y3                         // 62913d2e60dc or 6291bd2e60dc
+       VPUNPCKLBW -7(DI)(R8*1), Y8, K6, Y3                // 62b13d2e609c07f9ffffff or 62b1bd2e609c07f9ffffff
+       VPUNPCKLBW (SP), Y8, K6, Y3                        // 62f13d2e601c24 or 62f1bd2e601c24
+       VPUNPCKLBW Z0, Z24, K3, Z0                         // 62f13d4360c0 or 62f1bd4360c0
+       VPUNPCKLBW Z26, Z24, K3, Z0                        // 62913d4360c2 or 6291bd4360c2
+       VPUNPCKLBW (BX), Z24, K3, Z0                       // 62f13d436003 or 62f1bd436003
+       VPUNPCKLBW -17(BP)(SI*1), Z24, K3, Z0              // 62f13d43608435efffffff or 62f1bd43608435efffffff
+       VPUNPCKLBW Z0, Z12, K3, Z0                         // 62f11d4b60c0 or 62f19d4b60c0
+       VPUNPCKLBW Z26, Z12, K3, Z0                        // 62911d4b60c2 or 62919d4b60c2
+       VPUNPCKLBW (BX), Z12, K3, Z0                       // 62f11d4b6003 or 62f19d4b6003
+       VPUNPCKLBW -17(BP)(SI*1), Z12, K3, Z0              // 62f11d4b608435efffffff or 62f19d4b608435efffffff
+       VPUNPCKLBW Z0, Z24, K3, Z25                        // 62613d4360c8 or 6261bd4360c8
+       VPUNPCKLBW Z26, Z24, K3, Z25                       // 62013d4360ca or 6201bd4360ca
+       VPUNPCKLBW (BX), Z24, K3, Z25                      // 62613d43600b or 6261bd43600b
+       VPUNPCKLBW -17(BP)(SI*1), Z24, K3, Z25             // 62613d43608c35efffffff or 6261bd43608c35efffffff
+       VPUNPCKLBW Z0, Z12, K3, Z25                        // 62611d4b60c8 or 62619d4b60c8
+       VPUNPCKLBW Z26, Z12, K3, Z25                       // 62011d4b60ca or 62019d4b60ca
+       VPUNPCKLBW (BX), Z12, K3, Z25                      // 62611d4b600b or 62619d4b600b
+       VPUNPCKLBW -17(BP)(SI*1), Z12, K3, Z25             // 62611d4b608c35efffffff or 62619d4b608c35efffffff
+       VPUNPCKLWD X8, X8, K3, X19                         // 62c13d0b61d8 or 62c1bd0b61d8
+       VPUNPCKLWD -15(R14)(R15*1), X8, K3, X19            // 62813d0b619c3ef1ffffff or 6281bd0b619c3ef1ffffff
+       VPUNPCKLWD -15(BX), X8, K3, X19                    // 62e13d0b619bf1ffffff or 62e1bd0b619bf1ffffff
+       VPUNPCKLWD Y8, Y27, K4, Y22                        // 62c1252461f0 or 62c1a52461f0
+       VPUNPCKLWD (AX), Y27, K4, Y22                      // 62e125246130 or 62e1a5246130
+       VPUNPCKLWD 7(SI), Y27, K4, Y22                     // 62e1252461b607000000 or 62e1a52461b607000000
+       VPUNPCKLWD Z6, Z21, K2, Z31                        // 6261554261fe or 6261d54261fe
+       VPUNPCKLWD Z9, Z21, K2, Z31                        // 6241554261f9 or 6241d54261f9
+       VPUNPCKLWD 17(SP)(BP*1), Z21, K2, Z31              // 6261554261bc2c11000000 or 6261d54261bc2c11000000
+       VPUNPCKLWD -7(CX)(DX*8), Z21, K2, Z31              // 6261554261bcd1f9ffffff or 6261d54261bcd1f9ffffff
+       VPUNPCKLWD Z6, Z9, K2, Z31                         // 6261354a61fe or 6261b54a61fe
+       VPUNPCKLWD Z9, Z9, K2, Z31                         // 6241354a61f9 or 6241b54a61f9
+       VPUNPCKLWD 17(SP)(BP*1), Z9, K2, Z31               // 6261354a61bc2c11000000 or 6261b54a61bc2c11000000
+       VPUNPCKLWD -7(CX)(DX*8), Z9, K2, Z31               // 6261354a61bcd1f9ffffff or 6261b54a61bcd1f9ffffff
+       VPUNPCKLWD Z6, Z21, K2, Z0                         // 62f1554261c6 or 62f1d54261c6
+       VPUNPCKLWD Z9, Z21, K2, Z0                         // 62d1554261c1 or 62d1d54261c1
+       VPUNPCKLWD 17(SP)(BP*1), Z21, K2, Z0               // 62f1554261842c11000000 or 62f1d54261842c11000000
+       VPUNPCKLWD -7(CX)(DX*8), Z21, K2, Z0               // 62f155426184d1f9ffffff or 62f1d5426184d1f9ffffff
+       VPUNPCKLWD Z6, Z9, K2, Z0                          // 62f1354a61c6 or 62f1b54a61c6
+       VPUNPCKLWD Z9, Z9, K2, Z0                          // 62d1354a61c1 or 62d1b54a61c1
+       VPUNPCKLWD 17(SP)(BP*1), Z9, K2, Z0                // 62f1354a61842c11000000 or 62f1b54a61842c11000000
+       VPUNPCKLWD -7(CX)(DX*8), Z9, K2, Z0                // 62f1354a6184d1f9ffffff or 62f1b54a6184d1f9ffffff
        RET
index 66c87e8fe3e4ad017f24187aaa413755da6106e1..9b8b9fdafb73e69b0a55b30237b9f745e00651b5 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512cd(SB), NOSPLIT, $0
-       //TODO: VPBROADCASTMB2Q K1, X25                            // 6262fe082ac9
-       //TODO: VPBROADCASTMB2Q K5, X25                            // 6262fe082acd
-       //TODO: VPBROADCASTMB2Q K1, X11                            // 6272fe082ad9
-       //TODO: VPBROADCASTMB2Q K5, X11                            // 6272fe082add
-       //TODO: VPBROADCASTMB2Q K1, X17                            // 62e2fe082ac9
-       //TODO: VPBROADCASTMB2Q K5, X17                            // 62e2fe082acd
-       //TODO: VPBROADCASTMB2Q K3, Y0                             // 62f2fe282ac3
-       //TODO: VPBROADCASTMB2Q K1, Y0                             // 62f2fe282ac1
-       //TODO: VPBROADCASTMB2Q K3, Y19                            // 62e2fe282adb
-       //TODO: VPBROADCASTMB2Q K1, Y19                            // 62e2fe282ad9
-       //TODO: VPBROADCASTMB2Q K3, Y31                            // 6262fe282afb
-       //TODO: VPBROADCASTMB2Q K1, Y31                            // 6262fe282af9
-       //TODO: VPBROADCASTMB2Q K5, Z21                            // 62e2fe482aed
-       //TODO: VPBROADCASTMB2Q K4, Z21                            // 62e2fe482aec
-       //TODO: VPBROADCASTMB2Q K5, Z8                             // 6272fe482ac5
-       //TODO: VPBROADCASTMB2Q K4, Z8                             // 6272fe482ac4
-       //TODO: VPBROADCASTMW2D K7, X18                            // 62e27e083ad7
-       //TODO: VPBROADCASTMW2D K6, X18                            // 62e27e083ad6
-       //TODO: VPBROADCASTMW2D K7, X11                            // 62727e083adf
-       //TODO: VPBROADCASTMW2D K6, X11                            // 62727e083ade
-       //TODO: VPBROADCASTMW2D K7, X9                             // 62727e083acf
-       //TODO: VPBROADCASTMW2D K6, X9                             // 62727e083ace
-       //TODO: VPBROADCASTMW2D K4, Y22                            // 62e27e283af4
-       //TODO: VPBROADCASTMW2D K6, Y22                            // 62e27e283af6
-       //TODO: VPBROADCASTMW2D K4, Y9                             // 62727e283acc
-       //TODO: VPBROADCASTMW2D K6, Y9                             // 62727e283ace
-       //TODO: VPBROADCASTMW2D K4, Y23                            // 62e27e283afc
-       //TODO: VPBROADCASTMW2D K6, Y23                            // 62e27e283afe
-       //TODO: VPBROADCASTMW2D K0, Z16                            // 62e27e483ac0
-       //TODO: VPBROADCASTMW2D K7, Z16                            // 62e27e483ac7
-       //TODO: VPBROADCASTMW2D K0, Z9                             // 62727e483ac8
-       //TODO: VPBROADCASTMW2D K7, Z9                             // 62727e483acf
-       //TODO: VPCONFLICTD X6, K6, X6                             // 62f27d0ec4f6
-       //TODO: VPCONFLICTD X1, K6, X6                             // 62f27d0ec4f1
-       //TODO: VPCONFLICTD X8, K6, X6                             // 62d27d0ec4f0
-       //TODO: VPCONFLICTD 15(R8), K6, X6                         // 62d27d0ec4b00f000000
-       //TODO: VPCONFLICTD (BP), K6, X6                           // 62f27d0ec47500
-       //TODO: VPCONFLICTD X6, K6, X17                            // 62e27d0ec4ce
-       //TODO: VPCONFLICTD X1, K6, X17                            // 62e27d0ec4c9
-       //TODO: VPCONFLICTD X8, K6, X17                            // 62c27d0ec4c8
-       //TODO: VPCONFLICTD 15(R8), K6, X17                        // 62c27d0ec4880f000000
-       //TODO: VPCONFLICTD (BP), K6, X17                          // 62e27d0ec44d00
-       //TODO: VPCONFLICTD X6, K6, X28                            // 62627d0ec4e6
-       //TODO: VPCONFLICTD X1, K6, X28                            // 62627d0ec4e1
-       //TODO: VPCONFLICTD X8, K6, X28                            // 62427d0ec4e0
-       //TODO: VPCONFLICTD 15(R8), K6, X28                        // 62427d0ec4a00f000000
-       //TODO: VPCONFLICTD (BP), K6, X28                          // 62627d0ec46500
-       //TODO: VPCONFLICTD Y14, K3, Y2                            // 62d27d2bc4d6
-       //TODO: VPCONFLICTD Y8, K3, Y2                             // 62d27d2bc4d0
-       //TODO: VPCONFLICTD Y20, K3, Y2                            // 62b27d2bc4d4
-       //TODO: VPCONFLICTD -7(CX), K3, Y2                         // 62f27d2bc491f9ffffff
-       //TODO: VPCONFLICTD 15(DX)(BX*4), K3, Y2                   // 62f27d2bc4949a0f000000
-       //TODO: VPCONFLICTD Y14, K3, Y7                            // 62d27d2bc4fe
-       //TODO: VPCONFLICTD Y8, K3, Y7                             // 62d27d2bc4f8
-       //TODO: VPCONFLICTD Y20, K3, Y7                            // 62b27d2bc4fc
-       //TODO: VPCONFLICTD -7(CX), K3, Y7                         // 62f27d2bc4b9f9ffffff
-       //TODO: VPCONFLICTD 15(DX)(BX*4), K3, Y7                   // 62f27d2bc4bc9a0f000000
-       //TODO: VPCONFLICTD Y14, K3, Y21                           // 62c27d2bc4ee
-       //TODO: VPCONFLICTD Y8, K3, Y21                            // 62c27d2bc4e8
-       //TODO: VPCONFLICTD Y20, K3, Y21                           // 62a27d2bc4ec
-       //TODO: VPCONFLICTD -7(CX), K3, Y21                        // 62e27d2bc4a9f9ffffff
-       //TODO: VPCONFLICTD 15(DX)(BX*4), K3, Y21                  // 62e27d2bc4ac9a0f000000
-       //TODO: VPCONFLICTD Z11, K7, Z21                           // 62c27d4fc4eb
-       //TODO: VPCONFLICTD Z25, K7, Z21                           // 62827d4fc4e9
-       //TODO: VPCONFLICTD -15(R14)(R15*1), K7, Z21               // 62827d4fc4ac3ef1ffffff
-       //TODO: VPCONFLICTD -15(BX), K7, Z21                       // 62e27d4fc4abf1ffffff
-       //TODO: VPCONFLICTD Z11, K7, Z13                           // 62527d4fc4eb
-       //TODO: VPCONFLICTD Z25, K7, Z13                           // 62127d4fc4e9
-       //TODO: VPCONFLICTD -15(R14)(R15*1), K7, Z13               // 62127d4fc4ac3ef1ffffff
-       //TODO: VPCONFLICTD -15(BX), K7, Z13                       // 62727d4fc4abf1ffffff
-       //TODO: VPCONFLICTQ X11, K4, X8                            // 6252fd0cc4c3
-       //TODO: VPCONFLICTQ X16, K4, X8                            // 6232fd0cc4c0
-       //TODO: VPCONFLICTQ X6, K4, X8                             // 6272fd0cc4c6
-       //TODO: VPCONFLICTQ 15(R8)(R14*8), K4, X8                  // 6212fd0cc484f00f000000
-       //TODO: VPCONFLICTQ -15(R14)(R15*2), K4, X8                // 6212fd0cc4847ef1ffffff
-       //TODO: VPCONFLICTQ X11, K4, X6                            // 62d2fd0cc4f3
-       //TODO: VPCONFLICTQ X16, K4, X6                            // 62b2fd0cc4f0
-       //TODO: VPCONFLICTQ X6, K4, X6                             // 62f2fd0cc4f6
-       //TODO: VPCONFLICTQ 15(R8)(R14*8), K4, X6                  // 6292fd0cc4b4f00f000000
-       //TODO: VPCONFLICTQ -15(R14)(R15*2), K4, X6                // 6292fd0cc4b47ef1ffffff
-       //TODO: VPCONFLICTQ X11, K4, X0                            // 62d2fd0cc4c3
-       //TODO: VPCONFLICTQ X16, K4, X0                            // 62b2fd0cc4c0
-       //TODO: VPCONFLICTQ X6, K4, X0                             // 62f2fd0cc4c6
-       //TODO: VPCONFLICTQ 15(R8)(R14*8), K4, X0                  // 6292fd0cc484f00f000000
-       //TODO: VPCONFLICTQ -15(R14)(R15*2), K4, X0                // 6292fd0cc4847ef1ffffff
-       //TODO: VPCONFLICTQ Y5, K4, Y11                            // 6272fd2cc4dd
-       //TODO: VPCONFLICTQ Y18, K4, Y11                           // 6232fd2cc4da
-       //TODO: VPCONFLICTQ Y20, K4, Y11                           // 6232fd2cc4dc
-       //TODO: VPCONFLICTQ 99(R15)(R15*8), K4, Y11                // 6212fd2cc49cff63000000
-       //TODO: VPCONFLICTQ 7(AX)(CX*8), K4, Y11                   // 6272fd2cc49cc807000000
-       //TODO: VPCONFLICTQ Y5, K4, Y24                            // 6262fd2cc4c5
-       //TODO: VPCONFLICTQ Y18, K4, Y24                           // 6222fd2cc4c2
-       //TODO: VPCONFLICTQ Y20, K4, Y24                           // 6222fd2cc4c4
-       //TODO: VPCONFLICTQ 99(R15)(R15*8), K4, Y24                // 6202fd2cc484ff63000000
-       //TODO: VPCONFLICTQ 7(AX)(CX*8), K4, Y24                   // 6262fd2cc484c807000000
-       //TODO: VPCONFLICTQ Y5, K4, Y1                             // 62f2fd2cc4cd
-       //TODO: VPCONFLICTQ Y18, K4, Y1                            // 62b2fd2cc4ca
-       //TODO: VPCONFLICTQ Y20, K4, Y1                            // 62b2fd2cc4cc
-       //TODO: VPCONFLICTQ 99(R15)(R15*8), K4, Y1                 // 6292fd2cc48cff63000000
-       //TODO: VPCONFLICTQ 7(AX)(CX*8), K4, Y1                    // 62f2fd2cc48cc807000000
-       //TODO: VPCONFLICTQ Z27, K7, Z3                            // 6292fd4fc4db
-       //TODO: VPCONFLICTQ Z15, K7, Z3                            // 62d2fd4fc4df
-       //TODO: VPCONFLICTQ 7(AX)(CX*4), K7, Z3                    // 62f2fd4fc49c8807000000
-       //TODO: VPCONFLICTQ 7(AX)(CX*1), K7, Z3                    // 62f2fd4fc49c0807000000
-       //TODO: VPCONFLICTQ Z27, K7, Z12                           // 6212fd4fc4e3
-       //TODO: VPCONFLICTQ Z15, K7, Z12                           // 6252fd4fc4e7
-       //TODO: VPCONFLICTQ 7(AX)(CX*4), K7, Z12                   // 6272fd4fc4a48807000000
-       //TODO: VPCONFLICTQ 7(AX)(CX*1), K7, Z12                   // 6272fd4fc4a40807000000
-       //TODO: VPLZCNTD X3, K3, X17                               // 62e27d0b44cb
-       //TODO: VPLZCNTD X26, K3, X17                              // 62827d0b44ca
-       //TODO: VPLZCNTD X23, K3, X17                              // 62a27d0b44cf
-       //TODO: VPLZCNTD 15(DX)(BX*1), K3, X17                     // 62e27d0b448c1a0f000000
-       //TODO: VPLZCNTD -7(CX)(DX*2), K3, X17                     // 62e27d0b448c51f9ffffff
-       //TODO: VPLZCNTD X3, K3, X15                               // 62727d0b44fb
-       //TODO: VPLZCNTD X26, K3, X15                              // 62127d0b44fa
-       //TODO: VPLZCNTD X23, K3, X15                              // 62327d0b44ff
-       //TODO: VPLZCNTD 15(DX)(BX*1), K3, X15                     // 62727d0b44bc1a0f000000
-       //TODO: VPLZCNTD -7(CX)(DX*2), K3, X15                     // 62727d0b44bc51f9ffffff
-       //TODO: VPLZCNTD X3, K3, X8                                // 62727d0b44c3
-       //TODO: VPLZCNTD X26, K3, X8                               // 62127d0b44c2
-       //TODO: VPLZCNTD X23, K3, X8                               // 62327d0b44c7
-       //TODO: VPLZCNTD 15(DX)(BX*1), K3, X8                      // 62727d0b44841a0f000000
-       //TODO: VPLZCNTD -7(CX)(DX*2), K3, X8                      // 62727d0b448451f9ffffff
-       //TODO: VPLZCNTD Y5, K3, Y20                               // 62e27d2b44e5
-       //TODO: VPLZCNTD Y28, K3, Y20                              // 62827d2b44e4
-       //TODO: VPLZCNTD Y7, K3, Y20                               // 62e27d2b44e7
-       //TODO: VPLZCNTD (BX), K3, Y20                             // 62e27d2b4423
-       //TODO: VPLZCNTD -17(BP)(SI*1), K3, Y20                    // 62e27d2b44a435efffffff
-       //TODO: VPLZCNTD Y5, K3, Y12                               // 62727d2b44e5
-       //TODO: VPLZCNTD Y28, K3, Y12                              // 62127d2b44e4
-       //TODO: VPLZCNTD Y7, K3, Y12                               // 62727d2b44e7
-       //TODO: VPLZCNTD (BX), K3, Y12                             // 62727d2b4423
-       //TODO: VPLZCNTD -17(BP)(SI*1), K3, Y12                    // 62727d2b44a435efffffff
-       //TODO: VPLZCNTD Y5, K3, Y3                                // 62f27d2b44dd
-       //TODO: VPLZCNTD Y28, K3, Y3                               // 62927d2b44dc
-       //TODO: VPLZCNTD Y7, K3, Y3                                // 62f27d2b44df
-       //TODO: VPLZCNTD (BX), K3, Y3                              // 62f27d2b441b
-       //TODO: VPLZCNTD -17(BP)(SI*1), K3, Y3                     // 62f27d2b449c35efffffff
-       //TODO: VPLZCNTD Z21, K3, Z3                               // 62b27d4b44dd
-       //TODO: VPLZCNTD Z13, K3, Z3                               // 62d27d4b44dd
-       //TODO: VPLZCNTD 17(SP)(BP*8), K3, Z3                      // 62f27d4b449cec11000000
-       //TODO: VPLZCNTD 17(SP)(BP*4), K3, Z3                      // 62f27d4b449cac11000000
-       //TODO: VPLZCNTD Z21, K3, Z0                               // 62b27d4b44c5
-       //TODO: VPLZCNTD Z13, K3, Z0                               // 62d27d4b44c5
-       //TODO: VPLZCNTD 17(SP)(BP*8), K3, Z0                      // 62f27d4b4484ec11000000
-       //TODO: VPLZCNTD 17(SP)(BP*4), K3, Z0                      // 62f27d4b4484ac11000000
-       //TODO: VPLZCNTQ X9, K2, X13                               // 6252fd0a44e9
-       //TODO: VPLZCNTQ X15, K2, X13                              // 6252fd0a44ef
-       //TODO: VPLZCNTQ X26, K2, X13                              // 6212fd0a44ea
-       //TODO: VPLZCNTQ -17(BP), K2, X13                          // 6272fd0a44adefffffff
-       //TODO: VPLZCNTQ -15(R14)(R15*8), K2, X13                  // 6212fd0a44acfef1ffffff
-       //TODO: VPLZCNTQ X9, K2, X28                               // 6242fd0a44e1
-       //TODO: VPLZCNTQ X15, K2, X28                              // 6242fd0a44e7
-       //TODO: VPLZCNTQ X26, K2, X28                              // 6202fd0a44e2
-       //TODO: VPLZCNTQ -17(BP), K2, X28                          // 6262fd0a44a5efffffff
-       //TODO: VPLZCNTQ -15(R14)(R15*8), K2, X28                  // 6202fd0a44a4fef1ffffff
-       //TODO: VPLZCNTQ X9, K2, X24                               // 6242fd0a44c1
-       //TODO: VPLZCNTQ X15, K2, X24                              // 6242fd0a44c7
-       //TODO: VPLZCNTQ X26, K2, X24                              // 6202fd0a44c2
-       //TODO: VPLZCNTQ -17(BP), K2, X24                          // 6262fd0a4485efffffff
-       //TODO: VPLZCNTQ -15(R14)(R15*8), K2, X24                  // 6202fd0a4484fef1ffffff
-       //TODO: VPLZCNTQ Y12, K1, Y0                               // 62d2fd2944c4
-       //TODO: VPLZCNTQ Y1, K1, Y0                                // 62f2fd2944c1
-       //TODO: VPLZCNTQ Y14, K1, Y0                               // 62d2fd2944c6
-       //TODO: VPLZCNTQ 15(R8)(R14*4), K1, Y0                     // 6292fd294484b00f000000
-       //TODO: VPLZCNTQ -7(CX)(DX*4), K1, Y0                      // 62f2fd29448491f9ffffff
-       //TODO: VPLZCNTQ Y12, K1, Y22                              // 62c2fd2944f4
-       //TODO: VPLZCNTQ Y1, K1, Y22                               // 62e2fd2944f1
-       //TODO: VPLZCNTQ Y14, K1, Y22                              // 62c2fd2944f6
-       //TODO: VPLZCNTQ 15(R8)(R14*4), K1, Y22                    // 6282fd2944b4b00f000000
-       //TODO: VPLZCNTQ -7(CX)(DX*4), K1, Y22                     // 62e2fd2944b491f9ffffff
-       //TODO: VPLZCNTQ Y12, K1, Y13                              // 6252fd2944ec
-       //TODO: VPLZCNTQ Y1, K1, Y13                               // 6272fd2944e9
-       //TODO: VPLZCNTQ Y14, K1, Y13                              // 6252fd2944ee
-       //TODO: VPLZCNTQ 15(R8)(R14*4), K1, Y13                    // 6212fd2944acb00f000000
-       //TODO: VPLZCNTQ -7(CX)(DX*4), K1, Y13                     // 6272fd2944ac91f9ffffff
-       //TODO: VPLZCNTQ Z3, K2, Z11                               // 6272fd4a44db
-       //TODO: VPLZCNTQ Z12, K2, Z11                              // 6252fd4a44dc
-       //TODO: VPLZCNTQ 7(SI)(DI*4), K2, Z11                      // 6272fd4a449cbe07000000
-       //TODO: VPLZCNTQ -7(DI)(R8*2), K2, Z11                     // 6232fd4a449c47f9ffffff
-       //TODO: VPLZCNTQ Z3, K2, Z25                               // 6262fd4a44cb
-       //TODO: VPLZCNTQ Z12, K2, Z25                              // 6242fd4a44cc
-       //TODO: VPLZCNTQ 7(SI)(DI*4), K2, Z25                      // 6262fd4a448cbe07000000
-       //TODO: VPLZCNTQ -7(DI)(R8*2), K2, Z25                     // 6222fd4a448c47f9ffffff
+       VPBROADCASTMB2Q K1, X25                            // 6262fe082ac9
+       VPBROADCASTMB2Q K5, X25                            // 6262fe082acd
+       VPBROADCASTMB2Q K1, X11                            // 6272fe082ad9
+       VPBROADCASTMB2Q K5, X11                            // 6272fe082add
+       VPBROADCASTMB2Q K1, X17                            // 62e2fe082ac9
+       VPBROADCASTMB2Q K5, X17                            // 62e2fe082acd
+       VPBROADCASTMB2Q K3, Y0                             // 62f2fe282ac3
+       VPBROADCASTMB2Q K1, Y0                             // 62f2fe282ac1
+       VPBROADCASTMB2Q K3, Y19                            // 62e2fe282adb
+       VPBROADCASTMB2Q K1, Y19                            // 62e2fe282ad9
+       VPBROADCASTMB2Q K3, Y31                            // 6262fe282afb
+       VPBROADCASTMB2Q K1, Y31                            // 6262fe282af9
+       VPBROADCASTMB2Q K5, Z21                            // 62e2fe482aed
+       VPBROADCASTMB2Q K4, Z21                            // 62e2fe482aec
+       VPBROADCASTMB2Q K5, Z8                             // 6272fe482ac5
+       VPBROADCASTMB2Q K4, Z8                             // 6272fe482ac4
+       VPBROADCASTMW2D K7, X18                            // 62e27e083ad7
+       VPBROADCASTMW2D K6, X18                            // 62e27e083ad6
+       VPBROADCASTMW2D K7, X11                            // 62727e083adf
+       VPBROADCASTMW2D K6, X11                            // 62727e083ade
+       VPBROADCASTMW2D K7, X9                             // 62727e083acf
+       VPBROADCASTMW2D K6, X9                             // 62727e083ace
+       VPBROADCASTMW2D K4, Y22                            // 62e27e283af4
+       VPBROADCASTMW2D K6, Y22                            // 62e27e283af6
+       VPBROADCASTMW2D K4, Y9                             // 62727e283acc
+       VPBROADCASTMW2D K6, Y9                             // 62727e283ace
+       VPBROADCASTMW2D K4, Y23                            // 62e27e283afc
+       VPBROADCASTMW2D K6, Y23                            // 62e27e283afe
+       VPBROADCASTMW2D K0, Z16                            // 62e27e483ac0
+       VPBROADCASTMW2D K7, Z16                            // 62e27e483ac7
+       VPBROADCASTMW2D K0, Z9                             // 62727e483ac8
+       VPBROADCASTMW2D K7, Z9                             // 62727e483acf
+       VPCONFLICTD X6, K6, X6                             // 62f27d0ec4f6
+       VPCONFLICTD X1, K6, X6                             // 62f27d0ec4f1
+       VPCONFLICTD X8, K6, X6                             // 62d27d0ec4f0
+       VPCONFLICTD 15(R8), K6, X6                         // 62d27d0ec4b00f000000
+       VPCONFLICTD (BP), K6, X6                           // 62f27d0ec47500
+       VPCONFLICTD X6, K6, X17                            // 62e27d0ec4ce
+       VPCONFLICTD X1, K6, X17                            // 62e27d0ec4c9
+       VPCONFLICTD X8, K6, X17                            // 62c27d0ec4c8
+       VPCONFLICTD 15(R8), K6, X17                        // 62c27d0ec4880f000000
+       VPCONFLICTD (BP), K6, X17                          // 62e27d0ec44d00
+       VPCONFLICTD X6, K6, X28                            // 62627d0ec4e6
+       VPCONFLICTD X1, K6, X28                            // 62627d0ec4e1
+       VPCONFLICTD X8, K6, X28                            // 62427d0ec4e0
+       VPCONFLICTD 15(R8), K6, X28                        // 62427d0ec4a00f000000
+       VPCONFLICTD (BP), K6, X28                          // 62627d0ec46500
+       VPCONFLICTD Y14, K3, Y2                            // 62d27d2bc4d6
+       VPCONFLICTD Y8, K3, Y2                             // 62d27d2bc4d0
+       VPCONFLICTD Y20, K3, Y2                            // 62b27d2bc4d4
+       VPCONFLICTD -7(CX), K3, Y2                         // 62f27d2bc491f9ffffff
+       VPCONFLICTD 15(DX)(BX*4), K3, Y2                   // 62f27d2bc4949a0f000000
+       VPCONFLICTD Y14, K3, Y7                            // 62d27d2bc4fe
+       VPCONFLICTD Y8, K3, Y7                             // 62d27d2bc4f8
+       VPCONFLICTD Y20, K3, Y7                            // 62b27d2bc4fc
+       VPCONFLICTD -7(CX), K3, Y7                         // 62f27d2bc4b9f9ffffff
+       VPCONFLICTD 15(DX)(BX*4), K3, Y7                   // 62f27d2bc4bc9a0f000000
+       VPCONFLICTD Y14, K3, Y21                           // 62c27d2bc4ee
+       VPCONFLICTD Y8, K3, Y21                            // 62c27d2bc4e8
+       VPCONFLICTD Y20, K3, Y21                           // 62a27d2bc4ec
+       VPCONFLICTD -7(CX), K3, Y21                        // 62e27d2bc4a9f9ffffff
+       VPCONFLICTD 15(DX)(BX*4), K3, Y21                  // 62e27d2bc4ac9a0f000000
+       VPCONFLICTD Z11, K7, Z21                           // 62c27d4fc4eb
+       VPCONFLICTD Z25, K7, Z21                           // 62827d4fc4e9
+       VPCONFLICTD -15(R14)(R15*1), K7, Z21               // 62827d4fc4ac3ef1ffffff
+       VPCONFLICTD -15(BX), K7, Z21                       // 62e27d4fc4abf1ffffff
+       VPCONFLICTD Z11, K7, Z13                           // 62527d4fc4eb
+       VPCONFLICTD Z25, K7, Z13                           // 62127d4fc4e9
+       VPCONFLICTD -15(R14)(R15*1), K7, Z13               // 62127d4fc4ac3ef1ffffff
+       VPCONFLICTD -15(BX), K7, Z13                       // 62727d4fc4abf1ffffff
+       VPCONFLICTQ X11, K4, X8                            // 6252fd0cc4c3
+       VPCONFLICTQ X16, K4, X8                            // 6232fd0cc4c0
+       VPCONFLICTQ X6, K4, X8                             // 6272fd0cc4c6
+       VPCONFLICTQ 15(R8)(R14*8), K4, X8                  // 6212fd0cc484f00f000000
+       VPCONFLICTQ -15(R14)(R15*2), K4, X8                // 6212fd0cc4847ef1ffffff
+       VPCONFLICTQ X11, K4, X6                            // 62d2fd0cc4f3
+       VPCONFLICTQ X16, K4, X6                            // 62b2fd0cc4f0
+       VPCONFLICTQ X6, K4, X6                             // 62f2fd0cc4f6
+       VPCONFLICTQ 15(R8)(R14*8), K4, X6                  // 6292fd0cc4b4f00f000000
+       VPCONFLICTQ -15(R14)(R15*2), K4, X6                // 6292fd0cc4b47ef1ffffff
+       VPCONFLICTQ X11, K4, X0                            // 62d2fd0cc4c3
+       VPCONFLICTQ X16, K4, X0                            // 62b2fd0cc4c0
+       VPCONFLICTQ X6, K4, X0                             // 62f2fd0cc4c6
+       VPCONFLICTQ 15(R8)(R14*8), K4, X0                  // 6292fd0cc484f00f000000
+       VPCONFLICTQ -15(R14)(R15*2), K4, X0                // 6292fd0cc4847ef1ffffff
+       VPCONFLICTQ Y5, K4, Y11                            // 6272fd2cc4dd
+       VPCONFLICTQ Y18, K4, Y11                           // 6232fd2cc4da
+       VPCONFLICTQ Y20, K4, Y11                           // 6232fd2cc4dc
+       VPCONFLICTQ 99(R15)(R15*8), K4, Y11                // 6212fd2cc49cff63000000
+       VPCONFLICTQ 7(AX)(CX*8), K4, Y11                   // 6272fd2cc49cc807000000
+       VPCONFLICTQ Y5, K4, Y24                            // 6262fd2cc4c5
+       VPCONFLICTQ Y18, K4, Y24                           // 6222fd2cc4c2
+       VPCONFLICTQ Y20, K4, Y24                           // 6222fd2cc4c4
+       VPCONFLICTQ 99(R15)(R15*8), K4, Y24                // 6202fd2cc484ff63000000
+       VPCONFLICTQ 7(AX)(CX*8), K4, Y24                   // 6262fd2cc484c807000000
+       VPCONFLICTQ Y5, K4, Y1                             // 62f2fd2cc4cd
+       VPCONFLICTQ Y18, K4, Y1                            // 62b2fd2cc4ca
+       VPCONFLICTQ Y20, K4, Y1                            // 62b2fd2cc4cc
+       VPCONFLICTQ 99(R15)(R15*8), K4, Y1                 // 6292fd2cc48cff63000000
+       VPCONFLICTQ 7(AX)(CX*8), K4, Y1                    // 62f2fd2cc48cc807000000
+       VPCONFLICTQ Z27, K7, Z3                            // 6292fd4fc4db
+       VPCONFLICTQ Z15, K7, Z3                            // 62d2fd4fc4df
+       VPCONFLICTQ 7(AX)(CX*4), K7, Z3                    // 62f2fd4fc49c8807000000
+       VPCONFLICTQ 7(AX)(CX*1), K7, Z3                    // 62f2fd4fc49c0807000000
+       VPCONFLICTQ Z27, K7, Z12                           // 6212fd4fc4e3
+       VPCONFLICTQ Z15, K7, Z12                           // 6252fd4fc4e7
+       VPCONFLICTQ 7(AX)(CX*4), K7, Z12                   // 6272fd4fc4a48807000000
+       VPCONFLICTQ 7(AX)(CX*1), K7, Z12                   // 6272fd4fc4a40807000000
+       VPLZCNTD X3, K3, X17                               // 62e27d0b44cb
+       VPLZCNTD X26, K3, X17                              // 62827d0b44ca
+       VPLZCNTD X23, K3, X17                              // 62a27d0b44cf
+       VPLZCNTD 15(DX)(BX*1), K3, X17                     // 62e27d0b448c1a0f000000
+       VPLZCNTD -7(CX)(DX*2), K3, X17                     // 62e27d0b448c51f9ffffff
+       VPLZCNTD X3, K3, X15                               // 62727d0b44fb
+       VPLZCNTD X26, K3, X15                              // 62127d0b44fa
+       VPLZCNTD X23, K3, X15                              // 62327d0b44ff
+       VPLZCNTD 15(DX)(BX*1), K3, X15                     // 62727d0b44bc1a0f000000
+       VPLZCNTD -7(CX)(DX*2), K3, X15                     // 62727d0b44bc51f9ffffff
+       VPLZCNTD X3, K3, X8                                // 62727d0b44c3
+       VPLZCNTD X26, K3, X8                               // 62127d0b44c2
+       VPLZCNTD X23, K3, X8                               // 62327d0b44c7
+       VPLZCNTD 15(DX)(BX*1), K3, X8                      // 62727d0b44841a0f000000
+       VPLZCNTD -7(CX)(DX*2), K3, X8                      // 62727d0b448451f9ffffff
+       VPLZCNTD Y5, K3, Y20                               // 62e27d2b44e5
+       VPLZCNTD Y28, K3, Y20                              // 62827d2b44e4
+       VPLZCNTD Y7, K3, Y20                               // 62e27d2b44e7
+       VPLZCNTD (BX), K3, Y20                             // 62e27d2b4423
+       VPLZCNTD -17(BP)(SI*1), K3, Y20                    // 62e27d2b44a435efffffff
+       VPLZCNTD Y5, K3, Y12                               // 62727d2b44e5
+       VPLZCNTD Y28, K3, Y12                              // 62127d2b44e4
+       VPLZCNTD Y7, K3, Y12                               // 62727d2b44e7
+       VPLZCNTD (BX), K3, Y12                             // 62727d2b4423
+       VPLZCNTD -17(BP)(SI*1), K3, Y12                    // 62727d2b44a435efffffff
+       VPLZCNTD Y5, K3, Y3                                // 62f27d2b44dd
+       VPLZCNTD Y28, K3, Y3                               // 62927d2b44dc
+       VPLZCNTD Y7, K3, Y3                                // 62f27d2b44df
+       VPLZCNTD (BX), K3, Y3                              // 62f27d2b441b
+       VPLZCNTD -17(BP)(SI*1), K3, Y3                     // 62f27d2b449c35efffffff
+       VPLZCNTD Z21, K3, Z3                               // 62b27d4b44dd
+       VPLZCNTD Z13, K3, Z3                               // 62d27d4b44dd
+       VPLZCNTD 17(SP)(BP*8), K3, Z3                      // 62f27d4b449cec11000000
+       VPLZCNTD 17(SP)(BP*4), K3, Z3                      // 62f27d4b449cac11000000
+       VPLZCNTD Z21, K3, Z0                               // 62b27d4b44c5
+       VPLZCNTD Z13, K3, Z0                               // 62d27d4b44c5
+       VPLZCNTD 17(SP)(BP*8), K3, Z0                      // 62f27d4b4484ec11000000
+       VPLZCNTD 17(SP)(BP*4), K3, Z0                      // 62f27d4b4484ac11000000
+       VPLZCNTQ X9, K2, X13                               // 6252fd0a44e9
+       VPLZCNTQ X15, K2, X13                              // 6252fd0a44ef
+       VPLZCNTQ X26, K2, X13                              // 6212fd0a44ea
+       VPLZCNTQ -17(BP), K2, X13                          // 6272fd0a44adefffffff
+       VPLZCNTQ -15(R14)(R15*8), K2, X13                  // 6212fd0a44acfef1ffffff
+       VPLZCNTQ X9, K2, X28                               // 6242fd0a44e1
+       VPLZCNTQ X15, K2, X28                              // 6242fd0a44e7
+       VPLZCNTQ X26, K2, X28                              // 6202fd0a44e2
+       VPLZCNTQ -17(BP), K2, X28                          // 6262fd0a44a5efffffff
+       VPLZCNTQ -15(R14)(R15*8), K2, X28                  // 6202fd0a44a4fef1ffffff
+       VPLZCNTQ X9, K2, X24                               // 6242fd0a44c1
+       VPLZCNTQ X15, K2, X24                              // 6242fd0a44c7
+       VPLZCNTQ X26, K2, X24                              // 6202fd0a44c2
+       VPLZCNTQ -17(BP), K2, X24                          // 6262fd0a4485efffffff
+       VPLZCNTQ -15(R14)(R15*8), K2, X24                  // 6202fd0a4484fef1ffffff
+       VPLZCNTQ Y12, K1, Y0                               // 62d2fd2944c4
+       VPLZCNTQ Y1, K1, Y0                                // 62f2fd2944c1
+       VPLZCNTQ Y14, K1, Y0                               // 62d2fd2944c6
+       VPLZCNTQ 15(R8)(R14*4), K1, Y0                     // 6292fd294484b00f000000
+       VPLZCNTQ -7(CX)(DX*4), K1, Y0                      // 62f2fd29448491f9ffffff
+       VPLZCNTQ Y12, K1, Y22                              // 62c2fd2944f4
+       VPLZCNTQ Y1, K1, Y22                               // 62e2fd2944f1
+       VPLZCNTQ Y14, K1, Y22                              // 62c2fd2944f6
+       VPLZCNTQ 15(R8)(R14*4), K1, Y22                    // 6282fd2944b4b00f000000
+       VPLZCNTQ -7(CX)(DX*4), K1, Y22                     // 62e2fd2944b491f9ffffff
+       VPLZCNTQ Y12, K1, Y13                              // 6252fd2944ec
+       VPLZCNTQ Y1, K1, Y13                               // 6272fd2944e9
+       VPLZCNTQ Y14, K1, Y13                              // 6252fd2944ee
+       VPLZCNTQ 15(R8)(R14*4), K1, Y13                    // 6212fd2944acb00f000000
+       VPLZCNTQ -7(CX)(DX*4), K1, Y13                     // 6272fd2944ac91f9ffffff
+       VPLZCNTQ Z3, K2, Z11                               // 6272fd4a44db
+       VPLZCNTQ Z12, K2, Z11                              // 6252fd4a44dc
+       VPLZCNTQ 7(SI)(DI*4), K2, Z11                      // 6272fd4a449cbe07000000
+       VPLZCNTQ -7(DI)(R8*2), K2, Z11                     // 6232fd4a449c47f9ffffff
+       VPLZCNTQ Z3, K2, Z25                               // 6262fd4a44cb
+       VPLZCNTQ Z12, K2, Z25                              // 6242fd4a44cc
+       VPLZCNTQ 7(SI)(DI*4), K2, Z25                      // 6262fd4a448cbe07000000
+       VPLZCNTQ -7(DI)(R8*2), K2, Z25                     // 6222fd4a448c47f9ffffff
        RET
index d514207c940b89a91823ba130a337827061e84b3..9861f4adddb5dcdcbbd8166508e6a73ee5fc3aa4 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512dq(SB), NOSPLIT, $0
-       //TODO: KADDB K3, K1, K6                                   // c5f54af3
-       //TODO: KADDB K1, K1, K6                                   // c5f54af1
-       //TODO: KADDB K3, K5, K6                                   // c5d54af3
-       //TODO: KADDB K1, K5, K6                                   // c5d54af1
-       //TODO: KADDB K3, K1, K5                                   // c5f54aeb
-       //TODO: KADDB K1, K1, K5                                   // c5f54ae9
-       //TODO: KADDB K3, K5, K5                                   // c5d54aeb
-       //TODO: KADDB K1, K5, K5                                   // c5d54ae9
-       //TODO: KADDW K6, K6, K1                                   // c5cc4ace
-       //TODO: KADDW K4, K6, K1                                   // c5cc4acc
-       //TODO: KADDW K6, K7, K1                                   // c5c44ace
-       //TODO: KADDW K4, K7, K1                                   // c5c44acc
-       //TODO: KADDW K6, K6, K3                                   // c5cc4ade
-       //TODO: KADDW K4, K6, K3                                   // c5cc4adc
-       //TODO: KADDW K6, K7, K3                                   // c5c44ade
-       //TODO: KADDW K4, K7, K3                                   // c5c44adc
-       //TODO: KANDB K2, K4, K4                                   // c5dd41e2
-       //TODO: KANDB K7, K4, K4                                   // c5dd41e7
-       //TODO: KANDB K2, K5, K4                                   // c5d541e2
-       //TODO: KANDB K7, K5, K4                                   // c5d541e7
-       //TODO: KANDB K2, K4, K6                                   // c5dd41f2
-       //TODO: KANDB K7, K4, K6                                   // c5dd41f7
-       //TODO: KANDB K2, K5, K6                                   // c5d541f2
-       //TODO: KANDB K7, K5, K6                                   // c5d541f7
-       //TODO: KANDNB K7, K5, K3                                  // c5d542df
-       //TODO: KANDNB K6, K5, K3                                  // c5d542de
-       //TODO: KANDNB K7, K4, K3                                  // c5dd42df
-       //TODO: KANDNB K6, K4, K3                                  // c5dd42de
-       //TODO: KANDNB K7, K5, K1                                  // c5d542cf
-       //TODO: KANDNB K6, K5, K1                                  // c5d542ce
-       //TODO: KANDNB K7, K4, K1                                  // c5dd42cf
-       //TODO: KANDNB K6, K4, K1                                  // c5dd42ce
-       //TODO: KMOVB K7, 17(SP)                                   // c5f9917c2411
-       //TODO: KMOVB K6, 17(SP)                                   // c5f991742411
-       //TODO: KMOVB K7, -17(BP)(SI*4)                            // c5f9917cb5ef
-       //TODO: KMOVB K6, -17(BP)(SI*4)                            // c5f99174b5ef
-       //TODO: KMOVB K4, AX                                       // c5f993c4
-       //TODO: KMOVB K6, AX                                       // c5f993c6
-       //TODO: KMOVB K4, R9                                       // c57993cc
-       //TODO: KMOVB K6, R9                                       // c57993ce
-       //TODO: KMOVB K5, K0                                       // c5f990c5
-       //TODO: KMOVB K4, K0                                       // c5f990c4
-       //TODO: KMOVB 7(AX), K0                                    // c5f9904007
-       //TODO: KMOVB (DI), K0                                     // c5f99007
-       //TODO: KMOVB K5, K7                                       // c5f990fd
-       //TODO: KMOVB K4, K7                                       // c5f990fc
-       //TODO: KMOVB 7(AX), K7                                    // c5f9907807
-       //TODO: KMOVB (DI), K7                                     // c5f9903f
-       //TODO: KMOVB CX, K4                                       // c5f992e1
-       //TODO: KMOVB SP, K4                                       // c5f992e4
-       //TODO: KMOVB CX, K6                                       // c5f992f1
-       //TODO: KMOVB SP, K6                                       // c5f992f4
-       //TODO: KNOTB K1, K4                                       // c5f944e1
-       //TODO: KNOTB K3, K4                                       // c5f944e3
-       //TODO: KNOTB K1, K6                                       // c5f944f1
-       //TODO: KNOTB K3, K6                                       // c5f944f3
-       //TODO: KORB K3, K1, K6                                    // c5f545f3
-       //TODO: KORB K1, K1, K6                                    // c5f545f1
-       //TODO: KORB K3, K5, K6                                    // c5d545f3
-       //TODO: KORB K1, K5, K6                                    // c5d545f1
-       //TODO: KORB K3, K1, K5                                    // c5f545eb
-       //TODO: KORB K1, K1, K5                                    // c5f545e9
-       //TODO: KORB K3, K5, K5                                    // c5d545eb
-       //TODO: KORB K1, K5, K5                                    // c5d545e9
-       //TODO: KORTESTB K6, K1                                    // c5f998ce
-       //TODO: KORTESTB K7, K1                                    // c5f998cf
-       //TODO: KORTESTB K6, K3                                    // c5f998de
-       //TODO: KORTESTB K7, K3                                    // c5f998df
-       //TODO: KSHIFTLB $127, K4, K7                              // c4e37932fc7f
-       //TODO: KSHIFTLB $127, K6, K7                              // c4e37932fe7f
-       //TODO: KSHIFTLB $127, K4, K6                              // c4e37932f47f
-       //TODO: KSHIFTLB $127, K6, K6                              // c4e37932f67f
-       //TODO: KSHIFTRB $42, K4, K4                               // c4e37930e42a
-       //TODO: KSHIFTRB $42, K5, K4                               // c4e37930e52a
-       //TODO: KSHIFTRB $42, K4, K6                               // c4e37930f42a
-       //TODO: KSHIFTRB $42, K5, K6                               // c4e37930f52a
-       //TODO: KTESTB K4, K7                                      // c5f999fc
-       //TODO: KTESTB K6, K7                                      // c5f999fe
-       //TODO: KTESTB K4, K6                                      // c5f999f4
-       //TODO: KTESTB K6, K6                                      // c5f999f6
-       //TODO: KTESTW K6, K6                                      // c5f899f6
-       //TODO: KTESTW K4, K6                                      // c5f899f4
-       //TODO: KTESTW K6, K7                                      // c5f899fe
-       //TODO: KTESTW K4, K7                                      // c5f899fc
-       //TODO: KXNORB K5, K0, K4                                  // c5fd46e5
-       //TODO: KXNORB K4, K0, K4                                  // c5fd46e4
-       //TODO: KXNORB K5, K7, K4                                  // c5c546e5
-       //TODO: KXNORB K4, K7, K4                                  // c5c546e4
-       //TODO: KXNORB K5, K0, K6                                  // c5fd46f5
-       //TODO: KXNORB K4, K0, K6                                  // c5fd46f4
-       //TODO: KXNORB K5, K7, K6                                  // c5c546f5
-       //TODO: KXNORB K4, K7, K6                                  // c5c546f4
-       //TODO: KXORB K5, K3, K1                                   // c5e547cd
-       //TODO: KXORB K4, K3, K1                                   // c5e547cc
-       //TODO: KXORB K5, K1, K1                                   // c5f547cd
-       //TODO: KXORB K4, K1, K1                                   // c5f547cc
-       //TODO: KXORB K5, K3, K5                                   // c5e547ed
-       //TODO: KXORB K4, K3, K5                                   // c5e547ec
-       //TODO: KXORB K5, K1, K5                                   // c5f547ed
-       //TODO: KXORB K4, K1, K5                                   // c5f547ec
-       //TODO: VANDNPD X15, X0, K4, X22                           // 62c1fd0c55f7
-       //TODO: VANDNPD X11, X0, K4, X22                           // 62c1fd0c55f3
-       //TODO: VANDNPD X0, X0, K4, X22                            // 62e1fd0c55f0
-       //TODO: VANDNPD (R8), X0, K4, X22                          // 62c1fd0c5530
-       //TODO: VANDNPD 15(DX)(BX*2), X0, K4, X22                  // 62e1fd0c55b45a0f000000
-       //TODO: VANDNPD X15, X17, K4, X22                          // 62c1f50455f7
-       //TODO: VANDNPD X11, X17, K4, X22                          // 62c1f50455f3
-       //TODO: VANDNPD X0, X17, K4, X22                           // 62e1f50455f0
-       //TODO: VANDNPD (R8), X17, K4, X22                         // 62c1f5045530
-       //TODO: VANDNPD 15(DX)(BX*2), X17, K4, X22                 // 62e1f50455b45a0f000000
-       //TODO: VANDNPD X15, X7, K4, X22                           // 62c1c50c55f7
-       //TODO: VANDNPD X11, X7, K4, X22                           // 62c1c50c55f3
-       //TODO: VANDNPD X0, X7, K4, X22                            // 62e1c50c55f0
-       //TODO: VANDNPD (R8), X7, K4, X22                          // 62c1c50c5530
-       //TODO: VANDNPD 15(DX)(BX*2), X7, K4, X22                  // 62e1c50c55b45a0f000000
-       //TODO: VANDNPD X15, X0, K4, X5                            // 62d1fd0c55ef
-       //TODO: VANDNPD X11, X0, K4, X5                            // 62d1fd0c55eb
-       //TODO: VANDNPD X0, X0, K4, X5                             // 62f1fd0c55e8
-       //TODO: VANDNPD (R8), X0, K4, X5                           // 62d1fd0c5528
-       //TODO: VANDNPD 15(DX)(BX*2), X0, K4, X5                   // 62f1fd0c55ac5a0f000000
-       //TODO: VANDNPD X15, X17, K4, X5                           // 62d1f50455ef
-       //TODO: VANDNPD X11, X17, K4, X5                           // 62d1f50455eb
-       //TODO: VANDNPD X0, X17, K4, X5                            // 62f1f50455e8
-       //TODO: VANDNPD (R8), X17, K4, X5                          // 62d1f5045528
-       //TODO: VANDNPD 15(DX)(BX*2), X17, K4, X5                  // 62f1f50455ac5a0f000000
-       //TODO: VANDNPD X15, X7, K4, X5                            // 62d1c50c55ef
-       //TODO: VANDNPD X11, X7, K4, X5                            // 62d1c50c55eb
-       //TODO: VANDNPD X0, X7, K4, X5                             // 62f1c50c55e8
-       //TODO: VANDNPD (R8), X7, K4, X5                           // 62d1c50c5528
-       //TODO: VANDNPD 15(DX)(BX*2), X7, K4, X5                   // 62f1c50c55ac5a0f000000
-       //TODO: VANDNPD X15, X0, K4, X14                           // 6251fd0c55f7
-       //TODO: VANDNPD X11, X0, K4, X14                           // 6251fd0c55f3
-       //TODO: VANDNPD X0, X0, K4, X14                            // 6271fd0c55f0
-       //TODO: VANDNPD (R8), X0, K4, X14                          // 6251fd0c5530
-       //TODO: VANDNPD 15(DX)(BX*2), X0, K4, X14                  // 6271fd0c55b45a0f000000
-       //TODO: VANDNPD X15, X17, K4, X14                          // 6251f50455f7
-       //TODO: VANDNPD X11, X17, K4, X14                          // 6251f50455f3
-       //TODO: VANDNPD X0, X17, K4, X14                           // 6271f50455f0
-       //TODO: VANDNPD (R8), X17, K4, X14                         // 6251f5045530
-       //TODO: VANDNPD 15(DX)(BX*2), X17, K4, X14                 // 6271f50455b45a0f000000
-       //TODO: VANDNPD X15, X7, K4, X14                           // 6251c50c55f7
-       //TODO: VANDNPD X11, X7, K4, X14                           // 6251c50c55f3
-       //TODO: VANDNPD X0, X7, K4, X14                            // 6271c50c55f0
-       //TODO: VANDNPD (R8), X7, K4, X14                          // 6251c50c5530
-       //TODO: VANDNPD 15(DX)(BX*2), X7, K4, X14                  // 6271c50c55b45a0f000000
-       //TODO: VANDNPD Y17, Y12, K5, Y0                           // 62b19d2d55c1
-       //TODO: VANDNPD Y7, Y12, K5, Y0                            // 62f19d2d55c7
-       //TODO: VANDNPD Y9, Y12, K5, Y0                            // 62d19d2d55c1
-       //TODO: VANDNPD 99(R15)(R15*8), Y12, K5, Y0                // 62919d2d5584ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y12, K5, Y0                   // 62f19d2d5584c807000000
-       //TODO: VANDNPD Y17, Y1, K5, Y0                            // 62b1f52d55c1
-       //TODO: VANDNPD Y7, Y1, K5, Y0                             // 62f1f52d55c7
-       //TODO: VANDNPD Y9, Y1, K5, Y0                             // 62d1f52d55c1
-       //TODO: VANDNPD 99(R15)(R15*8), Y1, K5, Y0                 // 6291f52d5584ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y1, K5, Y0                    // 62f1f52d5584c807000000
-       //TODO: VANDNPD Y17, Y14, K5, Y0                           // 62b18d2d55c1
-       //TODO: VANDNPD Y7, Y14, K5, Y0                            // 62f18d2d55c7
-       //TODO: VANDNPD Y9, Y14, K5, Y0                            // 62d18d2d55c1
-       //TODO: VANDNPD 99(R15)(R15*8), Y14, K5, Y0                // 62918d2d5584ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y14, K5, Y0                   // 62f18d2d5584c807000000
-       //TODO: VANDNPD Y17, Y12, K5, Y22                          // 62a19d2d55f1
-       //TODO: VANDNPD Y7, Y12, K5, Y22                           // 62e19d2d55f7
-       //TODO: VANDNPD Y9, Y12, K5, Y22                           // 62c19d2d55f1
-       //TODO: VANDNPD 99(R15)(R15*8), Y12, K5, Y22               // 62819d2d55b4ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y12, K5, Y22                  // 62e19d2d55b4c807000000
-       //TODO: VANDNPD Y17, Y1, K5, Y22                           // 62a1f52d55f1
-       //TODO: VANDNPD Y7, Y1, K5, Y22                            // 62e1f52d55f7
-       //TODO: VANDNPD Y9, Y1, K5, Y22                            // 62c1f52d55f1
-       //TODO: VANDNPD 99(R15)(R15*8), Y1, K5, Y22                // 6281f52d55b4ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y1, K5, Y22                   // 62e1f52d55b4c807000000
-       //TODO: VANDNPD Y17, Y14, K5, Y22                          // 62a18d2d55f1
-       //TODO: VANDNPD Y7, Y14, K5, Y22                           // 62e18d2d55f7
-       //TODO: VANDNPD Y9, Y14, K5, Y22                           // 62c18d2d55f1
-       //TODO: VANDNPD 99(R15)(R15*8), Y14, K5, Y22               // 62818d2d55b4ff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y14, K5, Y22                  // 62e18d2d55b4c807000000
-       //TODO: VANDNPD Y17, Y12, K5, Y13                          // 62319d2d55e9
-       //TODO: VANDNPD Y7, Y12, K5, Y13                           // 62719d2d55ef
-       //TODO: VANDNPD Y9, Y12, K5, Y13                           // 62519d2d55e9
-       //TODO: VANDNPD 99(R15)(R15*8), Y12, K5, Y13               // 62119d2d55acff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y12, K5, Y13                  // 62719d2d55acc807000000
-       //TODO: VANDNPD Y17, Y1, K5, Y13                           // 6231f52d55e9
-       //TODO: VANDNPD Y7, Y1, K5, Y13                            // 6271f52d55ef
-       //TODO: VANDNPD Y9, Y1, K5, Y13                            // 6251f52d55e9
-       //TODO: VANDNPD 99(R15)(R15*8), Y1, K5, Y13                // 6211f52d55acff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y1, K5, Y13                   // 6271f52d55acc807000000
-       //TODO: VANDNPD Y17, Y14, K5, Y13                          // 62318d2d55e9
-       //TODO: VANDNPD Y7, Y14, K5, Y13                           // 62718d2d55ef
-       //TODO: VANDNPD Y9, Y14, K5, Y13                           // 62518d2d55e9
-       //TODO: VANDNPD 99(R15)(R15*8), Y14, K5, Y13               // 62118d2d55acff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Y14, K5, Y13                  // 62718d2d55acc807000000
-       //TODO: VANDNPD Z20, Z0, K7, Z7                            // 62b1fd4f55fc
-       //TODO: VANDNPD Z28, Z0, K7, Z7                            // 6291fd4f55fc
-       //TODO: VANDNPD 99(R15)(R15*8), Z0, K7, Z7                 // 6291fd4f55bcff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Z0, K7, Z7                    // 62f1fd4f55bcc807000000
-       //TODO: VANDNPD Z20, Z6, K7, Z7                            // 62b1cd4f55fc
-       //TODO: VANDNPD Z28, Z6, K7, Z7                            // 6291cd4f55fc
-       //TODO: VANDNPD 99(R15)(R15*8), Z6, K7, Z7                 // 6291cd4f55bcff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Z6, K7, Z7                    // 62f1cd4f55bcc807000000
-       //TODO: VANDNPD Z20, Z0, K7, Z9                            // 6231fd4f55cc
-       //TODO: VANDNPD Z28, Z0, K7, Z9                            // 6211fd4f55cc
-       //TODO: VANDNPD 99(R15)(R15*8), Z0, K7, Z9                 // 6211fd4f558cff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Z0, K7, Z9                    // 6271fd4f558cc807000000
-       //TODO: VANDNPD Z20, Z6, K7, Z9                            // 6231cd4f55cc
-       //TODO: VANDNPD Z28, Z6, K7, Z9                            // 6211cd4f55cc
-       //TODO: VANDNPD 99(R15)(R15*8), Z6, K7, Z9                 // 6211cd4f558cff63000000
-       //TODO: VANDNPD 7(AX)(CX*8), Z6, K7, Z9                    // 6271cd4f558cc807000000
-       //TODO: VANDNPS X15, X25, K7, X18                          // 62c1340755d7
-       //TODO: VANDNPS X28, X25, K7, X18                          // 6281340755d4
-       //TODO: VANDNPS 17(SP)(BP*1), X25, K7, X18                 // 62e1340755942c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X25, K7, X18                 // 62e134075594d1f9ffffff
-       //TODO: VANDNPS X15, X3, K7, X18                           // 62c1640f55d7
-       //TODO: VANDNPS X28, X3, K7, X18                           // 6281640f55d4
-       //TODO: VANDNPS 17(SP)(BP*1), X3, K7, X18                  // 62e1640f55942c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X3, K7, X18                  // 62e1640f5594d1f9ffffff
-       //TODO: VANDNPS X15, X18, K7, X18                          // 62c16c0755d7
-       //TODO: VANDNPS X28, X18, K7, X18                          // 62816c0755d4
-       //TODO: VANDNPS 17(SP)(BP*1), X18, K7, X18                 // 62e16c0755942c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X18, K7, X18                 // 62e16c075594d1f9ffffff
-       //TODO: VANDNPS X15, X25, K7, X8                           // 6251340755c7
-       //TODO: VANDNPS X28, X25, K7, X8                           // 6211340755c4
-       //TODO: VANDNPS 17(SP)(BP*1), X25, K7, X8                  // 6271340755842c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X25, K7, X8                  // 627134075584d1f9ffffff
-       //TODO: VANDNPS X15, X3, K7, X8                            // 6251640f55c7
-       //TODO: VANDNPS X28, X3, K7, X8                            // 6211640f55c4
-       //TODO: VANDNPS 17(SP)(BP*1), X3, K7, X8                   // 6271640f55842c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X3, K7, X8                   // 6271640f5584d1f9ffffff
-       //TODO: VANDNPS X15, X18, K7, X8                           // 62516c0755c7
-       //TODO: VANDNPS X28, X18, K7, X8                           // 62116c0755c4
-       //TODO: VANDNPS 17(SP)(BP*1), X18, K7, X8                  // 62716c0755842c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X18, K7, X8                  // 62716c075584d1f9ffffff
-       //TODO: VANDNPS X15, X25, K7, X27                          // 6241340755df
-       //TODO: VANDNPS X28, X25, K7, X27                          // 6201340755dc
-       //TODO: VANDNPS 17(SP)(BP*1), X25, K7, X27                 // 62613407559c2c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X25, K7, X27                 // 62613407559cd1f9ffffff
-       //TODO: VANDNPS X15, X3, K7, X27                           // 6241640f55df
-       //TODO: VANDNPS X28, X3, K7, X27                           // 6201640f55dc
-       //TODO: VANDNPS 17(SP)(BP*1), X3, K7, X27                  // 6261640f559c2c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X3, K7, X27                  // 6261640f559cd1f9ffffff
-       //TODO: VANDNPS X15, X18, K7, X27                          // 62416c0755df
-       //TODO: VANDNPS X28, X18, K7, X27                          // 62016c0755dc
-       //TODO: VANDNPS 17(SP)(BP*1), X18, K7, X27                 // 62616c07559c2c11000000
-       //TODO: VANDNPS -7(CX)(DX*8), X18, K7, X27                 // 62616c07559cd1f9ffffff
-       //TODO: VANDNPS Y2, Y28, K6, Y31                           // 62611c2655fa
-       //TODO: VANDNPS Y21, Y28, K6, Y31                          // 62211c2655fd
-       //TODO: VANDNPS Y12, Y28, K6, Y31                          // 62411c2655fc
-       //TODO: VANDNPS (AX), Y28, K6, Y31                         // 62611c265538
-       //TODO: VANDNPS 7(SI), Y28, K6, Y31                        // 62611c2655be07000000
-       //TODO: VANDNPS Y2, Y13, K6, Y31                           // 6261142e55fa
-       //TODO: VANDNPS Y21, Y13, K6, Y31                          // 6221142e55fd
-       //TODO: VANDNPS Y12, Y13, K6, Y31                          // 6241142e55fc
-       //TODO: VANDNPS (AX), Y13, K6, Y31                         // 6261142e5538
-       //TODO: VANDNPS 7(SI), Y13, K6, Y31                        // 6261142e55be07000000
-       //TODO: VANDNPS Y2, Y7, K6, Y31                            // 6261442e55fa
-       //TODO: VANDNPS Y21, Y7, K6, Y31                           // 6221442e55fd
-       //TODO: VANDNPS Y12, Y7, K6, Y31                           // 6241442e55fc
-       //TODO: VANDNPS (AX), Y7, K6, Y31                          // 6261442e5538
-       //TODO: VANDNPS 7(SI), Y7, K6, Y31                         // 6261442e55be07000000
-       //TODO: VANDNPS Y2, Y28, K6, Y8                            // 62711c2655c2
-       //TODO: VANDNPS Y21, Y28, K6, Y8                           // 62311c2655c5
-       //TODO: VANDNPS Y12, Y28, K6, Y8                           // 62511c2655c4
-       //TODO: VANDNPS (AX), Y28, K6, Y8                          // 62711c265500
-       //TODO: VANDNPS 7(SI), Y28, K6, Y8                         // 62711c26558607000000
-       //TODO: VANDNPS Y2, Y13, K6, Y8                            // 6271142e55c2
-       //TODO: VANDNPS Y21, Y13, K6, Y8                           // 6231142e55c5
-       //TODO: VANDNPS Y12, Y13, K6, Y8                           // 6251142e55c4
-       //TODO: VANDNPS (AX), Y13, K6, Y8                          // 6271142e5500
-       //TODO: VANDNPS 7(SI), Y13, K6, Y8                         // 6271142e558607000000
-       //TODO: VANDNPS Y2, Y7, K6, Y8                             // 6271442e55c2
-       //TODO: VANDNPS Y21, Y7, K6, Y8                            // 6231442e55c5
-       //TODO: VANDNPS Y12, Y7, K6, Y8                            // 6251442e55c4
-       //TODO: VANDNPS (AX), Y7, K6, Y8                           // 6271442e5500
-       //TODO: VANDNPS 7(SI), Y7, K6, Y8                          // 6271442e558607000000
-       //TODO: VANDNPS Y2, Y28, K6, Y1                            // 62f11c2655ca
-       //TODO: VANDNPS Y21, Y28, K6, Y1                           // 62b11c2655cd
-       //TODO: VANDNPS Y12, Y28, K6, Y1                           // 62d11c2655cc
-       //TODO: VANDNPS (AX), Y28, K6, Y1                          // 62f11c265508
-       //TODO: VANDNPS 7(SI), Y28, K6, Y1                         // 62f11c26558e07000000
-       //TODO: VANDNPS Y2, Y13, K6, Y1                            // 62f1142e55ca
-       //TODO: VANDNPS Y21, Y13, K6, Y1                           // 62b1142e55cd
-       //TODO: VANDNPS Y12, Y13, K6, Y1                           // 62d1142e55cc
-       //TODO: VANDNPS (AX), Y13, K6, Y1                          // 62f1142e5508
-       //TODO: VANDNPS 7(SI), Y13, K6, Y1                         // 62f1142e558e07000000
-       //TODO: VANDNPS Y2, Y7, K6, Y1                             // 62f1442e55ca
-       //TODO: VANDNPS Y21, Y7, K6, Y1                            // 62b1442e55cd
-       //TODO: VANDNPS Y12, Y7, K6, Y1                            // 62d1442e55cc
-       //TODO: VANDNPS (AX), Y7, K6, Y1                           // 62f1442e5508
-       //TODO: VANDNPS 7(SI), Y7, K6, Y1                          // 62f1442e558e07000000
-       //TODO: VANDNPS Z12, Z9, K3, Z3                            // 62d1344b55dc
-       //TODO: VANDNPS Z22, Z9, K3, Z3                            // 62b1344b55de
-       //TODO: VANDNPS (AX), Z9, K3, Z3                           // 62f1344b5518
-       //TODO: VANDNPS 7(SI), Z9, K3, Z3                          // 62f1344b559e07000000
-       //TODO: VANDNPS Z12, Z19, K3, Z3                           // 62d1644355dc
-       //TODO: VANDNPS Z22, Z19, K3, Z3                           // 62b1644355de
-       //TODO: VANDNPS (AX), Z19, K3, Z3                          // 62f164435518
-       //TODO: VANDNPS 7(SI), Z19, K3, Z3                         // 62f16443559e07000000
-       //TODO: VANDNPS Z12, Z9, K3, Z30                           // 6241344b55f4
-       //TODO: VANDNPS Z22, Z9, K3, Z30                           // 6221344b55f6
-       //TODO: VANDNPS (AX), Z9, K3, Z30                          // 6261344b5530
-       //TODO: VANDNPS 7(SI), Z9, K3, Z30                         // 6261344b55b607000000
-       //TODO: VANDNPS Z12, Z19, K3, Z30                          // 6241644355f4
-       //TODO: VANDNPS Z22, Z19, K3, Z30                          // 6221644355f6
-       //TODO: VANDNPS (AX), Z19, K3, Z30                         // 626164435530
-       //TODO: VANDNPS 7(SI), Z19, K3, Z30                        // 6261644355b607000000
-       //TODO: VANDPD X22, X24, K7, X7                            // 62b1bd0754fe
-       //TODO: VANDPD X1, X24, K7, X7                             // 62f1bd0754f9
-       //TODO: VANDPD X11, X24, K7, X7                            // 62d1bd0754fb
-       //TODO: VANDPD -17(BP)(SI*2), X24, K7, X7                  // 62f1bd0754bc75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X24, K7, X7                    // 62f1bd0754bc4807000000
-       //TODO: VANDPD X22, X7, K7, X7                             // 62b1c50f54fe
-       //TODO: VANDPD X1, X7, K7, X7                              // 62f1c50f54f9
-       //TODO: VANDPD X11, X7, K7, X7                             // 62d1c50f54fb
-       //TODO: VANDPD -17(BP)(SI*2), X7, K7, X7                   // 62f1c50f54bc75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X7, K7, X7                     // 62f1c50f54bc4807000000
-       //TODO: VANDPD X22, X0, K7, X7                             // 62b1fd0f54fe
-       //TODO: VANDPD X1, X0, K7, X7                              // 62f1fd0f54f9
-       //TODO: VANDPD X11, X0, K7, X7                             // 62d1fd0f54fb
-       //TODO: VANDPD -17(BP)(SI*2), X0, K7, X7                   // 62f1fd0f54bc75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X0, K7, X7                     // 62f1fd0f54bc4807000000
-       //TODO: VANDPD X22, X24, K7, X13                           // 6231bd0754ee
-       //TODO: VANDPD X1, X24, K7, X13                            // 6271bd0754e9
-       //TODO: VANDPD X11, X24, K7, X13                           // 6251bd0754eb
-       //TODO: VANDPD -17(BP)(SI*2), X24, K7, X13                 // 6271bd0754ac75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X24, K7, X13                   // 6271bd0754ac4807000000
-       //TODO: VANDPD X22, X7, K7, X13                            // 6231c50f54ee
-       //TODO: VANDPD X1, X7, K7, X13                             // 6271c50f54e9
-       //TODO: VANDPD X11, X7, K7, X13                            // 6251c50f54eb
-       //TODO: VANDPD -17(BP)(SI*2), X7, K7, X13                  // 6271c50f54ac75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X7, K7, X13                    // 6271c50f54ac4807000000
-       //TODO: VANDPD X22, X0, K7, X13                            // 6231fd0f54ee
-       //TODO: VANDPD X1, X0, K7, X13                             // 6271fd0f54e9
-       //TODO: VANDPD X11, X0, K7, X13                            // 6251fd0f54eb
-       //TODO: VANDPD -17(BP)(SI*2), X0, K7, X13                  // 6271fd0f54ac75efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X0, K7, X13                    // 6271fd0f54ac4807000000
-       //TODO: VANDPD X22, X24, K7, X8                            // 6231bd0754c6
-       //TODO: VANDPD X1, X24, K7, X8                             // 6271bd0754c1
-       //TODO: VANDPD X11, X24, K7, X8                            // 6251bd0754c3
-       //TODO: VANDPD -17(BP)(SI*2), X24, K7, X8                  // 6271bd07548475efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X24, K7, X8                    // 6271bd0754844807000000
-       //TODO: VANDPD X22, X7, K7, X8                             // 6231c50f54c6
-       //TODO: VANDPD X1, X7, K7, X8                              // 6271c50f54c1
-       //TODO: VANDPD X11, X7, K7, X8                             // 6251c50f54c3
-       //TODO: VANDPD -17(BP)(SI*2), X7, K7, X8                   // 6271c50f548475efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X7, K7, X8                     // 6271c50f54844807000000
-       //TODO: VANDPD X22, X0, K7, X8                             // 6231fd0f54c6
-       //TODO: VANDPD X1, X0, K7, X8                              // 6271fd0f54c1
-       //TODO: VANDPD X11, X0, K7, X8                             // 6251fd0f54c3
-       //TODO: VANDPD -17(BP)(SI*2), X0, K7, X8                   // 6271fd0f548475efffffff
-       //TODO: VANDPD 7(AX)(CX*2), X0, K7, X8                     // 6271fd0f54844807000000
-       //TODO: VANDPD Y12, Y3, K4, Y9                             // 6251e52c54cc
-       //TODO: VANDPD Y21, Y3, K4, Y9                             // 6231e52c54cd
-       //TODO: VANDPD Y14, Y3, K4, Y9                             // 6251e52c54ce
-       //TODO: VANDPD (BX), Y3, K4, Y9                            // 6271e52c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y3, K4, Y9                   // 6271e52c548c35efffffff
-       //TODO: VANDPD Y12, Y2, K4, Y9                             // 6251ed2c54cc
-       //TODO: VANDPD Y21, Y2, K4, Y9                             // 6231ed2c54cd
-       //TODO: VANDPD Y14, Y2, K4, Y9                             // 6251ed2c54ce
-       //TODO: VANDPD (BX), Y2, K4, Y9                            // 6271ed2c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y2, K4, Y9                   // 6271ed2c548c35efffffff
-       //TODO: VANDPD Y12, Y9, K4, Y9                             // 6251b52c54cc
-       //TODO: VANDPD Y21, Y9, K4, Y9                             // 6231b52c54cd
-       //TODO: VANDPD Y14, Y9, K4, Y9                             // 6251b52c54ce
-       //TODO: VANDPD (BX), Y9, K4, Y9                            // 6271b52c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y9, K4, Y9                   // 6271b52c548c35efffffff
-       //TODO: VANDPD Y12, Y3, K4, Y1                             // 62d1e52c54cc
-       //TODO: VANDPD Y21, Y3, K4, Y1                             // 62b1e52c54cd
-       //TODO: VANDPD Y14, Y3, K4, Y1                             // 62d1e52c54ce
-       //TODO: VANDPD (BX), Y3, K4, Y1                            // 62f1e52c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y3, K4, Y1                   // 62f1e52c548c35efffffff
-       //TODO: VANDPD Y12, Y2, K4, Y1                             // 62d1ed2c54cc
-       //TODO: VANDPD Y21, Y2, K4, Y1                             // 62b1ed2c54cd
-       //TODO: VANDPD Y14, Y2, K4, Y1                             // 62d1ed2c54ce
-       //TODO: VANDPD (BX), Y2, K4, Y1                            // 62f1ed2c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y2, K4, Y1                   // 62f1ed2c548c35efffffff
-       //TODO: VANDPD Y12, Y9, K4, Y1                             // 62d1b52c54cc
-       //TODO: VANDPD Y21, Y9, K4, Y1                             // 62b1b52c54cd
-       //TODO: VANDPD Y14, Y9, K4, Y1                             // 62d1b52c54ce
-       //TODO: VANDPD (BX), Y9, K4, Y1                            // 62f1b52c540b
-       //TODO: VANDPD -17(BP)(SI*1), Y9, K4, Y1                   // 62f1b52c548c35efffffff
-       //TODO: VANDPD Z2, Z18, K4, Z11                            // 6271ed4454da
-       //TODO: VANDPD Z21, Z18, K4, Z11                           // 6231ed4454dd
-       //TODO: VANDPD (BX), Z18, K4, Z11                          // 6271ed44541b
-       //TODO: VANDPD -17(BP)(SI*1), Z18, K4, Z11                 // 6271ed44549c35efffffff
-       //TODO: VANDPD Z2, Z24, K4, Z11                            // 6271bd4454da
-       //TODO: VANDPD Z21, Z24, K4, Z11                           // 6231bd4454dd
-       //TODO: VANDPD (BX), Z24, K4, Z11                          // 6271bd44541b
-       //TODO: VANDPD -17(BP)(SI*1), Z24, K4, Z11                 // 6271bd44549c35efffffff
-       //TODO: VANDPD Z2, Z18, K4, Z5                             // 62f1ed4454ea
-       //TODO: VANDPD Z21, Z18, K4, Z5                            // 62b1ed4454ed
-       //TODO: VANDPD (BX), Z18, K4, Z5                           // 62f1ed44542b
-       //TODO: VANDPD -17(BP)(SI*1), Z18, K4, Z5                  // 62f1ed4454ac35efffffff
-       //TODO: VANDPD Z2, Z24, K4, Z5                             // 62f1bd4454ea
-       //TODO: VANDPD Z21, Z24, K4, Z5                            // 62b1bd4454ed
-       //TODO: VANDPD (BX), Z24, K4, Z5                           // 62f1bd44542b
-       //TODO: VANDPD -17(BP)(SI*1), Z24, K4, Z5                  // 62f1bd4454ac35efffffff
-       //TODO: VANDPS X20, X31, K7, X6                            // 62b1040754f4
-       //TODO: VANDPS X24, X31, K7, X6                            // 6291040754f0
-       //TODO: VANDPS X7, X31, K7, X6                             // 62f1040754f7
-       //TODO: VANDPS 15(R8)(R14*1), X31, K7, X6                  // 6291040754b4300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X31, K7, X6                  // 6291040754b4700f000000
-       //TODO: VANDPS X20, X3, K7, X6                             // 62b1640f54f4
-       //TODO: VANDPS X24, X3, K7, X6                             // 6291640f54f0
-       //TODO: VANDPS X7, X3, K7, X6                              // 62f1640f54f7
-       //TODO: VANDPS 15(R8)(R14*1), X3, K7, X6                   // 6291640f54b4300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X3, K7, X6                   // 6291640f54b4700f000000
-       //TODO: VANDPS X20, X28, K7, X6                            // 62b11c0754f4
-       //TODO: VANDPS X24, X28, K7, X6                            // 62911c0754f0
-       //TODO: VANDPS X7, X28, K7, X6                             // 62f11c0754f7
-       //TODO: VANDPS 15(R8)(R14*1), X28, K7, X6                  // 62911c0754b4300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X28, K7, X6                  // 62911c0754b4700f000000
-       //TODO: VANDPS X20, X31, K7, X7                            // 62b1040754fc
-       //TODO: VANDPS X24, X31, K7, X7                            // 6291040754f8
-       //TODO: VANDPS X7, X31, K7, X7                             // 62f1040754ff
-       //TODO: VANDPS 15(R8)(R14*1), X31, K7, X7                  // 6291040754bc300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X31, K7, X7                  // 6291040754bc700f000000
-       //TODO: VANDPS X20, X3, K7, X7                             // 62b1640f54fc
-       //TODO: VANDPS X24, X3, K7, X7                             // 6291640f54f8
-       //TODO: VANDPS X7, X3, K7, X7                              // 62f1640f54ff
-       //TODO: VANDPS 15(R8)(R14*1), X3, K7, X7                   // 6291640f54bc300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X3, K7, X7                   // 6291640f54bc700f000000
-       //TODO: VANDPS X20, X28, K7, X7                            // 62b11c0754fc
-       //TODO: VANDPS X24, X28, K7, X7                            // 62911c0754f8
-       //TODO: VANDPS X7, X28, K7, X7                             // 62f11c0754ff
-       //TODO: VANDPS 15(R8)(R14*1), X28, K7, X7                  // 62911c0754bc300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X28, K7, X7                  // 62911c0754bc700f000000
-       //TODO: VANDPS X20, X31, K7, X8                            // 6231040754c4
-       //TODO: VANDPS X24, X31, K7, X8                            // 6211040754c0
-       //TODO: VANDPS X7, X31, K7, X8                             // 6271040754c7
-       //TODO: VANDPS 15(R8)(R14*1), X31, K7, X8                  // 621104075484300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X31, K7, X8                  // 621104075484700f000000
-       //TODO: VANDPS X20, X3, K7, X8                             // 6231640f54c4
-       //TODO: VANDPS X24, X3, K7, X8                             // 6211640f54c0
-       //TODO: VANDPS X7, X3, K7, X8                              // 6271640f54c7
-       //TODO: VANDPS 15(R8)(R14*1), X3, K7, X8                   // 6211640f5484300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X3, K7, X8                   // 6211640f5484700f000000
-       //TODO: VANDPS X20, X28, K7, X8                            // 62311c0754c4
-       //TODO: VANDPS X24, X28, K7, X8                            // 62111c0754c0
-       //TODO: VANDPS X7, X28, K7, X8                             // 62711c0754c7
-       //TODO: VANDPS 15(R8)(R14*1), X28, K7, X8                  // 62111c075484300f000000
-       //TODO: VANDPS 15(R8)(R14*2), X28, K7, X8                  // 62111c075484700f000000
-       //TODO: VANDPS Y31, Y16, K2, Y30                           // 62017c2254f7
-       //TODO: VANDPS Y22, Y16, K2, Y30                           // 62217c2254f6
-       //TODO: VANDPS Y6, Y16, K2, Y30                            // 62617c2254f6
-       //TODO: VANDPS 15(R8)(R14*4), Y16, K2, Y30                 // 62017c2254b4b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y16, K2, Y30                  // 62617c2254b491f9ffffff
-       //TODO: VANDPS Y31, Y1, K2, Y30                            // 6201742a54f7
-       //TODO: VANDPS Y22, Y1, K2, Y30                            // 6221742a54f6
-       //TODO: VANDPS Y6, Y1, K2, Y30                             // 6261742a54f6
-       //TODO: VANDPS 15(R8)(R14*4), Y1, K2, Y30                  // 6201742a54b4b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y1, K2, Y30                   // 6261742a54b491f9ffffff
-       //TODO: VANDPS Y31, Y30, K2, Y30                           // 62010c2254f7
-       //TODO: VANDPS Y22, Y30, K2, Y30                           // 62210c2254f6
-       //TODO: VANDPS Y6, Y30, K2, Y30                            // 62610c2254f6
-       //TODO: VANDPS 15(R8)(R14*4), Y30, K2, Y30                 // 62010c2254b4b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y30, K2, Y30                  // 62610c2254b491f9ffffff
-       //TODO: VANDPS Y31, Y16, K2, Y26                           // 62017c2254d7
-       //TODO: VANDPS Y22, Y16, K2, Y26                           // 62217c2254d6
-       //TODO: VANDPS Y6, Y16, K2, Y26                            // 62617c2254d6
-       //TODO: VANDPS 15(R8)(R14*4), Y16, K2, Y26                 // 62017c225494b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y16, K2, Y26                  // 62617c22549491f9ffffff
-       //TODO: VANDPS Y31, Y1, K2, Y26                            // 6201742a54d7
-       //TODO: VANDPS Y22, Y1, K2, Y26                            // 6221742a54d6
-       //TODO: VANDPS Y6, Y1, K2, Y26                             // 6261742a54d6
-       //TODO: VANDPS 15(R8)(R14*4), Y1, K2, Y26                  // 6201742a5494b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y1, K2, Y26                   // 6261742a549491f9ffffff
-       //TODO: VANDPS Y31, Y30, K2, Y26                           // 62010c2254d7
-       //TODO: VANDPS Y22, Y30, K2, Y26                           // 62210c2254d6
-       //TODO: VANDPS Y6, Y30, K2, Y26                            // 62610c2254d6
-       //TODO: VANDPS 15(R8)(R14*4), Y30, K2, Y26                 // 62010c225494b00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y30, K2, Y26                  // 62610c22549491f9ffffff
-       //TODO: VANDPS Y31, Y16, K2, Y7                            // 62917c2254ff
-       //TODO: VANDPS Y22, Y16, K2, Y7                            // 62b17c2254fe
-       //TODO: VANDPS Y6, Y16, K2, Y7                             // 62f17c2254fe
-       //TODO: VANDPS 15(R8)(R14*4), Y16, K2, Y7                  // 62917c2254bcb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y16, K2, Y7                   // 62f17c2254bc91f9ffffff
-       //TODO: VANDPS Y31, Y1, K2, Y7                             // 6291742a54ff
-       //TODO: VANDPS Y22, Y1, K2, Y7                             // 62b1742a54fe
-       //TODO: VANDPS Y6, Y1, K2, Y7                              // 62f1742a54fe
-       //TODO: VANDPS 15(R8)(R14*4), Y1, K2, Y7                   // 6291742a54bcb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y1, K2, Y7                    // 62f1742a54bc91f9ffffff
-       //TODO: VANDPS Y31, Y30, K2, Y7                            // 62910c2254ff
-       //TODO: VANDPS Y22, Y30, K2, Y7                            // 62b10c2254fe
-       //TODO: VANDPS Y6, Y30, K2, Y7                             // 62f10c2254fe
-       //TODO: VANDPS 15(R8)(R14*4), Y30, K2, Y7                  // 62910c2254bcb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Y30, K2, Y7                   // 62f10c2254bc91f9ffffff
-       //TODO: VANDPS Z6, Z6, K5, Z7                              // 62f14c4d54fe
-       //TODO: VANDPS Z22, Z6, K5, Z7                             // 62b14c4d54fe
-       //TODO: VANDPS 15(R8)(R14*4), Z6, K5, Z7                   // 62914c4d54bcb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Z6, K5, Z7                    // 62f14c4d54bc91f9ffffff
-       //TODO: VANDPS Z6, Z16, K5, Z7                             // 62f17c4554fe
-       //TODO: VANDPS Z22, Z16, K5, Z7                            // 62b17c4554fe
-       //TODO: VANDPS 15(R8)(R14*4), Z16, K5, Z7                  // 62917c4554bcb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Z16, K5, Z7                   // 62f17c4554bc91f9ffffff
-       //TODO: VANDPS Z6, Z6, K5, Z13                             // 62714c4d54ee
-       //TODO: VANDPS Z22, Z6, K5, Z13                            // 62314c4d54ee
-       //TODO: VANDPS 15(R8)(R14*4), Z6, K5, Z13                  // 62114c4d54acb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Z6, K5, Z13                   // 62714c4d54ac91f9ffffff
-       //TODO: VANDPS Z6, Z16, K5, Z13                            // 62717c4554ee
-       //TODO: VANDPS Z22, Z16, K5, Z13                           // 62317c4554ee
-       //TODO: VANDPS 15(R8)(R14*4), Z16, K5, Z13                 // 62117c4554acb00f000000
-       //TODO: VANDPS -7(CX)(DX*4), Z16, K5, Z13                  // 62717c4554ac91f9ffffff
-       //TODO: VBROADCASTF32X2 X16, K3, Y1                        // 62b27d2b19c8
-       //TODO: VBROADCASTF32X2 X28, K3, Y1                        // 62927d2b19cc
-       //TODO: VBROADCASTF32X2 X8, K3, Y1                         // 62d27d2b19c8
-       //TODO: VBROADCASTF32X2 -17(BP)(SI*8), K3, Y1              // 62f27d2b198cf5efffffff
-       //TODO: VBROADCASTF32X2 (R15), K3, Y1                      // 62d27d2b190f
-       //TODO: VBROADCASTF32X2 X16, K3, Y27                       // 62227d2b19d8
-       //TODO: VBROADCASTF32X2 X28, K3, Y27                       // 62027d2b19dc
-       //TODO: VBROADCASTF32X2 X8, K3, Y27                        // 62427d2b19d8
-       //TODO: VBROADCASTF32X2 -17(BP)(SI*8), K3, Y27             // 62627d2b199cf5efffffff
-       //TODO: VBROADCASTF32X2 (R15), K3, Y27                     // 62427d2b191f
-       //TODO: VBROADCASTF32X2 X16, K3, Y19                       // 62a27d2b19d8
-       //TODO: VBROADCASTF32X2 X28, K3, Y19                       // 62827d2b19dc
-       //TODO: VBROADCASTF32X2 X8, K3, Y19                        // 62c27d2b19d8
-       //TODO: VBROADCASTF32X2 -17(BP)(SI*8), K3, Y19             // 62e27d2b199cf5efffffff
-       //TODO: VBROADCASTF32X2 (R15), K3, Y19                     // 62c27d2b191f
-       //TODO: VBROADCASTF32X2 X15, K2, Z1                        // 62d27d4a19cf
-       //TODO: VBROADCASTF32X2 X11, K2, Z1                        // 62d27d4a19cb
-       //TODO: VBROADCASTF32X2 X1, K2, Z1                         // 62f27d4a19c9
-       //TODO: VBROADCASTF32X2 7(SI)(DI*8), K2, Z1                // 62f27d4a198cfe07000000
-       //TODO: VBROADCASTF32X2 -15(R14), K2, Z1                   // 62d27d4a198ef1ffffff
-       //TODO: VBROADCASTF32X2 X15, K2, Z3                        // 62d27d4a19df
-       //TODO: VBROADCASTF32X2 X11, K2, Z3                        // 62d27d4a19db
-       //TODO: VBROADCASTF32X2 X1, K2, Z3                         // 62f27d4a19d9
-       //TODO: VBROADCASTF32X2 7(SI)(DI*8), K2, Z3                // 62f27d4a199cfe07000000
-       //TODO: VBROADCASTF32X2 -15(R14), K2, Z3                   // 62d27d4a199ef1ffffff
-       //TODO: VBROADCASTF32X8 -17(BP)(SI*2), K1, Z28             // 62627d491ba475efffffff
-       //TODO: VBROADCASTF32X8 7(AX)(CX*2), K1, Z28               // 62627d491ba44807000000
-       //TODO: VBROADCASTF32X8 -17(BP)(SI*2), K1, Z13             // 62727d491bac75efffffff
-       //TODO: VBROADCASTF32X8 7(AX)(CX*2), K1, Z13               // 62727d491bac4807000000
-       //TODO: VBROADCASTF64X2 -7(CX)(DX*1), K7, Y21              // 62e2fd2f1aac11f9ffffff
-       //TODO: VBROADCASTF64X2 -15(R14)(R15*4), K7, Y21           // 6282fd2f1aacbef1ffffff
-       //TODO: VBROADCASTF64X2 -7(CX)(DX*1), K7, Y7               // 62f2fd2f1abc11f9ffffff
-       //TODO: VBROADCASTF64X2 -15(R14)(R15*4), K7, Y7            // 6292fd2f1abcbef1ffffff
-       //TODO: VBROADCASTF64X2 -7(CX)(DX*1), K7, Y30              // 6262fd2f1ab411f9ffffff
-       //TODO: VBROADCASTF64X2 -15(R14)(R15*4), K7, Y30           // 6202fd2f1ab4bef1ffffff
-       //TODO: VBROADCASTF64X2 15(DX)(BX*1), K1, Z14              // 6272fd491ab41a0f000000
-       //TODO: VBROADCASTF64X2 -7(CX)(DX*2), K1, Z14              // 6272fd491ab451f9ffffff
-       //TODO: VBROADCASTF64X2 15(DX)(BX*1), K1, Z28              // 6262fd491aa41a0f000000
-       //TODO: VBROADCASTF64X2 -7(CX)(DX*2), K1, Z28              // 6262fd491aa451f9ffffff
-       //TODO: VBROADCASTI32X2 X14, K1, X19                       // 62c27d0959de
-       //TODO: VBROADCASTI32X2 X0, K1, X19                        // 62e27d0959d8
-       //TODO: VBROADCASTI32X2 7(SI)(DI*1), K1, X19               // 62e27d09599c3e07000000
-       //TODO: VBROADCASTI32X2 15(DX)(BX*8), K1, X19              // 62e27d09599cda0f000000
-       //TODO: VBROADCASTI32X2 X14, K1, X13                       // 62527d0959ee
-       //TODO: VBROADCASTI32X2 X0, K1, X13                        // 62727d0959e8
-       //TODO: VBROADCASTI32X2 7(SI)(DI*1), K1, X13               // 62727d0959ac3e07000000
-       //TODO: VBROADCASTI32X2 15(DX)(BX*8), K1, X13              // 62727d0959acda0f000000
-       //TODO: VBROADCASTI32X2 X14, K1, X2                        // 62d27d0959d6
-       //TODO: VBROADCASTI32X2 X0, K1, X2                         // 62f27d0959d0
-       //TODO: VBROADCASTI32X2 7(SI)(DI*1), K1, X2                // 62f27d0959943e07000000
-       //TODO: VBROADCASTI32X2 15(DX)(BX*8), K1, X2               // 62f27d095994da0f000000
-       //TODO: VBROADCASTI32X2 X25, K7, Y13                       // 62127d2f59e9
-       //TODO: VBROADCASTI32X2 X11, K7, Y13                       // 62527d2f59eb
-       //TODO: VBROADCASTI32X2 X17, K7, Y13                       // 62327d2f59e9
-       //TODO: VBROADCASTI32X2 -7(DI)(R8*1), K7, Y13              // 62327d2f59ac07f9ffffff
-       //TODO: VBROADCASTI32X2 (SP), K7, Y13                      // 62727d2f592c24
-       //TODO: VBROADCASTI32X2 X25, K7, Y18                       // 62827d2f59d1
-       //TODO: VBROADCASTI32X2 X11, K7, Y18                       // 62c27d2f59d3
-       //TODO: VBROADCASTI32X2 X17, K7, Y18                       // 62a27d2f59d1
-       //TODO: VBROADCASTI32X2 -7(DI)(R8*1), K7, Y18              // 62a27d2f599407f9ffffff
-       //TODO: VBROADCASTI32X2 (SP), K7, Y18                      // 62e27d2f591424
-       //TODO: VBROADCASTI32X2 X25, K7, Y24                       // 62027d2f59c1
-       //TODO: VBROADCASTI32X2 X11, K7, Y24                       // 62427d2f59c3
-       //TODO: VBROADCASTI32X2 X17, K7, Y24                       // 62227d2f59c1
-       //TODO: VBROADCASTI32X2 -7(DI)(R8*1), K7, Y24              // 62227d2f598407f9ffffff
-       //TODO: VBROADCASTI32X2 (SP), K7, Y24                      // 62627d2f590424
-       //TODO: VBROADCASTI32X2 X18, K2, Z15                       // 62327d4a59fa
-       //TODO: VBROADCASTI32X2 X11, K2, Z15                       // 62527d4a59fb
-       //TODO: VBROADCASTI32X2 X9, K2, Z15                        // 62527d4a59f9
-       //TODO: VBROADCASTI32X2 -7(CX), K2, Z15                    // 62727d4a59b9f9ffffff
-       //TODO: VBROADCASTI32X2 15(DX)(BX*4), K2, Z15              // 62727d4a59bc9a0f000000
-       //TODO: VBROADCASTI32X2 X18, K2, Z30                       // 62227d4a59f2
-       //TODO: VBROADCASTI32X2 X11, K2, Z30                       // 62427d4a59f3
-       //TODO: VBROADCASTI32X2 X9, K2, Z30                        // 62427d4a59f1
-       //TODO: VBROADCASTI32X2 -7(CX), K2, Z30                    // 62627d4a59b1f9ffffff
-       //TODO: VBROADCASTI32X2 15(DX)(BX*4), K2, Z30              // 62627d4a59b49a0f000000
-       //TODO: VBROADCASTI32X8 (R14), K3, Z5                      // 62d27d4b5b2e
-       //TODO: VBROADCASTI32X8 -7(DI)(R8*8), K3, Z5               // 62b27d4b5bacc7f9ffffff
-       //TODO: VBROADCASTI32X8 (R14), K3, Z1                      // 62d27d4b5b0e
-       //TODO: VBROADCASTI32X8 -7(DI)(R8*8), K3, Z1               // 62b27d4b5b8cc7f9ffffff
-       //TODO: VBROADCASTI64X2 15(R8), K4, Y5                     // 62d2fd2c5aa80f000000
-       //TODO: VBROADCASTI64X2 (BP), K4, Y5                       // 62f2fd2c5a6d00
-       //TODO: VBROADCASTI64X2 15(R8), K4, Y24                    // 6242fd2c5a800f000000
-       //TODO: VBROADCASTI64X2 (BP), K4, Y24                      // 6262fd2c5a4500
-       //TODO: VBROADCASTI64X2 15(R8), K4, Y21                    // 62c2fd2c5aa80f000000
-       //TODO: VBROADCASTI64X2 (BP), K4, Y21                      // 62e2fd2c5a6d00
-       //TODO: VBROADCASTI64X2 15(R8)(R14*8), K5, Z3              // 6292fd4d5a9cf00f000000
-       //TODO: VBROADCASTI64X2 -15(R14)(R15*2), K5, Z3            // 6292fd4d5a9c7ef1ffffff
-       //TODO: VBROADCASTI64X2 15(R8)(R14*8), K5, Z5              // 6292fd4d5aacf00f000000
-       //TODO: VBROADCASTI64X2 -15(R14)(R15*2), K5, Z5            // 6292fd4d5aac7ef1ffffff
-       //TODO: VCVTPD2QQ X15, K7, X0                              // 62d1fd0f7bc7
-       //TODO: VCVTPD2QQ X11, K7, X0                              // 62d1fd0f7bc3
-       //TODO: VCVTPD2QQ X0, K7, X0                               // 62f1fd0f7bc0
-       //TODO: VCVTPD2QQ -17(BP)(SI*8), K7, X0                    // 62f1fd0f7b84f5efffffff
-       //TODO: VCVTPD2QQ (R15), K7, X0                            // 62d1fd0f7b07
-       //TODO: VCVTPD2QQ X15, K7, X17                             // 62c1fd0f7bcf
-       //TODO: VCVTPD2QQ X11, K7, X17                             // 62c1fd0f7bcb
-       //TODO: VCVTPD2QQ X0, K7, X17                              // 62e1fd0f7bc8
-       //TODO: VCVTPD2QQ -17(BP)(SI*8), K7, X17                   // 62e1fd0f7b8cf5efffffff
-       //TODO: VCVTPD2QQ (R15), K7, X17                           // 62c1fd0f7b0f
-       //TODO: VCVTPD2QQ X15, K7, X7                              // 62d1fd0f7bff
-       //TODO: VCVTPD2QQ X11, K7, X7                              // 62d1fd0f7bfb
-       //TODO: VCVTPD2QQ X0, K7, X7                               // 62f1fd0f7bf8
-       //TODO: VCVTPD2QQ -17(BP)(SI*8), K7, X7                    // 62f1fd0f7bbcf5efffffff
-       //TODO: VCVTPD2QQ (R15), K7, X7                            // 62d1fd0f7b3f
-       //TODO: VCVTPD2QQ Y0, K2, Y6                               // 62f1fd2a7bf0
-       //TODO: VCVTPD2QQ Y19, K2, Y6                              // 62b1fd2a7bf3
-       //TODO: VCVTPD2QQ Y31, K2, Y6                              // 6291fd2a7bf7
-       //TODO: VCVTPD2QQ -15(R14)(R15*1), K2, Y6                  // 6291fd2a7bb43ef1ffffff
-       //TODO: VCVTPD2QQ -15(BX), K2, Y6                          // 62f1fd2a7bb3f1ffffff
-       //TODO: VCVTPD2QQ Y0, K2, Y1                               // 62f1fd2a7bc8
-       //TODO: VCVTPD2QQ Y19, K2, Y1                              // 62b1fd2a7bcb
-       //TODO: VCVTPD2QQ Y31, K2, Y1                              // 6291fd2a7bcf
-       //TODO: VCVTPD2QQ -15(R14)(R15*1), K2, Y1                  // 6291fd2a7b8c3ef1ffffff
-       //TODO: VCVTPD2QQ -15(BX), K2, Y1                          // 62f1fd2a7b8bf1ffffff
-       //TODO: VCVTPD2QQ Y0, K2, Y9                               // 6271fd2a7bc8
-       //TODO: VCVTPD2QQ Y19, K2, Y9                              // 6231fd2a7bcb
-       //TODO: VCVTPD2QQ Y31, K2, Y9                              // 6211fd2a7bcf
-       //TODO: VCVTPD2QQ -15(R14)(R15*1), K2, Y9                  // 6211fd2a7b8c3ef1ffffff
-       //TODO: VCVTPD2QQ -15(BX), K2, Y9                          // 6271fd2a7b8bf1ffffff
-       //TODO: VCVTPD2QQ Z12, K5, Z14                             // 6251fd4d7bf4
-       //TODO: VCVTPD2QQ Z13, K5, Z14                             // 6251fd4d7bf5
-       //TODO: VCVTPD2QQ Z12, K5, Z13                             // 6251fd4d7bec
-       //TODO: VCVTPD2QQ Z13, K5, Z13                             // 6251fd4d7bed
-       //TODO: VCVTPD2QQ Z2, K3, Z21                              // 62e1fd4b7bea
-       //TODO: VCVTPD2QQ Z7, K3, Z21                              // 62e1fd4b7bef
-       //TODO: VCVTPD2QQ -17(BP), K3, Z21                         // 62e1fd4b7badefffffff
-       //TODO: VCVTPD2QQ -15(R14)(R15*8), K3, Z21                 // 6281fd4b7bacfef1ffffff
-       //TODO: VCVTPD2QQ Z2, K3, Z9                               // 6271fd4b7bca
-       //TODO: VCVTPD2QQ Z7, K3, Z9                               // 6271fd4b7bcf
-       //TODO: VCVTPD2QQ -17(BP), K3, Z9                          // 6271fd4b7b8defffffff
-       //TODO: VCVTPD2QQ -15(R14)(R15*8), K3, Z9                  // 6211fd4b7b8cfef1ffffff
-       //TODO: VCVTPD2UQQ X24, K3, X7                             // 6291fd0b79f8
-       //TODO: VCVTPD2UQQ X7, K3, X7                              // 62f1fd0b79ff
-       //TODO: VCVTPD2UQQ X0, K3, X7                              // 62f1fd0b79f8
-       //TODO: VCVTPD2UQQ 7(SI)(DI*1), K3, X7                     // 62f1fd0b79bc3e07000000
-       //TODO: VCVTPD2UQQ 15(DX)(BX*8), K3, X7                    // 62f1fd0b79bcda0f000000
-       //TODO: VCVTPD2UQQ X24, K3, X13                            // 6211fd0b79e8
-       //TODO: VCVTPD2UQQ X7, K3, X13                             // 6271fd0b79ef
-       //TODO: VCVTPD2UQQ X0, K3, X13                             // 6271fd0b79e8
-       //TODO: VCVTPD2UQQ 7(SI)(DI*1), K3, X13                    // 6271fd0b79ac3e07000000
-       //TODO: VCVTPD2UQQ 15(DX)(BX*8), K3, X13                   // 6271fd0b79acda0f000000
-       //TODO: VCVTPD2UQQ X24, K3, X8                             // 6211fd0b79c0
-       //TODO: VCVTPD2UQQ X7, K3, X8                              // 6271fd0b79c7
-       //TODO: VCVTPD2UQQ X0, K3, X8                              // 6271fd0b79c0
-       //TODO: VCVTPD2UQQ 7(SI)(DI*1), K3, X8                     // 6271fd0b79843e07000000
-       //TODO: VCVTPD2UQQ 15(DX)(BX*8), K3, X8                    // 6271fd0b7984da0f000000
-       //TODO: VCVTPD2UQQ Y27, K3, Y28                            // 6201fd2b79e3
-       //TODO: VCVTPD2UQQ Y0, K3, Y28                             // 6261fd2b79e0
-       //TODO: VCVTPD2UQQ Y11, K3, Y28                            // 6241fd2b79e3
-       //TODO: VCVTPD2UQQ (SI), K3, Y28                           // 6261fd2b7926
-       //TODO: VCVTPD2UQQ 7(SI)(DI*2), K3, Y28                    // 6261fd2b79a47e07000000
-       //TODO: VCVTPD2UQQ Y27, K3, Y2                             // 6291fd2b79d3
-       //TODO: VCVTPD2UQQ Y0, K3, Y2                              // 62f1fd2b79d0
-       //TODO: VCVTPD2UQQ Y11, K3, Y2                             // 62d1fd2b79d3
-       //TODO: VCVTPD2UQQ (SI), K3, Y2                            // 62f1fd2b7916
-       //TODO: VCVTPD2UQQ 7(SI)(DI*2), K3, Y2                     // 62f1fd2b79947e07000000
-       //TODO: VCVTPD2UQQ Y27, K3, Y24                            // 6201fd2b79c3
-       //TODO: VCVTPD2UQQ Y0, K3, Y24                             // 6261fd2b79c0
-       //TODO: VCVTPD2UQQ Y11, K3, Y24                            // 6241fd2b79c3
-       //TODO: VCVTPD2UQQ (SI), K3, Y24                           // 6261fd2b7906
-       //TODO: VCVTPD2UQQ 7(SI)(DI*2), K3, Y24                    // 6261fd2b79847e07000000
-       //TODO: VCVTPD2UQQ Z3, K2, Z27                             // 6261fd4a79db
-       //TODO: VCVTPD2UQQ Z0, K2, Z27                             // 6261fd4a79d8
-       //TODO: VCVTPD2UQQ Z3, K2, Z14                             // 6271fd4a79f3
-       //TODO: VCVTPD2UQQ Z0, K2, Z14                             // 6271fd4a79f0
-       //TODO: VCVTPD2UQQ Z8, K1, Z14                             // 6251fd4979f0
-       //TODO: VCVTPD2UQQ Z24, K1, Z14                            // 6211fd4979f0
-       //TODO: VCVTPD2UQQ 15(R8), K1, Z14                         // 6251fd4979b00f000000
-       //TODO: VCVTPD2UQQ (BP), K1, Z14                           // 6271fd49797500
-       //TODO: VCVTPD2UQQ Z8, K1, Z7                              // 62d1fd4979f8
-       //TODO: VCVTPD2UQQ Z24, K1, Z7                             // 6291fd4979f8
-       //TODO: VCVTPD2UQQ 15(R8), K1, Z7                          // 62d1fd4979b80f000000
-       //TODO: VCVTPD2UQQ (BP), K1, Z7                            // 62f1fd49797d00
-       //TODO: VCVTPS2QQ X19, K3, X15                             // 62317d0b7bfb
-       //TODO: VCVTPS2QQ X13, K3, X15                             // 62517d0b7bfd
-       //TODO: VCVTPS2QQ X2, K3, X15                              // 62717d0b7bfa
-       //TODO: VCVTPS2QQ (BX), K3, X15                            // 62717d0b7b3b
-       //TODO: VCVTPS2QQ -17(BP)(SI*1), K3, X15                   // 62717d0b7bbc35efffffff
-       //TODO: VCVTPS2QQ X19, K3, X11                             // 62317d0b7bdb
-       //TODO: VCVTPS2QQ X13, K3, X11                             // 62517d0b7bdd
-       //TODO: VCVTPS2QQ X2, K3, X11                              // 62717d0b7bda
-       //TODO: VCVTPS2QQ (BX), K3, X11                            // 62717d0b7b1b
-       //TODO: VCVTPS2QQ -17(BP)(SI*1), K3, X11                   // 62717d0b7b9c35efffffff
-       //TODO: VCVTPS2QQ X19, K3, X1                              // 62b17d0b7bcb
-       //TODO: VCVTPS2QQ X13, K3, X1                              // 62d17d0b7bcd
-       //TODO: VCVTPS2QQ X2, K3, X1                               // 62f17d0b7bca
-       //TODO: VCVTPS2QQ (BX), K3, X1                             // 62f17d0b7b0b
-       //TODO: VCVTPS2QQ -17(BP)(SI*1), K3, X1                    // 62f17d0b7b8c35efffffff
-       //TODO: VCVTPS2QQ X14, K7, Y20                             // 62c17d2f7be6
-       //TODO: VCVTPS2QQ X0, K7, Y20                              // 62e17d2f7be0
-       //TODO: VCVTPS2QQ 99(R15)(R15*1), K7, Y20                  // 62817d2f7ba43f63000000
-       //TODO: VCVTPS2QQ (DX), K7, Y20                            // 62e17d2f7b22
-       //TODO: VCVTPS2QQ X14, K7, Y12                             // 62517d2f7be6
-       //TODO: VCVTPS2QQ X0, K7, Y12                              // 62717d2f7be0
-       //TODO: VCVTPS2QQ 99(R15)(R15*1), K7, Y12                  // 62117d2f7ba43f63000000
-       //TODO: VCVTPS2QQ (DX), K7, Y12                            // 62717d2f7b22
-       //TODO: VCVTPS2QQ X14, K7, Y3                              // 62d17d2f7bde
-       //TODO: VCVTPS2QQ X0, K7, Y3                               // 62f17d2f7bd8
-       //TODO: VCVTPS2QQ 99(R15)(R15*1), K7, Y3                   // 62917d2f7b9c3f63000000
-       //TODO: VCVTPS2QQ (DX), K7, Y3                             // 62f17d2f7b1a
-       //TODO: VCVTPS2QQ Y5, K4, Z6                               // 62f17d4c7bf5
-       //TODO: VCVTPS2QQ Y28, K4, Z6                              // 62917d4c7bf4
-       //TODO: VCVTPS2QQ Y7, K4, Z6                               // 62f17d4c7bf7
-       //TODO: VCVTPS2QQ Y5, K4, Z14                              // 62717d4c7bf5
-       //TODO: VCVTPS2QQ Y28, K4, Z14                             // 62117d4c7bf4
-       //TODO: VCVTPS2QQ Y7, K4, Z14                              // 62717d4c7bf7
-       //TODO: VCVTPS2QQ Y0, K4, Z26                              // 62617d4c7bd0
-       //TODO: VCVTPS2QQ Y22, K4, Z26                             // 62217d4c7bd6
-       //TODO: VCVTPS2QQ Y13, K4, Z26                             // 62417d4c7bd5
-       //TODO: VCVTPS2QQ 7(AX)(CX*4), K4, Z26                     // 62617d4c7b948807000000
-       //TODO: VCVTPS2QQ 7(AX)(CX*1), K4, Z26                     // 62617d4c7b940807000000
-       //TODO: VCVTPS2QQ Y0, K4, Z14                              // 62717d4c7bf0
-       //TODO: VCVTPS2QQ Y22, K4, Z14                             // 62317d4c7bf6
-       //TODO: VCVTPS2QQ Y13, K4, Z14                             // 62517d4c7bf5
-       //TODO: VCVTPS2QQ 7(AX)(CX*4), K4, Z14                     // 62717d4c7bb48807000000
-       //TODO: VCVTPS2QQ 7(AX)(CX*1), K4, Z14                     // 62717d4c7bb40807000000
-       //TODO: VCVTPS2UQQ X2, K4, X2                              // 62f17d0c79d2
-       //TODO: VCVTPS2UQQ X27, K4, X2                             // 62917d0c79d3
-       //TODO: VCVTPS2UQQ X26, K4, X2                             // 62917d0c79d2
-       //TODO: VCVTPS2UQQ (R8), K4, X2                            // 62d17d0c7910
-       //TODO: VCVTPS2UQQ 15(DX)(BX*2), K4, X2                    // 62f17d0c79945a0f000000
-       //TODO: VCVTPS2UQQ X2, K4, X24                             // 62617d0c79c2
-       //TODO: VCVTPS2UQQ X27, K4, X24                            // 62017d0c79c3
-       //TODO: VCVTPS2UQQ X26, K4, X24                            // 62017d0c79c2
-       //TODO: VCVTPS2UQQ (R8), K4, X24                           // 62417d0c7900
-       //TODO: VCVTPS2UQQ 15(DX)(BX*2), K4, X24                   // 62617d0c79845a0f000000
-       //TODO: VCVTPS2UQQ X22, K2, Y31                            // 62217d2a79fe
-       //TODO: VCVTPS2UQQ X30, K2, Y31                            // 62017d2a79fe
-       //TODO: VCVTPS2UQQ X3, K2, Y31                             // 62617d2a79fb
-       //TODO: VCVTPS2UQQ 7(SI)(DI*8), K2, Y31                    // 62617d2a79bcfe07000000
-       //TODO: VCVTPS2UQQ -15(R14), K2, Y31                       // 62417d2a79bef1ffffff
-       //TODO: VCVTPS2UQQ X22, K2, Y8                             // 62317d2a79c6
-       //TODO: VCVTPS2UQQ X30, K2, Y8                             // 62117d2a79c6
-       //TODO: VCVTPS2UQQ X3, K2, Y8                              // 62717d2a79c3
-       //TODO: VCVTPS2UQQ 7(SI)(DI*8), K2, Y8                     // 62717d2a7984fe07000000
-       //TODO: VCVTPS2UQQ -15(R14), K2, Y8                        // 62517d2a7986f1ffffff
-       //TODO: VCVTPS2UQQ X22, K2, Y1                             // 62b17d2a79ce
-       //TODO: VCVTPS2UQQ X30, K2, Y1                             // 62917d2a79ce
-       //TODO: VCVTPS2UQQ X3, K2, Y1                              // 62f17d2a79cb
-       //TODO: VCVTPS2UQQ 7(SI)(DI*8), K2, Y1                     // 62f17d2a798cfe07000000
-       //TODO: VCVTPS2UQQ -15(R14), K2, Y1                        // 62d17d2a798ef1ffffff
-       //TODO: VCVTPS2UQQ Y28, K2, Z21                            // 62817d4a79ec
-       //TODO: VCVTPS2UQQ Y13, K2, Z21                            // 62c17d4a79ed
-       //TODO: VCVTPS2UQQ Y7, K2, Z21                             // 62e17d4a79ef
-       //TODO: VCVTPS2UQQ Y28, K2, Z13                            // 62117d4a79ec
-       //TODO: VCVTPS2UQQ Y13, K2, Z13                            // 62517d4a79ed
-       //TODO: VCVTPS2UQQ Y7, K2, Z13                             // 62717d4a79ef
-       //TODO: VCVTPS2UQQ Y2, K3, Z11                             // 62717d4b79da
-       //TODO: VCVTPS2UQQ Y21, K3, Z11                            // 62317d4b79dd
-       //TODO: VCVTPS2UQQ Y12, K3, Z11                            // 62517d4b79dc
-       //TODO: VCVTPS2UQQ 17(SP)(BP*8), K3, Z11                   // 62717d4b799cec11000000
-       //TODO: VCVTPS2UQQ 17(SP)(BP*4), K3, Z11                   // 62717d4b799cac11000000
-       //TODO: VCVTPS2UQQ Y2, K3, Z25                             // 62617d4b79ca
-       //TODO: VCVTPS2UQQ Y21, K3, Z25                            // 62217d4b79cd
-       //TODO: VCVTPS2UQQ Y12, K3, Z25                            // 62417d4b79cc
-       //TODO: VCVTPS2UQQ 17(SP)(BP*8), K3, Z25                   // 62617d4b798cec11000000
-       //TODO: VCVTPS2UQQ 17(SP)(BP*4), K3, Z25                   // 62617d4b798cac11000000
-       //TODO: VCVTQQ2PD X13, K3, X11                             // 6251fe0be6dd
-       //TODO: VCVTQQ2PD X6, K3, X11                              // 6271fe0be6de
-       //TODO: VCVTQQ2PD X12, K3, X11                             // 6251fe0be6dc
-       //TODO: VCVTQQ2PD 17(SP)(BP*1), K3, X11                    // 6271fe0be69c2c11000000
-       //TODO: VCVTQQ2PD -7(CX)(DX*8), K3, X11                    // 6271fe0be69cd1f9ffffff
-       //TODO: VCVTQQ2PD X13, K3, X15                             // 6251fe0be6fd
-       //TODO: VCVTQQ2PD X6, K3, X15                              // 6271fe0be6fe
-       //TODO: VCVTQQ2PD X12, K3, X15                             // 6251fe0be6fc
-       //TODO: VCVTQQ2PD 17(SP)(BP*1), K3, X15                    // 6271fe0be6bc2c11000000
-       //TODO: VCVTQQ2PD -7(CX)(DX*8), K3, X15                    // 6271fe0be6bcd1f9ffffff
-       //TODO: VCVTQQ2PD X13, K3, X30                             // 6241fe0be6f5
-       //TODO: VCVTQQ2PD X6, K3, X30                              // 6261fe0be6f6
-       //TODO: VCVTQQ2PD X12, K3, X30                             // 6241fe0be6f4
-       //TODO: VCVTQQ2PD 17(SP)(BP*1), K3, X30                    // 6261fe0be6b42c11000000
-       //TODO: VCVTQQ2PD -7(CX)(DX*8), K3, X30                    // 6261fe0be6b4d1f9ffffff
-       //TODO: VCVTQQ2PD Y3, K3, Y9                               // 6271fe2be6cb
-       //TODO: VCVTQQ2PD Y2, K3, Y9                               // 6271fe2be6ca
-       //TODO: VCVTQQ2PD Y9, K3, Y9                               // 6251fe2be6c9
-       //TODO: VCVTQQ2PD 7(SI)(DI*1), K3, Y9                      // 6271fe2be68c3e07000000
-       //TODO: VCVTQQ2PD 15(DX)(BX*8), K3, Y9                     // 6271fe2be68cda0f000000
-       //TODO: VCVTQQ2PD Y3, K3, Y1                               // 62f1fe2be6cb
-       //TODO: VCVTQQ2PD Y2, K3, Y1                               // 62f1fe2be6ca
-       //TODO: VCVTQQ2PD Y9, K3, Y1                               // 62d1fe2be6c9
-       //TODO: VCVTQQ2PD 7(SI)(DI*1), K3, Y1                      // 62f1fe2be68c3e07000000
-       //TODO: VCVTQQ2PD 15(DX)(BX*8), K3, Y1                     // 62f1fe2be68cda0f000000
-       //TODO: VCVTQQ2PD Z27, K2, Z3                              // 6291fe4ae6db
-       //TODO: VCVTQQ2PD Z15, K2, Z3                              // 62d1fe4ae6df
-       //TODO: VCVTQQ2PD Z27, K2, Z12                             // 6211fe4ae6e3
-       //TODO: VCVTQQ2PD Z15, K2, Z12                             // 6251fe4ae6e7
-       //TODO: VCVTQQ2PD Z23, K1, Z23                             // 62a1fe49e6ff
-       //TODO: VCVTQQ2PD Z6, K1, Z23                              // 62e1fe49e6fe
-       //TODO: VCVTQQ2PD 7(SI)(DI*4), K1, Z23                     // 62e1fe49e6bcbe07000000
-       //TODO: VCVTQQ2PD -7(DI)(R8*2), K1, Z23                    // 62a1fe49e6bc47f9ffffff
-       //TODO: VCVTQQ2PD Z23, K1, Z5                              // 62b1fe49e6ef
-       //TODO: VCVTQQ2PD Z6, K1, Z5                               // 62f1fe49e6ee
-       //TODO: VCVTQQ2PD 7(SI)(DI*4), K1, Z5                      // 62f1fe49e6acbe07000000
-       //TODO: VCVTQQ2PD -7(DI)(R8*2), K1, Z5                     // 62b1fe49e6ac47f9ffffff
-       //TODO: VCVTQQ2PS Z8, K2, Y12                              // 6251fc4a5be0
-       //TODO: VCVTQQ2PS Z28, K2, Y12                             // 6211fc4a5be4
-       //TODO: VCVTQQ2PS Z8, K2, Y21                              // 62c1fc4a5be8
-       //TODO: VCVTQQ2PS Z28, K2, Y21                             // 6281fc4a5bec
-       //TODO: VCVTQQ2PS Z8, K2, Y14                              // 6251fc4a5bf0
-       //TODO: VCVTQQ2PS Z28, K2, Y14                             // 6211fc4a5bf4
-       //TODO: VCVTQQ2PS Z21, K1, Y30                             // 6221fc495bf5
-       //TODO: VCVTQQ2PS Z5, K1, Y30                              // 6261fc495bf5
-       //TODO: VCVTQQ2PS 17(SP), K1, Y30                          // 6261fc495bb42411000000
-       //TODO: VCVTQQ2PS -17(BP)(SI*4), K1, Y30                   // 6261fc495bb4b5efffffff
-       //TODO: VCVTQQ2PS Z21, K1, Y26                             // 6221fc495bd5
-       //TODO: VCVTQQ2PS Z5, K1, Y26                              // 6261fc495bd5
-       //TODO: VCVTQQ2PS 17(SP), K1, Y26                          // 6261fc495b942411000000
-       //TODO: VCVTQQ2PS -17(BP)(SI*4), K1, Y26                   // 6261fc495b94b5efffffff
-       //TODO: VCVTQQ2PS Z21, K1, Y7                              // 62b1fc495bfd
-       //TODO: VCVTQQ2PS Z5, K1, Y7                               // 62f1fc495bfd
-       //TODO: VCVTQQ2PS 17(SP), K1, Y7                           // 62f1fc495bbc2411000000
-       //TODO: VCVTQQ2PS -17(BP)(SI*4), K1, Y7                    // 62f1fc495bbcb5efffffff
-       //TODO: VCVTQQ2PSX X20, K7, X23                            // 62a1fc0f5bfc
-       //TODO: VCVTQQ2PSX X2, K7, X23                             // 62e1fc0f5bfa
-       //TODO: VCVTQQ2PSX X9, K7, X23                             // 62c1fc0f5bf9
-       //TODO: VCVTQQ2PSX -17(BP)(SI*2), K7, X23                  // 62e1fc0f5bbc75efffffff
-       //TODO: VCVTQQ2PSX 7(AX)(CX*2), K7, X23                    // 62e1fc0f5bbc4807000000
-       //TODO: VCVTQQ2PSX X20, K7, X30                            // 6221fc0f5bf4
-       //TODO: VCVTQQ2PSX X2, K7, X30                             // 6261fc0f5bf2
-       //TODO: VCVTQQ2PSX X9, K7, X30                             // 6241fc0f5bf1
-       //TODO: VCVTQQ2PSX -17(BP)(SI*2), K7, X30                  // 6261fc0f5bb475efffffff
-       //TODO: VCVTQQ2PSX 7(AX)(CX*2), K7, X30                    // 6261fc0f5bb44807000000
-       //TODO: VCVTQQ2PSX X20, K7, X8                             // 6231fc0f5bc4
-       //TODO: VCVTQQ2PSX X2, K7, X8                              // 6271fc0f5bc2
-       //TODO: VCVTQQ2PSX X9, K7, X8                              // 6251fc0f5bc1
-       //TODO: VCVTQQ2PSX -17(BP)(SI*2), K7, X8                   // 6271fc0f5b8475efffffff
-       //TODO: VCVTQQ2PSX 7(AX)(CX*2), K7, X8                     // 6271fc0f5b844807000000
-       //TODO: VCVTQQ2PSY Y16, K1, X26                            // 6221fc295bd0
-       //TODO: VCVTQQ2PSY Y1, K1, X26                             // 6261fc295bd1
-       //TODO: VCVTQQ2PSY Y30, K1, X26                            // 6201fc295bd6
-       //TODO: VCVTQQ2PSY -7(DI)(R8*1), K1, X26                   // 6221fc295b9407f9ffffff
-       //TODO: VCVTQQ2PSY (SP), K1, X26                           // 6261fc295b1424
-       //TODO: VCVTQQ2PSY Y16, K1, X19                            // 62a1fc295bd8
-       //TODO: VCVTQQ2PSY Y1, K1, X19                             // 62e1fc295bd9
-       //TODO: VCVTQQ2PSY Y30, K1, X19                            // 6281fc295bde
-       //TODO: VCVTQQ2PSY -7(DI)(R8*1), K1, X19                   // 62a1fc295b9c07f9ffffff
-       //TODO: VCVTQQ2PSY (SP), K1, X19                           // 62e1fc295b1c24
-       //TODO: VCVTQQ2PSY Y16, K1, X0                             // 62b1fc295bc0
-       //TODO: VCVTQQ2PSY Y1, K1, X0                              // 62f1fc295bc1
-       //TODO: VCVTQQ2PSY Y30, K1, X0                             // 6291fc295bc6
-       //TODO: VCVTQQ2PSY -7(DI)(R8*1), K1, X0                    // 62b1fc295b8407f9ffffff
-       //TODO: VCVTQQ2PSY (SP), K1, X0                            // 62f1fc295b0424
-       //TODO: VCVTTPD2QQ X6, K5, X6                              // 62f1fd0d7af6
-       //TODO: VCVTTPD2QQ X1, K5, X6                              // 62f1fd0d7af1
-       //TODO: VCVTTPD2QQ X8, K5, X6                              // 62d1fd0d7af0
-       //TODO: VCVTTPD2QQ (R14), K5, X6                           // 62d1fd0d7a36
-       //TODO: VCVTTPD2QQ -7(DI)(R8*8), K5, X6                    // 62b1fd0d7ab4c7f9ffffff
-       //TODO: VCVTTPD2QQ X6, K5, X17                             // 62e1fd0d7ace
-       //TODO: VCVTTPD2QQ X1, K5, X17                             // 62e1fd0d7ac9
-       //TODO: VCVTTPD2QQ X8, K5, X17                             // 62c1fd0d7ac8
-       //TODO: VCVTTPD2QQ (R14), K5, X17                          // 62c1fd0d7a0e
-       //TODO: VCVTTPD2QQ -7(DI)(R8*8), K5, X17                   // 62a1fd0d7a8cc7f9ffffff
-       //TODO: VCVTTPD2QQ X6, K5, X28                             // 6261fd0d7ae6
-       //TODO: VCVTTPD2QQ X1, K5, X28                             // 6261fd0d7ae1
-       //TODO: VCVTTPD2QQ X8, K5, X28                             // 6241fd0d7ae0
-       //TODO: VCVTTPD2QQ (R14), K5, X28                          // 6241fd0d7a26
-       //TODO: VCVTTPD2QQ -7(DI)(R8*8), K5, X28                   // 6221fd0d7aa4c7f9ffffff
-       //TODO: VCVTTPD2QQ Y14, K7, Y24                            // 6241fd2f7ac6
-       //TODO: VCVTTPD2QQ Y21, K7, Y24                            // 6221fd2f7ac5
-       //TODO: VCVTTPD2QQ Y1, K7, Y24                             // 6261fd2f7ac1
-       //TODO: VCVTTPD2QQ 99(R15)(R15*8), K7, Y24                 // 6201fd2f7a84ff63000000
-       //TODO: VCVTTPD2QQ 7(AX)(CX*8), K7, Y24                    // 6261fd2f7a84c807000000
-       //TODO: VCVTTPD2QQ Y14, K7, Y13                            // 6251fd2f7aee
-       //TODO: VCVTTPD2QQ Y21, K7, Y13                            // 6231fd2f7aed
-       //TODO: VCVTTPD2QQ Y1, K7, Y13                             // 6271fd2f7ae9
-       //TODO: VCVTTPD2QQ 99(R15)(R15*8), K7, Y13                 // 6211fd2f7aacff63000000
-       //TODO: VCVTTPD2QQ 7(AX)(CX*8), K7, Y13                    // 6271fd2f7aacc807000000
-       //TODO: VCVTTPD2QQ Y14, K7, Y20                            // 62c1fd2f7ae6
-       //TODO: VCVTTPD2QQ Y21, K7, Y20                            // 62a1fd2f7ae5
-       //TODO: VCVTTPD2QQ Y1, K7, Y20                             // 62e1fd2f7ae1
-       //TODO: VCVTTPD2QQ 99(R15)(R15*8), K7, Y20                 // 6281fd2f7aa4ff63000000
-       //TODO: VCVTTPD2QQ 7(AX)(CX*8), K7, Y20                    // 62e1fd2f7aa4c807000000
-       //TODO: VCVTTPD2QQ Z6, K7, Z22                             // 62e1fd4f7af6
-       //TODO: VCVTTPD2QQ Z8, K7, Z22                             // 62c1fd4f7af0
-       //TODO: VCVTTPD2QQ Z6, K7, Z11                             // 6271fd4f7ade
-       //TODO: VCVTTPD2QQ Z8, K7, Z11                             // 6251fd4f7ad8
-       //TODO: VCVTTPD2QQ Z12, K6, Z25                            // 6241fd4e7acc
-       //TODO: VCVTTPD2QQ Z17, K6, Z25                            // 6221fd4e7ac9
-       //TODO: VCVTTPD2QQ 99(R15)(R15*1), K6, Z25                 // 6201fd4e7a8c3f63000000
-       //TODO: VCVTTPD2QQ (DX), K6, Z25                           // 6261fd4e7a0a
-       //TODO: VCVTTPD2QQ Z12, K6, Z12                            // 6251fd4e7ae4
-       //TODO: VCVTTPD2QQ Z17, K6, Z12                            // 6231fd4e7ae1
-       //TODO: VCVTTPD2QQ 99(R15)(R15*1), K6, Z12                 // 6211fd4e7aa43f63000000
-       //TODO: VCVTTPD2QQ (DX), K6, Z12                           // 6271fd4e7a22
-       //TODO: VCVTTPD2UQQ X15, K7, X16                           // 62c1fd0f78c7
-       //TODO: VCVTTPD2UQQ X11, K7, X16                           // 62c1fd0f78c3
-       //TODO: VCVTTPD2UQQ X1, K7, X16                            // 62e1fd0f78c1
-       //TODO: VCVTTPD2UQQ (CX), K7, X16                          // 62e1fd0f7801
-       //TODO: VCVTTPD2UQQ 99(R15), K7, X16                       // 62c1fd0f788763000000
-       //TODO: VCVTTPD2UQQ X15, K7, X28                           // 6241fd0f78e7
-       //TODO: VCVTTPD2UQQ X11, K7, X28                           // 6241fd0f78e3
-       //TODO: VCVTTPD2UQQ X1, K7, X28                            // 6261fd0f78e1
-       //TODO: VCVTTPD2UQQ (CX), K7, X28                          // 6261fd0f7821
-       //TODO: VCVTTPD2UQQ 99(R15), K7, X28                       // 6241fd0f78a763000000
-       //TODO: VCVTTPD2UQQ X15, K7, X8                            // 6251fd0f78c7
-       //TODO: VCVTTPD2UQQ X11, K7, X8                            // 6251fd0f78c3
-       //TODO: VCVTTPD2UQQ X1, K7, X8                             // 6271fd0f78c1
-       //TODO: VCVTTPD2UQQ (CX), K7, X8                           // 6271fd0f7801
-       //TODO: VCVTTPD2UQQ 99(R15), K7, X8                        // 6251fd0f788763000000
-       //TODO: VCVTTPD2UQQ Y21, K2, Y5                            // 62b1fd2a78ed
-       //TODO: VCVTTPD2UQQ Y7, K2, Y5                             // 62f1fd2a78ef
-       //TODO: VCVTTPD2UQQ Y30, K2, Y5                            // 6291fd2a78ee
-       //TODO: VCVTTPD2UQQ (BX), K2, Y5                           // 62f1fd2a782b
-       //TODO: VCVTTPD2UQQ -17(BP)(SI*1), K2, Y5                  // 62f1fd2a78ac35efffffff
-       //TODO: VCVTTPD2UQQ Y21, K2, Y17                           // 62a1fd2a78cd
-       //TODO: VCVTTPD2UQQ Y7, K2, Y17                            // 62e1fd2a78cf
-       //TODO: VCVTTPD2UQQ Y30, K2, Y17                           // 6281fd2a78ce
-       //TODO: VCVTTPD2UQQ (BX), K2, Y17                          // 62e1fd2a780b
-       //TODO: VCVTTPD2UQQ -17(BP)(SI*1), K2, Y17                 // 62e1fd2a788c35efffffff
-       //TODO: VCVTTPD2UQQ Y21, K2, Y13                           // 6231fd2a78ed
-       //TODO: VCVTTPD2UQQ Y7, K2, Y13                            // 6271fd2a78ef
-       //TODO: VCVTTPD2UQQ Y30, K2, Y13                           // 6211fd2a78ee
-       //TODO: VCVTTPD2UQQ (BX), K2, Y13                          // 6271fd2a782b
-       //TODO: VCVTTPD2UQQ -17(BP)(SI*1), K2, Y13                 // 6271fd2a78ac35efffffff
-       //TODO: VCVTTPD2UQQ Z8, K5, Z3                             // 62d1fd4d78d8
-       //TODO: VCVTTPD2UQQ Z2, K5, Z3                             // 62f1fd4d78da
-       //TODO: VCVTTPD2UQQ Z8, K5, Z21                            // 62c1fd4d78e8
-       //TODO: VCVTTPD2UQQ Z2, K5, Z21                            // 62e1fd4d78ea
-       //TODO: VCVTTPD2UQQ Z7, K3, Z3                             // 62f1fd4b78df
-       //TODO: VCVTTPD2UQQ Z9, K3, Z3                             // 62d1fd4b78d9
-       //TODO: VCVTTPD2UQQ 7(SI)(DI*8), K3, Z3                    // 62f1fd4b789cfe07000000
-       //TODO: VCVTTPD2UQQ -15(R14), K3, Z3                       // 62d1fd4b789ef1ffffff
-       //TODO: VCVTTPD2UQQ Z7, K3, Z27                            // 6261fd4b78df
-       //TODO: VCVTTPD2UQQ Z9, K3, Z27                            // 6241fd4b78d9
-       //TODO: VCVTTPD2UQQ 7(SI)(DI*8), K3, Z27                   // 6261fd4b789cfe07000000
-       //TODO: VCVTTPD2UQQ -15(R14), K3, Z27                      // 6241fd4b789ef1ffffff
-       //TODO: VCVTTPS2QQ X18, K3, X25                            // 62217d0b7aca
-       //TODO: VCVTTPS2QQ X11, K3, X25                            // 62417d0b7acb
-       //TODO: VCVTTPS2QQ X9, K3, X25                             // 62417d0b7ac9
-       //TODO: VCVTTPS2QQ -7(CX)(DX*1), K3, X25                   // 62617d0b7a8c11f9ffffff
-       //TODO: VCVTTPS2QQ -15(R14)(R15*4), K3, X25                // 62017d0b7a8cbef1ffffff
-       //TODO: VCVTTPS2QQ X18, K3, X11                            // 62317d0b7ada
-       //TODO: VCVTTPS2QQ X11, K3, X11                            // 62517d0b7adb
-       //TODO: VCVTTPS2QQ X9, K3, X11                             // 62517d0b7ad9
-       //TODO: VCVTTPS2QQ -7(CX)(DX*1), K3, X11                   // 62717d0b7a9c11f9ffffff
-       //TODO: VCVTTPS2QQ -15(R14)(R15*4), K3, X11                // 62117d0b7a9cbef1ffffff
-       //TODO: VCVTTPS2QQ X18, K3, X17                            // 62a17d0b7aca
-       //TODO: VCVTTPS2QQ X11, K3, X17                            // 62c17d0b7acb
-       //TODO: VCVTTPS2QQ X9, K3, X17                             // 62c17d0b7ac9
-       //TODO: VCVTTPS2QQ -7(CX)(DX*1), K3, X17                   // 62e17d0b7a8c11f9ffffff
-       //TODO: VCVTTPS2QQ -15(R14)(R15*4), K3, X17                // 62817d0b7a8cbef1ffffff
-       //TODO: VCVTTPS2QQ X2, K3, Y5                              // 62f17d2b7aea
-       //TODO: VCVTTPS2QQ X24, K3, Y5                             // 62917d2b7ae8
-       //TODO: VCVTTPS2QQ (R8), K3, Y5                            // 62d17d2b7a28
-       //TODO: VCVTTPS2QQ 15(DX)(BX*2), K3, Y5                    // 62f17d2b7aac5a0f000000
-       //TODO: VCVTTPS2QQ X2, K3, Y24                             // 62617d2b7ac2
-       //TODO: VCVTTPS2QQ X24, K3, Y24                            // 62017d2b7ac0
-       //TODO: VCVTTPS2QQ (R8), K3, Y24                           // 62417d2b7a00
-       //TODO: VCVTTPS2QQ 15(DX)(BX*2), K3, Y24                   // 62617d2b7a845a0f000000
-       //TODO: VCVTTPS2QQ X2, K3, Y21                             // 62e17d2b7aea
-       //TODO: VCVTTPS2QQ X24, K3, Y21                            // 62817d2b7ae8
-       //TODO: VCVTTPS2QQ (R8), K3, Y21                           // 62c17d2b7a28
-       //TODO: VCVTTPS2QQ 15(DX)(BX*2), K3, Y21                   // 62e17d2b7aac5a0f000000
-       //TODO: VCVTTPS2QQ Y16, K2, Z12                            // 62317d4a7ae0
-       //TODO: VCVTTPS2QQ Y9, K2, Z12                             // 62517d4a7ae1
-       //TODO: VCVTTPS2QQ Y13, K2, Z12                            // 62517d4a7ae5
-       //TODO: VCVTTPS2QQ Y16, K2, Z22                            // 62a17d4a7af0
-       //TODO: VCVTTPS2QQ Y9, K2, Z22                             // 62c17d4a7af1
-       //TODO: VCVTTPS2QQ Y13, K2, Z22                            // 62c17d4a7af5
-       //TODO: VCVTTPS2QQ Y9, K1, Z11                             // 62517d497ad9
-       //TODO: VCVTTPS2QQ Y6, K1, Z11                             // 62717d497ade
-       //TODO: VCVTTPS2QQ Y3, K1, Z11                             // 62717d497adb
-       //TODO: VCVTTPS2QQ -7(DI)(R8*1), K1, Z11                   // 62317d497a9c07f9ffffff
-       //TODO: VCVTTPS2QQ (SP), K1, Z11                           // 62717d497a1c24
-       //TODO: VCVTTPS2QQ Y9, K1, Z5                              // 62d17d497ae9
-       //TODO: VCVTTPS2QQ Y6, K1, Z5                              // 62f17d497aee
-       //TODO: VCVTTPS2QQ Y3, K1, Z5                              // 62f17d497aeb
-       //TODO: VCVTTPS2QQ -7(DI)(R8*1), K1, Z5                    // 62b17d497aac07f9ffffff
-       //TODO: VCVTTPS2QQ (SP), K1, Z5                            // 62f17d497a2c24
-       //TODO: VCVTTPS2UQQ X13, K1, X11                           // 62517d0978dd
-       //TODO: VCVTTPS2UQQ X6, K1, X11                            // 62717d0978de
-       //TODO: VCVTTPS2UQQ X12, K1, X11                           // 62517d0978dc
-       //TODO: VCVTTPS2UQQ -17(BP), K1, X11                       // 62717d09789defffffff
-       //TODO: VCVTTPS2UQQ -15(R14)(R15*8), K1, X11               // 62117d09789cfef1ffffff
-       //TODO: VCVTTPS2UQQ X13, K1, X15                           // 62517d0978fd
-       //TODO: VCVTTPS2UQQ X6, K1, X15                            // 62717d0978fe
-       //TODO: VCVTTPS2UQQ X12, K1, X15                           // 62517d0978fc
-       //TODO: VCVTTPS2UQQ -17(BP), K1, X15                       // 62717d0978bdefffffff
-       //TODO: VCVTTPS2UQQ -15(R14)(R15*8), K1, X15               // 62117d0978bcfef1ffffff
-       //TODO: VCVTTPS2UQQ X13, K1, X30                           // 62417d0978f5
-       //TODO: VCVTTPS2UQQ X6, K1, X30                            // 62617d0978f6
-       //TODO: VCVTTPS2UQQ X12, K1, X30                           // 62417d0978f4
-       //TODO: VCVTTPS2UQQ -17(BP), K1, X30                       // 62617d0978b5efffffff
-       //TODO: VCVTTPS2UQQ -15(R14)(R15*8), K1, X30               // 62017d0978b4fef1ffffff
-       //TODO: VCVTTPS2UQQ X23, K1, Y14                           // 62317d2978f7
-       //TODO: VCVTTPS2UQQ X30, K1, Y14                           // 62117d2978f6
-       //TODO: VCVTTPS2UQQ X8, K1, Y14                            // 62517d2978f0
-       //TODO: VCVTTPS2UQQ -17(BP)(SI*2), K1, Y14                 // 62717d2978b475efffffff
-       //TODO: VCVTTPS2UQQ 7(AX)(CX*2), K1, Y14                   // 62717d2978b44807000000
-       //TODO: VCVTTPS2UQQ X23, K1, Y18                           // 62a17d2978d7
-       //TODO: VCVTTPS2UQQ X30, K1, Y18                           // 62817d2978d6
-       //TODO: VCVTTPS2UQQ X8, K1, Y18                            // 62c17d2978d0
-       //TODO: VCVTTPS2UQQ -17(BP)(SI*2), K1, Y18                 // 62e17d29789475efffffff
-       //TODO: VCVTTPS2UQQ 7(AX)(CX*2), K1, Y18                   // 62e17d2978944807000000
-       //TODO: VCVTTPS2UQQ X23, K1, Y31                           // 62217d2978ff
-       //TODO: VCVTTPS2UQQ X30, K1, Y31                           // 62017d2978fe
-       //TODO: VCVTTPS2UQQ X8, K1, Y31                            // 62417d2978f8
-       //TODO: VCVTTPS2UQQ -17(BP)(SI*2), K1, Y31                 // 62617d2978bc75efffffff
-       //TODO: VCVTTPS2UQQ 7(AX)(CX*2), K1, Y31                   // 62617d2978bc4807000000
-       //TODO: VCVTTPS2UQQ Y18, K7, Z6                            // 62b17d4f78f2
-       //TODO: VCVTTPS2UQQ Y3, K7, Z6                             // 62f17d4f78f3
-       //TODO: VCVTTPS2UQQ Y24, K7, Z6                            // 62917d4f78f0
-       //TODO: VCVTTPS2UQQ Y18, K7, Z22                           // 62a17d4f78f2
-       //TODO: VCVTTPS2UQQ Y3, K7, Z22                            // 62e17d4f78f3
-       //TODO: VCVTTPS2UQQ Y24, K7, Z22                           // 62817d4f78f0
-       //TODO: VCVTTPS2UQQ Y2, K2, Z1                             // 62f17d4a78ca
-       //TODO: VCVTTPS2UQQ Y7, K2, Z1                             // 62f17d4a78cf
-       //TODO: VCVTTPS2UQQ Y21, K2, Z1                            // 62b17d4a78cd
-       //TODO: VCVTTPS2UQQ 99(R15)(R15*8), K2, Z1                 // 62917d4a788cff63000000
-       //TODO: VCVTTPS2UQQ 7(AX)(CX*8), K2, Z1                    // 62f17d4a788cc807000000
-       //TODO: VCVTTPS2UQQ Y2, K2, Z15                            // 62717d4a78fa
-       //TODO: VCVTTPS2UQQ Y7, K2, Z15                            // 62717d4a78ff
-       //TODO: VCVTTPS2UQQ Y21, K2, Z15                           // 62317d4a78fd
-       //TODO: VCVTTPS2UQQ 99(R15)(R15*8), K2, Z15                // 62117d4a78bcff63000000
-       //TODO: VCVTTPS2UQQ 7(AX)(CX*8), K2, Z15                   // 62717d4a78bcc807000000
-       //TODO: VCVTUQQ2PD X13, K6, X21                            // 62c1fe0e7aed
-       //TODO: VCVTUQQ2PD X0, K6, X21                             // 62e1fe0e7ae8
-       //TODO: VCVTUQQ2PD X30, K6, X21                            // 6281fe0e7aee
-       //TODO: VCVTUQQ2PD 15(R8)(R14*8), K6, X21                  // 6281fe0e7aacf00f000000
-       //TODO: VCVTUQQ2PD -15(R14)(R15*2), K6, X21                // 6281fe0e7aac7ef1ffffff
-       //TODO: VCVTUQQ2PD X13, K6, X1                             // 62d1fe0e7acd
-       //TODO: VCVTUQQ2PD X0, K6, X1                              // 62f1fe0e7ac8
-       //TODO: VCVTUQQ2PD X30, K6, X1                             // 6291fe0e7ace
-       //TODO: VCVTUQQ2PD 15(R8)(R14*8), K6, X1                   // 6291fe0e7a8cf00f000000
-       //TODO: VCVTUQQ2PD -15(R14)(R15*2), K6, X1                 // 6291fe0e7a8c7ef1ffffff
-       //TODO: VCVTUQQ2PD X13, K6, X11                            // 6251fe0e7add
-       //TODO: VCVTUQQ2PD X0, K6, X11                             // 6271fe0e7ad8
-       //TODO: VCVTUQQ2PD X30, K6, X11                            // 6211fe0e7ade
-       //TODO: VCVTUQQ2PD 15(R8)(R14*8), K6, X11                  // 6211fe0e7a9cf00f000000
-       //TODO: VCVTUQQ2PD -15(R14)(R15*2), K6, X11                // 6211fe0e7a9c7ef1ffffff
-       //TODO: VCVTUQQ2PD Y11, K3, Y28                            // 6241fe2b7ae3
-       //TODO: VCVTUQQ2PD Y27, K3, Y28                            // 6201fe2b7ae3
-       //TODO: VCVTUQQ2PD Y17, K3, Y28                            // 6221fe2b7ae1
-       //TODO: VCVTUQQ2PD 99(R15)(R15*4), K3, Y28                 // 6201fe2b7aa4bf63000000
-       //TODO: VCVTUQQ2PD 15(DX), K3, Y28                         // 6261fe2b7aa20f000000
-       //TODO: VCVTUQQ2PD Y11, K3, Y1                             // 62d1fe2b7acb
-       //TODO: VCVTUQQ2PD Y27, K3, Y1                             // 6291fe2b7acb
-       //TODO: VCVTUQQ2PD Y17, K3, Y1                             // 62b1fe2b7ac9
-       //TODO: VCVTUQQ2PD 99(R15)(R15*4), K3, Y1                  // 6291fe2b7a8cbf63000000
-       //TODO: VCVTUQQ2PD 15(DX), K3, Y1                          // 62f1fe2b7a8a0f000000
-       //TODO: VCVTUQQ2PD Y11, K3, Y8                             // 6251fe2b7ac3
-       //TODO: VCVTUQQ2PD Y27, K3, Y8                             // 6211fe2b7ac3
-       //TODO: VCVTUQQ2PD Y17, K3, Y8                             // 6231fe2b7ac1
-       //TODO: VCVTUQQ2PD 99(R15)(R15*4), K3, Y8                  // 6211fe2b7a84bf63000000
-       //TODO: VCVTUQQ2PD 15(DX), K3, Y8                          // 6271fe2b7a820f000000
-       //TODO: VCVTUQQ2PD Z12, K7, Z1                             // 62d1fe4f7acc
-       //TODO: VCVTUQQ2PD Z16, K7, Z1                             // 62b1fe4f7ac8
-       //TODO: VCVTUQQ2PD Z12, K7, Z3                             // 62d1fe4f7adc
-       //TODO: VCVTUQQ2PD Z16, K7, Z3                             // 62b1fe4f7ad8
-       //TODO: VCVTUQQ2PD Z14, K4, Z28                            // 6241fe4c7ae6
-       //TODO: VCVTUQQ2PD Z28, K4, Z28                            // 6201fe4c7ae4
-       //TODO: VCVTUQQ2PD 15(R8)(R14*4), K4, Z28                  // 6201fe4c7aa4b00f000000
-       //TODO: VCVTUQQ2PD -7(CX)(DX*4), K4, Z28                   // 6261fe4c7aa491f9ffffff
-       //TODO: VCVTUQQ2PD Z14, K4, Z13                            // 6251fe4c7aee
-       //TODO: VCVTUQQ2PD Z28, K4, Z13                            // 6211fe4c7aec
-       //TODO: VCVTUQQ2PD 15(R8)(R14*4), K4, Z13                  // 6211fe4c7aacb00f000000
-       //TODO: VCVTUQQ2PD -7(CX)(DX*4), K4, Z13                   // 6271fe4c7aac91f9ffffff
-       //TODO: VCVTUQQ2PS Z3, K4, Y16                             // 62e1ff4c7ac3
-       //TODO: VCVTUQQ2PS Z12, K4, Y16                            // 62c1ff4c7ac4
-       //TODO: VCVTUQQ2PS Z3, K4, Y12                             // 6271ff4c7ae3
-       //TODO: VCVTUQQ2PS Z12, K4, Y12                            // 6251ff4c7ae4
-       //TODO: VCVTUQQ2PS Z3, K4, Y6                              // 62f1ff4c7af3
-       //TODO: VCVTUQQ2PS Z12, K4, Y6                             // 62d1ff4c7af4
-       //TODO: VCVTUQQ2PS Z15, K7, Y26                            // 6241ff4f7ad7
-       //TODO: VCVTUQQ2PS Z30, K7, Y26                            // 6201ff4f7ad6
-       //TODO: VCVTUQQ2PS (R8), K7, Y26                           // 6241ff4f7a10
-       //TODO: VCVTUQQ2PS 15(DX)(BX*2), K7, Y26                   // 6261ff4f7a945a0f000000
-       //TODO: VCVTUQQ2PS Z15, K7, Y3                             // 62d1ff4f7adf
-       //TODO: VCVTUQQ2PS Z30, K7, Y3                             // 6291ff4f7ade
-       //TODO: VCVTUQQ2PS (R8), K7, Y3                            // 62d1ff4f7a18
-       //TODO: VCVTUQQ2PS 15(DX)(BX*2), K7, Y3                    // 62f1ff4f7a9c5a0f000000
-       //TODO: VCVTUQQ2PS Z15, K7, Y8                             // 6251ff4f7ac7
-       //TODO: VCVTUQQ2PS Z30, K7, Y8                             // 6211ff4f7ac6
-       //TODO: VCVTUQQ2PS (R8), K7, Y8                            // 6251ff4f7a00
-       //TODO: VCVTUQQ2PS 15(DX)(BX*2), K7, Y8                    // 6271ff4f7a845a0f000000
-       //TODO: VCVTUQQ2PSX X14, K2, X16                           // 62c1ff0a7ac6
-       //TODO: VCVTUQQ2PSX X19, K2, X16                           // 62a1ff0a7ac3
-       //TODO: VCVTUQQ2PSX X8, K2, X16                            // 62c1ff0a7ac0
-       //TODO: VCVTUQQ2PSX -15(R14)(R15*1), K2, X16               // 6281ff0a7a843ef1ffffff
-       //TODO: VCVTUQQ2PSX -15(BX), K2, X16                       // 62e1ff0a7a83f1ffffff
-       //TODO: VCVTUQQ2PSX X14, K2, X14                           // 6251ff0a7af6
-       //TODO: VCVTUQQ2PSX X19, K2, X14                           // 6231ff0a7af3
-       //TODO: VCVTUQQ2PSX X8, K2, X14                            // 6251ff0a7af0
-       //TODO: VCVTUQQ2PSX -15(R14)(R15*1), K2, X14               // 6211ff0a7ab43ef1ffffff
-       //TODO: VCVTUQQ2PSX -15(BX), K2, X14                       // 6271ff0a7ab3f1ffffff
-       //TODO: VCVTUQQ2PSX X14, K2, X11                           // 6251ff0a7ade
-       //TODO: VCVTUQQ2PSX X19, K2, X11                           // 6231ff0a7adb
-       //TODO: VCVTUQQ2PSX X8, K2, X11                            // 6251ff0a7ad8
-       //TODO: VCVTUQQ2PSX -15(R14)(R15*1), K2, X11               // 6211ff0a7a9c3ef1ffffff
-       //TODO: VCVTUQQ2PSX -15(BX), K2, X11                       // 6271ff0a7a9bf1ffffff
-       //TODO: VCVTUQQ2PSY Y28, K5, X8                            // 6211ff2d7ac4
-       //TODO: VCVTUQQ2PSY Y1, K5, X8                             // 6271ff2d7ac1
-       //TODO: VCVTUQQ2PSY Y23, K5, X8                            // 6231ff2d7ac7
-       //TODO: VCVTUQQ2PSY (CX), K5, X8                           // 6271ff2d7a01
-       //TODO: VCVTUQQ2PSY 99(R15), K5, X8                        // 6251ff2d7a8763000000
-       //TODO: VCVTUQQ2PSY Y28, K5, X26                           // 6201ff2d7ad4
-       //TODO: VCVTUQQ2PSY Y1, K5, X26                            // 6261ff2d7ad1
-       //TODO: VCVTUQQ2PSY Y23, K5, X26                           // 6221ff2d7ad7
-       //TODO: VCVTUQQ2PSY (CX), K5, X26                          // 6261ff2d7a11
-       //TODO: VCVTUQQ2PSY 99(R15), K5, X26                       // 6241ff2d7a9763000000
-       //TODO: VCVTUQQ2PSY Y28, K5, X23                           // 6281ff2d7afc
-       //TODO: VCVTUQQ2PSY Y1, K5, X23                            // 62e1ff2d7af9
-       //TODO: VCVTUQQ2PSY Y23, K5, X23                           // 62a1ff2d7aff
-       //TODO: VCVTUQQ2PSY (CX), K5, X23                          // 62e1ff2d7a39
-       //TODO: VCVTUQQ2PSY 99(R15), K5, X23                       // 62c1ff2d7abf63000000
-       //TODO: VEXTRACTF32X8 $0, Z12, K4, Y18                     // 62337d4c1be200
-       //TODO: VEXTRACTF32X8 $0, Z13, K4, Y18                     // 62337d4c1bea00
-       //TODO: VEXTRACTF32X8 $0, Z12, K4, Y24                     // 62137d4c1be000
-       //TODO: VEXTRACTF32X8 $0, Z13, K4, Y24                     // 62137d4c1be800
-       //TODO: VEXTRACTF32X8 $0, Z12, K4, Y9                      // 62537d4c1be100
-       //TODO: VEXTRACTF32X8 $0, Z13, K4, Y9                      // 62537d4c1be900
-       //TODO: VEXTRACTF32X8 $0, Z12, K4, 15(R8)                  // 62537d4c1ba00f00000000
-       //TODO: VEXTRACTF32X8 $0, Z13, K4, 15(R8)                  // 62537d4c1ba80f00000000
-       //TODO: VEXTRACTF32X8 $0, Z12, K4, (BP)                    // 62737d4c1b650000
-       //TODO: VEXTRACTF32X8 $0, Z13, K4, (BP)                    // 62737d4c1b6d0000
-       //TODO: VEXTRACTF64X2 $1, Y3, K4, X8                       // 62d3fd2c19d801
-       //TODO: VEXTRACTF64X2 $1, Y19, K4, X8                      // 62c3fd2c19d801
-       //TODO: VEXTRACTF64X2 $1, Y23, K4, X8                      // 62c3fd2c19f801
-       //TODO: VEXTRACTF64X2 $1, Y3, K4, X1                       // 62f3fd2c19d901
-       //TODO: VEXTRACTF64X2 $1, Y19, K4, X1                      // 62e3fd2c19d901
-       //TODO: VEXTRACTF64X2 $1, Y23, K4, X1                      // 62e3fd2c19f901
-       //TODO: VEXTRACTF64X2 $1, Y3, K4, X0                       // 62f3fd2c19d801
-       //TODO: VEXTRACTF64X2 $1, Y19, K4, X0                      // 62e3fd2c19d801
-       //TODO: VEXTRACTF64X2 $1, Y23, K4, X0                      // 62e3fd2c19f801
-       //TODO: VEXTRACTF64X2 $1, Y3, K4, -17(BP)(SI*8)            // 62f3fd2c199cf5efffffff01
-       //TODO: VEXTRACTF64X2 $1, Y19, K4, -17(BP)(SI*8)           // 62e3fd2c199cf5efffffff01
-       //TODO: VEXTRACTF64X2 $1, Y23, K4, -17(BP)(SI*8)           // 62e3fd2c19bcf5efffffff01
-       //TODO: VEXTRACTF64X2 $1, Y3, K4, (R15)                    // 62d3fd2c191f01
-       //TODO: VEXTRACTF64X2 $1, Y19, K4, (R15)                   // 62c3fd2c191f01
-       //TODO: VEXTRACTF64X2 $1, Y23, K4, (R15)                   // 62c3fd2c193f01
-       //TODO: VEXTRACTF64X2 $0, Z21, K7, X15                     // 62c3fd4f19ef00
-       //TODO: VEXTRACTF64X2 $0, Z9, K7, X15                      // 6253fd4f19cf00
-       //TODO: VEXTRACTF64X2 $0, Z21, K7, X0                      // 62e3fd4f19e800
-       //TODO: VEXTRACTF64X2 $0, Z9, K7, X0                       // 6273fd4f19c800
-       //TODO: VEXTRACTF64X2 $0, Z21, K7, X16                     // 62a3fd4f19e800
-       //TODO: VEXTRACTF64X2 $0, Z9, K7, X16                      // 6233fd4f19c800
-       //TODO: VEXTRACTF64X2 $0, Z21, K7, 7(SI)(DI*8)             // 62e3fd4f19acfe0700000000
-       //TODO: VEXTRACTF64X2 $0, Z9, K7, 7(SI)(DI*8)              // 6273fd4f198cfe0700000000
-       //TODO: VEXTRACTF64X2 $0, Z21, K7, -15(R14)                // 62c3fd4f19aef1ffffff00
-       //TODO: VEXTRACTF64X2 $0, Z9, K7, -15(R14)                 // 6253fd4f198ef1ffffff00
-       //TODO: VEXTRACTI32X8 $1, Z23, K4, Y21                     // 62a37d4c3bfd01
-       //TODO: VEXTRACTI32X8 $1, Z9, K4, Y21                      // 62337d4c3bcd01
-       //TODO: VEXTRACTI32X8 $1, Z23, K4, Y20                     // 62a37d4c3bfc01
-       //TODO: VEXTRACTI32X8 $1, Z9, K4, Y20                      // 62337d4c3bcc01
-       //TODO: VEXTRACTI32X8 $1, Z23, K4, Y6                      // 62e37d4c3bfe01
-       //TODO: VEXTRACTI32X8 $1, Z9, K4, Y6                       // 62737d4c3bce01
-       //TODO: VEXTRACTI32X8 $1, Z23, K4, -15(R14)(R15*1)         // 62837d4c3bbc3ef1ffffff01
-       //TODO: VEXTRACTI32X8 $1, Z9, K4, -15(R14)(R15*1)          // 62137d4c3b8c3ef1ffffff01
-       //TODO: VEXTRACTI32X8 $1, Z23, K4, -15(BX)                 // 62e37d4c3bbbf1ffffff01
-       //TODO: VEXTRACTI32X8 $1, Z9, K4, -15(BX)                  // 62737d4c3b8bf1ffffff01
-       //TODO: VEXTRACTI64X2 $0, Y31, K2, X7                      // 6263fd2a39ff00
-       //TODO: VEXTRACTI64X2 $0, Y6, K2, X7                       // 62f3fd2a39f700
-       //TODO: VEXTRACTI64X2 $0, Y11, K2, X7                      // 6273fd2a39df00
-       //TODO: VEXTRACTI64X2 $0, Y31, K2, X16                     // 6223fd2a39f800
-       //TODO: VEXTRACTI64X2 $0, Y6, K2, X16                      // 62b3fd2a39f000
-       //TODO: VEXTRACTI64X2 $0, Y11, K2, X16                     // 6233fd2a39d800
-       //TODO: VEXTRACTI64X2 $0, Y31, K2, X31                     // 6203fd2a39ff00
-       //TODO: VEXTRACTI64X2 $0, Y6, K2, X31                      // 6293fd2a39f700
-       //TODO: VEXTRACTI64X2 $0, Y11, K2, X31                     // 6213fd2a39df00
-       //TODO: VEXTRACTI64X2 $0, Y31, K2, -7(CX)                  // 6263fd2a39b9f9ffffff00
-       //TODO: VEXTRACTI64X2 $0, Y6, K2, -7(CX)                   // 62f3fd2a39b1f9ffffff00
-       //TODO: VEXTRACTI64X2 $0, Y11, K2, -7(CX)                  // 6273fd2a3999f9ffffff00
-       //TODO: VEXTRACTI64X2 $0, Y31, K2, 15(DX)(BX*4)            // 6263fd2a39bc9a0f00000000
-       //TODO: VEXTRACTI64X2 $0, Y6, K2, 15(DX)(BX*4)             // 62f3fd2a39b49a0f00000000
-       //TODO: VEXTRACTI64X2 $0, Y11, K2, 15(DX)(BX*4)            // 6273fd2a399c9a0f00000000
-       //TODO: VEXTRACTI64X2 $2, Z27, K2, X1                      // 6263fd4a39d902
-       //TODO: VEXTRACTI64X2 $2, Z14, K2, X1                      // 6273fd4a39f102
-       //TODO: VEXTRACTI64X2 $2, Z27, K2, X7                      // 6263fd4a39df02
-       //TODO: VEXTRACTI64X2 $2, Z14, K2, X7                      // 6273fd4a39f702
-       //TODO: VEXTRACTI64X2 $2, Z27, K2, X9                      // 6243fd4a39d902
-       //TODO: VEXTRACTI64X2 $2, Z14, K2, X9                      // 6253fd4a39f102
-       //TODO: VEXTRACTI64X2 $2, Z27, K2, 99(R15)(R15*8)          // 6203fd4a399cff6300000002
-       //TODO: VEXTRACTI64X2 $2, Z14, K2, 99(R15)(R15*8)          // 6213fd4a39b4ff6300000002
-       //TODO: VEXTRACTI64X2 $2, Z27, K2, 7(AX)(CX*8)             // 6263fd4a399cc80700000002
-       //TODO: VEXTRACTI64X2 $2, Z14, K2, 7(AX)(CX*8)             // 6273fd4a39b4c80700000002
-       //TODO: VFPCLASSPDX $65, X14, K4, K1                       // 62d3fd0c66ce41
-       //TODO: VFPCLASSPDX $65, X19, K4, K1                       // 62b3fd0c66cb41
-       //TODO: VFPCLASSPDX $65, X8, K4, K1                        // 62d3fd0c66c841
-       //TODO: VFPCLASSPDX $65, (R14), K4, K1                     // 62d3fd0c660e41
-       //TODO: VFPCLASSPDX $65, -7(DI)(R8*8), K4, K1              // 62b3fd0c668cc7f9ffffff41
-       //TODO: VFPCLASSPDX $65, X14, K4, K3                       // 62d3fd0c66de41
-       //TODO: VFPCLASSPDX $65, X19, K4, K3                       // 62b3fd0c66db41
-       //TODO: VFPCLASSPDX $65, X8, K4, K3                        // 62d3fd0c66d841
-       //TODO: VFPCLASSPDX $65, (R14), K4, K3                     // 62d3fd0c661e41
-       //TODO: VFPCLASSPDX $65, -7(DI)(R8*8), K4, K3              // 62b3fd0c669cc7f9ffffff41
-       //TODO: VFPCLASSPDY $67, Y31, K1, K6                       // 6293fd2966f743
-       //TODO: VFPCLASSPDY $67, Y5, K1, K6                        // 62f3fd2966f543
-       //TODO: VFPCLASSPDY $67, Y0, K1, K6                        // 62f3fd2966f043
-       //TODO: VFPCLASSPDY $67, 7(SI)(DI*8), K1, K6               // 62f3fd2966b4fe0700000043
-       //TODO: VFPCLASSPDY $67, -15(R14), K1, K6                  // 62d3fd2966b6f1ffffff43
-       //TODO: VFPCLASSPDY $67, Y31, K1, K7                       // 6293fd2966ff43
-       //TODO: VFPCLASSPDY $67, Y5, K1, K7                        // 62f3fd2966fd43
-       //TODO: VFPCLASSPDY $67, Y0, K1, K7                        // 62f3fd2966f843
-       //TODO: VFPCLASSPDY $67, 7(SI)(DI*8), K1, K7               // 62f3fd2966bcfe0700000043
-       //TODO: VFPCLASSPDY $67, -15(R14), K1, K7                  // 62d3fd2966bef1ffffff43
-       //TODO: VFPCLASSPDZ $127, Z3, K3, K6                       // 62f3fd4b66f37f
-       //TODO: VFPCLASSPDZ $127, Z27, K3, K6                      // 6293fd4b66f37f
-       //TODO: VFPCLASSPDZ $127, 7(AX)(CX*4), K3, K6              // 62f3fd4b66b488070000007f
-       //TODO: VFPCLASSPDZ $127, 7(AX)(CX*1), K3, K6              // 62f3fd4b66b408070000007f
-       //TODO: VFPCLASSPDZ $127, Z3, K3, K4                       // 62f3fd4b66e37f
-       //TODO: VFPCLASSPDZ $127, Z27, K3, K4                      // 6293fd4b66e37f
-       //TODO: VFPCLASSPDZ $127, 7(AX)(CX*4), K3, K4              // 62f3fd4b66a488070000007f
-       //TODO: VFPCLASSPDZ $127, 7(AX)(CX*1), K3, K4              // 62f3fd4b66a408070000007f
-       //TODO: VFPCLASSPSX $0, X8, K4, K4                         // 62d37d0c66e000
-       //TODO: VFPCLASSPSX $0, X26, K4, K4                        // 62937d0c66e200
-       //TODO: VFPCLASSPSX $0, X23, K4, K4                        // 62b37d0c66e700
-       //TODO: VFPCLASSPSX $0, 99(R15)(R15*4), K4, K4             // 62937d0c66a4bf6300000000
-       //TODO: VFPCLASSPSX $0, 15(DX), K4, K4                     // 62f37d0c66a20f00000000
-       //TODO: VFPCLASSPSX $0, X8, K4, K6                         // 62d37d0c66f000
-       //TODO: VFPCLASSPSX $0, X26, K4, K6                        // 62937d0c66f200
-       //TODO: VFPCLASSPSX $0, X23, K4, K6                        // 62b37d0c66f700
-       //TODO: VFPCLASSPSX $0, 99(R15)(R15*4), K4, K6             // 62937d0c66b4bf6300000000
-       //TODO: VFPCLASSPSX $0, 15(DX), K4, K6                     // 62f37d0c66b20f00000000
-       //TODO: VFPCLASSPSY $97, Y5, K5, K4                        // 62f37d2d66e561
-       //TODO: VFPCLASSPSY $97, Y19, K5, K4                       // 62b37d2d66e361
-       //TODO: VFPCLASSPSY $97, Y31, K5, K4                       // 62937d2d66e761
-       //TODO: VFPCLASSPSY $97, 7(SI)(DI*1), K5, K4               // 62f37d2d66a43e0700000061
-       //TODO: VFPCLASSPSY $97, 15(DX)(BX*8), K5, K4              // 62f37d2d66a4da0f00000061
-       //TODO: VFPCLASSPSY $97, Y5, K5, K5                        // 62f37d2d66ed61
-       //TODO: VFPCLASSPSY $97, Y19, K5, K5                       // 62b37d2d66eb61
-       //TODO: VFPCLASSPSY $97, Y31, K5, K5                       // 62937d2d66ef61
-       //TODO: VFPCLASSPSY $97, 7(SI)(DI*1), K5, K5               // 62f37d2d66ac3e0700000061
-       //TODO: VFPCLASSPSY $97, 15(DX)(BX*8), K5, K5              // 62f37d2d66acda0f00000061
-       //TODO: VFPCLASSPSZ $81, Z7, K7, K2                        // 62f37d4f66d751
-       //TODO: VFPCLASSPSZ $81, Z9, K7, K2                        // 62d37d4f66d151
-       //TODO: VFPCLASSPSZ $81, (SI), K7, K2                      // 62f37d4f661651
-       //TODO: VFPCLASSPSZ $81, 7(SI)(DI*2), K7, K2               // 62f37d4f66947e0700000051
-       //TODO: VFPCLASSPSZ $81, Z7, K7, K7                        // 62f37d4f66ff51
-       //TODO: VFPCLASSPSZ $81, Z9, K7, K7                        // 62d37d4f66f951
-       //TODO: VFPCLASSPSZ $81, (SI), K7, K7                      // 62f37d4f663e51
-       //TODO: VFPCLASSPSZ $81, 7(SI)(DI*2), K7, K7               // 62f37d4f66bc7e0700000051
-       //TODO: VFPCLASSSD $42, X12, K7, K0                        // 62d3fd0f67c42a or 62d3fd2f67c42a or 62d3fd4f67c42a
-       //TODO: VFPCLASSSD $42, X16, K7, K0                        // 62b3fd0f67c02a or 62b3fd2f67c02a or 62b3fd4f67c02a
-       //TODO: VFPCLASSSD $42, X23, K7, K0                        // 62b3fd0f67c72a or 62b3fd2f67c72a or 62b3fd4f67c72a
-       //TODO: VFPCLASSSD $42, (BX), K7, K0                       // 62f3fd0f67032a or 62f3fd2f67032a or 62f3fd4f67032a
-       //TODO: VFPCLASSSD $42, -17(BP)(SI*1), K7, K0              // 62f3fd0f678435efffffff2a or 62f3fd2f678435efffffff2a or 62f3fd4f678435efffffff2a
-       //TODO: VFPCLASSSD $42, X12, K7, K5                        // 62d3fd0f67ec2a or 62d3fd2f67ec2a or 62d3fd4f67ec2a
-       //TODO: VFPCLASSSD $42, X16, K7, K5                        // 62b3fd0f67e82a or 62b3fd2f67e82a or 62b3fd4f67e82a
-       //TODO: VFPCLASSSD $42, X23, K7, K5                        // 62b3fd0f67ef2a or 62b3fd2f67ef2a or 62b3fd4f67ef2a
-       //TODO: VFPCLASSSD $42, (BX), K7, K5                       // 62f3fd0f672b2a or 62f3fd2f672b2a or 62f3fd4f672b2a
-       //TODO: VFPCLASSSD $42, -17(BP)(SI*1), K7, K5              // 62f3fd0f67ac35efffffff2a or 62f3fd2f67ac35efffffff2a or 62f3fd4f67ac35efffffff2a
-       //TODO: VFPCLASSSS $79, X23, K6, K6                        // 62b37d0e67f74f or 62b37d2e67f74f or 62b37d4e67f74f
-       //TODO: VFPCLASSSS $79, X11, K6, K6                        // 62d37d0e67f34f or 62d37d2e67f34f or 62d37d4e67f34f
-       //TODO: VFPCLASSSS $79, X31, K6, K6                        // 62937d0e67f74f or 62937d2e67f74f or 62937d4e67f74f
-       //TODO: VFPCLASSSS $79, 7(SI)(DI*1), K6, K6                // 62f37d0e67b43e070000004f or 62f37d2e67b43e070000004f or 62f37d4e67b43e070000004f
-       //TODO: VFPCLASSSS $79, 15(DX)(BX*8), K6, K6               // 62f37d0e67b4da0f0000004f or 62f37d2e67b4da0f0000004f or 62f37d4e67b4da0f0000004f
-       //TODO: VFPCLASSSS $79, X23, K6, K5                        // 62b37d0e67ef4f or 62b37d2e67ef4f or 62b37d4e67ef4f
-       //TODO: VFPCLASSSS $79, X11, K6, K5                        // 62d37d0e67eb4f or 62d37d2e67eb4f or 62d37d4e67eb4f
-       //TODO: VFPCLASSSS $79, X31, K6, K5                        // 62937d0e67ef4f or 62937d2e67ef4f or 62937d4e67ef4f
-       //TODO: VFPCLASSSS $79, 7(SI)(DI*1), K6, K5                // 62f37d0e67ac3e070000004f or 62f37d2e67ac3e070000004f or 62f37d4e67ac3e070000004f
-       //TODO: VFPCLASSSS $79, 15(DX)(BX*8), K6, K5               // 62f37d0e67acda0f0000004f or 62f37d2e67acda0f0000004f or 62f37d4e67acda0f0000004f
-       //TODO: VINSERTF32X8 $1, Y12, Z0, K2, Z23                  // 62c37d4a1afc01
-       //TODO: VINSERTF32X8 $1, Y21, Z0, K2, Z23                  // 62a37d4a1afd01
-       //TODO: VINSERTF32X8 $1, Y14, Z0, K2, Z23                  // 62c37d4a1afe01
-       //TODO: VINSERTF32X8 $1, 17(SP)(BP*1), Z0, K2, Z23         // 62e37d4a1abc2c1100000001
-       //TODO: VINSERTF32X8 $1, -7(CX)(DX*8), Z0, K2, Z23         // 62e37d4a1abcd1f9ffffff01
-       //TODO: VINSERTF32X8 $1, Y12, Z11, K2, Z23                 // 62c3254a1afc01
-       //TODO: VINSERTF32X8 $1, Y21, Z11, K2, Z23                 // 62a3254a1afd01
-       //TODO: VINSERTF32X8 $1, Y14, Z11, K2, Z23                 // 62c3254a1afe01
-       //TODO: VINSERTF32X8 $1, 17(SP)(BP*1), Z11, K2, Z23        // 62e3254a1abc2c1100000001
-       //TODO: VINSERTF32X8 $1, -7(CX)(DX*8), Z11, K2, Z23        // 62e3254a1abcd1f9ffffff01
-       //TODO: VINSERTF32X8 $1, Y12, Z0, K2, Z19                  // 62c37d4a1adc01
-       //TODO: VINSERTF32X8 $1, Y21, Z0, K2, Z19                  // 62a37d4a1add01
-       //TODO: VINSERTF32X8 $1, Y14, Z0, K2, Z19                  // 62c37d4a1ade01
-       //TODO: VINSERTF32X8 $1, 17(SP)(BP*1), Z0, K2, Z19         // 62e37d4a1a9c2c1100000001
-       //TODO: VINSERTF32X8 $1, -7(CX)(DX*8), Z0, K2, Z19         // 62e37d4a1a9cd1f9ffffff01
-       //TODO: VINSERTF32X8 $1, Y12, Z11, K2, Z19                 // 62c3254a1adc01
-       //TODO: VINSERTF32X8 $1, Y21, Z11, K2, Z19                 // 62a3254a1add01
-       //TODO: VINSERTF32X8 $1, Y14, Z11, K2, Z19                 // 62c3254a1ade01
-       //TODO: VINSERTF32X8 $1, 17(SP)(BP*1), Z11, K2, Z19        // 62e3254a1a9c2c1100000001
-       //TODO: VINSERTF32X8 $1, -7(CX)(DX*8), Z11, K2, Z19        // 62e3254a1a9cd1f9ffffff01
-       //TODO: VINSERTF64X2 $0, X3, Y16, K4, Y30                  // 6263fd2418f300
-       //TODO: VINSERTF64X2 $0, X26, Y16, K4, Y30                 // 6203fd2418f200
-       //TODO: VINSERTF64X2 $0, X23, Y16, K4, Y30                 // 6223fd2418f700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y30         // 6263fd2418b4880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y30         // 6263fd2418b4080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y1, K4, Y30                   // 6263f52c18f300
-       //TODO: VINSERTF64X2 $0, X26, Y1, K4, Y30                  // 6203f52c18f200
-       //TODO: VINSERTF64X2 $0, X23, Y1, K4, Y30                  // 6223f52c18f700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y30          // 6263f52c18b4880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y30          // 6263f52c18b4080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y30, K4, Y30                  // 62638d2418f300
-       //TODO: VINSERTF64X2 $0, X26, Y30, K4, Y30                 // 62038d2418f200
-       //TODO: VINSERTF64X2 $0, X23, Y30, K4, Y30                 // 62238d2418f700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y30         // 62638d2418b4880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y30         // 62638d2418b4080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y16, K4, Y26                  // 6263fd2418d300
-       //TODO: VINSERTF64X2 $0, X26, Y16, K4, Y26                 // 6203fd2418d200
-       //TODO: VINSERTF64X2 $0, X23, Y16, K4, Y26                 // 6223fd2418d700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y26         // 6263fd241894880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y26         // 6263fd241894080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y1, K4, Y26                   // 6263f52c18d300
-       //TODO: VINSERTF64X2 $0, X26, Y1, K4, Y26                  // 6203f52c18d200
-       //TODO: VINSERTF64X2 $0, X23, Y1, K4, Y26                  // 6223f52c18d700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y26          // 6263f52c1894880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y26          // 6263f52c1894080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y30, K4, Y26                  // 62638d2418d300
-       //TODO: VINSERTF64X2 $0, X26, Y30, K4, Y26                 // 62038d2418d200
-       //TODO: VINSERTF64X2 $0, X23, Y30, K4, Y26                 // 62238d2418d700
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y26         // 62638d241894880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y26         // 62638d241894080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y16, K4, Y7                   // 62f3fd2418fb00
-       //TODO: VINSERTF64X2 $0, X26, Y16, K4, Y7                  // 6293fd2418fa00
-       //TODO: VINSERTF64X2 $0, X23, Y16, K4, Y7                  // 62b3fd2418ff00
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y7          // 62f3fd2418bc880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y7          // 62f3fd2418bc080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y1, K4, Y7                    // 62f3f52c18fb00
-       //TODO: VINSERTF64X2 $0, X26, Y1, K4, Y7                   // 6293f52c18fa00
-       //TODO: VINSERTF64X2 $0, X23, Y1, K4, Y7                   // 62b3f52c18ff00
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y7           // 62f3f52c18bc880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y7           // 62f3f52c18bc080700000000
-       //TODO: VINSERTF64X2 $0, X3, Y30, K4, Y7                   // 62f38d2418fb00
-       //TODO: VINSERTF64X2 $0, X26, Y30, K4, Y7                  // 62938d2418fa00
-       //TODO: VINSERTF64X2 $0, X23, Y30, K4, Y7                  // 62b38d2418ff00
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y7          // 62f38d2418bc880700000000
-       //TODO: VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y7          // 62f38d2418bc080700000000
-       //TODO: VINSERTF64X2 $1, X13, Z24, K1, Z0                  // 62d3bd4118c501
-       //TODO: VINSERTF64X2 $1, X28, Z24, K1, Z0                  // 6293bd4118c401
-       //TODO: VINSERTF64X2 $1, X24, Z24, K1, Z0                  // 6293bd4118c001
-       //TODO: VINSERTF64X2 $1, (SI), Z24, K1, Z0                 // 62f3bd41180601
-       //TODO: VINSERTF64X2 $1, 7(SI)(DI*2), Z24, K1, Z0          // 62f3bd4118847e0700000001
-       //TODO: VINSERTF64X2 $1, X13, Z12, K1, Z0                  // 62d39d4918c501
-       //TODO: VINSERTF64X2 $1, X28, Z12, K1, Z0                  // 62939d4918c401
-       //TODO: VINSERTF64X2 $1, X24, Z12, K1, Z0                  // 62939d4918c001
-       //TODO: VINSERTF64X2 $1, (SI), Z12, K1, Z0                 // 62f39d49180601
-       //TODO: VINSERTF64X2 $1, 7(SI)(DI*2), Z12, K1, Z0          // 62f39d4918847e0700000001
-       //TODO: VINSERTF64X2 $1, X13, Z24, K1, Z25                 // 6243bd4118cd01
-       //TODO: VINSERTF64X2 $1, X28, Z24, K1, Z25                 // 6203bd4118cc01
-       //TODO: VINSERTF64X2 $1, X24, Z24, K1, Z25                 // 6203bd4118c801
-       //TODO: VINSERTF64X2 $1, (SI), Z24, K1, Z25                // 6263bd41180e01
-       //TODO: VINSERTF64X2 $1, 7(SI)(DI*2), Z24, K1, Z25         // 6263bd41188c7e0700000001
-       //TODO: VINSERTF64X2 $1, X13, Z12, K1, Z25                 // 62439d4918cd01
-       //TODO: VINSERTF64X2 $1, X28, Z12, K1, Z25                 // 62039d4918cc01
-       //TODO: VINSERTF64X2 $1, X24, Z12, K1, Z25                 // 62039d4918c801
-       //TODO: VINSERTF64X2 $1, (SI), Z12, K1, Z25                // 62639d49180e01
-       //TODO: VINSERTF64X2 $1, 7(SI)(DI*2), Z12, K1, Z25         // 62639d49188c7e0700000001
-       //TODO: VINSERTI32X8 $1, Y24, Z17, K7, Z20                 // 628375473ae001
-       //TODO: VINSERTI32X8 $1, Y13, Z17, K7, Z20                 // 62c375473ae501
-       //TODO: VINSERTI32X8 $1, Y20, Z17, K7, Z20                 // 62a375473ae401
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*1), Z17, K7, Z20       // 628375473aa4300f00000001
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*2), Z17, K7, Z20       // 628375473aa4700f00000001
-       //TODO: VINSERTI32X8 $1, Y24, Z0, K7, Z20                  // 62837d4f3ae001
-       //TODO: VINSERTI32X8 $1, Y13, Z0, K7, Z20                  // 62c37d4f3ae501
-       //TODO: VINSERTI32X8 $1, Y20, Z0, K7, Z20                  // 62a37d4f3ae401
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*1), Z0, K7, Z20        // 62837d4f3aa4300f00000001
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*2), Z0, K7, Z20        // 62837d4f3aa4700f00000001
-       //TODO: VINSERTI32X8 $1, Y24, Z17, K7, Z0                  // 629375473ac001
-       //TODO: VINSERTI32X8 $1, Y13, Z17, K7, Z0                  // 62d375473ac501
-       //TODO: VINSERTI32X8 $1, Y20, Z17, K7, Z0                  // 62b375473ac401
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*1), Z17, K7, Z0        // 629375473a84300f00000001
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*2), Z17, K7, Z0        // 629375473a84700f00000001
-       //TODO: VINSERTI32X8 $1, Y24, Z0, K7, Z0                   // 62937d4f3ac001
-       //TODO: VINSERTI32X8 $1, Y13, Z0, K7, Z0                   // 62d37d4f3ac501
-       //TODO: VINSERTI32X8 $1, Y20, Z0, K7, Z0                   // 62b37d4f3ac401
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*1), Z0, K7, Z0         // 62937d4f3a84300f00000001
-       //TODO: VINSERTI32X8 $1, 15(R8)(R14*2), Z0, K7, Z0         // 62937d4f3a84700f00000001
-       //TODO: VINSERTI64X2 $0, X11, Y26, K7, Y14                 // 6253ad2738f300
-       //TODO: VINSERTI64X2 $0, X31, Y26, K7, Y14                 // 6213ad2738f700
-       //TODO: VINSERTI64X2 $0, X3, Y26, K7, Y14                  // 6273ad2738f300
-       //TODO: VINSERTI64X2 $0, 17(SP), Y26, K7, Y14              // 6273ad2738b4241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y14       // 6273ad2738b4b5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y30, K7, Y14                 // 62538d2738f300
-       //TODO: VINSERTI64X2 $0, X31, Y30, K7, Y14                 // 62138d2738f700
-       //TODO: VINSERTI64X2 $0, X3, Y30, K7, Y14                  // 62738d2738f300
-       //TODO: VINSERTI64X2 $0, 17(SP), Y30, K7, Y14              // 62738d2738b4241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y14       // 62738d2738b4b5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y12, K7, Y14                 // 62539d2f38f300
-       //TODO: VINSERTI64X2 $0, X31, Y12, K7, Y14                 // 62139d2f38f700
-       //TODO: VINSERTI64X2 $0, X3, Y12, K7, Y14                  // 62739d2f38f300
-       //TODO: VINSERTI64X2 $0, 17(SP), Y12, K7, Y14              // 62739d2f38b4241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y14       // 62739d2f38b4b5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y26, K7, Y21                 // 62c3ad2738eb00
-       //TODO: VINSERTI64X2 $0, X31, Y26, K7, Y21                 // 6283ad2738ef00
-       //TODO: VINSERTI64X2 $0, X3, Y26, K7, Y21                  // 62e3ad2738eb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y26, K7, Y21              // 62e3ad2738ac241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y21       // 62e3ad2738acb5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y30, K7, Y21                 // 62c38d2738eb00
-       //TODO: VINSERTI64X2 $0, X31, Y30, K7, Y21                 // 62838d2738ef00
-       //TODO: VINSERTI64X2 $0, X3, Y30, K7, Y21                  // 62e38d2738eb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y30, K7, Y21              // 62e38d2738ac241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y21       // 62e38d2738acb5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y12, K7, Y21                 // 62c39d2f38eb00
-       //TODO: VINSERTI64X2 $0, X31, Y12, K7, Y21                 // 62839d2f38ef00
-       //TODO: VINSERTI64X2 $0, X3, Y12, K7, Y21                  // 62e39d2f38eb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y12, K7, Y21              // 62e39d2f38ac241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y21       // 62e39d2f38acb5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y26, K7, Y1                  // 62d3ad2738cb00
-       //TODO: VINSERTI64X2 $0, X31, Y26, K7, Y1                  // 6293ad2738cf00
-       //TODO: VINSERTI64X2 $0, X3, Y26, K7, Y1                   // 62f3ad2738cb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y26, K7, Y1               // 62f3ad27388c241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y1        // 62f3ad27388cb5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y30, K7, Y1                  // 62d38d2738cb00
-       //TODO: VINSERTI64X2 $0, X31, Y30, K7, Y1                  // 62938d2738cf00
-       //TODO: VINSERTI64X2 $0, X3, Y30, K7, Y1                   // 62f38d2738cb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y30, K7, Y1               // 62f38d27388c241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y1        // 62f38d27388cb5efffffff00
-       //TODO: VINSERTI64X2 $0, X11, Y12, K7, Y1                  // 62d39d2f38cb00
-       //TODO: VINSERTI64X2 $0, X31, Y12, K7, Y1                  // 62939d2f38cf00
-       //TODO: VINSERTI64X2 $0, X3, Y12, K7, Y1                   // 62f39d2f38cb00
-       //TODO: VINSERTI64X2 $0, 17(SP), Y12, K7, Y1               // 62f39d2f388c241100000000
-       //TODO: VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y1        // 62f39d2f388cb5efffffff00
-       //TODO: VINSERTI64X2 $3, X7, Z31, K6, Z17                  // 62e3854638cf03
-       //TODO: VINSERTI64X2 $3, X0, Z31, K6, Z17                  // 62e3854638c803
-       //TODO: VINSERTI64X2 $3, 7(AX), Z31, K6, Z17               // 62e3854638880700000003
-       //TODO: VINSERTI64X2 $3, (DI), Z31, K6, Z17                // 62e38546380f03
-       //TODO: VINSERTI64X2 $3, X7, Z0, K6, Z17                   // 62e3fd4e38cf03
-       //TODO: VINSERTI64X2 $3, X0, Z0, K6, Z17                   // 62e3fd4e38c803
-       //TODO: VINSERTI64X2 $3, 7(AX), Z0, K6, Z17                // 62e3fd4e38880700000003
-       //TODO: VINSERTI64X2 $3, (DI), Z0, K6, Z17                 // 62e3fd4e380f03
-       //TODO: VINSERTI64X2 $3, X7, Z31, K6, Z23                  // 62e3854638ff03
-       //TODO: VINSERTI64X2 $3, X0, Z31, K6, Z23                  // 62e3854638f803
-       //TODO: VINSERTI64X2 $3, 7(AX), Z31, K6, Z23               // 62e3854638b80700000003
-       //TODO: VINSERTI64X2 $3, (DI), Z31, K6, Z23                // 62e38546383f03
-       //TODO: VINSERTI64X2 $3, X7, Z0, K6, Z23                   // 62e3fd4e38ff03
-       //TODO: VINSERTI64X2 $3, X0, Z0, K6, Z23                   // 62e3fd4e38f803
-       //TODO: VINSERTI64X2 $3, 7(AX), Z0, K6, Z23                // 62e3fd4e38b80700000003
-       //TODO: VINSERTI64X2 $3, (DI), Z0, K6, Z23                 // 62e3fd4e383f03
-       //TODO: VORPD X11, X24, K7, X23                            // 62c1bd0756fb
-       //TODO: VORPD X23, X24, K7, X23                            // 62a1bd0756ff
-       //TODO: VORPD X2, X24, K7, X23                             // 62e1bd0756fa
-       //TODO: VORPD -17(BP)(SI*8), X24, K7, X23                  // 62e1bd0756bcf5efffffff
-       //TODO: VORPD (R15), X24, K7, X23                          // 62c1bd07563f
-       //TODO: VORPD X11, X14, K7, X23                            // 62c18d0f56fb
-       //TODO: VORPD X23, X14, K7, X23                            // 62a18d0f56ff
-       //TODO: VORPD X2, X14, K7, X23                             // 62e18d0f56fa
-       //TODO: VORPD -17(BP)(SI*8), X14, K7, X23                  // 62e18d0f56bcf5efffffff
-       //TODO: VORPD (R15), X14, K7, X23                          // 62c18d0f563f
-       //TODO: VORPD X11, X0, K7, X23                             // 62c1fd0f56fb
-       //TODO: VORPD X23, X0, K7, X23                             // 62a1fd0f56ff
-       //TODO: VORPD X2, X0, K7, X23                              // 62e1fd0f56fa
-       //TODO: VORPD -17(BP)(SI*8), X0, K7, X23                   // 62e1fd0f56bcf5efffffff
-       //TODO: VORPD (R15), X0, K7, X23                           // 62c1fd0f563f
-       //TODO: VORPD X11, X24, K7, X11                            // 6251bd0756db
-       //TODO: VORPD X23, X24, K7, X11                            // 6231bd0756df
-       //TODO: VORPD X2, X24, K7, X11                             // 6271bd0756da
-       //TODO: VORPD -17(BP)(SI*8), X24, K7, X11                  // 6271bd07569cf5efffffff
-       //TODO: VORPD (R15), X24, K7, X11                          // 6251bd07561f
-       //TODO: VORPD X11, X14, K7, X11                            // 62518d0f56db
-       //TODO: VORPD X23, X14, K7, X11                            // 62318d0f56df
-       //TODO: VORPD X2, X14, K7, X11                             // 62718d0f56da
-       //TODO: VORPD -17(BP)(SI*8), X14, K7, X11                  // 62718d0f569cf5efffffff
-       //TODO: VORPD (R15), X14, K7, X11                          // 62518d0f561f
-       //TODO: VORPD X11, X0, K7, X11                             // 6251fd0f56db
-       //TODO: VORPD X23, X0, K7, X11                             // 6231fd0f56df
-       //TODO: VORPD X2, X0, K7, X11                              // 6271fd0f56da
-       //TODO: VORPD -17(BP)(SI*8), X0, K7, X11                   // 6271fd0f569cf5efffffff
-       //TODO: VORPD (R15), X0, K7, X11                           // 6251fd0f561f
-       //TODO: VORPD X11, X24, K7, X31                            // 6241bd0756fb
-       //TODO: VORPD X23, X24, K7, X31                            // 6221bd0756ff
-       //TODO: VORPD X2, X24, K7, X31                             // 6261bd0756fa
-       //TODO: VORPD -17(BP)(SI*8), X24, K7, X31                  // 6261bd0756bcf5efffffff
-       //TODO: VORPD (R15), X24, K7, X31                          // 6241bd07563f
-       //TODO: VORPD X11, X14, K7, X31                            // 62418d0f56fb
-       //TODO: VORPD X23, X14, K7, X31                            // 62218d0f56ff
-       //TODO: VORPD X2, X14, K7, X31                             // 62618d0f56fa
-       //TODO: VORPD -17(BP)(SI*8), X14, K7, X31                  // 62618d0f56bcf5efffffff
-       //TODO: VORPD (R15), X14, K7, X31                          // 62418d0f563f
-       //TODO: VORPD X11, X0, K7, X31                             // 6241fd0f56fb
-       //TODO: VORPD X23, X0, K7, X31                             // 6221fd0f56ff
-       //TODO: VORPD X2, X0, K7, X31                              // 6261fd0f56fa
-       //TODO: VORPD -17(BP)(SI*8), X0, K7, X31                   // 6261fd0f56bcf5efffffff
-       //TODO: VORPD (R15), X0, K7, X31                           // 6241fd0f563f
-       //TODO: VORPD Y16, Y5, K1, Y8                              // 6231d52956c0
-       //TODO: VORPD Y9, Y5, K1, Y8                               // 6251d52956c1
-       //TODO: VORPD Y13, Y5, K1, Y8                              // 6251d52956c5
-       //TODO: VORPD 99(R15)(R15*2), Y5, K1, Y8                   // 6211d52956847f63000000
-       //TODO: VORPD -7(DI), Y5, K1, Y8                           // 6271d5295687f9ffffff
-       //TODO: VORPD Y16, Y24, K1, Y8                             // 6231bd2156c0
-       //TODO: VORPD Y9, Y24, K1, Y8                              // 6251bd2156c1
-       //TODO: VORPD Y13, Y24, K1, Y8                             // 6251bd2156c5
-       //TODO: VORPD 99(R15)(R15*2), Y24, K1, Y8                  // 6211bd2156847f63000000
-       //TODO: VORPD -7(DI), Y24, K1, Y8                          // 6271bd215687f9ffffff
-       //TODO: VORPD Y16, Y21, K1, Y8                             // 6231d52156c0
-       //TODO: VORPD Y9, Y21, K1, Y8                              // 6251d52156c1
-       //TODO: VORPD Y13, Y21, K1, Y8                             // 6251d52156c5
-       //TODO: VORPD 99(R15)(R15*2), Y21, K1, Y8                  // 6211d52156847f63000000
-       //TODO: VORPD -7(DI), Y21, K1, Y8                          // 6271d5215687f9ffffff
-       //TODO: VORPD Y16, Y5, K1, Y11                             // 6231d52956d8
-       //TODO: VORPD Y9, Y5, K1, Y11                              // 6251d52956d9
-       //TODO: VORPD Y13, Y5, K1, Y11                             // 6251d52956dd
-       //TODO: VORPD 99(R15)(R15*2), Y5, K1, Y11                  // 6211d529569c7f63000000
-       //TODO: VORPD -7(DI), Y5, K1, Y11                          // 6271d529569ff9ffffff
-       //TODO: VORPD Y16, Y24, K1, Y11                            // 6231bd2156d8
-       //TODO: VORPD Y9, Y24, K1, Y11                             // 6251bd2156d9
-       //TODO: VORPD Y13, Y24, K1, Y11                            // 6251bd2156dd
-       //TODO: VORPD 99(R15)(R15*2), Y24, K1, Y11                 // 6211bd21569c7f63000000
-       //TODO: VORPD -7(DI), Y24, K1, Y11                         // 6271bd21569ff9ffffff
-       //TODO: VORPD Y16, Y21, K1, Y11                            // 6231d52156d8
-       //TODO: VORPD Y9, Y21, K1, Y11                             // 6251d52156d9
-       //TODO: VORPD Y13, Y21, K1, Y11                            // 6251d52156dd
-       //TODO: VORPD 99(R15)(R15*2), Y21, K1, Y11                 // 6211d521569c7f63000000
-       //TODO: VORPD -7(DI), Y21, K1, Y11                         // 6271d521569ff9ffffff
-       //TODO: VORPD Y16, Y5, K1, Y24                             // 6221d52956c0
-       //TODO: VORPD Y9, Y5, K1, Y24                              // 6241d52956c1
-       //TODO: VORPD Y13, Y5, K1, Y24                             // 6241d52956c5
-       //TODO: VORPD 99(R15)(R15*2), Y5, K1, Y24                  // 6201d52956847f63000000
-       //TODO: VORPD -7(DI), Y5, K1, Y24                          // 6261d5295687f9ffffff
-       //TODO: VORPD Y16, Y24, K1, Y24                            // 6221bd2156c0
-       //TODO: VORPD Y9, Y24, K1, Y24                             // 6241bd2156c1
-       //TODO: VORPD Y13, Y24, K1, Y24                            // 6241bd2156c5
-       //TODO: VORPD 99(R15)(R15*2), Y24, K1, Y24                 // 6201bd2156847f63000000
-       //TODO: VORPD -7(DI), Y24, K1, Y24                         // 6261bd215687f9ffffff
-       //TODO: VORPD Y16, Y21, K1, Y24                            // 6221d52156c0
-       //TODO: VORPD Y9, Y21, K1, Y24                             // 6241d52156c1
-       //TODO: VORPD Y13, Y21, K1, Y24                            // 6241d52156c5
-       //TODO: VORPD 99(R15)(R15*2), Y21, K1, Y24                 // 6201d52156847f63000000
-       //TODO: VORPD -7(DI), Y21, K1, Y24                         // 6261d5215687f9ffffff
-       //TODO: VORPD Z9, Z9, K1, Z0                               // 62d1b54956c1
-       //TODO: VORPD Z25, Z9, K1, Z0                              // 6291b54956c1
-       //TODO: VORPD -7(CX), Z9, K1, Z0                           // 62f1b5495681f9ffffff
-       //TODO: VORPD 15(DX)(BX*4), Z9, K1, Z0                     // 62f1b54956849a0f000000
-       //TODO: VORPD Z9, Z3, K1, Z0                               // 62d1e54956c1
-       //TODO: VORPD Z25, Z3, K1, Z0                              // 6291e54956c1
-       //TODO: VORPD -7(CX), Z3, K1, Z0                           // 62f1e5495681f9ffffff
-       //TODO: VORPD 15(DX)(BX*4), Z3, K1, Z0                     // 62f1e54956849a0f000000
-       //TODO: VORPD Z9, Z9, K1, Z26                              // 6241b54956d1
-       //TODO: VORPD Z25, Z9, K1, Z26                             // 6201b54956d1
-       //TODO: VORPD -7(CX), Z9, K1, Z26                          // 6261b5495691f9ffffff
-       //TODO: VORPD 15(DX)(BX*4), Z9, K1, Z26                    // 6261b54956949a0f000000
-       //TODO: VORPD Z9, Z3, K1, Z26                              // 6241e54956d1
-       //TODO: VORPD Z25, Z3, K1, Z26                             // 6201e54956d1
-       //TODO: VORPD -7(CX), Z3, K1, Z26                          // 6261e5495691f9ffffff
-       //TODO: VORPD 15(DX)(BX*4), Z3, K1, Z26                    // 6261e54956949a0f000000
-       //TODO: VORPS X2, X0, K1, X20                              // 62e17c0956e2
-       //TODO: VORPS X8, X0, K1, X20                              // 62c17c0956e0
-       //TODO: VORPS X9, X0, K1, X20                              // 62c17c0956e1
-       //TODO: VORPS 7(SI)(DI*8), X0, K1, X20                     // 62e17c0956a4fe07000000
-       //TODO: VORPS -15(R14), X0, K1, X20                        // 62c17c0956a6f1ffffff
-       //TODO: VORPS X2, X9, K1, X20                              // 62e1340956e2
-       //TODO: VORPS X8, X9, K1, X20                              // 62c1340956e0
-       //TODO: VORPS X9, X9, K1, X20                              // 62c1340956e1
-       //TODO: VORPS 7(SI)(DI*8), X9, K1, X20                     // 62e1340956a4fe07000000
-       //TODO: VORPS -15(R14), X9, K1, X20                        // 62c1340956a6f1ffffff
-       //TODO: VORPS X2, X13, K1, X20                             // 62e1140956e2
-       //TODO: VORPS X8, X13, K1, X20                             // 62c1140956e0
-       //TODO: VORPS X9, X13, K1, X20                             // 62c1140956e1
-       //TODO: VORPS 7(SI)(DI*8), X13, K1, X20                    // 62e1140956a4fe07000000
-       //TODO: VORPS -15(R14), X13, K1, X20                       // 62c1140956a6f1ffffff
-       //TODO: VORPS X2, X0, K1, X5                               // 62f17c0956ea
-       //TODO: VORPS X8, X0, K1, X5                               // 62d17c0956e8
-       //TODO: VORPS X9, X0, K1, X5                               // 62d17c0956e9
-       //TODO: VORPS 7(SI)(DI*8), X0, K1, X5                      // 62f17c0956acfe07000000
-       //TODO: VORPS -15(R14), X0, K1, X5                         // 62d17c0956aef1ffffff
-       //TODO: VORPS X2, X9, K1, X5                               // 62f1340956ea
-       //TODO: VORPS X8, X9, K1, X5                               // 62d1340956e8
-       //TODO: VORPS X9, X9, K1, X5                               // 62d1340956e9
-       //TODO: VORPS 7(SI)(DI*8), X9, K1, X5                      // 62f1340956acfe07000000
-       //TODO: VORPS -15(R14), X9, K1, X5                         // 62d1340956aef1ffffff
-       //TODO: VORPS X2, X13, K1, X5                              // 62f1140956ea
-       //TODO: VORPS X8, X13, K1, X5                              // 62d1140956e8
-       //TODO: VORPS X9, X13, K1, X5                              // 62d1140956e9
-       //TODO: VORPS 7(SI)(DI*8), X13, K1, X5                     // 62f1140956acfe07000000
-       //TODO: VORPS -15(R14), X13, K1, X5                        // 62d1140956aef1ffffff
-       //TODO: VORPS X2, X0, K1, X25                              // 62617c0956ca
-       //TODO: VORPS X8, X0, K1, X25                              // 62417c0956c8
-       //TODO: VORPS X9, X0, K1, X25                              // 62417c0956c9
-       //TODO: VORPS 7(SI)(DI*8), X0, K1, X25                     // 62617c09568cfe07000000
-       //TODO: VORPS -15(R14), X0, K1, X25                        // 62417c09568ef1ffffff
-       //TODO: VORPS X2, X9, K1, X25                              // 6261340956ca
-       //TODO: VORPS X8, X9, K1, X25                              // 6241340956c8
-       //TODO: VORPS X9, X9, K1, X25                              // 6241340956c9
-       //TODO: VORPS 7(SI)(DI*8), X9, K1, X25                     // 62613409568cfe07000000
-       //TODO: VORPS -15(R14), X9, K1, X25                        // 62413409568ef1ffffff
-       //TODO: VORPS X2, X13, K1, X25                             // 6261140956ca
-       //TODO: VORPS X8, X13, K1, X25                             // 6241140956c8
-       //TODO: VORPS X9, X13, K1, X25                             // 6241140956c9
-       //TODO: VORPS 7(SI)(DI*8), X13, K1, X25                    // 62611409568cfe07000000
-       //TODO: VORPS -15(R14), X13, K1, X25                       // 62411409568ef1ffffff
-       //TODO: VORPS Y11, Y7, K7, Y9                              // 6251442f56cb
-       //TODO: VORPS Y26, Y7, K7, Y9                              // 6211442f56ca
-       //TODO: VORPS Y12, Y7, K7, Y9                              // 6251442f56cc
-       //TODO: VORPS -7(CX)(DX*1), Y7, K7, Y9                     // 6271442f568c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y7, K7, Y9                  // 6211442f568cbef1ffffff
-       //TODO: VORPS Y11, Y6, K7, Y9                              // 62514c2f56cb
-       //TODO: VORPS Y26, Y6, K7, Y9                              // 62114c2f56ca
-       //TODO: VORPS Y12, Y6, K7, Y9                              // 62514c2f56cc
-       //TODO: VORPS -7(CX)(DX*1), Y6, K7, Y9                     // 62714c2f568c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y6, K7, Y9                  // 62114c2f568cbef1ffffff
-       //TODO: VORPS Y11, Y26, K7, Y9                             // 62512c2756cb
-       //TODO: VORPS Y26, Y26, K7, Y9                             // 62112c2756ca
-       //TODO: VORPS Y12, Y26, K7, Y9                             // 62512c2756cc
-       //TODO: VORPS -7(CX)(DX*1), Y26, K7, Y9                    // 62712c27568c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y26, K7, Y9                 // 62112c27568cbef1ffffff
-       //TODO: VORPS Y11, Y7, K7, Y6                              // 62d1442f56f3
-       //TODO: VORPS Y26, Y7, K7, Y6                              // 6291442f56f2
-       //TODO: VORPS Y12, Y7, K7, Y6                              // 62d1442f56f4
-       //TODO: VORPS -7(CX)(DX*1), Y7, K7, Y6                     // 62f1442f56b411f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y7, K7, Y6                  // 6291442f56b4bef1ffffff
-       //TODO: VORPS Y11, Y6, K7, Y6                              // 62d14c2f56f3
-       //TODO: VORPS Y26, Y6, K7, Y6                              // 62914c2f56f2
-       //TODO: VORPS Y12, Y6, K7, Y6                              // 62d14c2f56f4
-       //TODO: VORPS -7(CX)(DX*1), Y6, K7, Y6                     // 62f14c2f56b411f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y6, K7, Y6                  // 62914c2f56b4bef1ffffff
-       //TODO: VORPS Y11, Y26, K7, Y6                             // 62d12c2756f3
-       //TODO: VORPS Y26, Y26, K7, Y6                             // 62912c2756f2
-       //TODO: VORPS Y12, Y26, K7, Y6                             // 62d12c2756f4
-       //TODO: VORPS -7(CX)(DX*1), Y26, K7, Y6                    // 62f12c2756b411f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y26, K7, Y6                 // 62912c2756b4bef1ffffff
-       //TODO: VORPS Y11, Y7, K7, Y3                              // 62d1442f56db
-       //TODO: VORPS Y26, Y7, K7, Y3                              // 6291442f56da
-       //TODO: VORPS Y12, Y7, K7, Y3                              // 62d1442f56dc
-       //TODO: VORPS -7(CX)(DX*1), Y7, K7, Y3                     // 62f1442f569c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y7, K7, Y3                  // 6291442f569cbef1ffffff
-       //TODO: VORPS Y11, Y6, K7, Y3                              // 62d14c2f56db
-       //TODO: VORPS Y26, Y6, K7, Y3                              // 62914c2f56da
-       //TODO: VORPS Y12, Y6, K7, Y3                              // 62d14c2f56dc
-       //TODO: VORPS -7(CX)(DX*1), Y6, K7, Y3                     // 62f14c2f569c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y6, K7, Y3                  // 62914c2f569cbef1ffffff
-       //TODO: VORPS Y11, Y26, K7, Y3                             // 62d12c2756db
-       //TODO: VORPS Y26, Y26, K7, Y3                             // 62912c2756da
-       //TODO: VORPS Y12, Y26, K7, Y3                             // 62d12c2756dc
-       //TODO: VORPS -7(CX)(DX*1), Y26, K7, Y3                    // 62f12c27569c11f9ffffff
-       //TODO: VORPS -15(R14)(R15*4), Y26, K7, Y3                 // 62912c27569cbef1ffffff
-       //TODO: VORPS Z17, Z20, K2, Z9                             // 62315c4256c9
-       //TODO: VORPS Z0, Z20, K2, Z9                              // 62715c4256c8
-       //TODO: VORPS 99(R15)(R15*8), Z20, K2, Z9                  // 62115c42568cff63000000
-       //TODO: VORPS 7(AX)(CX*8), Z20, K2, Z9                     // 62715c42568cc807000000
-       //TODO: VORPS Z17, Z0, K2, Z9                              // 62317c4a56c9
-       //TODO: VORPS Z0, Z0, K2, Z9                               // 62717c4a56c8
-       //TODO: VORPS 99(R15)(R15*8), Z0, K2, Z9                   // 62117c4a568cff63000000
-       //TODO: VORPS 7(AX)(CX*8), Z0, K2, Z9                      // 62717c4a568cc807000000
-       //TODO: VORPS Z17, Z20, K2, Z28                            // 62215c4256e1
-       //TODO: VORPS Z0, Z20, K2, Z28                             // 62615c4256e0
-       //TODO: VORPS 99(R15)(R15*8), Z20, K2, Z28                 // 62015c4256a4ff63000000
-       //TODO: VORPS 7(AX)(CX*8), Z20, K2, Z28                    // 62615c4256a4c807000000
-       //TODO: VORPS Z17, Z0, K2, Z28                             // 62217c4a56e1
-       //TODO: VORPS Z0, Z0, K2, Z28                              // 62617c4a56e0
-       //TODO: VORPS 99(R15)(R15*8), Z0, K2, Z28                  // 62017c4a56a4ff63000000
-       //TODO: VORPS 7(AX)(CX*8), Z0, K2, Z28                     // 62617c4a56a4c807000000
-       //TODO: VPEXTRD $64, X22, CX                               // 62e37d0816f140
-       //TODO: VPEXTRD $64, X30, CX                               // 62637d0816f140
-       //TODO: VPEXTRD $64, X22, SP                               // 62e37d0816f440
-       //TODO: VPEXTRD $64, X30, SP                               // 62637d0816f440
-       //TODO: VPEXTRD $64, X22, 99(R15)(R15*2)                   // 62837d0816b47f6300000040
-       //TODO: VPEXTRD $64, X30, 99(R15)(R15*2)                   // 62037d0816b47f6300000040
-       //TODO: VPEXTRD $64, X22, -7(DI)                           // 62e37d0816b7f9ffffff40
-       //TODO: VPEXTRD $64, X30, -7(DI)                           // 62637d0816b7f9ffffff40
-       //TODO: VPEXTRQ $27, X30, R9                               // 6243fd0816f11b
-       //TODO: VPEXTRQ $27, X30, R13                              // 6243fd0816f51b
-       //TODO: VPEXTRQ $27, X30, -15(R14)(R15*1)                  // 6203fd0816b43ef1ffffff1b
-       //TODO: VPEXTRQ $27, X30, -15(BX)                          // 6263fd0816b3f1ffffff1b
-       //TODO: VPINSRD $82, R9, X22, X21                          // 62c34d0022e952
-       //TODO: VPINSRD $82, CX, X22, X21                          // 62e34d0022e952
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X22, X21                // 62e34d0022ac11f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X22, X21             // 62834d0022acbef1ffffff52
-       //TODO: VPINSRD $82, R9, X7, X21                           // 62c3450822e952
-       //TODO: VPINSRD $82, CX, X7, X21                           // 62e3450822e952
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X7, X21                 // 62e3450822ac11f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X7, X21              // 6283450822acbef1ffffff52
-       //TODO: VPINSRD $82, R9, X19, X21                          // 62c3650022e952
-       //TODO: VPINSRD $82, CX, X19, X21                          // 62e3650022e952
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X19, X21                // 62e3650022ac11f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X19, X21             // 6283650022acbef1ffffff52
-       //TODO: VPINSRD $82, R9, X22, X0                           // 62d34d0022c152
-       //TODO: VPINSRD $82, CX, X22, X0                           // 62f34d0022c152
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X22, X0                 // 62f34d00228411f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X22, X0              // 62934d002284bef1ffffff52
-       //TODO: VPINSRD $82, R9, X19, X0                           // 62d3650022c152
-       //TODO: VPINSRD $82, CX, X19, X0                           // 62f3650022c152
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X19, X0                 // 62f36500228411f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X19, X0              // 629365002284bef1ffffff52
-       //TODO: VPINSRD $82, R9, X22, X28                          // 62434d0022e152
-       //TODO: VPINSRD $82, CX, X22, X28                          // 62634d0022e152
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X22, X28                // 62634d0022a411f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X22, X28             // 62034d0022a4bef1ffffff52
-       //TODO: VPINSRD $82, R9, X7, X28                           // 6243450822e152
-       //TODO: VPINSRD $82, CX, X7, X28                           // 6263450822e152
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X7, X28                 // 6263450822a411f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X7, X28              // 6203450822a4bef1ffffff52
-       //TODO: VPINSRD $82, R9, X19, X28                          // 6243650022e152
-       //TODO: VPINSRD $82, CX, X19, X28                          // 6263650022e152
-       //TODO: VPINSRD $82, -7(CX)(DX*1), X19, X28                // 6263650022a411f9ffffff52
-       //TODO: VPINSRD $82, -15(R14)(R15*4), X19, X28             // 6203650022a4bef1ffffff52
-       //TODO: VPINSRQ $126, DX, X1, X16                          // 62e3f50822c27e
-       //TODO: VPINSRQ $126, BP, X1, X16                          // 62e3f50822c57e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X1, X16                 // 62e3f508228488070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X1, X16                 // 62e3f508228408070000007e
-       //TODO: VPINSRQ $126, DX, X7, X16                          // 62e3c50822c27e
-       //TODO: VPINSRQ $126, BP, X7, X16                          // 62e3c50822c57e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X7, X16                 // 62e3c508228488070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X7, X16                 // 62e3c508228408070000007e
-       //TODO: VPINSRQ $126, DX, X9, X16                          // 62e3b50822c27e
-       //TODO: VPINSRQ $126, BP, X9, X16                          // 62e3b50822c57e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X9, X16                 // 62e3b508228488070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X9, X16                 // 62e3b508228408070000007e
-       //TODO: VPINSRQ $126, DX, X1, X31                          // 6263f50822fa7e
-       //TODO: VPINSRQ $126, BP, X1, X31                          // 6263f50822fd7e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X1, X31                 // 6263f50822bc88070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X1, X31                 // 6263f50822bc08070000007e
-       //TODO: VPINSRQ $126, DX, X7, X31                          // 6263c50822fa7e
-       //TODO: VPINSRQ $126, BP, X7, X31                          // 6263c50822fd7e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X7, X31                 // 6263c50822bc88070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X7, X31                 // 6263c50822bc08070000007e
-       //TODO: VPINSRQ $126, DX, X9, X31                          // 6263b50822fa7e
-       //TODO: VPINSRQ $126, BP, X9, X31                          // 6263b50822fd7e
-       //TODO: VPINSRQ $126, 7(AX)(CX*4), X9, X31                 // 6263b50822bc88070000007e
-       //TODO: VPINSRQ $126, 7(AX)(CX*1), X9, X31                 // 6263b50822bc08070000007e
-       //TODO: VPMOVD2M X3, K6                                    // 62f27e0839f3
-       //TODO: VPMOVD2M X26, K6                                   // 62927e0839f2
-       //TODO: VPMOVD2M X23, K6                                   // 62b27e0839f7
-       //TODO: VPMOVD2M X3, K7                                    // 62f27e0839fb
-       //TODO: VPMOVD2M X26, K7                                   // 62927e0839fa
-       //TODO: VPMOVD2M X23, K7                                   // 62b27e0839ff
-       //TODO: VPMOVD2M Y5, K6                                    // 62f27e2839f5
-       //TODO: VPMOVD2M Y28, K6                                   // 62927e2839f4
-       //TODO: VPMOVD2M Y7, K6                                    // 62f27e2839f7
-       //TODO: VPMOVD2M Y5, K4                                    // 62f27e2839e5
-       //TODO: VPMOVD2M Y28, K4                                   // 62927e2839e4
-       //TODO: VPMOVD2M Y7, K4                                    // 62f27e2839e7
-       //TODO: VPMOVD2M Z1, K4                                    // 62f27e4839e1
-       //TODO: VPMOVD2M Z9, K4                                    // 62d27e4839e1
-       //TODO: VPMOVD2M Z1, K6                                    // 62f27e4839f1
-       //TODO: VPMOVD2M Z9, K6                                    // 62d27e4839f1
-       //TODO: VPMOVM2D K6, X21                                   // 62e27e0838ee
-       //TODO: VPMOVM2D K5, X21                                   // 62e27e0838ed
-       //TODO: VPMOVM2D K6, X1                                    // 62f27e0838ce
-       //TODO: VPMOVM2D K5, X1                                    // 62f27e0838cd
-       //TODO: VPMOVM2D K6, X11                                   // 62727e0838de
-       //TODO: VPMOVM2D K5, X11                                   // 62727e0838dd
-       //TODO: VPMOVM2D K1, Y28                                   // 62627e2838e1
-       //TODO: VPMOVM2D K5, Y28                                   // 62627e2838e5
-       //TODO: VPMOVM2D K1, Y13                                   // 62727e2838e9
-       //TODO: VPMOVM2D K5, Y13                                   // 62727e2838ed
-       //TODO: VPMOVM2D K1, Y7                                    // 62f27e2838f9
-       //TODO: VPMOVM2D K5, Y7                                    // 62f27e2838fd
-       //TODO: VPMOVM2D K3, Z7                                    // 62f27e4838fb
-       //TODO: VPMOVM2D K1, Z7                                    // 62f27e4838f9
-       //TODO: VPMOVM2D K3, Z21                                   // 62e27e4838eb
-       //TODO: VPMOVM2D K1, Z21                                   // 62e27e4838e9
-       //TODO: VPMOVM2Q K5, X13                                   // 6272fe0838ed
-       //TODO: VPMOVM2Q K4, X13                                   // 6272fe0838ec
-       //TODO: VPMOVM2Q K5, X0                                    // 62f2fe0838c5
-       //TODO: VPMOVM2Q K4, X0                                    // 62f2fe0838c4
-       //TODO: VPMOVM2Q K5, X30                                   // 6262fe0838f5
-       //TODO: VPMOVM2Q K4, X30                                   // 6262fe0838f4
-       //TODO: VPMOVM2Q K7, Y2                                    // 62f2fe2838d7
-       //TODO: VPMOVM2Q K6, Y2                                    // 62f2fe2838d6
-       //TODO: VPMOVM2Q K7, Y21                                   // 62e2fe2838ef
-       //TODO: VPMOVM2Q K6, Y21                                   // 62e2fe2838ee
-       //TODO: VPMOVM2Q K7, Y12                                   // 6272fe2838e7
-       //TODO: VPMOVM2Q K6, Y12                                   // 6272fe2838e6
-       //TODO: VPMOVM2Q K4, Z16                                   // 62e2fe4838c4
-       //TODO: VPMOVM2Q K6, Z16                                   // 62e2fe4838c6
-       //TODO: VPMOVM2Q K4, Z25                                   // 6262fe4838cc
-       //TODO: VPMOVM2Q K6, Z25                                   // 6262fe4838ce
-       //TODO: VPMOVQ2M X14, K1                                   // 62d2fe0839ce
-       //TODO: VPMOVQ2M X19, K1                                   // 62b2fe0839cb
-       //TODO: VPMOVQ2M X8, K1                                    // 62d2fe0839c8
-       //TODO: VPMOVQ2M X14, K3                                   // 62d2fe0839de
-       //TODO: VPMOVQ2M X19, K3                                   // 62b2fe0839db
-       //TODO: VPMOVQ2M X8, K3                                    // 62d2fe0839d8
-       //TODO: VPMOVQ2M Y3, K6                                    // 62f2fe2839f3
-       //TODO: VPMOVQ2M Y2, K6                                    // 62f2fe2839f2
-       //TODO: VPMOVQ2M Y9, K6                                    // 62d2fe2839f1
-       //TODO: VPMOVQ2M Y3, K7                                    // 62f2fe2839fb
-       //TODO: VPMOVQ2M Y2, K7                                    // 62f2fe2839fa
-       //TODO: VPMOVQ2M Y9, K7                                    // 62d2fe2839f9
-       //TODO: VPMOVQ2M Z12, K6                                   // 62d2fe4839f4
-       //TODO: VPMOVQ2M Z13, K6                                   // 62d2fe4839f5
-       //TODO: VPMOVQ2M Z12, K4                                   // 62d2fe4839e4
-       //TODO: VPMOVQ2M Z13, K4                                   // 62d2fe4839e5
-       //TODO: VPMULLQ X13, X3, K7, X17                           // 62c2e50f40cd
-       //TODO: VPMULLQ X28, X3, K7, X17                           // 6282e50f40cc
-       //TODO: VPMULLQ X24, X3, K7, X17                           // 6282e50f40c8
-       //TODO: VPMULLQ 15(R8)(R14*4), X3, K7, X17                 // 6282e50f408cb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X3, K7, X17                  // 62e2e50f408c91f9ffffff
-       //TODO: VPMULLQ X13, X26, K7, X17                          // 62c2ad0740cd
-       //TODO: VPMULLQ X28, X26, K7, X17                          // 6282ad0740cc
-       //TODO: VPMULLQ X24, X26, K7, X17                          // 6282ad0740c8
-       //TODO: VPMULLQ 15(R8)(R14*4), X26, K7, X17                // 6282ad07408cb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X26, K7, X17                 // 62e2ad07408c91f9ffffff
-       //TODO: VPMULLQ X13, X23, K7, X17                          // 62c2c50740cd
-       //TODO: VPMULLQ X28, X23, K7, X17                          // 6282c50740cc
-       //TODO: VPMULLQ X24, X23, K7, X17                          // 6282c50740c8
-       //TODO: VPMULLQ 15(R8)(R14*4), X23, K7, X17                // 6282c507408cb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X23, K7, X17                 // 62e2c507408c91f9ffffff
-       //TODO: VPMULLQ X13, X3, K7, X15                           // 6252e50f40fd
-       //TODO: VPMULLQ X28, X3, K7, X15                           // 6212e50f40fc
-       //TODO: VPMULLQ X24, X3, K7, X15                           // 6212e50f40f8
-       //TODO: VPMULLQ 15(R8)(R14*4), X3, K7, X15                 // 6212e50f40bcb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X3, K7, X15                  // 6272e50f40bc91f9ffffff
-       //TODO: VPMULLQ X13, X26, K7, X15                          // 6252ad0740fd
-       //TODO: VPMULLQ X28, X26, K7, X15                          // 6212ad0740fc
-       //TODO: VPMULLQ X24, X26, K7, X15                          // 6212ad0740f8
-       //TODO: VPMULLQ 15(R8)(R14*4), X26, K7, X15                // 6212ad0740bcb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X26, K7, X15                 // 6272ad0740bc91f9ffffff
-       //TODO: VPMULLQ X13, X23, K7, X15                          // 6252c50740fd
-       //TODO: VPMULLQ X28, X23, K7, X15                          // 6212c50740fc
-       //TODO: VPMULLQ X24, X23, K7, X15                          // 6212c50740f8
-       //TODO: VPMULLQ 15(R8)(R14*4), X23, K7, X15                // 6212c50740bcb00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X23, K7, X15                 // 6272c50740bc91f9ffffff
-       //TODO: VPMULLQ X13, X3, K7, X8                            // 6252e50f40c5
-       //TODO: VPMULLQ X28, X3, K7, X8                            // 6212e50f40c4
-       //TODO: VPMULLQ X24, X3, K7, X8                            // 6212e50f40c0
-       //TODO: VPMULLQ 15(R8)(R14*4), X3, K7, X8                  // 6212e50f4084b00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X3, K7, X8                   // 6272e50f408491f9ffffff
-       //TODO: VPMULLQ X13, X26, K7, X8                           // 6252ad0740c5
-       //TODO: VPMULLQ X28, X26, K7, X8                           // 6212ad0740c4
-       //TODO: VPMULLQ X24, X26, K7, X8                           // 6212ad0740c0
-       //TODO: VPMULLQ 15(R8)(R14*4), X26, K7, X8                 // 6212ad074084b00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X26, K7, X8                  // 6272ad07408491f9ffffff
-       //TODO: VPMULLQ X13, X23, K7, X8                           // 6252c50740c5
-       //TODO: VPMULLQ X28, X23, K7, X8                           // 6212c50740c4
-       //TODO: VPMULLQ X24, X23, K7, X8                           // 6212c50740c0
-       //TODO: VPMULLQ 15(R8)(R14*4), X23, K7, X8                 // 6212c5074084b00f000000
-       //TODO: VPMULLQ -7(CX)(DX*4), X23, K7, X8                  // 6272c507408491f9ffffff
-       //TODO: VPMULLQ Y28, Y31, K2, Y17                          // 6282852240cc
-       //TODO: VPMULLQ Y13, Y31, K2, Y17                          // 62c2852240cd
-       //TODO: VPMULLQ Y7, Y31, K2, Y17                           // 62e2852240cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y31, K2, Y17                 // 62e28522408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y31, K2, Y17                 // 62e28522408c51f9ffffff
-       //TODO: VPMULLQ Y28, Y8, K2, Y17                           // 6282bd2a40cc
-       //TODO: VPMULLQ Y13, Y8, K2, Y17                           // 62c2bd2a40cd
-       //TODO: VPMULLQ Y7, Y8, K2, Y17                            // 62e2bd2a40cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y8, K2, Y17                  // 62e2bd2a408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y8, K2, Y17                  // 62e2bd2a408c51f9ffffff
-       //TODO: VPMULLQ Y28, Y1, K2, Y17                           // 6282f52a40cc
-       //TODO: VPMULLQ Y13, Y1, K2, Y17                           // 62c2f52a40cd
-       //TODO: VPMULLQ Y7, Y1, K2, Y17                            // 62e2f52a40cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y1, K2, Y17                  // 62e2f52a408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y1, K2, Y17                  // 62e2f52a408c51f9ffffff
-       //TODO: VPMULLQ Y28, Y31, K2, Y7                           // 6292852240fc
-       //TODO: VPMULLQ Y13, Y31, K2, Y7                           // 62d2852240fd
-       //TODO: VPMULLQ Y7, Y31, K2, Y7                            // 62f2852240ff
-       //TODO: VPMULLQ 15(DX)(BX*1), Y31, K2, Y7                  // 62f2852240bc1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y31, K2, Y7                  // 62f2852240bc51f9ffffff
-       //TODO: VPMULLQ Y28, Y8, K2, Y7                            // 6292bd2a40fc
-       //TODO: VPMULLQ Y13, Y8, K2, Y7                            // 62d2bd2a40fd
-       //TODO: VPMULLQ Y7, Y8, K2, Y7                             // 62f2bd2a40ff
-       //TODO: VPMULLQ 15(DX)(BX*1), Y8, K2, Y7                   // 62f2bd2a40bc1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y8, K2, Y7                   // 62f2bd2a40bc51f9ffffff
-       //TODO: VPMULLQ Y28, Y1, K2, Y7                            // 6292f52a40fc
-       //TODO: VPMULLQ Y13, Y1, K2, Y7                            // 62d2f52a40fd
-       //TODO: VPMULLQ Y7, Y1, K2, Y7                             // 62f2f52a40ff
-       //TODO: VPMULLQ 15(DX)(BX*1), Y1, K2, Y7                   // 62f2f52a40bc1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y1, K2, Y7                   // 62f2f52a40bc51f9ffffff
-       //TODO: VPMULLQ Y28, Y31, K2, Y9                           // 6212852240cc
-       //TODO: VPMULLQ Y13, Y31, K2, Y9                           // 6252852240cd
-       //TODO: VPMULLQ Y7, Y31, K2, Y9                            // 6272852240cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y31, K2, Y9                  // 62728522408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y31, K2, Y9                  // 62728522408c51f9ffffff
-       //TODO: VPMULLQ Y28, Y8, K2, Y9                            // 6212bd2a40cc
-       //TODO: VPMULLQ Y13, Y8, K2, Y9                            // 6252bd2a40cd
-       //TODO: VPMULLQ Y7, Y8, K2, Y9                             // 6272bd2a40cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y8, K2, Y9                   // 6272bd2a408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y8, K2, Y9                   // 6272bd2a408c51f9ffffff
-       //TODO: VPMULLQ Y28, Y1, K2, Y9                            // 6212f52a40cc
-       //TODO: VPMULLQ Y13, Y1, K2, Y9                            // 6252f52a40cd
-       //TODO: VPMULLQ Y7, Y1, K2, Y9                             // 6272f52a40cf
-       //TODO: VPMULLQ 15(DX)(BX*1), Y1, K2, Y9                   // 6272f52a408c1a0f000000
-       //TODO: VPMULLQ -7(CX)(DX*2), Y1, K2, Y9                   // 6272f52a408c51f9ffffff
-       //TODO: VPMULLQ Z3, Z20, K4, Z0                            // 62f2dd4440c3
-       //TODO: VPMULLQ Z30, Z20, K4, Z0                           // 6292dd4440c6
-       //TODO: VPMULLQ 15(R8)(R14*8), Z20, K4, Z0                 // 6292dd444084f00f000000
-       //TODO: VPMULLQ -15(R14)(R15*2), Z20, K4, Z0               // 6292dd4440847ef1ffffff
-       //TODO: VPMULLQ Z3, Z28, K4, Z0                            // 62f29d4440c3
-       //TODO: VPMULLQ Z30, Z28, K4, Z0                           // 62929d4440c6
-       //TODO: VPMULLQ 15(R8)(R14*8), Z28, K4, Z0                 // 62929d444084f00f000000
-       //TODO: VPMULLQ -15(R14)(R15*2), Z28, K4, Z0               // 62929d4440847ef1ffffff
-       //TODO: VPMULLQ Z3, Z20, K4, Z6                            // 62f2dd4440f3
-       //TODO: VPMULLQ Z30, Z20, K4, Z6                           // 6292dd4440f6
-       //TODO: VPMULLQ 15(R8)(R14*8), Z20, K4, Z6                 // 6292dd4440b4f00f000000
-       //TODO: VPMULLQ -15(R14)(R15*2), Z20, K4, Z6               // 6292dd4440b47ef1ffffff
-       //TODO: VPMULLQ Z3, Z28, K4, Z6                            // 62f29d4440f3
-       //TODO: VPMULLQ Z30, Z28, K4, Z6                           // 62929d4440f6
-       //TODO: VPMULLQ 15(R8)(R14*8), Z28, K4, Z6                 // 62929d4440b4f00f000000
-       //TODO: VPMULLQ -15(R14)(R15*2), Z28, K4, Z6               // 62929d4440b47ef1ffffff
-       //TODO: VRANGEPD $11, X24, X23, K2, X12                    // 6213c50250e00b
-       //TODO: VRANGEPD $11, X14, X23, K2, X12                    // 6253c50250e60b
-       //TODO: VRANGEPD $11, X0, X23, K2, X12                     // 6273c50250e00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X23, K2, X12           // 6273c50250a4ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X23, K2, X12           // 6273c50250a4ac110000000b
-       //TODO: VRANGEPD $11, X24, X11, K2, X12                    // 6213a50a50e00b
-       //TODO: VRANGEPD $11, X14, X11, K2, X12                    // 6253a50a50e60b
-       //TODO: VRANGEPD $11, X0, X11, K2, X12                     // 6273a50a50e00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X11, K2, X12           // 6273a50a50a4ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X11, K2, X12           // 6273a50a50a4ac110000000b
-       //TODO: VRANGEPD $11, X24, X31, K2, X12                    // 6213850250e00b
-       //TODO: VRANGEPD $11, X14, X31, K2, X12                    // 6253850250e60b
-       //TODO: VRANGEPD $11, X0, X31, K2, X12                     // 6273850250e00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X31, K2, X12           // 6273850250a4ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X31, K2, X12           // 6273850250a4ac110000000b
-       //TODO: VRANGEPD $11, X24, X23, K2, X16                    // 6283c50250c00b
-       //TODO: VRANGEPD $11, X14, X23, K2, X16                    // 62c3c50250c60b
-       //TODO: VRANGEPD $11, X0, X23, K2, X16                     // 62e3c50250c00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X23, K2, X16           // 62e3c5025084ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X23, K2, X16           // 62e3c5025084ac110000000b
-       //TODO: VRANGEPD $11, X24, X11, K2, X16                    // 6283a50a50c00b
-       //TODO: VRANGEPD $11, X14, X11, K2, X16                    // 62c3a50a50c60b
-       //TODO: VRANGEPD $11, X0, X11, K2, X16                     // 62e3a50a50c00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X11, K2, X16           // 62e3a50a5084ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X11, K2, X16           // 62e3a50a5084ac110000000b
-       //TODO: VRANGEPD $11, X24, X31, K2, X16                    // 6283850250c00b
-       //TODO: VRANGEPD $11, X14, X31, K2, X16                    // 62c3850250c60b
-       //TODO: VRANGEPD $11, X0, X31, K2, X16                     // 62e3850250c00b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X31, K2, X16           // 62e385025084ec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X31, K2, X16           // 62e385025084ac110000000b
-       //TODO: VRANGEPD $11, X24, X23, K2, X23                    // 6283c50250f80b
-       //TODO: VRANGEPD $11, X14, X23, K2, X23                    // 62c3c50250fe0b
-       //TODO: VRANGEPD $11, X0, X23, K2, X23                     // 62e3c50250f80b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X23, K2, X23           // 62e3c50250bcec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X23, K2, X23           // 62e3c50250bcac110000000b
-       //TODO: VRANGEPD $11, X24, X11, K2, X23                    // 6283a50a50f80b
-       //TODO: VRANGEPD $11, X14, X11, K2, X23                    // 62c3a50a50fe0b
-       //TODO: VRANGEPD $11, X0, X11, K2, X23                     // 62e3a50a50f80b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X11, K2, X23           // 62e3a50a50bcec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X11, K2, X23           // 62e3a50a50bcac110000000b
-       //TODO: VRANGEPD $11, X24, X31, K2, X23                    // 6283850250f80b
-       //TODO: VRANGEPD $11, X14, X31, K2, X23                    // 62c3850250fe0b
-       //TODO: VRANGEPD $11, X0, X31, K2, X23                     // 62e3850250f80b
-       //TODO: VRANGEPD $11, 17(SP)(BP*8), X31, K2, X23           // 62e3850250bcec110000000b
-       //TODO: VRANGEPD $11, 17(SP)(BP*4), X31, K2, X23           // 62e3850250bcac110000000b
-       //TODO: VRANGEPD $12, Y3, Y18, K1, Y15                     // 6273ed2150fb0c
-       //TODO: VRANGEPD $12, Y19, Y18, K1, Y15                    // 6233ed2150fb0c
-       //TODO: VRANGEPD $12, Y23, Y18, K1, Y15                    // 6233ed2150ff0c
-       //TODO: VRANGEPD $12, (R8), Y18, K1, Y15                   // 6253ed2150380c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y15           // 6273ed2150bc5a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y24, K1, Y15                     // 6273bd2150fb0c
-       //TODO: VRANGEPD $12, Y19, Y24, K1, Y15                    // 6233bd2150fb0c
-       //TODO: VRANGEPD $12, Y23, Y24, K1, Y15                    // 6233bd2150ff0c
-       //TODO: VRANGEPD $12, (R8), Y24, K1, Y15                   // 6253bd2150380c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y15           // 6273bd2150bc5a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y9, K1, Y15                      // 6273b52950fb0c
-       //TODO: VRANGEPD $12, Y19, Y9, K1, Y15                     // 6233b52950fb0c
-       //TODO: VRANGEPD $12, Y23, Y9, K1, Y15                     // 6233b52950ff0c
-       //TODO: VRANGEPD $12, (R8), Y9, K1, Y15                    // 6253b52950380c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y15            // 6273b52950bc5a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y18, K1, Y22                     // 62e3ed2150f30c
-       //TODO: VRANGEPD $12, Y19, Y18, K1, Y22                    // 62a3ed2150f30c
-       //TODO: VRANGEPD $12, Y23, Y18, K1, Y22                    // 62a3ed2150f70c
-       //TODO: VRANGEPD $12, (R8), Y18, K1, Y22                   // 62c3ed2150300c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y22           // 62e3ed2150b45a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y24, K1, Y22                     // 62e3bd2150f30c
-       //TODO: VRANGEPD $12, Y19, Y24, K1, Y22                    // 62a3bd2150f30c
-       //TODO: VRANGEPD $12, Y23, Y24, K1, Y22                    // 62a3bd2150f70c
-       //TODO: VRANGEPD $12, (R8), Y24, K1, Y22                   // 62c3bd2150300c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y22           // 62e3bd2150b45a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y9, K1, Y22                      // 62e3b52950f30c
-       //TODO: VRANGEPD $12, Y19, Y9, K1, Y22                     // 62a3b52950f30c
-       //TODO: VRANGEPD $12, Y23, Y9, K1, Y22                     // 62a3b52950f70c
-       //TODO: VRANGEPD $12, (R8), Y9, K1, Y22                    // 62c3b52950300c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y22            // 62e3b52950b45a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y18, K1, Y20                     // 62e3ed2150e30c
-       //TODO: VRANGEPD $12, Y19, Y18, K1, Y20                    // 62a3ed2150e30c
-       //TODO: VRANGEPD $12, Y23, Y18, K1, Y20                    // 62a3ed2150e70c
-       //TODO: VRANGEPD $12, (R8), Y18, K1, Y20                   // 62c3ed2150200c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y20           // 62e3ed2150a45a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y24, K1, Y20                     // 62e3bd2150e30c
-       //TODO: VRANGEPD $12, Y19, Y24, K1, Y20                    // 62a3bd2150e30c
-       //TODO: VRANGEPD $12, Y23, Y24, K1, Y20                    // 62a3bd2150e70c
-       //TODO: VRANGEPD $12, (R8), Y24, K1, Y20                   // 62c3bd2150200c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y20           // 62e3bd2150a45a0f0000000c
-       //TODO: VRANGEPD $12, Y3, Y9, K1, Y20                      // 62e3b52950e30c
-       //TODO: VRANGEPD $12, Y19, Y9, K1, Y20                     // 62a3b52950e30c
-       //TODO: VRANGEPD $12, Y23, Y9, K1, Y20                     // 62a3b52950e70c
-       //TODO: VRANGEPD $12, (R8), Y9, K1, Y20                    // 62c3b52950200c
-       //TODO: VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y20            // 62e3b52950a45a0f0000000c
-       //TODO: VRANGEPD $13, Z21, Z12, K7, Z14                    // 62339d4f50f50d
-       //TODO: VRANGEPD $13, Z9, Z12, K7, Z14                     // 62539d4f50f10d
-       //TODO: VRANGEPD $13, Z21, Z13, K7, Z14                    // 6233954f50f50d
-       //TODO: VRANGEPD $13, Z9, Z13, K7, Z14                     // 6253954f50f10d
-       //TODO: VRANGEPD $13, Z21, Z12, K7, Z13                    // 62339d4f50ed0d
-       //TODO: VRANGEPD $13, Z9, Z12, K7, Z13                     // 62539d4f50e90d
-       //TODO: VRANGEPD $13, Z21, Z13, K7, Z13                    // 6233954f50ed0d
-       //TODO: VRANGEPD $13, Z9, Z13, K7, Z13                     // 6253954f50e90d
-       //TODO: VRANGEPD $14, Z23, Z27, K1, Z2                     // 62b3a54150d70e
-       //TODO: VRANGEPD $14, Z9, Z27, K1, Z2                      // 62d3a54150d10e
-       //TODO: VRANGEPD $14, (R14), Z27, K1, Z2                   // 62d3a54150160e
-       //TODO: VRANGEPD $14, -7(DI)(R8*8), Z27, K1, Z2            // 62b3a5415094c7f9ffffff0e
-       //TODO: VRANGEPD $14, Z23, Z25, K1, Z2                     // 62b3b54150d70e
-       //TODO: VRANGEPD $14, Z9, Z25, K1, Z2                      // 62d3b54150d10e
-       //TODO: VRANGEPD $14, (R14), Z25, K1, Z2                   // 62d3b54150160e
-       //TODO: VRANGEPD $14, -7(DI)(R8*8), Z25, K1, Z2            // 62b3b5415094c7f9ffffff0e
-       //TODO: VRANGEPD $14, Z23, Z27, K1, Z7                     // 62b3a54150ff0e
-       //TODO: VRANGEPD $14, Z9, Z27, K1, Z7                      // 62d3a54150f90e
-       //TODO: VRANGEPD $14, (R14), Z27, K1, Z7                   // 62d3a541503e0e
-       //TODO: VRANGEPD $14, -7(DI)(R8*8), Z27, K1, Z7            // 62b3a54150bcc7f9ffffff0e
-       //TODO: VRANGEPD $14, Z23, Z25, K1, Z7                     // 62b3b54150ff0e
-       //TODO: VRANGEPD $14, Z9, Z25, K1, Z7                      // 62d3b54150f90e
-       //TODO: VRANGEPD $14, (R14), Z25, K1, Z7                   // 62d3b541503e0e
-       //TODO: VRANGEPD $14, -7(DI)(R8*8), Z25, K1, Z7            // 62b3b54150bcc7f9ffffff0e
-       //TODO: VRANGEPS $15, X0, X20, K1, X11                     // 62735d0150d80f
-       //TODO: VRANGEPS $15, X9, X20, K1, X11                     // 62535d0150d90f
-       //TODO: VRANGEPS $15, X13, X20, K1, X11                    // 62535d0150dd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X20, K1, X11            // 62735d01509cbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X20, K1, X11           // 62335d01509c47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X5, K1, X11                      // 6273550950d80f
-       //TODO: VRANGEPS $15, X9, X5, K1, X11                      // 6253550950d90f
-       //TODO: VRANGEPS $15, X13, X5, K1, X11                     // 6253550950dd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X5, K1, X11             // 62735509509cbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X5, K1, X11            // 62335509509c47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X25, K1, X11                     // 6273350150d80f
-       //TODO: VRANGEPS $15, X9, X25, K1, X11                     // 6253350150d90f
-       //TODO: VRANGEPS $15, X13, X25, K1, X11                    // 6253350150dd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X25, K1, X11            // 62733501509cbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X25, K1, X11           // 62333501509c47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X20, K1, X23                     // 62e35d0150f80f
-       //TODO: VRANGEPS $15, X9, X20, K1, X23                     // 62c35d0150f90f
-       //TODO: VRANGEPS $15, X13, X20, K1, X23                    // 62c35d0150fd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X20, K1, X23            // 62e35d0150bcbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X20, K1, X23           // 62a35d0150bc47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X5, K1, X23                      // 62e3550950f80f
-       //TODO: VRANGEPS $15, X9, X5, K1, X23                      // 62c3550950f90f
-       //TODO: VRANGEPS $15, X13, X5, K1, X23                     // 62c3550950fd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X5, K1, X23             // 62e3550950bcbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X5, K1, X23            // 62a3550950bc47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X25, K1, X23                     // 62e3350150f80f
-       //TODO: VRANGEPS $15, X9, X25, K1, X23                     // 62c3350150f90f
-       //TODO: VRANGEPS $15, X13, X25, K1, X23                    // 62c3350150fd0f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X25, K1, X23            // 62e3350150bcbe070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X25, K1, X23           // 62a3350150bc47f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X20, K1, X2                      // 62f35d0150d00f
-       //TODO: VRANGEPS $15, X9, X20, K1, X2                      // 62d35d0150d10f
-       //TODO: VRANGEPS $15, X13, X20, K1, X2                     // 62d35d0150d50f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X20, K1, X2             // 62f35d015094be070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X20, K1, X2            // 62b35d01509447f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X5, K1, X2                       // 62f3550950d00f
-       //TODO: VRANGEPS $15, X9, X5, K1, X2                       // 62d3550950d10f
-       //TODO: VRANGEPS $15, X13, X5, K1, X2                      // 62d3550950d50f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X5, K1, X2              // 62f355095094be070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X5, K1, X2             // 62b35509509447f9ffffff0f
-       //TODO: VRANGEPS $15, X0, X25, K1, X2                      // 62f3350150d00f
-       //TODO: VRANGEPS $15, X9, X25, K1, X2                      // 62d3350150d10f
-       //TODO: VRANGEPS $15, X13, X25, K1, X2                     // 62d3350150d50f
-       //TODO: VRANGEPS $15, 7(SI)(DI*4), X25, K1, X2             // 62f335015094be070000000f
-       //TODO: VRANGEPS $15, -7(DI)(R8*2), X25, K1, X2            // 62b33501509447f9ffffff0f
-       //TODO: VRANGEPS $0, Y21, Y5, K1, Y19                      // 62a3552950dd00
-       //TODO: VRANGEPS $0, Y20, Y5, K1, Y19                      // 62a3552950dc00
-       //TODO: VRANGEPS $0, Y6, Y5, K1, Y19                       // 62e3552950de00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y19             // 62e35529509c2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y19             // 62e35529509cd1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y16, K1, Y19                     // 62a37d2150dd00
-       //TODO: VRANGEPS $0, Y20, Y16, K1, Y19                     // 62a37d2150dc00
-       //TODO: VRANGEPS $0, Y6, Y16, K1, Y19                      // 62e37d2150de00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y19            // 62e37d21509c2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y19            // 62e37d21509cd1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y2, K1, Y19                      // 62a36d2950dd00
-       //TODO: VRANGEPS $0, Y20, Y2, K1, Y19                      // 62a36d2950dc00
-       //TODO: VRANGEPS $0, Y6, Y2, K1, Y19                       // 62e36d2950de00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y19             // 62e36d29509c2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y19             // 62e36d29509cd1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y5, K1, Y14                      // 6233552950f500
-       //TODO: VRANGEPS $0, Y20, Y5, K1, Y14                      // 6233552950f400
-       //TODO: VRANGEPS $0, Y6, Y5, K1, Y14                       // 6273552950f600
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y14             // 6273552950b42c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y14             // 6273552950b4d1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y16, K1, Y14                     // 62337d2150f500
-       //TODO: VRANGEPS $0, Y20, Y16, K1, Y14                     // 62337d2150f400
-       //TODO: VRANGEPS $0, Y6, Y16, K1, Y14                      // 62737d2150f600
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y14            // 62737d2150b42c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y14            // 62737d2150b4d1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y2, K1, Y14                      // 62336d2950f500
-       //TODO: VRANGEPS $0, Y20, Y2, K1, Y14                      // 62336d2950f400
-       //TODO: VRANGEPS $0, Y6, Y2, K1, Y14                       // 62736d2950f600
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y14             // 62736d2950b42c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y14             // 62736d2950b4d1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y5, K1, Y21                      // 62a3552950ed00
-       //TODO: VRANGEPS $0, Y20, Y5, K1, Y21                      // 62a3552950ec00
-       //TODO: VRANGEPS $0, Y6, Y5, K1, Y21                       // 62e3552950ee00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y21             // 62e3552950ac2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y21             // 62e3552950acd1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y16, K1, Y21                     // 62a37d2150ed00
-       //TODO: VRANGEPS $0, Y20, Y16, K1, Y21                     // 62a37d2150ec00
-       //TODO: VRANGEPS $0, Y6, Y16, K1, Y21                      // 62e37d2150ee00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y21            // 62e37d2150ac2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y21            // 62e37d2150acd1f9ffffff00
-       //TODO: VRANGEPS $0, Y21, Y2, K1, Y21                      // 62a36d2950ed00
-       //TODO: VRANGEPS $0, Y20, Y2, K1, Y21                      // 62a36d2950ec00
-       //TODO: VRANGEPS $0, Y6, Y2, K1, Y21                       // 62e36d2950ee00
-       //TODO: VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y21             // 62e36d2950ac2c1100000000
-       //TODO: VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y21             // 62e36d2950acd1f9ffffff00
-       //TODO: VRANGEPS $1, Z14, Z3, K7, Z27                      // 6243654f50de01
-       //TODO: VRANGEPS $1, Z7, Z3, K7, Z27                       // 6263654f50df01
-       //TODO: VRANGEPS $1, Z14, Z0, K7, Z27                      // 62437d4f50de01
-       //TODO: VRANGEPS $1, Z7, Z0, K7, Z27                       // 62637d4f50df01
-       //TODO: VRANGEPS $1, Z14, Z3, K7, Z14                      // 6253654f50f601
-       //TODO: VRANGEPS $1, Z7, Z3, K7, Z14                       // 6273654f50f701
-       //TODO: VRANGEPS $1, Z14, Z0, K7, Z14                      // 62537d4f50f601
-       //TODO: VRANGEPS $1, Z7, Z0, K7, Z14                       // 62737d4f50f701
-       //TODO: VRANGEPS $2, Z1, Z22, K2, Z8                       // 62734d4250c102
-       //TODO: VRANGEPS $2, Z16, Z22, K2, Z8                      // 62334d4250c002
-       //TODO: VRANGEPS $2, 99(R15)(R15*4), Z22, K2, Z8           // 62134d425084bf6300000002
-       //TODO: VRANGEPS $2, 15(DX), Z22, K2, Z8                   // 62734d4250820f00000002
-       //TODO: VRANGEPS $2, Z1, Z25, K2, Z8                       // 6273354250c102
-       //TODO: VRANGEPS $2, Z16, Z25, K2, Z8                      // 6233354250c002
-       //TODO: VRANGEPS $2, 99(R15)(R15*4), Z25, K2, Z8           // 621335425084bf6300000002
-       //TODO: VRANGEPS $2, 15(DX), Z25, K2, Z8                   // 6273354250820f00000002
-       //TODO: VRANGEPS $2, Z1, Z22, K2, Z24                      // 62634d4250c102
-       //TODO: VRANGEPS $2, Z16, Z22, K2, Z24                     // 62234d4250c002
-       //TODO: VRANGEPS $2, 99(R15)(R15*4), Z22, K2, Z24          // 62034d425084bf6300000002
-       //TODO: VRANGEPS $2, 15(DX), Z22, K2, Z24                  // 62634d4250820f00000002
-       //TODO: VRANGEPS $2, Z1, Z25, K2, Z24                      // 6263354250c102
-       //TODO: VRANGEPS $2, Z16, Z25, K2, Z24                     // 6223354250c002
-       //TODO: VRANGEPS $2, 99(R15)(R15*4), Z25, K2, Z24          // 620335425084bf6300000002
-       //TODO: VRANGEPS $2, 15(DX), Z25, K2, Z24                  // 6263354250820f00000002
-       //TODO: VRANGESD $3, X22, X2, K4, X2                       // 62b3ed0c51d603
-       //TODO: VRANGESD $3, X5, X2, K4, X2                        // 62f3ed0c51d503
-       //TODO: VRANGESD $3, X14, X2, K4, X2                       // 62d3ed0c51d603
-       //TODO: VRANGESD $3, X22, X31, K4, X2                      // 62b3850451d603
-       //TODO: VRANGESD $3, X5, X31, K4, X2                       // 62f3850451d503
-       //TODO: VRANGESD $3, X14, X31, K4, X2                      // 62d3850451d603
-       //TODO: VRANGESD $3, X22, X11, K4, X2                      // 62b3a50c51d603
-       //TODO: VRANGESD $3, X5, X11, K4, X2                       // 62f3a50c51d503
-       //TODO: VRANGESD $3, X14, X11, K4, X2                      // 62d3a50c51d603
-       //TODO: VRANGESD $3, X22, X2, K4, X8                       // 6233ed0c51c603
-       //TODO: VRANGESD $3, X5, X2, K4, X8                        // 6273ed0c51c503
-       //TODO: VRANGESD $3, X14, X2, K4, X8                       // 6253ed0c51c603
-       //TODO: VRANGESD $3, X22, X31, K4, X8                      // 6233850451c603
-       //TODO: VRANGESD $3, X5, X31, K4, X8                       // 6273850451c503
-       //TODO: VRANGESD $3, X14, X31, K4, X8                      // 6253850451c603
-       //TODO: VRANGESD $3, X22, X11, K4, X8                      // 6233a50c51c603
-       //TODO: VRANGESD $3, X5, X11, K4, X8                       // 6273a50c51c503
-       //TODO: VRANGESD $3, X14, X11, K4, X8                      // 6253a50c51c603
-       //TODO: VRANGESD $3, X22, X2, K4, X9                       // 6233ed0c51ce03
-       //TODO: VRANGESD $3, X5, X2, K4, X9                        // 6273ed0c51cd03
-       //TODO: VRANGESD $3, X14, X2, K4, X9                       // 6253ed0c51ce03
-       //TODO: VRANGESD $3, X22, X31, K4, X9                      // 6233850451ce03
-       //TODO: VRANGESD $3, X5, X31, K4, X9                       // 6273850451cd03
-       //TODO: VRANGESD $3, X14, X31, K4, X9                      // 6253850451ce03
-       //TODO: VRANGESD $3, X22, X11, K4, X9                      // 6233a50c51ce03
-       //TODO: VRANGESD $3, X5, X11, K4, X9                       // 6273a50c51cd03
-       //TODO: VRANGESD $3, X14, X11, K4, X9                      // 6253a50c51ce03
-       //TODO: VRANGESD $4, X18, X15, K1, X0                      // 62b3850951c204 or 62b3852951c204 or 62b3854951c204
-       //TODO: VRANGESD $4, X8, X15, K1, X0                       // 62d3850951c004 or 62d3852951c004 or 62d3854951c004
-       //TODO: VRANGESD $4, X27, X15, K1, X0                      // 6293850951c304 or 6293852951c304 or 6293854951c304
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X15, K1, X0              // 62f385095184880700000004 or 62f385295184880700000004 or 62f385495184880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X15, K1, X0              // 62f385095184080700000004 or 62f385295184080700000004 or 62f385495184080700000004
-       //TODO: VRANGESD $4, X18, X11, K1, X0                      // 62b3a50951c204 or 62b3a52951c204 or 62b3a54951c204
-       //TODO: VRANGESD $4, X8, X11, K1, X0                       // 62d3a50951c004 or 62d3a52951c004 or 62d3a54951c004
-       //TODO: VRANGESD $4, X27, X11, K1, X0                      // 6293a50951c304 or 6293a52951c304 or 6293a54951c304
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X11, K1, X0              // 62f3a5095184880700000004 or 62f3a5295184880700000004 or 62f3a5495184880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X11, K1, X0              // 62f3a5095184080700000004 or 62f3a5295184080700000004 or 62f3a5495184080700000004
-       //TODO: VRANGESD $4, X18, X0, K1, X0                       // 62b3fd0951c204 or 62b3fd2951c204 or 62b3fd4951c204
-       //TODO: VRANGESD $4, X8, X0, K1, X0                        // 62d3fd0951c004 or 62d3fd2951c004 or 62d3fd4951c004
-       //TODO: VRANGESD $4, X27, X0, K1, X0                       // 6293fd0951c304 or 6293fd2951c304 or 6293fd4951c304
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X0, K1, X0               // 62f3fd095184880700000004 or 62f3fd295184880700000004 or 62f3fd495184880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X0, K1, X0               // 62f3fd095184080700000004 or 62f3fd295184080700000004 or 62f3fd495184080700000004
-       //TODO: VRANGESD $4, X18, X15, K1, X17                     // 62a3850951ca04 or 62a3852951ca04 or 62a3854951ca04
-       //TODO: VRANGESD $4, X8, X15, K1, X17                      // 62c3850951c804 or 62c3852951c804 or 62c3854951c804
-       //TODO: VRANGESD $4, X27, X15, K1, X17                     // 6283850951cb04 or 6283852951cb04 or 6283854951cb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X15, K1, X17             // 62e38509518c880700000004 or 62e38529518c880700000004 or 62e38549518c880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X15, K1, X17             // 62e38509518c080700000004 or 62e38529518c080700000004 or 62e38549518c080700000004
-       //TODO: VRANGESD $4, X18, X11, K1, X17                     // 62a3a50951ca04 or 62a3a52951ca04 or 62a3a54951ca04
-       //TODO: VRANGESD $4, X8, X11, K1, X17                      // 62c3a50951c804 or 62c3a52951c804 or 62c3a54951c804
-       //TODO: VRANGESD $4, X27, X11, K1, X17                     // 6283a50951cb04 or 6283a52951cb04 or 6283a54951cb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X11, K1, X17             // 62e3a509518c880700000004 or 62e3a529518c880700000004 or 62e3a549518c880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X11, K1, X17             // 62e3a509518c080700000004 or 62e3a529518c080700000004 or 62e3a549518c080700000004
-       //TODO: VRANGESD $4, X18, X0, K1, X17                      // 62a3fd0951ca04 or 62a3fd2951ca04 or 62a3fd4951ca04
-       //TODO: VRANGESD $4, X8, X0, K1, X17                       // 62c3fd0951c804 or 62c3fd2951c804 or 62c3fd4951c804
-       //TODO: VRANGESD $4, X27, X0, K1, X17                      // 6283fd0951cb04 or 6283fd2951cb04 or 6283fd4951cb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X0, K1, X17              // 62e3fd09518c880700000004 or 62e3fd29518c880700000004 or 62e3fd49518c880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X0, K1, X17              // 62e3fd09518c080700000004 or 62e3fd29518c080700000004 or 62e3fd49518c080700000004
-       //TODO: VRANGESD $4, X18, X15, K1, X7                      // 62b3850951fa04 or 62b3852951fa04 or 62b3854951fa04
-       //TODO: VRANGESD $4, X8, X15, K1, X7                       // 62d3850951f804 or 62d3852951f804 or 62d3854951f804
-       //TODO: VRANGESD $4, X27, X15, K1, X7                      // 6293850951fb04 or 6293852951fb04 or 6293854951fb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X15, K1, X7              // 62f3850951bc880700000004 or 62f3852951bc880700000004 or 62f3854951bc880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X15, K1, X7              // 62f3850951bc080700000004 or 62f3852951bc080700000004 or 62f3854951bc080700000004
-       //TODO: VRANGESD $4, X18, X11, K1, X7                      // 62b3a50951fa04 or 62b3a52951fa04 or 62b3a54951fa04
-       //TODO: VRANGESD $4, X8, X11, K1, X7                       // 62d3a50951f804 or 62d3a52951f804 or 62d3a54951f804
-       //TODO: VRANGESD $4, X27, X11, K1, X7                      // 6293a50951fb04 or 6293a52951fb04 or 6293a54951fb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X11, K1, X7              // 62f3a50951bc880700000004 or 62f3a52951bc880700000004 or 62f3a54951bc880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X11, K1, X7              // 62f3a50951bc080700000004 or 62f3a52951bc080700000004 or 62f3a54951bc080700000004
-       //TODO: VRANGESD $4, X18, X0, K1, X7                       // 62b3fd0951fa04 or 62b3fd2951fa04 or 62b3fd4951fa04
-       //TODO: VRANGESD $4, X8, X0, K1, X7                        // 62d3fd0951f804 or 62d3fd2951f804 or 62d3fd4951f804
-       //TODO: VRANGESD $4, X27, X0, K1, X7                       // 6293fd0951fb04 or 6293fd2951fb04 or 6293fd4951fb04
-       //TODO: VRANGESD $4, 7(AX)(CX*4), X0, K1, X7               // 62f3fd0951bc880700000004 or 62f3fd2951bc880700000004 or 62f3fd4951bc880700000004
-       //TODO: VRANGESD $4, 7(AX)(CX*1), X0, K1, X7               // 62f3fd0951bc080700000004 or 62f3fd2951bc080700000004 or 62f3fd4951bc080700000004
-       //TODO: VRANGESS $5, X7, X15, K3, X25                      // 6263050b51cf05
-       //TODO: VRANGESS $5, X13, X15, K3, X25                     // 6243050b51cd05
-       //TODO: VRANGESS $5, X8, X15, K3, X25                      // 6243050b51c805
-       //TODO: VRANGESS $5, X7, X28, K3, X25                      // 62631d0351cf05
-       //TODO: VRANGESS $5, X13, X28, K3, X25                     // 62431d0351cd05
-       //TODO: VRANGESS $5, X8, X28, K3, X25                      // 62431d0351c805
-       //TODO: VRANGESS $5, X7, X15, K3, X3                       // 62f3050b51df05
-       //TODO: VRANGESS $5, X13, X15, K3, X3                      // 62d3050b51dd05
-       //TODO: VRANGESS $5, X8, X15, K3, X3                       // 62d3050b51d805
-       //TODO: VRANGESS $5, X7, X28, K3, X3                       // 62f31d0351df05
-       //TODO: VRANGESS $5, X13, X28, K3, X3                      // 62d31d0351dd05
-       //TODO: VRANGESS $5, X8, X28, K3, X3                       // 62d31d0351d805
-       //TODO: VRANGESS $5, X7, X15, K3, X18                      // 62e3050b51d705
-       //TODO: VRANGESS $5, X13, X15, K3, X18                     // 62c3050b51d505
-       //TODO: VRANGESS $5, X8, X15, K3, X18                      // 62c3050b51d005
-       //TODO: VRANGESS $5, X7, X28, K3, X18                      // 62e31d0351d705
-       //TODO: VRANGESS $5, X13, X28, K3, X18                     // 62c31d0351d505
-       //TODO: VRANGESS $5, X8, X28, K3, X18                      // 62c31d0351d005
-       //TODO: VRANGESS $6, X6, X22, K4, X24                      // 62634d0451c606 or 62634d2451c606 or 62634d4451c606
-       //TODO: VRANGESS $6, X7, X22, K4, X24                      // 62634d0451c706 or 62634d2451c706 or 62634d4451c706
-       //TODO: VRANGESS $6, X8, X22, K4, X24                      // 62434d0451c006 or 62434d2451c006 or 62434d4451c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X22, K4, X24             // 62634d0451843e0700000006 or 62634d2451843e0700000006 or 62634d4451843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X22, K4, X24            // 62634d045184da0f00000006 or 62634d245184da0f00000006 or 62634d445184da0f00000006
-       //TODO: VRANGESS $6, X6, X1, K4, X24                       // 6263750c51c606 or 6263752c51c606 or 6263754c51c606
-       //TODO: VRANGESS $6, X7, X1, K4, X24                       // 6263750c51c706 or 6263752c51c706 or 6263754c51c706
-       //TODO: VRANGESS $6, X8, X1, K4, X24                       // 6243750c51c006 or 6243752c51c006 or 6243754c51c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X1, K4, X24              // 6263750c51843e0700000006 or 6263752c51843e0700000006 or 6263754c51843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X1, K4, X24             // 6263750c5184da0f00000006 or 6263752c5184da0f00000006 or 6263754c5184da0f00000006
-       //TODO: VRANGESS $6, X6, X11, K4, X24                      // 6263250c51c606 or 6263252c51c606 or 6263254c51c606
-       //TODO: VRANGESS $6, X7, X11, K4, X24                      // 6263250c51c706 or 6263252c51c706 or 6263254c51c706
-       //TODO: VRANGESS $6, X8, X11, K4, X24                      // 6243250c51c006 or 6243252c51c006 or 6243254c51c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X11, K4, X24             // 6263250c51843e0700000006 or 6263252c51843e0700000006 or 6263254c51843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X11, K4, X24            // 6263250c5184da0f00000006 or 6263252c5184da0f00000006 or 6263254c5184da0f00000006
-       //TODO: VRANGESS $6, X6, X22, K4, X7                       // 62f34d0451fe06 or 62f34d2451fe06 or 62f34d4451fe06
-       //TODO: VRANGESS $6, X7, X22, K4, X7                       // 62f34d0451ff06 or 62f34d2451ff06 or 62f34d4451ff06
-       //TODO: VRANGESS $6, X8, X22, K4, X7                       // 62d34d0451f806 or 62d34d2451f806 or 62d34d4451f806
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X22, K4, X7              // 62f34d0451bc3e0700000006 or 62f34d2451bc3e0700000006 or 62f34d4451bc3e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X22, K4, X7             // 62f34d0451bcda0f00000006 or 62f34d2451bcda0f00000006 or 62f34d4451bcda0f00000006
-       //TODO: VRANGESS $6, X6, X1, K4, X7                        // 62f3750c51fe06 or 62f3752c51fe06 or 62f3754c51fe06
-       //TODO: VRANGESS $6, X7, X1, K4, X7                        // 62f3750c51ff06 or 62f3752c51ff06 or 62f3754c51ff06
-       //TODO: VRANGESS $6, X8, X1, K4, X7                        // 62d3750c51f806 or 62d3752c51f806 or 62d3754c51f806
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X1, K4, X7               // 62f3750c51bc3e0700000006 or 62f3752c51bc3e0700000006 or 62f3754c51bc3e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X1, K4, X7              // 62f3750c51bcda0f00000006 or 62f3752c51bcda0f00000006 or 62f3754c51bcda0f00000006
-       //TODO: VRANGESS $6, X6, X11, K4, X7                       // 62f3250c51fe06 or 62f3252c51fe06 or 62f3254c51fe06
-       //TODO: VRANGESS $6, X7, X11, K4, X7                       // 62f3250c51ff06 or 62f3252c51ff06 or 62f3254c51ff06
-       //TODO: VRANGESS $6, X8, X11, K4, X7                       // 62d3250c51f806 or 62d3252c51f806 or 62d3254c51f806
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X11, K4, X7              // 62f3250c51bc3e0700000006 or 62f3252c51bc3e0700000006 or 62f3254c51bc3e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X11, K4, X7             // 62f3250c51bcda0f00000006 or 62f3252c51bcda0f00000006 or 62f3254c51bcda0f00000006
-       //TODO: VRANGESS $6, X6, X22, K4, X0                       // 62f34d0451c606 or 62f34d2451c606 or 62f34d4451c606
-       //TODO: VRANGESS $6, X7, X22, K4, X0                       // 62f34d0451c706 or 62f34d2451c706 or 62f34d4451c706
-       //TODO: VRANGESS $6, X8, X22, K4, X0                       // 62d34d0451c006 or 62d34d2451c006 or 62d34d4451c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X22, K4, X0              // 62f34d0451843e0700000006 or 62f34d2451843e0700000006 or 62f34d4451843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X22, K4, X0             // 62f34d045184da0f00000006 or 62f34d245184da0f00000006 or 62f34d445184da0f00000006
-       //TODO: VRANGESS $6, X6, X1, K4, X0                        // 62f3750c51c606 or 62f3752c51c606 or 62f3754c51c606
-       //TODO: VRANGESS $6, X7, X1, K4, X0                        // 62f3750c51c706 or 62f3752c51c706 or 62f3754c51c706
-       //TODO: VRANGESS $6, X8, X1, K4, X0                        // 62d3750c51c006 or 62d3752c51c006 or 62d3754c51c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X1, K4, X0               // 62f3750c51843e0700000006 or 62f3752c51843e0700000006 or 62f3754c51843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X1, K4, X0              // 62f3750c5184da0f00000006 or 62f3752c5184da0f00000006 or 62f3754c5184da0f00000006
-       //TODO: VRANGESS $6, X6, X11, K4, X0                       // 62f3250c51c606 or 62f3252c51c606 or 62f3254c51c606
-       //TODO: VRANGESS $6, X7, X11, K4, X0                       // 62f3250c51c706 or 62f3252c51c706 or 62f3254c51c706
-       //TODO: VRANGESS $6, X8, X11, K4, X0                       // 62d3250c51c006 or 62d3252c51c006 or 62d3254c51c006
-       //TODO: VRANGESS $6, 7(SI)(DI*1), X11, K4, X0              // 62f3250c51843e0700000006 or 62f3252c51843e0700000006 or 62f3254c51843e0700000006
-       //TODO: VRANGESS $6, 15(DX)(BX*8), X11, K4, X0             // 62f3250c5184da0f00000006 or 62f3252c5184da0f00000006 or 62f3254c5184da0f00000006
-       //TODO: VREDUCEPD $126, X8, K3, X31                        // 6243fd0b56f87e
-       //TODO: VREDUCEPD $126, X1, K3, X31                        // 6263fd0b56f97e
-       //TODO: VREDUCEPD $126, X0, K3, X31                        // 6263fd0b56f87e
-       //TODO: VREDUCEPD $126, 99(R15)(R15*1), K3, X31            // 6203fd0b56bc3f630000007e
-       //TODO: VREDUCEPD $126, (DX), K3, X31                      // 6263fd0b563a7e
-       //TODO: VREDUCEPD $126, X8, K3, X16                        // 62c3fd0b56c07e
-       //TODO: VREDUCEPD $126, X1, K3, X16                        // 62e3fd0b56c17e
-       //TODO: VREDUCEPD $126, X0, K3, X16                        // 62e3fd0b56c07e
-       //TODO: VREDUCEPD $126, 99(R15)(R15*1), K3, X16            // 6283fd0b56843f630000007e
-       //TODO: VREDUCEPD $126, (DX), K3, X16                      // 62e3fd0b56027e
-       //TODO: VREDUCEPD $126, X8, K3, X7                         // 62d3fd0b56f87e
-       //TODO: VREDUCEPD $126, X1, K3, X7                         // 62f3fd0b56f97e
-       //TODO: VREDUCEPD $126, X0, K3, X7                         // 62f3fd0b56f87e
-       //TODO: VREDUCEPD $126, 99(R15)(R15*1), K3, X7             // 6293fd0b56bc3f630000007e
-       //TODO: VREDUCEPD $126, (DX), K3, X7                       // 62f3fd0b563a7e
-       //TODO: VREDUCEPD $94, Y0, K3, Y5                          // 62f3fd2b56e85e
-       //TODO: VREDUCEPD $94, Y22, K3, Y5                         // 62b3fd2b56ee5e
-       //TODO: VREDUCEPD $94, Y13, K3, Y5                         // 62d3fd2b56ed5e
-       //TODO: VREDUCEPD $94, (R14), K3, Y5                       // 62d3fd2b562e5e
-       //TODO: VREDUCEPD $94, -7(DI)(R8*8), K3, Y5                // 62b3fd2b56acc7f9ffffff5e
-       //TODO: VREDUCEPD $94, Y0, K3, Y28                         // 6263fd2b56e05e
-       //TODO: VREDUCEPD $94, Y22, K3, Y28                        // 6223fd2b56e65e
-       //TODO: VREDUCEPD $94, Y13, K3, Y28                        // 6243fd2b56e55e
-       //TODO: VREDUCEPD $94, (R14), K3, Y28                      // 6243fd2b56265e
-       //TODO: VREDUCEPD $94, -7(DI)(R8*8), K3, Y28               // 6223fd2b56a4c7f9ffffff5e
-       //TODO: VREDUCEPD $94, Y0, K3, Y7                          // 62f3fd2b56f85e
-       //TODO: VREDUCEPD $94, Y22, K3, Y7                         // 62b3fd2b56fe5e
-       //TODO: VREDUCEPD $94, Y13, K3, Y7                         // 62d3fd2b56fd5e
-       //TODO: VREDUCEPD $94, (R14), K3, Y7                       // 62d3fd2b563e5e
-       //TODO: VREDUCEPD $94, -7(DI)(R8*8), K3, Y7                // 62b3fd2b56bcc7f9ffffff5e
-       //TODO: VREDUCEPD $121, Z3, K2, Z26                        // 6263fd4a56d379
-       //TODO: VREDUCEPD $121, Z0, K2, Z26                        // 6263fd4a56d079
-       //TODO: VREDUCEPD $121, Z3, K2, Z3                         // 62f3fd4a56db79
-       //TODO: VREDUCEPD $121, Z0, K2, Z3                         // 62f3fd4a56d879
-       //TODO: VREDUCEPD $13, Z11, K1, Z21                        // 62c3fd4956eb0d
-       //TODO: VREDUCEPD $13, Z25, K1, Z21                        // 6283fd4956e90d
-       //TODO: VREDUCEPD $13, -17(BP), K1, Z21                    // 62e3fd4956adefffffff0d
-       //TODO: VREDUCEPD $13, -15(R14)(R15*8), K1, Z21            // 6283fd4956acfef1ffffff0d
-       //TODO: VREDUCEPD $13, Z11, K1, Z13                        // 6253fd4956eb0d
-       //TODO: VREDUCEPD $13, Z25, K1, Z13                        // 6213fd4956e90d
-       //TODO: VREDUCEPD $13, -17(BP), K1, Z13                    // 6273fd4956adefffffff0d
-       //TODO: VREDUCEPD $13, -15(R14)(R15*8), K1, Z13            // 6213fd4956acfef1ffffff0d
-       //TODO: VREDUCEPS $65, X21, K2, X15                        // 62337d0a56fd41
-       //TODO: VREDUCEPS $65, X0, K2, X15                         // 62737d0a56f841
-       //TODO: VREDUCEPS $65, X28, K2, X15                        // 62137d0a56fc41
-       //TODO: VREDUCEPS $65, -17(BP)(SI*8), K2, X15              // 62737d0a56bcf5efffffff41
-       //TODO: VREDUCEPS $65, (R15), K2, X15                      // 62537d0a563f41
-       //TODO: VREDUCEPS $65, X21, K2, X0                         // 62b37d0a56c541
-       //TODO: VREDUCEPS $65, X0, K2, X0                          // 62f37d0a56c041
-       //TODO: VREDUCEPS $65, X28, K2, X0                         // 62937d0a56c441
-       //TODO: VREDUCEPS $65, -17(BP)(SI*8), K2, X0               // 62f37d0a5684f5efffffff41
-       //TODO: VREDUCEPS $65, (R15), K2, X0                       // 62d37d0a560741
-       //TODO: VREDUCEPS $65, X21, K2, X16                        // 62a37d0a56c541
-       //TODO: VREDUCEPS $65, X0, K2, X16                         // 62e37d0a56c041
-       //TODO: VREDUCEPS $65, X28, K2, X16                        // 62837d0a56c441
-       //TODO: VREDUCEPS $65, -17(BP)(SI*8), K2, X16              // 62e37d0a5684f5efffffff41
-       //TODO: VREDUCEPS $65, (R15), K2, X16                      // 62c37d0a560741
-       //TODO: VREDUCEPS $67, Y17, K1, Y12                        // 62337d2956e143
-       //TODO: VREDUCEPS $67, Y7, K1, Y12                         // 62737d2956e743
-       //TODO: VREDUCEPS $67, Y9, K1, Y12                         // 62537d2956e143
-       //TODO: VREDUCEPS $67, 99(R15)(R15*4), K1, Y12             // 62137d2956a4bf6300000043
-       //TODO: VREDUCEPS $67, 15(DX), K1, Y12                     // 62737d2956a20f00000043
-       //TODO: VREDUCEPS $67, Y17, K1, Y1                         // 62b37d2956c943
-       //TODO: VREDUCEPS $67, Y7, K1, Y1                          // 62f37d2956cf43
-       //TODO: VREDUCEPS $67, Y9, K1, Y1                          // 62d37d2956c943
-       //TODO: VREDUCEPS $67, 99(R15)(R15*4), K1, Y1              // 62937d29568cbf6300000043
-       //TODO: VREDUCEPS $67, 15(DX), K1, Y1                      // 62f37d29568a0f00000043
-       //TODO: VREDUCEPS $67, Y17, K1, Y14                        // 62337d2956f143
-       //TODO: VREDUCEPS $67, Y7, K1, Y14                         // 62737d2956f743
-       //TODO: VREDUCEPS $67, Y9, K1, Y14                         // 62537d2956f143
-       //TODO: VREDUCEPS $67, 99(R15)(R15*4), K1, Y14             // 62137d2956b4bf6300000043
-       //TODO: VREDUCEPS $67, 15(DX), K1, Y14                     // 62737d2956b20f00000043
-       //TODO: VREDUCEPS $127, Z27, K7, Z3                        // 62937d4f56db7f
-       //TODO: VREDUCEPS $127, Z15, K7, Z3                        // 62d37d4f56df7f
-       //TODO: VREDUCEPS $127, Z27, K7, Z12                       // 62137d4f56e37f
-       //TODO: VREDUCEPS $127, Z15, K7, Z12                       // 62537d4f56e77f
-       //TODO: VREDUCEPS $0, Z23, K1, Z23                         // 62a37d4956ff00
-       //TODO: VREDUCEPS $0, Z6, K1, Z23                          // 62e37d4956fe00
-       //TODO: VREDUCEPS $0, 17(SP)(BP*2), K1, Z23                // 62e37d4956bc6c1100000000
-       //TODO: VREDUCEPS $0, -7(DI)(R8*4), K1, Z23                // 62a37d4956bc87f9ffffff00
-       //TODO: VREDUCEPS $0, Z23, K1, Z5                          // 62b37d4956ef00
-       //TODO: VREDUCEPS $0, Z6, K1, Z5                           // 62f37d4956ee00
-       //TODO: VREDUCEPS $0, 17(SP)(BP*2), K1, Z5                 // 62f37d4956ac6c1100000000
-       //TODO: VREDUCEPS $0, -7(DI)(R8*4), K1, Z5                 // 62b37d4956ac87f9ffffff00
-       //TODO: VREDUCESD $97, X1, X7, K1, X22                     // 62e3c50957f161
-       //TODO: VREDUCESD $97, X7, X7, K1, X22                     // 62e3c50957f761
-       //TODO: VREDUCESD $97, X9, X7, K1, X22                     // 62c3c50957f161
-       //TODO: VREDUCESD $97, X1, X16, K1, X22                    // 62e3fd0157f161
-       //TODO: VREDUCESD $97, X7, X16, K1, X22                    // 62e3fd0157f761
-       //TODO: VREDUCESD $97, X9, X16, K1, X22                    // 62c3fd0157f161
-       //TODO: VREDUCESD $97, X1, X31, K1, X22                    // 62e3850157f161
-       //TODO: VREDUCESD $97, X7, X31, K1, X22                    // 62e3850157f761
-       //TODO: VREDUCESD $97, X9, X31, K1, X22                    // 62c3850157f161
-       //TODO: VREDUCESD $97, X1, X7, K1, X7                      // 62f3c50957f961
-       //TODO: VREDUCESD $97, X7, X7, K1, X7                      // 62f3c50957ff61
-       //TODO: VREDUCESD $97, X9, X7, K1, X7                      // 62d3c50957f961
-       //TODO: VREDUCESD $97, X1, X16, K1, X7                     // 62f3fd0157f961
-       //TODO: VREDUCESD $97, X7, X16, K1, X7                     // 62f3fd0157ff61
-       //TODO: VREDUCESD $97, X9, X16, K1, X7                     // 62d3fd0157f961
-       //TODO: VREDUCESD $97, X1, X31, K1, X7                     // 62f3850157f961
-       //TODO: VREDUCESD $97, X7, X31, K1, X7                     // 62f3850157ff61
-       //TODO: VREDUCESD $97, X9, X31, K1, X7                     // 62d3850157f961
-       //TODO: VREDUCESD $97, X1, X7, K1, X19                     // 62e3c50957d961
-       //TODO: VREDUCESD $97, X7, X7, K1, X19                     // 62e3c50957df61
-       //TODO: VREDUCESD $97, X9, X7, K1, X19                     // 62c3c50957d961
-       //TODO: VREDUCESD $97, X1, X16, K1, X19                    // 62e3fd0157d961
-       //TODO: VREDUCESD $97, X7, X16, K1, X19                    // 62e3fd0157df61
-       //TODO: VREDUCESD $97, X9, X16, K1, X19                    // 62c3fd0157d961
-       //TODO: VREDUCESD $97, X1, X31, K1, X19                    // 62e3850157d961
-       //TODO: VREDUCESD $97, X7, X31, K1, X19                    // 62e3850157df61
-       //TODO: VREDUCESD $97, X9, X31, K1, X19                    // 62c3850157d961
-       //TODO: VREDUCESD $81, X17, X12, K1, X15                   // 62339d0957f951 or 62339d2957f951 or 62339d4957f951
-       //TODO: VREDUCESD $81, X15, X12, K1, X15                   // 62539d0957ff51 or 62539d2957ff51 or 62539d4957ff51
-       //TODO: VREDUCESD $81, X8, X12, K1, X15                    // 62539d0957f851 or 62539d2957f851 or 62539d4957f851
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X12, K1, X15           // 62739d0957bcbe0700000051 or 62739d2957bcbe0700000051 or 62739d4957bcbe0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X12, K1, X15          // 62339d0957bc47f9ffffff51 or 62339d2957bc47f9ffffff51 or 62339d4957bc47f9ffffff51
-       //TODO: VREDUCESD $81, X17, X14, K1, X15                   // 62338d0957f951 or 62338d2957f951 or 62338d4957f951
-       //TODO: VREDUCESD $81, X15, X14, K1, X15                   // 62538d0957ff51 or 62538d2957ff51 or 62538d4957ff51
-       //TODO: VREDUCESD $81, X8, X14, K1, X15                    // 62538d0957f851 or 62538d2957f851 or 62538d4957f851
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X14, K1, X15           // 62738d0957bcbe0700000051 or 62738d2957bcbe0700000051 or 62738d4957bcbe0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X14, K1, X15          // 62338d0957bc47f9ffffff51 or 62338d2957bc47f9ffffff51 or 62338d4957bc47f9ffffff51
-       //TODO: VREDUCESD $81, X17, X5, K1, X15                    // 6233d50957f951 or 6233d52957f951 or 6233d54957f951
-       //TODO: VREDUCESD $81, X15, X5, K1, X15                    // 6253d50957ff51 or 6253d52957ff51 or 6253d54957ff51
-       //TODO: VREDUCESD $81, X8, X5, K1, X15                     // 6253d50957f851 or 6253d52957f851 or 6253d54957f851
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X5, K1, X15            // 6273d50957bcbe0700000051 or 6273d52957bcbe0700000051 or 6273d54957bcbe0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X5, K1, X15           // 6233d50957bc47f9ffffff51 or 6233d52957bc47f9ffffff51 or 6233d54957bc47f9ffffff51
-       //TODO: VREDUCESD $81, X17, X12, K1, X12                   // 62339d0957e151 or 62339d2957e151 or 62339d4957e151
-       //TODO: VREDUCESD $81, X15, X12, K1, X12                   // 62539d0957e751 or 62539d2957e751 or 62539d4957e751
-       //TODO: VREDUCESD $81, X8, X12, K1, X12                    // 62539d0957e051 or 62539d2957e051 or 62539d4957e051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X12, K1, X12           // 62739d0957a4be0700000051 or 62739d2957a4be0700000051 or 62739d4957a4be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X12, K1, X12          // 62339d0957a447f9ffffff51 or 62339d2957a447f9ffffff51 or 62339d4957a447f9ffffff51
-       //TODO: VREDUCESD $81, X17, X14, K1, X12                   // 62338d0957e151 or 62338d2957e151 or 62338d4957e151
-       //TODO: VREDUCESD $81, X15, X14, K1, X12                   // 62538d0957e751 or 62538d2957e751 or 62538d4957e751
-       //TODO: VREDUCESD $81, X8, X14, K1, X12                    // 62538d0957e051 or 62538d2957e051 or 62538d4957e051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X14, K1, X12           // 62738d0957a4be0700000051 or 62738d2957a4be0700000051 or 62738d4957a4be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X14, K1, X12          // 62338d0957a447f9ffffff51 or 62338d2957a447f9ffffff51 or 62338d4957a447f9ffffff51
-       //TODO: VREDUCESD $81, X17, X5, K1, X12                    // 6233d50957e151 or 6233d52957e151 or 6233d54957e151
-       //TODO: VREDUCESD $81, X15, X5, K1, X12                    // 6253d50957e751 or 6253d52957e751 or 6253d54957e751
-       //TODO: VREDUCESD $81, X8, X5, K1, X12                     // 6253d50957e051 or 6253d52957e051 or 6253d54957e051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X5, K1, X12            // 6273d50957a4be0700000051 or 6273d52957a4be0700000051 or 6273d54957a4be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X5, K1, X12           // 6233d50957a447f9ffffff51 or 6233d52957a447f9ffffff51 or 6233d54957a447f9ffffff51
-       //TODO: VREDUCESD $81, X17, X12, K1, X0                    // 62b39d0957c151 or 62b39d2957c151 or 62b39d4957c151
-       //TODO: VREDUCESD $81, X15, X12, K1, X0                    // 62d39d0957c751 or 62d39d2957c751 or 62d39d4957c751
-       //TODO: VREDUCESD $81, X8, X12, K1, X0                     // 62d39d0957c051 or 62d39d2957c051 or 62d39d4957c051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X12, K1, X0            // 62f39d095784be0700000051 or 62f39d295784be0700000051 or 62f39d495784be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X12, K1, X0           // 62b39d09578447f9ffffff51 or 62b39d29578447f9ffffff51 or 62b39d49578447f9ffffff51
-       //TODO: VREDUCESD $81, X17, X14, K1, X0                    // 62b38d0957c151 or 62b38d2957c151 or 62b38d4957c151
-       //TODO: VREDUCESD $81, X15, X14, K1, X0                    // 62d38d0957c751 or 62d38d2957c751 or 62d38d4957c751
-       //TODO: VREDUCESD $81, X8, X14, K1, X0                     // 62d38d0957c051 or 62d38d2957c051 or 62d38d4957c051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X14, K1, X0            // 62f38d095784be0700000051 or 62f38d295784be0700000051 or 62f38d495784be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X14, K1, X0           // 62b38d09578447f9ffffff51 or 62b38d29578447f9ffffff51 or 62b38d49578447f9ffffff51
-       //TODO: VREDUCESD $81, X17, X5, K1, X0                     // 62b3d50957c151 or 62b3d52957c151 or 62b3d54957c151
-       //TODO: VREDUCESD $81, X15, X5, K1, X0                     // 62d3d50957c751 or 62d3d52957c751 or 62d3d54957c751
-       //TODO: VREDUCESD $81, X8, X5, K1, X0                      // 62d3d50957c051 or 62d3d52957c051 or 62d3d54957c051
-       //TODO: VREDUCESD $81, 7(SI)(DI*4), X5, K1, X0             // 62f3d5095784be0700000051 or 62f3d5295784be0700000051 or 62f3d5495784be0700000051
-       //TODO: VREDUCESD $81, -7(DI)(R8*2), X5, K1, X0            // 62b3d509578447f9ffffff51 or 62b3d529578447f9ffffff51 or 62b3d549578447f9ffffff51
-       //TODO: VREDUCESS $42, X9, X13, K7, X3                     // 62d3150f57d92a
-       //TODO: VREDUCESS $42, X15, X13, K7, X3                    // 62d3150f57df2a
-       //TODO: VREDUCESS $42, X26, X13, K7, X3                    // 6293150f57da2a
-       //TODO: VREDUCESS $42, X9, X28, K7, X3                     // 62d31d0757d92a
-       //TODO: VREDUCESS $42, X15, X28, K7, X3                    // 62d31d0757df2a
-       //TODO: VREDUCESS $42, X26, X28, K7, X3                    // 62931d0757da2a
-       //TODO: VREDUCESS $42, X9, X24, K7, X3                     // 62d33d0757d92a
-       //TODO: VREDUCESS $42, X15, X24, K7, X3                    // 62d33d0757df2a
-       //TODO: VREDUCESS $42, X26, X24, K7, X3                    // 62933d0757da2a
-       //TODO: VREDUCESS $42, X9, X13, K7, X26                    // 6243150f57d12a
-       //TODO: VREDUCESS $42, X15, X13, K7, X26                   // 6243150f57d72a
-       //TODO: VREDUCESS $42, X26, X13, K7, X26                   // 6203150f57d22a
-       //TODO: VREDUCESS $42, X9, X28, K7, X26                    // 62431d0757d12a
-       //TODO: VREDUCESS $42, X15, X28, K7, X26                   // 62431d0757d72a
-       //TODO: VREDUCESS $42, X26, X28, K7, X26                   // 62031d0757d22a
-       //TODO: VREDUCESS $42, X9, X24, K7, X26                    // 62433d0757d12a
-       //TODO: VREDUCESS $42, X15, X24, K7, X26                   // 62433d0757d72a
-       //TODO: VREDUCESS $42, X26, X24, K7, X26                   // 62033d0757d22a
-       //TODO: VREDUCESS $42, X9, X13, K7, X23                    // 62c3150f57f92a
-       //TODO: VREDUCESS $42, X15, X13, K7, X23                   // 62c3150f57ff2a
-       //TODO: VREDUCESS $42, X26, X13, K7, X23                   // 6283150f57fa2a
-       //TODO: VREDUCESS $42, X9, X28, K7, X23                    // 62c31d0757f92a
-       //TODO: VREDUCESS $42, X15, X28, K7, X23                   // 62c31d0757ff2a
-       //TODO: VREDUCESS $42, X26, X28, K7, X23                   // 62831d0757fa2a
-       //TODO: VREDUCESS $42, X9, X24, K7, X23                    // 62c33d0757f92a
-       //TODO: VREDUCESS $42, X15, X24, K7, X23                   // 62c33d0757ff2a
-       //TODO: VREDUCESS $42, X26, X24, K7, X23                   // 62833d0757fa2a
-       //TODO: VREDUCESS $79, X7, X11, K2, X18                    // 62e3250a57d74f or 62e3252a57d74f or 62e3254a57d74f
-       //TODO: VREDUCESS $79, X0, X11, K2, X18                    // 62e3250a57d04f or 62e3252a57d04f or 62e3254a57d04f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X11, K2, X18        // 6283250a5794ff630000004f or 6283252a5794ff630000004f or 6283254a5794ff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X11, K2, X18           // 62e3250a5794c8070000004f or 62e3252a5794c8070000004f or 62e3254a5794c8070000004f
-       //TODO: VREDUCESS $79, X7, X31, K2, X18                    // 62e3050257d74f or 62e3052257d74f or 62e3054257d74f
-       //TODO: VREDUCESS $79, X0, X31, K2, X18                    // 62e3050257d04f or 62e3052257d04f or 62e3054257d04f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X31, K2, X18        // 628305025794ff630000004f or 628305225794ff630000004f or 628305425794ff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X31, K2, X18           // 62e305025794c8070000004f or 62e305225794c8070000004f or 62e305425794c8070000004f
-       //TODO: VREDUCESS $79, X7, X3, K2, X18                     // 62e3650a57d74f or 62e3652a57d74f or 62e3654a57d74f
-       //TODO: VREDUCESS $79, X0, X3, K2, X18                     // 62e3650a57d04f or 62e3652a57d04f or 62e3654a57d04f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X3, K2, X18         // 6283650a5794ff630000004f or 6283652a5794ff630000004f or 6283654a5794ff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X3, K2, X18            // 62e3650a5794c8070000004f or 62e3652a5794c8070000004f or 62e3654a5794c8070000004f
-       //TODO: VREDUCESS $79, X7, X11, K2, X21                    // 62e3250a57ef4f or 62e3252a57ef4f or 62e3254a57ef4f
-       //TODO: VREDUCESS $79, X0, X11, K2, X21                    // 62e3250a57e84f or 62e3252a57e84f or 62e3254a57e84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X11, K2, X21        // 6283250a57acff630000004f or 6283252a57acff630000004f or 6283254a57acff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X11, K2, X21           // 62e3250a57acc8070000004f or 62e3252a57acc8070000004f or 62e3254a57acc8070000004f
-       //TODO: VREDUCESS $79, X7, X31, K2, X21                    // 62e3050257ef4f or 62e3052257ef4f or 62e3054257ef4f
-       //TODO: VREDUCESS $79, X0, X31, K2, X21                    // 62e3050257e84f or 62e3052257e84f or 62e3054257e84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X31, K2, X21        // 6283050257acff630000004f or 6283052257acff630000004f or 6283054257acff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X31, K2, X21           // 62e3050257acc8070000004f or 62e3052257acc8070000004f or 62e3054257acc8070000004f
-       //TODO: VREDUCESS $79, X7, X3, K2, X21                     // 62e3650a57ef4f or 62e3652a57ef4f or 62e3654a57ef4f
-       //TODO: VREDUCESS $79, X0, X3, K2, X21                     // 62e3650a57e84f or 62e3652a57e84f or 62e3654a57e84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X3, K2, X21         // 6283650a57acff630000004f or 6283652a57acff630000004f or 6283654a57acff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X3, K2, X21            // 62e3650a57acc8070000004f or 62e3652a57acc8070000004f or 62e3654a57acc8070000004f
-       //TODO: VREDUCESS $79, X7, X11, K2, X1                     // 62f3250a57cf4f or 62f3252a57cf4f or 62f3254a57cf4f
-       //TODO: VREDUCESS $79, X0, X11, K2, X1                     // 62f3250a57c84f or 62f3252a57c84f or 62f3254a57c84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X11, K2, X1         // 6293250a578cff630000004f or 6293252a578cff630000004f or 6293254a578cff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X11, K2, X1            // 62f3250a578cc8070000004f or 62f3252a578cc8070000004f or 62f3254a578cc8070000004f
-       //TODO: VREDUCESS $79, X7, X31, K2, X1                     // 62f3050257cf4f or 62f3052257cf4f or 62f3054257cf4f
-       //TODO: VREDUCESS $79, X0, X31, K2, X1                     // 62f3050257c84f or 62f3052257c84f or 62f3054257c84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X31, K2, X1         // 62930502578cff630000004f or 62930522578cff630000004f or 62930542578cff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X31, K2, X1            // 62f30502578cc8070000004f or 62f30522578cc8070000004f or 62f30542578cc8070000004f
-       //TODO: VREDUCESS $79, X7, X3, K2, X1                      // 62f3650a57cf4f or 62f3652a57cf4f or 62f3654a57cf4f
-       //TODO: VREDUCESS $79, X0, X3, K2, X1                      // 62f3650a57c84f or 62f3652a57c84f or 62f3654a57c84f
-       //TODO: VREDUCESS $79, 99(R15)(R15*8), X3, K2, X1          // 6293650a578cff630000004f or 6293652a578cff630000004f or 6293654a578cff630000004f
-       //TODO: VREDUCESS $79, 7(AX)(CX*8), X3, K2, X1             // 62f3650a578cc8070000004f or 62f3652a578cc8070000004f or 62f3654a578cc8070000004f
-       //TODO: VXORPD X13, X3, K5, X17                            // 62c1e50d57cd
-       //TODO: VXORPD X28, X3, K5, X17                            // 6281e50d57cc
-       //TODO: VXORPD X24, X3, K5, X17                            // 6281e50d57c8
-       //TODO: VXORPD -7(CX)(DX*1), X3, K5, X17                   // 62e1e50d578c11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X3, K5, X17                // 6281e50d578cbef1ffffff
-       //TODO: VXORPD X13, X26, K5, X17                           // 62c1ad0557cd
-       //TODO: VXORPD X28, X26, K5, X17                           // 6281ad0557cc
-       //TODO: VXORPD X24, X26, K5, X17                           // 6281ad0557c8
-       //TODO: VXORPD -7(CX)(DX*1), X26, K5, X17                  // 62e1ad05578c11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X26, K5, X17               // 6281ad05578cbef1ffffff
-       //TODO: VXORPD X13, X23, K5, X17                           // 62c1c50557cd
-       //TODO: VXORPD X28, X23, K5, X17                           // 6281c50557cc
-       //TODO: VXORPD X24, X23, K5, X17                           // 6281c50557c8
-       //TODO: VXORPD -7(CX)(DX*1), X23, K5, X17                  // 62e1c505578c11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X23, K5, X17               // 6281c505578cbef1ffffff
-       //TODO: VXORPD X13, X3, K5, X15                            // 6251e50d57fd
-       //TODO: VXORPD X28, X3, K5, X15                            // 6211e50d57fc
-       //TODO: VXORPD X24, X3, K5, X15                            // 6211e50d57f8
-       //TODO: VXORPD -7(CX)(DX*1), X3, K5, X15                   // 6271e50d57bc11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X3, K5, X15                // 6211e50d57bcbef1ffffff
-       //TODO: VXORPD X13, X26, K5, X15                           // 6251ad0557fd
-       //TODO: VXORPD X28, X26, K5, X15                           // 6211ad0557fc
-       //TODO: VXORPD X24, X26, K5, X15                           // 6211ad0557f8
-       //TODO: VXORPD -7(CX)(DX*1), X26, K5, X15                  // 6271ad0557bc11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X26, K5, X15               // 6211ad0557bcbef1ffffff
-       //TODO: VXORPD X13, X23, K5, X15                           // 6251c50557fd
-       //TODO: VXORPD X28, X23, K5, X15                           // 6211c50557fc
-       //TODO: VXORPD X24, X23, K5, X15                           // 6211c50557f8
-       //TODO: VXORPD -7(CX)(DX*1), X23, K5, X15                  // 6271c50557bc11f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X23, K5, X15               // 6211c50557bcbef1ffffff
-       //TODO: VXORPD X13, X3, K5, X8                             // 6251e50d57c5
-       //TODO: VXORPD X28, X3, K5, X8                             // 6211e50d57c4
-       //TODO: VXORPD X24, X3, K5, X8                             // 6211e50d57c0
-       //TODO: VXORPD -7(CX)(DX*1), X3, K5, X8                    // 6271e50d578411f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X3, K5, X8                 // 6211e50d5784bef1ffffff
-       //TODO: VXORPD X13, X26, K5, X8                            // 6251ad0557c5
-       //TODO: VXORPD X28, X26, K5, X8                            // 6211ad0557c4
-       //TODO: VXORPD X24, X26, K5, X8                            // 6211ad0557c0
-       //TODO: VXORPD -7(CX)(DX*1), X26, K5, X8                   // 6271ad05578411f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X26, K5, X8                // 6211ad055784bef1ffffff
-       //TODO: VXORPD X13, X23, K5, X8                            // 6251c50557c5
-       //TODO: VXORPD X28, X23, K5, X8                            // 6211c50557c4
-       //TODO: VXORPD X24, X23, K5, X8                            // 6211c50557c0
-       //TODO: VXORPD -7(CX)(DX*1), X23, K5, X8                   // 6271c505578411f9ffffff
-       //TODO: VXORPD -15(R14)(R15*4), X23, K5, X8                // 6211c5055784bef1ffffff
-       //TODO: VXORPD Y5, Y20, K3, Y0                             // 62f1dd2357c5
-       //TODO: VXORPD Y28, Y20, K3, Y0                            // 6291dd2357c4
-       //TODO: VXORPD Y7, Y20, K3, Y0                             // 62f1dd2357c7
-       //TODO: VXORPD -7(CX), Y20, K3, Y0                         // 62f1dd235781f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y20, K3, Y0                   // 62f1dd2357849a0f000000
-       //TODO: VXORPD Y5, Y12, K3, Y0                             // 62f19d2b57c5
-       //TODO: VXORPD Y28, Y12, K3, Y0                            // 62919d2b57c4
-       //TODO: VXORPD Y7, Y12, K3, Y0                             // 62f19d2b57c7
-       //TODO: VXORPD -7(CX), Y12, K3, Y0                         // 62f19d2b5781f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y12, K3, Y0                   // 62f19d2b57849a0f000000
-       //TODO: VXORPD Y5, Y3, K3, Y0                              // 62f1e52b57c5
-       //TODO: VXORPD Y28, Y3, K3, Y0                             // 6291e52b57c4
-       //TODO: VXORPD Y7, Y3, K3, Y0                              // 62f1e52b57c7
-       //TODO: VXORPD -7(CX), Y3, K3, Y0                          // 62f1e52b5781f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y3, K3, Y0                    // 62f1e52b57849a0f000000
-       //TODO: VXORPD Y5, Y20, K3, Y3                             // 62f1dd2357dd
-       //TODO: VXORPD Y28, Y20, K3, Y3                            // 6291dd2357dc
-       //TODO: VXORPD Y7, Y20, K3, Y3                             // 62f1dd2357df
-       //TODO: VXORPD -7(CX), Y20, K3, Y3                         // 62f1dd235799f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y20, K3, Y3                   // 62f1dd23579c9a0f000000
-       //TODO: VXORPD Y5, Y12, K3, Y3                             // 62f19d2b57dd
-       //TODO: VXORPD Y28, Y12, K3, Y3                            // 62919d2b57dc
-       //TODO: VXORPD Y7, Y12, K3, Y3                             // 62f19d2b57df
-       //TODO: VXORPD -7(CX), Y12, K3, Y3                         // 62f19d2b5799f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y12, K3, Y3                   // 62f19d2b579c9a0f000000
-       //TODO: VXORPD Y5, Y3, K3, Y3                              // 62f1e52b57dd
-       //TODO: VXORPD Y28, Y3, K3, Y3                             // 6291e52b57dc
-       //TODO: VXORPD Y7, Y3, K3, Y3                              // 62f1e52b57df
-       //TODO: VXORPD -7(CX), Y3, K3, Y3                          // 62f1e52b5799f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y3, K3, Y3                    // 62f1e52b579c9a0f000000
-       //TODO: VXORPD Y5, Y20, K3, Y5                             // 62f1dd2357ed
-       //TODO: VXORPD Y28, Y20, K3, Y5                            // 6291dd2357ec
-       //TODO: VXORPD Y7, Y20, K3, Y5                             // 62f1dd2357ef
-       //TODO: VXORPD -7(CX), Y20, K3, Y5                         // 62f1dd2357a9f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y20, K3, Y5                   // 62f1dd2357ac9a0f000000
-       //TODO: VXORPD Y5, Y12, K3, Y5                             // 62f19d2b57ed
-       //TODO: VXORPD Y28, Y12, K3, Y5                            // 62919d2b57ec
-       //TODO: VXORPD Y7, Y12, K3, Y5                             // 62f19d2b57ef
-       //TODO: VXORPD -7(CX), Y12, K3, Y5                         // 62f19d2b57a9f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y12, K3, Y5                   // 62f19d2b57ac9a0f000000
-       //TODO: VXORPD Y5, Y3, K3, Y5                              // 62f1e52b57ed
-       //TODO: VXORPD Y28, Y3, K3, Y5                             // 6291e52b57ec
-       //TODO: VXORPD Y7, Y3, K3, Y5                              // 62f1e52b57ef
-       //TODO: VXORPD -7(CX), Y3, K3, Y5                          // 62f1e52b57a9f9ffffff
-       //TODO: VXORPD 15(DX)(BX*4), Y3, K3, Y5                    // 62f1e52b57ac9a0f000000
-       //TODO: VXORPD Z13, Z28, K4, Z26                           // 62419d4457d5
-       //TODO: VXORPD Z21, Z28, K4, Z26                           // 62219d4457d5
-       //TODO: VXORPD 15(R8)(R14*1), Z28, K4, Z26                 // 62019d445794300f000000
-       //TODO: VXORPD 15(R8)(R14*2), Z28, K4, Z26                 // 62019d445794700f000000
-       //TODO: VXORPD Z13, Z6, K4, Z26                            // 6241cd4c57d5
-       //TODO: VXORPD Z21, Z6, K4, Z26                            // 6221cd4c57d5
-       //TODO: VXORPD 15(R8)(R14*1), Z6, K4, Z26                  // 6201cd4c5794300f000000
-       //TODO: VXORPD 15(R8)(R14*2), Z6, K4, Z26                  // 6201cd4c5794700f000000
-       //TODO: VXORPD Z13, Z28, K4, Z14                           // 62519d4457f5
-       //TODO: VXORPD Z21, Z28, K4, Z14                           // 62319d4457f5
-       //TODO: VXORPD 15(R8)(R14*1), Z28, K4, Z14                 // 62119d4457b4300f000000
-       //TODO: VXORPD 15(R8)(R14*2), Z28, K4, Z14                 // 62119d4457b4700f000000
-       //TODO: VXORPD Z13, Z6, K4, Z14                            // 6251cd4c57f5
-       //TODO: VXORPD Z21, Z6, K4, Z14                            // 6231cd4c57f5
-       //TODO: VXORPD 15(R8)(R14*1), Z6, K4, Z14                  // 6211cd4c57b4300f000000
-       //TODO: VXORPD 15(R8)(R14*2), Z6, K4, Z14                  // 6211cd4c57b4700f000000
-       //TODO: VXORPS X11, X18, K2, X9                            // 62516c0257cb
-       //TODO: VXORPS X31, X18, K2, X9                            // 62116c0257cf
-       //TODO: VXORPS X3, X18, K2, X9                             // 62716c0257cb
-       //TODO: VXORPS 15(DX)(BX*1), X18, K2, X9                   // 62716c02578c1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X18, K2, X9                   // 62716c02578c51f9ffffff
-       //TODO: VXORPS X11, X21, K2, X9                            // 6251540257cb
-       //TODO: VXORPS X31, X21, K2, X9                            // 6211540257cf
-       //TODO: VXORPS X3, X21, K2, X9                             // 6271540257cb
-       //TODO: VXORPS 15(DX)(BX*1), X21, K2, X9                   // 62715402578c1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X21, K2, X9                   // 62715402578c51f9ffffff
-       //TODO: VXORPS X11, X1, K2, X9                             // 6251740a57cb
-       //TODO: VXORPS X31, X1, K2, X9                             // 6211740a57cf
-       //TODO: VXORPS X3, X1, K2, X9                              // 6271740a57cb
-       //TODO: VXORPS 15(DX)(BX*1), X1, K2, X9                    // 6271740a578c1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X1, K2, X9                    // 6271740a578c51f9ffffff
-       //TODO: VXORPS X11, X18, K2, X15                           // 62516c0257fb
-       //TODO: VXORPS X31, X18, K2, X15                           // 62116c0257ff
-       //TODO: VXORPS X3, X18, K2, X15                            // 62716c0257fb
-       //TODO: VXORPS 15(DX)(BX*1), X18, K2, X15                  // 62716c0257bc1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X18, K2, X15                  // 62716c0257bc51f9ffffff
-       //TODO: VXORPS X11, X21, K2, X15                           // 6251540257fb
-       //TODO: VXORPS X31, X21, K2, X15                           // 6211540257ff
-       //TODO: VXORPS X3, X21, K2, X15                            // 6271540257fb
-       //TODO: VXORPS 15(DX)(BX*1), X21, K2, X15                  // 6271540257bc1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X21, K2, X15                  // 6271540257bc51f9ffffff
-       //TODO: VXORPS X11, X1, K2, X15                            // 6251740a57fb
-       //TODO: VXORPS X31, X1, K2, X15                            // 6211740a57ff
-       //TODO: VXORPS X3, X1, K2, X15                             // 6271740a57fb
-       //TODO: VXORPS 15(DX)(BX*1), X1, K2, X15                   // 6271740a57bc1a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X1, K2, X15                   // 6271740a57bc51f9ffffff
-       //TODO: VXORPS X11, X18, K2, X26                           // 62416c0257d3
-       //TODO: VXORPS X31, X18, K2, X26                           // 62016c0257d7
-       //TODO: VXORPS X3, X18, K2, X26                            // 62616c0257d3
-       //TODO: VXORPS 15(DX)(BX*1), X18, K2, X26                  // 62616c0257941a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X18, K2, X26                  // 62616c02579451f9ffffff
-       //TODO: VXORPS X11, X21, K2, X26                           // 6241540257d3
-       //TODO: VXORPS X31, X21, K2, X26                           // 6201540257d7
-       //TODO: VXORPS X3, X21, K2, X26                            // 6261540257d3
-       //TODO: VXORPS 15(DX)(BX*1), X21, K2, X26                  // 6261540257941a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X21, K2, X26                  // 62615402579451f9ffffff
-       //TODO: VXORPS X11, X1, K2, X26                            // 6241740a57d3
-       //TODO: VXORPS X31, X1, K2, X26                            // 6201740a57d7
-       //TODO: VXORPS X3, X1, K2, X26                             // 6261740a57d3
-       //TODO: VXORPS 15(DX)(BX*1), X1, K2, X26                   // 6261740a57941a0f000000
-       //TODO: VXORPS -7(CX)(DX*2), X1, K2, X26                   // 6261740a579451f9ffffff
-       //TODO: VXORPS Y17, Y12, K2, Y0                            // 62b11c2a57c1
-       //TODO: VXORPS Y7, Y12, K2, Y0                             // 62f11c2a57c7
-       //TODO: VXORPS Y9, Y12, K2, Y0                             // 62d11c2a57c1
-       //TODO: VXORPS 99(R15)(R15*8), Y12, K2, Y0                 // 62911c2a5784ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y12, K2, Y0                    // 62f11c2a5784c807000000
-       //TODO: VXORPS Y17, Y1, K2, Y0                             // 62b1742a57c1
-       //TODO: VXORPS Y7, Y1, K2, Y0                              // 62f1742a57c7
-       //TODO: VXORPS Y9, Y1, K2, Y0                              // 62d1742a57c1
-       //TODO: VXORPS 99(R15)(R15*8), Y1, K2, Y0                  // 6291742a5784ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y1, K2, Y0                     // 62f1742a5784c807000000
-       //TODO: VXORPS Y17, Y14, K2, Y0                            // 62b10c2a57c1
-       //TODO: VXORPS Y7, Y14, K2, Y0                             // 62f10c2a57c7
-       //TODO: VXORPS Y9, Y14, K2, Y0                             // 62d10c2a57c1
-       //TODO: VXORPS 99(R15)(R15*8), Y14, K2, Y0                 // 62910c2a5784ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y14, K2, Y0                    // 62f10c2a5784c807000000
-       //TODO: VXORPS Y17, Y12, K2, Y22                           // 62a11c2a57f1
-       //TODO: VXORPS Y7, Y12, K2, Y22                            // 62e11c2a57f7
-       //TODO: VXORPS Y9, Y12, K2, Y22                            // 62c11c2a57f1
-       //TODO: VXORPS 99(R15)(R15*8), Y12, K2, Y22                // 62811c2a57b4ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y12, K2, Y22                   // 62e11c2a57b4c807000000
-       //TODO: VXORPS Y17, Y1, K2, Y22                            // 62a1742a57f1
-       //TODO: VXORPS Y7, Y1, K2, Y22                             // 62e1742a57f7
-       //TODO: VXORPS Y9, Y1, K2, Y22                             // 62c1742a57f1
-       //TODO: VXORPS 99(R15)(R15*8), Y1, K2, Y22                 // 6281742a57b4ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y1, K2, Y22                    // 62e1742a57b4c807000000
-       //TODO: VXORPS Y17, Y14, K2, Y22                           // 62a10c2a57f1
-       //TODO: VXORPS Y7, Y14, K2, Y22                            // 62e10c2a57f7
-       //TODO: VXORPS Y9, Y14, K2, Y22                            // 62c10c2a57f1
-       //TODO: VXORPS 99(R15)(R15*8), Y14, K2, Y22                // 62810c2a57b4ff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y14, K2, Y22                   // 62e10c2a57b4c807000000
-       //TODO: VXORPS Y17, Y12, K2, Y13                           // 62311c2a57e9
-       //TODO: VXORPS Y7, Y12, K2, Y13                            // 62711c2a57ef
-       //TODO: VXORPS Y9, Y12, K2, Y13                            // 62511c2a57e9
-       //TODO: VXORPS 99(R15)(R15*8), Y12, K2, Y13                // 62111c2a57acff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y12, K2, Y13                   // 62711c2a57acc807000000
-       //TODO: VXORPS Y17, Y1, K2, Y13                            // 6231742a57e9
-       //TODO: VXORPS Y7, Y1, K2, Y13                             // 6271742a57ef
-       //TODO: VXORPS Y9, Y1, K2, Y13                             // 6251742a57e9
-       //TODO: VXORPS 99(R15)(R15*8), Y1, K2, Y13                 // 6211742a57acff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y1, K2, Y13                    // 6271742a57acc807000000
-       //TODO: VXORPS Y17, Y14, K2, Y13                           // 62310c2a57e9
-       //TODO: VXORPS Y7, Y14, K2, Y13                            // 62710c2a57ef
-       //TODO: VXORPS Y9, Y14, K2, Y13                            // 62510c2a57e9
-       //TODO: VXORPS 99(R15)(R15*8), Y14, K2, Y13                // 62110c2a57acff63000000
-       //TODO: VXORPS 7(AX)(CX*8), Y14, K2, Y13                   // 62710c2a57acc807000000
-       //TODO: VXORPS Z21, Z3, K3, Z26                            // 6221644b57d5
-       //TODO: VXORPS Z13, Z3, K3, Z26                            // 6241644b57d5
-       //TODO: VXORPS (R14), Z3, K3, Z26                          // 6241644b5716
-       //TODO: VXORPS -7(DI)(R8*8), Z3, K3, Z26                   // 6221644b5794c7f9ffffff
-       //TODO: VXORPS Z21, Z0, K3, Z26                            // 62217c4b57d5
-       //TODO: VXORPS Z13, Z0, K3, Z26                            // 62417c4b57d5
-       //TODO: VXORPS (R14), Z0, K3, Z26                          // 62417c4b5716
-       //TODO: VXORPS -7(DI)(R8*8), Z0, K3, Z26                   // 62217c4b5794c7f9ffffff
-       //TODO: VXORPS Z21, Z3, K3, Z3                             // 62b1644b57dd
-       //TODO: VXORPS Z13, Z3, K3, Z3                             // 62d1644b57dd
-       //TODO: VXORPS (R14), Z3, K3, Z3                           // 62d1644b571e
-       //TODO: VXORPS -7(DI)(R8*8), Z3, K3, Z3                    // 62b1644b579cc7f9ffffff
-       //TODO: VXORPS Z21, Z0, K3, Z3                             // 62b17c4b57dd
-       //TODO: VXORPS Z13, Z0, K3, Z3                             // 62d17c4b57dd
-       //TODO: VXORPS (R14), Z0, K3, Z3                           // 62d17c4b571e
-       //TODO: VXORPS -7(DI)(R8*8), Z0, K3, Z3                    // 62b17c4b579cc7f9ffffff
+       KADDB K3, K1, K6                                   // c5f54af3
+       KADDB K1, K1, K6                                   // c5f54af1
+       KADDB K3, K5, K6                                   // c5d54af3
+       KADDB K1, K5, K6                                   // c5d54af1
+       KADDB K3, K1, K5                                   // c5f54aeb
+       KADDB K1, K1, K5                                   // c5f54ae9
+       KADDB K3, K5, K5                                   // c5d54aeb
+       KADDB K1, K5, K5                                   // c5d54ae9
+       KADDW K6, K6, K1                                   // c5cc4ace
+       KADDW K4, K6, K1                                   // c5cc4acc
+       KADDW K6, K7, K1                                   // c5c44ace
+       KADDW K4, K7, K1                                   // c5c44acc
+       KADDW K6, K6, K3                                   // c5cc4ade
+       KADDW K4, K6, K3                                   // c5cc4adc
+       KADDW K6, K7, K3                                   // c5c44ade
+       KADDW K4, K7, K3                                   // c5c44adc
+       KANDB K2, K4, K4                                   // c5dd41e2
+       KANDB K7, K4, K4                                   // c5dd41e7
+       KANDB K2, K5, K4                                   // c5d541e2
+       KANDB K7, K5, K4                                   // c5d541e7
+       KANDB K2, K4, K6                                   // c5dd41f2
+       KANDB K7, K4, K6                                   // c5dd41f7
+       KANDB K2, K5, K6                                   // c5d541f2
+       KANDB K7, K5, K6                                   // c5d541f7
+       KANDNB K7, K5, K3                                  // c5d542df
+       KANDNB K6, K5, K3                                  // c5d542de
+       KANDNB K7, K4, K3                                  // c5dd42df
+       KANDNB K6, K4, K3                                  // c5dd42de
+       KANDNB K7, K5, K1                                  // c5d542cf
+       KANDNB K6, K5, K1                                  // c5d542ce
+       KANDNB K7, K4, K1                                  // c5dd42cf
+       KANDNB K6, K4, K1                                  // c5dd42ce
+       KMOVB K7, 17(SP)                                   // c5f9917c2411
+       KMOVB K6, 17(SP)                                   // c5f991742411
+       KMOVB K7, -17(BP)(SI*4)                            // c5f9917cb5ef
+       KMOVB K6, -17(BP)(SI*4)                            // c5f99174b5ef
+       KMOVB K4, AX                                       // c5f993c4
+       KMOVB K6, AX                                       // c5f993c6
+       KMOVB K4, R9                                       // c57993cc
+       KMOVB K6, R9                                       // c57993ce
+       KMOVB K5, K0                                       // c5f990c5
+       KMOVB K4, K0                                       // c5f990c4
+       KMOVB 7(AX), K0                                    // c5f9904007
+       KMOVB (DI), K0                                     // c5f99007
+       KMOVB K5, K7                                       // c5f990fd
+       KMOVB K4, K7                                       // c5f990fc
+       KMOVB 7(AX), K7                                    // c5f9907807
+       KMOVB (DI), K7                                     // c5f9903f
+       KMOVB CX, K4                                       // c5f992e1
+       KMOVB SP, K4                                       // c5f992e4
+       KMOVB CX, K6                                       // c5f992f1
+       KMOVB SP, K6                                       // c5f992f4
+       KNOTB K1, K4                                       // c5f944e1
+       KNOTB K3, K4                                       // c5f944e3
+       KNOTB K1, K6                                       // c5f944f1
+       KNOTB K3, K6                                       // c5f944f3
+       KORB K3, K1, K6                                    // c5f545f3
+       KORB K1, K1, K6                                    // c5f545f1
+       KORB K3, K5, K6                                    // c5d545f3
+       KORB K1, K5, K6                                    // c5d545f1
+       KORB K3, K1, K5                                    // c5f545eb
+       KORB K1, K1, K5                                    // c5f545e9
+       KORB K3, K5, K5                                    // c5d545eb
+       KORB K1, K5, K5                                    // c5d545e9
+       KORTESTB K6, K1                                    // c5f998ce
+       KORTESTB K7, K1                                    // c5f998cf
+       KORTESTB K6, K3                                    // c5f998de
+       KORTESTB K7, K3                                    // c5f998df
+       KSHIFTLB $127, K4, K7                              // c4e37932fc7f
+       KSHIFTLB $127, K6, K7                              // c4e37932fe7f
+       KSHIFTLB $127, K4, K6                              // c4e37932f47f
+       KSHIFTLB $127, K6, K6                              // c4e37932f67f
+       KSHIFTRB $42, K4, K4                               // c4e37930e42a
+       KSHIFTRB $42, K5, K4                               // c4e37930e52a
+       KSHIFTRB $42, K4, K6                               // c4e37930f42a
+       KSHIFTRB $42, K5, K6                               // c4e37930f52a
+       KTESTB K4, K7                                      // c5f999fc
+       KTESTB K6, K7                                      // c5f999fe
+       KTESTB K4, K6                                      // c5f999f4
+       KTESTB K6, K6                                      // c5f999f6
+       KTESTW K6, K6                                      // c5f899f6
+       KTESTW K4, K6                                      // c5f899f4
+       KTESTW K6, K7                                      // c5f899fe
+       KTESTW K4, K7                                      // c5f899fc
+       KXNORB K5, K0, K4                                  // c5fd46e5
+       KXNORB K4, K0, K4                                  // c5fd46e4
+       KXNORB K5, K7, K4                                  // c5c546e5
+       KXNORB K4, K7, K4                                  // c5c546e4
+       KXNORB K5, K0, K6                                  // c5fd46f5
+       KXNORB K4, K0, K6                                  // c5fd46f4
+       KXNORB K5, K7, K6                                  // c5c546f5
+       KXNORB K4, K7, K6                                  // c5c546f4
+       KXORB K5, K3, K1                                   // c5e547cd
+       KXORB K4, K3, K1                                   // c5e547cc
+       KXORB K5, K1, K1                                   // c5f547cd
+       KXORB K4, K1, K1                                   // c5f547cc
+       KXORB K5, K3, K5                                   // c5e547ed
+       KXORB K4, K3, K5                                   // c5e547ec
+       KXORB K5, K1, K5                                   // c5f547ed
+       KXORB K4, K1, K5                                   // c5f547ec
+       VANDNPD X15, X0, K4, X22                           // 62c1fd0c55f7
+       VANDNPD X11, X0, K4, X22                           // 62c1fd0c55f3
+       VANDNPD X0, X0, K4, X22                            // 62e1fd0c55f0
+       VANDNPD (R8), X0, K4, X22                          // 62c1fd0c5530
+       VANDNPD 15(DX)(BX*2), X0, K4, X22                  // 62e1fd0c55b45a0f000000
+       VANDNPD X15, X17, K4, X22                          // 62c1f50455f7
+       VANDNPD X11, X17, K4, X22                          // 62c1f50455f3
+       VANDNPD X0, X17, K4, X22                           // 62e1f50455f0
+       VANDNPD (R8), X17, K4, X22                         // 62c1f5045530
+       VANDNPD 15(DX)(BX*2), X17, K4, X22                 // 62e1f50455b45a0f000000
+       VANDNPD X15, X7, K4, X22                           // 62c1c50c55f7
+       VANDNPD X11, X7, K4, X22                           // 62c1c50c55f3
+       VANDNPD X0, X7, K4, X22                            // 62e1c50c55f0
+       VANDNPD (R8), X7, K4, X22                          // 62c1c50c5530
+       VANDNPD 15(DX)(BX*2), X7, K4, X22                  // 62e1c50c55b45a0f000000
+       VANDNPD X15, X0, K4, X5                            // 62d1fd0c55ef
+       VANDNPD X11, X0, K4, X5                            // 62d1fd0c55eb
+       VANDNPD X0, X0, K4, X5                             // 62f1fd0c55e8
+       VANDNPD (R8), X0, K4, X5                           // 62d1fd0c5528
+       VANDNPD 15(DX)(BX*2), X0, K4, X5                   // 62f1fd0c55ac5a0f000000
+       VANDNPD X15, X17, K4, X5                           // 62d1f50455ef
+       VANDNPD X11, X17, K4, X5                           // 62d1f50455eb
+       VANDNPD X0, X17, K4, X5                            // 62f1f50455e8
+       VANDNPD (R8), X17, K4, X5                          // 62d1f5045528
+       VANDNPD 15(DX)(BX*2), X17, K4, X5                  // 62f1f50455ac5a0f000000
+       VANDNPD X15, X7, K4, X5                            // 62d1c50c55ef
+       VANDNPD X11, X7, K4, X5                            // 62d1c50c55eb
+       VANDNPD X0, X7, K4, X5                             // 62f1c50c55e8
+       VANDNPD (R8), X7, K4, X5                           // 62d1c50c5528
+       VANDNPD 15(DX)(BX*2), X7, K4, X5                   // 62f1c50c55ac5a0f000000
+       VANDNPD X15, X0, K4, X14                           // 6251fd0c55f7
+       VANDNPD X11, X0, K4, X14                           // 6251fd0c55f3
+       VANDNPD X0, X0, K4, X14                            // 6271fd0c55f0
+       VANDNPD (R8), X0, K4, X14                          // 6251fd0c5530
+       VANDNPD 15(DX)(BX*2), X0, K4, X14                  // 6271fd0c55b45a0f000000
+       VANDNPD X15, X17, K4, X14                          // 6251f50455f7
+       VANDNPD X11, X17, K4, X14                          // 6251f50455f3
+       VANDNPD X0, X17, K4, X14                           // 6271f50455f0
+       VANDNPD (R8), X17, K4, X14                         // 6251f5045530
+       VANDNPD 15(DX)(BX*2), X17, K4, X14                 // 6271f50455b45a0f000000
+       VANDNPD X15, X7, K4, X14                           // 6251c50c55f7
+       VANDNPD X11, X7, K4, X14                           // 6251c50c55f3
+       VANDNPD X0, X7, K4, X14                            // 6271c50c55f0
+       VANDNPD (R8), X7, K4, X14                          // 6251c50c5530
+       VANDNPD 15(DX)(BX*2), X7, K4, X14                  // 6271c50c55b45a0f000000
+       VANDNPD Y17, Y12, K5, Y0                           // 62b19d2d55c1
+       VANDNPD Y7, Y12, K5, Y0                            // 62f19d2d55c7
+       VANDNPD Y9, Y12, K5, Y0                            // 62d19d2d55c1
+       VANDNPD 99(R15)(R15*8), Y12, K5, Y0                // 62919d2d5584ff63000000
+       VANDNPD 7(AX)(CX*8), Y12, K5, Y0                   // 62f19d2d5584c807000000
+       VANDNPD Y17, Y1, K5, Y0                            // 62b1f52d55c1
+       VANDNPD Y7, Y1, K5, Y0                             // 62f1f52d55c7
+       VANDNPD Y9, Y1, K5, Y0                             // 62d1f52d55c1
+       VANDNPD 99(R15)(R15*8), Y1, K5, Y0                 // 6291f52d5584ff63000000
+       VANDNPD 7(AX)(CX*8), Y1, K5, Y0                    // 62f1f52d5584c807000000
+       VANDNPD Y17, Y14, K5, Y0                           // 62b18d2d55c1
+       VANDNPD Y7, Y14, K5, Y0                            // 62f18d2d55c7
+       VANDNPD Y9, Y14, K5, Y0                            // 62d18d2d55c1
+       VANDNPD 99(R15)(R15*8), Y14, K5, Y0                // 62918d2d5584ff63000000
+       VANDNPD 7(AX)(CX*8), Y14, K5, Y0                   // 62f18d2d5584c807000000
+       VANDNPD Y17, Y12, K5, Y22                          // 62a19d2d55f1
+       VANDNPD Y7, Y12, K5, Y22                           // 62e19d2d55f7
+       VANDNPD Y9, Y12, K5, Y22                           // 62c19d2d55f1
+       VANDNPD 99(R15)(R15*8), Y12, K5, Y22               // 62819d2d55b4ff63000000
+       VANDNPD 7(AX)(CX*8), Y12, K5, Y22                  // 62e19d2d55b4c807000000
+       VANDNPD Y17, Y1, K5, Y22                           // 62a1f52d55f1
+       VANDNPD Y7, Y1, K5, Y22                            // 62e1f52d55f7
+       VANDNPD Y9, Y1, K5, Y22                            // 62c1f52d55f1
+       VANDNPD 99(R15)(R15*8), Y1, K5, Y22                // 6281f52d55b4ff63000000
+       VANDNPD 7(AX)(CX*8), Y1, K5, Y22                   // 62e1f52d55b4c807000000
+       VANDNPD Y17, Y14, K5, Y22                          // 62a18d2d55f1
+       VANDNPD Y7, Y14, K5, Y22                           // 62e18d2d55f7
+       VANDNPD Y9, Y14, K5, Y22                           // 62c18d2d55f1
+       VANDNPD 99(R15)(R15*8), Y14, K5, Y22               // 62818d2d55b4ff63000000
+       VANDNPD 7(AX)(CX*8), Y14, K5, Y22                  // 62e18d2d55b4c807000000
+       VANDNPD Y17, Y12, K5, Y13                          // 62319d2d55e9
+       VANDNPD Y7, Y12, K5, Y13                           // 62719d2d55ef
+       VANDNPD Y9, Y12, K5, Y13                           // 62519d2d55e9
+       VANDNPD 99(R15)(R15*8), Y12, K5, Y13               // 62119d2d55acff63000000
+       VANDNPD 7(AX)(CX*8), Y12, K5, Y13                  // 62719d2d55acc807000000
+       VANDNPD Y17, Y1, K5, Y13                           // 6231f52d55e9
+       VANDNPD Y7, Y1, K5, Y13                            // 6271f52d55ef
+       VANDNPD Y9, Y1, K5, Y13                            // 6251f52d55e9
+       VANDNPD 99(R15)(R15*8), Y1, K5, Y13                // 6211f52d55acff63000000
+       VANDNPD 7(AX)(CX*8), Y1, K5, Y13                   // 6271f52d55acc807000000
+       VANDNPD Y17, Y14, K5, Y13                          // 62318d2d55e9
+       VANDNPD Y7, Y14, K5, Y13                           // 62718d2d55ef
+       VANDNPD Y9, Y14, K5, Y13                           // 62518d2d55e9
+       VANDNPD 99(R15)(R15*8), Y14, K5, Y13               // 62118d2d55acff63000000
+       VANDNPD 7(AX)(CX*8), Y14, K5, Y13                  // 62718d2d55acc807000000
+       VANDNPD Z20, Z0, K7, Z7                            // 62b1fd4f55fc
+       VANDNPD Z28, Z0, K7, Z7                            // 6291fd4f55fc
+       VANDNPD 99(R15)(R15*8), Z0, K7, Z7                 // 6291fd4f55bcff63000000
+       VANDNPD 7(AX)(CX*8), Z0, K7, Z7                    // 62f1fd4f55bcc807000000
+       VANDNPD Z20, Z6, K7, Z7                            // 62b1cd4f55fc
+       VANDNPD Z28, Z6, K7, Z7                            // 6291cd4f55fc
+       VANDNPD 99(R15)(R15*8), Z6, K7, Z7                 // 6291cd4f55bcff63000000
+       VANDNPD 7(AX)(CX*8), Z6, K7, Z7                    // 62f1cd4f55bcc807000000
+       VANDNPD Z20, Z0, K7, Z9                            // 6231fd4f55cc
+       VANDNPD Z28, Z0, K7, Z9                            // 6211fd4f55cc
+       VANDNPD 99(R15)(R15*8), Z0, K7, Z9                 // 6211fd4f558cff63000000
+       VANDNPD 7(AX)(CX*8), Z0, K7, Z9                    // 6271fd4f558cc807000000
+       VANDNPD Z20, Z6, K7, Z9                            // 6231cd4f55cc
+       VANDNPD Z28, Z6, K7, Z9                            // 6211cd4f55cc
+       VANDNPD 99(R15)(R15*8), Z6, K7, Z9                 // 6211cd4f558cff63000000
+       VANDNPD 7(AX)(CX*8), Z6, K7, Z9                    // 6271cd4f558cc807000000
+       VANDNPS X15, X25, K7, X18                          // 62c1340755d7
+       VANDNPS X28, X25, K7, X18                          // 6281340755d4
+       VANDNPS 17(SP)(BP*1), X25, K7, X18                 // 62e1340755942c11000000
+       VANDNPS -7(CX)(DX*8), X25, K7, X18                 // 62e134075594d1f9ffffff
+       VANDNPS X15, X3, K7, X18                           // 62c1640f55d7
+       VANDNPS X28, X3, K7, X18                           // 6281640f55d4
+       VANDNPS 17(SP)(BP*1), X3, K7, X18                  // 62e1640f55942c11000000
+       VANDNPS -7(CX)(DX*8), X3, K7, X18                  // 62e1640f5594d1f9ffffff
+       VANDNPS X15, X18, K7, X18                          // 62c16c0755d7
+       VANDNPS X28, X18, K7, X18                          // 62816c0755d4
+       VANDNPS 17(SP)(BP*1), X18, K7, X18                 // 62e16c0755942c11000000
+       VANDNPS -7(CX)(DX*8), X18, K7, X18                 // 62e16c075594d1f9ffffff
+       VANDNPS X15, X25, K7, X8                           // 6251340755c7
+       VANDNPS X28, X25, K7, X8                           // 6211340755c4
+       VANDNPS 17(SP)(BP*1), X25, K7, X8                  // 6271340755842c11000000
+       VANDNPS -7(CX)(DX*8), X25, K7, X8                  // 627134075584d1f9ffffff
+       VANDNPS X15, X3, K7, X8                            // 6251640f55c7
+       VANDNPS X28, X3, K7, X8                            // 6211640f55c4
+       VANDNPS 17(SP)(BP*1), X3, K7, X8                   // 6271640f55842c11000000
+       VANDNPS -7(CX)(DX*8), X3, K7, X8                   // 6271640f5584d1f9ffffff
+       VANDNPS X15, X18, K7, X8                           // 62516c0755c7
+       VANDNPS X28, X18, K7, X8                           // 62116c0755c4
+       VANDNPS 17(SP)(BP*1), X18, K7, X8                  // 62716c0755842c11000000
+       VANDNPS -7(CX)(DX*8), X18, K7, X8                  // 62716c075584d1f9ffffff
+       VANDNPS X15, X25, K7, X27                          // 6241340755df
+       VANDNPS X28, X25, K7, X27                          // 6201340755dc
+       VANDNPS 17(SP)(BP*1), X25, K7, X27                 // 62613407559c2c11000000
+       VANDNPS -7(CX)(DX*8), X25, K7, X27                 // 62613407559cd1f9ffffff
+       VANDNPS X15, X3, K7, X27                           // 6241640f55df
+       VANDNPS X28, X3, K7, X27                           // 6201640f55dc
+       VANDNPS 17(SP)(BP*1), X3, K7, X27                  // 6261640f559c2c11000000
+       VANDNPS -7(CX)(DX*8), X3, K7, X27                  // 6261640f559cd1f9ffffff
+       VANDNPS X15, X18, K7, X27                          // 62416c0755df
+       VANDNPS X28, X18, K7, X27                          // 62016c0755dc
+       VANDNPS 17(SP)(BP*1), X18, K7, X27                 // 62616c07559c2c11000000
+       VANDNPS -7(CX)(DX*8), X18, K7, X27                 // 62616c07559cd1f9ffffff
+       VANDNPS Y2, Y28, K6, Y31                           // 62611c2655fa
+       VANDNPS Y21, Y28, K6, Y31                          // 62211c2655fd
+       VANDNPS Y12, Y28, K6, Y31                          // 62411c2655fc
+       VANDNPS (AX), Y28, K6, Y31                         // 62611c265538
+       VANDNPS 7(SI), Y28, K6, Y31                        // 62611c2655be07000000
+       VANDNPS Y2, Y13, K6, Y31                           // 6261142e55fa
+       VANDNPS Y21, Y13, K6, Y31                          // 6221142e55fd
+       VANDNPS Y12, Y13, K6, Y31                          // 6241142e55fc
+       VANDNPS (AX), Y13, K6, Y31                         // 6261142e5538
+       VANDNPS 7(SI), Y13, K6, Y31                        // 6261142e55be07000000
+       VANDNPS Y2, Y7, K6, Y31                            // 6261442e55fa
+       VANDNPS Y21, Y7, K6, Y31                           // 6221442e55fd
+       VANDNPS Y12, Y7, K6, Y31                           // 6241442e55fc
+       VANDNPS (AX), Y7, K6, Y31                          // 6261442e5538
+       VANDNPS 7(SI), Y7, K6, Y31                         // 6261442e55be07000000
+       VANDNPS Y2, Y28, K6, Y8                            // 62711c2655c2
+       VANDNPS Y21, Y28, K6, Y8                           // 62311c2655c5
+       VANDNPS Y12, Y28, K6, Y8                           // 62511c2655c4
+       VANDNPS (AX), Y28, K6, Y8                          // 62711c265500
+       VANDNPS 7(SI), Y28, K6, Y8                         // 62711c26558607000000
+       VANDNPS Y2, Y13, K6, Y8                            // 6271142e55c2
+       VANDNPS Y21, Y13, K6, Y8                           // 6231142e55c5
+       VANDNPS Y12, Y13, K6, Y8                           // 6251142e55c4
+       VANDNPS (AX), Y13, K6, Y8                          // 6271142e5500
+       VANDNPS 7(SI), Y13, K6, Y8                         // 6271142e558607000000
+       VANDNPS Y2, Y7, K6, Y8                             // 6271442e55c2
+       VANDNPS Y21, Y7, K6, Y8                            // 6231442e55c5
+       VANDNPS Y12, Y7, K6, Y8                            // 6251442e55c4
+       VANDNPS (AX), Y7, K6, Y8                           // 6271442e5500
+       VANDNPS 7(SI), Y7, K6, Y8                          // 6271442e558607000000
+       VANDNPS Y2, Y28, K6, Y1                            // 62f11c2655ca
+       VANDNPS Y21, Y28, K6, Y1                           // 62b11c2655cd
+       VANDNPS Y12, Y28, K6, Y1                           // 62d11c2655cc
+       VANDNPS (AX), Y28, K6, Y1                          // 62f11c265508
+       VANDNPS 7(SI), Y28, K6, Y1                         // 62f11c26558e07000000
+       VANDNPS Y2, Y13, K6, Y1                            // 62f1142e55ca
+       VANDNPS Y21, Y13, K6, Y1                           // 62b1142e55cd
+       VANDNPS Y12, Y13, K6, Y1                           // 62d1142e55cc
+       VANDNPS (AX), Y13, K6, Y1                          // 62f1142e5508
+       VANDNPS 7(SI), Y13, K6, Y1                         // 62f1142e558e07000000
+       VANDNPS Y2, Y7, K6, Y1                             // 62f1442e55ca
+       VANDNPS Y21, Y7, K6, Y1                            // 62b1442e55cd
+       VANDNPS Y12, Y7, K6, Y1                            // 62d1442e55cc
+       VANDNPS (AX), Y7, K6, Y1                           // 62f1442e5508
+       VANDNPS 7(SI), Y7, K6, Y1                          // 62f1442e558e07000000
+       VANDNPS Z12, Z9, K3, Z3                            // 62d1344b55dc
+       VANDNPS Z22, Z9, K3, Z3                            // 62b1344b55de
+       VANDNPS (AX), Z9, K3, Z3                           // 62f1344b5518
+       VANDNPS 7(SI), Z9, K3, Z3                          // 62f1344b559e07000000
+       VANDNPS Z12, Z19, K3, Z3                           // 62d1644355dc
+       VANDNPS Z22, Z19, K3, Z3                           // 62b1644355de
+       VANDNPS (AX), Z19, K3, Z3                          // 62f164435518
+       VANDNPS 7(SI), Z19, K3, Z3                         // 62f16443559e07000000
+       VANDNPS Z12, Z9, K3, Z30                           // 6241344b55f4
+       VANDNPS Z22, Z9, K3, Z30                           // 6221344b55f6
+       VANDNPS (AX), Z9, K3, Z30                          // 6261344b5530
+       VANDNPS 7(SI), Z9, K3, Z30                         // 6261344b55b607000000
+       VANDNPS Z12, Z19, K3, Z30                          // 6241644355f4
+       VANDNPS Z22, Z19, K3, Z30                          // 6221644355f6
+       VANDNPS (AX), Z19, K3, Z30                         // 626164435530
+       VANDNPS 7(SI), Z19, K3, Z30                        // 6261644355b607000000
+       VANDPD X22, X24, K7, X7                            // 62b1bd0754fe
+       VANDPD X1, X24, K7, X7                             // 62f1bd0754f9
+       VANDPD X11, X24, K7, X7                            // 62d1bd0754fb
+       VANDPD -17(BP)(SI*2), X24, K7, X7                  // 62f1bd0754bc75efffffff
+       VANDPD 7(AX)(CX*2), X24, K7, X7                    // 62f1bd0754bc4807000000
+       VANDPD X22, X7, K7, X7                             // 62b1c50f54fe
+       VANDPD X1, X7, K7, X7                              // 62f1c50f54f9
+       VANDPD X11, X7, K7, X7                             // 62d1c50f54fb
+       VANDPD -17(BP)(SI*2), X7, K7, X7                   // 62f1c50f54bc75efffffff
+       VANDPD 7(AX)(CX*2), X7, K7, X7                     // 62f1c50f54bc4807000000
+       VANDPD X22, X0, K7, X7                             // 62b1fd0f54fe
+       VANDPD X1, X0, K7, X7                              // 62f1fd0f54f9
+       VANDPD X11, X0, K7, X7                             // 62d1fd0f54fb
+       VANDPD -17(BP)(SI*2), X0, K7, X7                   // 62f1fd0f54bc75efffffff
+       VANDPD 7(AX)(CX*2), X0, K7, X7                     // 62f1fd0f54bc4807000000
+       VANDPD X22, X24, K7, X13                           // 6231bd0754ee
+       VANDPD X1, X24, K7, X13                            // 6271bd0754e9
+       VANDPD X11, X24, K7, X13                           // 6251bd0754eb
+       VANDPD -17(BP)(SI*2), X24, K7, X13                 // 6271bd0754ac75efffffff
+       VANDPD 7(AX)(CX*2), X24, K7, X13                   // 6271bd0754ac4807000000
+       VANDPD X22, X7, K7, X13                            // 6231c50f54ee
+       VANDPD X1, X7, K7, X13                             // 6271c50f54e9
+       VANDPD X11, X7, K7, X13                            // 6251c50f54eb
+       VANDPD -17(BP)(SI*2), X7, K7, X13                  // 6271c50f54ac75efffffff
+       VANDPD 7(AX)(CX*2), X7, K7, X13                    // 6271c50f54ac4807000000
+       VANDPD X22, X0, K7, X13                            // 6231fd0f54ee
+       VANDPD X1, X0, K7, X13                             // 6271fd0f54e9
+       VANDPD X11, X0, K7, X13                            // 6251fd0f54eb
+       VANDPD -17(BP)(SI*2), X0, K7, X13                  // 6271fd0f54ac75efffffff
+       VANDPD 7(AX)(CX*2), X0, K7, X13                    // 6271fd0f54ac4807000000
+       VANDPD X22, X24, K7, X8                            // 6231bd0754c6
+       VANDPD X1, X24, K7, X8                             // 6271bd0754c1
+       VANDPD X11, X24, K7, X8                            // 6251bd0754c3
+       VANDPD -17(BP)(SI*2), X24, K7, X8                  // 6271bd07548475efffffff
+       VANDPD 7(AX)(CX*2), X24, K7, X8                    // 6271bd0754844807000000
+       VANDPD X22, X7, K7, X8                             // 6231c50f54c6
+       VANDPD X1, X7, K7, X8                              // 6271c50f54c1
+       VANDPD X11, X7, K7, X8                             // 6251c50f54c3
+       VANDPD -17(BP)(SI*2), X7, K7, X8                   // 6271c50f548475efffffff
+       VANDPD 7(AX)(CX*2), X7, K7, X8                     // 6271c50f54844807000000
+       VANDPD X22, X0, K7, X8                             // 6231fd0f54c6
+       VANDPD X1, X0, K7, X8                              // 6271fd0f54c1
+       VANDPD X11, X0, K7, X8                             // 6251fd0f54c3
+       VANDPD -17(BP)(SI*2), X0, K7, X8                   // 6271fd0f548475efffffff
+       VANDPD 7(AX)(CX*2), X0, K7, X8                     // 6271fd0f54844807000000
+       VANDPD Y12, Y3, K4, Y9                             // 6251e52c54cc
+       VANDPD Y21, Y3, K4, Y9                             // 6231e52c54cd
+       VANDPD Y14, Y3, K4, Y9                             // 6251e52c54ce
+       VANDPD (BX), Y3, K4, Y9                            // 6271e52c540b
+       VANDPD -17(BP)(SI*1), Y3, K4, Y9                   // 6271e52c548c35efffffff
+       VANDPD Y12, Y2, K4, Y9                             // 6251ed2c54cc
+       VANDPD Y21, Y2, K4, Y9                             // 6231ed2c54cd
+       VANDPD Y14, Y2, K4, Y9                             // 6251ed2c54ce
+       VANDPD (BX), Y2, K4, Y9                            // 6271ed2c540b
+       VANDPD -17(BP)(SI*1), Y2, K4, Y9                   // 6271ed2c548c35efffffff
+       VANDPD Y12, Y9, K4, Y9                             // 6251b52c54cc
+       VANDPD Y21, Y9, K4, Y9                             // 6231b52c54cd
+       VANDPD Y14, Y9, K4, Y9                             // 6251b52c54ce
+       VANDPD (BX), Y9, K4, Y9                            // 6271b52c540b
+       VANDPD -17(BP)(SI*1), Y9, K4, Y9                   // 6271b52c548c35efffffff
+       VANDPD Y12, Y3, K4, Y1                             // 62d1e52c54cc
+       VANDPD Y21, Y3, K4, Y1                             // 62b1e52c54cd
+       VANDPD Y14, Y3, K4, Y1                             // 62d1e52c54ce
+       VANDPD (BX), Y3, K4, Y1                            // 62f1e52c540b
+       VANDPD -17(BP)(SI*1), Y3, K4, Y1                   // 62f1e52c548c35efffffff
+       VANDPD Y12, Y2, K4, Y1                             // 62d1ed2c54cc
+       VANDPD Y21, Y2, K4, Y1                             // 62b1ed2c54cd
+       VANDPD Y14, Y2, K4, Y1                             // 62d1ed2c54ce
+       VANDPD (BX), Y2, K4, Y1                            // 62f1ed2c540b
+       VANDPD -17(BP)(SI*1), Y2, K4, Y1                   // 62f1ed2c548c35efffffff
+       VANDPD Y12, Y9, K4, Y1                             // 62d1b52c54cc
+       VANDPD Y21, Y9, K4, Y1                             // 62b1b52c54cd
+       VANDPD Y14, Y9, K4, Y1                             // 62d1b52c54ce
+       VANDPD (BX), Y9, K4, Y1                            // 62f1b52c540b
+       VANDPD -17(BP)(SI*1), Y9, K4, Y1                   // 62f1b52c548c35efffffff
+       VANDPD Z2, Z18, K4, Z11                            // 6271ed4454da
+       VANDPD Z21, Z18, K4, Z11                           // 6231ed4454dd
+       VANDPD (BX), Z18, K4, Z11                          // 6271ed44541b
+       VANDPD -17(BP)(SI*1), Z18, K4, Z11                 // 6271ed44549c35efffffff
+       VANDPD Z2, Z24, K4, Z11                            // 6271bd4454da
+       VANDPD Z21, Z24, K4, Z11                           // 6231bd4454dd
+       VANDPD (BX), Z24, K4, Z11                          // 6271bd44541b
+       VANDPD -17(BP)(SI*1), Z24, K4, Z11                 // 6271bd44549c35efffffff
+       VANDPD Z2, Z18, K4, Z5                             // 62f1ed4454ea
+       VANDPD Z21, Z18, K4, Z5                            // 62b1ed4454ed
+       VANDPD (BX), Z18, K4, Z5                           // 62f1ed44542b
+       VANDPD -17(BP)(SI*1), Z18, K4, Z5                  // 62f1ed4454ac35efffffff
+       VANDPD Z2, Z24, K4, Z5                             // 62f1bd4454ea
+       VANDPD Z21, Z24, K4, Z5                            // 62b1bd4454ed
+       VANDPD (BX), Z24, K4, Z5                           // 62f1bd44542b
+       VANDPD -17(BP)(SI*1), Z24, K4, Z5                  // 62f1bd4454ac35efffffff
+       VANDPS X20, X31, K7, X6                            // 62b1040754f4
+       VANDPS X24, X31, K7, X6                            // 6291040754f0
+       VANDPS X7, X31, K7, X6                             // 62f1040754f7
+       VANDPS 15(R8)(R14*1), X31, K7, X6                  // 6291040754b4300f000000
+       VANDPS 15(R8)(R14*2), X31, K7, X6                  // 6291040754b4700f000000
+       VANDPS X20, X3, K7, X6                             // 62b1640f54f4
+       VANDPS X24, X3, K7, X6                             // 6291640f54f0
+       VANDPS X7, X3, K7, X6                              // 62f1640f54f7
+       VANDPS 15(R8)(R14*1), X3, K7, X6                   // 6291640f54b4300f000000
+       VANDPS 15(R8)(R14*2), X3, K7, X6                   // 6291640f54b4700f000000
+       VANDPS X20, X28, K7, X6                            // 62b11c0754f4
+       VANDPS X24, X28, K7, X6                            // 62911c0754f0
+       VANDPS X7, X28, K7, X6                             // 62f11c0754f7
+       VANDPS 15(R8)(R14*1), X28, K7, X6                  // 62911c0754b4300f000000
+       VANDPS 15(R8)(R14*2), X28, K7, X6                  // 62911c0754b4700f000000
+       VANDPS X20, X31, K7, X7                            // 62b1040754fc
+       VANDPS X24, X31, K7, X7                            // 6291040754f8
+       VANDPS X7, X31, K7, X7                             // 62f1040754ff
+       VANDPS 15(R8)(R14*1), X31, K7, X7                  // 6291040754bc300f000000
+       VANDPS 15(R8)(R14*2), X31, K7, X7                  // 6291040754bc700f000000
+       VANDPS X20, X3, K7, X7                             // 62b1640f54fc
+       VANDPS X24, X3, K7, X7                             // 6291640f54f8
+       VANDPS X7, X3, K7, X7                              // 62f1640f54ff
+       VANDPS 15(R8)(R14*1), X3, K7, X7                   // 6291640f54bc300f000000
+       VANDPS 15(R8)(R14*2), X3, K7, X7                   // 6291640f54bc700f000000
+       VANDPS X20, X28, K7, X7                            // 62b11c0754fc
+       VANDPS X24, X28, K7, X7                            // 62911c0754f8
+       VANDPS X7, X28, K7, X7                             // 62f11c0754ff
+       VANDPS 15(R8)(R14*1), X28, K7, X7                  // 62911c0754bc300f000000
+       VANDPS 15(R8)(R14*2), X28, K7, X7                  // 62911c0754bc700f000000
+       VANDPS X20, X31, K7, X8                            // 6231040754c4
+       VANDPS X24, X31, K7, X8                            // 6211040754c0
+       VANDPS X7, X31, K7, X8                             // 6271040754c7
+       VANDPS 15(R8)(R14*1), X31, K7, X8                  // 621104075484300f000000
+       VANDPS 15(R8)(R14*2), X31, K7, X8                  // 621104075484700f000000
+       VANDPS X20, X3, K7, X8                             // 6231640f54c4
+       VANDPS X24, X3, K7, X8                             // 6211640f54c0
+       VANDPS X7, X3, K7, X8                              // 6271640f54c7
+       VANDPS 15(R8)(R14*1), X3, K7, X8                   // 6211640f5484300f000000
+       VANDPS 15(R8)(R14*2), X3, K7, X8                   // 6211640f5484700f000000
+       VANDPS X20, X28, K7, X8                            // 62311c0754c4
+       VANDPS X24, X28, K7, X8                            // 62111c0754c0
+       VANDPS X7, X28, K7, X8                             // 62711c0754c7
+       VANDPS 15(R8)(R14*1), X28, K7, X8                  // 62111c075484300f000000
+       VANDPS 15(R8)(R14*2), X28, K7, X8                  // 62111c075484700f000000
+       VANDPS Y31, Y16, K2, Y30                           // 62017c2254f7
+       VANDPS Y22, Y16, K2, Y30                           // 62217c2254f6
+       VANDPS Y6, Y16, K2, Y30                            // 62617c2254f6
+       VANDPS 15(R8)(R14*4), Y16, K2, Y30                 // 62017c2254b4b00f000000
+       VANDPS -7(CX)(DX*4), Y16, K2, Y30                  // 62617c2254b491f9ffffff
+       VANDPS Y31, Y1, K2, Y30                            // 6201742a54f7
+       VANDPS Y22, Y1, K2, Y30                            // 6221742a54f6
+       VANDPS Y6, Y1, K2, Y30                             // 6261742a54f6
+       VANDPS 15(R8)(R14*4), Y1, K2, Y30                  // 6201742a54b4b00f000000
+       VANDPS -7(CX)(DX*4), Y1, K2, Y30                   // 6261742a54b491f9ffffff
+       VANDPS Y31, Y30, K2, Y30                           // 62010c2254f7
+       VANDPS Y22, Y30, K2, Y30                           // 62210c2254f6
+       VANDPS Y6, Y30, K2, Y30                            // 62610c2254f6
+       VANDPS 15(R8)(R14*4), Y30, K2, Y30                 // 62010c2254b4b00f000000
+       VANDPS -7(CX)(DX*4), Y30, K2, Y30                  // 62610c2254b491f9ffffff
+       VANDPS Y31, Y16, K2, Y26                           // 62017c2254d7
+       VANDPS Y22, Y16, K2, Y26                           // 62217c2254d6
+       VANDPS Y6, Y16, K2, Y26                            // 62617c2254d6
+       VANDPS 15(R8)(R14*4), Y16, K2, Y26                 // 62017c225494b00f000000
+       VANDPS -7(CX)(DX*4), Y16, K2, Y26                  // 62617c22549491f9ffffff
+       VANDPS Y31, Y1, K2, Y26                            // 6201742a54d7
+       VANDPS Y22, Y1, K2, Y26                            // 6221742a54d6
+       VANDPS Y6, Y1, K2, Y26                             // 6261742a54d6
+       VANDPS 15(R8)(R14*4), Y1, K2, Y26                  // 6201742a5494b00f000000
+       VANDPS -7(CX)(DX*4), Y1, K2, Y26                   // 6261742a549491f9ffffff
+       VANDPS Y31, Y30, K2, Y26                           // 62010c2254d7
+       VANDPS Y22, Y30, K2, Y26                           // 62210c2254d6
+       VANDPS Y6, Y30, K2, Y26                            // 62610c2254d6
+       VANDPS 15(R8)(R14*4), Y30, K2, Y26                 // 62010c225494b00f000000
+       VANDPS -7(CX)(DX*4), Y30, K2, Y26                  // 62610c22549491f9ffffff
+       VANDPS Y31, Y16, K2, Y7                            // 62917c2254ff
+       VANDPS Y22, Y16, K2, Y7                            // 62b17c2254fe
+       VANDPS Y6, Y16, K2, Y7                             // 62f17c2254fe
+       VANDPS 15(R8)(R14*4), Y16, K2, Y7                  // 62917c2254bcb00f000000
+       VANDPS -7(CX)(DX*4), Y16, K2, Y7                   // 62f17c2254bc91f9ffffff
+       VANDPS Y31, Y1, K2, Y7                             // 6291742a54ff
+       VANDPS Y22, Y1, K2, Y7                             // 62b1742a54fe
+       VANDPS Y6, Y1, K2, Y7                              // 62f1742a54fe
+       VANDPS 15(R8)(R14*4), Y1, K2, Y7                   // 6291742a54bcb00f000000
+       VANDPS -7(CX)(DX*4), Y1, K2, Y7                    // 62f1742a54bc91f9ffffff
+       VANDPS Y31, Y30, K2, Y7                            // 62910c2254ff
+       VANDPS Y22, Y30, K2, Y7                            // 62b10c2254fe
+       VANDPS Y6, Y30, K2, Y7                             // 62f10c2254fe
+       VANDPS 15(R8)(R14*4), Y30, K2, Y7                  // 62910c2254bcb00f000000
+       VANDPS -7(CX)(DX*4), Y30, K2, Y7                   // 62f10c2254bc91f9ffffff
+       VANDPS Z6, Z6, K5, Z7                              // 62f14c4d54fe
+       VANDPS Z22, Z6, K5, Z7                             // 62b14c4d54fe
+       VANDPS 15(R8)(R14*4), Z6, K5, Z7                   // 62914c4d54bcb00f000000
+       VANDPS -7(CX)(DX*4), Z6, K5, Z7                    // 62f14c4d54bc91f9ffffff
+       VANDPS Z6, Z16, K5, Z7                             // 62f17c4554fe
+       VANDPS Z22, Z16, K5, Z7                            // 62b17c4554fe
+       VANDPS 15(R8)(R14*4), Z16, K5, Z7                  // 62917c4554bcb00f000000
+       VANDPS -7(CX)(DX*4), Z16, K5, Z7                   // 62f17c4554bc91f9ffffff
+       VANDPS Z6, Z6, K5, Z13                             // 62714c4d54ee
+       VANDPS Z22, Z6, K5, Z13                            // 62314c4d54ee
+       VANDPS 15(R8)(R14*4), Z6, K5, Z13                  // 62114c4d54acb00f000000
+       VANDPS -7(CX)(DX*4), Z6, K5, Z13                   // 62714c4d54ac91f9ffffff
+       VANDPS Z6, Z16, K5, Z13                            // 62717c4554ee
+       VANDPS Z22, Z16, K5, Z13                           // 62317c4554ee
+       VANDPS 15(R8)(R14*4), Z16, K5, Z13                 // 62117c4554acb00f000000
+       VANDPS -7(CX)(DX*4), Z16, K5, Z13                  // 62717c4554ac91f9ffffff
+       VBROADCASTF32X2 X16, K3, Y1                        // 62b27d2b19c8
+       VBROADCASTF32X2 X28, K3, Y1                        // 62927d2b19cc
+       VBROADCASTF32X2 X8, K3, Y1                         // 62d27d2b19c8
+       VBROADCASTF32X2 -17(BP)(SI*8), K3, Y1              // 62f27d2b198cf5efffffff
+       VBROADCASTF32X2 (R15), K3, Y1                      // 62d27d2b190f
+       VBROADCASTF32X2 X16, K3, Y27                       // 62227d2b19d8
+       VBROADCASTF32X2 X28, K3, Y27                       // 62027d2b19dc
+       VBROADCASTF32X2 X8, K3, Y27                        // 62427d2b19d8
+       VBROADCASTF32X2 -17(BP)(SI*8), K3, Y27             // 62627d2b199cf5efffffff
+       VBROADCASTF32X2 (R15), K3, Y27                     // 62427d2b191f
+       VBROADCASTF32X2 X16, K3, Y19                       // 62a27d2b19d8
+       VBROADCASTF32X2 X28, K3, Y19                       // 62827d2b19dc
+       VBROADCASTF32X2 X8, K3, Y19                        // 62c27d2b19d8
+       VBROADCASTF32X2 -17(BP)(SI*8), K3, Y19             // 62e27d2b199cf5efffffff
+       VBROADCASTF32X2 (R15), K3, Y19                     // 62c27d2b191f
+       VBROADCASTF32X2 X15, K2, Z1                        // 62d27d4a19cf
+       VBROADCASTF32X2 X11, K2, Z1                        // 62d27d4a19cb
+       VBROADCASTF32X2 X1, K2, Z1                         // 62f27d4a19c9
+       VBROADCASTF32X2 7(SI)(DI*8), K2, Z1                // 62f27d4a198cfe07000000
+       VBROADCASTF32X2 -15(R14), K2, Z1                   // 62d27d4a198ef1ffffff
+       VBROADCASTF32X2 X15, K2, Z3                        // 62d27d4a19df
+       VBROADCASTF32X2 X11, K2, Z3                        // 62d27d4a19db
+       VBROADCASTF32X2 X1, K2, Z3                         // 62f27d4a19d9
+       VBROADCASTF32X2 7(SI)(DI*8), K2, Z3                // 62f27d4a199cfe07000000
+       VBROADCASTF32X2 -15(R14), K2, Z3                   // 62d27d4a199ef1ffffff
+       VBROADCASTF32X8 -17(BP)(SI*2), K1, Z28             // 62627d491ba475efffffff
+       VBROADCASTF32X8 7(AX)(CX*2), K1, Z28               // 62627d491ba44807000000
+       VBROADCASTF32X8 -17(BP)(SI*2), K1, Z13             // 62727d491bac75efffffff
+       VBROADCASTF32X8 7(AX)(CX*2), K1, Z13               // 62727d491bac4807000000
+       VBROADCASTF64X2 -7(CX)(DX*1), K7, Y21              // 62e2fd2f1aac11f9ffffff
+       VBROADCASTF64X2 -15(R14)(R15*4), K7, Y21           // 6282fd2f1aacbef1ffffff
+       VBROADCASTF64X2 -7(CX)(DX*1), K7, Y7               // 62f2fd2f1abc11f9ffffff
+       VBROADCASTF64X2 -15(R14)(R15*4), K7, Y7            // 6292fd2f1abcbef1ffffff
+       VBROADCASTF64X2 -7(CX)(DX*1), K7, Y30              // 6262fd2f1ab411f9ffffff
+       VBROADCASTF64X2 -15(R14)(R15*4), K7, Y30           // 6202fd2f1ab4bef1ffffff
+       VBROADCASTF64X2 15(DX)(BX*1), K1, Z14              // 6272fd491ab41a0f000000
+       VBROADCASTF64X2 -7(CX)(DX*2), K1, Z14              // 6272fd491ab451f9ffffff
+       VBROADCASTF64X2 15(DX)(BX*1), K1, Z28              // 6262fd491aa41a0f000000
+       VBROADCASTF64X2 -7(CX)(DX*2), K1, Z28              // 6262fd491aa451f9ffffff
+       VBROADCASTI32X2 X14, K1, X19                       // 62c27d0959de
+       VBROADCASTI32X2 X0, K1, X19                        // 62e27d0959d8
+       VBROADCASTI32X2 7(SI)(DI*1), K1, X19               // 62e27d09599c3e07000000
+       VBROADCASTI32X2 15(DX)(BX*8), K1, X19              // 62e27d09599cda0f000000
+       VBROADCASTI32X2 X14, K1, X13                       // 62527d0959ee
+       VBROADCASTI32X2 X0, K1, X13                        // 62727d0959e8
+       VBROADCASTI32X2 7(SI)(DI*1), K1, X13               // 62727d0959ac3e07000000
+       VBROADCASTI32X2 15(DX)(BX*8), K1, X13              // 62727d0959acda0f000000
+       VBROADCASTI32X2 X14, K1, X2                        // 62d27d0959d6
+       VBROADCASTI32X2 X0, K1, X2                         // 62f27d0959d0
+       VBROADCASTI32X2 7(SI)(DI*1), K1, X2                // 62f27d0959943e07000000
+       VBROADCASTI32X2 15(DX)(BX*8), K1, X2               // 62f27d095994da0f000000
+       VBROADCASTI32X2 X25, K7, Y13                       // 62127d2f59e9
+       VBROADCASTI32X2 X11, K7, Y13                       // 62527d2f59eb
+       VBROADCASTI32X2 X17, K7, Y13                       // 62327d2f59e9
+       VBROADCASTI32X2 -7(DI)(R8*1), K7, Y13              // 62327d2f59ac07f9ffffff
+       VBROADCASTI32X2 (SP), K7, Y13                      // 62727d2f592c24
+       VBROADCASTI32X2 X25, K7, Y18                       // 62827d2f59d1
+       VBROADCASTI32X2 X11, K7, Y18                       // 62c27d2f59d3
+       VBROADCASTI32X2 X17, K7, Y18                       // 62a27d2f59d1
+       VBROADCASTI32X2 -7(DI)(R8*1), K7, Y18              // 62a27d2f599407f9ffffff
+       VBROADCASTI32X2 (SP), K7, Y18                      // 62e27d2f591424
+       VBROADCASTI32X2 X25, K7, Y24                       // 62027d2f59c1
+       VBROADCASTI32X2 X11, K7, Y24                       // 62427d2f59c3
+       VBROADCASTI32X2 X17, K7, Y24                       // 62227d2f59c1
+       VBROADCASTI32X2 -7(DI)(R8*1), K7, Y24              // 62227d2f598407f9ffffff
+       VBROADCASTI32X2 (SP), K7, Y24                      // 62627d2f590424
+       VBROADCASTI32X2 X18, K2, Z15                       // 62327d4a59fa
+       VBROADCASTI32X2 X11, K2, Z15                       // 62527d4a59fb
+       VBROADCASTI32X2 X9, K2, Z15                        // 62527d4a59f9
+       VBROADCASTI32X2 -7(CX), K2, Z15                    // 62727d4a59b9f9ffffff
+       VBROADCASTI32X2 15(DX)(BX*4), K2, Z15              // 62727d4a59bc9a0f000000
+       VBROADCASTI32X2 X18, K2, Z30                       // 62227d4a59f2
+       VBROADCASTI32X2 X11, K2, Z30                       // 62427d4a59f3
+       VBROADCASTI32X2 X9, K2, Z30                        // 62427d4a59f1
+       VBROADCASTI32X2 -7(CX), K2, Z30                    // 62627d4a59b1f9ffffff
+       VBROADCASTI32X2 15(DX)(BX*4), K2, Z30              // 62627d4a59b49a0f000000
+       VBROADCASTI32X8 (R14), K3, Z5                      // 62d27d4b5b2e
+       VBROADCASTI32X8 -7(DI)(R8*8), K3, Z5               // 62b27d4b5bacc7f9ffffff
+       VBROADCASTI32X8 (R14), K3, Z1                      // 62d27d4b5b0e
+       VBROADCASTI32X8 -7(DI)(R8*8), K3, Z1               // 62b27d4b5b8cc7f9ffffff
+       VBROADCASTI64X2 15(R8), K4, Y5                     // 62d2fd2c5aa80f000000
+       VBROADCASTI64X2 (BP), K4, Y5                       // 62f2fd2c5a6d00
+       VBROADCASTI64X2 15(R8), K4, Y24                    // 6242fd2c5a800f000000
+       VBROADCASTI64X2 (BP), K4, Y24                      // 6262fd2c5a4500
+       VBROADCASTI64X2 15(R8), K4, Y21                    // 62c2fd2c5aa80f000000
+       VBROADCASTI64X2 (BP), K4, Y21                      // 62e2fd2c5a6d00
+       VBROADCASTI64X2 15(R8)(R14*8), K5, Z3              // 6292fd4d5a9cf00f000000
+       VBROADCASTI64X2 -15(R14)(R15*2), K5, Z3            // 6292fd4d5a9c7ef1ffffff
+       VBROADCASTI64X2 15(R8)(R14*8), K5, Z5              // 6292fd4d5aacf00f000000
+       VBROADCASTI64X2 -15(R14)(R15*2), K5, Z5            // 6292fd4d5aac7ef1ffffff
+       VCVTPD2QQ X15, K7, X0                              // 62d1fd0f7bc7
+       VCVTPD2QQ X11, K7, X0                              // 62d1fd0f7bc3
+       VCVTPD2QQ X0, K7, X0                               // 62f1fd0f7bc0
+       VCVTPD2QQ -17(BP)(SI*8), K7, X0                    // 62f1fd0f7b84f5efffffff
+       VCVTPD2QQ (R15), K7, X0                            // 62d1fd0f7b07
+       VCVTPD2QQ X15, K7, X17                             // 62c1fd0f7bcf
+       VCVTPD2QQ X11, K7, X17                             // 62c1fd0f7bcb
+       VCVTPD2QQ X0, K7, X17                              // 62e1fd0f7bc8
+       VCVTPD2QQ -17(BP)(SI*8), K7, X17                   // 62e1fd0f7b8cf5efffffff
+       VCVTPD2QQ (R15), K7, X17                           // 62c1fd0f7b0f
+       VCVTPD2QQ X15, K7, X7                              // 62d1fd0f7bff
+       VCVTPD2QQ X11, K7, X7                              // 62d1fd0f7bfb
+       VCVTPD2QQ X0, K7, X7                               // 62f1fd0f7bf8
+       VCVTPD2QQ -17(BP)(SI*8), K7, X7                    // 62f1fd0f7bbcf5efffffff
+       VCVTPD2QQ (R15), K7, X7                            // 62d1fd0f7b3f
+       VCVTPD2QQ Y0, K2, Y6                               // 62f1fd2a7bf0
+       VCVTPD2QQ Y19, K2, Y6                              // 62b1fd2a7bf3
+       VCVTPD2QQ Y31, K2, Y6                              // 6291fd2a7bf7
+       VCVTPD2QQ -15(R14)(R15*1), K2, Y6                  // 6291fd2a7bb43ef1ffffff
+       VCVTPD2QQ -15(BX), K2, Y6                          // 62f1fd2a7bb3f1ffffff
+       VCVTPD2QQ Y0, K2, Y1                               // 62f1fd2a7bc8
+       VCVTPD2QQ Y19, K2, Y1                              // 62b1fd2a7bcb
+       VCVTPD2QQ Y31, K2, Y1                              // 6291fd2a7bcf
+       VCVTPD2QQ -15(R14)(R15*1), K2, Y1                  // 6291fd2a7b8c3ef1ffffff
+       VCVTPD2QQ -15(BX), K2, Y1                          // 62f1fd2a7b8bf1ffffff
+       VCVTPD2QQ Y0, K2, Y9                               // 6271fd2a7bc8
+       VCVTPD2QQ Y19, K2, Y9                              // 6231fd2a7bcb
+       VCVTPD2QQ Y31, K2, Y9                              // 6211fd2a7bcf
+       VCVTPD2QQ -15(R14)(R15*1), K2, Y9                  // 6211fd2a7b8c3ef1ffffff
+       VCVTPD2QQ -15(BX), K2, Y9                          // 6271fd2a7b8bf1ffffff
+       VCVTPD2QQ Z12, K5, Z14                             // 6251fd4d7bf4
+       VCVTPD2QQ Z13, K5, Z14                             // 6251fd4d7bf5
+       VCVTPD2QQ Z12, K5, Z13                             // 6251fd4d7bec
+       VCVTPD2QQ Z13, K5, Z13                             // 6251fd4d7bed
+       VCVTPD2QQ Z2, K3, Z21                              // 62e1fd4b7bea
+       VCVTPD2QQ Z7, K3, Z21                              // 62e1fd4b7bef
+       VCVTPD2QQ -17(BP), K3, Z21                         // 62e1fd4b7badefffffff
+       VCVTPD2QQ -15(R14)(R15*8), K3, Z21                 // 6281fd4b7bacfef1ffffff
+       VCVTPD2QQ Z2, K3, Z9                               // 6271fd4b7bca
+       VCVTPD2QQ Z7, K3, Z9                               // 6271fd4b7bcf
+       VCVTPD2QQ -17(BP), K3, Z9                          // 6271fd4b7b8defffffff
+       VCVTPD2QQ -15(R14)(R15*8), K3, Z9                  // 6211fd4b7b8cfef1ffffff
+       VCVTPD2UQQ X24, K3, X7                             // 6291fd0b79f8
+       VCVTPD2UQQ X7, K3, X7                              // 62f1fd0b79ff
+       VCVTPD2UQQ X0, K3, X7                              // 62f1fd0b79f8
+       VCVTPD2UQQ 7(SI)(DI*1), K3, X7                     // 62f1fd0b79bc3e07000000
+       VCVTPD2UQQ 15(DX)(BX*8), K3, X7                    // 62f1fd0b79bcda0f000000
+       VCVTPD2UQQ X24, K3, X13                            // 6211fd0b79e8
+       VCVTPD2UQQ X7, K3, X13                             // 6271fd0b79ef
+       VCVTPD2UQQ X0, K3, X13                             // 6271fd0b79e8
+       VCVTPD2UQQ 7(SI)(DI*1), K3, X13                    // 6271fd0b79ac3e07000000
+       VCVTPD2UQQ 15(DX)(BX*8), K3, X13                   // 6271fd0b79acda0f000000
+       VCVTPD2UQQ X24, K3, X8                             // 6211fd0b79c0
+       VCVTPD2UQQ X7, K3, X8                              // 6271fd0b79c7
+       VCVTPD2UQQ X0, K3, X8                              // 6271fd0b79c0
+       VCVTPD2UQQ 7(SI)(DI*1), K3, X8                     // 6271fd0b79843e07000000
+       VCVTPD2UQQ 15(DX)(BX*8), K3, X8                    // 6271fd0b7984da0f000000
+       VCVTPD2UQQ Y27, K3, Y28                            // 6201fd2b79e3
+       VCVTPD2UQQ Y0, K3, Y28                             // 6261fd2b79e0
+       VCVTPD2UQQ Y11, K3, Y28                            // 6241fd2b79e3
+       VCVTPD2UQQ (SI), K3, Y28                           // 6261fd2b7926
+       VCVTPD2UQQ 7(SI)(DI*2), K3, Y28                    // 6261fd2b79a47e07000000
+       VCVTPD2UQQ Y27, K3, Y2                             // 6291fd2b79d3
+       VCVTPD2UQQ Y0, K3, Y2                              // 62f1fd2b79d0
+       VCVTPD2UQQ Y11, K3, Y2                             // 62d1fd2b79d3
+       VCVTPD2UQQ (SI), K3, Y2                            // 62f1fd2b7916
+       VCVTPD2UQQ 7(SI)(DI*2), K3, Y2                     // 62f1fd2b79947e07000000
+       VCVTPD2UQQ Y27, K3, Y24                            // 6201fd2b79c3
+       VCVTPD2UQQ Y0, K3, Y24                             // 6261fd2b79c0
+       VCVTPD2UQQ Y11, K3, Y24                            // 6241fd2b79c3
+       VCVTPD2UQQ (SI), K3, Y24                           // 6261fd2b7906
+       VCVTPD2UQQ 7(SI)(DI*2), K3, Y24                    // 6261fd2b79847e07000000
+       VCVTPD2UQQ Z3, K2, Z27                             // 6261fd4a79db
+       VCVTPD2UQQ Z0, K2, Z27                             // 6261fd4a79d8
+       VCVTPD2UQQ Z3, K2, Z14                             // 6271fd4a79f3
+       VCVTPD2UQQ Z0, K2, Z14                             // 6271fd4a79f0
+       VCVTPD2UQQ Z8, K1, Z14                             // 6251fd4979f0
+       VCVTPD2UQQ Z24, K1, Z14                            // 6211fd4979f0
+       VCVTPD2UQQ 15(R8), K1, Z14                         // 6251fd4979b00f000000
+       VCVTPD2UQQ (BP), K1, Z14                           // 6271fd49797500
+       VCVTPD2UQQ Z8, K1, Z7                              // 62d1fd4979f8
+       VCVTPD2UQQ Z24, K1, Z7                             // 6291fd4979f8
+       VCVTPD2UQQ 15(R8), K1, Z7                          // 62d1fd4979b80f000000
+       VCVTPD2UQQ (BP), K1, Z7                            // 62f1fd49797d00
+       VCVTPS2QQ X19, K3, X15                             // 62317d0b7bfb
+       VCVTPS2QQ X13, K3, X15                             // 62517d0b7bfd
+       VCVTPS2QQ X2, K3, X15                              // 62717d0b7bfa
+       VCVTPS2QQ (BX), K3, X15                            // 62717d0b7b3b
+       VCVTPS2QQ -17(BP)(SI*1), K3, X15                   // 62717d0b7bbc35efffffff
+       VCVTPS2QQ X19, K3, X11                             // 62317d0b7bdb
+       VCVTPS2QQ X13, K3, X11                             // 62517d0b7bdd
+       VCVTPS2QQ X2, K3, X11                              // 62717d0b7bda
+       VCVTPS2QQ (BX), K3, X11                            // 62717d0b7b1b
+       VCVTPS2QQ -17(BP)(SI*1), K3, X11                   // 62717d0b7b9c35efffffff
+       VCVTPS2QQ X19, K3, X1                              // 62b17d0b7bcb
+       VCVTPS2QQ X13, K3, X1                              // 62d17d0b7bcd
+       VCVTPS2QQ X2, K3, X1                               // 62f17d0b7bca
+       VCVTPS2QQ (BX), K3, X1                             // 62f17d0b7b0b
+       VCVTPS2QQ -17(BP)(SI*1), K3, X1                    // 62f17d0b7b8c35efffffff
+       VCVTPS2QQ X14, K7, Y20                             // 62c17d2f7be6
+       VCVTPS2QQ X0, K7, Y20                              // 62e17d2f7be0
+       VCVTPS2QQ 99(R15)(R15*1), K7, Y20                  // 62817d2f7ba43f63000000
+       VCVTPS2QQ (DX), K7, Y20                            // 62e17d2f7b22
+       VCVTPS2QQ X14, K7, Y12                             // 62517d2f7be6
+       VCVTPS2QQ X0, K7, Y12                              // 62717d2f7be0
+       VCVTPS2QQ 99(R15)(R15*1), K7, Y12                  // 62117d2f7ba43f63000000
+       VCVTPS2QQ (DX), K7, Y12                            // 62717d2f7b22
+       VCVTPS2QQ X14, K7, Y3                              // 62d17d2f7bde
+       VCVTPS2QQ X0, K7, Y3                               // 62f17d2f7bd8
+       VCVTPS2QQ 99(R15)(R15*1), K7, Y3                   // 62917d2f7b9c3f63000000
+       VCVTPS2QQ (DX), K7, Y3                             // 62f17d2f7b1a
+       VCVTPS2QQ Y5, K4, Z6                               // 62f17d4c7bf5
+       VCVTPS2QQ Y28, K4, Z6                              // 62917d4c7bf4
+       VCVTPS2QQ Y7, K4, Z6                               // 62f17d4c7bf7
+       VCVTPS2QQ Y5, K4, Z14                              // 62717d4c7bf5
+       VCVTPS2QQ Y28, K4, Z14                             // 62117d4c7bf4
+       VCVTPS2QQ Y7, K4, Z14                              // 62717d4c7bf7
+       VCVTPS2QQ Y0, K4, Z26                              // 62617d4c7bd0
+       VCVTPS2QQ Y22, K4, Z26                             // 62217d4c7bd6
+       VCVTPS2QQ Y13, K4, Z26                             // 62417d4c7bd5
+       VCVTPS2QQ 7(AX)(CX*4), K4, Z26                     // 62617d4c7b948807000000
+       VCVTPS2QQ 7(AX)(CX*1), K4, Z26                     // 62617d4c7b940807000000
+       VCVTPS2QQ Y0, K4, Z14                              // 62717d4c7bf0
+       VCVTPS2QQ Y22, K4, Z14                             // 62317d4c7bf6
+       VCVTPS2QQ Y13, K4, Z14                             // 62517d4c7bf5
+       VCVTPS2QQ 7(AX)(CX*4), K4, Z14                     // 62717d4c7bb48807000000
+       VCVTPS2QQ 7(AX)(CX*1), K4, Z14                     // 62717d4c7bb40807000000
+       VCVTPS2UQQ X2, K4, X2                              // 62f17d0c79d2
+       VCVTPS2UQQ X27, K4, X2                             // 62917d0c79d3
+       VCVTPS2UQQ X26, K4, X2                             // 62917d0c79d2
+       VCVTPS2UQQ (R8), K4, X2                            // 62d17d0c7910
+       VCVTPS2UQQ 15(DX)(BX*2), K4, X2                    // 62f17d0c79945a0f000000
+       VCVTPS2UQQ X2, K4, X24                             // 62617d0c79c2
+       VCVTPS2UQQ X27, K4, X24                            // 62017d0c79c3
+       VCVTPS2UQQ X26, K4, X24                            // 62017d0c79c2
+       VCVTPS2UQQ (R8), K4, X24                           // 62417d0c7900
+       VCVTPS2UQQ 15(DX)(BX*2), K4, X24                   // 62617d0c79845a0f000000
+       VCVTPS2UQQ X22, K2, Y31                            // 62217d2a79fe
+       VCVTPS2UQQ X30, K2, Y31                            // 62017d2a79fe
+       VCVTPS2UQQ X3, K2, Y31                             // 62617d2a79fb
+       VCVTPS2UQQ 7(SI)(DI*8), K2, Y31                    // 62617d2a79bcfe07000000
+       VCVTPS2UQQ -15(R14), K2, Y31                       // 62417d2a79bef1ffffff
+       VCVTPS2UQQ X22, K2, Y8                             // 62317d2a79c6
+       VCVTPS2UQQ X30, K2, Y8                             // 62117d2a79c6
+       VCVTPS2UQQ X3, K2, Y8                              // 62717d2a79c3
+       VCVTPS2UQQ 7(SI)(DI*8), K2, Y8                     // 62717d2a7984fe07000000
+       VCVTPS2UQQ -15(R14), K2, Y8                        // 62517d2a7986f1ffffff
+       VCVTPS2UQQ X22, K2, Y1                             // 62b17d2a79ce
+       VCVTPS2UQQ X30, K2, Y1                             // 62917d2a79ce
+       VCVTPS2UQQ X3, K2, Y1                              // 62f17d2a79cb
+       VCVTPS2UQQ 7(SI)(DI*8), K2, Y1                     // 62f17d2a798cfe07000000
+       VCVTPS2UQQ -15(R14), K2, Y1                        // 62d17d2a798ef1ffffff
+       VCVTPS2UQQ Y28, K2, Z21                            // 62817d4a79ec
+       VCVTPS2UQQ Y13, K2, Z21                            // 62c17d4a79ed
+       VCVTPS2UQQ Y7, K2, Z21                             // 62e17d4a79ef
+       VCVTPS2UQQ Y28, K2, Z13                            // 62117d4a79ec
+       VCVTPS2UQQ Y13, K2, Z13                            // 62517d4a79ed
+       VCVTPS2UQQ Y7, K2, Z13                             // 62717d4a79ef
+       VCVTPS2UQQ Y2, K3, Z11                             // 62717d4b79da
+       VCVTPS2UQQ Y21, K3, Z11                            // 62317d4b79dd
+       VCVTPS2UQQ Y12, K3, Z11                            // 62517d4b79dc
+       VCVTPS2UQQ 17(SP)(BP*8), K3, Z11                   // 62717d4b799cec11000000
+       VCVTPS2UQQ 17(SP)(BP*4), K3, Z11                   // 62717d4b799cac11000000
+       VCVTPS2UQQ Y2, K3, Z25                             // 62617d4b79ca
+       VCVTPS2UQQ Y21, K3, Z25                            // 62217d4b79cd
+       VCVTPS2UQQ Y12, K3, Z25                            // 62417d4b79cc
+       VCVTPS2UQQ 17(SP)(BP*8), K3, Z25                   // 62617d4b798cec11000000
+       VCVTPS2UQQ 17(SP)(BP*4), K3, Z25                   // 62617d4b798cac11000000
+       VCVTQQ2PD X13, K3, X11                             // 6251fe0be6dd
+       VCVTQQ2PD X6, K3, X11                              // 6271fe0be6de
+       VCVTQQ2PD X12, K3, X11                             // 6251fe0be6dc
+       VCVTQQ2PD 17(SP)(BP*1), K3, X11                    // 6271fe0be69c2c11000000
+       VCVTQQ2PD -7(CX)(DX*8), K3, X11                    // 6271fe0be69cd1f9ffffff
+       VCVTQQ2PD X13, K3, X15                             // 6251fe0be6fd
+       VCVTQQ2PD X6, K3, X15                              // 6271fe0be6fe
+       VCVTQQ2PD X12, K3, X15                             // 6251fe0be6fc
+       VCVTQQ2PD 17(SP)(BP*1), K3, X15                    // 6271fe0be6bc2c11000000
+       VCVTQQ2PD -7(CX)(DX*8), K3, X15                    // 6271fe0be6bcd1f9ffffff
+       VCVTQQ2PD X13, K3, X30                             // 6241fe0be6f5
+       VCVTQQ2PD X6, K3, X30                              // 6261fe0be6f6
+       VCVTQQ2PD X12, K3, X30                             // 6241fe0be6f4
+       VCVTQQ2PD 17(SP)(BP*1), K3, X30                    // 6261fe0be6b42c11000000
+       VCVTQQ2PD -7(CX)(DX*8), K3, X30                    // 6261fe0be6b4d1f9ffffff
+       VCVTQQ2PD Y3, K3, Y9                               // 6271fe2be6cb
+       VCVTQQ2PD Y2, K3, Y9                               // 6271fe2be6ca
+       VCVTQQ2PD Y9, K3, Y9                               // 6251fe2be6c9
+       VCVTQQ2PD 7(SI)(DI*1), K3, Y9                      // 6271fe2be68c3e07000000
+       VCVTQQ2PD 15(DX)(BX*8), K3, Y9                     // 6271fe2be68cda0f000000
+       VCVTQQ2PD Y3, K3, Y1                               // 62f1fe2be6cb
+       VCVTQQ2PD Y2, K3, Y1                               // 62f1fe2be6ca
+       VCVTQQ2PD Y9, K3, Y1                               // 62d1fe2be6c9
+       VCVTQQ2PD 7(SI)(DI*1), K3, Y1                      // 62f1fe2be68c3e07000000
+       VCVTQQ2PD 15(DX)(BX*8), K3, Y1                     // 62f1fe2be68cda0f000000
+       VCVTQQ2PD Z27, K2, Z3                              // 6291fe4ae6db
+       VCVTQQ2PD Z15, K2, Z3                              // 62d1fe4ae6df
+       VCVTQQ2PD Z27, K2, Z12                             // 6211fe4ae6e3
+       VCVTQQ2PD Z15, K2, Z12                             // 6251fe4ae6e7
+       VCVTQQ2PD Z23, K1, Z23                             // 62a1fe49e6ff
+       VCVTQQ2PD Z6, K1, Z23                              // 62e1fe49e6fe
+       VCVTQQ2PD 7(SI)(DI*4), K1, Z23                     // 62e1fe49e6bcbe07000000
+       VCVTQQ2PD -7(DI)(R8*2), K1, Z23                    // 62a1fe49e6bc47f9ffffff
+       VCVTQQ2PD Z23, K1, Z5                              // 62b1fe49e6ef
+       VCVTQQ2PD Z6, K1, Z5                               // 62f1fe49e6ee
+       VCVTQQ2PD 7(SI)(DI*4), K1, Z5                      // 62f1fe49e6acbe07000000
+       VCVTQQ2PD -7(DI)(R8*2), K1, Z5                     // 62b1fe49e6ac47f9ffffff
+       VCVTQQ2PS Z8, K2, Y12                              // 6251fc4a5be0
+       VCVTQQ2PS Z28, K2, Y12                             // 6211fc4a5be4
+       VCVTQQ2PS Z8, K2, Y21                              // 62c1fc4a5be8
+       VCVTQQ2PS Z28, K2, Y21                             // 6281fc4a5bec
+       VCVTQQ2PS Z8, K2, Y14                              // 6251fc4a5bf0
+       VCVTQQ2PS Z28, K2, Y14                             // 6211fc4a5bf4
+       VCVTQQ2PS Z21, K1, Y30                             // 6221fc495bf5
+       VCVTQQ2PS Z5, K1, Y30                              // 6261fc495bf5
+       VCVTQQ2PS 17(SP), K1, Y30                          // 6261fc495bb42411000000
+       VCVTQQ2PS -17(BP)(SI*4), K1, Y30                   // 6261fc495bb4b5efffffff
+       VCVTQQ2PS Z21, K1, Y26                             // 6221fc495bd5
+       VCVTQQ2PS Z5, K1, Y26                              // 6261fc495bd5
+       VCVTQQ2PS 17(SP), K1, Y26                          // 6261fc495b942411000000
+       VCVTQQ2PS -17(BP)(SI*4), K1, Y26                   // 6261fc495b94b5efffffff
+       VCVTQQ2PS Z21, K1, Y7                              // 62b1fc495bfd
+       VCVTQQ2PS Z5, K1, Y7                               // 62f1fc495bfd
+       VCVTQQ2PS 17(SP), K1, Y7                           // 62f1fc495bbc2411000000
+       VCVTQQ2PS -17(BP)(SI*4), K1, Y7                    // 62f1fc495bbcb5efffffff
+       VCVTQQ2PSX X20, K7, X23                            // 62a1fc0f5bfc
+       VCVTQQ2PSX X2, K7, X23                             // 62e1fc0f5bfa
+       VCVTQQ2PSX X9, K7, X23                             // 62c1fc0f5bf9
+       VCVTQQ2PSX -17(BP)(SI*2), K7, X23                  // 62e1fc0f5bbc75efffffff
+       VCVTQQ2PSX 7(AX)(CX*2), K7, X23                    // 62e1fc0f5bbc4807000000
+       VCVTQQ2PSX X20, K7, X30                            // 6221fc0f5bf4
+       VCVTQQ2PSX X2, K7, X30                             // 6261fc0f5bf2
+       VCVTQQ2PSX X9, K7, X30                             // 6241fc0f5bf1
+       VCVTQQ2PSX -17(BP)(SI*2), K7, X30                  // 6261fc0f5bb475efffffff
+       VCVTQQ2PSX 7(AX)(CX*2), K7, X30                    // 6261fc0f5bb44807000000
+       VCVTQQ2PSX X20, K7, X8                             // 6231fc0f5bc4
+       VCVTQQ2PSX X2, K7, X8                              // 6271fc0f5bc2
+       VCVTQQ2PSX X9, K7, X8                              // 6251fc0f5bc1
+       VCVTQQ2PSX -17(BP)(SI*2), K7, X8                   // 6271fc0f5b8475efffffff
+       VCVTQQ2PSX 7(AX)(CX*2), K7, X8                     // 6271fc0f5b844807000000
+       VCVTQQ2PSY Y16, K1, X26                            // 6221fc295bd0
+       VCVTQQ2PSY Y1, K1, X26                             // 6261fc295bd1
+       VCVTQQ2PSY Y30, K1, X26                            // 6201fc295bd6
+       VCVTQQ2PSY -7(DI)(R8*1), K1, X26                   // 6221fc295b9407f9ffffff
+       VCVTQQ2PSY (SP), K1, X26                           // 6261fc295b1424
+       VCVTQQ2PSY Y16, K1, X19                            // 62a1fc295bd8
+       VCVTQQ2PSY Y1, K1, X19                             // 62e1fc295bd9
+       VCVTQQ2PSY Y30, K1, X19                            // 6281fc295bde
+       VCVTQQ2PSY -7(DI)(R8*1), K1, X19                   // 62a1fc295b9c07f9ffffff
+       VCVTQQ2PSY (SP), K1, X19                           // 62e1fc295b1c24
+       VCVTQQ2PSY Y16, K1, X0                             // 62b1fc295bc0
+       VCVTQQ2PSY Y1, K1, X0                              // 62f1fc295bc1
+       VCVTQQ2PSY Y30, K1, X0                             // 6291fc295bc6
+       VCVTQQ2PSY -7(DI)(R8*1), K1, X0                    // 62b1fc295b8407f9ffffff
+       VCVTQQ2PSY (SP), K1, X0                            // 62f1fc295b0424
+       VCVTTPD2QQ X6, K5, X6                              // 62f1fd0d7af6
+       VCVTTPD2QQ X1, K5, X6                              // 62f1fd0d7af1
+       VCVTTPD2QQ X8, K5, X6                              // 62d1fd0d7af0
+       VCVTTPD2QQ (R14), K5, X6                           // 62d1fd0d7a36
+       VCVTTPD2QQ -7(DI)(R8*8), K5, X6                    // 62b1fd0d7ab4c7f9ffffff
+       VCVTTPD2QQ X6, K5, X17                             // 62e1fd0d7ace
+       VCVTTPD2QQ X1, K5, X17                             // 62e1fd0d7ac9
+       VCVTTPD2QQ X8, K5, X17                             // 62c1fd0d7ac8
+       VCVTTPD2QQ (R14), K5, X17                          // 62c1fd0d7a0e
+       VCVTTPD2QQ -7(DI)(R8*8), K5, X17                   // 62a1fd0d7a8cc7f9ffffff
+       VCVTTPD2QQ X6, K5, X28                             // 6261fd0d7ae6
+       VCVTTPD2QQ X1, K5, X28                             // 6261fd0d7ae1
+       VCVTTPD2QQ X8, K5, X28                             // 6241fd0d7ae0
+       VCVTTPD2QQ (R14), K5, X28                          // 6241fd0d7a26
+       VCVTTPD2QQ -7(DI)(R8*8), K5, X28                   // 6221fd0d7aa4c7f9ffffff
+       VCVTTPD2QQ Y14, K7, Y24                            // 6241fd2f7ac6
+       VCVTTPD2QQ Y21, K7, Y24                            // 6221fd2f7ac5
+       VCVTTPD2QQ Y1, K7, Y24                             // 6261fd2f7ac1
+       VCVTTPD2QQ 99(R15)(R15*8), K7, Y24                 // 6201fd2f7a84ff63000000
+       VCVTTPD2QQ 7(AX)(CX*8), K7, Y24                    // 6261fd2f7a84c807000000
+       VCVTTPD2QQ Y14, K7, Y13                            // 6251fd2f7aee
+       VCVTTPD2QQ Y21, K7, Y13                            // 6231fd2f7aed
+       VCVTTPD2QQ Y1, K7, Y13                             // 6271fd2f7ae9
+       VCVTTPD2QQ 99(R15)(R15*8), K7, Y13                 // 6211fd2f7aacff63000000
+       VCVTTPD2QQ 7(AX)(CX*8), K7, Y13                    // 6271fd2f7aacc807000000
+       VCVTTPD2QQ Y14, K7, Y20                            // 62c1fd2f7ae6
+       VCVTTPD2QQ Y21, K7, Y20                            // 62a1fd2f7ae5
+       VCVTTPD2QQ Y1, K7, Y20                             // 62e1fd2f7ae1
+       VCVTTPD2QQ 99(R15)(R15*8), K7, Y20                 // 6281fd2f7aa4ff63000000
+       VCVTTPD2QQ 7(AX)(CX*8), K7, Y20                    // 62e1fd2f7aa4c807000000
+       VCVTTPD2QQ Z6, K7, Z22                             // 62e1fd4f7af6
+       VCVTTPD2QQ Z8, K7, Z22                             // 62c1fd4f7af0
+       VCVTTPD2QQ Z6, K7, Z11                             // 6271fd4f7ade
+       VCVTTPD2QQ Z8, K7, Z11                             // 6251fd4f7ad8
+       VCVTTPD2QQ Z12, K6, Z25                            // 6241fd4e7acc
+       VCVTTPD2QQ Z17, K6, Z25                            // 6221fd4e7ac9
+       VCVTTPD2QQ 99(R15)(R15*1), K6, Z25                 // 6201fd4e7a8c3f63000000
+       VCVTTPD2QQ (DX), K6, Z25                           // 6261fd4e7a0a
+       VCVTTPD2QQ Z12, K6, Z12                            // 6251fd4e7ae4
+       VCVTTPD2QQ Z17, K6, Z12                            // 6231fd4e7ae1
+       VCVTTPD2QQ 99(R15)(R15*1), K6, Z12                 // 6211fd4e7aa43f63000000
+       VCVTTPD2QQ (DX), K6, Z12                           // 6271fd4e7a22
+       VCVTTPD2UQQ X15, K7, X16                           // 62c1fd0f78c7
+       VCVTTPD2UQQ X11, K7, X16                           // 62c1fd0f78c3
+       VCVTTPD2UQQ X1, K7, X16                            // 62e1fd0f78c1
+       VCVTTPD2UQQ (CX), K7, X16                          // 62e1fd0f7801
+       VCVTTPD2UQQ 99(R15), K7, X16                       // 62c1fd0f788763000000
+       VCVTTPD2UQQ X15, K7, X28                           // 6241fd0f78e7
+       VCVTTPD2UQQ X11, K7, X28                           // 6241fd0f78e3
+       VCVTTPD2UQQ X1, K7, X28                            // 6261fd0f78e1
+       VCVTTPD2UQQ (CX), K7, X28                          // 6261fd0f7821
+       VCVTTPD2UQQ 99(R15), K7, X28                       // 6241fd0f78a763000000
+       VCVTTPD2UQQ X15, K7, X8                            // 6251fd0f78c7
+       VCVTTPD2UQQ X11, K7, X8                            // 6251fd0f78c3
+       VCVTTPD2UQQ X1, K7, X8                             // 6271fd0f78c1
+       VCVTTPD2UQQ (CX), K7, X8                           // 6271fd0f7801
+       VCVTTPD2UQQ 99(R15), K7, X8                        // 6251fd0f788763000000
+       VCVTTPD2UQQ Y21, K2, Y5                            // 62b1fd2a78ed
+       VCVTTPD2UQQ Y7, K2, Y5                             // 62f1fd2a78ef
+       VCVTTPD2UQQ Y30, K2, Y5                            // 6291fd2a78ee
+       VCVTTPD2UQQ (BX), K2, Y5                           // 62f1fd2a782b
+       VCVTTPD2UQQ -17(BP)(SI*1), K2, Y5                  // 62f1fd2a78ac35efffffff
+       VCVTTPD2UQQ Y21, K2, Y17                           // 62a1fd2a78cd
+       VCVTTPD2UQQ Y7, K2, Y17                            // 62e1fd2a78cf
+       VCVTTPD2UQQ Y30, K2, Y17                           // 6281fd2a78ce
+       VCVTTPD2UQQ (BX), K2, Y17                          // 62e1fd2a780b
+       VCVTTPD2UQQ -17(BP)(SI*1), K2, Y17                 // 62e1fd2a788c35efffffff
+       VCVTTPD2UQQ Y21, K2, Y13                           // 6231fd2a78ed
+       VCVTTPD2UQQ Y7, K2, Y13                            // 6271fd2a78ef
+       VCVTTPD2UQQ Y30, K2, Y13                           // 6211fd2a78ee
+       VCVTTPD2UQQ (BX), K2, Y13                          // 6271fd2a782b
+       VCVTTPD2UQQ -17(BP)(SI*1), K2, Y13                 // 6271fd2a78ac35efffffff
+       VCVTTPD2UQQ Z8, K5, Z3                             // 62d1fd4d78d8
+       VCVTTPD2UQQ Z2, K5, Z3                             // 62f1fd4d78da
+       VCVTTPD2UQQ Z8, K5, Z21                            // 62c1fd4d78e8
+       VCVTTPD2UQQ Z2, K5, Z21                            // 62e1fd4d78ea
+       VCVTTPD2UQQ Z7, K3, Z3                             // 62f1fd4b78df
+       VCVTTPD2UQQ Z9, K3, Z3                             // 62d1fd4b78d9
+       VCVTTPD2UQQ 7(SI)(DI*8), K3, Z3                    // 62f1fd4b789cfe07000000
+       VCVTTPD2UQQ -15(R14), K3, Z3                       // 62d1fd4b789ef1ffffff
+       VCVTTPD2UQQ Z7, K3, Z27                            // 6261fd4b78df
+       VCVTTPD2UQQ Z9, K3, Z27                            // 6241fd4b78d9
+       VCVTTPD2UQQ 7(SI)(DI*8), K3, Z27                   // 6261fd4b789cfe07000000
+       VCVTTPD2UQQ -15(R14), K3, Z27                      // 6241fd4b789ef1ffffff
+       VCVTTPS2QQ X18, K3, X25                            // 62217d0b7aca
+       VCVTTPS2QQ X11, K3, X25                            // 62417d0b7acb
+       VCVTTPS2QQ X9, K3, X25                             // 62417d0b7ac9
+       VCVTTPS2QQ -7(CX)(DX*1), K3, X25                   // 62617d0b7a8c11f9ffffff
+       VCVTTPS2QQ -15(R14)(R15*4), K3, X25                // 62017d0b7a8cbef1ffffff
+       VCVTTPS2QQ X18, K3, X11                            // 62317d0b7ada
+       VCVTTPS2QQ X11, K3, X11                            // 62517d0b7adb
+       VCVTTPS2QQ X9, K3, X11                             // 62517d0b7ad9
+       VCVTTPS2QQ -7(CX)(DX*1), K3, X11                   // 62717d0b7a9c11f9ffffff
+       VCVTTPS2QQ -15(R14)(R15*4), K3, X11                // 62117d0b7a9cbef1ffffff
+       VCVTTPS2QQ X18, K3, X17                            // 62a17d0b7aca
+       VCVTTPS2QQ X11, K3, X17                            // 62c17d0b7acb
+       VCVTTPS2QQ X9, K3, X17                             // 62c17d0b7ac9
+       VCVTTPS2QQ -7(CX)(DX*1), K3, X17                   // 62e17d0b7a8c11f9ffffff
+       VCVTTPS2QQ -15(R14)(R15*4), K3, X17                // 62817d0b7a8cbef1ffffff
+       VCVTTPS2QQ X2, K3, Y5                              // 62f17d2b7aea
+       VCVTTPS2QQ X24, K3, Y5                             // 62917d2b7ae8
+       VCVTTPS2QQ (R8), K3, Y5                            // 62d17d2b7a28
+       VCVTTPS2QQ 15(DX)(BX*2), K3, Y5                    // 62f17d2b7aac5a0f000000
+       VCVTTPS2QQ X2, K3, Y24                             // 62617d2b7ac2
+       VCVTTPS2QQ X24, K3, Y24                            // 62017d2b7ac0
+       VCVTTPS2QQ (R8), K3, Y24                           // 62417d2b7a00
+       VCVTTPS2QQ 15(DX)(BX*2), K3, Y24                   // 62617d2b7a845a0f000000
+       VCVTTPS2QQ X2, K3, Y21                             // 62e17d2b7aea
+       VCVTTPS2QQ X24, K3, Y21                            // 62817d2b7ae8
+       VCVTTPS2QQ (R8), K3, Y21                           // 62c17d2b7a28
+       VCVTTPS2QQ 15(DX)(BX*2), K3, Y21                   // 62e17d2b7aac5a0f000000
+       VCVTTPS2QQ Y16, K2, Z12                            // 62317d4a7ae0
+       VCVTTPS2QQ Y9, K2, Z12                             // 62517d4a7ae1
+       VCVTTPS2QQ Y13, K2, Z12                            // 62517d4a7ae5
+       VCVTTPS2QQ Y16, K2, Z22                            // 62a17d4a7af0
+       VCVTTPS2QQ Y9, K2, Z22                             // 62c17d4a7af1
+       VCVTTPS2QQ Y13, K2, Z22                            // 62c17d4a7af5
+       VCVTTPS2QQ Y9, K1, Z11                             // 62517d497ad9
+       VCVTTPS2QQ Y6, K1, Z11                             // 62717d497ade
+       VCVTTPS2QQ Y3, K1, Z11                             // 62717d497adb
+       VCVTTPS2QQ -7(DI)(R8*1), K1, Z11                   // 62317d497a9c07f9ffffff
+       VCVTTPS2QQ (SP), K1, Z11                           // 62717d497a1c24
+       VCVTTPS2QQ Y9, K1, Z5                              // 62d17d497ae9
+       VCVTTPS2QQ Y6, K1, Z5                              // 62f17d497aee
+       VCVTTPS2QQ Y3, K1, Z5                              // 62f17d497aeb
+       VCVTTPS2QQ -7(DI)(R8*1), K1, Z5                    // 62b17d497aac07f9ffffff
+       VCVTTPS2QQ (SP), K1, Z5                            // 62f17d497a2c24
+       VCVTTPS2UQQ X13, K1, X11                           // 62517d0978dd
+       VCVTTPS2UQQ X6, K1, X11                            // 62717d0978de
+       VCVTTPS2UQQ X12, K1, X11                           // 62517d0978dc
+       VCVTTPS2UQQ -17(BP), K1, X11                       // 62717d09789defffffff
+       VCVTTPS2UQQ -15(R14)(R15*8), K1, X11               // 62117d09789cfef1ffffff
+       VCVTTPS2UQQ X13, K1, X15                           // 62517d0978fd
+       VCVTTPS2UQQ X6, K1, X15                            // 62717d0978fe
+       VCVTTPS2UQQ X12, K1, X15                           // 62517d0978fc
+       VCVTTPS2UQQ -17(BP), K1, X15                       // 62717d0978bdefffffff
+       VCVTTPS2UQQ -15(R14)(R15*8), K1, X15               // 62117d0978bcfef1ffffff
+       VCVTTPS2UQQ X13, K1, X30                           // 62417d0978f5
+       VCVTTPS2UQQ X6, K1, X30                            // 62617d0978f6
+       VCVTTPS2UQQ X12, K1, X30                           // 62417d0978f4
+       VCVTTPS2UQQ -17(BP), K1, X30                       // 62617d0978b5efffffff
+       VCVTTPS2UQQ -15(R14)(R15*8), K1, X30               // 62017d0978b4fef1ffffff
+       VCVTTPS2UQQ X23, K1, Y14                           // 62317d2978f7
+       VCVTTPS2UQQ X30, K1, Y14                           // 62117d2978f6
+       VCVTTPS2UQQ X8, K1, Y14                            // 62517d2978f0
+       VCVTTPS2UQQ -17(BP)(SI*2), K1, Y14                 // 62717d2978b475efffffff
+       VCVTTPS2UQQ 7(AX)(CX*2), K1, Y14                   // 62717d2978b44807000000
+       VCVTTPS2UQQ X23, K1, Y18                           // 62a17d2978d7
+       VCVTTPS2UQQ X30, K1, Y18                           // 62817d2978d6
+       VCVTTPS2UQQ X8, K1, Y18                            // 62c17d2978d0
+       VCVTTPS2UQQ -17(BP)(SI*2), K1, Y18                 // 62e17d29789475efffffff
+       VCVTTPS2UQQ 7(AX)(CX*2), K1, Y18                   // 62e17d2978944807000000
+       VCVTTPS2UQQ X23, K1, Y31                           // 62217d2978ff
+       VCVTTPS2UQQ X30, K1, Y31                           // 62017d2978fe
+       VCVTTPS2UQQ X8, K1, Y31                            // 62417d2978f8
+       VCVTTPS2UQQ -17(BP)(SI*2), K1, Y31                 // 62617d2978bc75efffffff
+       VCVTTPS2UQQ 7(AX)(CX*2), K1, Y31                   // 62617d2978bc4807000000
+       VCVTTPS2UQQ Y18, K7, Z6                            // 62b17d4f78f2
+       VCVTTPS2UQQ Y3, K7, Z6                             // 62f17d4f78f3
+       VCVTTPS2UQQ Y24, K7, Z6                            // 62917d4f78f0
+       VCVTTPS2UQQ Y18, K7, Z22                           // 62a17d4f78f2
+       VCVTTPS2UQQ Y3, K7, Z22                            // 62e17d4f78f3
+       VCVTTPS2UQQ Y24, K7, Z22                           // 62817d4f78f0
+       VCVTTPS2UQQ Y2, K2, Z1                             // 62f17d4a78ca
+       VCVTTPS2UQQ Y7, K2, Z1                             // 62f17d4a78cf
+       VCVTTPS2UQQ Y21, K2, Z1                            // 62b17d4a78cd
+       VCVTTPS2UQQ 99(R15)(R15*8), K2, Z1                 // 62917d4a788cff63000000
+       VCVTTPS2UQQ 7(AX)(CX*8), K2, Z1                    // 62f17d4a788cc807000000
+       VCVTTPS2UQQ Y2, K2, Z15                            // 62717d4a78fa
+       VCVTTPS2UQQ Y7, K2, Z15                            // 62717d4a78ff
+       VCVTTPS2UQQ Y21, K2, Z15                           // 62317d4a78fd
+       VCVTTPS2UQQ 99(R15)(R15*8), K2, Z15                // 62117d4a78bcff63000000
+       VCVTTPS2UQQ 7(AX)(CX*8), K2, Z15                   // 62717d4a78bcc807000000
+       VCVTUQQ2PD X13, K6, X21                            // 62c1fe0e7aed
+       VCVTUQQ2PD X0, K6, X21                             // 62e1fe0e7ae8
+       VCVTUQQ2PD X30, K6, X21                            // 6281fe0e7aee
+       VCVTUQQ2PD 15(R8)(R14*8), K6, X21                  // 6281fe0e7aacf00f000000
+       VCVTUQQ2PD -15(R14)(R15*2), K6, X21                // 6281fe0e7aac7ef1ffffff
+       VCVTUQQ2PD X13, K6, X1                             // 62d1fe0e7acd
+       VCVTUQQ2PD X0, K6, X1                              // 62f1fe0e7ac8
+       VCVTUQQ2PD X30, K6, X1                             // 6291fe0e7ace
+       VCVTUQQ2PD 15(R8)(R14*8), K6, X1                   // 6291fe0e7a8cf00f000000
+       VCVTUQQ2PD -15(R14)(R15*2), K6, X1                 // 6291fe0e7a8c7ef1ffffff
+       VCVTUQQ2PD X13, K6, X11                            // 6251fe0e7add
+       VCVTUQQ2PD X0, K6, X11                             // 6271fe0e7ad8
+       VCVTUQQ2PD X30, K6, X11                            // 6211fe0e7ade
+       VCVTUQQ2PD 15(R8)(R14*8), K6, X11                  // 6211fe0e7a9cf00f000000
+       VCVTUQQ2PD -15(R14)(R15*2), K6, X11                // 6211fe0e7a9c7ef1ffffff
+       VCVTUQQ2PD Y11, K3, Y28                            // 6241fe2b7ae3
+       VCVTUQQ2PD Y27, K3, Y28                            // 6201fe2b7ae3
+       VCVTUQQ2PD Y17, K3, Y28                            // 6221fe2b7ae1
+       VCVTUQQ2PD 99(R15)(R15*4), K3, Y28                 // 6201fe2b7aa4bf63000000
+       VCVTUQQ2PD 15(DX), K3, Y28                         // 6261fe2b7aa20f000000
+       VCVTUQQ2PD Y11, K3, Y1                             // 62d1fe2b7acb
+       VCVTUQQ2PD Y27, K3, Y1                             // 6291fe2b7acb
+       VCVTUQQ2PD Y17, K3, Y1                             // 62b1fe2b7ac9
+       VCVTUQQ2PD 99(R15)(R15*4), K3, Y1                  // 6291fe2b7a8cbf63000000
+       VCVTUQQ2PD 15(DX), K3, Y1                          // 62f1fe2b7a8a0f000000
+       VCVTUQQ2PD Y11, K3, Y8                             // 6251fe2b7ac3
+       VCVTUQQ2PD Y27, K3, Y8                             // 6211fe2b7ac3
+       VCVTUQQ2PD Y17, K3, Y8                             // 6231fe2b7ac1
+       VCVTUQQ2PD 99(R15)(R15*4), K3, Y8                  // 6211fe2b7a84bf63000000
+       VCVTUQQ2PD 15(DX), K3, Y8                          // 6271fe2b7a820f000000
+       VCVTUQQ2PD Z12, K7, Z1                             // 62d1fe4f7acc
+       VCVTUQQ2PD Z16, K7, Z1                             // 62b1fe4f7ac8
+       VCVTUQQ2PD Z12, K7, Z3                             // 62d1fe4f7adc
+       VCVTUQQ2PD Z16, K7, Z3                             // 62b1fe4f7ad8
+       VCVTUQQ2PD Z14, K4, Z28                            // 6241fe4c7ae6
+       VCVTUQQ2PD Z28, K4, Z28                            // 6201fe4c7ae4
+       VCVTUQQ2PD 15(R8)(R14*4), K4, Z28                  // 6201fe4c7aa4b00f000000
+       VCVTUQQ2PD -7(CX)(DX*4), K4, Z28                   // 6261fe4c7aa491f9ffffff
+       VCVTUQQ2PD Z14, K4, Z13                            // 6251fe4c7aee
+       VCVTUQQ2PD Z28, K4, Z13                            // 6211fe4c7aec
+       VCVTUQQ2PD 15(R8)(R14*4), K4, Z13                  // 6211fe4c7aacb00f000000
+       VCVTUQQ2PD -7(CX)(DX*4), K4, Z13                   // 6271fe4c7aac91f9ffffff
+       VCVTUQQ2PS Z3, K4, Y16                             // 62e1ff4c7ac3
+       VCVTUQQ2PS Z12, K4, Y16                            // 62c1ff4c7ac4
+       VCVTUQQ2PS Z3, K4, Y12                             // 6271ff4c7ae3
+       VCVTUQQ2PS Z12, K4, Y12                            // 6251ff4c7ae4
+       VCVTUQQ2PS Z3, K4, Y6                              // 62f1ff4c7af3
+       VCVTUQQ2PS Z12, K4, Y6                             // 62d1ff4c7af4
+       VCVTUQQ2PS Z15, K7, Y26                            // 6241ff4f7ad7
+       VCVTUQQ2PS Z30, K7, Y26                            // 6201ff4f7ad6
+       VCVTUQQ2PS (R8), K7, Y26                           // 6241ff4f7a10
+       VCVTUQQ2PS 15(DX)(BX*2), K7, Y26                   // 6261ff4f7a945a0f000000
+       VCVTUQQ2PS Z15, K7, Y3                             // 62d1ff4f7adf
+       VCVTUQQ2PS Z30, K7, Y3                             // 6291ff4f7ade
+       VCVTUQQ2PS (R8), K7, Y3                            // 62d1ff4f7a18
+       VCVTUQQ2PS 15(DX)(BX*2), K7, Y3                    // 62f1ff4f7a9c5a0f000000
+       VCVTUQQ2PS Z15, K7, Y8                             // 6251ff4f7ac7
+       VCVTUQQ2PS Z30, K7, Y8                             // 6211ff4f7ac6
+       VCVTUQQ2PS (R8), K7, Y8                            // 6251ff4f7a00
+       VCVTUQQ2PS 15(DX)(BX*2), K7, Y8                    // 6271ff4f7a845a0f000000
+       VCVTUQQ2PSX X14, K2, X16                           // 62c1ff0a7ac6
+       VCVTUQQ2PSX X19, K2, X16                           // 62a1ff0a7ac3
+       VCVTUQQ2PSX X8, K2, X16                            // 62c1ff0a7ac0
+       VCVTUQQ2PSX -15(R14)(R15*1), K2, X16               // 6281ff0a7a843ef1ffffff
+       VCVTUQQ2PSX -15(BX), K2, X16                       // 62e1ff0a7a83f1ffffff
+       VCVTUQQ2PSX X14, K2, X14                           // 6251ff0a7af6
+       VCVTUQQ2PSX X19, K2, X14                           // 6231ff0a7af3
+       VCVTUQQ2PSX X8, K2, X14                            // 6251ff0a7af0
+       VCVTUQQ2PSX -15(R14)(R15*1), K2, X14               // 6211ff0a7ab43ef1ffffff
+       VCVTUQQ2PSX -15(BX), K2, X14                       // 6271ff0a7ab3f1ffffff
+       VCVTUQQ2PSX X14, K2, X11                           // 6251ff0a7ade
+       VCVTUQQ2PSX X19, K2, X11                           // 6231ff0a7adb
+       VCVTUQQ2PSX X8, K2, X11                            // 6251ff0a7ad8
+       VCVTUQQ2PSX -15(R14)(R15*1), K2, X11               // 6211ff0a7a9c3ef1ffffff
+       VCVTUQQ2PSX -15(BX), K2, X11                       // 6271ff0a7a9bf1ffffff
+       VCVTUQQ2PSY Y28, K5, X8                            // 6211ff2d7ac4
+       VCVTUQQ2PSY Y1, K5, X8                             // 6271ff2d7ac1
+       VCVTUQQ2PSY Y23, K5, X8                            // 6231ff2d7ac7
+       VCVTUQQ2PSY (CX), K5, X8                           // 6271ff2d7a01
+       VCVTUQQ2PSY 99(R15), K5, X8                        // 6251ff2d7a8763000000
+       VCVTUQQ2PSY Y28, K5, X26                           // 6201ff2d7ad4
+       VCVTUQQ2PSY Y1, K5, X26                            // 6261ff2d7ad1
+       VCVTUQQ2PSY Y23, K5, X26                           // 6221ff2d7ad7
+       VCVTUQQ2PSY (CX), K5, X26                          // 6261ff2d7a11
+       VCVTUQQ2PSY 99(R15), K5, X26                       // 6241ff2d7a9763000000
+       VCVTUQQ2PSY Y28, K5, X23                           // 6281ff2d7afc
+       VCVTUQQ2PSY Y1, K5, X23                            // 62e1ff2d7af9
+       VCVTUQQ2PSY Y23, K5, X23                           // 62a1ff2d7aff
+       VCVTUQQ2PSY (CX), K5, X23                          // 62e1ff2d7a39
+       VCVTUQQ2PSY 99(R15), K5, X23                       // 62c1ff2d7abf63000000
+       VEXTRACTF32X8 $0, Z12, K4, Y18                     // 62337d4c1be200
+       VEXTRACTF32X8 $0, Z13, K4, Y18                     // 62337d4c1bea00
+       VEXTRACTF32X8 $0, Z12, K4, Y24                     // 62137d4c1be000
+       VEXTRACTF32X8 $0, Z13, K4, Y24                     // 62137d4c1be800
+       VEXTRACTF32X8 $0, Z12, K4, Y9                      // 62537d4c1be100
+       VEXTRACTF32X8 $0, Z13, K4, Y9                      // 62537d4c1be900
+       VEXTRACTF32X8 $0, Z12, K4, 15(R8)                  // 62537d4c1ba00f00000000
+       VEXTRACTF32X8 $0, Z13, K4, 15(R8)                  // 62537d4c1ba80f00000000
+       VEXTRACTF32X8 $0, Z12, K4, (BP)                    // 62737d4c1b650000
+       VEXTRACTF32X8 $0, Z13, K4, (BP)                    // 62737d4c1b6d0000
+       VEXTRACTF64X2 $1, Y3, K4, X8                       // 62d3fd2c19d801
+       VEXTRACTF64X2 $1, Y19, K4, X8                      // 62c3fd2c19d801
+       VEXTRACTF64X2 $1, Y23, K4, X8                      // 62c3fd2c19f801
+       VEXTRACTF64X2 $1, Y3, K4, X1                       // 62f3fd2c19d901
+       VEXTRACTF64X2 $1, Y19, K4, X1                      // 62e3fd2c19d901
+       VEXTRACTF64X2 $1, Y23, K4, X1                      // 62e3fd2c19f901
+       VEXTRACTF64X2 $1, Y3, K4, X0                       // 62f3fd2c19d801
+       VEXTRACTF64X2 $1, Y19, K4, X0                      // 62e3fd2c19d801
+       VEXTRACTF64X2 $1, Y23, K4, X0                      // 62e3fd2c19f801
+       VEXTRACTF64X2 $1, Y3, K4, -17(BP)(SI*8)            // 62f3fd2c199cf5efffffff01
+       VEXTRACTF64X2 $1, Y19, K4, -17(BP)(SI*8)           // 62e3fd2c199cf5efffffff01
+       VEXTRACTF64X2 $1, Y23, K4, -17(BP)(SI*8)           // 62e3fd2c19bcf5efffffff01
+       VEXTRACTF64X2 $1, Y3, K4, (R15)                    // 62d3fd2c191f01
+       VEXTRACTF64X2 $1, Y19, K4, (R15)                   // 62c3fd2c191f01
+       VEXTRACTF64X2 $1, Y23, K4, (R15)                   // 62c3fd2c193f01
+       VEXTRACTF64X2 $0, Z21, K7, X15                     // 62c3fd4f19ef00
+       VEXTRACTF64X2 $0, Z9, K7, X15                      // 6253fd4f19cf00
+       VEXTRACTF64X2 $0, Z21, K7, X0                      // 62e3fd4f19e800
+       VEXTRACTF64X2 $0, Z9, K7, X0                       // 6273fd4f19c800
+       VEXTRACTF64X2 $0, Z21, K7, X16                     // 62a3fd4f19e800
+       VEXTRACTF64X2 $0, Z9, K7, X16                      // 6233fd4f19c800
+       VEXTRACTF64X2 $0, Z21, K7, 7(SI)(DI*8)             // 62e3fd4f19acfe0700000000
+       VEXTRACTF64X2 $0, Z9, K7, 7(SI)(DI*8)              // 6273fd4f198cfe0700000000
+       VEXTRACTF64X2 $0, Z21, K7, -15(R14)                // 62c3fd4f19aef1ffffff00
+       VEXTRACTF64X2 $0, Z9, K7, -15(R14)                 // 6253fd4f198ef1ffffff00
+       VEXTRACTI32X8 $1, Z23, K4, Y21                     // 62a37d4c3bfd01
+       VEXTRACTI32X8 $1, Z9, K4, Y21                      // 62337d4c3bcd01
+       VEXTRACTI32X8 $1, Z23, K4, Y20                     // 62a37d4c3bfc01
+       VEXTRACTI32X8 $1, Z9, K4, Y20                      // 62337d4c3bcc01
+       VEXTRACTI32X8 $1, Z23, K4, Y6                      // 62e37d4c3bfe01
+       VEXTRACTI32X8 $1, Z9, K4, Y6                       // 62737d4c3bce01
+       VEXTRACTI32X8 $1, Z23, K4, -15(R14)(R15*1)         // 62837d4c3bbc3ef1ffffff01
+       VEXTRACTI32X8 $1, Z9, K4, -15(R14)(R15*1)          // 62137d4c3b8c3ef1ffffff01
+       VEXTRACTI32X8 $1, Z23, K4, -15(BX)                 // 62e37d4c3bbbf1ffffff01
+       VEXTRACTI32X8 $1, Z9, K4, -15(BX)                  // 62737d4c3b8bf1ffffff01
+       VEXTRACTI64X2 $0, Y31, K2, X7                      // 6263fd2a39ff00
+       VEXTRACTI64X2 $0, Y6, K2, X7                       // 62f3fd2a39f700
+       VEXTRACTI64X2 $0, Y11, K2, X7                      // 6273fd2a39df00
+       VEXTRACTI64X2 $0, Y31, K2, X16                     // 6223fd2a39f800
+       VEXTRACTI64X2 $0, Y6, K2, X16                      // 62b3fd2a39f000
+       VEXTRACTI64X2 $0, Y11, K2, X16                     // 6233fd2a39d800
+       VEXTRACTI64X2 $0, Y31, K2, X31                     // 6203fd2a39ff00
+       VEXTRACTI64X2 $0, Y6, K2, X31                      // 6293fd2a39f700
+       VEXTRACTI64X2 $0, Y11, K2, X31                     // 6213fd2a39df00
+       VEXTRACTI64X2 $0, Y31, K2, -7(CX)                  // 6263fd2a39b9f9ffffff00
+       VEXTRACTI64X2 $0, Y6, K2, -7(CX)                   // 62f3fd2a39b1f9ffffff00
+       VEXTRACTI64X2 $0, Y11, K2, -7(CX)                  // 6273fd2a3999f9ffffff00
+       VEXTRACTI64X2 $0, Y31, K2, 15(DX)(BX*4)            // 6263fd2a39bc9a0f00000000
+       VEXTRACTI64X2 $0, Y6, K2, 15(DX)(BX*4)             // 62f3fd2a39b49a0f00000000
+       VEXTRACTI64X2 $0, Y11, K2, 15(DX)(BX*4)            // 6273fd2a399c9a0f00000000
+       VEXTRACTI64X2 $2, Z27, K2, X1                      // 6263fd4a39d902
+       VEXTRACTI64X2 $2, Z14, K2, X1                      // 6273fd4a39f102
+       VEXTRACTI64X2 $2, Z27, K2, X7                      // 6263fd4a39df02
+       VEXTRACTI64X2 $2, Z14, K2, X7                      // 6273fd4a39f702
+       VEXTRACTI64X2 $2, Z27, K2, X9                      // 6243fd4a39d902
+       VEXTRACTI64X2 $2, Z14, K2, X9                      // 6253fd4a39f102
+       VEXTRACTI64X2 $2, Z27, K2, 99(R15)(R15*8)          // 6203fd4a399cff6300000002
+       VEXTRACTI64X2 $2, Z14, K2, 99(R15)(R15*8)          // 6213fd4a39b4ff6300000002
+       VEXTRACTI64X2 $2, Z27, K2, 7(AX)(CX*8)             // 6263fd4a399cc80700000002
+       VEXTRACTI64X2 $2, Z14, K2, 7(AX)(CX*8)             // 6273fd4a39b4c80700000002
+       VFPCLASSPDX $65, X14, K4, K1                       // 62d3fd0c66ce41
+       VFPCLASSPDX $65, X19, K4, K1                       // 62b3fd0c66cb41
+       VFPCLASSPDX $65, X8, K4, K1                        // 62d3fd0c66c841
+       VFPCLASSPDX $65, (R14), K4, K1                     // 62d3fd0c660e41
+       VFPCLASSPDX $65, -7(DI)(R8*8), K4, K1              // 62b3fd0c668cc7f9ffffff41
+       VFPCLASSPDX $65, X14, K4, K3                       // 62d3fd0c66de41
+       VFPCLASSPDX $65, X19, K4, K3                       // 62b3fd0c66db41
+       VFPCLASSPDX $65, X8, K4, K3                        // 62d3fd0c66d841
+       VFPCLASSPDX $65, (R14), K4, K3                     // 62d3fd0c661e41
+       VFPCLASSPDX $65, -7(DI)(R8*8), K4, K3              // 62b3fd0c669cc7f9ffffff41
+       VFPCLASSPDY $67, Y31, K1, K6                       // 6293fd2966f743
+       VFPCLASSPDY $67, Y5, K1, K6                        // 62f3fd2966f543
+       VFPCLASSPDY $67, Y0, K1, K6                        // 62f3fd2966f043
+       VFPCLASSPDY $67, 7(SI)(DI*8), K1, K6               // 62f3fd2966b4fe0700000043
+       VFPCLASSPDY $67, -15(R14), K1, K6                  // 62d3fd2966b6f1ffffff43
+       VFPCLASSPDY $67, Y31, K1, K7                       // 6293fd2966ff43
+       VFPCLASSPDY $67, Y5, K1, K7                        // 62f3fd2966fd43
+       VFPCLASSPDY $67, Y0, K1, K7                        // 62f3fd2966f843
+       VFPCLASSPDY $67, 7(SI)(DI*8), K1, K7               // 62f3fd2966bcfe0700000043
+       VFPCLASSPDY $67, -15(R14), K1, K7                  // 62d3fd2966bef1ffffff43
+       VFPCLASSPDZ $127, Z3, K3, K6                       // 62f3fd4b66f37f
+       VFPCLASSPDZ $127, Z27, K3, K6                      // 6293fd4b66f37f
+       VFPCLASSPDZ $127, 7(AX)(CX*4), K3, K6              // 62f3fd4b66b488070000007f
+       VFPCLASSPDZ $127, 7(AX)(CX*1), K3, K6              // 62f3fd4b66b408070000007f
+       VFPCLASSPDZ $127, Z3, K3, K4                       // 62f3fd4b66e37f
+       VFPCLASSPDZ $127, Z27, K3, K4                      // 6293fd4b66e37f
+       VFPCLASSPDZ $127, 7(AX)(CX*4), K3, K4              // 62f3fd4b66a488070000007f
+       VFPCLASSPDZ $127, 7(AX)(CX*1), K3, K4              // 62f3fd4b66a408070000007f
+       VFPCLASSPSX $0, X8, K4, K4                         // 62d37d0c66e000
+       VFPCLASSPSX $0, X26, K4, K4                        // 62937d0c66e200
+       VFPCLASSPSX $0, X23, K4, K4                        // 62b37d0c66e700
+       VFPCLASSPSX $0, 99(R15)(R15*4), K4, K4             // 62937d0c66a4bf6300000000
+       VFPCLASSPSX $0, 15(DX), K4, K4                     // 62f37d0c66a20f00000000
+       VFPCLASSPSX $0, X8, K4, K6                         // 62d37d0c66f000
+       VFPCLASSPSX $0, X26, K4, K6                        // 62937d0c66f200
+       VFPCLASSPSX $0, X23, K4, K6                        // 62b37d0c66f700
+       VFPCLASSPSX $0, 99(R15)(R15*4), K4, K6             // 62937d0c66b4bf6300000000
+       VFPCLASSPSX $0, 15(DX), K4, K6                     // 62f37d0c66b20f00000000
+       VFPCLASSPSY $97, Y5, K5, K4                        // 62f37d2d66e561
+       VFPCLASSPSY $97, Y19, K5, K4                       // 62b37d2d66e361
+       VFPCLASSPSY $97, Y31, K5, K4                       // 62937d2d66e761
+       VFPCLASSPSY $97, 7(SI)(DI*1), K5, K4               // 62f37d2d66a43e0700000061
+       VFPCLASSPSY $97, 15(DX)(BX*8), K5, K4              // 62f37d2d66a4da0f00000061
+       VFPCLASSPSY $97, Y5, K5, K5                        // 62f37d2d66ed61
+       VFPCLASSPSY $97, Y19, K5, K5                       // 62b37d2d66eb61
+       VFPCLASSPSY $97, Y31, K5, K5                       // 62937d2d66ef61
+       VFPCLASSPSY $97, 7(SI)(DI*1), K5, K5               // 62f37d2d66ac3e0700000061
+       VFPCLASSPSY $97, 15(DX)(BX*8), K5, K5              // 62f37d2d66acda0f00000061
+       VFPCLASSPSZ $81, Z7, K7, K2                        // 62f37d4f66d751
+       VFPCLASSPSZ $81, Z9, K7, K2                        // 62d37d4f66d151
+       VFPCLASSPSZ $81, (SI), K7, K2                      // 62f37d4f661651
+       VFPCLASSPSZ $81, 7(SI)(DI*2), K7, K2               // 62f37d4f66947e0700000051
+       VFPCLASSPSZ $81, Z7, K7, K7                        // 62f37d4f66ff51
+       VFPCLASSPSZ $81, Z9, K7, K7                        // 62d37d4f66f951
+       VFPCLASSPSZ $81, (SI), K7, K7                      // 62f37d4f663e51
+       VFPCLASSPSZ $81, 7(SI)(DI*2), K7, K7               // 62f37d4f66bc7e0700000051
+       VFPCLASSSD $42, X12, K7, K0                        // 62d3fd0f67c42a or 62d3fd2f67c42a or 62d3fd4f67c42a
+       VFPCLASSSD $42, X16, K7, K0                        // 62b3fd0f67c02a or 62b3fd2f67c02a or 62b3fd4f67c02a
+       VFPCLASSSD $42, X23, K7, K0                        // 62b3fd0f67c72a or 62b3fd2f67c72a or 62b3fd4f67c72a
+       VFPCLASSSD $42, (BX), K7, K0                       // 62f3fd0f67032a or 62f3fd2f67032a or 62f3fd4f67032a
+       VFPCLASSSD $42, -17(BP)(SI*1), K7, K0              // 62f3fd0f678435efffffff2a or 62f3fd2f678435efffffff2a or 62f3fd4f678435efffffff2a
+       VFPCLASSSD $42, X12, K7, K5                        // 62d3fd0f67ec2a or 62d3fd2f67ec2a or 62d3fd4f67ec2a
+       VFPCLASSSD $42, X16, K7, K5                        // 62b3fd0f67e82a or 62b3fd2f67e82a or 62b3fd4f67e82a
+       VFPCLASSSD $42, X23, K7, K5                        // 62b3fd0f67ef2a or 62b3fd2f67ef2a or 62b3fd4f67ef2a
+       VFPCLASSSD $42, (BX), K7, K5                       // 62f3fd0f672b2a or 62f3fd2f672b2a or 62f3fd4f672b2a
+       VFPCLASSSD $42, -17(BP)(SI*1), K7, K5              // 62f3fd0f67ac35efffffff2a or 62f3fd2f67ac35efffffff2a or 62f3fd4f67ac35efffffff2a
+       VFPCLASSSS $79, X23, K6, K6                        // 62b37d0e67f74f or 62b37d2e67f74f or 62b37d4e67f74f
+       VFPCLASSSS $79, X11, K6, K6                        // 62d37d0e67f34f or 62d37d2e67f34f or 62d37d4e67f34f
+       VFPCLASSSS $79, X31, K6, K6                        // 62937d0e67f74f or 62937d2e67f74f or 62937d4e67f74f
+       VFPCLASSSS $79, 7(SI)(DI*1), K6, K6                // 62f37d0e67b43e070000004f or 62f37d2e67b43e070000004f or 62f37d4e67b43e070000004f
+       VFPCLASSSS $79, 15(DX)(BX*8), K6, K6               // 62f37d0e67b4da0f0000004f or 62f37d2e67b4da0f0000004f or 62f37d4e67b4da0f0000004f
+       VFPCLASSSS $79, X23, K6, K5                        // 62b37d0e67ef4f or 62b37d2e67ef4f or 62b37d4e67ef4f
+       VFPCLASSSS $79, X11, K6, K5                        // 62d37d0e67eb4f or 62d37d2e67eb4f or 62d37d4e67eb4f
+       VFPCLASSSS $79, X31, K6, K5                        // 62937d0e67ef4f or 62937d2e67ef4f or 62937d4e67ef4f
+       VFPCLASSSS $79, 7(SI)(DI*1), K6, K5                // 62f37d0e67ac3e070000004f or 62f37d2e67ac3e070000004f or 62f37d4e67ac3e070000004f
+       VFPCLASSSS $79, 15(DX)(BX*8), K6, K5               // 62f37d0e67acda0f0000004f or 62f37d2e67acda0f0000004f or 62f37d4e67acda0f0000004f
+       VINSERTF32X8 $1, Y12, Z0, K2, Z23                  // 62c37d4a1afc01
+       VINSERTF32X8 $1, Y21, Z0, K2, Z23                  // 62a37d4a1afd01
+       VINSERTF32X8 $1, Y14, Z0, K2, Z23                  // 62c37d4a1afe01
+       VINSERTF32X8 $1, 17(SP)(BP*1), Z0, K2, Z23         // 62e37d4a1abc2c1100000001
+       VINSERTF32X8 $1, -7(CX)(DX*8), Z0, K2, Z23         // 62e37d4a1abcd1f9ffffff01
+       VINSERTF32X8 $1, Y12, Z11, K2, Z23                 // 62c3254a1afc01
+       VINSERTF32X8 $1, Y21, Z11, K2, Z23                 // 62a3254a1afd01
+       VINSERTF32X8 $1, Y14, Z11, K2, Z23                 // 62c3254a1afe01
+       VINSERTF32X8 $1, 17(SP)(BP*1), Z11, K2, Z23        // 62e3254a1abc2c1100000001
+       VINSERTF32X8 $1, -7(CX)(DX*8), Z11, K2, Z23        // 62e3254a1abcd1f9ffffff01
+       VINSERTF32X8 $1, Y12, Z0, K2, Z19                  // 62c37d4a1adc01
+       VINSERTF32X8 $1, Y21, Z0, K2, Z19                  // 62a37d4a1add01
+       VINSERTF32X8 $1, Y14, Z0, K2, Z19                  // 62c37d4a1ade01
+       VINSERTF32X8 $1, 17(SP)(BP*1), Z0, K2, Z19         // 62e37d4a1a9c2c1100000001
+       VINSERTF32X8 $1, -7(CX)(DX*8), Z0, K2, Z19         // 62e37d4a1a9cd1f9ffffff01
+       VINSERTF32X8 $1, Y12, Z11, K2, Z19                 // 62c3254a1adc01
+       VINSERTF32X8 $1, Y21, Z11, K2, Z19                 // 62a3254a1add01
+       VINSERTF32X8 $1, Y14, Z11, K2, Z19                 // 62c3254a1ade01
+       VINSERTF32X8 $1, 17(SP)(BP*1), Z11, K2, Z19        // 62e3254a1a9c2c1100000001
+       VINSERTF32X8 $1, -7(CX)(DX*8), Z11, K2, Z19        // 62e3254a1a9cd1f9ffffff01
+       VINSERTF64X2 $0, X3, Y16, K4, Y30                  // 6263fd2418f300
+       VINSERTF64X2 $0, X26, Y16, K4, Y30                 // 6203fd2418f200
+       VINSERTF64X2 $0, X23, Y16, K4, Y30                 // 6223fd2418f700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y30         // 6263fd2418b4880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y30         // 6263fd2418b4080700000000
+       VINSERTF64X2 $0, X3, Y1, K4, Y30                   // 6263f52c18f300
+       VINSERTF64X2 $0, X26, Y1, K4, Y30                  // 6203f52c18f200
+       VINSERTF64X2 $0, X23, Y1, K4, Y30                  // 6223f52c18f700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y30          // 6263f52c18b4880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y30          // 6263f52c18b4080700000000
+       VINSERTF64X2 $0, X3, Y30, K4, Y30                  // 62638d2418f300
+       VINSERTF64X2 $0, X26, Y30, K4, Y30                 // 62038d2418f200
+       VINSERTF64X2 $0, X23, Y30, K4, Y30                 // 62238d2418f700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y30         // 62638d2418b4880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y30         // 62638d2418b4080700000000
+       VINSERTF64X2 $0, X3, Y16, K4, Y26                  // 6263fd2418d300
+       VINSERTF64X2 $0, X26, Y16, K4, Y26                 // 6203fd2418d200
+       VINSERTF64X2 $0, X23, Y16, K4, Y26                 // 6223fd2418d700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y26         // 6263fd241894880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y26         // 6263fd241894080700000000
+       VINSERTF64X2 $0, X3, Y1, K4, Y26                   // 6263f52c18d300
+       VINSERTF64X2 $0, X26, Y1, K4, Y26                  // 6203f52c18d200
+       VINSERTF64X2 $0, X23, Y1, K4, Y26                  // 6223f52c18d700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y26          // 6263f52c1894880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y26          // 6263f52c1894080700000000
+       VINSERTF64X2 $0, X3, Y30, K4, Y26                  // 62638d2418d300
+       VINSERTF64X2 $0, X26, Y30, K4, Y26                 // 62038d2418d200
+       VINSERTF64X2 $0, X23, Y30, K4, Y26                 // 62238d2418d700
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y26         // 62638d241894880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y26         // 62638d241894080700000000
+       VINSERTF64X2 $0, X3, Y16, K4, Y7                   // 62f3fd2418fb00
+       VINSERTF64X2 $0, X26, Y16, K4, Y7                  // 6293fd2418fa00
+       VINSERTF64X2 $0, X23, Y16, K4, Y7                  // 62b3fd2418ff00
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y16, K4, Y7          // 62f3fd2418bc880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y16, K4, Y7          // 62f3fd2418bc080700000000
+       VINSERTF64X2 $0, X3, Y1, K4, Y7                    // 62f3f52c18fb00
+       VINSERTF64X2 $0, X26, Y1, K4, Y7                   // 6293f52c18fa00
+       VINSERTF64X2 $0, X23, Y1, K4, Y7                   // 62b3f52c18ff00
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y1, K4, Y7           // 62f3f52c18bc880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y1, K4, Y7           // 62f3f52c18bc080700000000
+       VINSERTF64X2 $0, X3, Y30, K4, Y7                   // 62f38d2418fb00
+       VINSERTF64X2 $0, X26, Y30, K4, Y7                  // 62938d2418fa00
+       VINSERTF64X2 $0, X23, Y30, K4, Y7                  // 62b38d2418ff00
+       VINSERTF64X2 $0, 7(AX)(CX*4), Y30, K4, Y7          // 62f38d2418bc880700000000
+       VINSERTF64X2 $0, 7(AX)(CX*1), Y30, K4, Y7          // 62f38d2418bc080700000000
+       VINSERTF64X2 $1, X13, Z24, K1, Z0                  // 62d3bd4118c501
+       VINSERTF64X2 $1, X28, Z24, K1, Z0                  // 6293bd4118c401
+       VINSERTF64X2 $1, X24, Z24, K1, Z0                  // 6293bd4118c001
+       VINSERTF64X2 $1, (SI), Z24, K1, Z0                 // 62f3bd41180601
+       VINSERTF64X2 $1, 7(SI)(DI*2), Z24, K1, Z0          // 62f3bd4118847e0700000001
+       VINSERTF64X2 $1, X13, Z12, K1, Z0                  // 62d39d4918c501
+       VINSERTF64X2 $1, X28, Z12, K1, Z0                  // 62939d4918c401
+       VINSERTF64X2 $1, X24, Z12, K1, Z0                  // 62939d4918c001
+       VINSERTF64X2 $1, (SI), Z12, K1, Z0                 // 62f39d49180601
+       VINSERTF64X2 $1, 7(SI)(DI*2), Z12, K1, Z0          // 62f39d4918847e0700000001
+       VINSERTF64X2 $1, X13, Z24, K1, Z25                 // 6243bd4118cd01
+       VINSERTF64X2 $1, X28, Z24, K1, Z25                 // 6203bd4118cc01
+       VINSERTF64X2 $1, X24, Z24, K1, Z25                 // 6203bd4118c801
+       VINSERTF64X2 $1, (SI), Z24, K1, Z25                // 6263bd41180e01
+       VINSERTF64X2 $1, 7(SI)(DI*2), Z24, K1, Z25         // 6263bd41188c7e0700000001
+       VINSERTF64X2 $1, X13, Z12, K1, Z25                 // 62439d4918cd01
+       VINSERTF64X2 $1, X28, Z12, K1, Z25                 // 62039d4918cc01
+       VINSERTF64X2 $1, X24, Z12, K1, Z25                 // 62039d4918c801
+       VINSERTF64X2 $1, (SI), Z12, K1, Z25                // 62639d49180e01
+       VINSERTF64X2 $1, 7(SI)(DI*2), Z12, K1, Z25         // 62639d49188c7e0700000001
+       VINSERTI32X8 $1, Y24, Z17, K7, Z20                 // 628375473ae001
+       VINSERTI32X8 $1, Y13, Z17, K7, Z20                 // 62c375473ae501
+       VINSERTI32X8 $1, Y20, Z17, K7, Z20                 // 62a375473ae401
+       VINSERTI32X8 $1, 15(R8)(R14*1), Z17, K7, Z20       // 628375473aa4300f00000001
+       VINSERTI32X8 $1, 15(R8)(R14*2), Z17, K7, Z20       // 628375473aa4700f00000001
+       VINSERTI32X8 $1, Y24, Z0, K7, Z20                  // 62837d4f3ae001
+       VINSERTI32X8 $1, Y13, Z0, K7, Z20                  // 62c37d4f3ae501
+       VINSERTI32X8 $1, Y20, Z0, K7, Z20                  // 62a37d4f3ae401
+       VINSERTI32X8 $1, 15(R8)(R14*1), Z0, K7, Z20        // 62837d4f3aa4300f00000001
+       VINSERTI32X8 $1, 15(R8)(R14*2), Z0, K7, Z20        // 62837d4f3aa4700f00000001
+       VINSERTI32X8 $1, Y24, Z17, K7, Z0                  // 629375473ac001
+       VINSERTI32X8 $1, Y13, Z17, K7, Z0                  // 62d375473ac501
+       VINSERTI32X8 $1, Y20, Z17, K7, Z0                  // 62b375473ac401
+       VINSERTI32X8 $1, 15(R8)(R14*1), Z17, K7, Z0        // 629375473a84300f00000001
+       VINSERTI32X8 $1, 15(R8)(R14*2), Z17, K7, Z0        // 629375473a84700f00000001
+       VINSERTI32X8 $1, Y24, Z0, K7, Z0                   // 62937d4f3ac001
+       VINSERTI32X8 $1, Y13, Z0, K7, Z0                   // 62d37d4f3ac501
+       VINSERTI32X8 $1, Y20, Z0, K7, Z0                   // 62b37d4f3ac401
+       VINSERTI32X8 $1, 15(R8)(R14*1), Z0, K7, Z0         // 62937d4f3a84300f00000001
+       VINSERTI32X8 $1, 15(R8)(R14*2), Z0, K7, Z0         // 62937d4f3a84700f00000001
+       VINSERTI64X2 $0, X11, Y26, K7, Y14                 // 6253ad2738f300
+       VINSERTI64X2 $0, X31, Y26, K7, Y14                 // 6213ad2738f700
+       VINSERTI64X2 $0, X3, Y26, K7, Y14                  // 6273ad2738f300
+       VINSERTI64X2 $0, 17(SP), Y26, K7, Y14              // 6273ad2738b4241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y14       // 6273ad2738b4b5efffffff00
+       VINSERTI64X2 $0, X11, Y30, K7, Y14                 // 62538d2738f300
+       VINSERTI64X2 $0, X31, Y30, K7, Y14                 // 62138d2738f700
+       VINSERTI64X2 $0, X3, Y30, K7, Y14                  // 62738d2738f300
+       VINSERTI64X2 $0, 17(SP), Y30, K7, Y14              // 62738d2738b4241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y14       // 62738d2738b4b5efffffff00
+       VINSERTI64X2 $0, X11, Y12, K7, Y14                 // 62539d2f38f300
+       VINSERTI64X2 $0, X31, Y12, K7, Y14                 // 62139d2f38f700
+       VINSERTI64X2 $0, X3, Y12, K7, Y14                  // 62739d2f38f300
+       VINSERTI64X2 $0, 17(SP), Y12, K7, Y14              // 62739d2f38b4241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y14       // 62739d2f38b4b5efffffff00
+       VINSERTI64X2 $0, X11, Y26, K7, Y21                 // 62c3ad2738eb00
+       VINSERTI64X2 $0, X31, Y26, K7, Y21                 // 6283ad2738ef00
+       VINSERTI64X2 $0, X3, Y26, K7, Y21                  // 62e3ad2738eb00
+       VINSERTI64X2 $0, 17(SP), Y26, K7, Y21              // 62e3ad2738ac241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y21       // 62e3ad2738acb5efffffff00
+       VINSERTI64X2 $0, X11, Y30, K7, Y21                 // 62c38d2738eb00
+       VINSERTI64X2 $0, X31, Y30, K7, Y21                 // 62838d2738ef00
+       VINSERTI64X2 $0, X3, Y30, K7, Y21                  // 62e38d2738eb00
+       VINSERTI64X2 $0, 17(SP), Y30, K7, Y21              // 62e38d2738ac241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y21       // 62e38d2738acb5efffffff00
+       VINSERTI64X2 $0, X11, Y12, K7, Y21                 // 62c39d2f38eb00
+       VINSERTI64X2 $0, X31, Y12, K7, Y21                 // 62839d2f38ef00
+       VINSERTI64X2 $0, X3, Y12, K7, Y21                  // 62e39d2f38eb00
+       VINSERTI64X2 $0, 17(SP), Y12, K7, Y21              // 62e39d2f38ac241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y21       // 62e39d2f38acb5efffffff00
+       VINSERTI64X2 $0, X11, Y26, K7, Y1                  // 62d3ad2738cb00
+       VINSERTI64X2 $0, X31, Y26, K7, Y1                  // 6293ad2738cf00
+       VINSERTI64X2 $0, X3, Y26, K7, Y1                   // 62f3ad2738cb00
+       VINSERTI64X2 $0, 17(SP), Y26, K7, Y1               // 62f3ad27388c241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y26, K7, Y1        // 62f3ad27388cb5efffffff00
+       VINSERTI64X2 $0, X11, Y30, K7, Y1                  // 62d38d2738cb00
+       VINSERTI64X2 $0, X31, Y30, K7, Y1                  // 62938d2738cf00
+       VINSERTI64X2 $0, X3, Y30, K7, Y1                   // 62f38d2738cb00
+       VINSERTI64X2 $0, 17(SP), Y30, K7, Y1               // 62f38d27388c241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y30, K7, Y1        // 62f38d27388cb5efffffff00
+       VINSERTI64X2 $0, X11, Y12, K7, Y1                  // 62d39d2f38cb00
+       VINSERTI64X2 $0, X31, Y12, K7, Y1                  // 62939d2f38cf00
+       VINSERTI64X2 $0, X3, Y12, K7, Y1                   // 62f39d2f38cb00
+       VINSERTI64X2 $0, 17(SP), Y12, K7, Y1               // 62f39d2f388c241100000000
+       VINSERTI64X2 $0, -17(BP)(SI*4), Y12, K7, Y1        // 62f39d2f388cb5efffffff00
+       VINSERTI64X2 $3, X7, Z31, K6, Z17                  // 62e3854638cf03
+       VINSERTI64X2 $3, X0, Z31, K6, Z17                  // 62e3854638c803
+       VINSERTI64X2 $3, 7(AX), Z31, K6, Z17               // 62e3854638880700000003
+       VINSERTI64X2 $3, (DI), Z31, K6, Z17                // 62e38546380f03
+       VINSERTI64X2 $3, X7, Z0, K6, Z17                   // 62e3fd4e38cf03
+       VINSERTI64X2 $3, X0, Z0, K6, Z17                   // 62e3fd4e38c803
+       VINSERTI64X2 $3, 7(AX), Z0, K6, Z17                // 62e3fd4e38880700000003
+       VINSERTI64X2 $3, (DI), Z0, K6, Z17                 // 62e3fd4e380f03
+       VINSERTI64X2 $3, X7, Z31, K6, Z23                  // 62e3854638ff03
+       VINSERTI64X2 $3, X0, Z31, K6, Z23                  // 62e3854638f803
+       VINSERTI64X2 $3, 7(AX), Z31, K6, Z23               // 62e3854638b80700000003
+       VINSERTI64X2 $3, (DI), Z31, K6, Z23                // 62e38546383f03
+       VINSERTI64X2 $3, X7, Z0, K6, Z23                   // 62e3fd4e38ff03
+       VINSERTI64X2 $3, X0, Z0, K6, Z23                   // 62e3fd4e38f803
+       VINSERTI64X2 $3, 7(AX), Z0, K6, Z23                // 62e3fd4e38b80700000003
+       VINSERTI64X2 $3, (DI), Z0, K6, Z23                 // 62e3fd4e383f03
+       VORPD X11, X24, K7, X23                            // 62c1bd0756fb
+       VORPD X23, X24, K7, X23                            // 62a1bd0756ff
+       VORPD X2, X24, K7, X23                             // 62e1bd0756fa
+       VORPD -17(BP)(SI*8), X24, K7, X23                  // 62e1bd0756bcf5efffffff
+       VORPD (R15), X24, K7, X23                          // 62c1bd07563f
+       VORPD X11, X14, K7, X23                            // 62c18d0f56fb
+       VORPD X23, X14, K7, X23                            // 62a18d0f56ff
+       VORPD X2, X14, K7, X23                             // 62e18d0f56fa
+       VORPD -17(BP)(SI*8), X14, K7, X23                  // 62e18d0f56bcf5efffffff
+       VORPD (R15), X14, K7, X23                          // 62c18d0f563f
+       VORPD X11, X0, K7, X23                             // 62c1fd0f56fb
+       VORPD X23, X0, K7, X23                             // 62a1fd0f56ff
+       VORPD X2, X0, K7, X23                              // 62e1fd0f56fa
+       VORPD -17(BP)(SI*8), X0, K7, X23                   // 62e1fd0f56bcf5efffffff
+       VORPD (R15), X0, K7, X23                           // 62c1fd0f563f
+       VORPD X11, X24, K7, X11                            // 6251bd0756db
+       VORPD X23, X24, K7, X11                            // 6231bd0756df
+       VORPD X2, X24, K7, X11                             // 6271bd0756da
+       VORPD -17(BP)(SI*8), X24, K7, X11                  // 6271bd07569cf5efffffff
+       VORPD (R15), X24, K7, X11                          // 6251bd07561f
+       VORPD X11, X14, K7, X11                            // 62518d0f56db
+       VORPD X23, X14, K7, X11                            // 62318d0f56df
+       VORPD X2, X14, K7, X11                             // 62718d0f56da
+       VORPD -17(BP)(SI*8), X14, K7, X11                  // 62718d0f569cf5efffffff
+       VORPD (R15), X14, K7, X11                          // 62518d0f561f
+       VORPD X11, X0, K7, X11                             // 6251fd0f56db
+       VORPD X23, X0, K7, X11                             // 6231fd0f56df
+       VORPD X2, X0, K7, X11                              // 6271fd0f56da
+       VORPD -17(BP)(SI*8), X0, K7, X11                   // 6271fd0f569cf5efffffff
+       VORPD (R15), X0, K7, X11                           // 6251fd0f561f
+       VORPD X11, X24, K7, X31                            // 6241bd0756fb
+       VORPD X23, X24, K7, X31                            // 6221bd0756ff
+       VORPD X2, X24, K7, X31                             // 6261bd0756fa
+       VORPD -17(BP)(SI*8), X24, K7, X31                  // 6261bd0756bcf5efffffff
+       VORPD (R15), X24, K7, X31                          // 6241bd07563f
+       VORPD X11, X14, K7, X31                            // 62418d0f56fb
+       VORPD X23, X14, K7, X31                            // 62218d0f56ff
+       VORPD X2, X14, K7, X31                             // 62618d0f56fa
+       VORPD -17(BP)(SI*8), X14, K7, X31                  // 62618d0f56bcf5efffffff
+       VORPD (R15), X14, K7, X31                          // 62418d0f563f
+       VORPD X11, X0, K7, X31                             // 6241fd0f56fb
+       VORPD X23, X0, K7, X31                             // 6221fd0f56ff
+       VORPD X2, X0, K7, X31                              // 6261fd0f56fa
+       VORPD -17(BP)(SI*8), X0, K7, X31                   // 6261fd0f56bcf5efffffff
+       VORPD (R15), X0, K7, X31                           // 6241fd0f563f
+       VORPD Y16, Y5, K1, Y8                              // 6231d52956c0
+       VORPD Y9, Y5, K1, Y8                               // 6251d52956c1
+       VORPD Y13, Y5, K1, Y8                              // 6251d52956c5
+       VORPD 99(R15)(R15*2), Y5, K1, Y8                   // 6211d52956847f63000000
+       VORPD -7(DI), Y5, K1, Y8                           // 6271d5295687f9ffffff
+       VORPD Y16, Y24, K1, Y8                             // 6231bd2156c0
+       VORPD Y9, Y24, K1, Y8                              // 6251bd2156c1
+       VORPD Y13, Y24, K1, Y8                             // 6251bd2156c5
+       VORPD 99(R15)(R15*2), Y24, K1, Y8                  // 6211bd2156847f63000000
+       VORPD -7(DI), Y24, K1, Y8                          // 6271bd215687f9ffffff
+       VORPD Y16, Y21, K1, Y8                             // 6231d52156c0
+       VORPD Y9, Y21, K1, Y8                              // 6251d52156c1
+       VORPD Y13, Y21, K1, Y8                             // 6251d52156c5
+       VORPD 99(R15)(R15*2), Y21, K1, Y8                  // 6211d52156847f63000000
+       VORPD -7(DI), Y21, K1, Y8                          // 6271d5215687f9ffffff
+       VORPD Y16, Y5, K1, Y11                             // 6231d52956d8
+       VORPD Y9, Y5, K1, Y11                              // 6251d52956d9
+       VORPD Y13, Y5, K1, Y11                             // 6251d52956dd
+       VORPD 99(R15)(R15*2), Y5, K1, Y11                  // 6211d529569c7f63000000
+       VORPD -7(DI), Y5, K1, Y11                          // 6271d529569ff9ffffff
+       VORPD Y16, Y24, K1, Y11                            // 6231bd2156d8
+       VORPD Y9, Y24, K1, Y11                             // 6251bd2156d9
+       VORPD Y13, Y24, K1, Y11                            // 6251bd2156dd
+       VORPD 99(R15)(R15*2), Y24, K1, Y11                 // 6211bd21569c7f63000000
+       VORPD -7(DI), Y24, K1, Y11                         // 6271bd21569ff9ffffff
+       VORPD Y16, Y21, K1, Y11                            // 6231d52156d8
+       VORPD Y9, Y21, K1, Y11                             // 6251d52156d9
+       VORPD Y13, Y21, K1, Y11                            // 6251d52156dd
+       VORPD 99(R15)(R15*2), Y21, K1, Y11                 // 6211d521569c7f63000000
+       VORPD -7(DI), Y21, K1, Y11                         // 6271d521569ff9ffffff
+       VORPD Y16, Y5, K1, Y24                             // 6221d52956c0
+       VORPD Y9, Y5, K1, Y24                              // 6241d52956c1
+       VORPD Y13, Y5, K1, Y24                             // 6241d52956c5
+       VORPD 99(R15)(R15*2), Y5, K1, Y24                  // 6201d52956847f63000000
+       VORPD -7(DI), Y5, K1, Y24                          // 6261d5295687f9ffffff
+       VORPD Y16, Y24, K1, Y24                            // 6221bd2156c0
+       VORPD Y9, Y24, K1, Y24                             // 6241bd2156c1
+       VORPD Y13, Y24, K1, Y24                            // 6241bd2156c5
+       VORPD 99(R15)(R15*2), Y24, K1, Y24                 // 6201bd2156847f63000000
+       VORPD -7(DI), Y24, K1, Y24                         // 6261bd215687f9ffffff
+       VORPD Y16, Y21, K1, Y24                            // 6221d52156c0
+       VORPD Y9, Y21, K1, Y24                             // 6241d52156c1
+       VORPD Y13, Y21, K1, Y24                            // 6241d52156c5
+       VORPD 99(R15)(R15*2), Y21, K1, Y24                 // 6201d52156847f63000000
+       VORPD -7(DI), Y21, K1, Y24                         // 6261d5215687f9ffffff
+       VORPD Z9, Z9, K1, Z0                               // 62d1b54956c1
+       VORPD Z25, Z9, K1, Z0                              // 6291b54956c1
+       VORPD -7(CX), Z9, K1, Z0                           // 62f1b5495681f9ffffff
+       VORPD 15(DX)(BX*4), Z9, K1, Z0                     // 62f1b54956849a0f000000
+       VORPD Z9, Z3, K1, Z0                               // 62d1e54956c1
+       VORPD Z25, Z3, K1, Z0                              // 6291e54956c1
+       VORPD -7(CX), Z3, K1, Z0                           // 62f1e5495681f9ffffff
+       VORPD 15(DX)(BX*4), Z3, K1, Z0                     // 62f1e54956849a0f000000
+       VORPD Z9, Z9, K1, Z26                              // 6241b54956d1
+       VORPD Z25, Z9, K1, Z26                             // 6201b54956d1
+       VORPD -7(CX), Z9, K1, Z26                          // 6261b5495691f9ffffff
+       VORPD 15(DX)(BX*4), Z9, K1, Z26                    // 6261b54956949a0f000000
+       VORPD Z9, Z3, K1, Z26                              // 6241e54956d1
+       VORPD Z25, Z3, K1, Z26                             // 6201e54956d1
+       VORPD -7(CX), Z3, K1, Z26                          // 6261e5495691f9ffffff
+       VORPD 15(DX)(BX*4), Z3, K1, Z26                    // 6261e54956949a0f000000
+       VORPS X2, X0, K1, X20                              // 62e17c0956e2
+       VORPS X8, X0, K1, X20                              // 62c17c0956e0
+       VORPS X9, X0, K1, X20                              // 62c17c0956e1
+       VORPS 7(SI)(DI*8), X0, K1, X20                     // 62e17c0956a4fe07000000
+       VORPS -15(R14), X0, K1, X20                        // 62c17c0956a6f1ffffff
+       VORPS X2, X9, K1, X20                              // 62e1340956e2
+       VORPS X8, X9, K1, X20                              // 62c1340956e0
+       VORPS X9, X9, K1, X20                              // 62c1340956e1
+       VORPS 7(SI)(DI*8), X9, K1, X20                     // 62e1340956a4fe07000000
+       VORPS -15(R14), X9, K1, X20                        // 62c1340956a6f1ffffff
+       VORPS X2, X13, K1, X20                             // 62e1140956e2
+       VORPS X8, X13, K1, X20                             // 62c1140956e0
+       VORPS X9, X13, K1, X20                             // 62c1140956e1
+       VORPS 7(SI)(DI*8), X13, K1, X20                    // 62e1140956a4fe07000000
+       VORPS -15(R14), X13, K1, X20                       // 62c1140956a6f1ffffff
+       VORPS X2, X0, K1, X5                               // 62f17c0956ea
+       VORPS X8, X0, K1, X5                               // 62d17c0956e8
+       VORPS X9, X0, K1, X5                               // 62d17c0956e9
+       VORPS 7(SI)(DI*8), X0, K1, X5                      // 62f17c0956acfe07000000
+       VORPS -15(R14), X0, K1, X5                         // 62d17c0956aef1ffffff
+       VORPS X2, X9, K1, X5                               // 62f1340956ea
+       VORPS X8, X9, K1, X5                               // 62d1340956e8
+       VORPS X9, X9, K1, X5                               // 62d1340956e9
+       VORPS 7(SI)(DI*8), X9, K1, X5                      // 62f1340956acfe07000000
+       VORPS -15(R14), X9, K1, X5                         // 62d1340956aef1ffffff
+       VORPS X2, X13, K1, X5                              // 62f1140956ea
+       VORPS X8, X13, K1, X5                              // 62d1140956e8
+       VORPS X9, X13, K1, X5                              // 62d1140956e9
+       VORPS 7(SI)(DI*8), X13, K1, X5                     // 62f1140956acfe07000000
+       VORPS -15(R14), X13, K1, X5                        // 62d1140956aef1ffffff
+       VORPS X2, X0, K1, X25                              // 62617c0956ca
+       VORPS X8, X0, K1, X25                              // 62417c0956c8
+       VORPS X9, X0, K1, X25                              // 62417c0956c9
+       VORPS 7(SI)(DI*8), X0, K1, X25                     // 62617c09568cfe07000000
+       VORPS -15(R14), X0, K1, X25                        // 62417c09568ef1ffffff
+       VORPS X2, X9, K1, X25                              // 6261340956ca
+       VORPS X8, X9, K1, X25                              // 6241340956c8
+       VORPS X9, X9, K1, X25                              // 6241340956c9
+       VORPS 7(SI)(DI*8), X9, K1, X25                     // 62613409568cfe07000000
+       VORPS -15(R14), X9, K1, X25                        // 62413409568ef1ffffff
+       VORPS X2, X13, K1, X25                             // 6261140956ca
+       VORPS X8, X13, K1, X25                             // 6241140956c8
+       VORPS X9, X13, K1, X25                             // 6241140956c9
+       VORPS 7(SI)(DI*8), X13, K1, X25                    // 62611409568cfe07000000
+       VORPS -15(R14), X13, K1, X25                       // 62411409568ef1ffffff
+       VORPS Y11, Y7, K7, Y9                              // 6251442f56cb
+       VORPS Y26, Y7, K7, Y9                              // 6211442f56ca
+       VORPS Y12, Y7, K7, Y9                              // 6251442f56cc
+       VORPS -7(CX)(DX*1), Y7, K7, Y9                     // 6271442f568c11f9ffffff
+       VORPS -15(R14)(R15*4), Y7, K7, Y9                  // 6211442f568cbef1ffffff
+       VORPS Y11, Y6, K7, Y9                              // 62514c2f56cb
+       VORPS Y26, Y6, K7, Y9                              // 62114c2f56ca
+       VORPS Y12, Y6, K7, Y9                              // 62514c2f56cc
+       VORPS -7(CX)(DX*1), Y6, K7, Y9                     // 62714c2f568c11f9ffffff
+       VORPS -15(R14)(R15*4), Y6, K7, Y9                  // 62114c2f568cbef1ffffff
+       VORPS Y11, Y26, K7, Y9                             // 62512c2756cb
+       VORPS Y26, Y26, K7, Y9                             // 62112c2756ca
+       VORPS Y12, Y26, K7, Y9                             // 62512c2756cc
+       VORPS -7(CX)(DX*1), Y26, K7, Y9                    // 62712c27568c11f9ffffff
+       VORPS -15(R14)(R15*4), Y26, K7, Y9                 // 62112c27568cbef1ffffff
+       VORPS Y11, Y7, K7, Y6                              // 62d1442f56f3
+       VORPS Y26, Y7, K7, Y6                              // 6291442f56f2
+       VORPS Y12, Y7, K7, Y6                              // 62d1442f56f4
+       VORPS -7(CX)(DX*1), Y7, K7, Y6                     // 62f1442f56b411f9ffffff
+       VORPS -15(R14)(R15*4), Y7, K7, Y6                  // 6291442f56b4bef1ffffff
+       VORPS Y11, Y6, K7, Y6                              // 62d14c2f56f3
+       VORPS Y26, Y6, K7, Y6                              // 62914c2f56f2
+       VORPS Y12, Y6, K7, Y6                              // 62d14c2f56f4
+       VORPS -7(CX)(DX*1), Y6, K7, Y6                     // 62f14c2f56b411f9ffffff
+       VORPS -15(R14)(R15*4), Y6, K7, Y6                  // 62914c2f56b4bef1ffffff
+       VORPS Y11, Y26, K7, Y6                             // 62d12c2756f3
+       VORPS Y26, Y26, K7, Y6                             // 62912c2756f2
+       VORPS Y12, Y26, K7, Y6                             // 62d12c2756f4
+       VORPS -7(CX)(DX*1), Y26, K7, Y6                    // 62f12c2756b411f9ffffff
+       VORPS -15(R14)(R15*4), Y26, K7, Y6                 // 62912c2756b4bef1ffffff
+       VORPS Y11, Y7, K7, Y3                              // 62d1442f56db
+       VORPS Y26, Y7, K7, Y3                              // 6291442f56da
+       VORPS Y12, Y7, K7, Y3                              // 62d1442f56dc
+       VORPS -7(CX)(DX*1), Y7, K7, Y3                     // 62f1442f569c11f9ffffff
+       VORPS -15(R14)(R15*4), Y7, K7, Y3                  // 6291442f569cbef1ffffff
+       VORPS Y11, Y6, K7, Y3                              // 62d14c2f56db
+       VORPS Y26, Y6, K7, Y3                              // 62914c2f56da
+       VORPS Y12, Y6, K7, Y3                              // 62d14c2f56dc
+       VORPS -7(CX)(DX*1), Y6, K7, Y3                     // 62f14c2f569c11f9ffffff
+       VORPS -15(R14)(R15*4), Y6, K7, Y3                  // 62914c2f569cbef1ffffff
+       VORPS Y11, Y26, K7, Y3                             // 62d12c2756db
+       VORPS Y26, Y26, K7, Y3                             // 62912c2756da
+       VORPS Y12, Y26, K7, Y3                             // 62d12c2756dc
+       VORPS -7(CX)(DX*1), Y26, K7, Y3                    // 62f12c27569c11f9ffffff
+       VORPS -15(R14)(R15*4), Y26, K7, Y3                 // 62912c27569cbef1ffffff
+       VORPS Z17, Z20, K2, Z9                             // 62315c4256c9
+       VORPS Z0, Z20, K2, Z9                              // 62715c4256c8
+       VORPS 99(R15)(R15*8), Z20, K2, Z9                  // 62115c42568cff63000000
+       VORPS 7(AX)(CX*8), Z20, K2, Z9                     // 62715c42568cc807000000
+       VORPS Z17, Z0, K2, Z9                              // 62317c4a56c9
+       VORPS Z0, Z0, K2, Z9                               // 62717c4a56c8
+       VORPS 99(R15)(R15*8), Z0, K2, Z9                   // 62117c4a568cff63000000
+       VORPS 7(AX)(CX*8), Z0, K2, Z9                      // 62717c4a568cc807000000
+       VORPS Z17, Z20, K2, Z28                            // 62215c4256e1
+       VORPS Z0, Z20, K2, Z28                             // 62615c4256e0
+       VORPS 99(R15)(R15*8), Z20, K2, Z28                 // 62015c4256a4ff63000000
+       VORPS 7(AX)(CX*8), Z20, K2, Z28                    // 62615c4256a4c807000000
+       VORPS Z17, Z0, K2, Z28                             // 62217c4a56e1
+       VORPS Z0, Z0, K2, Z28                              // 62617c4a56e0
+       VORPS 99(R15)(R15*8), Z0, K2, Z28                  // 62017c4a56a4ff63000000
+       VORPS 7(AX)(CX*8), Z0, K2, Z28                     // 62617c4a56a4c807000000
+       VPEXTRD $64, X22, CX                               // 62e37d0816f140
+       VPEXTRD $64, X30, CX                               // 62637d0816f140
+       VPEXTRD $64, X22, SP                               // 62e37d0816f440
+       VPEXTRD $64, X30, SP                               // 62637d0816f440
+       VPEXTRD $64, X22, 99(R15)(R15*2)                   // 62837d0816b47f6300000040
+       VPEXTRD $64, X30, 99(R15)(R15*2)                   // 62037d0816b47f6300000040
+       VPEXTRD $64, X22, -7(DI)                           // 62e37d0816b7f9ffffff40
+       VPEXTRD $64, X30, -7(DI)                           // 62637d0816b7f9ffffff40
+       VPEXTRQ $27, X30, R9                               // 6243fd0816f11b
+       VPEXTRQ $27, X30, R13                              // 6243fd0816f51b
+       VPEXTRQ $27, X30, -15(R14)(R15*1)                  // 6203fd0816b43ef1ffffff1b
+       VPEXTRQ $27, X30, -15(BX)                          // 6263fd0816b3f1ffffff1b
+       VPINSRD $82, R9, X22, X21                          // 62c34d0022e952
+       VPINSRD $82, CX, X22, X21                          // 62e34d0022e952
+       VPINSRD $82, -7(CX)(DX*1), X22, X21                // 62e34d0022ac11f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X22, X21             // 62834d0022acbef1ffffff52
+       VPINSRD $82, R9, X7, X21                           // 62c3450822e952
+       VPINSRD $82, CX, X7, X21                           // 62e3450822e952
+       VPINSRD $82, -7(CX)(DX*1), X7, X21                 // 62e3450822ac11f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X7, X21              // 6283450822acbef1ffffff52
+       VPINSRD $82, R9, X19, X21                          // 62c3650022e952
+       VPINSRD $82, CX, X19, X21                          // 62e3650022e952
+       VPINSRD $82, -7(CX)(DX*1), X19, X21                // 62e3650022ac11f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X19, X21             // 6283650022acbef1ffffff52
+       VPINSRD $82, R9, X22, X0                           // 62d34d0022c152
+       VPINSRD $82, CX, X22, X0                           // 62f34d0022c152
+       VPINSRD $82, -7(CX)(DX*1), X22, X0                 // 62f34d00228411f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X22, X0              // 62934d002284bef1ffffff52
+       VPINSRD $82, R9, X19, X0                           // 62d3650022c152
+       VPINSRD $82, CX, X19, X0                           // 62f3650022c152
+       VPINSRD $82, -7(CX)(DX*1), X19, X0                 // 62f36500228411f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X19, X0              // 629365002284bef1ffffff52
+       VPINSRD $82, R9, X22, X28                          // 62434d0022e152
+       VPINSRD $82, CX, X22, X28                          // 62634d0022e152
+       VPINSRD $82, -7(CX)(DX*1), X22, X28                // 62634d0022a411f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X22, X28             // 62034d0022a4bef1ffffff52
+       VPINSRD $82, R9, X7, X28                           // 6243450822e152
+       VPINSRD $82, CX, X7, X28                           // 6263450822e152
+       VPINSRD $82, -7(CX)(DX*1), X7, X28                 // 6263450822a411f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X7, X28              // 6203450822a4bef1ffffff52
+       VPINSRD $82, R9, X19, X28                          // 6243650022e152
+       VPINSRD $82, CX, X19, X28                          // 6263650022e152
+       VPINSRD $82, -7(CX)(DX*1), X19, X28                // 6263650022a411f9ffffff52
+       VPINSRD $82, -15(R14)(R15*4), X19, X28             // 6203650022a4bef1ffffff52
+       VPINSRQ $126, DX, X1, X16                          // 62e3f50822c27e
+       VPINSRQ $126, BP, X1, X16                          // 62e3f50822c57e
+       VPINSRQ $126, 7(AX)(CX*4), X1, X16                 // 62e3f508228488070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X1, X16                 // 62e3f508228408070000007e
+       VPINSRQ $126, DX, X7, X16                          // 62e3c50822c27e
+       VPINSRQ $126, BP, X7, X16                          // 62e3c50822c57e
+       VPINSRQ $126, 7(AX)(CX*4), X7, X16                 // 62e3c508228488070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X7, X16                 // 62e3c508228408070000007e
+       VPINSRQ $126, DX, X9, X16                          // 62e3b50822c27e
+       VPINSRQ $126, BP, X9, X16                          // 62e3b50822c57e
+       VPINSRQ $126, 7(AX)(CX*4), X9, X16                 // 62e3b508228488070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X9, X16                 // 62e3b508228408070000007e
+       VPINSRQ $126, DX, X1, X31                          // 6263f50822fa7e
+       VPINSRQ $126, BP, X1, X31                          // 6263f50822fd7e
+       VPINSRQ $126, 7(AX)(CX*4), X1, X31                 // 6263f50822bc88070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X1, X31                 // 6263f50822bc08070000007e
+       VPINSRQ $126, DX, X7, X31                          // 6263c50822fa7e
+       VPINSRQ $126, BP, X7, X31                          // 6263c50822fd7e
+       VPINSRQ $126, 7(AX)(CX*4), X7, X31                 // 6263c50822bc88070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X7, X31                 // 6263c50822bc08070000007e
+       VPINSRQ $126, DX, X9, X31                          // 6263b50822fa7e
+       VPINSRQ $126, BP, X9, X31                          // 6263b50822fd7e
+       VPINSRQ $126, 7(AX)(CX*4), X9, X31                 // 6263b50822bc88070000007e
+       VPINSRQ $126, 7(AX)(CX*1), X9, X31                 // 6263b50822bc08070000007e
+       VPMOVD2M X3, K6                                    // 62f27e0839f3
+       VPMOVD2M X26, K6                                   // 62927e0839f2
+       VPMOVD2M X23, K6                                   // 62b27e0839f7
+       VPMOVD2M X3, K7                                    // 62f27e0839fb
+       VPMOVD2M X26, K7                                   // 62927e0839fa
+       VPMOVD2M X23, K7                                   // 62b27e0839ff
+       VPMOVD2M Y5, K6                                    // 62f27e2839f5
+       VPMOVD2M Y28, K6                                   // 62927e2839f4
+       VPMOVD2M Y7, K6                                    // 62f27e2839f7
+       VPMOVD2M Y5, K4                                    // 62f27e2839e5
+       VPMOVD2M Y28, K4                                   // 62927e2839e4
+       VPMOVD2M Y7, K4                                    // 62f27e2839e7
+       VPMOVD2M Z1, K4                                    // 62f27e4839e1
+       VPMOVD2M Z9, K4                                    // 62d27e4839e1
+       VPMOVD2M Z1, K6                                    // 62f27e4839f1
+       VPMOVD2M Z9, K6                                    // 62d27e4839f1
+       VPMOVM2D K6, X21                                   // 62e27e0838ee
+       VPMOVM2D K5, X21                                   // 62e27e0838ed
+       VPMOVM2D K6, X1                                    // 62f27e0838ce
+       VPMOVM2D K5, X1                                    // 62f27e0838cd
+       VPMOVM2D K6, X11                                   // 62727e0838de
+       VPMOVM2D K5, X11                                   // 62727e0838dd
+       VPMOVM2D K1, Y28                                   // 62627e2838e1
+       VPMOVM2D K5, Y28                                   // 62627e2838e5
+       VPMOVM2D K1, Y13                                   // 62727e2838e9
+       VPMOVM2D K5, Y13                                   // 62727e2838ed
+       VPMOVM2D K1, Y7                                    // 62f27e2838f9
+       VPMOVM2D K5, Y7                                    // 62f27e2838fd
+       VPMOVM2D K3, Z7                                    // 62f27e4838fb
+       VPMOVM2D K1, Z7                                    // 62f27e4838f9
+       VPMOVM2D K3, Z21                                   // 62e27e4838eb
+       VPMOVM2D K1, Z21                                   // 62e27e4838e9
+       VPMOVM2Q K5, X13                                   // 6272fe0838ed
+       VPMOVM2Q K4, X13                                   // 6272fe0838ec
+       VPMOVM2Q K5, X0                                    // 62f2fe0838c5
+       VPMOVM2Q K4, X0                                    // 62f2fe0838c4
+       VPMOVM2Q K5, X30                                   // 6262fe0838f5
+       VPMOVM2Q K4, X30                                   // 6262fe0838f4
+       VPMOVM2Q K7, Y2                                    // 62f2fe2838d7
+       VPMOVM2Q K6, Y2                                    // 62f2fe2838d6
+       VPMOVM2Q K7, Y21                                   // 62e2fe2838ef
+       VPMOVM2Q K6, Y21                                   // 62e2fe2838ee
+       VPMOVM2Q K7, Y12                                   // 6272fe2838e7
+       VPMOVM2Q K6, Y12                                   // 6272fe2838e6
+       VPMOVM2Q K4, Z16                                   // 62e2fe4838c4
+       VPMOVM2Q K6, Z16                                   // 62e2fe4838c6
+       VPMOVM2Q K4, Z25                                   // 6262fe4838cc
+       VPMOVM2Q K6, Z25                                   // 6262fe4838ce
+       VPMOVQ2M X14, K1                                   // 62d2fe0839ce
+       VPMOVQ2M X19, K1                                   // 62b2fe0839cb
+       VPMOVQ2M X8, K1                                    // 62d2fe0839c8
+       VPMOVQ2M X14, K3                                   // 62d2fe0839de
+       VPMOVQ2M X19, K3                                   // 62b2fe0839db
+       VPMOVQ2M X8, K3                                    // 62d2fe0839d8
+       VPMOVQ2M Y3, K6                                    // 62f2fe2839f3
+       VPMOVQ2M Y2, K6                                    // 62f2fe2839f2
+       VPMOVQ2M Y9, K6                                    // 62d2fe2839f1
+       VPMOVQ2M Y3, K7                                    // 62f2fe2839fb
+       VPMOVQ2M Y2, K7                                    // 62f2fe2839fa
+       VPMOVQ2M Y9, K7                                    // 62d2fe2839f9
+       VPMOVQ2M Z12, K6                                   // 62d2fe4839f4
+       VPMOVQ2M Z13, K6                                   // 62d2fe4839f5
+       VPMOVQ2M Z12, K4                                   // 62d2fe4839e4
+       VPMOVQ2M Z13, K4                                   // 62d2fe4839e5
+       VPMULLQ X13, X3, K7, X17                           // 62c2e50f40cd
+       VPMULLQ X28, X3, K7, X17                           // 6282e50f40cc
+       VPMULLQ X24, X3, K7, X17                           // 6282e50f40c8
+       VPMULLQ 15(R8)(R14*4), X3, K7, X17                 // 6282e50f408cb00f000000
+       VPMULLQ -7(CX)(DX*4), X3, K7, X17                  // 62e2e50f408c91f9ffffff
+       VPMULLQ X13, X26, K7, X17                          // 62c2ad0740cd
+       VPMULLQ X28, X26, K7, X17                          // 6282ad0740cc
+       VPMULLQ X24, X26, K7, X17                          // 6282ad0740c8
+       VPMULLQ 15(R8)(R14*4), X26, K7, X17                // 6282ad07408cb00f000000
+       VPMULLQ -7(CX)(DX*4), X26, K7, X17                 // 62e2ad07408c91f9ffffff
+       VPMULLQ X13, X23, K7, X17                          // 62c2c50740cd
+       VPMULLQ X28, X23, K7, X17                          // 6282c50740cc
+       VPMULLQ X24, X23, K7, X17                          // 6282c50740c8
+       VPMULLQ 15(R8)(R14*4), X23, K7, X17                // 6282c507408cb00f000000
+       VPMULLQ -7(CX)(DX*4), X23, K7, X17                 // 62e2c507408c91f9ffffff
+       VPMULLQ X13, X3, K7, X15                           // 6252e50f40fd
+       VPMULLQ X28, X3, K7, X15                           // 6212e50f40fc
+       VPMULLQ X24, X3, K7, X15                           // 6212e50f40f8
+       VPMULLQ 15(R8)(R14*4), X3, K7, X15                 // 6212e50f40bcb00f000000
+       VPMULLQ -7(CX)(DX*4), X3, K7, X15                  // 6272e50f40bc91f9ffffff
+       VPMULLQ X13, X26, K7, X15                          // 6252ad0740fd
+       VPMULLQ X28, X26, K7, X15                          // 6212ad0740fc
+       VPMULLQ X24, X26, K7, X15                          // 6212ad0740f8
+       VPMULLQ 15(R8)(R14*4), X26, K7, X15                // 6212ad0740bcb00f000000
+       VPMULLQ -7(CX)(DX*4), X26, K7, X15                 // 6272ad0740bc91f9ffffff
+       VPMULLQ X13, X23, K7, X15                          // 6252c50740fd
+       VPMULLQ X28, X23, K7, X15                          // 6212c50740fc
+       VPMULLQ X24, X23, K7, X15                          // 6212c50740f8
+       VPMULLQ 15(R8)(R14*4), X23, K7, X15                // 6212c50740bcb00f000000
+       VPMULLQ -7(CX)(DX*4), X23, K7, X15                 // 6272c50740bc91f9ffffff
+       VPMULLQ X13, X3, K7, X8                            // 6252e50f40c5
+       VPMULLQ X28, X3, K7, X8                            // 6212e50f40c4
+       VPMULLQ X24, X3, K7, X8                            // 6212e50f40c0
+       VPMULLQ 15(R8)(R14*4), X3, K7, X8                  // 6212e50f4084b00f000000
+       VPMULLQ -7(CX)(DX*4), X3, K7, X8                   // 6272e50f408491f9ffffff
+       VPMULLQ X13, X26, K7, X8                           // 6252ad0740c5
+       VPMULLQ X28, X26, K7, X8                           // 6212ad0740c4
+       VPMULLQ X24, X26, K7, X8                           // 6212ad0740c0
+       VPMULLQ 15(R8)(R14*4), X26, K7, X8                 // 6212ad074084b00f000000
+       VPMULLQ -7(CX)(DX*4), X26, K7, X8                  // 6272ad07408491f9ffffff
+       VPMULLQ X13, X23, K7, X8                           // 6252c50740c5
+       VPMULLQ X28, X23, K7, X8                           // 6212c50740c4
+       VPMULLQ X24, X23, K7, X8                           // 6212c50740c0
+       VPMULLQ 15(R8)(R14*4), X23, K7, X8                 // 6212c5074084b00f000000
+       VPMULLQ -7(CX)(DX*4), X23, K7, X8                  // 6272c507408491f9ffffff
+       VPMULLQ Y28, Y31, K2, Y17                          // 6282852240cc
+       VPMULLQ Y13, Y31, K2, Y17                          // 62c2852240cd
+       VPMULLQ Y7, Y31, K2, Y17                           // 62e2852240cf
+       VPMULLQ 15(DX)(BX*1), Y31, K2, Y17                 // 62e28522408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y31, K2, Y17                 // 62e28522408c51f9ffffff
+       VPMULLQ Y28, Y8, K2, Y17                           // 6282bd2a40cc
+       VPMULLQ Y13, Y8, K2, Y17                           // 62c2bd2a40cd
+       VPMULLQ Y7, Y8, K2, Y17                            // 62e2bd2a40cf
+       VPMULLQ 15(DX)(BX*1), Y8, K2, Y17                  // 62e2bd2a408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y8, K2, Y17                  // 62e2bd2a408c51f9ffffff
+       VPMULLQ Y28, Y1, K2, Y17                           // 6282f52a40cc
+       VPMULLQ Y13, Y1, K2, Y17                           // 62c2f52a40cd
+       VPMULLQ Y7, Y1, K2, Y17                            // 62e2f52a40cf
+       VPMULLQ 15(DX)(BX*1), Y1, K2, Y17                  // 62e2f52a408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y1, K2, Y17                  // 62e2f52a408c51f9ffffff
+       VPMULLQ Y28, Y31, K2, Y7                           // 6292852240fc
+       VPMULLQ Y13, Y31, K2, Y7                           // 62d2852240fd
+       VPMULLQ Y7, Y31, K2, Y7                            // 62f2852240ff
+       VPMULLQ 15(DX)(BX*1), Y31, K2, Y7                  // 62f2852240bc1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y31, K2, Y7                  // 62f2852240bc51f9ffffff
+       VPMULLQ Y28, Y8, K2, Y7                            // 6292bd2a40fc
+       VPMULLQ Y13, Y8, K2, Y7                            // 62d2bd2a40fd
+       VPMULLQ Y7, Y8, K2, Y7                             // 62f2bd2a40ff
+       VPMULLQ 15(DX)(BX*1), Y8, K2, Y7                   // 62f2bd2a40bc1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y8, K2, Y7                   // 62f2bd2a40bc51f9ffffff
+       VPMULLQ Y28, Y1, K2, Y7                            // 6292f52a40fc
+       VPMULLQ Y13, Y1, K2, Y7                            // 62d2f52a40fd
+       VPMULLQ Y7, Y1, K2, Y7                             // 62f2f52a40ff
+       VPMULLQ 15(DX)(BX*1), Y1, K2, Y7                   // 62f2f52a40bc1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y1, K2, Y7                   // 62f2f52a40bc51f9ffffff
+       VPMULLQ Y28, Y31, K2, Y9                           // 6212852240cc
+       VPMULLQ Y13, Y31, K2, Y9                           // 6252852240cd
+       VPMULLQ Y7, Y31, K2, Y9                            // 6272852240cf
+       VPMULLQ 15(DX)(BX*1), Y31, K2, Y9                  // 62728522408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y31, K2, Y9                  // 62728522408c51f9ffffff
+       VPMULLQ Y28, Y8, K2, Y9                            // 6212bd2a40cc
+       VPMULLQ Y13, Y8, K2, Y9                            // 6252bd2a40cd
+       VPMULLQ Y7, Y8, K2, Y9                             // 6272bd2a40cf
+       VPMULLQ 15(DX)(BX*1), Y8, K2, Y9                   // 6272bd2a408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y8, K2, Y9                   // 6272bd2a408c51f9ffffff
+       VPMULLQ Y28, Y1, K2, Y9                            // 6212f52a40cc
+       VPMULLQ Y13, Y1, K2, Y9                            // 6252f52a40cd
+       VPMULLQ Y7, Y1, K2, Y9                             // 6272f52a40cf
+       VPMULLQ 15(DX)(BX*1), Y1, K2, Y9                   // 6272f52a408c1a0f000000
+       VPMULLQ -7(CX)(DX*2), Y1, K2, Y9                   // 6272f52a408c51f9ffffff
+       VPMULLQ Z3, Z20, K4, Z0                            // 62f2dd4440c3
+       VPMULLQ Z30, Z20, K4, Z0                           // 6292dd4440c6
+       VPMULLQ 15(R8)(R14*8), Z20, K4, Z0                 // 6292dd444084f00f000000
+       VPMULLQ -15(R14)(R15*2), Z20, K4, Z0               // 6292dd4440847ef1ffffff
+       VPMULLQ Z3, Z28, K4, Z0                            // 62f29d4440c3
+       VPMULLQ Z30, Z28, K4, Z0                           // 62929d4440c6
+       VPMULLQ 15(R8)(R14*8), Z28, K4, Z0                 // 62929d444084f00f000000
+       VPMULLQ -15(R14)(R15*2), Z28, K4, Z0               // 62929d4440847ef1ffffff
+       VPMULLQ Z3, Z20, K4, Z6                            // 62f2dd4440f3
+       VPMULLQ Z30, Z20, K4, Z6                           // 6292dd4440f6
+       VPMULLQ 15(R8)(R14*8), Z20, K4, Z6                 // 6292dd4440b4f00f000000
+       VPMULLQ -15(R14)(R15*2), Z20, K4, Z6               // 6292dd4440b47ef1ffffff
+       VPMULLQ Z3, Z28, K4, Z6                            // 62f29d4440f3
+       VPMULLQ Z30, Z28, K4, Z6                           // 62929d4440f6
+       VPMULLQ 15(R8)(R14*8), Z28, K4, Z6                 // 62929d4440b4f00f000000
+       VPMULLQ -15(R14)(R15*2), Z28, K4, Z6               // 62929d4440b47ef1ffffff
+       VRANGEPD $11, X24, X23, K2, X12                    // 6213c50250e00b
+       VRANGEPD $11, X14, X23, K2, X12                    // 6253c50250e60b
+       VRANGEPD $11, X0, X23, K2, X12                     // 6273c50250e00b
+       VRANGEPD $11, 17(SP)(BP*8), X23, K2, X12           // 6273c50250a4ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X23, K2, X12           // 6273c50250a4ac110000000b
+       VRANGEPD $11, X24, X11, K2, X12                    // 6213a50a50e00b
+       VRANGEPD $11, X14, X11, K2, X12                    // 6253a50a50e60b
+       VRANGEPD $11, X0, X11, K2, X12                     // 6273a50a50e00b
+       VRANGEPD $11, 17(SP)(BP*8), X11, K2, X12           // 6273a50a50a4ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X11, K2, X12           // 6273a50a50a4ac110000000b
+       VRANGEPD $11, X24, X31, K2, X12                    // 6213850250e00b
+       VRANGEPD $11, X14, X31, K2, X12                    // 6253850250e60b
+       VRANGEPD $11, X0, X31, K2, X12                     // 6273850250e00b
+       VRANGEPD $11, 17(SP)(BP*8), X31, K2, X12           // 6273850250a4ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X31, K2, X12           // 6273850250a4ac110000000b
+       VRANGEPD $11, X24, X23, K2, X16                    // 6283c50250c00b
+       VRANGEPD $11, X14, X23, K2, X16                    // 62c3c50250c60b
+       VRANGEPD $11, X0, X23, K2, X16                     // 62e3c50250c00b
+       VRANGEPD $11, 17(SP)(BP*8), X23, K2, X16           // 62e3c5025084ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X23, K2, X16           // 62e3c5025084ac110000000b
+       VRANGEPD $11, X24, X11, K2, X16                    // 6283a50a50c00b
+       VRANGEPD $11, X14, X11, K2, X16                    // 62c3a50a50c60b
+       VRANGEPD $11, X0, X11, K2, X16                     // 62e3a50a50c00b
+       VRANGEPD $11, 17(SP)(BP*8), X11, K2, X16           // 62e3a50a5084ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X11, K2, X16           // 62e3a50a5084ac110000000b
+       VRANGEPD $11, X24, X31, K2, X16                    // 6283850250c00b
+       VRANGEPD $11, X14, X31, K2, X16                    // 62c3850250c60b
+       VRANGEPD $11, X0, X31, K2, X16                     // 62e3850250c00b
+       VRANGEPD $11, 17(SP)(BP*8), X31, K2, X16           // 62e385025084ec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X31, K2, X16           // 62e385025084ac110000000b
+       VRANGEPD $11, X24, X23, K2, X23                    // 6283c50250f80b
+       VRANGEPD $11, X14, X23, K2, X23                    // 62c3c50250fe0b
+       VRANGEPD $11, X0, X23, K2, X23                     // 62e3c50250f80b
+       VRANGEPD $11, 17(SP)(BP*8), X23, K2, X23           // 62e3c50250bcec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X23, K2, X23           // 62e3c50250bcac110000000b
+       VRANGEPD $11, X24, X11, K2, X23                    // 6283a50a50f80b
+       VRANGEPD $11, X14, X11, K2, X23                    // 62c3a50a50fe0b
+       VRANGEPD $11, X0, X11, K2, X23                     // 62e3a50a50f80b
+       VRANGEPD $11, 17(SP)(BP*8), X11, K2, X23           // 62e3a50a50bcec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X11, K2, X23           // 62e3a50a50bcac110000000b
+       VRANGEPD $11, X24, X31, K2, X23                    // 6283850250f80b
+       VRANGEPD $11, X14, X31, K2, X23                    // 62c3850250fe0b
+       VRANGEPD $11, X0, X31, K2, X23                     // 62e3850250f80b
+       VRANGEPD $11, 17(SP)(BP*8), X31, K2, X23           // 62e3850250bcec110000000b
+       VRANGEPD $11, 17(SP)(BP*4), X31, K2, X23           // 62e3850250bcac110000000b
+       VRANGEPD $12, Y3, Y18, K1, Y15                     // 6273ed2150fb0c
+       VRANGEPD $12, Y19, Y18, K1, Y15                    // 6233ed2150fb0c
+       VRANGEPD $12, Y23, Y18, K1, Y15                    // 6233ed2150ff0c
+       VRANGEPD $12, (R8), Y18, K1, Y15                   // 6253ed2150380c
+       VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y15           // 6273ed2150bc5a0f0000000c
+       VRANGEPD $12, Y3, Y24, K1, Y15                     // 6273bd2150fb0c
+       VRANGEPD $12, Y19, Y24, K1, Y15                    // 6233bd2150fb0c
+       VRANGEPD $12, Y23, Y24, K1, Y15                    // 6233bd2150ff0c
+       VRANGEPD $12, (R8), Y24, K1, Y15                   // 6253bd2150380c
+       VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y15           // 6273bd2150bc5a0f0000000c
+       VRANGEPD $12, Y3, Y9, K1, Y15                      // 6273b52950fb0c
+       VRANGEPD $12, Y19, Y9, K1, Y15                     // 6233b52950fb0c
+       VRANGEPD $12, Y23, Y9, K1, Y15                     // 6233b52950ff0c
+       VRANGEPD $12, (R8), Y9, K1, Y15                    // 6253b52950380c
+       VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y15            // 6273b52950bc5a0f0000000c
+       VRANGEPD $12, Y3, Y18, K1, Y22                     // 62e3ed2150f30c
+       VRANGEPD $12, Y19, Y18, K1, Y22                    // 62a3ed2150f30c
+       VRANGEPD $12, Y23, Y18, K1, Y22                    // 62a3ed2150f70c
+       VRANGEPD $12, (R8), Y18, K1, Y22                   // 62c3ed2150300c
+       VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y22           // 62e3ed2150b45a0f0000000c
+       VRANGEPD $12, Y3, Y24, K1, Y22                     // 62e3bd2150f30c
+       VRANGEPD $12, Y19, Y24, K1, Y22                    // 62a3bd2150f30c
+       VRANGEPD $12, Y23, Y24, K1, Y22                    // 62a3bd2150f70c
+       VRANGEPD $12, (R8), Y24, K1, Y22                   // 62c3bd2150300c
+       VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y22           // 62e3bd2150b45a0f0000000c
+       VRANGEPD $12, Y3, Y9, K1, Y22                      // 62e3b52950f30c
+       VRANGEPD $12, Y19, Y9, K1, Y22                     // 62a3b52950f30c
+       VRANGEPD $12, Y23, Y9, K1, Y22                     // 62a3b52950f70c
+       VRANGEPD $12, (R8), Y9, K1, Y22                    // 62c3b52950300c
+       VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y22            // 62e3b52950b45a0f0000000c
+       VRANGEPD $12, Y3, Y18, K1, Y20                     // 62e3ed2150e30c
+       VRANGEPD $12, Y19, Y18, K1, Y20                    // 62a3ed2150e30c
+       VRANGEPD $12, Y23, Y18, K1, Y20                    // 62a3ed2150e70c
+       VRANGEPD $12, (R8), Y18, K1, Y20                   // 62c3ed2150200c
+       VRANGEPD $12, 15(DX)(BX*2), Y18, K1, Y20           // 62e3ed2150a45a0f0000000c
+       VRANGEPD $12, Y3, Y24, K1, Y20                     // 62e3bd2150e30c
+       VRANGEPD $12, Y19, Y24, K1, Y20                    // 62a3bd2150e30c
+       VRANGEPD $12, Y23, Y24, K1, Y20                    // 62a3bd2150e70c
+       VRANGEPD $12, (R8), Y24, K1, Y20                   // 62c3bd2150200c
+       VRANGEPD $12, 15(DX)(BX*2), Y24, K1, Y20           // 62e3bd2150a45a0f0000000c
+       VRANGEPD $12, Y3, Y9, K1, Y20                      // 62e3b52950e30c
+       VRANGEPD $12, Y19, Y9, K1, Y20                     // 62a3b52950e30c
+       VRANGEPD $12, Y23, Y9, K1, Y20                     // 62a3b52950e70c
+       VRANGEPD $12, (R8), Y9, K1, Y20                    // 62c3b52950200c
+       VRANGEPD $12, 15(DX)(BX*2), Y9, K1, Y20            // 62e3b52950a45a0f0000000c
+       VRANGEPD $13, Z21, Z12, K7, Z14                    // 62339d4f50f50d
+       VRANGEPD $13, Z9, Z12, K7, Z14                     // 62539d4f50f10d
+       VRANGEPD $13, Z21, Z13, K7, Z14                    // 6233954f50f50d
+       VRANGEPD $13, Z9, Z13, K7, Z14                     // 6253954f50f10d
+       VRANGEPD $13, Z21, Z12, K7, Z13                    // 62339d4f50ed0d
+       VRANGEPD $13, Z9, Z12, K7, Z13                     // 62539d4f50e90d
+       VRANGEPD $13, Z21, Z13, K7, Z13                    // 6233954f50ed0d
+       VRANGEPD $13, Z9, Z13, K7, Z13                     // 6253954f50e90d
+       VRANGEPD $14, Z23, Z27, K1, Z2                     // 62b3a54150d70e
+       VRANGEPD $14, Z9, Z27, K1, Z2                      // 62d3a54150d10e
+       VRANGEPD $14, (R14), Z27, K1, Z2                   // 62d3a54150160e
+       VRANGEPD $14, -7(DI)(R8*8), Z27, K1, Z2            // 62b3a5415094c7f9ffffff0e
+       VRANGEPD $14, Z23, Z25, K1, Z2                     // 62b3b54150d70e
+       VRANGEPD $14, Z9, Z25, K1, Z2                      // 62d3b54150d10e
+       VRANGEPD $14, (R14), Z25, K1, Z2                   // 62d3b54150160e
+       VRANGEPD $14, -7(DI)(R8*8), Z25, K1, Z2            // 62b3b5415094c7f9ffffff0e
+       VRANGEPD $14, Z23, Z27, K1, Z7                     // 62b3a54150ff0e
+       VRANGEPD $14, Z9, Z27, K1, Z7                      // 62d3a54150f90e
+       VRANGEPD $14, (R14), Z27, K1, Z7                   // 62d3a541503e0e
+       VRANGEPD $14, -7(DI)(R8*8), Z27, K1, Z7            // 62b3a54150bcc7f9ffffff0e
+       VRANGEPD $14, Z23, Z25, K1, Z7                     // 62b3b54150ff0e
+       VRANGEPD $14, Z9, Z25, K1, Z7                      // 62d3b54150f90e
+       VRANGEPD $14, (R14), Z25, K1, Z7                   // 62d3b541503e0e
+       VRANGEPD $14, -7(DI)(R8*8), Z25, K1, Z7            // 62b3b54150bcc7f9ffffff0e
+       VRANGEPS $15, X0, X20, K1, X11                     // 62735d0150d80f
+       VRANGEPS $15, X9, X20, K1, X11                     // 62535d0150d90f
+       VRANGEPS $15, X13, X20, K1, X11                    // 62535d0150dd0f
+       VRANGEPS $15, 7(SI)(DI*4), X20, K1, X11            // 62735d01509cbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X20, K1, X11           // 62335d01509c47f9ffffff0f
+       VRANGEPS $15, X0, X5, K1, X11                      // 6273550950d80f
+       VRANGEPS $15, X9, X5, K1, X11                      // 6253550950d90f
+       VRANGEPS $15, X13, X5, K1, X11                     // 6253550950dd0f
+       VRANGEPS $15, 7(SI)(DI*4), X5, K1, X11             // 62735509509cbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X5, K1, X11            // 62335509509c47f9ffffff0f
+       VRANGEPS $15, X0, X25, K1, X11                     // 6273350150d80f
+       VRANGEPS $15, X9, X25, K1, X11                     // 6253350150d90f
+       VRANGEPS $15, X13, X25, K1, X11                    // 6253350150dd0f
+       VRANGEPS $15, 7(SI)(DI*4), X25, K1, X11            // 62733501509cbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X25, K1, X11           // 62333501509c47f9ffffff0f
+       VRANGEPS $15, X0, X20, K1, X23                     // 62e35d0150f80f
+       VRANGEPS $15, X9, X20, K1, X23                     // 62c35d0150f90f
+       VRANGEPS $15, X13, X20, K1, X23                    // 62c35d0150fd0f
+       VRANGEPS $15, 7(SI)(DI*4), X20, K1, X23            // 62e35d0150bcbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X20, K1, X23           // 62a35d0150bc47f9ffffff0f
+       VRANGEPS $15, X0, X5, K1, X23                      // 62e3550950f80f
+       VRANGEPS $15, X9, X5, K1, X23                      // 62c3550950f90f
+       VRANGEPS $15, X13, X5, K1, X23                     // 62c3550950fd0f
+       VRANGEPS $15, 7(SI)(DI*4), X5, K1, X23             // 62e3550950bcbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X5, K1, X23            // 62a3550950bc47f9ffffff0f
+       VRANGEPS $15, X0, X25, K1, X23                     // 62e3350150f80f
+       VRANGEPS $15, X9, X25, K1, X23                     // 62c3350150f90f
+       VRANGEPS $15, X13, X25, K1, X23                    // 62c3350150fd0f
+       VRANGEPS $15, 7(SI)(DI*4), X25, K1, X23            // 62e3350150bcbe070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X25, K1, X23           // 62a3350150bc47f9ffffff0f
+       VRANGEPS $15, X0, X20, K1, X2                      // 62f35d0150d00f
+       VRANGEPS $15, X9, X20, K1, X2                      // 62d35d0150d10f
+       VRANGEPS $15, X13, X20, K1, X2                     // 62d35d0150d50f
+       VRANGEPS $15, 7(SI)(DI*4), X20, K1, X2             // 62f35d015094be070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X20, K1, X2            // 62b35d01509447f9ffffff0f
+       VRANGEPS $15, X0, X5, K1, X2                       // 62f3550950d00f
+       VRANGEPS $15, X9, X5, K1, X2                       // 62d3550950d10f
+       VRANGEPS $15, X13, X5, K1, X2                      // 62d3550950d50f
+       VRANGEPS $15, 7(SI)(DI*4), X5, K1, X2              // 62f355095094be070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X5, K1, X2             // 62b35509509447f9ffffff0f
+       VRANGEPS $15, X0, X25, K1, X2                      // 62f3350150d00f
+       VRANGEPS $15, X9, X25, K1, X2                      // 62d3350150d10f
+       VRANGEPS $15, X13, X25, K1, X2                     // 62d3350150d50f
+       VRANGEPS $15, 7(SI)(DI*4), X25, K1, X2             // 62f335015094be070000000f
+       VRANGEPS $15, -7(DI)(R8*2), X25, K1, X2            // 62b33501509447f9ffffff0f
+       VRANGEPS $0, Y21, Y5, K1, Y19                      // 62a3552950dd00
+       VRANGEPS $0, Y20, Y5, K1, Y19                      // 62a3552950dc00
+       VRANGEPS $0, Y6, Y5, K1, Y19                       // 62e3552950de00
+       VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y19             // 62e35529509c2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y19             // 62e35529509cd1f9ffffff00
+       VRANGEPS $0, Y21, Y16, K1, Y19                     // 62a37d2150dd00
+       VRANGEPS $0, Y20, Y16, K1, Y19                     // 62a37d2150dc00
+       VRANGEPS $0, Y6, Y16, K1, Y19                      // 62e37d2150de00
+       VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y19            // 62e37d21509c2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y19            // 62e37d21509cd1f9ffffff00
+       VRANGEPS $0, Y21, Y2, K1, Y19                      // 62a36d2950dd00
+       VRANGEPS $0, Y20, Y2, K1, Y19                      // 62a36d2950dc00
+       VRANGEPS $0, Y6, Y2, K1, Y19                       // 62e36d2950de00
+       VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y19             // 62e36d29509c2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y19             // 62e36d29509cd1f9ffffff00
+       VRANGEPS $0, Y21, Y5, K1, Y14                      // 6233552950f500
+       VRANGEPS $0, Y20, Y5, K1, Y14                      // 6233552950f400
+       VRANGEPS $0, Y6, Y5, K1, Y14                       // 6273552950f600
+       VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y14             // 6273552950b42c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y14             // 6273552950b4d1f9ffffff00
+       VRANGEPS $0, Y21, Y16, K1, Y14                     // 62337d2150f500
+       VRANGEPS $0, Y20, Y16, K1, Y14                     // 62337d2150f400
+       VRANGEPS $0, Y6, Y16, K1, Y14                      // 62737d2150f600
+       VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y14            // 62737d2150b42c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y14            // 62737d2150b4d1f9ffffff00
+       VRANGEPS $0, Y21, Y2, K1, Y14                      // 62336d2950f500
+       VRANGEPS $0, Y20, Y2, K1, Y14                      // 62336d2950f400
+       VRANGEPS $0, Y6, Y2, K1, Y14                       // 62736d2950f600
+       VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y14             // 62736d2950b42c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y14             // 62736d2950b4d1f9ffffff00
+       VRANGEPS $0, Y21, Y5, K1, Y21                      // 62a3552950ed00
+       VRANGEPS $0, Y20, Y5, K1, Y21                      // 62a3552950ec00
+       VRANGEPS $0, Y6, Y5, K1, Y21                       // 62e3552950ee00
+       VRANGEPS $0, 17(SP)(BP*1), Y5, K1, Y21             // 62e3552950ac2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y5, K1, Y21             // 62e3552950acd1f9ffffff00
+       VRANGEPS $0, Y21, Y16, K1, Y21                     // 62a37d2150ed00
+       VRANGEPS $0, Y20, Y16, K1, Y21                     // 62a37d2150ec00
+       VRANGEPS $0, Y6, Y16, K1, Y21                      // 62e37d2150ee00
+       VRANGEPS $0, 17(SP)(BP*1), Y16, K1, Y21            // 62e37d2150ac2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y16, K1, Y21            // 62e37d2150acd1f9ffffff00
+       VRANGEPS $0, Y21, Y2, K1, Y21                      // 62a36d2950ed00
+       VRANGEPS $0, Y20, Y2, K1, Y21                      // 62a36d2950ec00
+       VRANGEPS $0, Y6, Y2, K1, Y21                       // 62e36d2950ee00
+       VRANGEPS $0, 17(SP)(BP*1), Y2, K1, Y21             // 62e36d2950ac2c1100000000
+       VRANGEPS $0, -7(CX)(DX*8), Y2, K1, Y21             // 62e36d2950acd1f9ffffff00
+       VRANGEPS $1, Z14, Z3, K7, Z27                      // 6243654f50de01
+       VRANGEPS $1, Z7, Z3, K7, Z27                       // 6263654f50df01
+       VRANGEPS $1, Z14, Z0, K7, Z27                      // 62437d4f50de01
+       VRANGEPS $1, Z7, Z0, K7, Z27                       // 62637d4f50df01
+       VRANGEPS $1, Z14, Z3, K7, Z14                      // 6253654f50f601
+       VRANGEPS $1, Z7, Z3, K7, Z14                       // 6273654f50f701
+       VRANGEPS $1, Z14, Z0, K7, Z14                      // 62537d4f50f601
+       VRANGEPS $1, Z7, Z0, K7, Z14                       // 62737d4f50f701
+       VRANGEPS $2, Z1, Z22, K2, Z8                       // 62734d4250c102
+       VRANGEPS $2, Z16, Z22, K2, Z8                      // 62334d4250c002
+       VRANGEPS $2, 99(R15)(R15*4), Z22, K2, Z8           // 62134d425084bf6300000002
+       VRANGEPS $2, 15(DX), Z22, K2, Z8                   // 62734d4250820f00000002
+       VRANGEPS $2, Z1, Z25, K2, Z8                       // 6273354250c102
+       VRANGEPS $2, Z16, Z25, K2, Z8                      // 6233354250c002
+       VRANGEPS $2, 99(R15)(R15*4), Z25, K2, Z8           // 621335425084bf6300000002
+       VRANGEPS $2, 15(DX), Z25, K2, Z8                   // 6273354250820f00000002
+       VRANGEPS $2, Z1, Z22, K2, Z24                      // 62634d4250c102
+       VRANGEPS $2, Z16, Z22, K2, Z24                     // 62234d4250c002
+       VRANGEPS $2, 99(R15)(R15*4), Z22, K2, Z24          // 62034d425084bf6300000002
+       VRANGEPS $2, 15(DX), Z22, K2, Z24                  // 62634d4250820f00000002
+       VRANGEPS $2, Z1, Z25, K2, Z24                      // 6263354250c102
+       VRANGEPS $2, Z16, Z25, K2, Z24                     // 6223354250c002
+       VRANGEPS $2, 99(R15)(R15*4), Z25, K2, Z24          // 620335425084bf6300000002
+       VRANGEPS $2, 15(DX), Z25, K2, Z24                  // 6263354250820f00000002
+       VRANGESD $3, X22, X2, K4, X2                       // 62b3ed0c51d603
+       VRANGESD $3, X5, X2, K4, X2                        // 62f3ed0c51d503
+       VRANGESD $3, X14, X2, K4, X2                       // 62d3ed0c51d603
+       VRANGESD $3, X22, X31, K4, X2                      // 62b3850451d603
+       VRANGESD $3, X5, X31, K4, X2                       // 62f3850451d503
+       VRANGESD $3, X14, X31, K4, X2                      // 62d3850451d603
+       VRANGESD $3, X22, X11, K4, X2                      // 62b3a50c51d603
+       VRANGESD $3, X5, X11, K4, X2                       // 62f3a50c51d503
+       VRANGESD $3, X14, X11, K4, X2                      // 62d3a50c51d603
+       VRANGESD $3, X22, X2, K4, X8                       // 6233ed0c51c603
+       VRANGESD $3, X5, X2, K4, X8                        // 6273ed0c51c503
+       VRANGESD $3, X14, X2, K4, X8                       // 6253ed0c51c603
+       VRANGESD $3, X22, X31, K4, X8                      // 6233850451c603
+       VRANGESD $3, X5, X31, K4, X8                       // 6273850451c503
+       VRANGESD $3, X14, X31, K4, X8                      // 6253850451c603
+       VRANGESD $3, X22, X11, K4, X8                      // 6233a50c51c603
+       VRANGESD $3, X5, X11, K4, X8                       // 6273a50c51c503
+       VRANGESD $3, X14, X11, K4, X8                      // 6253a50c51c603
+       VRANGESD $3, X22, X2, K4, X9                       // 6233ed0c51ce03
+       VRANGESD $3, X5, X2, K4, X9                        // 6273ed0c51cd03
+       VRANGESD $3, X14, X2, K4, X9                       // 6253ed0c51ce03
+       VRANGESD $3, X22, X31, K4, X9                      // 6233850451ce03
+       VRANGESD $3, X5, X31, K4, X9                       // 6273850451cd03
+       VRANGESD $3, X14, X31, K4, X9                      // 6253850451ce03
+       VRANGESD $3, X22, X11, K4, X9                      // 6233a50c51ce03
+       VRANGESD $3, X5, X11, K4, X9                       // 6273a50c51cd03
+       VRANGESD $3, X14, X11, K4, X9                      // 6253a50c51ce03
+       VRANGESD $4, X18, X15, K1, X0                      // 62b3850951c204 or 62b3852951c204 or 62b3854951c204
+       VRANGESD $4, X8, X15, K1, X0                       // 62d3850951c004 or 62d3852951c004 or 62d3854951c004
+       VRANGESD $4, X27, X15, K1, X0                      // 6293850951c304 or 6293852951c304 or 6293854951c304
+       VRANGESD $4, 7(AX)(CX*4), X15, K1, X0              // 62f385095184880700000004 or 62f385295184880700000004 or 62f385495184880700000004
+       VRANGESD $4, 7(AX)(CX*1), X15, K1, X0              // 62f385095184080700000004 or 62f385295184080700000004 or 62f385495184080700000004
+       VRANGESD $4, X18, X11, K1, X0                      // 62b3a50951c204 or 62b3a52951c204 or 62b3a54951c204
+       VRANGESD $4, X8, X11, K1, X0                       // 62d3a50951c004 or 62d3a52951c004 or 62d3a54951c004
+       VRANGESD $4, X27, X11, K1, X0                      // 6293a50951c304 or 6293a52951c304 or 6293a54951c304
+       VRANGESD $4, 7(AX)(CX*4), X11, K1, X0              // 62f3a5095184880700000004 or 62f3a5295184880700000004 or 62f3a5495184880700000004
+       VRANGESD $4, 7(AX)(CX*1), X11, K1, X0              // 62f3a5095184080700000004 or 62f3a5295184080700000004 or 62f3a5495184080700000004
+       VRANGESD $4, X18, X0, K1, X0                       // 62b3fd0951c204 or 62b3fd2951c204 or 62b3fd4951c204
+       VRANGESD $4, X8, X0, K1, X0                        // 62d3fd0951c004 or 62d3fd2951c004 or 62d3fd4951c004
+       VRANGESD $4, X27, X0, K1, X0                       // 6293fd0951c304 or 6293fd2951c304 or 6293fd4951c304
+       VRANGESD $4, 7(AX)(CX*4), X0, K1, X0               // 62f3fd095184880700000004 or 62f3fd295184880700000004 or 62f3fd495184880700000004
+       VRANGESD $4, 7(AX)(CX*1), X0, K1, X0               // 62f3fd095184080700000004 or 62f3fd295184080700000004 or 62f3fd495184080700000004
+       VRANGESD $4, X18, X15, K1, X17                     // 62a3850951ca04 or 62a3852951ca04 or 62a3854951ca04
+       VRANGESD $4, X8, X15, K1, X17                      // 62c3850951c804 or 62c3852951c804 or 62c3854951c804
+       VRANGESD $4, X27, X15, K1, X17                     // 6283850951cb04 or 6283852951cb04 or 6283854951cb04
+       VRANGESD $4, 7(AX)(CX*4), X15, K1, X17             // 62e38509518c880700000004 or 62e38529518c880700000004 or 62e38549518c880700000004
+       VRANGESD $4, 7(AX)(CX*1), X15, K1, X17             // 62e38509518c080700000004 or 62e38529518c080700000004 or 62e38549518c080700000004
+       VRANGESD $4, X18, X11, K1, X17                     // 62a3a50951ca04 or 62a3a52951ca04 or 62a3a54951ca04
+       VRANGESD $4, X8, X11, K1, X17                      // 62c3a50951c804 or 62c3a52951c804 or 62c3a54951c804
+       VRANGESD $4, X27, X11, K1, X17                     // 6283a50951cb04 or 6283a52951cb04 or 6283a54951cb04
+       VRANGESD $4, 7(AX)(CX*4), X11, K1, X17             // 62e3a509518c880700000004 or 62e3a529518c880700000004 or 62e3a549518c880700000004
+       VRANGESD $4, 7(AX)(CX*1), X11, K1, X17             // 62e3a509518c080700000004 or 62e3a529518c080700000004 or 62e3a549518c080700000004
+       VRANGESD $4, X18, X0, K1, X17                      // 62a3fd0951ca04 or 62a3fd2951ca04 or 62a3fd4951ca04
+       VRANGESD $4, X8, X0, K1, X17                       // 62c3fd0951c804 or 62c3fd2951c804 or 62c3fd4951c804
+       VRANGESD $4, X27, X0, K1, X17                      // 6283fd0951cb04 or 6283fd2951cb04 or 6283fd4951cb04
+       VRANGESD $4, 7(AX)(CX*4), X0, K1, X17              // 62e3fd09518c880700000004 or 62e3fd29518c880700000004 or 62e3fd49518c880700000004
+       VRANGESD $4, 7(AX)(CX*1), X0, K1, X17              // 62e3fd09518c080700000004 or 62e3fd29518c080700000004 or 62e3fd49518c080700000004
+       VRANGESD $4, X18, X15, K1, X7                      // 62b3850951fa04 or 62b3852951fa04 or 62b3854951fa04
+       VRANGESD $4, X8, X15, K1, X7                       // 62d3850951f804 or 62d3852951f804 or 62d3854951f804
+       VRANGESD $4, X27, X15, K1, X7                      // 6293850951fb04 or 6293852951fb04 or 6293854951fb04
+       VRANGESD $4, 7(AX)(CX*4), X15, K1, X7              // 62f3850951bc880700000004 or 62f3852951bc880700000004 or 62f3854951bc880700000004
+       VRANGESD $4, 7(AX)(CX*1), X15, K1, X7              // 62f3850951bc080700000004 or 62f3852951bc080700000004 or 62f3854951bc080700000004
+       VRANGESD $4, X18, X11, K1, X7                      // 62b3a50951fa04 or 62b3a52951fa04 or 62b3a54951fa04
+       VRANGESD $4, X8, X11, K1, X7                       // 62d3a50951f804 or 62d3a52951f804 or 62d3a54951f804
+       VRANGESD $4, X27, X11, K1, X7                      // 6293a50951fb04 or 6293a52951fb04 or 6293a54951fb04
+       VRANGESD $4, 7(AX)(CX*4), X11, K1, X7              // 62f3a50951bc880700000004 or 62f3a52951bc880700000004 or 62f3a54951bc880700000004
+       VRANGESD $4, 7(AX)(CX*1), X11, K1, X7              // 62f3a50951bc080700000004 or 62f3a52951bc080700000004 or 62f3a54951bc080700000004
+       VRANGESD $4, X18, X0, K1, X7                       // 62b3fd0951fa04 or 62b3fd2951fa04 or 62b3fd4951fa04
+       VRANGESD $4, X8, X0, K1, X7                        // 62d3fd0951f804 or 62d3fd2951f804 or 62d3fd4951f804
+       VRANGESD $4, X27, X0, K1, X7                       // 6293fd0951fb04 or 6293fd2951fb04 or 6293fd4951fb04
+       VRANGESD $4, 7(AX)(CX*4), X0, K1, X7               // 62f3fd0951bc880700000004 or 62f3fd2951bc880700000004 or 62f3fd4951bc880700000004
+       VRANGESD $4, 7(AX)(CX*1), X0, K1, X7               // 62f3fd0951bc080700000004 or 62f3fd2951bc080700000004 or 62f3fd4951bc080700000004
+       VRANGESS $5, X7, X15, K3, X25                      // 6263050b51cf05
+       VRANGESS $5, X13, X15, K3, X25                     // 6243050b51cd05
+       VRANGESS $5, X8, X15, K3, X25                      // 6243050b51c805
+       VRANGESS $5, X7, X28, K3, X25                      // 62631d0351cf05
+       VRANGESS $5, X13, X28, K3, X25                     // 62431d0351cd05
+       VRANGESS $5, X8, X28, K3, X25                      // 62431d0351c805
+       VRANGESS $5, X7, X15, K3, X3                       // 62f3050b51df05
+       VRANGESS $5, X13, X15, K3, X3                      // 62d3050b51dd05
+       VRANGESS $5, X8, X15, K3, X3                       // 62d3050b51d805
+       VRANGESS $5, X7, X28, K3, X3                       // 62f31d0351df05
+       VRANGESS $5, X13, X28, K3, X3                      // 62d31d0351dd05
+       VRANGESS $5, X8, X28, K3, X3                       // 62d31d0351d805
+       VRANGESS $5, X7, X15, K3, X18                      // 62e3050b51d705
+       VRANGESS $5, X13, X15, K3, X18                     // 62c3050b51d505
+       VRANGESS $5, X8, X15, K3, X18                      // 62c3050b51d005
+       VRANGESS $5, X7, X28, K3, X18                      // 62e31d0351d705
+       VRANGESS $5, X13, X28, K3, X18                     // 62c31d0351d505
+       VRANGESS $5, X8, X28, K3, X18                      // 62c31d0351d005
+       VRANGESS $6, X6, X22, K4, X24                      // 62634d0451c606 or 62634d2451c606 or 62634d4451c606
+       VRANGESS $6, X7, X22, K4, X24                      // 62634d0451c706 or 62634d2451c706 or 62634d4451c706
+       VRANGESS $6, X8, X22, K4, X24                      // 62434d0451c006 or 62434d2451c006 or 62434d4451c006
+       VRANGESS $6, 7(SI)(DI*1), X22, K4, X24             // 62634d0451843e0700000006 or 62634d2451843e0700000006 or 62634d4451843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X22, K4, X24            // 62634d045184da0f00000006 or 62634d245184da0f00000006 or 62634d445184da0f00000006
+       VRANGESS $6, X6, X1, K4, X24                       // 6263750c51c606 or 6263752c51c606 or 6263754c51c606
+       VRANGESS $6, X7, X1, K4, X24                       // 6263750c51c706 or 6263752c51c706 or 6263754c51c706
+       VRANGESS $6, X8, X1, K4, X24                       // 6243750c51c006 or 6243752c51c006 or 6243754c51c006
+       VRANGESS $6, 7(SI)(DI*1), X1, K4, X24              // 6263750c51843e0700000006 or 6263752c51843e0700000006 or 6263754c51843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X1, K4, X24             // 6263750c5184da0f00000006 or 6263752c5184da0f00000006 or 6263754c5184da0f00000006
+       VRANGESS $6, X6, X11, K4, X24                      // 6263250c51c606 or 6263252c51c606 or 6263254c51c606
+       VRANGESS $6, X7, X11, K4, X24                      // 6263250c51c706 or 6263252c51c706 or 6263254c51c706
+       VRANGESS $6, X8, X11, K4, X24                      // 6243250c51c006 or 6243252c51c006 or 6243254c51c006
+       VRANGESS $6, 7(SI)(DI*1), X11, K4, X24             // 6263250c51843e0700000006 or 6263252c51843e0700000006 or 6263254c51843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X11, K4, X24            // 6263250c5184da0f00000006 or 6263252c5184da0f00000006 or 6263254c5184da0f00000006
+       VRANGESS $6, X6, X22, K4, X7                       // 62f34d0451fe06 or 62f34d2451fe06 or 62f34d4451fe06
+       VRANGESS $6, X7, X22, K4, X7                       // 62f34d0451ff06 or 62f34d2451ff06 or 62f34d4451ff06
+       VRANGESS $6, X8, X22, K4, X7                       // 62d34d0451f806 or 62d34d2451f806 or 62d34d4451f806
+       VRANGESS $6, 7(SI)(DI*1), X22, K4, X7              // 62f34d0451bc3e0700000006 or 62f34d2451bc3e0700000006 or 62f34d4451bc3e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X22, K4, X7             // 62f34d0451bcda0f00000006 or 62f34d2451bcda0f00000006 or 62f34d4451bcda0f00000006
+       VRANGESS $6, X6, X1, K4, X7                        // 62f3750c51fe06 or 62f3752c51fe06 or 62f3754c51fe06
+       VRANGESS $6, X7, X1, K4, X7                        // 62f3750c51ff06 or 62f3752c51ff06 or 62f3754c51ff06
+       VRANGESS $6, X8, X1, K4, X7                        // 62d3750c51f806 or 62d3752c51f806 or 62d3754c51f806
+       VRANGESS $6, 7(SI)(DI*1), X1, K4, X7               // 62f3750c51bc3e0700000006 or 62f3752c51bc3e0700000006 or 62f3754c51bc3e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X1, K4, X7              // 62f3750c51bcda0f00000006 or 62f3752c51bcda0f00000006 or 62f3754c51bcda0f00000006
+       VRANGESS $6, X6, X11, K4, X7                       // 62f3250c51fe06 or 62f3252c51fe06 or 62f3254c51fe06
+       VRANGESS $6, X7, X11, K4, X7                       // 62f3250c51ff06 or 62f3252c51ff06 or 62f3254c51ff06
+       VRANGESS $6, X8, X11, K4, X7                       // 62d3250c51f806 or 62d3252c51f806 or 62d3254c51f806
+       VRANGESS $6, 7(SI)(DI*1), X11, K4, X7              // 62f3250c51bc3e0700000006 or 62f3252c51bc3e0700000006 or 62f3254c51bc3e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X11, K4, X7             // 62f3250c51bcda0f00000006 or 62f3252c51bcda0f00000006 or 62f3254c51bcda0f00000006
+       VRANGESS $6, X6, X22, K4, X0                       // 62f34d0451c606 or 62f34d2451c606 or 62f34d4451c606
+       VRANGESS $6, X7, X22, K4, X0                       // 62f34d0451c706 or 62f34d2451c706 or 62f34d4451c706
+       VRANGESS $6, X8, X22, K4, X0                       // 62d34d0451c006 or 62d34d2451c006 or 62d34d4451c006
+       VRANGESS $6, 7(SI)(DI*1), X22, K4, X0              // 62f34d0451843e0700000006 or 62f34d2451843e0700000006 or 62f34d4451843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X22, K4, X0             // 62f34d045184da0f00000006 or 62f34d245184da0f00000006 or 62f34d445184da0f00000006
+       VRANGESS $6, X6, X1, K4, X0                        // 62f3750c51c606 or 62f3752c51c606 or 62f3754c51c606
+       VRANGESS $6, X7, X1, K4, X0                        // 62f3750c51c706 or 62f3752c51c706 or 62f3754c51c706
+       VRANGESS $6, X8, X1, K4, X0                        // 62d3750c51c006 or 62d3752c51c006 or 62d3754c51c006
+       VRANGESS $6, 7(SI)(DI*1), X1, K4, X0               // 62f3750c51843e0700000006 or 62f3752c51843e0700000006 or 62f3754c51843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X1, K4, X0              // 62f3750c5184da0f00000006 or 62f3752c5184da0f00000006 or 62f3754c5184da0f00000006
+       VRANGESS $6, X6, X11, K4, X0                       // 62f3250c51c606 or 62f3252c51c606 or 62f3254c51c606
+       VRANGESS $6, X7, X11, K4, X0                       // 62f3250c51c706 or 62f3252c51c706 or 62f3254c51c706
+       VRANGESS $6, X8, X11, K4, X0                       // 62d3250c51c006 or 62d3252c51c006 or 62d3254c51c006
+       VRANGESS $6, 7(SI)(DI*1), X11, K4, X0              // 62f3250c51843e0700000006 or 62f3252c51843e0700000006 or 62f3254c51843e0700000006
+       VRANGESS $6, 15(DX)(BX*8), X11, K4, X0             // 62f3250c5184da0f00000006 or 62f3252c5184da0f00000006 or 62f3254c5184da0f00000006
+       VREDUCEPD $126, X8, K3, X31                        // 6243fd0b56f87e
+       VREDUCEPD $126, X1, K3, X31                        // 6263fd0b56f97e
+       VREDUCEPD $126, X0, K3, X31                        // 6263fd0b56f87e
+       VREDUCEPD $126, 99(R15)(R15*1), K3, X31            // 6203fd0b56bc3f630000007e
+       VREDUCEPD $126, (DX), K3, X31                      // 6263fd0b563a7e
+       VREDUCEPD $126, X8, K3, X16                        // 62c3fd0b56c07e
+       VREDUCEPD $126, X1, K3, X16                        // 62e3fd0b56c17e
+       VREDUCEPD $126, X0, K3, X16                        // 62e3fd0b56c07e
+       VREDUCEPD $126, 99(R15)(R15*1), K3, X16            // 6283fd0b56843f630000007e
+       VREDUCEPD $126, (DX), K3, X16                      // 62e3fd0b56027e
+       VREDUCEPD $126, X8, K3, X7                         // 62d3fd0b56f87e
+       VREDUCEPD $126, X1, K3, X7                         // 62f3fd0b56f97e
+       VREDUCEPD $126, X0, K3, X7                         // 62f3fd0b56f87e
+       VREDUCEPD $126, 99(R15)(R15*1), K3, X7             // 6293fd0b56bc3f630000007e
+       VREDUCEPD $126, (DX), K3, X7                       // 62f3fd0b563a7e
+       VREDUCEPD $94, Y0, K3, Y5                          // 62f3fd2b56e85e
+       VREDUCEPD $94, Y22, K3, Y5                         // 62b3fd2b56ee5e
+       VREDUCEPD $94, Y13, K3, Y5                         // 62d3fd2b56ed5e
+       VREDUCEPD $94, (R14), K3, Y5                       // 62d3fd2b562e5e
+       VREDUCEPD $94, -7(DI)(R8*8), K3, Y5                // 62b3fd2b56acc7f9ffffff5e
+       VREDUCEPD $94, Y0, K3, Y28                         // 6263fd2b56e05e
+       VREDUCEPD $94, Y22, K3, Y28                        // 6223fd2b56e65e
+       VREDUCEPD $94, Y13, K3, Y28                        // 6243fd2b56e55e
+       VREDUCEPD $94, (R14), K3, Y28                      // 6243fd2b56265e
+       VREDUCEPD $94, -7(DI)(R8*8), K3, Y28               // 6223fd2b56a4c7f9ffffff5e
+       VREDUCEPD $94, Y0, K3, Y7                          // 62f3fd2b56f85e
+       VREDUCEPD $94, Y22, K3, Y7                         // 62b3fd2b56fe5e
+       VREDUCEPD $94, Y13, K3, Y7                         // 62d3fd2b56fd5e
+       VREDUCEPD $94, (R14), K3, Y7                       // 62d3fd2b563e5e
+       VREDUCEPD $94, -7(DI)(R8*8), K3, Y7                // 62b3fd2b56bcc7f9ffffff5e
+       VREDUCEPD $121, Z3, K2, Z26                        // 6263fd4a56d379
+       VREDUCEPD $121, Z0, K2, Z26                        // 6263fd4a56d079
+       VREDUCEPD $121, Z3, K2, Z3                         // 62f3fd4a56db79
+       VREDUCEPD $121, Z0, K2, Z3                         // 62f3fd4a56d879
+       VREDUCEPD $13, Z11, K1, Z21                        // 62c3fd4956eb0d
+       VREDUCEPD $13, Z25, K1, Z21                        // 6283fd4956e90d
+       VREDUCEPD $13, -17(BP), K1, Z21                    // 62e3fd4956adefffffff0d
+       VREDUCEPD $13, -15(R14)(R15*8), K1, Z21            // 6283fd4956acfef1ffffff0d
+       VREDUCEPD $13, Z11, K1, Z13                        // 6253fd4956eb0d
+       VREDUCEPD $13, Z25, K1, Z13                        // 6213fd4956e90d
+       VREDUCEPD $13, -17(BP), K1, Z13                    // 6273fd4956adefffffff0d
+       VREDUCEPD $13, -15(R14)(R15*8), K1, Z13            // 6213fd4956acfef1ffffff0d
+       VREDUCEPS $65, X21, K2, X15                        // 62337d0a56fd41
+       VREDUCEPS $65, X0, K2, X15                         // 62737d0a56f841
+       VREDUCEPS $65, X28, K2, X15                        // 62137d0a56fc41
+       VREDUCEPS $65, -17(BP)(SI*8), K2, X15              // 62737d0a56bcf5efffffff41
+       VREDUCEPS $65, (R15), K2, X15                      // 62537d0a563f41
+       VREDUCEPS $65, X21, K2, X0                         // 62b37d0a56c541
+       VREDUCEPS $65, X0, K2, X0                          // 62f37d0a56c041
+       VREDUCEPS $65, X28, K2, X0                         // 62937d0a56c441
+       VREDUCEPS $65, -17(BP)(SI*8), K2, X0               // 62f37d0a5684f5efffffff41
+       VREDUCEPS $65, (R15), K2, X0                       // 62d37d0a560741
+       VREDUCEPS $65, X21, K2, X16                        // 62a37d0a56c541
+       VREDUCEPS $65, X0, K2, X16                         // 62e37d0a56c041
+       VREDUCEPS $65, X28, K2, X16                        // 62837d0a56c441
+       VREDUCEPS $65, -17(BP)(SI*8), K2, X16              // 62e37d0a5684f5efffffff41
+       VREDUCEPS $65, (R15), K2, X16                      // 62c37d0a560741
+       VREDUCEPS $67, Y17, K1, Y12                        // 62337d2956e143
+       VREDUCEPS $67, Y7, K1, Y12                         // 62737d2956e743
+       VREDUCEPS $67, Y9, K1, Y12                         // 62537d2956e143
+       VREDUCEPS $67, 99(R15)(R15*4), K1, Y12             // 62137d2956a4bf6300000043
+       VREDUCEPS $67, 15(DX), K1, Y12                     // 62737d2956a20f00000043
+       VREDUCEPS $67, Y17, K1, Y1                         // 62b37d2956c943
+       VREDUCEPS $67, Y7, K1, Y1                          // 62f37d2956cf43
+       VREDUCEPS $67, Y9, K1, Y1                          // 62d37d2956c943
+       VREDUCEPS $67, 99(R15)(R15*4), K1, Y1              // 62937d29568cbf6300000043
+       VREDUCEPS $67, 15(DX), K1, Y1                      // 62f37d29568a0f00000043
+       VREDUCEPS $67, Y17, K1, Y14                        // 62337d2956f143
+       VREDUCEPS $67, Y7, K1, Y14                         // 62737d2956f743
+       VREDUCEPS $67, Y9, K1, Y14                         // 62537d2956f143
+       VREDUCEPS $67, 99(R15)(R15*4), K1, Y14             // 62137d2956b4bf6300000043
+       VREDUCEPS $67, 15(DX), K1, Y14                     // 62737d2956b20f00000043
+       VREDUCEPS $127, Z27, K7, Z3                        // 62937d4f56db7f
+       VREDUCEPS $127, Z15, K7, Z3                        // 62d37d4f56df7f
+       VREDUCEPS $127, Z27, K7, Z12                       // 62137d4f56e37f
+       VREDUCEPS $127, Z15, K7, Z12                       // 62537d4f56e77f
+       VREDUCEPS $0, Z23, K1, Z23                         // 62a37d4956ff00
+       VREDUCEPS $0, Z6, K1, Z23                          // 62e37d4956fe00
+       VREDUCEPS $0, 17(SP)(BP*2), K1, Z23                // 62e37d4956bc6c1100000000
+       VREDUCEPS $0, -7(DI)(R8*4), K1, Z23                // 62a37d4956bc87f9ffffff00
+       VREDUCEPS $0, Z23, K1, Z5                          // 62b37d4956ef00
+       VREDUCEPS $0, Z6, K1, Z5                           // 62f37d4956ee00
+       VREDUCEPS $0, 17(SP)(BP*2), K1, Z5                 // 62f37d4956ac6c1100000000
+       VREDUCEPS $0, -7(DI)(R8*4), K1, Z5                 // 62b37d4956ac87f9ffffff00
+       VREDUCESD $97, X1, X7, K1, X22                     // 62e3c50957f161
+       VREDUCESD $97, X7, X7, K1, X22                     // 62e3c50957f761
+       VREDUCESD $97, X9, X7, K1, X22                     // 62c3c50957f161
+       VREDUCESD $97, X1, X16, K1, X22                    // 62e3fd0157f161
+       VREDUCESD $97, X7, X16, K1, X22                    // 62e3fd0157f761
+       VREDUCESD $97, X9, X16, K1, X22                    // 62c3fd0157f161
+       VREDUCESD $97, X1, X31, K1, X22                    // 62e3850157f161
+       VREDUCESD $97, X7, X31, K1, X22                    // 62e3850157f761
+       VREDUCESD $97, X9, X31, K1, X22                    // 62c3850157f161
+       VREDUCESD $97, X1, X7, K1, X7                      // 62f3c50957f961
+       VREDUCESD $97, X7, X7, K1, X7                      // 62f3c50957ff61
+       VREDUCESD $97, X9, X7, K1, X7                      // 62d3c50957f961
+       VREDUCESD $97, X1, X16, K1, X7                     // 62f3fd0157f961
+       VREDUCESD $97, X7, X16, K1, X7                     // 62f3fd0157ff61
+       VREDUCESD $97, X9, X16, K1, X7                     // 62d3fd0157f961
+       VREDUCESD $97, X1, X31, K1, X7                     // 62f3850157f961
+       VREDUCESD $97, X7, X31, K1, X7                     // 62f3850157ff61
+       VREDUCESD $97, X9, X31, K1, X7                     // 62d3850157f961
+       VREDUCESD $97, X1, X7, K1, X19                     // 62e3c50957d961
+       VREDUCESD $97, X7, X7, K1, X19                     // 62e3c50957df61
+       VREDUCESD $97, X9, X7, K1, X19                     // 62c3c50957d961
+       VREDUCESD $97, X1, X16, K1, X19                    // 62e3fd0157d961
+       VREDUCESD $97, X7, X16, K1, X19                    // 62e3fd0157df61
+       VREDUCESD $97, X9, X16, K1, X19                    // 62c3fd0157d961
+       VREDUCESD $97, X1, X31, K1, X19                    // 62e3850157d961
+       VREDUCESD $97, X7, X31, K1, X19                    // 62e3850157df61
+       VREDUCESD $97, X9, X31, K1, X19                    // 62c3850157d961
+       VREDUCESD $81, X17, X12, K1, X15                   // 62339d0957f951 or 62339d2957f951 or 62339d4957f951
+       VREDUCESD $81, X15, X12, K1, X15                   // 62539d0957ff51 or 62539d2957ff51 or 62539d4957ff51
+       VREDUCESD $81, X8, X12, K1, X15                    // 62539d0957f851 or 62539d2957f851 or 62539d4957f851
+       VREDUCESD $81, 7(SI)(DI*4), X12, K1, X15           // 62739d0957bcbe0700000051 or 62739d2957bcbe0700000051 or 62739d4957bcbe0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X12, K1, X15          // 62339d0957bc47f9ffffff51 or 62339d2957bc47f9ffffff51 or 62339d4957bc47f9ffffff51
+       VREDUCESD $81, X17, X14, K1, X15                   // 62338d0957f951 or 62338d2957f951 or 62338d4957f951
+       VREDUCESD $81, X15, X14, K1, X15                   // 62538d0957ff51 or 62538d2957ff51 or 62538d4957ff51
+       VREDUCESD $81, X8, X14, K1, X15                    // 62538d0957f851 or 62538d2957f851 or 62538d4957f851
+       VREDUCESD $81, 7(SI)(DI*4), X14, K1, X15           // 62738d0957bcbe0700000051 or 62738d2957bcbe0700000051 or 62738d4957bcbe0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X14, K1, X15          // 62338d0957bc47f9ffffff51 or 62338d2957bc47f9ffffff51 or 62338d4957bc47f9ffffff51
+       VREDUCESD $81, X17, X5, K1, X15                    // 6233d50957f951 or 6233d52957f951 or 6233d54957f951
+       VREDUCESD $81, X15, X5, K1, X15                    // 6253d50957ff51 or 6253d52957ff51 or 6253d54957ff51
+       VREDUCESD $81, X8, X5, K1, X15                     // 6253d50957f851 or 6253d52957f851 or 6253d54957f851
+       VREDUCESD $81, 7(SI)(DI*4), X5, K1, X15            // 6273d50957bcbe0700000051 or 6273d52957bcbe0700000051 or 6273d54957bcbe0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X5, K1, X15           // 6233d50957bc47f9ffffff51 or 6233d52957bc47f9ffffff51 or 6233d54957bc47f9ffffff51
+       VREDUCESD $81, X17, X12, K1, X12                   // 62339d0957e151 or 62339d2957e151 or 62339d4957e151
+       VREDUCESD $81, X15, X12, K1, X12                   // 62539d0957e751 or 62539d2957e751 or 62539d4957e751
+       VREDUCESD $81, X8, X12, K1, X12                    // 62539d0957e051 or 62539d2957e051 or 62539d4957e051
+       VREDUCESD $81, 7(SI)(DI*4), X12, K1, X12           // 62739d0957a4be0700000051 or 62739d2957a4be0700000051 or 62739d4957a4be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X12, K1, X12          // 62339d0957a447f9ffffff51 or 62339d2957a447f9ffffff51 or 62339d4957a447f9ffffff51
+       VREDUCESD $81, X17, X14, K1, X12                   // 62338d0957e151 or 62338d2957e151 or 62338d4957e151
+       VREDUCESD $81, X15, X14, K1, X12                   // 62538d0957e751 or 62538d2957e751 or 62538d4957e751
+       VREDUCESD $81, X8, X14, K1, X12                    // 62538d0957e051 or 62538d2957e051 or 62538d4957e051
+       VREDUCESD $81, 7(SI)(DI*4), X14, K1, X12           // 62738d0957a4be0700000051 or 62738d2957a4be0700000051 or 62738d4957a4be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X14, K1, X12          // 62338d0957a447f9ffffff51 or 62338d2957a447f9ffffff51 or 62338d4957a447f9ffffff51
+       VREDUCESD $81, X17, X5, K1, X12                    // 6233d50957e151 or 6233d52957e151 or 6233d54957e151
+       VREDUCESD $81, X15, X5, K1, X12                    // 6253d50957e751 or 6253d52957e751 or 6253d54957e751
+       VREDUCESD $81, X8, X5, K1, X12                     // 6253d50957e051 or 6253d52957e051 or 6253d54957e051
+       VREDUCESD $81, 7(SI)(DI*4), X5, K1, X12            // 6273d50957a4be0700000051 or 6273d52957a4be0700000051 or 6273d54957a4be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X5, K1, X12           // 6233d50957a447f9ffffff51 or 6233d52957a447f9ffffff51 or 6233d54957a447f9ffffff51
+       VREDUCESD $81, X17, X12, K1, X0                    // 62b39d0957c151 or 62b39d2957c151 or 62b39d4957c151
+       VREDUCESD $81, X15, X12, K1, X0                    // 62d39d0957c751 or 62d39d2957c751 or 62d39d4957c751
+       VREDUCESD $81, X8, X12, K1, X0                     // 62d39d0957c051 or 62d39d2957c051 or 62d39d4957c051
+       VREDUCESD $81, 7(SI)(DI*4), X12, K1, X0            // 62f39d095784be0700000051 or 62f39d295784be0700000051 or 62f39d495784be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X12, K1, X0           // 62b39d09578447f9ffffff51 or 62b39d29578447f9ffffff51 or 62b39d49578447f9ffffff51
+       VREDUCESD $81, X17, X14, K1, X0                    // 62b38d0957c151 or 62b38d2957c151 or 62b38d4957c151
+       VREDUCESD $81, X15, X14, K1, X0                    // 62d38d0957c751 or 62d38d2957c751 or 62d38d4957c751
+       VREDUCESD $81, X8, X14, K1, X0                     // 62d38d0957c051 or 62d38d2957c051 or 62d38d4957c051
+       VREDUCESD $81, 7(SI)(DI*4), X14, K1, X0            // 62f38d095784be0700000051 or 62f38d295784be0700000051 or 62f38d495784be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X14, K1, X0           // 62b38d09578447f9ffffff51 or 62b38d29578447f9ffffff51 or 62b38d49578447f9ffffff51
+       VREDUCESD $81, X17, X5, K1, X0                     // 62b3d50957c151 or 62b3d52957c151 or 62b3d54957c151
+       VREDUCESD $81, X15, X5, K1, X0                     // 62d3d50957c751 or 62d3d52957c751 or 62d3d54957c751
+       VREDUCESD $81, X8, X5, K1, X0                      // 62d3d50957c051 or 62d3d52957c051 or 62d3d54957c051
+       VREDUCESD $81, 7(SI)(DI*4), X5, K1, X0             // 62f3d5095784be0700000051 or 62f3d5295784be0700000051 or 62f3d5495784be0700000051
+       VREDUCESD $81, -7(DI)(R8*2), X5, K1, X0            // 62b3d509578447f9ffffff51 or 62b3d529578447f9ffffff51 or 62b3d549578447f9ffffff51
+       VREDUCESS $42, X9, X13, K7, X3                     // 62d3150f57d92a
+       VREDUCESS $42, X15, X13, K7, X3                    // 62d3150f57df2a
+       VREDUCESS $42, X26, X13, K7, X3                    // 6293150f57da2a
+       VREDUCESS $42, X9, X28, K7, X3                     // 62d31d0757d92a
+       VREDUCESS $42, X15, X28, K7, X3                    // 62d31d0757df2a
+       VREDUCESS $42, X26, X28, K7, X3                    // 62931d0757da2a
+       VREDUCESS $42, X9, X24, K7, X3                     // 62d33d0757d92a
+       VREDUCESS $42, X15, X24, K7, X3                    // 62d33d0757df2a
+       VREDUCESS $42, X26, X24, K7, X3                    // 62933d0757da2a
+       VREDUCESS $42, X9, X13, K7, X26                    // 6243150f57d12a
+       VREDUCESS $42, X15, X13, K7, X26                   // 6243150f57d72a
+       VREDUCESS $42, X26, X13, K7, X26                   // 6203150f57d22a
+       VREDUCESS $42, X9, X28, K7, X26                    // 62431d0757d12a
+       VREDUCESS $42, X15, X28, K7, X26                   // 62431d0757d72a
+       VREDUCESS $42, X26, X28, K7, X26                   // 62031d0757d22a
+       VREDUCESS $42, X9, X24, K7, X26                    // 62433d0757d12a
+       VREDUCESS $42, X15, X24, K7, X26                   // 62433d0757d72a
+       VREDUCESS $42, X26, X24, K7, X26                   // 62033d0757d22a
+       VREDUCESS $42, X9, X13, K7, X23                    // 62c3150f57f92a
+       VREDUCESS $42, X15, X13, K7, X23                   // 62c3150f57ff2a
+       VREDUCESS $42, X26, X13, K7, X23                   // 6283150f57fa2a
+       VREDUCESS $42, X9, X28, K7, X23                    // 62c31d0757f92a
+       VREDUCESS $42, X15, X28, K7, X23                   // 62c31d0757ff2a
+       VREDUCESS $42, X26, X28, K7, X23                   // 62831d0757fa2a
+       VREDUCESS $42, X9, X24, K7, X23                    // 62c33d0757f92a
+       VREDUCESS $42, X15, X24, K7, X23                   // 62c33d0757ff2a
+       VREDUCESS $42, X26, X24, K7, X23                   // 62833d0757fa2a
+       VREDUCESS $79, X7, X11, K2, X18                    // 62e3250a57d74f or 62e3252a57d74f or 62e3254a57d74f
+       VREDUCESS $79, X0, X11, K2, X18                    // 62e3250a57d04f or 62e3252a57d04f or 62e3254a57d04f
+       VREDUCESS $79, 99(R15)(R15*8), X11, K2, X18        // 6283250a5794ff630000004f or 6283252a5794ff630000004f or 6283254a5794ff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X11, K2, X18           // 62e3250a5794c8070000004f or 62e3252a5794c8070000004f or 62e3254a5794c8070000004f
+       VREDUCESS $79, X7, X31, K2, X18                    // 62e3050257d74f or 62e3052257d74f or 62e3054257d74f
+       VREDUCESS $79, X0, X31, K2, X18                    // 62e3050257d04f or 62e3052257d04f or 62e3054257d04f
+       VREDUCESS $79, 99(R15)(R15*8), X31, K2, X18        // 628305025794ff630000004f or 628305225794ff630000004f or 628305425794ff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X31, K2, X18           // 62e305025794c8070000004f or 62e305225794c8070000004f or 62e305425794c8070000004f
+       VREDUCESS $79, X7, X3, K2, X18                     // 62e3650a57d74f or 62e3652a57d74f or 62e3654a57d74f
+       VREDUCESS $79, X0, X3, K2, X18                     // 62e3650a57d04f or 62e3652a57d04f or 62e3654a57d04f
+       VREDUCESS $79, 99(R15)(R15*8), X3, K2, X18         // 6283650a5794ff630000004f or 6283652a5794ff630000004f or 6283654a5794ff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X3, K2, X18            // 62e3650a5794c8070000004f or 62e3652a5794c8070000004f or 62e3654a5794c8070000004f
+       VREDUCESS $79, X7, X11, K2, X21                    // 62e3250a57ef4f or 62e3252a57ef4f or 62e3254a57ef4f
+       VREDUCESS $79, X0, X11, K2, X21                    // 62e3250a57e84f or 62e3252a57e84f or 62e3254a57e84f
+       VREDUCESS $79, 99(R15)(R15*8), X11, K2, X21        // 6283250a57acff630000004f or 6283252a57acff630000004f or 6283254a57acff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X11, K2, X21           // 62e3250a57acc8070000004f or 62e3252a57acc8070000004f or 62e3254a57acc8070000004f
+       VREDUCESS $79, X7, X31, K2, X21                    // 62e3050257ef4f or 62e3052257ef4f or 62e3054257ef4f
+       VREDUCESS $79, X0, X31, K2, X21                    // 62e3050257e84f or 62e3052257e84f or 62e3054257e84f
+       VREDUCESS $79, 99(R15)(R15*8), X31, K2, X21        // 6283050257acff630000004f or 6283052257acff630000004f or 6283054257acff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X31, K2, X21           // 62e3050257acc8070000004f or 62e3052257acc8070000004f or 62e3054257acc8070000004f
+       VREDUCESS $79, X7, X3, K2, X21                     // 62e3650a57ef4f or 62e3652a57ef4f or 62e3654a57ef4f
+       VREDUCESS $79, X0, X3, K2, X21                     // 62e3650a57e84f or 62e3652a57e84f or 62e3654a57e84f
+       VREDUCESS $79, 99(R15)(R15*8), X3, K2, X21         // 6283650a57acff630000004f or 6283652a57acff630000004f or 6283654a57acff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X3, K2, X21            // 62e3650a57acc8070000004f or 62e3652a57acc8070000004f or 62e3654a57acc8070000004f
+       VREDUCESS $79, X7, X11, K2, X1                     // 62f3250a57cf4f or 62f3252a57cf4f or 62f3254a57cf4f
+       VREDUCESS $79, X0, X11, K2, X1                     // 62f3250a57c84f or 62f3252a57c84f or 62f3254a57c84f
+       VREDUCESS $79, 99(R15)(R15*8), X11, K2, X1         // 6293250a578cff630000004f or 6293252a578cff630000004f or 6293254a578cff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X11, K2, X1            // 62f3250a578cc8070000004f or 62f3252a578cc8070000004f or 62f3254a578cc8070000004f
+       VREDUCESS $79, X7, X31, K2, X1                     // 62f3050257cf4f or 62f3052257cf4f or 62f3054257cf4f
+       VREDUCESS $79, X0, X31, K2, X1                     // 62f3050257c84f or 62f3052257c84f or 62f3054257c84f
+       VREDUCESS $79, 99(R15)(R15*8), X31, K2, X1         // 62930502578cff630000004f or 62930522578cff630000004f or 62930542578cff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X31, K2, X1            // 62f30502578cc8070000004f or 62f30522578cc8070000004f or 62f30542578cc8070000004f
+       VREDUCESS $79, X7, X3, K2, X1                      // 62f3650a57cf4f or 62f3652a57cf4f or 62f3654a57cf4f
+       VREDUCESS $79, X0, X3, K2, X1                      // 62f3650a57c84f or 62f3652a57c84f or 62f3654a57c84f
+       VREDUCESS $79, 99(R15)(R15*8), X3, K2, X1          // 6293650a578cff630000004f or 6293652a578cff630000004f or 6293654a578cff630000004f
+       VREDUCESS $79, 7(AX)(CX*8), X3, K2, X1             // 62f3650a578cc8070000004f or 62f3652a578cc8070000004f or 62f3654a578cc8070000004f
+       VXORPD X13, X3, K5, X17                            // 62c1e50d57cd
+       VXORPD X28, X3, K5, X17                            // 6281e50d57cc
+       VXORPD X24, X3, K5, X17                            // 6281e50d57c8
+       VXORPD -7(CX)(DX*1), X3, K5, X17                   // 62e1e50d578c11f9ffffff
+       VXORPD -15(R14)(R15*4), X3, K5, X17                // 6281e50d578cbef1ffffff
+       VXORPD X13, X26, K5, X17                           // 62c1ad0557cd
+       VXORPD X28, X26, K5, X17                           // 6281ad0557cc
+       VXORPD X24, X26, K5, X17                           // 6281ad0557c8
+       VXORPD -7(CX)(DX*1), X26, K5, X17                  // 62e1ad05578c11f9ffffff
+       VXORPD -15(R14)(R15*4), X26, K5, X17               // 6281ad05578cbef1ffffff
+       VXORPD X13, X23, K5, X17                           // 62c1c50557cd
+       VXORPD X28, X23, K5, X17                           // 6281c50557cc
+       VXORPD X24, X23, K5, X17                           // 6281c50557c8
+       VXORPD -7(CX)(DX*1), X23, K5, X17                  // 62e1c505578c11f9ffffff
+       VXORPD -15(R14)(R15*4), X23, K5, X17               // 6281c505578cbef1ffffff
+       VXORPD X13, X3, K5, X15                            // 6251e50d57fd
+       VXORPD X28, X3, K5, X15                            // 6211e50d57fc
+       VXORPD X24, X3, K5, X15                            // 6211e50d57f8
+       VXORPD -7(CX)(DX*1), X3, K5, X15                   // 6271e50d57bc11f9ffffff
+       VXORPD -15(R14)(R15*4), X3, K5, X15                // 6211e50d57bcbef1ffffff
+       VXORPD X13, X26, K5, X15                           // 6251ad0557fd
+       VXORPD X28, X26, K5, X15                           // 6211ad0557fc
+       VXORPD X24, X26, K5, X15                           // 6211ad0557f8
+       VXORPD -7(CX)(DX*1), X26, K5, X15                  // 6271ad0557bc11f9ffffff
+       VXORPD -15(R14)(R15*4), X26, K5, X15               // 6211ad0557bcbef1ffffff
+       VXORPD X13, X23, K5, X15                           // 6251c50557fd
+       VXORPD X28, X23, K5, X15                           // 6211c50557fc
+       VXORPD X24, X23, K5, X15                           // 6211c50557f8
+       VXORPD -7(CX)(DX*1), X23, K5, X15                  // 6271c50557bc11f9ffffff
+       VXORPD -15(R14)(R15*4), X23, K5, X15               // 6211c50557bcbef1ffffff
+       VXORPD X13, X3, K5, X8                             // 6251e50d57c5
+       VXORPD X28, X3, K5, X8                             // 6211e50d57c4
+       VXORPD X24, X3, K5, X8                             // 6211e50d57c0
+       VXORPD -7(CX)(DX*1), X3, K5, X8                    // 6271e50d578411f9ffffff
+       VXORPD -15(R14)(R15*4), X3, K5, X8                 // 6211e50d5784bef1ffffff
+       VXORPD X13, X26, K5, X8                            // 6251ad0557c5
+       VXORPD X28, X26, K5, X8                            // 6211ad0557c4
+       VXORPD X24, X26, K5, X8                            // 6211ad0557c0
+       VXORPD -7(CX)(DX*1), X26, K5, X8                   // 6271ad05578411f9ffffff
+       VXORPD -15(R14)(R15*4), X26, K5, X8                // 6211ad055784bef1ffffff
+       VXORPD X13, X23, K5, X8                            // 6251c50557c5
+       VXORPD X28, X23, K5, X8                            // 6211c50557c4
+       VXORPD X24, X23, K5, X8                            // 6211c50557c0
+       VXORPD -7(CX)(DX*1), X23, K5, X8                   // 6271c505578411f9ffffff
+       VXORPD -15(R14)(R15*4), X23, K5, X8                // 6211c5055784bef1ffffff
+       VXORPD Y5, Y20, K3, Y0                             // 62f1dd2357c5
+       VXORPD Y28, Y20, K3, Y0                            // 6291dd2357c4
+       VXORPD Y7, Y20, K3, Y0                             // 62f1dd2357c7
+       VXORPD -7(CX), Y20, K3, Y0                         // 62f1dd235781f9ffffff
+       VXORPD 15(DX)(BX*4), Y20, K3, Y0                   // 62f1dd2357849a0f000000
+       VXORPD Y5, Y12, K3, Y0                             // 62f19d2b57c5
+       VXORPD Y28, Y12, K3, Y0                            // 62919d2b57c4
+       VXORPD Y7, Y12, K3, Y0                             // 62f19d2b57c7
+       VXORPD -7(CX), Y12, K3, Y0                         // 62f19d2b5781f9ffffff
+       VXORPD 15(DX)(BX*4), Y12, K3, Y0                   // 62f19d2b57849a0f000000
+       VXORPD Y5, Y3, K3, Y0                              // 62f1e52b57c5
+       VXORPD Y28, Y3, K3, Y0                             // 6291e52b57c4
+       VXORPD Y7, Y3, K3, Y0                              // 62f1e52b57c7
+       VXORPD -7(CX), Y3, K3, Y0                          // 62f1e52b5781f9ffffff
+       VXORPD 15(DX)(BX*4), Y3, K3, Y0                    // 62f1e52b57849a0f000000
+       VXORPD Y5, Y20, K3, Y3                             // 62f1dd2357dd
+       VXORPD Y28, Y20, K3, Y3                            // 6291dd2357dc
+       VXORPD Y7, Y20, K3, Y3                             // 62f1dd2357df
+       VXORPD -7(CX), Y20, K3, Y3                         // 62f1dd235799f9ffffff
+       VXORPD 15(DX)(BX*4), Y20, K3, Y3                   // 62f1dd23579c9a0f000000
+       VXORPD Y5, Y12, K3, Y3                             // 62f19d2b57dd
+       VXORPD Y28, Y12, K3, Y3                            // 62919d2b57dc
+       VXORPD Y7, Y12, K3, Y3                             // 62f19d2b57df
+       VXORPD -7(CX), Y12, K3, Y3                         // 62f19d2b5799f9ffffff
+       VXORPD 15(DX)(BX*4), Y12, K3, Y3                   // 62f19d2b579c9a0f000000
+       VXORPD Y5, Y3, K3, Y3                              // 62f1e52b57dd
+       VXORPD Y28, Y3, K3, Y3                             // 6291e52b57dc
+       VXORPD Y7, Y3, K3, Y3                              // 62f1e52b57df
+       VXORPD -7(CX), Y3, K3, Y3                          // 62f1e52b5799f9ffffff
+       VXORPD 15(DX)(BX*4), Y3, K3, Y3                    // 62f1e52b579c9a0f000000
+       VXORPD Y5, Y20, K3, Y5                             // 62f1dd2357ed
+       VXORPD Y28, Y20, K3, Y5                            // 6291dd2357ec
+       VXORPD Y7, Y20, K3, Y5                             // 62f1dd2357ef
+       VXORPD -7(CX), Y20, K3, Y5                         // 62f1dd2357a9f9ffffff
+       VXORPD 15(DX)(BX*4), Y20, K3, Y5                   // 62f1dd2357ac9a0f000000
+       VXORPD Y5, Y12, K3, Y5                             // 62f19d2b57ed
+       VXORPD Y28, Y12, K3, Y5                            // 62919d2b57ec
+       VXORPD Y7, Y12, K3, Y5                             // 62f19d2b57ef
+       VXORPD -7(CX), Y12, K3, Y5                         // 62f19d2b57a9f9ffffff
+       VXORPD 15(DX)(BX*4), Y12, K3, Y5                   // 62f19d2b57ac9a0f000000
+       VXORPD Y5, Y3, K3, Y5                              // 62f1e52b57ed
+       VXORPD Y28, Y3, K3, Y5                             // 6291e52b57ec
+       VXORPD Y7, Y3, K3, Y5                              // 62f1e52b57ef
+       VXORPD -7(CX), Y3, K3, Y5                          // 62f1e52b57a9f9ffffff
+       VXORPD 15(DX)(BX*4), Y3, K3, Y5                    // 62f1e52b57ac9a0f000000
+       VXORPD Z13, Z28, K4, Z26                           // 62419d4457d5
+       VXORPD Z21, Z28, K4, Z26                           // 62219d4457d5
+       VXORPD 15(R8)(R14*1), Z28, K4, Z26                 // 62019d445794300f000000
+       VXORPD 15(R8)(R14*2), Z28, K4, Z26                 // 62019d445794700f000000
+       VXORPD Z13, Z6, K4, Z26                            // 6241cd4c57d5
+       VXORPD Z21, Z6, K4, Z26                            // 6221cd4c57d5
+       VXORPD 15(R8)(R14*1), Z6, K4, Z26                  // 6201cd4c5794300f000000
+       VXORPD 15(R8)(R14*2), Z6, K4, Z26                  // 6201cd4c5794700f000000
+       VXORPD Z13, Z28, K4, Z14                           // 62519d4457f5
+       VXORPD Z21, Z28, K4, Z14                           // 62319d4457f5
+       VXORPD 15(R8)(R14*1), Z28, K4, Z14                 // 62119d4457b4300f000000
+       VXORPD 15(R8)(R14*2), Z28, K4, Z14                 // 62119d4457b4700f000000
+       VXORPD Z13, Z6, K4, Z14                            // 6251cd4c57f5
+       VXORPD Z21, Z6, K4, Z14                            // 6231cd4c57f5
+       VXORPD 15(R8)(R14*1), Z6, K4, Z14                  // 6211cd4c57b4300f000000
+       VXORPD 15(R8)(R14*2), Z6, K4, Z14                  // 6211cd4c57b4700f000000
+       VXORPS X11, X18, K2, X9                            // 62516c0257cb
+       VXORPS X31, X18, K2, X9                            // 62116c0257cf
+       VXORPS X3, X18, K2, X9                             // 62716c0257cb
+       VXORPS 15(DX)(BX*1), X18, K2, X9                   // 62716c02578c1a0f000000
+       VXORPS -7(CX)(DX*2), X18, K2, X9                   // 62716c02578c51f9ffffff
+       VXORPS X11, X21, K2, X9                            // 6251540257cb
+       VXORPS X31, X21, K2, X9                            // 6211540257cf
+       VXORPS X3, X21, K2, X9                             // 6271540257cb
+       VXORPS 15(DX)(BX*1), X21, K2, X9                   // 62715402578c1a0f000000
+       VXORPS -7(CX)(DX*2), X21, K2, X9                   // 62715402578c51f9ffffff
+       VXORPS X11, X1, K2, X9                             // 6251740a57cb
+       VXORPS X31, X1, K2, X9                             // 6211740a57cf
+       VXORPS X3, X1, K2, X9                              // 6271740a57cb
+       VXORPS 15(DX)(BX*1), X1, K2, X9                    // 6271740a578c1a0f000000
+       VXORPS -7(CX)(DX*2), X1, K2, X9                    // 6271740a578c51f9ffffff
+       VXORPS X11, X18, K2, X15                           // 62516c0257fb
+       VXORPS X31, X18, K2, X15                           // 62116c0257ff
+       VXORPS X3, X18, K2, X15                            // 62716c0257fb
+       VXORPS 15(DX)(BX*1), X18, K2, X15                  // 62716c0257bc1a0f000000
+       VXORPS -7(CX)(DX*2), X18, K2, X15                  // 62716c0257bc51f9ffffff
+       VXORPS X11, X21, K2, X15                           // 6251540257fb
+       VXORPS X31, X21, K2, X15                           // 6211540257ff
+       VXORPS X3, X21, K2, X15                            // 6271540257fb
+       VXORPS 15(DX)(BX*1), X21, K2, X15                  // 6271540257bc1a0f000000
+       VXORPS -7(CX)(DX*2), X21, K2, X15                  // 6271540257bc51f9ffffff
+       VXORPS X11, X1, K2, X15                            // 6251740a57fb
+       VXORPS X31, X1, K2, X15                            // 6211740a57ff
+       VXORPS X3, X1, K2, X15                             // 6271740a57fb
+       VXORPS 15(DX)(BX*1), X1, K2, X15                   // 6271740a57bc1a0f000000
+       VXORPS -7(CX)(DX*2), X1, K2, X15                   // 6271740a57bc51f9ffffff
+       VXORPS X11, X18, K2, X26                           // 62416c0257d3
+       VXORPS X31, X18, K2, X26                           // 62016c0257d7
+       VXORPS X3, X18, K2, X26                            // 62616c0257d3
+       VXORPS 15(DX)(BX*1), X18, K2, X26                  // 62616c0257941a0f000000
+       VXORPS -7(CX)(DX*2), X18, K2, X26                  // 62616c02579451f9ffffff
+       VXORPS X11, X21, K2, X26                           // 6241540257d3
+       VXORPS X31, X21, K2, X26                           // 6201540257d7
+       VXORPS X3, X21, K2, X26                            // 6261540257d3
+       VXORPS 15(DX)(BX*1), X21, K2, X26                  // 6261540257941a0f000000
+       VXORPS -7(CX)(DX*2), X21, K2, X26                  // 62615402579451f9ffffff
+       VXORPS X11, X1, K2, X26                            // 6241740a57d3
+       VXORPS X31, X1, K2, X26                            // 6201740a57d7
+       VXORPS X3, X1, K2, X26                             // 6261740a57d3
+       VXORPS 15(DX)(BX*1), X1, K2, X26                   // 6261740a57941a0f000000
+       VXORPS -7(CX)(DX*2), X1, K2, X26                   // 6261740a579451f9ffffff
+       VXORPS Y17, Y12, K2, Y0                            // 62b11c2a57c1
+       VXORPS Y7, Y12, K2, Y0                             // 62f11c2a57c7
+       VXORPS Y9, Y12, K2, Y0                             // 62d11c2a57c1
+       VXORPS 99(R15)(R15*8), Y12, K2, Y0                 // 62911c2a5784ff63000000
+       VXORPS 7(AX)(CX*8), Y12, K2, Y0                    // 62f11c2a5784c807000000
+       VXORPS Y17, Y1, K2, Y0                             // 62b1742a57c1
+       VXORPS Y7, Y1, K2, Y0                              // 62f1742a57c7
+       VXORPS Y9, Y1, K2, Y0                              // 62d1742a57c1
+       VXORPS 99(R15)(R15*8), Y1, K2, Y0                  // 6291742a5784ff63000000
+       VXORPS 7(AX)(CX*8), Y1, K2, Y0                     // 62f1742a5784c807000000
+       VXORPS Y17, Y14, K2, Y0                            // 62b10c2a57c1
+       VXORPS Y7, Y14, K2, Y0                             // 62f10c2a57c7
+       VXORPS Y9, Y14, K2, Y0                             // 62d10c2a57c1
+       VXORPS 99(R15)(R15*8), Y14, K2, Y0                 // 62910c2a5784ff63000000
+       VXORPS 7(AX)(CX*8), Y14, K2, Y0                    // 62f10c2a5784c807000000
+       VXORPS Y17, Y12, K2, Y22                           // 62a11c2a57f1
+       VXORPS Y7, Y12, K2, Y22                            // 62e11c2a57f7
+       VXORPS Y9, Y12, K2, Y22                            // 62c11c2a57f1
+       VXORPS 99(R15)(R15*8), Y12, K2, Y22                // 62811c2a57b4ff63000000
+       VXORPS 7(AX)(CX*8), Y12, K2, Y22                   // 62e11c2a57b4c807000000
+       VXORPS Y17, Y1, K2, Y22                            // 62a1742a57f1
+       VXORPS Y7, Y1, K2, Y22                             // 62e1742a57f7
+       VXORPS Y9, Y1, K2, Y22                             // 62c1742a57f1
+       VXORPS 99(R15)(R15*8), Y1, K2, Y22                 // 6281742a57b4ff63000000
+       VXORPS 7(AX)(CX*8), Y1, K2, Y22                    // 62e1742a57b4c807000000
+       VXORPS Y17, Y14, K2, Y22                           // 62a10c2a57f1
+       VXORPS Y7, Y14, K2, Y22                            // 62e10c2a57f7
+       VXORPS Y9, Y14, K2, Y22                            // 62c10c2a57f1
+       VXORPS 99(R15)(R15*8), Y14, K2, Y22                // 62810c2a57b4ff63000000
+       VXORPS 7(AX)(CX*8), Y14, K2, Y22                   // 62e10c2a57b4c807000000
+       VXORPS Y17, Y12, K2, Y13                           // 62311c2a57e9
+       VXORPS Y7, Y12, K2, Y13                            // 62711c2a57ef
+       VXORPS Y9, Y12, K2, Y13                            // 62511c2a57e9
+       VXORPS 99(R15)(R15*8), Y12, K2, Y13                // 62111c2a57acff63000000
+       VXORPS 7(AX)(CX*8), Y12, K2, Y13                   // 62711c2a57acc807000000
+       VXORPS Y17, Y1, K2, Y13                            // 6231742a57e9
+       VXORPS Y7, Y1, K2, Y13                             // 6271742a57ef
+       VXORPS Y9, Y1, K2, Y13                             // 6251742a57e9
+       VXORPS 99(R15)(R15*8), Y1, K2, Y13                 // 6211742a57acff63000000
+       VXORPS 7(AX)(CX*8), Y1, K2, Y13                    // 6271742a57acc807000000
+       VXORPS Y17, Y14, K2, Y13                           // 62310c2a57e9
+       VXORPS Y7, Y14, K2, Y13                            // 62710c2a57ef
+       VXORPS Y9, Y14, K2, Y13                            // 62510c2a57e9
+       VXORPS 99(R15)(R15*8), Y14, K2, Y13                // 62110c2a57acff63000000
+       VXORPS 7(AX)(CX*8), Y14, K2, Y13                   // 62710c2a57acc807000000
+       VXORPS Z21, Z3, K3, Z26                            // 6221644b57d5
+       VXORPS Z13, Z3, K3, Z26                            // 6241644b57d5
+       VXORPS (R14), Z3, K3, Z26                          // 6241644b5716
+       VXORPS -7(DI)(R8*8), Z3, K3, Z26                   // 6221644b5794c7f9ffffff
+       VXORPS Z21, Z0, K3, Z26                            // 62217c4b57d5
+       VXORPS Z13, Z0, K3, Z26                            // 62417c4b57d5
+       VXORPS (R14), Z0, K3, Z26                          // 62417c4b5716
+       VXORPS -7(DI)(R8*8), Z0, K3, Z26                   // 62217c4b5794c7f9ffffff
+       VXORPS Z21, Z3, K3, Z3                             // 62b1644b57dd
+       VXORPS Z13, Z3, K3, Z3                             // 62d1644b57dd
+       VXORPS (R14), Z3, K3, Z3                           // 62d1644b571e
+       VXORPS -7(DI)(R8*8), Z3, K3, Z3                    // 62b1644b579cc7f9ffffff
+       VXORPS Z21, Z0, K3, Z3                             // 62b17c4b57dd
+       VXORPS Z13, Z0, K3, Z3                             // 62d17c4b57dd
+       VXORPS (R14), Z0, K3, Z3                           // 62d17c4b571e
+       VXORPS -7(DI)(R8*8), Z0, K3, Z3                    // 62b17c4b579cc7f9ffffff
        RET
index ddeba39217a7b154b043e4f9f42f502eda1561d9..855a8d9ea383f8f3a5d92b198dfbdb3a5b28f403 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512er(SB), NOSPLIT, $0
-       //TODO: VEXP2PD Z17, K7, Z20                               // 62a2fd4fc8e1
-       //TODO: VEXP2PD Z0, K7, Z20                                // 62e2fd4fc8e0
-       //TODO: VEXP2PD Z17, K7, Z0                                // 62b2fd4fc8c1
-       //TODO: VEXP2PD Z0, K7, Z0                                 // 62f2fd4fc8c0
-       //TODO: VEXP2PD Z31, K2, Z17                               // 6282fd4ac8cf
-       //TODO: VEXP2PD Z0, K2, Z17                                // 62e2fd4ac8c8
-       //TODO: VEXP2PD (R14), K2, Z17                             // 62c2fd4ac80e
-       //TODO: VEXP2PD -7(DI)(R8*8), K2, Z17                      // 62a2fd4ac88cc7f9ffffff
-       //TODO: VEXP2PD Z31, K2, Z23                               // 6282fd4ac8ff
-       //TODO: VEXP2PD Z0, K2, Z23                                // 62e2fd4ac8f8
-       //TODO: VEXP2PD (R14), K2, Z23                             // 62c2fd4ac83e
-       //TODO: VEXP2PD -7(DI)(R8*8), K2, Z23                      // 62a2fd4ac8bcc7f9ffffff
-       //TODO: VEXP2PS Z6, K4, Z21                                // 62e27d4cc8ee
-       //TODO: VEXP2PS Z9, K4, Z21                                // 62c27d4cc8e9
-       //TODO: VEXP2PS Z6, K4, Z9                                 // 62727d4cc8ce
-       //TODO: VEXP2PS Z9, K4, Z9                                 // 62527d4cc8c9
-       //TODO: VEXP2PS Z20, K1, Z1                                // 62b27d49c8cc
-       //TODO: VEXP2PS Z9, K1, Z1                                 // 62d27d49c8c9
-       //TODO: VEXP2PS 99(R15)(R15*4), K1, Z1                     // 62927d49c88cbf63000000
-       //TODO: VEXP2PS 15(DX), K1, Z1                             // 62f27d49c88a0f000000
-       //TODO: VEXP2PS Z20, K1, Z9                                // 62327d49c8cc
-       //TODO: VEXP2PS Z9, K1, Z9                                 // 62527d49c8c9
-       //TODO: VEXP2PS 99(R15)(R15*4), K1, Z9                     // 62127d49c88cbf63000000
-       //TODO: VEXP2PS 15(DX), K1, Z9                             // 62727d49c88a0f000000
-       //TODO: VRCP28PD Z13, K7, Z11                              // 6252fd4fcadd
-       //TODO: VRCP28PD Z14, K7, Z11                              // 6252fd4fcade
-       //TODO: VRCP28PD Z13, K7, Z5                               // 62d2fd4fcaed
-       //TODO: VRCP28PD Z14, K7, Z5                               // 62d2fd4fcaee
-       //TODO: VRCP28PD Z2, K2, Z5                                // 62f2fd4acaea
-       //TODO: VRCP28PD -7(CX)(DX*1), K2, Z5                      // 62f2fd4acaac11f9ffffff
-       //TODO: VRCP28PD -15(R14)(R15*4), K2, Z5                   // 6292fd4acaacbef1ffffff
-       //TODO: VRCP28PD Z2, K2, Z23                               // 62e2fd4acafa
-       //TODO: VRCP28PD -7(CX)(DX*1), K2, Z23                     // 62e2fd4acabc11f9ffffff
-       //TODO: VRCP28PD -15(R14)(R15*4), K2, Z23                  // 6282fd4acabcbef1ffffff
-       //TODO: VRCP28PS Z26, K5, Z6                               // 62927d4dcaf2
-       //TODO: VRCP28PS Z14, K5, Z6                               // 62d27d4dcaf6
-       //TODO: VRCP28PS Z26, K5, Z14                              // 62127d4dcaf2
-       //TODO: VRCP28PS Z14, K5, Z14                              // 62527d4dcaf6
-       //TODO: VRCP28PS Z13, K3, Z28                              // 62427d4bcae5
-       //TODO: VRCP28PS Z21, K3, Z28                              // 62227d4bcae5
-       //TODO: VRCP28PS 15(DX)(BX*1), K3, Z28                     // 62627d4bcaa41a0f000000
-       //TODO: VRCP28PS -7(CX)(DX*2), K3, Z28                     // 62627d4bcaa451f9ffffff
-       //TODO: VRCP28PS Z13, K3, Z6                               // 62d27d4bcaf5
-       //TODO: VRCP28PS Z21, K3, Z6                               // 62b27d4bcaf5
-       //TODO: VRCP28PS 15(DX)(BX*1), K3, Z6                      // 62f27d4bcab41a0f000000
-       //TODO: VRCP28PS -7(CX)(DX*2), K3, Z6                      // 62f27d4bcab451f9ffffff
-       //TODO: VRCP28SD X25, X14, K4, X19                         // 62828d0ccbd9
-       //TODO: VRCP28SD X11, X14, K4, X19                         // 62c28d0ccbdb
-       //TODO: VRCP28SD X17, X14, K4, X19                         // 62a28d0ccbd9
-       //TODO: VRCP28SD X25, X0, K4, X19                          // 6282fd0ccbd9
-       //TODO: VRCP28SD X11, X0, K4, X19                          // 62c2fd0ccbdb
-       //TODO: VRCP28SD X17, X0, K4, X19                          // 62a2fd0ccbd9
-       //TODO: VRCP28SD X25, X14, K4, X13                         // 62128d0ccbe9
-       //TODO: VRCP28SD X11, X14, K4, X13                         // 62528d0ccbeb
-       //TODO: VRCP28SD X17, X14, K4, X13                         // 62328d0ccbe9
-       //TODO: VRCP28SD X25, X0, K4, X13                          // 6212fd0ccbe9
-       //TODO: VRCP28SD X11, X0, K4, X13                          // 6252fd0ccbeb
-       //TODO: VRCP28SD X17, X0, K4, X13                          // 6232fd0ccbe9
-       //TODO: VRCP28SD X25, X14, K4, X2                          // 62928d0ccbd1
-       //TODO: VRCP28SD X11, X14, K4, X2                          // 62d28d0ccbd3
-       //TODO: VRCP28SD X17, X14, K4, X2                          // 62b28d0ccbd1
-       //TODO: VRCP28SD X25, X0, K4, X2                           // 6292fd0ccbd1
-       //TODO: VRCP28SD X11, X0, K4, X2                           // 62d2fd0ccbd3
-       //TODO: VRCP28SD X17, X0, K4, X2                           // 62b2fd0ccbd1
-       //TODO: VRCP28SD X2, X2, K2, X18                           // 62e2ed0acbd2 or 62e2ed2acbd2 or 62e2ed4acbd2
-       //TODO: VRCP28SD X27, X2, K2, X18                          // 6282ed0acbd3 or 6282ed2acbd3 or 6282ed4acbd3
-       //TODO: VRCP28SD X26, X2, K2, X18                          // 6282ed0acbd2 or 6282ed2acbd2 or 6282ed4acbd2
-       //TODO: VRCP28SD 17(SP)(BP*8), X2, K2, X18                 // 62e2ed0acb94ec11000000 or 62e2ed2acb94ec11000000 or 62e2ed4acb94ec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X2, K2, X18                 // 62e2ed0acb94ac11000000 or 62e2ed2acb94ac11000000 or 62e2ed4acb94ac11000000
-       //TODO: VRCP28SD X2, X24, K2, X18                          // 62e2bd02cbd2 or 62e2bd22cbd2 or 62e2bd42cbd2
-       //TODO: VRCP28SD X27, X24, K2, X18                         // 6282bd02cbd3 or 6282bd22cbd3 or 6282bd42cbd3
-       //TODO: VRCP28SD X26, X24, K2, X18                         // 6282bd02cbd2 or 6282bd22cbd2 or 6282bd42cbd2
-       //TODO: VRCP28SD 17(SP)(BP*8), X24, K2, X18                // 62e2bd02cb94ec11000000 or 62e2bd22cb94ec11000000 or 62e2bd42cb94ec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X24, K2, X18                // 62e2bd02cb94ac11000000 or 62e2bd22cb94ac11000000 or 62e2bd42cb94ac11000000
-       //TODO: VRCP28SD X2, X2, K2, X11                           // 6272ed0acbda or 6272ed2acbda or 6272ed4acbda
-       //TODO: VRCP28SD X27, X2, K2, X11                          // 6212ed0acbdb or 6212ed2acbdb or 6212ed4acbdb
-       //TODO: VRCP28SD X26, X2, K2, X11                          // 6212ed0acbda or 6212ed2acbda or 6212ed4acbda
-       //TODO: VRCP28SD 17(SP)(BP*8), X2, K2, X11                 // 6272ed0acb9cec11000000 or 6272ed2acb9cec11000000 or 6272ed4acb9cec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X2, K2, X11                 // 6272ed0acb9cac11000000 or 6272ed2acb9cac11000000 or 6272ed4acb9cac11000000
-       //TODO: VRCP28SD X2, X24, K2, X11                          // 6272bd02cbda or 6272bd22cbda or 6272bd42cbda
-       //TODO: VRCP28SD X27, X24, K2, X11                         // 6212bd02cbdb or 6212bd22cbdb or 6212bd42cbdb
-       //TODO: VRCP28SD X26, X24, K2, X11                         // 6212bd02cbda or 6212bd22cbda or 6212bd42cbda
-       //TODO: VRCP28SD 17(SP)(BP*8), X24, K2, X11                // 6272bd02cb9cec11000000 or 6272bd22cb9cec11000000 or 6272bd42cb9cec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X24, K2, X11                // 6272bd02cb9cac11000000 or 6272bd22cb9cac11000000 or 6272bd42cb9cac11000000
-       //TODO: VRCP28SD X2, X2, K2, X9                            // 6272ed0acbca or 6272ed2acbca or 6272ed4acbca
-       //TODO: VRCP28SD X27, X2, K2, X9                           // 6212ed0acbcb or 6212ed2acbcb or 6212ed4acbcb
-       //TODO: VRCP28SD X26, X2, K2, X9                           // 6212ed0acbca or 6212ed2acbca or 6212ed4acbca
-       //TODO: VRCP28SD 17(SP)(BP*8), X2, K2, X9                  // 6272ed0acb8cec11000000 or 6272ed2acb8cec11000000 or 6272ed4acb8cec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X2, K2, X9                  // 6272ed0acb8cac11000000 or 6272ed2acb8cac11000000 or 6272ed4acb8cac11000000
-       //TODO: VRCP28SD X2, X24, K2, X9                           // 6272bd02cbca or 6272bd22cbca or 6272bd42cbca
-       //TODO: VRCP28SD X27, X24, K2, X9                          // 6212bd02cbcb or 6212bd22cbcb or 6212bd42cbcb
-       //TODO: VRCP28SD X26, X24, K2, X9                          // 6212bd02cbca or 6212bd22cbca or 6212bd42cbca
-       //TODO: VRCP28SD 17(SP)(BP*8), X24, K2, X9                 // 6272bd02cb8cec11000000 or 6272bd22cb8cec11000000 or 6272bd42cb8cec11000000
-       //TODO: VRCP28SD 17(SP)(BP*4), X24, K2, X9                 // 6272bd02cb8cac11000000 or 6272bd22cb8cac11000000 or 6272bd42cb8cac11000000
-       //TODO: VRCP28SS X13, X11, K2, X22                         // 62c2250acbf5
-       //TODO: VRCP28SS X6, X11, K2, X22                          // 62e2250acbf6
-       //TODO: VRCP28SS X12, X11, K2, X22                         // 62c2250acbf4
-       //TODO: VRCP28SS X13, X15, K2, X22                         // 62c2050acbf5
-       //TODO: VRCP28SS X6, X15, K2, X22                          // 62e2050acbf6
-       //TODO: VRCP28SS X12, X15, K2, X22                         // 62c2050acbf4
-       //TODO: VRCP28SS X13, X30, K2, X22                         // 62c20d02cbf5
-       //TODO: VRCP28SS X6, X30, K2, X22                          // 62e20d02cbf6
-       //TODO: VRCP28SS X12, X30, K2, X22                         // 62c20d02cbf4
-       //TODO: VRCP28SS X13, X11, K2, X30                         // 6242250acbf5
-       //TODO: VRCP28SS X6, X11, K2, X30                          // 6262250acbf6
-       //TODO: VRCP28SS X12, X11, K2, X30                         // 6242250acbf4
-       //TODO: VRCP28SS X13, X15, K2, X30                         // 6242050acbf5
-       //TODO: VRCP28SS X6, X15, K2, X30                          // 6262050acbf6
-       //TODO: VRCP28SS X12, X15, K2, X30                         // 6242050acbf4
-       //TODO: VRCP28SS X13, X30, K2, X30                         // 62420d02cbf5
-       //TODO: VRCP28SS X6, X30, K2, X30                          // 62620d02cbf6
-       //TODO: VRCP28SS X12, X30, K2, X30                         // 62420d02cbf4
-       //TODO: VRCP28SS X13, X11, K2, X3                          // 62d2250acbdd
-       //TODO: VRCP28SS X6, X11, K2, X3                           // 62f2250acbde
-       //TODO: VRCP28SS X12, X11, K2, X3                          // 62d2250acbdc
-       //TODO: VRCP28SS X13, X15, K2, X3                          // 62d2050acbdd
-       //TODO: VRCP28SS X6, X15, K2, X3                           // 62f2050acbde
-       //TODO: VRCP28SS X12, X15, K2, X3                          // 62d2050acbdc
-       //TODO: VRCP28SS X13, X30, K2, X3                          // 62d20d02cbdd
-       //TODO: VRCP28SS X6, X30, K2, X3                           // 62f20d02cbde
-       //TODO: VRCP28SS X12, X30, K2, X3                          // 62d20d02cbdc
-       //TODO: VRCP28SS X26, X20, K3, X23                         // 62825d03cbfa or 62825d23cbfa or 62825d43cbfa
-       //TODO: VRCP28SS X19, X20, K3, X23                         // 62a25d03cbfb or 62a25d23cbfb or 62a25d43cbfb
-       //TODO: VRCP28SS X0, X20, K3, X23                          // 62e25d03cbf8 or 62e25d23cbf8 or 62e25d43cbf8
-       //TODO: VRCP28SS -7(CX), X20, K3, X23                      // 62e25d03cbb9f9ffffff or 62e25d23cbb9f9ffffff or 62e25d43cbb9f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X20, K3, X23                // 62e25d03cbbc9a0f000000 or 62e25d23cbbc9a0f000000 or 62e25d43cbbc9a0f000000
-       //TODO: VRCP28SS X26, X2, K3, X23                          // 62826d0bcbfa or 62826d2bcbfa or 62826d4bcbfa
-       //TODO: VRCP28SS X19, X2, K3, X23                          // 62a26d0bcbfb or 62a26d2bcbfb or 62a26d4bcbfb
-       //TODO: VRCP28SS X0, X2, K3, X23                           // 62e26d0bcbf8 or 62e26d2bcbf8 or 62e26d4bcbf8
-       //TODO: VRCP28SS -7(CX), X2, K3, X23                       // 62e26d0bcbb9f9ffffff or 62e26d2bcbb9f9ffffff or 62e26d4bcbb9f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X2, K3, X23                 // 62e26d0bcbbc9a0f000000 or 62e26d2bcbbc9a0f000000 or 62e26d4bcbbc9a0f000000
-       //TODO: VRCP28SS X26, X9, K3, X23                          // 6282350bcbfa or 6282352bcbfa or 6282354bcbfa
-       //TODO: VRCP28SS X19, X9, K3, X23                          // 62a2350bcbfb or 62a2352bcbfb or 62a2354bcbfb
-       //TODO: VRCP28SS X0, X9, K3, X23                           // 62e2350bcbf8 or 62e2352bcbf8 or 62e2354bcbf8
-       //TODO: VRCP28SS -7(CX), X9, K3, X23                       // 62e2350bcbb9f9ffffff or 62e2352bcbb9f9ffffff or 62e2354bcbb9f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X9, K3, X23                 // 62e2350bcbbc9a0f000000 or 62e2352bcbbc9a0f000000 or 62e2354bcbbc9a0f000000
-       //TODO: VRCP28SS X26, X20, K3, X30                         // 62025d03cbf2 or 62025d23cbf2 or 62025d43cbf2
-       //TODO: VRCP28SS X19, X20, K3, X30                         // 62225d03cbf3 or 62225d23cbf3 or 62225d43cbf3
-       //TODO: VRCP28SS X0, X20, K3, X30                          // 62625d03cbf0 or 62625d23cbf0 or 62625d43cbf0
-       //TODO: VRCP28SS -7(CX), X20, K3, X30                      // 62625d03cbb1f9ffffff or 62625d23cbb1f9ffffff or 62625d43cbb1f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X20, K3, X30                // 62625d03cbb49a0f000000 or 62625d23cbb49a0f000000 or 62625d43cbb49a0f000000
-       //TODO: VRCP28SS X26, X2, K3, X30                          // 62026d0bcbf2 or 62026d2bcbf2 or 62026d4bcbf2
-       //TODO: VRCP28SS X19, X2, K3, X30                          // 62226d0bcbf3 or 62226d2bcbf3 or 62226d4bcbf3
-       //TODO: VRCP28SS X0, X2, K3, X30                           // 62626d0bcbf0 or 62626d2bcbf0 or 62626d4bcbf0
-       //TODO: VRCP28SS -7(CX), X2, K3, X30                       // 62626d0bcbb1f9ffffff or 62626d2bcbb1f9ffffff or 62626d4bcbb1f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X2, K3, X30                 // 62626d0bcbb49a0f000000 or 62626d2bcbb49a0f000000 or 62626d4bcbb49a0f000000
-       //TODO: VRCP28SS X26, X9, K3, X30                          // 6202350bcbf2 or 6202352bcbf2 or 6202354bcbf2
-       //TODO: VRCP28SS X19, X9, K3, X30                          // 6222350bcbf3 or 6222352bcbf3 or 6222354bcbf3
-       //TODO: VRCP28SS X0, X9, K3, X30                           // 6262350bcbf0 or 6262352bcbf0 or 6262354bcbf0
-       //TODO: VRCP28SS -7(CX), X9, K3, X30                       // 6262350bcbb1f9ffffff or 6262352bcbb1f9ffffff or 6262354bcbb1f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X9, K3, X30                 // 6262350bcbb49a0f000000 or 6262352bcbb49a0f000000 or 6262354bcbb49a0f000000
-       //TODO: VRCP28SS X26, X20, K3, X8                          // 62125d03cbc2 or 62125d23cbc2 or 62125d43cbc2
-       //TODO: VRCP28SS X19, X20, K3, X8                          // 62325d03cbc3 or 62325d23cbc3 or 62325d43cbc3
-       //TODO: VRCP28SS X0, X20, K3, X8                           // 62725d03cbc0 or 62725d23cbc0 or 62725d43cbc0
-       //TODO: VRCP28SS -7(CX), X20, K3, X8                       // 62725d03cb81f9ffffff or 62725d23cb81f9ffffff or 62725d43cb81f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X20, K3, X8                 // 62725d03cb849a0f000000 or 62725d23cb849a0f000000 or 62725d43cb849a0f000000
-       //TODO: VRCP28SS X26, X2, K3, X8                           // 62126d0bcbc2 or 62126d2bcbc2 or 62126d4bcbc2
-       //TODO: VRCP28SS X19, X2, K3, X8                           // 62326d0bcbc3 or 62326d2bcbc3 or 62326d4bcbc3
-       //TODO: VRCP28SS X0, X2, K3, X8                            // 62726d0bcbc0 or 62726d2bcbc0 or 62726d4bcbc0
-       //TODO: VRCP28SS -7(CX), X2, K3, X8                        // 62726d0bcb81f9ffffff or 62726d2bcb81f9ffffff or 62726d4bcb81f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X2, K3, X8                  // 62726d0bcb849a0f000000 or 62726d2bcb849a0f000000 or 62726d4bcb849a0f000000
-       //TODO: VRCP28SS X26, X9, K3, X8                           // 6212350bcbc2 or 6212352bcbc2 or 6212354bcbc2
-       //TODO: VRCP28SS X19, X9, K3, X8                           // 6232350bcbc3 or 6232352bcbc3 or 6232354bcbc3
-       //TODO: VRCP28SS X0, X9, K3, X8                            // 6272350bcbc0 or 6272352bcbc0 or 6272354bcbc0
-       //TODO: VRCP28SS -7(CX), X9, K3, X8                        // 6272350bcb81f9ffffff or 6272352bcb81f9ffffff or 6272354bcb81f9ffffff
-       //TODO: VRCP28SS 15(DX)(BX*4), X9, K3, X8                  // 6272350bcb849a0f000000 or 6272352bcb849a0f000000 or 6272354bcb849a0f000000
-       //TODO: VRSQRT28PD Z7, K3, Z3                              // 62f2fd4bccdf
-       //TODO: VRSQRT28PD Z9, K3, Z3                              // 62d2fd4bccd9
-       //TODO: VRSQRT28PD Z7, K3, Z27                             // 6262fd4bccdf
-       //TODO: VRSQRT28PD Z9, K3, Z27                             // 6242fd4bccd9
-       //TODO: VRSQRT28PD Z20, K3, Z0                             // 62b2fd4bccc4
-       //TODO: VRSQRT28PD Z28, K3, Z0                             // 6292fd4bccc4
-       //TODO: VRSQRT28PD (SI), K3, Z0                            // 62f2fd4bcc06
-       //TODO: VRSQRT28PD 7(SI)(DI*2), K3, Z0                     // 62f2fd4bcc847e07000000
-       //TODO: VRSQRT28PD Z20, K3, Z6                             // 62b2fd4bccf4
-       //TODO: VRSQRT28PD Z28, K3, Z6                             // 6292fd4bccf4
-       //TODO: VRSQRT28PD (SI), K3, Z6                            // 62f2fd4bcc36
-       //TODO: VRSQRT28PD 7(SI)(DI*2), K3, Z6                     // 62f2fd4bccb47e07000000
-       //TODO: VRSQRT28PS Z9, K2, Z3                              // 62d27d4accd9
-       //TODO: VRSQRT28PS Z19, K2, Z3                             // 62b27d4accdb
-       //TODO: VRSQRT28PS Z9, K2, Z30                             // 62427d4accf1
-       //TODO: VRSQRT28PS Z19, K2, Z30                            // 62227d4accf3
-       //TODO: VRSQRT28PS Z11, K1, Z12                            // 62527d49cce3
-       //TODO: VRSQRT28PS Z5, K1, Z12                             // 62727d49cce5
-       //TODO: VRSQRT28PS 17(SP)(BP*8), K1, Z12                   // 62727d49cca4ec11000000
-       //TODO: VRSQRT28PS 17(SP)(BP*4), K1, Z12                   // 62727d49cca4ac11000000
-       //TODO: VRSQRT28PS Z11, K1, Z22                            // 62c27d49ccf3
-       //TODO: VRSQRT28PS Z5, K1, Z22                             // 62e27d49ccf5
-       //TODO: VRSQRT28PS 17(SP)(BP*8), K1, Z22                   // 62e27d49ccb4ec11000000
-       //TODO: VRSQRT28PS 17(SP)(BP*4), K1, Z22                   // 62e27d49ccb4ac11000000
-       //TODO: VRSQRT28SD X20, X20, K2, X31                       // 6222dd02cdfc
-       //TODO: VRSQRT28SD X16, X20, K2, X31                       // 6222dd02cdf8
-       //TODO: VRSQRT28SD X12, X20, K2, X31                       // 6242dd02cdfc
-       //TODO: VRSQRT28SD X20, X24, K2, X31                       // 6222bd02cdfc
-       //TODO: VRSQRT28SD X16, X24, K2, X31                       // 6222bd02cdf8
-       //TODO: VRSQRT28SD X12, X24, K2, X31                       // 6242bd02cdfc
-       //TODO: VRSQRT28SD X20, X7, K2, X31                        // 6222c50acdfc
-       //TODO: VRSQRT28SD X16, X7, K2, X31                        // 6222c50acdf8
-       //TODO: VRSQRT28SD X12, X7, K2, X31                        // 6242c50acdfc
-       //TODO: VRSQRT28SD X20, X20, K2, X3                        // 62b2dd02cddc
-       //TODO: VRSQRT28SD X16, X20, K2, X3                        // 62b2dd02cdd8
-       //TODO: VRSQRT28SD X12, X20, K2, X3                        // 62d2dd02cddc
-       //TODO: VRSQRT28SD X20, X24, K2, X3                        // 62b2bd02cddc
-       //TODO: VRSQRT28SD X16, X24, K2, X3                        // 62b2bd02cdd8
-       //TODO: VRSQRT28SD X12, X24, K2, X3                        // 62d2bd02cddc
-       //TODO: VRSQRT28SD X20, X7, K2, X3                         // 62b2c50acddc
-       //TODO: VRSQRT28SD X16, X7, K2, X3                         // 62b2c50acdd8
-       //TODO: VRSQRT28SD X12, X7, K2, X3                         // 62d2c50acddc
-       //TODO: VRSQRT28SD X20, X20, K2, X28                       // 6222dd02cde4
-       //TODO: VRSQRT28SD X16, X20, K2, X28                       // 6222dd02cde0
-       //TODO: VRSQRT28SD X12, X20, K2, X28                       // 6242dd02cde4
-       //TODO: VRSQRT28SD X20, X24, K2, X28                       // 6222bd02cde4
-       //TODO: VRSQRT28SD X16, X24, K2, X28                       // 6222bd02cde0
-       //TODO: VRSQRT28SD X12, X24, K2, X28                       // 6242bd02cde4
-       //TODO: VRSQRT28SD X20, X7, K2, X28                        // 6222c50acde4
-       //TODO: VRSQRT28SD X16, X7, K2, X28                        // 6222c50acde0
-       //TODO: VRSQRT28SD X12, X7, K2, X28                        // 6242c50acde4
-       //TODO: VRSQRT28SD X8, X6, K1, X6                          // 62d2cd09cdf0 or 62d2cd29cdf0 or 62d2cd49cdf0
-       //TODO: VRSQRT28SD X6, X6, K1, X6                          // 62f2cd09cdf6 or 62f2cd29cdf6 or 62f2cd49cdf6
-       //TODO: VRSQRT28SD X0, X6, K1, X6                          // 62f2cd09cdf0 or 62f2cd29cdf0 or 62f2cd49cdf0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X6, K1, X6              // 6292cd09cdb43f63000000 or 6292cd29cdb43f63000000 or 6292cd49cdb43f63000000
-       //TODO: VRSQRT28SD (DX), X6, K1, X6                        // 62f2cd09cd32 or 62f2cd29cd32 or 62f2cd49cd32
-       //TODO: VRSQRT28SD X8, X1, K1, X6                          // 62d2f509cdf0 or 62d2f529cdf0 or 62d2f549cdf0
-       //TODO: VRSQRT28SD X6, X1, K1, X6                          // 62f2f509cdf6 or 62f2f529cdf6 or 62f2f549cdf6
-       //TODO: VRSQRT28SD X0, X1, K1, X6                          // 62f2f509cdf0 or 62f2f529cdf0 or 62f2f549cdf0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X1, K1, X6              // 6292f509cdb43f63000000 or 6292f529cdb43f63000000 or 6292f549cdb43f63000000
-       //TODO: VRSQRT28SD (DX), X1, K1, X6                        // 62f2f509cd32 or 62f2f529cd32 or 62f2f549cd32
-       //TODO: VRSQRT28SD X8, X8, K1, X6                          // 62d2bd09cdf0 or 62d2bd29cdf0 or 62d2bd49cdf0
-       //TODO: VRSQRT28SD X6, X8, K1, X6                          // 62f2bd09cdf6 or 62f2bd29cdf6 or 62f2bd49cdf6
-       //TODO: VRSQRT28SD X0, X8, K1, X6                          // 62f2bd09cdf0 or 62f2bd29cdf0 or 62f2bd49cdf0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X8, K1, X6              // 6292bd09cdb43f63000000 or 6292bd29cdb43f63000000 or 6292bd49cdb43f63000000
-       //TODO: VRSQRT28SD (DX), X8, K1, X6                        // 62f2bd09cd32 or 62f2bd29cd32 or 62f2bd49cd32
-       //TODO: VRSQRT28SD X8, X6, K1, X17                         // 62c2cd09cdc8 or 62c2cd29cdc8 or 62c2cd49cdc8
-       //TODO: VRSQRT28SD X6, X6, K1, X17                         // 62e2cd09cdce or 62e2cd29cdce or 62e2cd49cdce
-       //TODO: VRSQRT28SD X0, X6, K1, X17                         // 62e2cd09cdc8 or 62e2cd29cdc8 or 62e2cd49cdc8
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X6, K1, X17             // 6282cd09cd8c3f63000000 or 6282cd29cd8c3f63000000 or 6282cd49cd8c3f63000000
-       //TODO: VRSQRT28SD (DX), X6, K1, X17                       // 62e2cd09cd0a or 62e2cd29cd0a or 62e2cd49cd0a
-       //TODO: VRSQRT28SD X8, X1, K1, X17                         // 62c2f509cdc8 or 62c2f529cdc8 or 62c2f549cdc8
-       //TODO: VRSQRT28SD X6, X1, K1, X17                         // 62e2f509cdce or 62e2f529cdce or 62e2f549cdce
-       //TODO: VRSQRT28SD X0, X1, K1, X17                         // 62e2f509cdc8 or 62e2f529cdc8 or 62e2f549cdc8
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X1, K1, X17             // 6282f509cd8c3f63000000 or 6282f529cd8c3f63000000 or 6282f549cd8c3f63000000
-       //TODO: VRSQRT28SD (DX), X1, K1, X17                       // 62e2f509cd0a or 62e2f529cd0a or 62e2f549cd0a
-       //TODO: VRSQRT28SD X8, X8, K1, X17                         // 62c2bd09cdc8 or 62c2bd29cdc8 or 62c2bd49cdc8
-       //TODO: VRSQRT28SD X6, X8, K1, X17                         // 62e2bd09cdce or 62e2bd29cdce or 62e2bd49cdce
-       //TODO: VRSQRT28SD X0, X8, K1, X17                         // 62e2bd09cdc8 or 62e2bd29cdc8 or 62e2bd49cdc8
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X8, K1, X17             // 6282bd09cd8c3f63000000 or 6282bd29cd8c3f63000000 or 6282bd49cd8c3f63000000
-       //TODO: VRSQRT28SD (DX), X8, K1, X17                       // 62e2bd09cd0a or 62e2bd29cd0a or 62e2bd49cd0a
-       //TODO: VRSQRT28SD X8, X6, K1, X28                         // 6242cd09cde0 or 6242cd29cde0 or 6242cd49cde0
-       //TODO: VRSQRT28SD X6, X6, K1, X28                         // 6262cd09cde6 or 6262cd29cde6 or 6262cd49cde6
-       //TODO: VRSQRT28SD X0, X6, K1, X28                         // 6262cd09cde0 or 6262cd29cde0 or 6262cd49cde0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X6, K1, X28             // 6202cd09cda43f63000000 or 6202cd29cda43f63000000 or 6202cd49cda43f63000000
-       //TODO: VRSQRT28SD (DX), X6, K1, X28                       // 6262cd09cd22 or 6262cd29cd22 or 6262cd49cd22
-       //TODO: VRSQRT28SD X8, X1, K1, X28                         // 6242f509cde0 or 6242f529cde0 or 6242f549cde0
-       //TODO: VRSQRT28SD X6, X1, K1, X28                         // 6262f509cde6 or 6262f529cde6 or 6262f549cde6
-       //TODO: VRSQRT28SD X0, X1, K1, X28                         // 6262f509cde0 or 6262f529cde0 or 6262f549cde0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X1, K1, X28             // 6202f509cda43f63000000 or 6202f529cda43f63000000 or 6202f549cda43f63000000
-       //TODO: VRSQRT28SD (DX), X1, K1, X28                       // 6262f509cd22 or 6262f529cd22 or 6262f549cd22
-       //TODO: VRSQRT28SD X8, X8, K1, X28                         // 6242bd09cde0 or 6242bd29cde0 or 6242bd49cde0
-       //TODO: VRSQRT28SD X6, X8, K1, X28                         // 6262bd09cde6 or 6262bd29cde6 or 6262bd49cde6
-       //TODO: VRSQRT28SD X0, X8, K1, X28                         // 6262bd09cde0 or 6262bd29cde0 or 6262bd49cde0
-       //TODO: VRSQRT28SD 99(R15)(R15*1), X8, K1, X28             // 6202bd09cda43f63000000 or 6202bd29cda43f63000000 or 6202bd49cda43f63000000
-       //TODO: VRSQRT28SD (DX), X8, K1, X28                       // 6262bd09cd22 or 6262bd29cd22 or 6262bd49cd22
-       //TODO: VRSQRT28SS X16, X6, K7, X11                        // 62324d0fcdd8
-       //TODO: VRSQRT28SS X28, X6, K7, X11                        // 62124d0fcddc
-       //TODO: VRSQRT28SS X8, X6, K7, X11                         // 62524d0fcdd8
-       //TODO: VRSQRT28SS X16, X22, K7, X11                       // 62324d07cdd8
-       //TODO: VRSQRT28SS X28, X22, K7, X11                       // 62124d07cddc
-       //TODO: VRSQRT28SS X8, X22, K7, X11                        // 62524d07cdd8
-       //TODO: VRSQRT28SS X16, X12, K7, X11                       // 62321d0fcdd8
-       //TODO: VRSQRT28SS X28, X12, K7, X11                       // 62121d0fcddc
-       //TODO: VRSQRT28SS X8, X12, K7, X11                        // 62521d0fcdd8
-       //TODO: VRSQRT28SS X16, X6, K7, X16                        // 62a24d0fcdc0
-       //TODO: VRSQRT28SS X28, X6, K7, X16                        // 62824d0fcdc4
-       //TODO: VRSQRT28SS X8, X6, K7, X16                         // 62c24d0fcdc0
-       //TODO: VRSQRT28SS X16, X22, K7, X16                       // 62a24d07cdc0
-       //TODO: VRSQRT28SS X28, X22, K7, X16                       // 62824d07cdc4
-       //TODO: VRSQRT28SS X8, X22, K7, X16                        // 62c24d07cdc0
-       //TODO: VRSQRT28SS X16, X12, K7, X16                       // 62a21d0fcdc0
-       //TODO: VRSQRT28SS X28, X12, K7, X16                       // 62821d0fcdc4
-       //TODO: VRSQRT28SS X8, X12, K7, X16                        // 62c21d0fcdc0
-       //TODO: VRSQRT28SS X16, X6, K7, X6                         // 62b24d0fcdf0
-       //TODO: VRSQRT28SS X28, X6, K7, X6                         // 62924d0fcdf4
-       //TODO: VRSQRT28SS X8, X6, K7, X6                          // 62d24d0fcdf0
-       //TODO: VRSQRT28SS X16, X22, K7, X6                        // 62b24d07cdf0
-       //TODO: VRSQRT28SS X28, X22, K7, X6                        // 62924d07cdf4
-       //TODO: VRSQRT28SS X8, X22, K7, X6                         // 62d24d07cdf0
-       //TODO: VRSQRT28SS X16, X12, K7, X6                        // 62b21d0fcdf0
-       //TODO: VRSQRT28SS X28, X12, K7, X6                        // 62921d0fcdf4
-       //TODO: VRSQRT28SS X8, X12, K7, X6                         // 62d21d0fcdf0
-       //TODO: VRSQRT28SS X14, X19, K1, X15                       // 62526501cdfe or 62526521cdfe or 62526541cdfe
-       //TODO: VRSQRT28SS X0, X19, K1, X15                        // 62726501cdf8 or 62726521cdf8 or 62726541cdf8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X19, K1, X15             // 62126501cdbcb00f000000 or 62126521cdbcb00f000000 or 62126541cdbcb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X19, K1, X15              // 62726501cdbc91f9ffffff or 62726521cdbc91f9ffffff or 62726541cdbc91f9ffffff
-       //TODO: VRSQRT28SS X14, X13, K1, X15                       // 62521509cdfe or 62521529cdfe or 62521549cdfe
-       //TODO: VRSQRT28SS X0, X13, K1, X15                        // 62721509cdf8 or 62721529cdf8 or 62721549cdf8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X13, K1, X15             // 62121509cdbcb00f000000 or 62121529cdbcb00f000000 or 62121549cdbcb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X13, K1, X15              // 62721509cdbc91f9ffffff or 62721529cdbc91f9ffffff or 62721549cdbc91f9ffffff
-       //TODO: VRSQRT28SS X14, X2, K1, X15                        // 62526d09cdfe or 62526d29cdfe or 62526d49cdfe
-       //TODO: VRSQRT28SS X0, X2, K1, X15                         // 62726d09cdf8 or 62726d29cdf8 or 62726d49cdf8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X2, K1, X15              // 62126d09cdbcb00f000000 or 62126d29cdbcb00f000000 or 62126d49cdbcb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X2, K1, X15               // 62726d09cdbc91f9ffffff or 62726d29cdbc91f9ffffff or 62726d49cdbc91f9ffffff
-       //TODO: VRSQRT28SS X14, X19, K1, X11                       // 62526501cdde or 62526521cdde or 62526541cdde
-       //TODO: VRSQRT28SS X0, X19, K1, X11                        // 62726501cdd8 or 62726521cdd8 or 62726541cdd8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X19, K1, X11             // 62126501cd9cb00f000000 or 62126521cd9cb00f000000 or 62126541cd9cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X19, K1, X11              // 62726501cd9c91f9ffffff or 62726521cd9c91f9ffffff or 62726541cd9c91f9ffffff
-       //TODO: VRSQRT28SS X14, X13, K1, X11                       // 62521509cdde or 62521529cdde or 62521549cdde
-       //TODO: VRSQRT28SS X0, X13, K1, X11                        // 62721509cdd8 or 62721529cdd8 or 62721549cdd8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X13, K1, X11             // 62121509cd9cb00f000000 or 62121529cd9cb00f000000 or 62121549cd9cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X13, K1, X11              // 62721509cd9c91f9ffffff or 62721529cd9c91f9ffffff or 62721549cd9c91f9ffffff
-       //TODO: VRSQRT28SS X14, X2, K1, X11                        // 62526d09cdde or 62526d29cdde or 62526d49cdde
-       //TODO: VRSQRT28SS X0, X2, K1, X11                         // 62726d09cdd8 or 62726d29cdd8 or 62726d49cdd8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X2, K1, X11              // 62126d09cd9cb00f000000 or 62126d29cd9cb00f000000 or 62126d49cd9cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X2, K1, X11               // 62726d09cd9c91f9ffffff or 62726d29cd9c91f9ffffff or 62726d49cd9c91f9ffffff
-       //TODO: VRSQRT28SS X14, X19, K1, X1                        // 62d26501cdce or 62d26521cdce or 62d26541cdce
-       //TODO: VRSQRT28SS X0, X19, K1, X1                         // 62f26501cdc8 or 62f26521cdc8 or 62f26541cdc8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X19, K1, X1              // 62926501cd8cb00f000000 or 62926521cd8cb00f000000 or 62926541cd8cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X19, K1, X1               // 62f26501cd8c91f9ffffff or 62f26521cd8c91f9ffffff or 62f26541cd8c91f9ffffff
-       //TODO: VRSQRT28SS X14, X13, K1, X1                        // 62d21509cdce or 62d21529cdce or 62d21549cdce
-       //TODO: VRSQRT28SS X0, X13, K1, X1                         // 62f21509cdc8 or 62f21529cdc8 or 62f21549cdc8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X13, K1, X1              // 62921509cd8cb00f000000 or 62921529cd8cb00f000000 or 62921549cd8cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X13, K1, X1               // 62f21509cd8c91f9ffffff or 62f21529cd8c91f9ffffff or 62f21549cd8c91f9ffffff
-       //TODO: VRSQRT28SS X14, X2, K1, X1                         // 62d26d09cdce or 62d26d29cdce or 62d26d49cdce
-       //TODO: VRSQRT28SS X0, X2, K1, X1                          // 62f26d09cdc8 or 62f26d29cdc8 or 62f26d49cdc8
-       //TODO: VRSQRT28SS 15(R8)(R14*4), X2, K1, X1               // 62926d09cd8cb00f000000 or 62926d29cd8cb00f000000 or 62926d49cd8cb00f000000
-       //TODO: VRSQRT28SS -7(CX)(DX*4), X2, K1, X1                // 62f26d09cd8c91f9ffffff or 62f26d29cd8c91f9ffffff or 62f26d49cd8c91f9ffffff
+       VEXP2PD Z17, K7, Z20                               // 62a2fd4fc8e1
+       VEXP2PD Z0, K7, Z20                                // 62e2fd4fc8e0
+       VEXP2PD Z17, K7, Z0                                // 62b2fd4fc8c1
+       VEXP2PD Z0, K7, Z0                                 // 62f2fd4fc8c0
+       VEXP2PD Z31, K2, Z17                               // 6282fd4ac8cf
+       VEXP2PD Z0, K2, Z17                                // 62e2fd4ac8c8
+       VEXP2PD (R14), K2, Z17                             // 62c2fd4ac80e
+       VEXP2PD -7(DI)(R8*8), K2, Z17                      // 62a2fd4ac88cc7f9ffffff
+       VEXP2PD Z31, K2, Z23                               // 6282fd4ac8ff
+       VEXP2PD Z0, K2, Z23                                // 62e2fd4ac8f8
+       VEXP2PD (R14), K2, Z23                             // 62c2fd4ac83e
+       VEXP2PD -7(DI)(R8*8), K2, Z23                      // 62a2fd4ac8bcc7f9ffffff
+       VEXP2PS Z6, K4, Z21                                // 62e27d4cc8ee
+       VEXP2PS Z9, K4, Z21                                // 62c27d4cc8e9
+       VEXP2PS Z6, K4, Z9                                 // 62727d4cc8ce
+       VEXP2PS Z9, K4, Z9                                 // 62527d4cc8c9
+       VEXP2PS Z20, K1, Z1                                // 62b27d49c8cc
+       VEXP2PS Z9, K1, Z1                                 // 62d27d49c8c9
+       VEXP2PS 99(R15)(R15*4), K1, Z1                     // 62927d49c88cbf63000000
+       VEXP2PS 15(DX), K1, Z1                             // 62f27d49c88a0f000000
+       VEXP2PS Z20, K1, Z9                                // 62327d49c8cc
+       VEXP2PS Z9, K1, Z9                                 // 62527d49c8c9
+       VEXP2PS 99(R15)(R15*4), K1, Z9                     // 62127d49c88cbf63000000
+       VEXP2PS 15(DX), K1, Z9                             // 62727d49c88a0f000000
+       VRCP28PD Z13, K7, Z11                              // 6252fd4fcadd
+       VRCP28PD Z14, K7, Z11                              // 6252fd4fcade
+       VRCP28PD Z13, K7, Z5                               // 62d2fd4fcaed
+       VRCP28PD Z14, K7, Z5                               // 62d2fd4fcaee
+       VRCP28PD Z2, K2, Z5                                // 62f2fd4acaea
+       VRCP28PD -7(CX)(DX*1), K2, Z5                      // 62f2fd4acaac11f9ffffff
+       VRCP28PD -15(R14)(R15*4), K2, Z5                   // 6292fd4acaacbef1ffffff
+       VRCP28PD Z2, K2, Z23                               // 62e2fd4acafa
+       VRCP28PD -7(CX)(DX*1), K2, Z23                     // 62e2fd4acabc11f9ffffff
+       VRCP28PD -15(R14)(R15*4), K2, Z23                  // 6282fd4acabcbef1ffffff
+       VRCP28PS Z26, K5, Z6                               // 62927d4dcaf2
+       VRCP28PS Z14, K5, Z6                               // 62d27d4dcaf6
+       VRCP28PS Z26, K5, Z14                              // 62127d4dcaf2
+       VRCP28PS Z14, K5, Z14                              // 62527d4dcaf6
+       VRCP28PS Z13, K3, Z28                              // 62427d4bcae5
+       VRCP28PS Z21, K3, Z28                              // 62227d4bcae5
+       VRCP28PS 15(DX)(BX*1), K3, Z28                     // 62627d4bcaa41a0f000000
+       VRCP28PS -7(CX)(DX*2), K3, Z28                     // 62627d4bcaa451f9ffffff
+       VRCP28PS Z13, K3, Z6                               // 62d27d4bcaf5
+       VRCP28PS Z21, K3, Z6                               // 62b27d4bcaf5
+       VRCP28PS 15(DX)(BX*1), K3, Z6                      // 62f27d4bcab41a0f000000
+       VRCP28PS -7(CX)(DX*2), K3, Z6                      // 62f27d4bcab451f9ffffff
+       VRCP28SD X25, X14, K4, X19                         // 62828d0ccbd9
+       VRCP28SD X11, X14, K4, X19                         // 62c28d0ccbdb
+       VRCP28SD X17, X14, K4, X19                         // 62a28d0ccbd9
+       VRCP28SD X25, X0, K4, X19                          // 6282fd0ccbd9
+       VRCP28SD X11, X0, K4, X19                          // 62c2fd0ccbdb
+       VRCP28SD X17, X0, K4, X19                          // 62a2fd0ccbd9
+       VRCP28SD X25, X14, K4, X13                         // 62128d0ccbe9
+       VRCP28SD X11, X14, K4, X13                         // 62528d0ccbeb
+       VRCP28SD X17, X14, K4, X13                         // 62328d0ccbe9
+       VRCP28SD X25, X0, K4, X13                          // 6212fd0ccbe9
+       VRCP28SD X11, X0, K4, X13                          // 6252fd0ccbeb
+       VRCP28SD X17, X0, K4, X13                          // 6232fd0ccbe9
+       VRCP28SD X25, X14, K4, X2                          // 62928d0ccbd1
+       VRCP28SD X11, X14, K4, X2                          // 62d28d0ccbd3
+       VRCP28SD X17, X14, K4, X2                          // 62b28d0ccbd1
+       VRCP28SD X25, X0, K4, X2                           // 6292fd0ccbd1
+       VRCP28SD X11, X0, K4, X2                           // 62d2fd0ccbd3
+       VRCP28SD X17, X0, K4, X2                           // 62b2fd0ccbd1
+       VRCP28SD X2, X2, K2, X18                           // 62e2ed0acbd2 or 62e2ed2acbd2 or 62e2ed4acbd2
+       VRCP28SD X27, X2, K2, X18                          // 6282ed0acbd3 or 6282ed2acbd3 or 6282ed4acbd3
+       VRCP28SD X26, X2, K2, X18                          // 6282ed0acbd2 or 6282ed2acbd2 or 6282ed4acbd2
+       VRCP28SD 17(SP)(BP*8), X2, K2, X18                 // 62e2ed0acb94ec11000000 or 62e2ed2acb94ec11000000 or 62e2ed4acb94ec11000000
+       VRCP28SD 17(SP)(BP*4), X2, K2, X18                 // 62e2ed0acb94ac11000000 or 62e2ed2acb94ac11000000 or 62e2ed4acb94ac11000000
+       VRCP28SD X2, X24, K2, X18                          // 62e2bd02cbd2 or 62e2bd22cbd2 or 62e2bd42cbd2
+       VRCP28SD X27, X24, K2, X18                         // 6282bd02cbd3 or 6282bd22cbd3 or 6282bd42cbd3
+       VRCP28SD X26, X24, K2, X18                         // 6282bd02cbd2 or 6282bd22cbd2 or 6282bd42cbd2
+       VRCP28SD 17(SP)(BP*8), X24, K2, X18                // 62e2bd02cb94ec11000000 or 62e2bd22cb94ec11000000 or 62e2bd42cb94ec11000000
+       VRCP28SD 17(SP)(BP*4), X24, K2, X18                // 62e2bd02cb94ac11000000 or 62e2bd22cb94ac11000000 or 62e2bd42cb94ac11000000
+       VRCP28SD X2, X2, K2, X11                           // 6272ed0acbda or 6272ed2acbda or 6272ed4acbda
+       VRCP28SD X27, X2, K2, X11                          // 6212ed0acbdb or 6212ed2acbdb or 6212ed4acbdb
+       VRCP28SD X26, X2, K2, X11                          // 6212ed0acbda or 6212ed2acbda or 6212ed4acbda
+       VRCP28SD 17(SP)(BP*8), X2, K2, X11                 // 6272ed0acb9cec11000000 or 6272ed2acb9cec11000000 or 6272ed4acb9cec11000000
+       VRCP28SD 17(SP)(BP*4), X2, K2, X11                 // 6272ed0acb9cac11000000 or 6272ed2acb9cac11000000 or 6272ed4acb9cac11000000
+       VRCP28SD X2, X24, K2, X11                          // 6272bd02cbda or 6272bd22cbda or 6272bd42cbda
+       VRCP28SD X27, X24, K2, X11                         // 6212bd02cbdb or 6212bd22cbdb or 6212bd42cbdb
+       VRCP28SD X26, X24, K2, X11                         // 6212bd02cbda or 6212bd22cbda or 6212bd42cbda
+       VRCP28SD 17(SP)(BP*8), X24, K2, X11                // 6272bd02cb9cec11000000 or 6272bd22cb9cec11000000 or 6272bd42cb9cec11000000
+       VRCP28SD 17(SP)(BP*4), X24, K2, X11                // 6272bd02cb9cac11000000 or 6272bd22cb9cac11000000 or 6272bd42cb9cac11000000
+       VRCP28SD X2, X2, K2, X9                            // 6272ed0acbca or 6272ed2acbca or 6272ed4acbca
+       VRCP28SD X27, X2, K2, X9                           // 6212ed0acbcb or 6212ed2acbcb or 6212ed4acbcb
+       VRCP28SD X26, X2, K2, X9                           // 6212ed0acbca or 6212ed2acbca or 6212ed4acbca
+       VRCP28SD 17(SP)(BP*8), X2, K2, X9                  // 6272ed0acb8cec11000000 or 6272ed2acb8cec11000000 or 6272ed4acb8cec11000000
+       VRCP28SD 17(SP)(BP*4), X2, K2, X9                  // 6272ed0acb8cac11000000 or 6272ed2acb8cac11000000 or 6272ed4acb8cac11000000
+       VRCP28SD X2, X24, K2, X9                           // 6272bd02cbca or 6272bd22cbca or 6272bd42cbca
+       VRCP28SD X27, X24, K2, X9                          // 6212bd02cbcb or 6212bd22cbcb or 6212bd42cbcb
+       VRCP28SD X26, X24, K2, X9                          // 6212bd02cbca or 6212bd22cbca or 6212bd42cbca
+       VRCP28SD 17(SP)(BP*8), X24, K2, X9                 // 6272bd02cb8cec11000000 or 6272bd22cb8cec11000000 or 6272bd42cb8cec11000000
+       VRCP28SD 17(SP)(BP*4), X24, K2, X9                 // 6272bd02cb8cac11000000 or 6272bd22cb8cac11000000 or 6272bd42cb8cac11000000
+       VRCP28SS X13, X11, K2, X22                         // 62c2250acbf5
+       VRCP28SS X6, X11, K2, X22                          // 62e2250acbf6
+       VRCP28SS X12, X11, K2, X22                         // 62c2250acbf4
+       VRCP28SS X13, X15, K2, X22                         // 62c2050acbf5
+       VRCP28SS X6, X15, K2, X22                          // 62e2050acbf6
+       VRCP28SS X12, X15, K2, X22                         // 62c2050acbf4
+       VRCP28SS X13, X30, K2, X22                         // 62c20d02cbf5
+       VRCP28SS X6, X30, K2, X22                          // 62e20d02cbf6
+       VRCP28SS X12, X30, K2, X22                         // 62c20d02cbf4
+       VRCP28SS X13, X11, K2, X30                         // 6242250acbf5
+       VRCP28SS X6, X11, K2, X30                          // 6262250acbf6
+       VRCP28SS X12, X11, K2, X30                         // 6242250acbf4
+       VRCP28SS X13, X15, K2, X30                         // 6242050acbf5
+       VRCP28SS X6, X15, K2, X30                          // 6262050acbf6
+       VRCP28SS X12, X15, K2, X30                         // 6242050acbf4
+       VRCP28SS X13, X30, K2, X30                         // 62420d02cbf5
+       VRCP28SS X6, X30, K2, X30                          // 62620d02cbf6
+       VRCP28SS X12, X30, K2, X30                         // 62420d02cbf4
+       VRCP28SS X13, X11, K2, X3                          // 62d2250acbdd
+       VRCP28SS X6, X11, K2, X3                           // 62f2250acbde
+       VRCP28SS X12, X11, K2, X3                          // 62d2250acbdc
+       VRCP28SS X13, X15, K2, X3                          // 62d2050acbdd
+       VRCP28SS X6, X15, K2, X3                           // 62f2050acbde
+       VRCP28SS X12, X15, K2, X3                          // 62d2050acbdc
+       VRCP28SS X13, X30, K2, X3                          // 62d20d02cbdd
+       VRCP28SS X6, X30, K2, X3                           // 62f20d02cbde
+       VRCP28SS X12, X30, K2, X3                          // 62d20d02cbdc
+       VRCP28SS X26, X20, K3, X23                         // 62825d03cbfa or 62825d23cbfa or 62825d43cbfa
+       VRCP28SS X19, X20, K3, X23                         // 62a25d03cbfb or 62a25d23cbfb or 62a25d43cbfb
+       VRCP28SS X0, X20, K3, X23                          // 62e25d03cbf8 or 62e25d23cbf8 or 62e25d43cbf8
+       VRCP28SS -7(CX), X20, K3, X23                      // 62e25d03cbb9f9ffffff or 62e25d23cbb9f9ffffff or 62e25d43cbb9f9ffffff
+       VRCP28SS 15(DX)(BX*4), X20, K3, X23                // 62e25d03cbbc9a0f000000 or 62e25d23cbbc9a0f000000 or 62e25d43cbbc9a0f000000
+       VRCP28SS X26, X2, K3, X23                          // 62826d0bcbfa or 62826d2bcbfa or 62826d4bcbfa
+       VRCP28SS X19, X2, K3, X23                          // 62a26d0bcbfb or 62a26d2bcbfb or 62a26d4bcbfb
+       VRCP28SS X0, X2, K3, X23                           // 62e26d0bcbf8 or 62e26d2bcbf8 or 62e26d4bcbf8
+       VRCP28SS -7(CX), X2, K3, X23                       // 62e26d0bcbb9f9ffffff or 62e26d2bcbb9f9ffffff or 62e26d4bcbb9f9ffffff
+       VRCP28SS 15(DX)(BX*4), X2, K3, X23                 // 62e26d0bcbbc9a0f000000 or 62e26d2bcbbc9a0f000000 or 62e26d4bcbbc9a0f000000
+       VRCP28SS X26, X9, K3, X23                          // 6282350bcbfa or 6282352bcbfa or 6282354bcbfa
+       VRCP28SS X19, X9, K3, X23                          // 62a2350bcbfb or 62a2352bcbfb or 62a2354bcbfb
+       VRCP28SS X0, X9, K3, X23                           // 62e2350bcbf8 or 62e2352bcbf8 or 62e2354bcbf8
+       VRCP28SS -7(CX), X9, K3, X23                       // 62e2350bcbb9f9ffffff or 62e2352bcbb9f9ffffff or 62e2354bcbb9f9ffffff
+       VRCP28SS 15(DX)(BX*4), X9, K3, X23                 // 62e2350bcbbc9a0f000000 or 62e2352bcbbc9a0f000000 or 62e2354bcbbc9a0f000000
+       VRCP28SS X26, X20, K3, X30                         // 62025d03cbf2 or 62025d23cbf2 or 62025d43cbf2
+       VRCP28SS X19, X20, K3, X30                         // 62225d03cbf3 or 62225d23cbf3 or 62225d43cbf3
+       VRCP28SS X0, X20, K3, X30                          // 62625d03cbf0 or 62625d23cbf0 or 62625d43cbf0
+       VRCP28SS -7(CX), X20, K3, X30                      // 62625d03cbb1f9ffffff or 62625d23cbb1f9ffffff or 62625d43cbb1f9ffffff
+       VRCP28SS 15(DX)(BX*4), X20, K3, X30                // 62625d03cbb49a0f000000 or 62625d23cbb49a0f000000 or 62625d43cbb49a0f000000
+       VRCP28SS X26, X2, K3, X30                          // 62026d0bcbf2 or 62026d2bcbf2 or 62026d4bcbf2
+       VRCP28SS X19, X2, K3, X30                          // 62226d0bcbf3 or 62226d2bcbf3 or 62226d4bcbf3
+       VRCP28SS X0, X2, K3, X30                           // 62626d0bcbf0 or 62626d2bcbf0 or 62626d4bcbf0
+       VRCP28SS -7(CX), X2, K3, X30                       // 62626d0bcbb1f9ffffff or 62626d2bcbb1f9ffffff or 62626d4bcbb1f9ffffff
+       VRCP28SS 15(DX)(BX*4), X2, K3, X30                 // 62626d0bcbb49a0f000000 or 62626d2bcbb49a0f000000 or 62626d4bcbb49a0f000000
+       VRCP28SS X26, X9, K3, X30                          // 6202350bcbf2 or 6202352bcbf2 or 6202354bcbf2
+       VRCP28SS X19, X9, K3, X30                          // 6222350bcbf3 or 6222352bcbf3 or 6222354bcbf3
+       VRCP28SS X0, X9, K3, X30                           // 6262350bcbf0 or 6262352bcbf0 or 6262354bcbf0
+       VRCP28SS -7(CX), X9, K3, X30                       // 6262350bcbb1f9ffffff or 6262352bcbb1f9ffffff or 6262354bcbb1f9ffffff
+       VRCP28SS 15(DX)(BX*4), X9, K3, X30                 // 6262350bcbb49a0f000000 or 6262352bcbb49a0f000000 or 6262354bcbb49a0f000000
+       VRCP28SS X26, X20, K3, X8                          // 62125d03cbc2 or 62125d23cbc2 or 62125d43cbc2
+       VRCP28SS X19, X20, K3, X8                          // 62325d03cbc3 or 62325d23cbc3 or 62325d43cbc3
+       VRCP28SS X0, X20, K3, X8                           // 62725d03cbc0 or 62725d23cbc0 or 62725d43cbc0
+       VRCP28SS -7(CX), X20, K3, X8                       // 62725d03cb81f9ffffff or 62725d23cb81f9ffffff or 62725d43cb81f9ffffff
+       VRCP28SS 15(DX)(BX*4), X20, K3, X8                 // 62725d03cb849a0f000000 or 62725d23cb849a0f000000 or 62725d43cb849a0f000000
+       VRCP28SS X26, X2, K3, X8                           // 62126d0bcbc2 or 62126d2bcbc2 or 62126d4bcbc2
+       VRCP28SS X19, X2, K3, X8                           // 62326d0bcbc3 or 62326d2bcbc3 or 62326d4bcbc3
+       VRCP28SS X0, X2, K3, X8                            // 62726d0bcbc0 or 62726d2bcbc0 or 62726d4bcbc0
+       VRCP28SS -7(CX), X2, K3, X8                        // 62726d0bcb81f9ffffff or 62726d2bcb81f9ffffff or 62726d4bcb81f9ffffff
+       VRCP28SS 15(DX)(BX*4), X2, K3, X8                  // 62726d0bcb849a0f000000 or 62726d2bcb849a0f000000 or 62726d4bcb849a0f000000
+       VRCP28SS X26, X9, K3, X8                           // 6212350bcbc2 or 6212352bcbc2 or 6212354bcbc2
+       VRCP28SS X19, X9, K3, X8                           // 6232350bcbc3 or 6232352bcbc3 or 6232354bcbc3
+       VRCP28SS X0, X9, K3, X8                            // 6272350bcbc0 or 6272352bcbc0 or 6272354bcbc0
+       VRCP28SS -7(CX), X9, K3, X8                        // 6272350bcb81f9ffffff or 6272352bcb81f9ffffff or 6272354bcb81f9ffffff
+       VRCP28SS 15(DX)(BX*4), X9, K3, X8                  // 6272350bcb849a0f000000 or 6272352bcb849a0f000000 or 6272354bcb849a0f000000
+       VRSQRT28PD Z7, K3, Z3                              // 62f2fd4bccdf
+       VRSQRT28PD Z9, K3, Z3                              // 62d2fd4bccd9
+       VRSQRT28PD Z7, K3, Z27                             // 6262fd4bccdf
+       VRSQRT28PD Z9, K3, Z27                             // 6242fd4bccd9
+       VRSQRT28PD Z20, K3, Z0                             // 62b2fd4bccc4
+       VRSQRT28PD Z28, K3, Z0                             // 6292fd4bccc4
+       VRSQRT28PD (SI), K3, Z0                            // 62f2fd4bcc06
+       VRSQRT28PD 7(SI)(DI*2), K3, Z0                     // 62f2fd4bcc847e07000000
+       VRSQRT28PD Z20, K3, Z6                             // 62b2fd4bccf4
+       VRSQRT28PD Z28, K3, Z6                             // 6292fd4bccf4
+       VRSQRT28PD (SI), K3, Z6                            // 62f2fd4bcc36
+       VRSQRT28PD 7(SI)(DI*2), K3, Z6                     // 62f2fd4bccb47e07000000
+       VRSQRT28PS Z9, K2, Z3                              // 62d27d4accd9
+       VRSQRT28PS Z19, K2, Z3                             // 62b27d4accdb
+       VRSQRT28PS Z9, K2, Z30                             // 62427d4accf1
+       VRSQRT28PS Z19, K2, Z30                            // 62227d4accf3
+       VRSQRT28PS Z11, K1, Z12                            // 62527d49cce3
+       VRSQRT28PS Z5, K1, Z12                             // 62727d49cce5
+       VRSQRT28PS 17(SP)(BP*8), K1, Z12                   // 62727d49cca4ec11000000
+       VRSQRT28PS 17(SP)(BP*4), K1, Z12                   // 62727d49cca4ac11000000
+       VRSQRT28PS Z11, K1, Z22                            // 62c27d49ccf3
+       VRSQRT28PS Z5, K1, Z22                             // 62e27d49ccf5
+       VRSQRT28PS 17(SP)(BP*8), K1, Z22                   // 62e27d49ccb4ec11000000
+       VRSQRT28PS 17(SP)(BP*4), K1, Z22                   // 62e27d49ccb4ac11000000
+       VRSQRT28SD X20, X20, K2, X31                       // 6222dd02cdfc
+       VRSQRT28SD X16, X20, K2, X31                       // 6222dd02cdf8
+       VRSQRT28SD X12, X20, K2, X31                       // 6242dd02cdfc
+       VRSQRT28SD X20, X24, K2, X31                       // 6222bd02cdfc
+       VRSQRT28SD X16, X24, K2, X31                       // 6222bd02cdf8
+       VRSQRT28SD X12, X24, K2, X31                       // 6242bd02cdfc
+       VRSQRT28SD X20, X7, K2, X31                        // 6222c50acdfc
+       VRSQRT28SD X16, X7, K2, X31                        // 6222c50acdf8
+       VRSQRT28SD X12, X7, K2, X31                        // 6242c50acdfc
+       VRSQRT28SD X20, X20, K2, X3                        // 62b2dd02cddc
+       VRSQRT28SD X16, X20, K2, X3                        // 62b2dd02cdd8
+       VRSQRT28SD X12, X20, K2, X3                        // 62d2dd02cddc
+       VRSQRT28SD X20, X24, K2, X3                        // 62b2bd02cddc
+       VRSQRT28SD X16, X24, K2, X3                        // 62b2bd02cdd8
+       VRSQRT28SD X12, X24, K2, X3                        // 62d2bd02cddc
+       VRSQRT28SD X20, X7, K2, X3                         // 62b2c50acddc
+       VRSQRT28SD X16, X7, K2, X3                         // 62b2c50acdd8
+       VRSQRT28SD X12, X7, K2, X3                         // 62d2c50acddc
+       VRSQRT28SD X20, X20, K2, X28                       // 6222dd02cde4
+       VRSQRT28SD X16, X20, K2, X28                       // 6222dd02cde0
+       VRSQRT28SD X12, X20, K2, X28                       // 6242dd02cde4
+       VRSQRT28SD X20, X24, K2, X28                       // 6222bd02cde4
+       VRSQRT28SD X16, X24, K2, X28                       // 6222bd02cde0
+       VRSQRT28SD X12, X24, K2, X28                       // 6242bd02cde4
+       VRSQRT28SD X20, X7, K2, X28                        // 6222c50acde4
+       VRSQRT28SD X16, X7, K2, X28                        // 6222c50acde0
+       VRSQRT28SD X12, X7, K2, X28                        // 6242c50acde4
+       VRSQRT28SD X8, X6, K1, X6                          // 62d2cd09cdf0 or 62d2cd29cdf0 or 62d2cd49cdf0
+       VRSQRT28SD X6, X6, K1, X6                          // 62f2cd09cdf6 or 62f2cd29cdf6 or 62f2cd49cdf6
+       VRSQRT28SD X0, X6, K1, X6                          // 62f2cd09cdf0 or 62f2cd29cdf0 or 62f2cd49cdf0
+       VRSQRT28SD 99(R15)(R15*1), X6, K1, X6              // 6292cd09cdb43f63000000 or 6292cd29cdb43f63000000 or 6292cd49cdb43f63000000
+       VRSQRT28SD (DX), X6, K1, X6                        // 62f2cd09cd32 or 62f2cd29cd32 or 62f2cd49cd32
+       VRSQRT28SD X8, X1, K1, X6                          // 62d2f509cdf0 or 62d2f529cdf0 or 62d2f549cdf0
+       VRSQRT28SD X6, X1, K1, X6                          // 62f2f509cdf6 or 62f2f529cdf6 or 62f2f549cdf6
+       VRSQRT28SD X0, X1, K1, X6                          // 62f2f509cdf0 or 62f2f529cdf0 or 62f2f549cdf0
+       VRSQRT28SD 99(R15)(R15*1), X1, K1, X6              // 6292f509cdb43f63000000 or 6292f529cdb43f63000000 or 6292f549cdb43f63000000
+       VRSQRT28SD (DX), X1, K1, X6                        // 62f2f509cd32 or 62f2f529cd32 or 62f2f549cd32
+       VRSQRT28SD X8, X8, K1, X6                          // 62d2bd09cdf0 or 62d2bd29cdf0 or 62d2bd49cdf0
+       VRSQRT28SD X6, X8, K1, X6                          // 62f2bd09cdf6 or 62f2bd29cdf6 or 62f2bd49cdf6
+       VRSQRT28SD X0, X8, K1, X6                          // 62f2bd09cdf0 or 62f2bd29cdf0 or 62f2bd49cdf0
+       VRSQRT28SD 99(R15)(R15*1), X8, K1, X6              // 6292bd09cdb43f63000000 or 6292bd29cdb43f63000000 or 6292bd49cdb43f63000000
+       VRSQRT28SD (DX), X8, K1, X6                        // 62f2bd09cd32 or 62f2bd29cd32 or 62f2bd49cd32
+       VRSQRT28SD X8, X6, K1, X17                         // 62c2cd09cdc8 or 62c2cd29cdc8 or 62c2cd49cdc8
+       VRSQRT28SD X6, X6, K1, X17                         // 62e2cd09cdce or 62e2cd29cdce or 62e2cd49cdce
+       VRSQRT28SD X0, X6, K1, X17                         // 62e2cd09cdc8 or 62e2cd29cdc8 or 62e2cd49cdc8
+       VRSQRT28SD 99(R15)(R15*1), X6, K1, X17             // 6282cd09cd8c3f63000000 or 6282cd29cd8c3f63000000 or 6282cd49cd8c3f63000000
+       VRSQRT28SD (DX), X6, K1, X17                       // 62e2cd09cd0a or 62e2cd29cd0a or 62e2cd49cd0a
+       VRSQRT28SD X8, X1, K1, X17                         // 62c2f509cdc8 or 62c2f529cdc8 or 62c2f549cdc8
+       VRSQRT28SD X6, X1, K1, X17                         // 62e2f509cdce or 62e2f529cdce or 62e2f549cdce
+       VRSQRT28SD X0, X1, K1, X17                         // 62e2f509cdc8 or 62e2f529cdc8 or 62e2f549cdc8
+       VRSQRT28SD 99(R15)(R15*1), X1, K1, X17             // 6282f509cd8c3f63000000 or 6282f529cd8c3f63000000 or 6282f549cd8c3f63000000
+       VRSQRT28SD (DX), X1, K1, X17                       // 62e2f509cd0a or 62e2f529cd0a or 62e2f549cd0a
+       VRSQRT28SD X8, X8, K1, X17                         // 62c2bd09cdc8 or 62c2bd29cdc8 or 62c2bd49cdc8
+       VRSQRT28SD X6, X8, K1, X17                         // 62e2bd09cdce or 62e2bd29cdce or 62e2bd49cdce
+       VRSQRT28SD X0, X8, K1, X17                         // 62e2bd09cdc8 or 62e2bd29cdc8 or 62e2bd49cdc8
+       VRSQRT28SD 99(R15)(R15*1), X8, K1, X17             // 6282bd09cd8c3f63000000 or 6282bd29cd8c3f63000000 or 6282bd49cd8c3f63000000
+       VRSQRT28SD (DX), X8, K1, X17                       // 62e2bd09cd0a or 62e2bd29cd0a or 62e2bd49cd0a
+       VRSQRT28SD X8, X6, K1, X28                         // 6242cd09cde0 or 6242cd29cde0 or 6242cd49cde0
+       VRSQRT28SD X6, X6, K1, X28                         // 6262cd09cde6 or 6262cd29cde6 or 6262cd49cde6
+       VRSQRT28SD X0, X6, K1, X28                         // 6262cd09cde0 or 6262cd29cde0 or 6262cd49cde0
+       VRSQRT28SD 99(R15)(R15*1), X6, K1, X28             // 6202cd09cda43f63000000 or 6202cd29cda43f63000000 or 6202cd49cda43f63000000
+       VRSQRT28SD (DX), X6, K1, X28                       // 6262cd09cd22 or 6262cd29cd22 or 6262cd49cd22
+       VRSQRT28SD X8, X1, K1, X28                         // 6242f509cde0 or 6242f529cde0 or 6242f549cde0
+       VRSQRT28SD X6, X1, K1, X28                         // 6262f509cde6 or 6262f529cde6 or 6262f549cde6
+       VRSQRT28SD X0, X1, K1, X28                         // 6262f509cde0 or 6262f529cde0 or 6262f549cde0
+       VRSQRT28SD 99(R15)(R15*1), X1, K1, X28             // 6202f509cda43f63000000 or 6202f529cda43f63000000 or 6202f549cda43f63000000
+       VRSQRT28SD (DX), X1, K1, X28                       // 6262f509cd22 or 6262f529cd22 or 6262f549cd22
+       VRSQRT28SD X8, X8, K1, X28                         // 6242bd09cde0 or 6242bd29cde0 or 6242bd49cde0
+       VRSQRT28SD X6, X8, K1, X28                         // 6262bd09cde6 or 6262bd29cde6 or 6262bd49cde6
+       VRSQRT28SD X0, X8, K1, X28                         // 6262bd09cde0 or 6262bd29cde0 or 6262bd49cde0
+       VRSQRT28SD 99(R15)(R15*1), X8, K1, X28             // 6202bd09cda43f63000000 or 6202bd29cda43f63000000 or 6202bd49cda43f63000000
+       VRSQRT28SD (DX), X8, K1, X28                       // 6262bd09cd22 or 6262bd29cd22 or 6262bd49cd22
+       VRSQRT28SS X16, X6, K7, X11                        // 62324d0fcdd8
+       VRSQRT28SS X28, X6, K7, X11                        // 62124d0fcddc
+       VRSQRT28SS X8, X6, K7, X11                         // 62524d0fcdd8
+       VRSQRT28SS X16, X22, K7, X11                       // 62324d07cdd8
+       VRSQRT28SS X28, X22, K7, X11                       // 62124d07cddc
+       VRSQRT28SS X8, X22, K7, X11                        // 62524d07cdd8
+       VRSQRT28SS X16, X12, K7, X11                       // 62321d0fcdd8
+       VRSQRT28SS X28, X12, K7, X11                       // 62121d0fcddc
+       VRSQRT28SS X8, X12, K7, X11                        // 62521d0fcdd8
+       VRSQRT28SS X16, X6, K7, X16                        // 62a24d0fcdc0
+       VRSQRT28SS X28, X6, K7, X16                        // 62824d0fcdc4
+       VRSQRT28SS X8, X6, K7, X16                         // 62c24d0fcdc0
+       VRSQRT28SS X16, X22, K7, X16                       // 62a24d07cdc0
+       VRSQRT28SS X28, X22, K7, X16                       // 62824d07cdc4
+       VRSQRT28SS X8, X22, K7, X16                        // 62c24d07cdc0
+       VRSQRT28SS X16, X12, K7, X16                       // 62a21d0fcdc0
+       VRSQRT28SS X28, X12, K7, X16                       // 62821d0fcdc4
+       VRSQRT28SS X8, X12, K7, X16                        // 62c21d0fcdc0
+       VRSQRT28SS X16, X6, K7, X6                         // 62b24d0fcdf0
+       VRSQRT28SS X28, X6, K7, X6                         // 62924d0fcdf4
+       VRSQRT28SS X8, X6, K7, X6                          // 62d24d0fcdf0
+       VRSQRT28SS X16, X22, K7, X6                        // 62b24d07cdf0
+       VRSQRT28SS X28, X22, K7, X6                        // 62924d07cdf4
+       VRSQRT28SS X8, X22, K7, X6                         // 62d24d07cdf0
+       VRSQRT28SS X16, X12, K7, X6                        // 62b21d0fcdf0
+       VRSQRT28SS X28, X12, K7, X6                        // 62921d0fcdf4
+       VRSQRT28SS X8, X12, K7, X6                         // 62d21d0fcdf0
+       VRSQRT28SS X14, X19, K1, X15                       // 62526501cdfe or 62526521cdfe or 62526541cdfe
+       VRSQRT28SS X0, X19, K1, X15                        // 62726501cdf8 or 62726521cdf8 or 62726541cdf8
+       VRSQRT28SS 15(R8)(R14*4), X19, K1, X15             // 62126501cdbcb00f000000 or 62126521cdbcb00f000000 or 62126541cdbcb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X19, K1, X15              // 62726501cdbc91f9ffffff or 62726521cdbc91f9ffffff or 62726541cdbc91f9ffffff
+       VRSQRT28SS X14, X13, K1, X15                       // 62521509cdfe or 62521529cdfe or 62521549cdfe
+       VRSQRT28SS X0, X13, K1, X15                        // 62721509cdf8 or 62721529cdf8 or 62721549cdf8
+       VRSQRT28SS 15(R8)(R14*4), X13, K1, X15             // 62121509cdbcb00f000000 or 62121529cdbcb00f000000 or 62121549cdbcb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X13, K1, X15              // 62721509cdbc91f9ffffff or 62721529cdbc91f9ffffff or 62721549cdbc91f9ffffff
+       VRSQRT28SS X14, X2, K1, X15                        // 62526d09cdfe or 62526d29cdfe or 62526d49cdfe
+       VRSQRT28SS X0, X2, K1, X15                         // 62726d09cdf8 or 62726d29cdf8 or 62726d49cdf8
+       VRSQRT28SS 15(R8)(R14*4), X2, K1, X15              // 62126d09cdbcb00f000000 or 62126d29cdbcb00f000000 or 62126d49cdbcb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X2, K1, X15               // 62726d09cdbc91f9ffffff or 62726d29cdbc91f9ffffff or 62726d49cdbc91f9ffffff
+       VRSQRT28SS X14, X19, K1, X11                       // 62526501cdde or 62526521cdde or 62526541cdde
+       VRSQRT28SS X0, X19, K1, X11                        // 62726501cdd8 or 62726521cdd8 or 62726541cdd8
+       VRSQRT28SS 15(R8)(R14*4), X19, K1, X11             // 62126501cd9cb00f000000 or 62126521cd9cb00f000000 or 62126541cd9cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X19, K1, X11              // 62726501cd9c91f9ffffff or 62726521cd9c91f9ffffff or 62726541cd9c91f9ffffff
+       VRSQRT28SS X14, X13, K1, X11                       // 62521509cdde or 62521529cdde or 62521549cdde
+       VRSQRT28SS X0, X13, K1, X11                        // 62721509cdd8 or 62721529cdd8 or 62721549cdd8
+       VRSQRT28SS 15(R8)(R14*4), X13, K1, X11             // 62121509cd9cb00f000000 or 62121529cd9cb00f000000 or 62121549cd9cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X13, K1, X11              // 62721509cd9c91f9ffffff or 62721529cd9c91f9ffffff or 62721549cd9c91f9ffffff
+       VRSQRT28SS X14, X2, K1, X11                        // 62526d09cdde or 62526d29cdde or 62526d49cdde
+       VRSQRT28SS X0, X2, K1, X11                         // 62726d09cdd8 or 62726d29cdd8 or 62726d49cdd8
+       VRSQRT28SS 15(R8)(R14*4), X2, K1, X11              // 62126d09cd9cb00f000000 or 62126d29cd9cb00f000000 or 62126d49cd9cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X2, K1, X11               // 62726d09cd9c91f9ffffff or 62726d29cd9c91f9ffffff or 62726d49cd9c91f9ffffff
+       VRSQRT28SS X14, X19, K1, X1                        // 62d26501cdce or 62d26521cdce or 62d26541cdce
+       VRSQRT28SS X0, X19, K1, X1                         // 62f26501cdc8 or 62f26521cdc8 or 62f26541cdc8
+       VRSQRT28SS 15(R8)(R14*4), X19, K1, X1              // 62926501cd8cb00f000000 or 62926521cd8cb00f000000 or 62926541cd8cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X19, K1, X1               // 62f26501cd8c91f9ffffff or 62f26521cd8c91f9ffffff or 62f26541cd8c91f9ffffff
+       VRSQRT28SS X14, X13, K1, X1                        // 62d21509cdce or 62d21529cdce or 62d21549cdce
+       VRSQRT28SS X0, X13, K1, X1                         // 62f21509cdc8 or 62f21529cdc8 or 62f21549cdc8
+       VRSQRT28SS 15(R8)(R14*4), X13, K1, X1              // 62921509cd8cb00f000000 or 62921529cd8cb00f000000 or 62921549cd8cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X13, K1, X1               // 62f21509cd8c91f9ffffff or 62f21529cd8c91f9ffffff or 62f21549cd8c91f9ffffff
+       VRSQRT28SS X14, X2, K1, X1                         // 62d26d09cdce or 62d26d29cdce or 62d26d49cdce
+       VRSQRT28SS X0, X2, K1, X1                          // 62f26d09cdc8 or 62f26d29cdc8 or 62f26d49cdc8
+       VRSQRT28SS 15(R8)(R14*4), X2, K1, X1               // 62926d09cd8cb00f000000 or 62926d29cd8cb00f000000 or 62926d49cd8cb00f000000
+       VRSQRT28SS -7(CX)(DX*4), X2, K1, X1                // 62f26d09cd8c91f9ffffff or 62f26d29cd8c91f9ffffff or 62f26d49cd8c91f9ffffff
        RET
index 3aa88982dae2a2cc64bf449c5c492cfdf5b14d10..71b5764c5b79c8ba9370d23aa1935c0128d53705 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512f(SB), NOSPLIT, $0
-       //TODO: KANDNW K4, K4, K6                                  // c5dc42f4
-       //TODO: KANDNW K5, K4, K6                                  // c5dc42f5
-       //TODO: KANDNW K4, K6, K6                                  // c5cc42f4
-       //TODO: KANDNW K5, K6, K6                                  // c5cc42f5
-       //TODO: KANDNW K4, K4, K4                                  // c5dc42e4
-       //TODO: KANDNW K5, K4, K4                                  // c5dc42e5
-       //TODO: KANDNW K4, K6, K4                                  // c5cc42e4
-       //TODO: KANDNW K5, K6, K4                                  // c5cc42e5
-       //TODO: KANDW K5, K3, K1                                   // c5e441cd
-       //TODO: KANDW K4, K3, K1                                   // c5e441cc
-       //TODO: KANDW K5, K1, K1                                   // c5f441cd
-       //TODO: KANDW K4, K1, K1                                   // c5f441cc
-       //TODO: KANDW K5, K3, K5                                   // c5e441ed
-       //TODO: KANDW K4, K3, K5                                   // c5e441ec
-       //TODO: KANDW K5, K1, K5                                   // c5f441ed
-       //TODO: KANDW K4, K1, K5                                   // c5f441ec
-       //TODO: KMOVW K5, 17(SP)                                   // c5f8916c2411
-       //TODO: KMOVW K4, 17(SP)                                   // c5f891642411
-       //TODO: KMOVW K5, -17(BP)(SI*4)                            // c5f8916cb5ef
-       //TODO: KMOVW K4, -17(BP)(SI*4)                            // c5f89164b5ef
-       //TODO: KMOVW K7, SP                                       // c5f893e7
-       //TODO: KMOVW K6, SP                                       // c5f893e6
-       //TODO: KMOVW K7, R14                                      // c57893f7
-       //TODO: KMOVW K6, R14                                      // c57893f6
-       //TODO: KMOVW K0, K4                                       // c5f890e0
-       //TODO: KMOVW K7, K4                                       // c5f890e7
-       //TODO: KMOVW 7(AX), K4                                    // c5f8906007
-       //TODO: KMOVW (DI), K4                                     // c5f89027
-       //TODO: KMOVW K0, K6                                       // c5f890f0
-       //TODO: KMOVW K7, K6                                       // c5f890f7
-       //TODO: KMOVW 7(AX), K6                                    // c5f8907007
-       //TODO: KMOVW (DI), K6                                     // c5f89037
-       //TODO: KMOVW AX, K5                                       // c5f892e8
-       //TODO: KMOVW R9, K5                                       // c4c17892e9
-       //TODO: KMOVW AX, K4                                       // c5f892e0
-       //TODO: KMOVW R9, K4                                       // c4c17892e1
-       //TODO: KNOTW K0, K2                                       // c5f844d0
-       //TODO: KNOTW K5, K2                                       // c5f844d5
-       //TODO: KNOTW K0, K7                                       // c5f844f8
-       //TODO: KNOTW K5, K7                                       // c5f844fd
-       //TODO: KORTESTW K6, K0                                    // c5f898c6
-       //TODO: KORTESTW K5, K0                                    // c5f898c5
-       //TODO: KORTESTW K6, K5                                    // c5f898ee
-       //TODO: KORTESTW K5, K5                                    // c5f898ed
-       //TODO: KORW K5, K3, K1                                    // c5e445cd
-       //TODO: KORW K4, K3, K1                                    // c5e445cc
-       //TODO: KORW K5, K1, K1                                    // c5f445cd
-       //TODO: KORW K4, K1, K1                                    // c5f445cc
-       //TODO: KORW K5, K3, K5                                    // c5e445ed
-       //TODO: KORW K4, K3, K5                                    // c5e445ec
-       //TODO: KORW K5, K1, K5                                    // c5f445ed
-       //TODO: KORW K4, K1, K5                                    // c5f445ec
-       //TODO: KSHIFTLW $81, K6, K6                               // c4e3f932f651
-       //TODO: KSHIFTLW $81, K4, K6                               // c4e3f932f451
-       //TODO: KSHIFTLW $81, K6, K7                               // c4e3f932fe51
-       //TODO: KSHIFTLW $81, K4, K7                               // c4e3f932fc51
-       //TODO: KSHIFTRW $27, K5, K3                               // c4e3f930dd1b
-       //TODO: KSHIFTRW $27, K4, K3                               // c4e3f930dc1b
-       //TODO: KSHIFTRW $27, K5, K1                               // c4e3f930cd1b
-       //TODO: KSHIFTRW $27, K4, K1                               // c4e3f930cc1b
-       //TODO: KUNPCKBW K2, K4, K4                                // c5dd4be2
-       //TODO: KUNPCKBW K7, K4, K4                                // c5dd4be7
-       //TODO: KUNPCKBW K2, K5, K4                                // c5d54be2
-       //TODO: KUNPCKBW K7, K5, K4                                // c5d54be7
-       //TODO: KUNPCKBW K2, K4, K6                                // c5dd4bf2
-       //TODO: KUNPCKBW K7, K4, K6                                // c5dd4bf7
-       //TODO: KUNPCKBW K2, K5, K6                                // c5d54bf2
-       //TODO: KUNPCKBW K7, K5, K6                                // c5d54bf7
-       //TODO: KXNORW K6, K0, K2                                  // c5fc46d6
-       //TODO: KXNORW K5, K0, K2                                  // c5fc46d5
-       //TODO: KXNORW K6, K5, K2                                  // c5d446d6
-       //TODO: KXNORW K5, K5, K2                                  // c5d446d5
-       //TODO: KXNORW K6, K0, K7                                  // c5fc46fe
-       //TODO: KXNORW K5, K0, K7                                  // c5fc46fd
-       //TODO: KXNORW K6, K5, K7                                  // c5d446fe
-       //TODO: KXNORW K5, K5, K7                                  // c5d446fd
-       //TODO: KXORW K4, K6, K6                                   // c5cc47f4
-       //TODO: KXORW K6, K6, K6                                   // c5cc47f6
-       //TODO: KXORW K4, K4, K6                                   // c5dc47f4
-       //TODO: KXORW K6, K4, K6                                   // c5dc47f6
-       //TODO: KXORW K4, K6, K7                                   // c5cc47fc
-       //TODO: KXORW K6, K6, K7                                   // c5cc47fe
-       //TODO: KXORW K4, K4, K7                                   // c5dc47fc
-       //TODO: KXORW K6, K4, K7                                   // c5dc47fe
-       //TODO: VADDPD X15, X11, K2, X3                            // 62d1a50a58df
-       //TODO: VADDPD 7(SI)(DI*8), X11, K2, X3                    // 62f1a50a589cfe07000000
-       //TODO: VADDPD -15(R14), X11, K2, X3                       // 62d1a50a589ef1ffffff
-       //TODO: VADDPD Y25, Y31, K2, Y14                           // 6211852258f1
-       //TODO: VADDPD 17(SP), Y31, K2, Y14                        // 6271852258b42411000000
-       //TODO: VADDPD -17(BP)(SI*4), Y31, K2, Y14                 // 6271852258b4b5efffffff
-       //TODO: VADDPD Z13, Z11, K3, Z14                           // 6251a54b58f5
-       //TODO: VADDPD Z14, Z11, K3, Z14                           // 6251a54b58f6
-       //TODO: VADDPD Z13, Z5, K3, Z14                            // 6251d54b58f5
-       //TODO: VADDPD Z14, Z5, K3, Z14                            // 6251d54b58f6
-       //TODO: VADDPD Z13, Z11, K3, Z27                           // 6241a54b58dd
-       //TODO: VADDPD Z14, Z11, K3, Z27                           // 6241a54b58de
-       //TODO: VADDPD Z13, Z5, K3, Z27                            // 6241d54b58dd
-       //TODO: VADDPD Z14, Z5, K3, Z27                            // 6241d54b58de
-       //TODO: VADDPD Z6, Z2, K3, Z5                              // 62f1ed4b58ee
-       //TODO: VADDPD Z14, Z2, K3, Z5                             // 62d1ed4b58ee
-       //TODO: VADDPD 17(SP), Z2, K3, Z5                          // 62f1ed4b58ac2411000000
-       //TODO: VADDPD -17(BP)(SI*4), Z2, K3, Z5                   // 62f1ed4b58acb5efffffff
-       //TODO: VADDPD Z6, Z2, K3, Z23                             // 62e1ed4b58fe
-       //TODO: VADDPD Z14, Z2, K3, Z23                            // 62c1ed4b58fe
-       //TODO: VADDPD 17(SP), Z2, K3, Z23                         // 62e1ed4b58bc2411000000
-       //TODO: VADDPD -17(BP)(SI*4), Z2, K3, Z23                  // 62e1ed4b58bcb5efffffff
-       //TODO: VADDPS X6, X13, K3, X30                            // 6261140b58f6
-       //TODO: VADDPS 7(SI)(DI*1), X13, K3, X30                   // 6261140b58b43e07000000
-       //TODO: VADDPS 15(DX)(BX*8), X13, K3, X30                  // 6261140b58b4da0f000000
-       //TODO: VADDPS Y27, Y22, K2, Y2                            // 62914c2258d3
-       //TODO: VADDPS 7(AX), Y22, K2, Y2                          // 62f14c22589007000000
-       //TODO: VADDPS (DI), Y22, K2, Y2                           // 62f14c225817
-       //TODO: VADDPS Z13, Z28, K1, Z26                           // 62411c4158d5
-       //TODO: VADDPS Z21, Z28, K1, Z26                           // 62211c4158d5
-       //TODO: VADDPS Z13, Z6, K1, Z26                            // 62414c4958d5
-       //TODO: VADDPS Z21, Z6, K1, Z26                            // 62214c4958d5
-       //TODO: VADDPS Z13, Z28, K1, Z14                           // 62511c4158f5
-       //TODO: VADDPS Z21, Z28, K1, Z14                           // 62311c4158f5
-       //TODO: VADDPS Z13, Z6, K1, Z14                            // 62514c4958f5
-       //TODO: VADDPS Z21, Z6, K1, Z14                            // 62314c4958f5
-       //TODO: VADDPS Z21, Z3, K2, Z26                            // 6221644a58d5
-       //TODO: VADDPS Z13, Z3, K2, Z26                            // 6241644a58d5
-       //TODO: VADDPS 7(AX), Z3, K2, Z26                          // 6261644a589007000000
-       //TODO: VADDPS (DI), Z3, K2, Z26                           // 6261644a5817
-       //TODO: VADDPS Z21, Z0, K2, Z26                            // 62217c4a58d5
-       //TODO: VADDPS Z13, Z0, K2, Z26                            // 62417c4a58d5
-       //TODO: VADDPS 7(AX), Z0, K2, Z26                          // 62617c4a589007000000
-       //TODO: VADDPS (DI), Z0, K2, Z26                           // 62617c4a5817
-       //TODO: VADDPS Z21, Z3, K2, Z3                             // 62b1644a58dd
-       //TODO: VADDPS Z13, Z3, K2, Z3                             // 62d1644a58dd
-       //TODO: VADDPS 7(AX), Z3, K2, Z3                           // 62f1644a589807000000
-       //TODO: VADDPS (DI), Z3, K2, Z3                            // 62f1644a581f
-       //TODO: VADDPS Z21, Z0, K2, Z3                             // 62b17c4a58dd
-       //TODO: VADDPS Z13, Z0, K2, Z3                             // 62d17c4a58dd
-       //TODO: VADDPS 7(AX), Z0, K2, Z3                           // 62f17c4a589807000000
-       //TODO: VADDPS (DI), Z0, K2, Z3                            // 62f17c4a581f
-       //TODO: VADDSD X30, X23, K1, X12                           // 6211c70158e6
-       //TODO: VADDSD X2, X20, K7, X8                             // 6271df0758c2 or 6271df2758c2 or 6271df4758c2
-       //TODO: VADDSD 99(R15)(R15*1), X20, K7, X8                 // 6211df0758843f63000000 or 6211df2758843f63000000 or 6211df4758843f63000000
-       //TODO: VADDSD (DX), X20, K7, X8                           // 6271df075802 or 6271df275802 or 6271df475802
-       //TODO: VADDSS X19, X26, K1, X9                            // 62312e0158cb
-       //TODO: VADDSS X16, X31, K1, X0                            // 62b1060158c0 or 62b1062158c0 or 62b1064158c0
-       //TODO: VADDSS 99(R15)(R15*1), X31, K1, X0                 // 6291060158843f63000000 or 6291062158843f63000000 or 6291064158843f63000000
-       //TODO: VADDSS (DX), X31, K1, X0                           // 62f106015802 or 62f106215802 or 62f106415802
-       //TODO: VALIGND $47, X16, X7, K1, X19                      // 62a3450903d82f
-       //TODO: VALIGND $47, (BX), X7, K1, X19                     // 62e34509031b2f
-       //TODO: VALIGND $47, -17(BP)(SI*1), X7, K1, X19            // 62e34509039c35efffffff2f
-       //TODO: VALIGND $82, Y23, Y9, K7, Y22                      // 62a3352f03f752
-       //TODO: VALIGND $82, -7(DI)(R8*1), Y9, K7, Y22             // 62a3352f03b407f9ffffff52
-       //TODO: VALIGND $82, (SP), Y9, K7, Y22                     // 62e3352f03342452
-       //TODO: VALIGND $126, Z6, Z9, K2, Z12                      // 6273354a03e67e
-       //TODO: VALIGND $126, Z25, Z9, K2, Z12                     // 6213354a03e17e
-       //TODO: VALIGND $126, -7(DI)(R8*1), Z9, K2, Z12            // 6233354a03a407f9ffffff7e
-       //TODO: VALIGND $126, (SP), Z9, K2, Z12                    // 6273354a0324247e
-       //TODO: VALIGND $126, Z6, Z12, K2, Z12                     // 62731d4a03e67e
-       //TODO: VALIGND $126, Z25, Z12, K2, Z12                    // 62131d4a03e17e
-       //TODO: VALIGND $126, -7(DI)(R8*1), Z12, K2, Z12           // 62331d4a03a407f9ffffff7e
-       //TODO: VALIGND $126, (SP), Z12, K2, Z12                   // 62731d4a0324247e
-       //TODO: VALIGND $126, Z6, Z9, K2, Z17                      // 62e3354a03ce7e
-       //TODO: VALIGND $126, Z25, Z9, K2, Z17                     // 6283354a03c97e
-       //TODO: VALIGND $126, -7(DI)(R8*1), Z9, K2, Z17            // 62a3354a038c07f9ffffff7e
-       //TODO: VALIGND $126, (SP), Z9, K2, Z17                    // 62e3354a030c247e
-       //TODO: VALIGND $126, Z6, Z12, K2, Z17                     // 62e31d4a03ce7e
-       //TODO: VALIGND $126, Z25, Z12, K2, Z17                    // 62831d4a03c97e
-       //TODO: VALIGND $126, -7(DI)(R8*1), Z12, K2, Z17           // 62a31d4a038c07f9ffffff7e
-       //TODO: VALIGND $126, (SP), Z12, K2, Z17                   // 62e31d4a030c247e
-       //TODO: VALIGNQ $94, X7, X1, K4, X31                       // 6263f50c03ff5e
-       //TODO: VALIGNQ $94, 15(R8)(R14*4), X1, K4, X31            // 6203f50c03bcb00f0000005e
-       //TODO: VALIGNQ $94, -7(CX)(DX*4), X1, K4, X31             // 6263f50c03bc91f9ffffff5e
-       //TODO: VALIGNQ $121, Y0, Y5, K1, Y31                      // 6263d52903f879
-       //TODO: VALIGNQ $121, -7(CX), Y5, K1, Y31                  // 6263d52903b9f9ffffff79
-       //TODO: VALIGNQ $121, 15(DX)(BX*4), Y5, K1, Y31            // 6263d52903bc9a0f00000079
-       //TODO: VALIGNQ $13, Z3, Z8, K3, Z3                        // 62f3bd4b03db0d
-       //TODO: VALIGNQ $13, Z27, Z8, K3, Z3                       // 6293bd4b03db0d
-       //TODO: VALIGNQ $13, -7(CX), Z8, K3, Z3                    // 62f3bd4b0399f9ffffff0d
-       //TODO: VALIGNQ $13, 15(DX)(BX*4), Z8, K3, Z3              // 62f3bd4b039c9a0f0000000d
-       //TODO: VALIGNQ $13, Z3, Z2, K3, Z3                        // 62f3ed4b03db0d
-       //TODO: VALIGNQ $13, Z27, Z2, K3, Z3                       // 6293ed4b03db0d
-       //TODO: VALIGNQ $13, -7(CX), Z2, K3, Z3                    // 62f3ed4b0399f9ffffff0d
-       //TODO: VALIGNQ $13, 15(DX)(BX*4), Z2, K3, Z3              // 62f3ed4b039c9a0f0000000d
-       //TODO: VALIGNQ $13, Z3, Z8, K3, Z21                       // 62e3bd4b03eb0d
-       //TODO: VALIGNQ $13, Z27, Z8, K3, Z21                      // 6283bd4b03eb0d
-       //TODO: VALIGNQ $13, -7(CX), Z8, K3, Z21                   // 62e3bd4b03a9f9ffffff0d
-       //TODO: VALIGNQ $13, 15(DX)(BX*4), Z8, K3, Z21             // 62e3bd4b03ac9a0f0000000d
-       //TODO: VALIGNQ $13, Z3, Z2, K3, Z21                       // 62e3ed4b03eb0d
-       //TODO: VALIGNQ $13, Z27, Z2, K3, Z21                      // 6283ed4b03eb0d
-       //TODO: VALIGNQ $13, -7(CX), Z2, K3, Z21                   // 62e3ed4b03a9f9ffffff0d
-       //TODO: VALIGNQ $13, 15(DX)(BX*4), Z2, K3, Z21             // 62e3ed4b03ac9a0f0000000d
-       //TODO: VBLENDMPD X28, X13, K3, X23                        // 6282950b65fc
-       //TODO: VBLENDMPD (R14), X13, K3, X23                      // 62c2950b653e
-       //TODO: VBLENDMPD -7(DI)(R8*8), X13, K3, X23               // 62a2950b65bcc7f9ffffff
-       //TODO: VBLENDMPD Y27, Y13, K4, Y2                         // 6292952c65d3
-       //TODO: VBLENDMPD (R8), Y13, K4, Y2                        // 62d2952c6510
-       //TODO: VBLENDMPD 15(DX)(BX*2), Y13, K4, Y2                // 62f2952c65945a0f000000
-       //TODO: VBLENDMPD Z18, Z13, K2, Z1                         // 62b2954a65ca
-       //TODO: VBLENDMPD Z8, Z13, K2, Z1                          // 62d2954a65c8
-       //TODO: VBLENDMPD (R8), Z13, K2, Z1                        // 62d2954a6508
-       //TODO: VBLENDMPD 15(DX)(BX*2), Z13, K2, Z1                // 62f2954a658c5a0f000000
-       //TODO: VBLENDMPD Z18, Z13, K2, Z15                        // 6232954a65fa
-       //TODO: VBLENDMPD Z8, Z13, K2, Z15                         // 6252954a65f8
-       //TODO: VBLENDMPD (R8), Z13, K2, Z15                       // 6252954a6538
-       //TODO: VBLENDMPD 15(DX)(BX*2), Z13, K2, Z15               // 6272954a65bc5a0f000000
-       //TODO: VBLENDMPS X15, X9, K2, X24                         // 6242350a65c7
-       //TODO: VBLENDMPS 99(R15)(R15*4), X9, K2, X24              // 6202350a6584bf63000000
-       //TODO: VBLENDMPS 15(DX), X9, K2, X24                      // 6262350a65820f000000
-       //TODO: VBLENDMPS Y20, Y22, K3, Y15                        // 62324d2365fc
-       //TODO: VBLENDMPS 17(SP)(BP*1), Y22, K3, Y15               // 62724d2365bc2c11000000
-       //TODO: VBLENDMPS -7(CX)(DX*8), Y22, K3, Y15               // 62724d2365bcd1f9ffffff
-       //TODO: VBLENDMPS Z20, Z2, K3, Z22                         // 62a26d4b65f4
-       //TODO: VBLENDMPS Z9, Z2, K3, Z22                          // 62c26d4b65f1
-       //TODO: VBLENDMPS 17(SP)(BP*1), Z2, K3, Z22                // 62e26d4b65b42c11000000
-       //TODO: VBLENDMPS -7(CX)(DX*8), Z2, K3, Z22                // 62e26d4b65b4d1f9ffffff
-       //TODO: VBLENDMPS Z20, Z31, K3, Z22                        // 62a2054365f4
-       //TODO: VBLENDMPS Z9, Z31, K3, Z22                         // 62c2054365f1
-       //TODO: VBLENDMPS 17(SP)(BP*1), Z31, K3, Z22               // 62e2054365b42c11000000
-       //TODO: VBLENDMPS -7(CX)(DX*8), Z31, K3, Z22               // 62e2054365b4d1f9ffffff
-       //TODO: VBLENDMPS Z20, Z2, K3, Z7                          // 62b26d4b65fc
-       //TODO: VBLENDMPS Z9, Z2, K3, Z7                           // 62d26d4b65f9
-       //TODO: VBLENDMPS 17(SP)(BP*1), Z2, K3, Z7                 // 62f26d4b65bc2c11000000
-       //TODO: VBLENDMPS -7(CX)(DX*8), Z2, K3, Z7                 // 62f26d4b65bcd1f9ffffff
-       //TODO: VBLENDMPS Z20, Z31, K3, Z7                         // 62b2054365fc
-       //TODO: VBLENDMPS Z9, Z31, K3, Z7                          // 62d2054365f9
-       //TODO: VBLENDMPS 17(SP)(BP*1), Z31, K3, Z7                // 62f2054365bc2c11000000
-       //TODO: VBLENDMPS -7(CX)(DX*8), Z31, K3, Z7                // 62f2054365bcd1f9ffffff
-       //TODO: VBROADCASTF32X4 (CX), K1, Y24                      // 62627d291a01
-       //TODO: VBROADCASTF32X4 99(R15), K1, Y24                   // 62427d291a8763000000
-       //TODO: VBROADCASTF32X4 99(R15)(R15*2), K2, Z12            // 62127d4a1aa47f63000000
-       //TODO: VBROADCASTF32X4 -7(DI), K2, Z12                    // 62727d4a1aa7f9ffffff
-       //TODO: VBROADCASTF32X4 99(R15)(R15*2), K2, Z16            // 62827d4a1a847f63000000
-       //TODO: VBROADCASTF32X4 -7(DI), K2, Z16                    // 62e27d4a1a87f9ffffff
-       //TODO: VBROADCASTF64X4 15(R8)(R14*1), K1, Z3              // 6292fd491b9c300f000000
-       //TODO: VBROADCASTF64X4 15(R8)(R14*2), K1, Z3              // 6292fd491b9c700f000000
-       //TODO: VBROADCASTF64X4 15(R8)(R14*1), K1, Z12             // 6212fd491ba4300f000000
-       //TODO: VBROADCASTF64X4 15(R8)(R14*2), K1, Z12             // 6212fd491ba4700f000000
-       //TODO: VBROADCASTI32X4 -17(BP), K4, Y19                   // 62e27d2c5a9defffffff
-       //TODO: VBROADCASTI32X4 -15(R14)(R15*8), K4, Y19           // 62827d2c5a9cfef1ffffff
-       //TODO: VBROADCASTI32X4 17(SP)(BP*2), K1, Z19              // 62e27d495a9c6c11000000
-       //TODO: VBROADCASTI32X4 -7(DI)(R8*4), K1, Z19              // 62a27d495a9c87f9ffffff
-       //TODO: VBROADCASTI32X4 17(SP)(BP*2), K1, Z15              // 62727d495abc6c11000000
-       //TODO: VBROADCASTI32X4 -7(DI)(R8*4), K1, Z15              // 62327d495abc87f9ffffff
-       //TODO: VBROADCASTI64X4 99(R15)(R15*4), K7, Z14            // 6212fd4f5bb4bf63000000
-       //TODO: VBROADCASTI64X4 15(DX), K7, Z14                    // 6272fd4f5bb20f000000
-       //TODO: VBROADCASTI64X4 99(R15)(R15*4), K7, Z15            // 6212fd4f5bbcbf63000000
-       //TODO: VBROADCASTI64X4 15(DX), K7, Z15                    // 6272fd4f5bba0f000000
-       //TODO: VBROADCASTSD X3, K7, Y19                           // 62e2fd2f19db
-       //TODO: VBROADCASTSD 99(R15)(R15*8), K7, Y19               // 6282fd2f199cff63000000
-       //TODO: VBROADCASTSD 7(AX)(CX*8), K7, Y19                  // 62e2fd2f199cc807000000
-       //TODO: VBROADCASTSD X7, K6, Z21                           // 62e2fd4e19ef
-       //TODO: VBROADCASTSD (AX), K6, Z21                         // 62e2fd4e1928
-       //TODO: VBROADCASTSD 7(SI), K6, Z21                        // 62e2fd4e19ae07000000
-       //TODO: VBROADCASTSD X7, K6, Z8                            // 6272fd4e19c7
-       //TODO: VBROADCASTSD (AX), K6, Z8                          // 6272fd4e1900
-       //TODO: VBROADCASTSD 7(SI), K6, Z8                         // 6272fd4e198607000000
-       //TODO: VBROADCASTSS X0, K3, X0                            // 62f27d0b18c0
-       //TODO: VBROADCASTSS -17(BP)(SI*8), K3, X0                 // 62f27d0b1884f5efffffff
-       //TODO: VBROADCASTSS (R15), K3, X0                         // 62d27d0b1807
-       //TODO: VBROADCASTSS X24, K7, Y14                          // 62127d2f18f0
-       //TODO: VBROADCASTSS 7(SI)(DI*8), K7, Y14                  // 62727d2f18b4fe07000000
-       //TODO: VBROADCASTSS -15(R14), K7, Y14                     // 62527d2f18b6f1ffffff
-       //TODO: VBROADCASTSS X20, K4, Z16                          // 62a27d4c18c4
-       //TODO: VBROADCASTSS 7(SI)(DI*1), K4, Z16                  // 62e27d4c18843e07000000
-       //TODO: VBROADCASTSS 15(DX)(BX*8), K4, Z16                 // 62e27d4c1884da0f000000
-       //TODO: VBROADCASTSS X20, K4, Z9                           // 62327d4c18cc
-       //TODO: VBROADCASTSS 7(SI)(DI*1), K4, Z9                   // 62727d4c188c3e07000000
-       //TODO: VBROADCASTSS 15(DX)(BX*8), K4, Z9                  // 62727d4c188cda0f000000
-       //TODO: VCMPPD $65, X9, X7, K4, K4                         // 62d1c50cc2e141
-       //TODO: VCMPPD $65, -15(R14)(R15*1), X7, K4, K4            // 6291c50cc2a43ef1ffffff41
-       //TODO: VCMPPD $65, -15(BX), X7, K4, K4                    // 62f1c50cc2a3f1ffffff41
-       //TODO: VCMPPD $65, X9, X7, K4, K5                         // 62d1c50cc2e941
-       //TODO: VCMPPD $65, -15(R14)(R15*1), X7, K4, K5            // 6291c50cc2ac3ef1ffffff41
-       //TODO: VCMPPD $65, -15(BX), X7, K4, K5                    // 62f1c50cc2abf1ffffff41
-       //TODO: VCMPPD $67, Y5, Y21, K7, K2                        // 62f1d527c2d543
-       //TODO: VCMPPD $67, (CX), Y21, K7, K2                      // 62f1d527c21143
-       //TODO: VCMPPD $67, 99(R15), Y21, K7, K2                   // 62d1d527c2976300000043
-       //TODO: VCMPPD $67, Y5, Y21, K7, K7                        // 62f1d527c2fd43
-       //TODO: VCMPPD $67, (CX), Y21, K7, K7                      // 62f1d527c23943
-       //TODO: VCMPPD $67, 99(R15), Y21, K7, K7                   // 62d1d527c2bf6300000043
-       //TODO: VCMPPD $127, Z23, Z20, K2, K0                      // 62b1dd42c2c77f
-       //TODO: VCMPPD $127, Z19, Z20, K2, K0                      // 62b1dd42c2c37f
-       //TODO: VCMPPD $127, Z23, Z0, K2, K0                       // 62b1fd4ac2c77f
-       //TODO: VCMPPD $127, Z19, Z0, K2, K0                       // 62b1fd4ac2c37f
-       //TODO: VCMPPD $127, Z23, Z20, K2, K5                      // 62b1dd42c2ef7f
-       //TODO: VCMPPD $127, Z19, Z20, K2, K5                      // 62b1dd42c2eb7f
-       //TODO: VCMPPD $127, Z23, Z0, K2, K5                       // 62b1fd4ac2ef7f
-       //TODO: VCMPPD $127, Z19, Z0, K2, K5                       // 62b1fd4ac2eb7f
-       //TODO: VCMPPD $0, Z0, Z0, K5, K6                          // 62f1fd4dc2f000
-       //TODO: VCMPPD $0, Z25, Z0, K5, K6                         // 6291fd4dc2f100
-       //TODO: VCMPPD $0, -17(BP)(SI*2), Z0, K5, K6               // 62f1fd4dc2b475efffffff00
-       //TODO: VCMPPD $0, 7(AX)(CX*2), Z0, K5, K6                 // 62f1fd4dc2b4480700000000
-       //TODO: VCMPPD $0, Z0, Z11, K5, K6                         // 62f1a54dc2f000
-       //TODO: VCMPPD $0, Z25, Z11, K5, K6                        // 6291a54dc2f100
-       //TODO: VCMPPD $0, -17(BP)(SI*2), Z11, K5, K6              // 62f1a54dc2b475efffffff00
-       //TODO: VCMPPD $0, 7(AX)(CX*2), Z11, K5, K6                // 62f1a54dc2b4480700000000
-       //TODO: VCMPPD $0, Z0, Z0, K5, K5                          // 62f1fd4dc2e800
-       //TODO: VCMPPD $0, Z25, Z0, K5, K5                         // 6291fd4dc2e900
-       //TODO: VCMPPD $0, -17(BP)(SI*2), Z0, K5, K5               // 62f1fd4dc2ac75efffffff00
-       //TODO: VCMPPD $0, 7(AX)(CX*2), Z0, K5, K5                 // 62f1fd4dc2ac480700000000
-       //TODO: VCMPPD $0, Z0, Z11, K5, K5                         // 62f1a54dc2e800
-       //TODO: VCMPPD $0, Z25, Z11, K5, K5                        // 6291a54dc2e900
-       //TODO: VCMPPD $0, -17(BP)(SI*2), Z11, K5, K5              // 62f1a54dc2ac75efffffff00
-       //TODO: VCMPPD $0, 7(AX)(CX*2), Z11, K5, K5                // 62f1a54dc2ac480700000000
-       //TODO: VCMPPS $97, X14, X7, K3, K1                        // 62d1440bc2ce61
-       //TODO: VCMPPS $97, 7(AX)(CX*4), X7, K3, K1                // 62f1440bc28c880700000061
-       //TODO: VCMPPS $97, 7(AX)(CX*1), X7, K3, K1                // 62f1440bc28c080700000061
-       //TODO: VCMPPS $97, X14, X7, K3, K5                        // 62d1440bc2ee61
-       //TODO: VCMPPS $97, 7(AX)(CX*4), X7, K3, K5                // 62f1440bc2ac880700000061
-       //TODO: VCMPPS $97, 7(AX)(CX*1), X7, K3, K5                // 62f1440bc2ac080700000061
-       //TODO: VCMPPS $81, Y2, Y16, K4, K3                        // 62f17c24c2da51
-       //TODO: VCMPPS $81, 99(R15)(R15*2), Y16, K4, K3            // 62917c24c29c7f6300000051
-       //TODO: VCMPPS $81, -7(DI), Y16, K4, K3                    // 62f17c24c29ff9ffffff51
-       //TODO: VCMPPS $81, Y2, Y16, K4, K1                        // 62f17c24c2ca51
-       //TODO: VCMPPS $81, 99(R15)(R15*2), Y16, K4, K1            // 62917c24c28c7f6300000051
-       //TODO: VCMPPS $81, -7(DI), Y16, K4, K1                    // 62f17c24c28ff9ffffff51
-       //TODO: VCMPPS $42, Z0, Z24, K2, K5                        // 62f13c42c2e82a
-       //TODO: VCMPPS $42, Z26, Z24, K2, K5                       // 62913c42c2ea2a
-       //TODO: VCMPPS $42, Z0, Z12, K2, K5                        // 62f11c4ac2e82a
-       //TODO: VCMPPS $42, Z26, Z12, K2, K5                       // 62911c4ac2ea2a
-       //TODO: VCMPPS $42, Z0, Z24, K2, K4                        // 62f13c42c2e02a
-       //TODO: VCMPPS $42, Z26, Z24, K2, K4                       // 62913c42c2e22a
-       //TODO: VCMPPS $42, Z0, Z12, K2, K4                        // 62f11c4ac2e02a
-       //TODO: VCMPPS $42, Z26, Z12, K2, K4                       // 62911c4ac2e22a
-       //TODO: VCMPPS $79, Z9, Z9, K2, K7                         // 62d1344ac2f94f
-       //TODO: VCMPPS $79, Z25, Z9, K2, K7                        // 6291344ac2f94f
-       //TODO: VCMPPS $79, 15(R8)(R14*1), Z9, K2, K7              // 6291344ac2bc300f0000004f
-       //TODO: VCMPPS $79, 15(R8)(R14*2), Z9, K2, K7              // 6291344ac2bc700f0000004f
-       //TODO: VCMPPS $79, Z9, Z3, K2, K7                         // 62d1644ac2f94f
-       //TODO: VCMPPS $79, Z25, Z3, K2, K7                        // 6291644ac2f94f
-       //TODO: VCMPPS $79, 15(R8)(R14*1), Z3, K2, K7              // 6291644ac2bc300f0000004f
-       //TODO: VCMPPS $79, 15(R8)(R14*2), Z3, K2, K7              // 6291644ac2bc700f0000004f
-       //TODO: VCMPPS $79, Z9, Z9, K2, K6                         // 62d1344ac2f14f
-       //TODO: VCMPPS $79, Z25, Z9, K2, K6                        // 6291344ac2f14f
-       //TODO: VCMPPS $79, 15(R8)(R14*1), Z9, K2, K6              // 6291344ac2b4300f0000004f
-       //TODO: VCMPPS $79, 15(R8)(R14*2), Z9, K2, K6              // 6291344ac2b4700f0000004f
-       //TODO: VCMPPS $79, Z9, Z3, K2, K6                         // 62d1644ac2f14f
-       //TODO: VCMPPS $79, Z25, Z3, K2, K6                        // 6291644ac2f14f
-       //TODO: VCMPPS $79, 15(R8)(R14*1), Z3, K2, K6              // 6291644ac2b4300f0000004f
-       //TODO: VCMPPS $79, 15(R8)(R14*2), Z3, K2, K6              // 6291644ac2b4700f0000004f
-       //TODO: VCMPSD $64, X31, X5, K3, K4                        // 6291d70bc2e740
-       //TODO: VCMPSD $64, X31, X5, K3, K6                        // 6291d70bc2f740
-       //TODO: VCMPSD $27, X21, X3, K3, K0                        // 62b1e70bc2c51b or 62b1e72bc2c51b or 62b1e74bc2c51b
-       //TODO: VCMPSD $27, (BX), X3, K3, K0                       // 62f1e70bc2031b or 62f1e72bc2031b or 62f1e74bc2031b
-       //TODO: VCMPSD $27, -17(BP)(SI*1), X3, K3, K0              // 62f1e70bc28435efffffff1b or 62f1e72bc28435efffffff1b or 62f1e74bc28435efffffff1b
-       //TODO: VCMPSD $27, X21, X3, K3, K7                        // 62b1e70bc2fd1b or 62b1e72bc2fd1b or 62b1e74bc2fd1b
-       //TODO: VCMPSD $27, (BX), X3, K3, K7                       // 62f1e70bc23b1b or 62f1e72bc23b1b or 62f1e74bc23b1b
-       //TODO: VCMPSD $27, -17(BP)(SI*1), X3, K3, K7              // 62f1e70bc2bc35efffffff1b or 62f1e72bc2bc35efffffff1b or 62f1e74bc2bc35efffffff1b
-       //TODO: VCMPSS $47, X11, X1, K3, K5                        // 62d1760bc2eb2f
-       //TODO: VCMPSS $47, X11, X1, K3, K4                        // 62d1760bc2e32f
-       //TODO: VCMPSS $82, X0, X13, K2, K4                        // 62f1160ac2e052 or 62f1162ac2e052 or 62f1164ac2e052
-       //TODO: VCMPSS $82, -7(DI)(R8*1), X13, K2, K4              // 62b1160ac2a407f9ffffff52 or 62b1162ac2a407f9ffffff52 or 62b1164ac2a407f9ffffff52
-       //TODO: VCMPSS $82, (SP), X13, K2, K4                      // 62f1160ac2242452 or 62f1162ac2242452 or 62f1164ac2242452
-       //TODO: VCMPSS $82, X0, X13, K2, K6                        // 62f1160ac2f052 or 62f1162ac2f052 or 62f1164ac2f052
-       //TODO: VCMPSS $82, -7(DI)(R8*1), X13, K2, K6              // 62b1160ac2b407f9ffffff52 or 62b1162ac2b407f9ffffff52 or 62b1164ac2b407f9ffffff52
-       //TODO: VCMPSS $82, (SP), X13, K2, K6                      // 62f1160ac2342452 or 62f1162ac2342452 or 62f1164ac2342452
-       //TODO: VCOMISD X16, X30                                   // 6221fd082ff0
-       //TODO: VCOMISS X19, X14                                   // 62317c082ff3
-       //TODO: VCOMPRESSPD X23, K1, X26                           // 6282fd098afa
-       //TODO: VCOMPRESSPD X23, K1, (SI)                          // 62e2fd098a3e
-       //TODO: VCOMPRESSPD X23, K1, 7(SI)(DI*2)                   // 62e2fd098abc7e07000000
-       //TODO: VCOMPRESSPD Y20, K2, Y21                           // 62a2fd2a8ae5
-       //TODO: VCOMPRESSPD Y20, K2, -7(CX)(DX*1)                  // 62e2fd2a8aa411f9ffffff
-       //TODO: VCOMPRESSPD Y20, K2, -15(R14)(R15*4)               // 6282fd2a8aa4bef1ffffff
-       //TODO: VCOMPRESSPD Z20, K1, Z9                            // 62c2fd498ae1
-       //TODO: VCOMPRESSPD Z0, K1, Z9                             // 62d2fd498ac1
-       //TODO: VCOMPRESSPD Z20, K1, Z28                           // 6282fd498ae4
-       //TODO: VCOMPRESSPD Z0, K1, Z28                            // 6292fd498ac4
-       //TODO: VCOMPRESSPD Z20, K1, (R14)                         // 62c2fd498a26
-       //TODO: VCOMPRESSPD Z0, K1, (R14)                          // 62d2fd498a06
-       //TODO: VCOMPRESSPD Z20, K1, -7(DI)(R8*8)                  // 62a2fd498aa4c7f9ffffff
-       //TODO: VCOMPRESSPD Z0, K1, -7(DI)(R8*8)                   // 62b2fd498a84c7f9ffffff
-       //TODO: VCOMPRESSPS X16, K7, X12                           // 62c27d0f8ac4
-       //TODO: VCOMPRESSPS X16, K7, 17(SP)(BP*8)                  // 62e27d0f8a84ec11000000
-       //TODO: VCOMPRESSPS X16, K7, 17(SP)(BP*4)                  // 62e27d0f8a84ac11000000
-       //TODO: VCOMPRESSPS Y31, K1, Y6                            // 62627d298afe
-       //TODO: VCOMPRESSPS Y31, K1, 15(DX)(BX*1)                  // 62627d298abc1a0f000000
-       //TODO: VCOMPRESSPS Y31, K1, -7(CX)(DX*2)                  // 62627d298abc51f9ffffff
-       //TODO: VCOMPRESSPS Z17, K1, Z17                           // 62a27d498ac9
-       //TODO: VCOMPRESSPS Z23, K1, Z17                           // 62a27d498af9
-       //TODO: VCOMPRESSPS Z17, K1, Z0                            // 62e27d498ac8
-       //TODO: VCOMPRESSPS Z23, K1, Z0                            // 62e27d498af8
-       //TODO: VCOMPRESSPS Z17, K1, 99(R15)(R15*4)                // 62827d498a8cbf63000000
-       //TODO: VCOMPRESSPS Z23, K1, 99(R15)(R15*4)                // 62827d498abcbf63000000
-       //TODO: VCOMPRESSPS Z17, K1, 15(DX)                        // 62e27d498a8a0f000000
-       //TODO: VCOMPRESSPS Z23, K1, 15(DX)                        // 62e27d498aba0f000000
-       //TODO: VCVTDQ2PD X23, K1, X23                             // 62a17e09e6ff
-       //TODO: VCVTDQ2PD 7(SI)(DI*4), K1, X23                     // 62e17e09e6bcbe07000000
-       //TODO: VCVTDQ2PD -7(DI)(R8*2), K1, X23                    // 62a17e09e6bc47f9ffffff
-       //TODO: VCVTDQ2PD X11, K7, Y6                              // 62d17e2fe6f3
-       //TODO: VCVTDQ2PD -17(BP), K7, Y6                          // 62f17e2fe6b5efffffff
-       //TODO: VCVTDQ2PD -15(R14)(R15*8), K7, Y6                  // 62917e2fe6b4fef1ffffff
-       //TODO: VCVTDQ2PD Y11, K2, Z31                             // 62417e4ae6fb
-       //TODO: VCVTDQ2PD (CX), K2, Z31                            // 62617e4ae639
-       //TODO: VCVTDQ2PD 99(R15), K2, Z31                         // 62417e4ae6bf63000000
-       //TODO: VCVTDQ2PD Y11, K2, Z0                              // 62d17e4ae6c3
-       //TODO: VCVTDQ2PD (CX), K2, Z0                             // 62f17e4ae601
-       //TODO: VCVTDQ2PD 99(R15), K2, Z0                          // 62d17e4ae68763000000
-       //TODO: VCVTDQ2PS X24, K4, X31                             // 62017c0c5bf8
-       //TODO: VCVTDQ2PS 17(SP), K4, X31                          // 62617c0c5bbc2411000000
-       //TODO: VCVTDQ2PS -17(BP)(SI*4), K4, X31                   // 62617c0c5bbcb5efffffff
-       //TODO: VCVTDQ2PS Y7, K1, Y19                              // 62e17c295bdf
-       //TODO: VCVTDQ2PS 17(SP)(BP*2), K1, Y19                    // 62e17c295b9c6c11000000
-       //TODO: VCVTDQ2PS -7(DI)(R8*4), K1, Y19                    // 62a17c295b9c87f9ffffff
-       //TODO: VCVTDQ2PS Z6, K3, Z21                              // 62e17c4b5bee
-       //TODO: VCVTDQ2PS Z9, K3, Z21                              // 62c17c4b5be9
-       //TODO: VCVTDQ2PS Z6, K3, Z9                               // 62717c4b5bce
-       //TODO: VCVTDQ2PS Z9, K3, Z9                               // 62517c4b5bc9
-       //TODO: VCVTDQ2PS Z20, K4, Z1                              // 62b17c4c5bcc
-       //TODO: VCVTDQ2PS Z9, K4, Z1                               // 62d17c4c5bc9
-       //TODO: VCVTDQ2PS 99(R15)(R15*2), K4, Z1                   // 62917c4c5b8c7f63000000
-       //TODO: VCVTDQ2PS -7(DI), K4, Z1                           // 62f17c4c5b8ff9ffffff
-       //TODO: VCVTDQ2PS Z20, K4, Z9                              // 62317c4c5bcc
-       //TODO: VCVTDQ2PS Z9, K4, Z9                               // 62517c4c5bc9
-       //TODO: VCVTDQ2PS 99(R15)(R15*2), K4, Z9                   // 62117c4c5b8c7f63000000
-       //TODO: VCVTDQ2PS -7(DI), K4, Z9                           // 62717c4c5b8ff9ffffff
-       //TODO: VCVTPD2DQ Z30, K5, Y6                              // 6291ff4de6f6
-       //TODO: VCVTPD2DQ Z5, K5, Y6                               // 62f1ff4de6f5
-       //TODO: VCVTPD2DQ Z26, K7, Y0                              // 6291ff4fe6c2
-       //TODO: VCVTPD2DQ Z22, K7, Y0                              // 62b1ff4fe6c6
-       //TODO: VCVTPD2DQ -7(CX)(DX*1), K7, Y0                     // 62f1ff4fe68411f9ffffff
-       //TODO: VCVTPD2DQ -15(R14)(R15*4), K7, Y0                  // 6291ff4fe684bef1ffffff
-       //TODO: VCVTPD2DQX X0, K7, X14                             // 6271ff0fe6f0
-       //TODO: VCVTPD2DQX 7(AX), K7, X14                          // 6271ff0fe6b007000000
-       //TODO: VCVTPD2DQX (DI), K7, X14                           // 6271ff0fe637
-       //TODO: VCVTPD2DQY Y3, K6, X11                             // 6271ff2ee6db
-       //TODO: VCVTPD2DQY 15(R8), K6, X11                         // 6251ff2ee6980f000000
-       //TODO: VCVTPD2DQY (BP), K6, X11                           // 6271ff2ee65d00
-       //TODO: VCVTPD2PS Z7, K3, Y5                               // 62f1fd4b5aef
-       //TODO: VCVTPD2PS Z21, K3, Y5                              // 62b1fd4b5aed
-       //TODO: VCVTPD2PS Z16, K7, Y20                             // 62a1fd4f5ae0
-       //TODO: VCVTPD2PS Z25, K7, Y20                             // 6281fd4f5ae1
-       //TODO: VCVTPD2PS 15(DX)(BX*1), K7, Y20                    // 62e1fd4f5aa41a0f000000
-       //TODO: VCVTPD2PS -7(CX)(DX*2), K7, Y20                    // 62e1fd4f5aa451f9ffffff
-       //TODO: VCVTPD2PSX X2, K4, X23                             // 62e1fd0c5afa
-       //TODO: VCVTPD2PSX 99(R15)(R15*1), K4, X23                 // 6281fd0c5abc3f63000000
-       //TODO: VCVTPD2PSX (DX), K4, X23                           // 62e1fd0c5a3a
-       //TODO: VCVTPD2PSY Y12, K4, X20                            // 62c1fd2c5ae4
-       //TODO: VCVTPD2PSY 15(R8)(R14*8), K4, X20                  // 6281fd2c5aa4f00f000000
-       //TODO: VCVTPD2PSY -15(R14)(R15*2), K4, X20                // 6281fd2c5aa47ef1ffffff
-       //TODO: VCVTPD2UDQ Z27, K4, Y28                            // 6201fc4c79e3
-       //TODO: VCVTPD2UDQ Z25, K4, Y28                            // 6201fc4c79e1
-       //TODO: VCVTPD2UDQ Z23, K2, Y7                             // 62b1fc4a79ff
-       //TODO: VCVTPD2UDQ Z9, K2, Y7                              // 62d1fc4a79f9
-       //TODO: VCVTPD2UDQ 17(SP)(BP*2), K2, Y7                    // 62f1fc4a79bc6c11000000
-       //TODO: VCVTPD2UDQ -7(DI)(R8*4), K2, Y7                    // 62b1fc4a79bc87f9ffffff
-       //TODO: VCVTPD2UDQX X9, K2, X0                             // 62d1fc0a79c1
-       //TODO: VCVTPD2UDQX 7(SI)(DI*8), K2, X0                    // 62f1fc0a7984fe07000000
-       //TODO: VCVTPD2UDQX -15(R14), K2, X0                       // 62d1fc0a7986f1ffffff
-       //TODO: VCVTPD2UDQY Y0, K3, X13                            // 6271fc2b79e8
-       //TODO: VCVTPD2UDQY 7(AX)(CX*4), K3, X13                   // 6271fc2b79ac8807000000
-       //TODO: VCVTPD2UDQY 7(AX)(CX*1), K3, X13                   // 6271fc2b79ac0807000000
-       //TODO: VCVTPH2PS X9, K2, Y12                              // 62527d2a13e1
-       //TODO: VCVTPH2PS -7(DI)(R8*1), K2, Y12                    // 62327d2a13a407f9ffffff
-       //TODO: VCVTPH2PS (SP), K2, Y12                            // 62727d2a132424
-       //TODO: VCVTPH2PS X31, K1, X2                              // 62927d0913d7
-       //TODO: VCVTPH2PS (R8), K1, X2                             // 62d27d091310
-       //TODO: VCVTPH2PS 15(DX)(BX*2), K1, X2                     // 62f27d0913945a0f000000
-       //TODO: VCVTPH2PS Y1, K7, Z22                              // 62e27d4f13f1
-       //TODO: VCVTPH2PS Y1, K7, Z25                              // 62627d4f13c9
-       //TODO: VCVTPH2PS Y14, K1, Z1                              // 62d27d4913ce
-       //TODO: VCVTPH2PS 17(SP)(BP*8), K1, Z1                     // 62f27d49138cec11000000
-       //TODO: VCVTPH2PS 17(SP)(BP*4), K1, Z1                     // 62f27d49138cac11000000
-       //TODO: VCVTPH2PS Y14, K1, Z16                             // 62c27d4913c6
-       //TODO: VCVTPH2PS 17(SP)(BP*8), K1, Z16                    // 62e27d491384ec11000000
-       //TODO: VCVTPH2PS 17(SP)(BP*4), K1, Z16                    // 62e27d491384ac11000000
-       //TODO: VCVTPS2DQ X22, K1, X11                             // 62317d095bde
-       //TODO: VCVTPS2DQ -7(CX), K1, X11                          // 62717d095b99f9ffffff
-       //TODO: VCVTPS2DQ 15(DX)(BX*4), K1, X11                    // 62717d095b9c9a0f000000
-       //TODO: VCVTPS2DQ Y7, K1, Y17                              // 62e17d295bcf
-       //TODO: VCVTPS2DQ 7(SI)(DI*4), K1, Y17                     // 62e17d295b8cbe07000000
-       //TODO: VCVTPS2DQ -7(DI)(R8*2), K1, Y17                    // 62a17d295b8c47f9ffffff
-       //TODO: VCVTPS2DQ Z0, K7, Z6                               // 62f17d4f5bf0
-       //TODO: VCVTPS2DQ Z8, K7, Z6                               // 62d17d4f5bf0
-       //TODO: VCVTPS2DQ Z0, K7, Z2                               // 62f17d4f5bd0
-       //TODO: VCVTPS2DQ Z8, K7, Z2                               // 62d17d4f5bd0
-       //TODO: VCVTPS2DQ Z14, K2, Z15                             // 62517d4a5bfe
-       //TODO: VCVTPS2DQ Z27, K2, Z15                             // 62117d4a5bfb
-       //TODO: VCVTPS2DQ 15(R8)(R14*8), K2, Z15                   // 62117d4a5bbcf00f000000
-       //TODO: VCVTPS2DQ -15(R14)(R15*2), K2, Z15                 // 62117d4a5bbc7ef1ffffff
-       //TODO: VCVTPS2DQ Z14, K2, Z12                             // 62517d4a5be6
-       //TODO: VCVTPS2DQ Z27, K2, Z12                             // 62117d4a5be3
-       //TODO: VCVTPS2DQ 15(R8)(R14*8), K2, Z12                   // 62117d4a5ba4f00f000000
-       //TODO: VCVTPS2DQ -15(R14)(R15*2), K2, Z12                 // 62117d4a5ba47ef1ffffff
-       //TODO: VCVTPS2PD X14, K4, X5                              // 62d17c0c5aee
-       //TODO: VCVTPS2PD 99(R15)(R15*8), K4, X5                   // 62917c0c5aacff63000000
-       //TODO: VCVTPS2PD 7(AX)(CX*8), K4, X5                      // 62f17c0c5aacc807000000
-       //TODO: VCVTPS2PD X0, K1, Y9                               // 62717c295ac8
-       //TODO: VCVTPS2PD 17(SP), K1, Y9                           // 62717c295a8c2411000000
-       //TODO: VCVTPS2PD -17(BP)(SI*4), K1, Y9                    // 62717c295a8cb5efffffff
-       //TODO: VCVTPS2PD Y31, K3, Z11                             // 62117c4b5adf
-       //TODO: VCVTPS2PD Y31, K3, Z5                              // 62917c4b5aef
-       //TODO: VCVTPS2PD Y8, K4, Z13                              // 62517c4c5ae8
-       //TODO: VCVTPS2PD -15(R14)(R15*1), K4, Z13                 // 62117c4c5aac3ef1ffffff
-       //TODO: VCVTPS2PD -15(BX), K4, Z13                         // 62717c4c5aabf1ffffff
-       //TODO: VCVTPS2PD Y8, K4, Z14                              // 62517c4c5af0
-       //TODO: VCVTPS2PD -15(R14)(R15*1), K4, Z14                 // 62117c4c5ab43ef1ffffff
-       //TODO: VCVTPS2PD -15(BX), K4, Z14                         // 62717c4c5ab3f1ffffff
-       //TODO: VCVTPS2PH $126, X7, K5, X17                        // 62b37d0d1df97e
-       //TODO: VCVTPS2PH $126, X7, K5, 17(SP)(BP*1)               // 62f37d0d1dbc2c110000007e
-       //TODO: VCVTPS2PH $126, X7, K5, -7(CX)(DX*8)               // 62f37d0d1dbcd1f9ffffff7e
-       //TODO: VCVTPS2PH $94, Y1, K7, X15                         // 62d37d2f1dcf5e
-       //TODO: VCVTPS2PH $94, Y1, K7, (AX)                        // 62f37d2f1d085e
-       //TODO: VCVTPS2PH $94, Y1, K7, 7(SI)                       // 62f37d2f1d8e070000005e
-       //TODO: VCVTPS2PH $121, Z5, K7, Y28                        // 62937d4f1dec79
-       //TODO: VCVTPS2PH $121, Z23, K7, Y28                       // 62837d4f1dfc79
-       //TODO: VCVTPS2PH $121, Z5, K7, 7(AX)                      // 62f37d4f1da80700000079
-       //TODO: VCVTPS2PH $121, Z23, K7, 7(AX)                     // 62e37d4f1db80700000079
-       //TODO: VCVTPS2PH $121, Z5, K7, (DI)                       // 62f37d4f1d2f79
-       //TODO: VCVTPS2PH $121, Z23, K7, (DI)                      // 62e37d4f1d3f79
-       //TODO: VCVTPS2PH $13, Z2, K6, Y13                         // 62d37d4e1dd50d
-       //TODO: VCVTPS2UDQ X27, K7, X8                             // 62117c0f79c3
-       //TODO: VCVTPS2UDQ 15(R8)(R14*4), K7, X8                   // 62117c0f7984b00f000000
-       //TODO: VCVTPS2UDQ -7(CX)(DX*4), K7, X8                    // 62717c0f798491f9ffffff
-       //TODO: VCVTPS2UDQ Y9, K2, Y12                             // 62517c2a79e1
-       //TODO: VCVTPS2UDQ -17(BP)(SI*8), K2, Y12                  // 62717c2a79a4f5efffffff
-       //TODO: VCVTPS2UDQ (R15), K2, Y12                          // 62517c2a7927
-       //TODO: VCVTPS2UDQ Z13, K5, Z28                            // 62417c4d79e5
-       //TODO: VCVTPS2UDQ Z21, K5, Z28                            // 62217c4d79e5
-       //TODO: VCVTPS2UDQ Z13, K5, Z6                             // 62d17c4d79f5
-       //TODO: VCVTPS2UDQ Z21, K5, Z6                             // 62b17c4d79f5
-       //TODO: VCVTPS2UDQ Z3, K3, Z26                             // 62617c4b79d3
-       //TODO: VCVTPS2UDQ Z0, K3, Z26                             // 62617c4b79d0
-       //TODO: VCVTPS2UDQ (SI), K3, Z26                           // 62617c4b7916
-       //TODO: VCVTPS2UDQ 7(SI)(DI*2), K3, Z26                    // 62617c4b79947e07000000
-       //TODO: VCVTPS2UDQ Z3, K3, Z3                              // 62f17c4b79db
-       //TODO: VCVTPS2UDQ Z0, K3, Z3                              // 62f17c4b79d8
-       //TODO: VCVTPS2UDQ (SI), K3, Z3                            // 62f17c4b791e
-       //TODO: VCVTPS2UDQ 7(SI)(DI*2), K3, Z3                     // 62f17c4b799c7e07000000
-       //TODO: VCVTSD2SI X24, R14                                 // 62117f082df0 or 62117f282df0 or 62117f482df0
-       //TODO: VCVTSD2SI X24, AX                                  // 62917f082dc0 or 62917f282dc0 or 62917f482dc0
-       //TODO: VCVTSD2SS X11, X1, K1, X22                         // 62c1f7095af3
-       //TODO: VCVTSD2SS X8, X7, K1, X6                           // 62d1c7095af0 or 62d1c7295af0 or 62d1c7495af0
-       //TODO: VCVTSD2SS (R14), X7, K1, X6                        // 62d1c7095a36 or 62d1c7295a36 or 62d1c7495a36
-       //TODO: VCVTSD2SS -7(DI)(R8*8), X7, K1, X6                 // 62b1c7095ab4c7f9ffffff or 62b1c7295ab4c7f9ffffff or 62b1c7495ab4c7f9ffffff
-       //TODO: VCVTSD2USIL X31, R9                                // 62117f0879cf
-       //TODO: VCVTSD2USIL X31, CX                                // 62917f0879cf
-       //TODO: VCVTSD2USIL X3, SP                                 // 62f17f0879e3 or 62f17f2879e3 or 62f17f4879e3
-       //TODO: VCVTSD2USIL 99(R15)(R15*4), SP                     // 62917f0879a4bf63000000 or 62917f2879a4bf63000000 or 62917f4879a4bf63000000
-       //TODO: VCVTSD2USIL 15(DX), SP                             // 62f17f0879a20f000000 or 62f17f2879a20f000000 or 62f17f4879a20f000000
-       //TODO: VCVTSD2USIL X3, R14                                // 62717f0879f3 or 62717f2879f3 or 62717f4879f3
-       //TODO: VCVTSD2USIL 99(R15)(R15*4), R14                    // 62117f0879b4bf63000000 or 62117f2879b4bf63000000 or 62117f4879b4bf63000000
-       //TODO: VCVTSD2USIL 15(DX), R14                            // 62717f0879b20f000000 or 62717f2879b20f000000 or 62717f4879b20f000000
-       //TODO: VCVTSD2USIQ X28, R10                               // 6211ff0879d4
-       //TODO: VCVTSD2USIQ X28, CX                                // 6291ff0879cc
-       //TODO: VCVTSD2USIQ X20, R9                                // 6231ff0879cc or 6231ff2879cc or 6231ff4879cc
-       //TODO: VCVTSD2USIQ (CX), R9                               // 6271ff087909 or 6271ff287909 or 6271ff487909
-       //TODO: VCVTSD2USIQ 99(R15), R9                            // 6251ff08798f63000000 or 6251ff28798f63000000 or 6251ff48798f63000000
-       //TODO: VCVTSD2USIQ X20, R13                               // 6231ff0879ec or 6231ff2879ec or 6231ff4879ec
-       //TODO: VCVTSD2USIQ (CX), R13                              // 6271ff087929 or 6271ff287929 or 6271ff487929
-       //TODO: VCVTSD2USIQ 99(R15), R13                           // 6251ff0879af63000000 or 6251ff2879af63000000 or 6251ff4879af63000000
-       //TODO: VCVTSI2SDL AX, X7, X24                             // 626147082ac0 or 626147282ac0 or 626147482ac0
-       //TODO: VCVTSI2SDL R9, X7, X24                             // 624147082ac1 or 624147282ac1 or 624147482ac1
-       //TODO: VCVTSI2SDL 99(R15)(R15*8), X7, X24                 // 620147082a84ff63000000 or 620147282a84ff63000000 or 620147482a84ff63000000
-       //TODO: VCVTSI2SDL 7(AX)(CX*8), X7, X24                    // 626147082a84c807000000 or 626147282a84c807000000 or 626147482a84c807000000
-       //TODO: VCVTSI2SDQ DX, X16, X20                            // 62e1ff002ae2 or 62e1ff202ae2 or 62e1ff402ae2
-       //TODO: VCVTSI2SDQ BP, X16, X20                            // 62e1ff002ae5 or 62e1ff202ae5 or 62e1ff402ae5
-       //TODO: VCVTSI2SDQ 99(R15)(R15*2), X16, X20                // 6281ff002aa47f63000000 or 6281ff202aa47f63000000 or 6281ff402aa47f63000000
-       //TODO: VCVTSI2SDQ -7(DI), X16, X20                        // 62e1ff002aa7f9ffffff or 62e1ff202aa7f9ffffff or 62e1ff402aa7f9ffffff
-       //TODO: VCVTSI2SSL CX, X28, X17                            // 62e11e002ac9 or 62e11e202ac9 or 62e11e402ac9
-       //TODO: VCVTSI2SSL SP, X28, X17                            // 62e11e002acc or 62e11e202acc or 62e11e402acc
-       //TODO: VCVTSI2SSL (AX), X28, X17                          // 62e11e002a08 or 62e11e202a08 or 62e11e402a08
-       //TODO: VCVTSI2SSL 7(SI), X28, X17                         // 62e11e002a8e07000000 or 62e11e202a8e07000000 or 62e11e402a8e07000000
-       //TODO: VCVTSS2SD X6, X16, K7, X11                         // 62717e075ade
-       //TODO: VCVTSS2SD X12, X22, K2, X6                         // 62d14e025af4 or 62d14e225af4 or 62d14e425af4
-       //TODO: VCVTSS2SD (BX), X22, K2, X6                        // 62f14e025a33 or 62f14e225a33 or 62f14e425a33
-       //TODO: VCVTSS2SD -17(BP)(SI*1), X22, K2, X6               // 62f14e025ab435efffffff or 62f14e225ab435efffffff or 62f14e425ab435efffffff
-       //TODO: VCVTSS2SI X16, R9                                  // 62317e082dc8
-       //TODO: VCVTSS2SI X16, CX                                  // 62b17e082dc8
-       //TODO: VCVTSS2SI X28, SP                                  // 62917e082de4 or 62917e282de4 or 62917e482de4
-       //TODO: VCVTSS2SI X28, R14                                 // 62117e082df4 or 62117e282df4 or 62117e482df4
-       //TODO: VCVTSS2USIL X11, AX                                // 62d17e0879c3
-       //TODO: VCVTSS2USIL X11, R9                                // 62517e0879cb
-       //TODO: VCVTSS2USIL X1, CX                                 // 62f17e0879c9 or 62f17e2879c9 or 62f17e4879c9
-       //TODO: VCVTSS2USIL 17(SP)(BP*1), CX                       // 62f17e08798c2c11000000 or 62f17e28798c2c11000000 or 62f17e48798c2c11000000
-       //TODO: VCVTSS2USIL -7(CX)(DX*8), CX                       // 62f17e08798cd1f9ffffff or 62f17e28798cd1f9ffffff or 62f17e48798cd1f9ffffff
-       //TODO: VCVTSS2USIL X1, SP                                 // 62f17e0879e1 or 62f17e2879e1 or 62f17e4879e1
-       //TODO: VCVTSS2USIL 17(SP)(BP*1), SP                       // 62f17e0879a42c11000000 or 62f17e2879a42c11000000 or 62f17e4879a42c11000000
-       //TODO: VCVTSS2USIL -7(CX)(DX*8), SP                       // 62f17e0879a4d1f9ffffff or 62f17e2879a4d1f9ffffff or 62f17e4879a4d1f9ffffff
-       //TODO: VCVTSS2USIQ X19, DX                                // 62b1fe0879d3
-       //TODO: VCVTSS2USIQ X19, BP                                // 62b1fe0879eb
-       //TODO: VCVTSS2USIQ X13, R10                               // 6251fe0879d5 or 6251fe2879d5 or 6251fe4879d5
-       //TODO: VCVTSS2USIQ -17(BP)(SI*2), R10                     // 6271fe08799475efffffff or 6271fe28799475efffffff or 6271fe48799475efffffff
-       //TODO: VCVTSS2USIQ 7(AX)(CX*2), R10                       // 6271fe0879944807000000 or 6271fe2879944807000000 or 6271fe4879944807000000
-       //TODO: VCVTSS2USIQ X13, CX                                // 62d1fe0879cd or 62d1fe2879cd or 62d1fe4879cd
-       //TODO: VCVTSS2USIQ -17(BP)(SI*2), CX                      // 62f1fe08798c75efffffff or 62f1fe28798c75efffffff or 62f1fe48798c75efffffff
-       //TODO: VCVTSS2USIQ 7(AX)(CX*2), CX                        // 62f1fe08798c4807000000 or 62f1fe28798c4807000000 or 62f1fe48798c4807000000
-       //TODO: VCVTTPD2DQ Z16, K4, Y30                            // 6221fd4ce6f0
-       //TODO: VCVTTPD2DQ Z13, K4, Y30                            // 6241fd4ce6f5
-       //TODO: VCVTTPD2DQ Z12, K1, Y26                            // 6241fd49e6d4
-       //TODO: VCVTTPD2DQ Z27, K1, Y26                            // 6201fd49e6d3
-       //TODO: VCVTTPD2DQ 7(AX), K1, Y26                          // 6261fd49e69007000000
-       //TODO: VCVTTPD2DQ (DI), K1, Y26                           // 6261fd49e617
-       //TODO: VCVTTPD2DQX X14, K3, X2                            // 62d1fd0be6d6
-       //TODO: VCVTTPD2DQX 15(R8)(R14*1), K3, X2                  // 6291fd0be694300f000000
-       //TODO: VCVTTPD2DQX 15(R8)(R14*2), K3, X2                  // 6291fd0be694700f000000
-       //TODO: VCVTTPD2DQY Y7, K4, X0                             // 62f1fd2ce6c7
-       //TODO: VCVTTPD2DQY -7(CX), K4, X0                         // 62f1fd2ce681f9ffffff
-       //TODO: VCVTTPD2DQY 15(DX)(BX*4), K4, X0                   // 62f1fd2ce6849a0f000000
-       //TODO: VCVTTPD2UDQ Z9, K3, Y30                            // 6241fc4b78f1
-       //TODO: VCVTTPD2UDQ Z12, K3, Y30                           // 6241fc4b78f4
-       //TODO: VCVTTPD2UDQ Z6, K7, Y31                            // 6261fc4f78fe
-       //TODO: VCVTTPD2UDQ Z25, K7, Y31                           // 6201fc4f78f9
-       //TODO: VCVTTPD2UDQ -17(BP)(SI*8), K7, Y31                 // 6261fc4f78bcf5efffffff
-       //TODO: VCVTTPD2UDQ (R15), K7, Y31                         // 6241fc4f783f
-       //TODO: VCVTTPD2UDQX X17, K4, X11                          // 6231fc0c78d9
-       //TODO: VCVTTPD2UDQX 99(R15)(R15*4), K4, X11               // 6211fc0c789cbf63000000
-       //TODO: VCVTTPD2UDQX 15(DX), K4, X11                       // 6271fc0c789a0f000000
-       //TODO: VCVTTPD2UDQY Y22, K4, X18                          // 62a1fc2c78d6
-       //TODO: VCVTTPD2UDQY (AX), K4, X18                         // 62e1fc2c7810
-       //TODO: VCVTTPD2UDQY 7(SI), K4, X18                        // 62e1fc2c789607000000
-       //TODO: VCVTTPS2DQ X24, K4, X2                             // 62917e0c5bd0
-       //TODO: VCVTTPS2DQ 99(R15)(R15*2), K4, X2                  // 62917e0c5b947f63000000
-       //TODO: VCVTTPS2DQ -7(DI), K4, X2                          // 62f17e0c5b97f9ffffff
-       //TODO: VCVTTPS2DQ Y0, K2, Y7                              // 62f17e2a5bf8
-       //TODO: VCVTTPS2DQ 15(R8)(R14*4), K2, Y7                   // 62917e2a5bbcb00f000000
-       //TODO: VCVTTPS2DQ -7(CX)(DX*4), K2, Y7                    // 62f17e2a5bbc91f9ffffff
-       //TODO: VCVTTPS2DQ Z20, K2, Z0                             // 62b17e4a5bc4
-       //TODO: VCVTTPS2DQ Z28, K2, Z0                             // 62917e4a5bc4
-       //TODO: VCVTTPS2DQ Z20, K2, Z6                             // 62b17e4a5bf4
-       //TODO: VCVTTPS2DQ Z28, K2, Z6                             // 62917e4a5bf4
-       //TODO: VCVTTPS2DQ Z9, K3, Z3                              // 62d17e4b5bd9
-       //TODO: VCVTTPS2DQ Z19, K3, Z3                             // 62b17e4b5bdb
-       //TODO: VCVTTPS2DQ 7(SI)(DI*1), K3, Z3                     // 62f17e4b5b9c3e07000000
-       //TODO: VCVTTPS2DQ 15(DX)(BX*8), K3, Z3                    // 62f17e4b5b9cda0f000000
-       //TODO: VCVTTPS2DQ Z9, K3, Z30                             // 62417e4b5bf1
-       //TODO: VCVTTPS2DQ Z19, K3, Z30                            // 62217e4b5bf3
-       //TODO: VCVTTPS2DQ 7(SI)(DI*1), K3, Z30                    // 62617e4b5bb43e07000000
-       //TODO: VCVTTPS2DQ 15(DX)(BX*8), K3, Z30                   // 62617e4b5bb4da0f000000
-       //TODO: VCVTTPS2UDQ X22, K2, X26                           // 62217c0a78d6
-       //TODO: VCVTTPS2UDQ 15(DX)(BX*1), K2, X26                  // 62617c0a78941a0f000000
-       //TODO: VCVTTPS2UDQ -7(CX)(DX*2), K2, X26                  // 62617c0a789451f9ffffff
-       //TODO: VCVTTPS2UDQ Y13, K1, Y24                           // 62417c2978c5
-       //TODO: VCVTTPS2UDQ 17(SP)(BP*1), K1, Y24                  // 62617c2978842c11000000
-       //TODO: VCVTTPS2UDQ -7(CX)(DX*8), K1, Y24                  // 62617c297884d1f9ffffff
-       //TODO: VCVTTPS2UDQ Z2, K7, Z18                            // 62e17c4f78d2
-       //TODO: VCVTTPS2UDQ Z21, K7, Z18                           // 62a17c4f78d5
-       //TODO: VCVTTPS2UDQ Z2, K7, Z24                            // 62617c4f78c2
-       //TODO: VCVTTPS2UDQ Z21, K7, Z24                           // 62217c4f78c5
-       //TODO: VCVTTPS2UDQ Z6, K1, Z7                             // 62f17c4978fe
-       //TODO: VCVTTPS2UDQ Z16, K1, Z7                            // 62b17c4978f8
-       //TODO: VCVTTPS2UDQ -7(CX), K1, Z7                         // 62f17c4978b9f9ffffff
-       //TODO: VCVTTPS2UDQ 15(DX)(BX*4), K1, Z7                   // 62f17c4978bc9a0f000000
-       //TODO: VCVTTPS2UDQ Z6, K1, Z13                            // 62717c4978ee
-       //TODO: VCVTTPS2UDQ Z16, K1, Z13                           // 62317c4978e8
-       //TODO: VCVTTPS2UDQ -7(CX), K1, Z13                        // 62717c4978a9f9ffffff
-       //TODO: VCVTTPS2UDQ 15(DX)(BX*4), K1, Z13                  // 62717c4978ac9a0f000000
-       //TODO: VCVTTSD2SI X30, R9                                 // 62117f082cce or 62117f282cce or 62117f482cce
-       //TODO: VCVTTSD2SI X30, CX                                 // 62917f082cce or 62917f282cce or 62917f482cce
-       //TODO: VCVTTSD2USIL X12, SP                               // 62d17f0878e4
-       //TODO: VCVTTSD2USIL X12, R14                              // 62517f0878f4
-       //TODO: VCVTTSD2USIL X23, AX                               // 62b17f0878c7 or 62b17f2878c7 or 62b17f4878c7
-       //TODO: VCVTTSD2USIL 17(SP)(BP*2), AX                      // 62f17f0878846c11000000 or 62f17f2878846c11000000 or 62f17f4878846c11000000
-       //TODO: VCVTTSD2USIL -7(DI)(R8*4), AX                      // 62b17f08788487f9ffffff or 62b17f28788487f9ffffff or 62b17f48788487f9ffffff
-       //TODO: VCVTTSD2USIL X23, R9                               // 62317f0878cf or 62317f2878cf or 62317f4878cf
-       //TODO: VCVTTSD2USIL 17(SP)(BP*2), R9                      // 62717f08788c6c11000000 or 62717f28788c6c11000000 or 62717f48788c6c11000000
-       //TODO: VCVTTSD2USIL -7(DI)(R8*4), R9                      // 62317f08788c87f9ffffff or 62317f28788c87f9ffffff or 62317f48788c87f9ffffff
-       //TODO: VCVTTSD2USIQ X30, R10                              // 6211ff0878d6
-       //TODO: VCVTTSD2USIQ X30, CX                               // 6291ff0878ce
-       //TODO: VCVTTSD2USIQ X8, R9                                // 6251ff0878c8 or 6251ff2878c8 or 6251ff4878c8
-       //TODO: VCVTTSD2USIQ 15(R8), R9                            // 6251ff0878880f000000 or 6251ff2878880f000000 or 6251ff4878880f000000
-       //TODO: VCVTTSD2USIQ (BP), R9                              // 6271ff08784d00 or 6271ff28784d00 or 6271ff48784d00
-       //TODO: VCVTTSD2USIQ X8, R13                               // 6251ff0878e8 or 6251ff2878e8 or 6251ff4878e8
-       //TODO: VCVTTSD2USIQ 15(R8), R13                           // 6251ff0878a80f000000 or 6251ff2878a80f000000 or 6251ff4878a80f000000
-       //TODO: VCVTTSD2USIQ (BP), R13                             // 6271ff08786d00 or 6271ff28786d00 or 6271ff48786d00
-       //TODO: VCVTTSS2SI X20, CX                                 // 62b17e082ccc
-       //TODO: VCVTTSS2SI X20, SP                                 // 62b17e082ce4
-       //TODO: VCVTTSS2SIQ X26, R10                               // 6211fe082cd2 or 6211fe282cd2 or 6211fe482cd2
-       //TODO: VCVTTSS2SIQ X26, CX                                // 6291fe082cca or 6291fe282cca or 6291fe482cca
-       //TODO: VCVTTSS2USIL X19, R9                               // 62317e0878cb
-       //TODO: VCVTTSS2USIL X19, CX                               // 62b17e0878cb
-       //TODO: VCVTTSS2USIL X0, SP                                // 62f17e0878e0 or 62f17e2878e0 or 62f17e4878e0
-       //TODO: VCVTTSS2USIL 99(R15)(R15*4), SP                    // 62917e0878a4bf63000000 or 62917e2878a4bf63000000 or 62917e4878a4bf63000000
-       //TODO: VCVTTSS2USIL 15(DX), SP                            // 62f17e0878a20f000000 or 62f17e2878a20f000000 or 62f17e4878a20f000000
-       //TODO: VCVTTSS2USIL X0, R14                               // 62717e0878f0 or 62717e2878f0 or 62717e4878f0
-       //TODO: VCVTTSS2USIL 99(R15)(R15*4), R14                   // 62117e0878b4bf63000000 or 62117e2878b4bf63000000 or 62117e4878b4bf63000000
-       //TODO: VCVTTSS2USIL 15(DX), R14                           // 62717e0878b20f000000 or 62717e2878b20f000000 or 62717e4878b20f000000
-       //TODO: VCVTTSS2USIQ X31, R9                               // 6211fe0878cf
-       //TODO: VCVTTSS2USIQ X31, R13                              // 6211fe0878ef
-       //TODO: VCVTTSS2USIQ X16, DX                               // 62b1fe0878d0 or 62b1fe2878d0 or 62b1fe4878d0
-       //TODO: VCVTTSS2USIQ (CX), DX                              // 62f1fe087811 or 62f1fe287811 or 62f1fe487811
-       //TODO: VCVTTSS2USIQ 99(R15), DX                           // 62d1fe08789763000000 or 62d1fe28789763000000 or 62d1fe48789763000000
-       //TODO: VCVTTSS2USIQ X16, BP                               // 62b1fe0878e8 or 62b1fe2878e8 or 62b1fe4878e8
-       //TODO: VCVTTSS2USIQ (CX), BP                              // 62f1fe087829 or 62f1fe287829 or 62f1fe487829
-       //TODO: VCVTTSS2USIQ 99(R15), BP                           // 62d1fe0878af63000000 or 62d1fe2878af63000000 or 62d1fe4878af63000000
-       //TODO: VCVTUDQ2PD X8, K4, X7                              // 62d17e0c7af8
-       //TODO: VCVTUDQ2PD 17(SP)(BP*2), K4, X7                    // 62f17e0c7abc6c11000000
-       //TODO: VCVTUDQ2PD -7(DI)(R8*4), K4, X7                    // 62b17e0c7abc87f9ffffff
-       //TODO: VCVTUDQ2PD X1, K1, Y1                              // 62f17e297ac9
-       //TODO: VCVTUDQ2PD 15(R8)(R14*1), K1, Y1                   // 62917e297a8c300f000000
-       //TODO: VCVTUDQ2PD 15(R8)(R14*2), K1, Y1                   // 62917e297a8c700f000000
-       //TODO: VCVTUDQ2PD Y26, K3, Z13                            // 62117e4b7aea
-       //TODO: VCVTUDQ2PD (AX), K3, Z13                           // 62717e4b7a28
-       //TODO: VCVTUDQ2PD 7(SI), K3, Z13                          // 62717e4b7aae07000000
-       //TODO: VCVTUDQ2PS X15, K4, X0                             // 62d17f0c7ac7
-       //TODO: VCVTUDQ2PS 15(R8), K4, X0                          // 62d17f0c7a800f000000
-       //TODO: VCVTUDQ2PS (BP), K4, X0                            // 62f17f0c7a4500
-       //TODO: VCVTUDQ2PS Y12, K5, Y30                            // 62417f2d7af4
-       //TODO: VCVTUDQ2PS (R14), K5, Y30                          // 62417f2d7a36
-       //TODO: VCVTUDQ2PS -7(DI)(R8*8), K5, Y30                   // 62217f2d7ab4c7f9ffffff
-       //TODO: VCVTUDQ2PS Z22, K7, Z18                            // 62a17f4f7ad6
-       //TODO: VCVTUDQ2PS Z7, K7, Z18                             // 62e17f4f7ad7
-       //TODO: VCVTUDQ2PS Z22, K7, Z8                             // 62317f4f7ac6
-       //TODO: VCVTUDQ2PS Z7, K7, Z8                              // 62717f4f7ac7
-       //TODO: VCVTUDQ2PS Z20, K7, Z2                             // 62b17f4f7ad4
-       //TODO: VCVTUDQ2PS Z9, K7, Z2                              // 62d17f4f7ad1
-       //TODO: VCVTUDQ2PS (BX), K7, Z2                            // 62f17f4f7a13
-       //TODO: VCVTUDQ2PS -17(BP)(SI*1), K7, Z2                   // 62f17f4f7a9435efffffff
-       //TODO: VCVTUDQ2PS Z20, K7, Z31                            // 62217f4f7afc
-       //TODO: VCVTUDQ2PS Z9, K7, Z31                             // 62417f4f7af9
-       //TODO: VCVTUDQ2PS (BX), K7, Z31                           // 62617f4f7a3b
-       //TODO: VCVTUDQ2PS -17(BP)(SI*1), K7, Z31                  // 62617f4f7abc35efffffff
-       //TODO: VCVTUSI2SDL AX, X7, X22                            // 62e147087bf0 or 62e147287bf0 or 62e147487bf0
-       //TODO: VCVTUSI2SDL R9, X7, X22                            // 62c147087bf1 or 62c147287bf1 or 62c147487bf1
-       //TODO: VCVTUSI2SDL 99(R15)(R15*2), X7, X22                // 628147087bb47f63000000 or 628147287bb47f63000000 or 628147487bb47f63000000
-       //TODO: VCVTUSI2SDL -7(DI), X7, X22                        // 62e147087bb7f9ffffff or 62e147287bb7f9ffffff or 62e147487bb7f9ffffff
-       //TODO: VCVTUSI2SDQ R10, X7, X19                           // 62c1c7087bda or 62c1c7287bda or 62c1c7487bda
-       //TODO: VCVTUSI2SDQ CX, X7, X19                            // 62e1c7087bd9 or 62e1c7287bd9 or 62e1c7487bd9
-       //TODO: VCVTUSI2SDQ 15(R8)(R14*8), X7, X19                 // 6281c7087b9cf00f000000 or 6281c7287b9cf00f000000 or 6281c7487b9cf00f000000
-       //TODO: VCVTUSI2SDQ -15(R14)(R15*2), X7, X19               // 6281c7087b9c7ef1ffffff or 6281c7287b9c7ef1ffffff or 6281c7487b9c7ef1ffffff
-       //TODO: VCVTUSI2SDQ R9, X31, X16                           // 62c187007bc1
-       //TODO: VCVTUSI2SDQ R13, X31, X16                          // 62c187007bc5
-       //TODO: VCVTUSI2SSL CX, X7, X1                             // 62f146087bc9 or 62f146287bc9 or 62f146487bc9
-       //TODO: VCVTUSI2SSL SP, X7, X1                             // 62f146087bcc or 62f146287bcc or 62f146487bcc
-       //TODO: VCVTUSI2SSL -7(CX)(DX*1), X7, X1                   // 62f146087b8c11f9ffffff or 62f146287b8c11f9ffffff or 62f146487b8c11f9ffffff
-       //TODO: VCVTUSI2SSL -15(R14)(R15*4), X7, X1                // 629146087b8cbef1ffffff or 629146287b8cbef1ffffff or 629146487b8cbef1ffffff
-       //TODO: VCVTUSI2SSL R14, X15, X9                           // 625106087bce
-       //TODO: VCVTUSI2SSL AX, X15, X9                            // 627106087bc8
-       //TODO: VCVTUSI2SSQ DX, X0, X12                            // 6271fe087be2 or 6271fe287be2 or 6271fe487be2
-       //TODO: VCVTUSI2SSQ BP, X0, X12                            // 6271fe087be5 or 6271fe287be5 or 6271fe487be5
-       //TODO: VCVTUSI2SSQ -15(R14)(R15*1), X0, X12               // 6211fe087ba43ef1ffffff or 6211fe287ba43ef1ffffff or 6211fe487ba43ef1ffffff
-       //TODO: VCVTUSI2SSQ -15(BX), X0, X12                       // 6271fe087ba3f1ffffff or 6271fe287ba3f1ffffff or 6271fe487ba3f1ffffff
-       //TODO: VCVTUSI2SSQ R10, X14, X12                          // 62518e087be2
-       //TODO: VCVTUSI2SSQ CX, X14, X12                           // 62718e087be1
-       //TODO: VDIVPD X26, X3, K2, X8                             // 6211e50a5ec2
-       //TODO: VDIVPD (SI), X3, K2, X8                            // 6271e50a5e06
-       //TODO: VDIVPD 7(SI)(DI*2), X3, K2, X8                     // 6271e50a5e847e07000000
-       //TODO: VDIVPD Y7, Y21, K3, Y13                            // 6271d5235eef
-       //TODO: VDIVPD -7(CX)(DX*1), Y21, K3, Y13                  // 6271d5235eac11f9ffffff
-       //TODO: VDIVPD -15(R14)(R15*4), Y21, K3, Y13               // 6211d5235eacbef1ffffff
-       //TODO: VDIVPD Z16, Z21, K3, Z14                           // 6231d5435ef0
-       //TODO: VDIVPD Z9, Z21, K3, Z14                            // 6251d5435ef1
-       //TODO: VDIVPD Z16, Z8, K3, Z14                            // 6231bd4b5ef0
-       //TODO: VDIVPD Z9, Z8, K3, Z14                             // 6251bd4b5ef1
-       //TODO: VDIVPD Z16, Z21, K3, Z15                           // 6231d5435ef8
-       //TODO: VDIVPD Z9, Z21, K3, Z15                            // 6251d5435ef9
-       //TODO: VDIVPD Z16, Z8, K3, Z15                            // 6231bd4b5ef8
-       //TODO: VDIVPD Z9, Z8, K3, Z15                             // 6251bd4b5ef9
-       //TODO: VDIVPD Z0, Z23, K3, Z20                            // 62e1c5435ee0
-       //TODO: VDIVPD Z11, Z23, K3, Z20                           // 62c1c5435ee3
-       //TODO: VDIVPD -17(BP)(SI*2), Z23, K3, Z20                 // 62e1c5435ea475efffffff
-       //TODO: VDIVPD 7(AX)(CX*2), Z23, K3, Z20                   // 62e1c5435ea44807000000
-       //TODO: VDIVPD Z0, Z19, K3, Z20                            // 62e1e5435ee0
-       //TODO: VDIVPD Z11, Z19, K3, Z20                           // 62c1e5435ee3
-       //TODO: VDIVPD -17(BP)(SI*2), Z19, K3, Z20                 // 62e1e5435ea475efffffff
-       //TODO: VDIVPD 7(AX)(CX*2), Z19, K3, Z20                   // 62e1e5435ea44807000000
-       //TODO: VDIVPD Z0, Z23, K3, Z0                             // 62f1c5435ec0
-       //TODO: VDIVPD Z11, Z23, K3, Z0                            // 62d1c5435ec3
-       //TODO: VDIVPD -17(BP)(SI*2), Z23, K3, Z0                  // 62f1c5435e8475efffffff
-       //TODO: VDIVPD 7(AX)(CX*2), Z23, K3, Z0                    // 62f1c5435e844807000000
-       //TODO: VDIVPD Z0, Z19, K3, Z0                             // 62f1e5435ec0
-       //TODO: VDIVPD Z11, Z19, K3, Z0                            // 62d1e5435ec3
-       //TODO: VDIVPD -17(BP)(SI*2), Z19, K3, Z0                  // 62f1e5435e8475efffffff
-       //TODO: VDIVPD 7(AX)(CX*2), Z19, K3, Z0                    // 62f1e5435e844807000000
-       //TODO: VDIVPS X28, X13, K2, X23                           // 6281140a5efc
-       //TODO: VDIVPS 17(SP)(BP*8), X13, K2, X23                  // 62e1140a5ebcec11000000
-       //TODO: VDIVPS 17(SP)(BP*4), X13, K2, X23                  // 62e1140a5ebcac11000000
-       //TODO: VDIVPS Y18, Y13, K1, Y30                           // 622114295ef2
-       //TODO: VDIVPS 15(DX)(BX*1), Y13, K1, Y30                  // 626114295eb41a0f000000
-       //TODO: VDIVPS -7(CX)(DX*2), Y13, K1, Y30                  // 626114295eb451f9ffffff
-       //TODO: VDIVPS Z0, Z24, K2, Z0                             // 62f13c425ec0
-       //TODO: VDIVPS Z26, Z24, K2, Z0                            // 62913c425ec2
-       //TODO: VDIVPS Z0, Z12, K2, Z0                             // 62f11c4a5ec0
-       //TODO: VDIVPS Z26, Z12, K2, Z0                            // 62911c4a5ec2
-       //TODO: VDIVPS Z0, Z24, K2, Z25                            // 62613c425ec8
-       //TODO: VDIVPS Z26, Z24, K2, Z25                           // 62013c425eca
-       //TODO: VDIVPS Z0, Z12, K2, Z25                            // 62611c4a5ec8
-       //TODO: VDIVPS Z26, Z12, K2, Z25                           // 62011c4a5eca
-       //TODO: VDIVPS Z9, Z9, K1, Z9                              // 625134495ec9
-       //TODO: VDIVPS Z28, Z9, K1, Z9                             // 621134495ecc
-       //TODO: VDIVPS 15(R8)(R14*1), Z9, K1, Z9                   // 621134495e8c300f000000
-       //TODO: VDIVPS 15(R8)(R14*2), Z9, K1, Z9                   // 621134495e8c700f000000
-       //TODO: VDIVPS Z9, Z25, K1, Z9                             // 625134415ec9
-       //TODO: VDIVPS Z28, Z25, K1, Z9                            // 621134415ecc
-       //TODO: VDIVPS 15(R8)(R14*1), Z25, K1, Z9                  // 621134415e8c300f000000
-       //TODO: VDIVPS 15(R8)(R14*2), Z25, K1, Z9                  // 621134415e8c700f000000
-       //TODO: VDIVPS Z9, Z9, K1, Z3                              // 62d134495ed9
-       //TODO: VDIVPS Z28, Z9, K1, Z3                             // 629134495edc
-       //TODO: VDIVPS 15(R8)(R14*1), Z9, K1, Z3                   // 629134495e9c300f000000
-       //TODO: VDIVPS 15(R8)(R14*2), Z9, K1, Z3                   // 629134495e9c700f000000
-       //TODO: VDIVPS Z9, Z25, K1, Z3                             // 62d134415ed9
-       //TODO: VDIVPS Z28, Z25, K1, Z3                            // 629134415edc
-       //TODO: VDIVPS 15(R8)(R14*1), Z25, K1, Z3                  // 629134415e9c300f000000
-       //TODO: VDIVPS 15(R8)(R14*2), Z25, K1, Z3                  // 629134415e9c700f000000
-       //TODO: VDIVSD X15, X9, K7, X24                            // 6241b70f5ec7
-       //TODO: VDIVSD X21, X18, K1, X26                           // 6221ef015ed5 or 6221ef215ed5 or 6221ef415ed5
-       //TODO: VDIVSD 7(AX)(CX*4), X18, K1, X26                   // 6261ef015e948807000000 or 6261ef215e948807000000 or 6261ef415e948807000000
-       //TODO: VDIVSD 7(AX)(CX*1), X18, K1, X26                   // 6261ef015e940807000000 or 6261ef215e940807000000 or 6261ef415e940807000000
-       //TODO: VDIVSS X31, X11, K1, X1                            // 629126095ecf
-       //TODO: VDIVSS X0, X7, K1, X3                              // 62f146095ed8 or 62f146295ed8 or 62f146495ed8
-       //TODO: VDIVSS 15(DX)(BX*1), X7, K1, X3                    // 62f146095e9c1a0f000000 or 62f146295e9c1a0f000000 or 62f146495e9c1a0f000000
-       //TODO: VDIVSS -7(CX)(DX*2), X7, K1, X3                    // 62f146095e9c51f9ffffff or 62f146295e9c51f9ffffff or 62f146495e9c51f9ffffff
-       //TODO: VEXPANDPD X24, K3, X0                              // 6292fd0b88c0
-       //TODO: VEXPANDPD 7(SI)(DI*4), K3, X0                      // 62f2fd0b8884be07000000
-       //TODO: VEXPANDPD -7(DI)(R8*2), K3, X0                     // 62b2fd0b888447f9ffffff
-       //TODO: VEXPANDPD Y8, K4, Y24                              // 6242fd2c88c0
-       //TODO: VEXPANDPD -17(BP), K4, Y24                         // 6262fd2c8885efffffff
-       //TODO: VEXPANDPD -15(R14)(R15*8), K4, Y24                 // 6202fd2c8884fef1ffffff
-       //TODO: VEXPANDPD Z26, K5, Z30                             // 6202fd4d88f2
-       //TODO: VEXPANDPD Z22, K5, Z30                             // 6222fd4d88f6
-       //TODO: VEXPANDPD (CX), K5, Z30                            // 6262fd4d8831
-       //TODO: VEXPANDPD 99(R15), K5, Z30                         // 6242fd4d88b763000000
-       //TODO: VEXPANDPD Z26, K5, Z5                              // 6292fd4d88ea
-       //TODO: VEXPANDPD Z22, K5, Z5                              // 62b2fd4d88ee
-       //TODO: VEXPANDPD (CX), K5, Z5                             // 62f2fd4d8829
-       //TODO: VEXPANDPD 99(R15), K5, Z5                          // 62d2fd4d88af63000000
-       //TODO: VEXPANDPS X7, K7, X20                              // 62e27d0f88e7
-       //TODO: VEXPANDPS 17(SP), K7, X20                          // 62e27d0f88a42411000000
-       //TODO: VEXPANDPS -17(BP)(SI*4), K7, X20                   // 62e27d0f88a4b5efffffff
-       //TODO: VEXPANDPS Y24, K7, Y11                             // 62127d2f88d8
-       //TODO: VEXPANDPS 17(SP)(BP*2), K7, Y11                    // 62727d2f889c6c11000000
-       //TODO: VEXPANDPS -7(DI)(R8*4), K7, Y11                    // 62327d2f889c87f9ffffff
-       //TODO: VEXPANDPS Z16, K6, Z7                              // 62b27d4e88f8
-       //TODO: VEXPANDPS Z25, K6, Z7                              // 62927d4e88f9
-       //TODO: VEXPANDPS 99(R15)(R15*2), K6, Z7                   // 62927d4e88bc7f63000000
-       //TODO: VEXPANDPS -7(DI), K6, Z7                           // 62f27d4e88bff9ffffff
-       //TODO: VEXPANDPS Z16, K6, Z21                             // 62a27d4e88e8
-       //TODO: VEXPANDPS Z25, K6, Z21                             // 62827d4e88e9
-       //TODO: VEXPANDPS 99(R15)(R15*2), K6, Z21                  // 62827d4e88ac7f63000000
-       //TODO: VEXPANDPS -7(DI), K6, Z21                          // 62e27d4e88aff9ffffff
-       //TODO: VEXTRACTF32X4 $1, Y5, K3, X9                       // 62d37d2b19e901
-       //TODO: VEXTRACTF32X4 $1, Y5, K3, 7(AX)                    // 62f37d2b19a80700000001
-       //TODO: VEXTRACTF32X4 $1, Y5, K3, (DI)                     // 62f37d2b192f01
-       //TODO: VEXTRACTF32X4 $3, Z14, K7, X7                      // 62737d4f19f703
-       //TODO: VEXTRACTF32X4 $3, Z13, K7, X7                      // 62737d4f19ef03
-       //TODO: VEXTRACTF32X4 $3, Z14, K7, 99(R15)(R15*1)          // 62137d4f19b43f6300000003
-       //TODO: VEXTRACTF32X4 $3, Z13, K7, 99(R15)(R15*1)          // 62137d4f19ac3f6300000003
-       //TODO: VEXTRACTF32X4 $3, Z14, K7, (DX)                    // 62737d4f193203
-       //TODO: VEXTRACTF32X4 $3, Z13, K7, (DX)                    // 62737d4f192a03
-       //TODO: VEXTRACTF64X4 $0, Z2, K2, Y16                      // 62b3fd4a1bd000
-       //TODO: VEXTRACTF64X4 $0, Z7, K2, Y16                      // 62b3fd4a1bf800
-       //TODO: VEXTRACTF64X4 $0, Z2, K2, 15(R8)(R14*8)            // 6293fd4a1b94f00f00000000
-       //TODO: VEXTRACTF64X4 $0, Z7, K2, 15(R8)(R14*8)            // 6293fd4a1bbcf00f00000000
-       //TODO: VEXTRACTF64X4 $0, Z2, K2, -15(R14)(R15*2)          // 6293fd4a1b947ef1ffffff00
-       //TODO: VEXTRACTF64X4 $0, Z7, K2, -15(R14)(R15*2)          // 6293fd4a1bbc7ef1ffffff00
-       //TODO: VEXTRACTI32X4 $0, Y9, K5, X31                      // 62137d2d39cf00
-       //TODO: VEXTRACTI32X4 $0, Y9, K5, 7(SI)(DI*1)              // 62737d2d398c3e0700000000
-       //TODO: VEXTRACTI32X4 $0, Y9, K5, 15(DX)(BX*8)             // 62737d2d398cda0f00000000
-       //TODO: VEXTRACTI32X4 $1, Z27, K3, X3                      // 62637d4b39db01
-       //TODO: VEXTRACTI32X4 $1, Z25, K3, X3                      // 62637d4b39cb01
-       //TODO: VEXTRACTI32X4 $1, Z27, K3, -7(DI)(R8*1)            // 62237d4b399c07f9ffffff01
-       //TODO: VEXTRACTI32X4 $1, Z25, K3, -7(DI)(R8*1)            // 62237d4b398c07f9ffffff01
-       //TODO: VEXTRACTI32X4 $1, Z27, K3, (SP)                    // 62637d4b391c2401
-       //TODO: VEXTRACTI32X4 $1, Z25, K3, (SP)                    // 62637d4b390c2401
-       //TODO: VEXTRACTI64X4 $1, Z3, K3, Y6                       // 62f3fd4b3bde01
-       //TODO: VEXTRACTI64X4 $1, Z0, K3, Y6                       // 62f3fd4b3bc601
-       //TODO: VEXTRACTI64X4 $1, Z3, K3, 7(AX)(CX*4)              // 62f3fd4b3b9c880700000001
-       //TODO: VEXTRACTI64X4 $1, Z0, K3, 7(AX)(CX*4)              // 62f3fd4b3b84880700000001
-       //TODO: VEXTRACTI64X4 $1, Z3, K3, 7(AX)(CX*1)              // 62f3fd4b3b9c080700000001
-       //TODO: VEXTRACTI64X4 $1, Z0, K3, 7(AX)(CX*1)              // 62f3fd4b3b84080700000001
-       //TODO: VFIXUPIMMPD $97, X30, X0, K3, X13                  // 6213fd0b54ee61
-       //TODO: VFIXUPIMMPD $97, (AX), X0, K3, X13                 // 6273fd0b542861
-       //TODO: VFIXUPIMMPD $97, 7(SI), X0, K3, X13                // 6273fd0b54ae0700000061
-       //TODO: VFIXUPIMMPD $81, Y6, Y7, K3, Y3                    // 62f3c52b54de51
-       //TODO: VFIXUPIMMPD $81, (SI), Y7, K3, Y3                  // 62f3c52b541e51
-       //TODO: VFIXUPIMMPD $81, 7(SI)(DI*2), Y7, K3, Y3           // 62f3c52b549c7e0700000051
-       //TODO: VFIXUPIMMPD $42, Z22, Z8, K2, Z14                  // 6233bd4a54f62a
-       //TODO: VFIXUPIMMPD $42, Z25, Z8, K2, Z14                  // 6213bd4a54f12a
-       //TODO: VFIXUPIMMPD $42, Z22, Z24, K2, Z14                 // 6233bd4254f62a
-       //TODO: VFIXUPIMMPD $42, Z25, Z24, K2, Z14                 // 6213bd4254f12a
-       //TODO: VFIXUPIMMPD $42, Z22, Z8, K2, Z7                   // 62b3bd4a54fe2a
-       //TODO: VFIXUPIMMPD $42, Z25, Z8, K2, Z7                   // 6293bd4a54f92a
-       //TODO: VFIXUPIMMPD $42, Z22, Z24, K2, Z7                  // 62b3bd4254fe2a
-       //TODO: VFIXUPIMMPD $42, Z25, Z24, K2, Z7                  // 6293bd4254f92a
-       //TODO: VFIXUPIMMPD $79, Z0, Z6, K1, Z1                    // 62f3cd4954c84f
-       //TODO: VFIXUPIMMPD $79, Z8, Z6, K1, Z1                    // 62d3cd4954c84f
-       //TODO: VFIXUPIMMPD $79, -7(CX)(DX*1), Z6, K1, Z1          // 62f3cd49548c11f9ffffff4f
-       //TODO: VFIXUPIMMPD $79, -15(R14)(R15*4), Z6, K1, Z1       // 6293cd49548cbef1ffffff4f
-       //TODO: VFIXUPIMMPD $79, Z0, Z2, K1, Z1                    // 62f3ed4954c84f
-       //TODO: VFIXUPIMMPD $79, Z8, Z2, K1, Z1                    // 62d3ed4954c84f
-       //TODO: VFIXUPIMMPD $79, -7(CX)(DX*1), Z2, K1, Z1          // 62f3ed49548c11f9ffffff4f
-       //TODO: VFIXUPIMMPD $79, -15(R14)(R15*4), Z2, K1, Z1       // 6293ed49548cbef1ffffff4f
-       //TODO: VFIXUPIMMPD $79, Z0, Z6, K1, Z16                   // 62e3cd4954c04f
-       //TODO: VFIXUPIMMPD $79, Z8, Z6, K1, Z16                   // 62c3cd4954c04f
-       //TODO: VFIXUPIMMPD $79, -7(CX)(DX*1), Z6, K1, Z16         // 62e3cd49548411f9ffffff4f
-       //TODO: VFIXUPIMMPD $79, -15(R14)(R15*4), Z6, K1, Z16      // 6283cd495484bef1ffffff4f
-       //TODO: VFIXUPIMMPD $79, Z0, Z2, K1, Z16                   // 62e3ed4954c04f
-       //TODO: VFIXUPIMMPD $79, Z8, Z2, K1, Z16                   // 62c3ed4954c04f
-       //TODO: VFIXUPIMMPD $79, -7(CX)(DX*1), Z2, K1, Z16         // 62e3ed49548411f9ffffff4f
-       //TODO: VFIXUPIMMPD $79, -15(R14)(R15*4), Z2, K1, Z16      // 6283ed495484bef1ffffff4f
-       //TODO: VFIXUPIMMPS $64, X11, X14, K2, X16                 // 62c30d0a54c340
-       //TODO: VFIXUPIMMPS $64, (BX), X14, K2, X16                // 62e30d0a540340
-       //TODO: VFIXUPIMMPS $64, -17(BP)(SI*1), X14, K2, X16       // 62e30d0a548435efffffff40
-       //TODO: VFIXUPIMMPS $27, Y26, Y11, K1, Y26                 // 6203252954d21b
-       //TODO: VFIXUPIMMPS $27, 17(SP)(BP*8), Y11, K1, Y26        // 626325295494ec110000001b
-       //TODO: VFIXUPIMMPS $27, 17(SP)(BP*4), Y11, K1, Y26        // 626325295494ac110000001b
-       //TODO: VFIXUPIMMPS $47, Z11, Z14, K7, Z15                 // 62530d4f54fb2f
-       //TODO: VFIXUPIMMPS $47, Z5, Z14, K7, Z15                  // 62730d4f54fd2f
-       //TODO: VFIXUPIMMPS $47, Z11, Z27, K7, Z15                 // 6253254754fb2f
-       //TODO: VFIXUPIMMPS $47, Z5, Z27, K7, Z15                  // 6273254754fd2f
-       //TODO: VFIXUPIMMPS $47, Z11, Z14, K7, Z12                 // 62530d4f54e32f
-       //TODO: VFIXUPIMMPS $47, Z5, Z14, K7, Z12                  // 62730d4f54e52f
-       //TODO: VFIXUPIMMPS $47, Z11, Z27, K7, Z12                 // 6253254754e32f
-       //TODO: VFIXUPIMMPS $47, Z5, Z27, K7, Z12                  // 6273254754e52f
-       //TODO: VFIXUPIMMPS $82, Z2, Z5, K1, Z13                   // 6273554954ea52
-       //TODO: VFIXUPIMMPS $82, 15(DX)(BX*1), Z5, K1, Z13         // 6273554954ac1a0f00000052
-       //TODO: VFIXUPIMMPS $82, -7(CX)(DX*2), Z5, K1, Z13         // 6273554954ac51f9ffffff52
-       //TODO: VFIXUPIMMPS $82, Z2, Z23, K1, Z13                  // 6273454154ea52
-       //TODO: VFIXUPIMMPS $82, 15(DX)(BX*1), Z23, K1, Z13        // 6273454154ac1a0f00000052
-       //TODO: VFIXUPIMMPS $82, -7(CX)(DX*2), Z23, K1, Z13        // 6273454154ac51f9ffffff52
-       //TODO: VFIXUPIMMPS $82, Z2, Z5, K1, Z14                   // 6273554954f252
-       //TODO: VFIXUPIMMPS $82, 15(DX)(BX*1), Z5, K1, Z14         // 6273554954b41a0f00000052
-       //TODO: VFIXUPIMMPS $82, -7(CX)(DX*2), Z5, K1, Z14         // 6273554954b451f9ffffff52
-       //TODO: VFIXUPIMMPS $82, Z2, Z23, K1, Z14                  // 6273454154f252
-       //TODO: VFIXUPIMMPS $82, 15(DX)(BX*1), Z23, K1, Z14        // 6273454154b41a0f00000052
-       //TODO: VFIXUPIMMPS $82, -7(CX)(DX*2), Z23, K1, Z14        // 6273454154b451f9ffffff52
-       //TODO: VFIXUPIMMSD $126, X8, X19, K1, X14                 // 6253e50155f07e
-       //TODO: VFIXUPIMMSD $94, X23, X26, K1, X8                  // 6233ad0155c75e or 6233ad2155c75e or 6233ad4155c75e
-       //TODO: VFIXUPIMMSD $94, (SI), X26, K1, X8                 // 6273ad0155065e or 6273ad2155065e or 6273ad4155065e
-       //TODO: VFIXUPIMMSD $94, 7(SI)(DI*2), X26, K1, X8          // 6273ad0155847e070000005e or 6273ad2155847e070000005e or 6273ad4155847e070000005e
-       //TODO: VFIXUPIMMSS $121, X23, X16, K7, X12                // 62337d0755e779
-       //TODO: VFIXUPIMMSS $13, X31, X11, K2, X23                 // 6283250a55ff0d or 6283252a55ff0d or 6283254a55ff0d
-       //TODO: VFIXUPIMMSS $13, 17(SP)(BP*2), X11, K2, X23        // 62e3250a55bc6c110000000d or 62e3252a55bc6c110000000d or 62e3254a55bc6c110000000d
-       //TODO: VFIXUPIMMSS $13, -7(DI)(R8*4), X11, K2, X23        // 62a3250a55bc87f9ffffff0d or 62a3252a55bc87f9ffffff0d or 62a3254a55bc87f9ffffff0d
-       //TODO: VFMADD132PD X0, X14, K4, X24                       // 62628d0c98c0
-       //TODO: VFMADD132PD 15(R8)(R14*4), X14, K4, X24            // 62028d0c9884b00f000000
-       //TODO: VFMADD132PD -7(CX)(DX*4), X14, K4, X24             // 62628d0c988491f9ffffff
-       //TODO: VFMADD132PD Y18, Y14, K1, Y12                      // 62328d2998e2
-       //TODO: VFMADD132PD 7(SI)(DI*4), Y14, K1, Y12              // 62728d2998a4be07000000
-       //TODO: VFMADD132PD -7(DI)(R8*2), Y14, K1, Y12             // 62328d2998a447f9ffffff
-       //TODO: VFMADD132PD Z28, Z26, K3, Z6                       // 6292ad4398f4
-       //TODO: VFMADD132PD Z6, Z26, K3, Z6                        // 62f2ad4398f6
-       //TODO: VFMADD132PD Z28, Z14, K3, Z6                       // 62928d4b98f4
-       //TODO: VFMADD132PD Z6, Z14, K3, Z6                        // 62f28d4b98f6
-       //TODO: VFMADD132PD Z28, Z26, K3, Z14                      // 6212ad4398f4
-       //TODO: VFMADD132PD Z6, Z26, K3, Z14                       // 6272ad4398f6
-       //TODO: VFMADD132PD Z28, Z14, K3, Z14                      // 62128d4b98f4
-       //TODO: VFMADD132PD Z6, Z14, K3, Z14                       // 62728d4b98f6
-       //TODO: VFMADD132PD Z3, Z26, K4, Z13                       // 6272ad4498eb
-       //TODO: VFMADD132PD Z0, Z26, K4, Z13                       // 6272ad4498e8
-       //TODO: VFMADD132PD -17(BP), Z26, K4, Z13                  // 6272ad4498adefffffff
-       //TODO: VFMADD132PD -15(R14)(R15*8), Z26, K4, Z13          // 6212ad4498acfef1ffffff
-       //TODO: VFMADD132PD Z3, Z3, K4, Z13                        // 6272e54c98eb
-       //TODO: VFMADD132PD Z0, Z3, K4, Z13                        // 6272e54c98e8
-       //TODO: VFMADD132PD -17(BP), Z3, K4, Z13                   // 6272e54c98adefffffff
-       //TODO: VFMADD132PD -15(R14)(R15*8), Z3, K4, Z13           // 6212e54c98acfef1ffffff
-       //TODO: VFMADD132PD Z3, Z26, K4, Z21                       // 62e2ad4498eb
-       //TODO: VFMADD132PD Z0, Z26, K4, Z21                       // 62e2ad4498e8
-       //TODO: VFMADD132PD -17(BP), Z26, K4, Z21                  // 62e2ad4498adefffffff
-       //TODO: VFMADD132PD -15(R14)(R15*8), Z26, K4, Z21          // 6282ad4498acfef1ffffff
-       //TODO: VFMADD132PD Z3, Z3, K4, Z21                        // 62e2e54c98eb
-       //TODO: VFMADD132PD Z0, Z3, K4, Z21                        // 62e2e54c98e8
-       //TODO: VFMADD132PD -17(BP), Z3, K4, Z21                   // 62e2e54c98adefffffff
-       //TODO: VFMADD132PD -15(R14)(R15*8), Z3, K4, Z21           // 6282e54c98acfef1ffffff
-       //TODO: VFMADD132PS X2, X23, K5, X11                       // 6272450598da
-       //TODO: VFMADD132PS (R8), X23, K5, X11                     // 625245059818
-       //TODO: VFMADD132PS 15(DX)(BX*2), X23, K5, X11             // 62724505989c5a0f000000
-       //TODO: VFMADD132PS Y3, Y18, K7, Y31                       // 62626d2798fb
-       //TODO: VFMADD132PS 17(SP), Y18, K7, Y31                   // 62626d2798bc2411000000
-       //TODO: VFMADD132PS -17(BP)(SI*4), Y18, K7, Y31            // 62626d2798bcb5efffffff
-       //TODO: VFMADD132PS Z3, Z11, K7, Z21                       // 62e2254f98eb
-       //TODO: VFMADD132PS Z12, Z11, K7, Z21                      // 62c2254f98ec
-       //TODO: VFMADD132PS Z3, Z25, K7, Z21                       // 62e2354798eb
-       //TODO: VFMADD132PS Z12, Z25, K7, Z21                      // 62c2354798ec
-       //TODO: VFMADD132PS Z3, Z11, K7, Z13                       // 6272254f98eb
-       //TODO: VFMADD132PS Z12, Z11, K7, Z13                      // 6252254f98ec
-       //TODO: VFMADD132PS Z3, Z25, K7, Z13                       // 6272354798eb
-       //TODO: VFMADD132PS Z12, Z25, K7, Z13                      // 6252354798ec
-       //TODO: VFMADD132PS Z23, Z23, K6, Z27                      // 6222454698df
-       //TODO: VFMADD132PS Z6, Z23, K6, Z27                       // 6262454698de
-       //TODO: VFMADD132PS 17(SP)(BP*2), Z23, K6, Z27             // 62624546989c6c11000000
-       //TODO: VFMADD132PS -7(DI)(R8*4), Z23, K6, Z27             // 62224546989c87f9ffffff
-       //TODO: VFMADD132PS Z23, Z5, K6, Z27                       // 6222554e98df
-       //TODO: VFMADD132PS Z6, Z5, K6, Z27                        // 6262554e98de
-       //TODO: VFMADD132PS 17(SP)(BP*2), Z5, K6, Z27              // 6262554e989c6c11000000
-       //TODO: VFMADD132PS -7(DI)(R8*4), Z5, K6, Z27              // 6222554e989c87f9ffffff
-       //TODO: VFMADD132PS Z23, Z23, K6, Z15                      // 6232454698ff
-       //TODO: VFMADD132PS Z6, Z23, K6, Z15                       // 6272454698fe
-       //TODO: VFMADD132PS 17(SP)(BP*2), Z23, K6, Z15             // 6272454698bc6c11000000
-       //TODO: VFMADD132PS -7(DI)(R8*4), Z23, K6, Z15             // 6232454698bc87f9ffffff
-       //TODO: VFMADD132PS Z23, Z5, K6, Z15                       // 6232554e98ff
-       //TODO: VFMADD132PS Z6, Z5, K6, Z15                        // 6272554e98fe
-       //TODO: VFMADD132PS 17(SP)(BP*2), Z5, K6, Z15              // 6272554e98bc6c11000000
-       //TODO: VFMADD132PS -7(DI)(R8*4), Z5, K6, Z15              // 6232554e98bc87f9ffffff
-       //TODO: VFMADD132SD X25, X5, K3, X20                       // 6282d50b99e1
-       //TODO: VFMADD132SD X13, X9, K7, X0                        // 62d2b50f99c5 or 62d2b52f99c5 or 62d2b54f99c5
-       //TODO: VFMADD132SD 17(SP)(BP*8), X9, K7, X0               // 62f2b50f9984ec11000000 or 62f2b52f9984ec11000000 or 62f2b54f9984ec11000000
-       //TODO: VFMADD132SD 17(SP)(BP*4), X9, K7, X0               // 62f2b50f9984ac11000000 or 62f2b52f9984ac11000000 or 62f2b54f9984ac11000000
-       //TODO: VFMADD132SS X9, X8, K4, X2                         // 62d23d0c99d1
-       //TODO: VFMADD132SS X11, X31, K4, X2                       // 62d2050499d3 or 62d2052499d3 or 62d2054499d3
-       //TODO: VFMADD132SS 15(R8), X31, K4, X2                    // 62d2050499900f000000 or 62d2052499900f000000 or 62d2054499900f000000
-       //TODO: VFMADD132SS (BP), X31, K4, X2                      // 62f20504995500 or 62f20524995500 or 62f20544995500
-       //TODO: VFMADD213PD X14, X5, K7, X22                       // 62c2d50fa8f6
-       //TODO: VFMADD213PD 17(SP)(BP*1), X5, K7, X22              // 62e2d50fa8b42c11000000
-       //TODO: VFMADD213PD -7(CX)(DX*8), X5, K7, X22              // 62e2d50fa8b4d1f9ffffff
-       //TODO: VFMADD213PD Y7, Y2, K2, Y24                        // 6262ed2aa8c7
-       //TODO: VFMADD213PD 7(AX), Y2, K2, Y24                     // 6262ed2aa88007000000
-       //TODO: VFMADD213PD (DI), Y2, K2, Y24                      // 6262ed2aa807
-       //TODO: VFMADD213PD Z16, Z21, K5, Z8                       // 6232d545a8c0
-       //TODO: VFMADD213PD Z13, Z21, K5, Z8                       // 6252d545a8c5
-       //TODO: VFMADD213PD Z16, Z5, K5, Z8                        // 6232d54da8c0
-       //TODO: VFMADD213PD Z13, Z5, K5, Z8                        // 6252d54da8c5
-       //TODO: VFMADD213PD Z16, Z21, K5, Z28                      // 6222d545a8e0
-       //TODO: VFMADD213PD Z13, Z21, K5, Z28                      // 6242d545a8e5
-       //TODO: VFMADD213PD Z16, Z5, K5, Z28                       // 6222d54da8e0
-       //TODO: VFMADD213PD Z13, Z5, K5, Z28                       // 6242d54da8e5
-       //TODO: VFMADD213PD Z6, Z22, K3, Z12                       // 6272cd43a8e6
-       //TODO: VFMADD213PD Z8, Z22, K3, Z12                       // 6252cd43a8e0
-       //TODO: VFMADD213PD 15(R8), Z22, K3, Z12                   // 6252cd43a8a00f000000
-       //TODO: VFMADD213PD (BP), Z22, K3, Z12                     // 6272cd43a86500
-       //TODO: VFMADD213PD Z6, Z11, K3, Z12                       // 6272a54ba8e6
-       //TODO: VFMADD213PD Z8, Z11, K3, Z12                       // 6252a54ba8e0
-       //TODO: VFMADD213PD 15(R8), Z11, K3, Z12                   // 6252a54ba8a00f000000
-       //TODO: VFMADD213PD (BP), Z11, K3, Z12                     // 6272a54ba86500
-       //TODO: VFMADD213PD Z6, Z22, K3, Z27                       // 6262cd43a8de
-       //TODO: VFMADD213PD Z8, Z22, K3, Z27                       // 6242cd43a8d8
-       //TODO: VFMADD213PD 15(R8), Z22, K3, Z27                   // 6242cd43a8980f000000
-       //TODO: VFMADD213PD (BP), Z22, K3, Z27                     // 6262cd43a85d00
-       //TODO: VFMADD213PD Z6, Z11, K3, Z27                       // 6262a54ba8de
-       //TODO: VFMADD213PD Z8, Z11, K3, Z27                       // 6242a54ba8d8
-       //TODO: VFMADD213PD 15(R8), Z11, K3, Z27                   // 6242a54ba8980f000000
-       //TODO: VFMADD213PD (BP), Z11, K3, Z27                     // 6262a54ba85d00
-       //TODO: VFMADD213PS X7, X17, K4, X0                        // 62f27504a8c7
-       //TODO: VFMADD213PS -17(BP)(SI*2), X17, K4, X0             // 62f27504a88475efffffff
-       //TODO: VFMADD213PS 7(AX)(CX*2), X17, K4, X0               // 62f27504a8844807000000
-       //TODO: VFMADD213PS Y8, Y14, K2, Y21                       // 62c20d2aa8e8
-       //TODO: VFMADD213PS 99(R15)(R15*1), Y14, K2, Y21           // 62820d2aa8ac3f63000000
-       //TODO: VFMADD213PS (DX), Y14, K2, Y21                     // 62e20d2aa82a
-       //TODO: VFMADD213PS Z9, Z12, K2, Z25                       // 62421d4aa8c9
-       //TODO: VFMADD213PS Z12, Z12, K2, Z25                      // 62421d4aa8cc
-       //TODO: VFMADD213PS Z9, Z17, K2, Z25                       // 62427542a8c9
-       //TODO: VFMADD213PS Z12, Z17, K2, Z25                      // 62427542a8cc
-       //TODO: VFMADD213PS Z9, Z12, K2, Z12                       // 62521d4aa8e1
-       //TODO: VFMADD213PS Z12, Z12, K2, Z12                      // 62521d4aa8e4
-       //TODO: VFMADD213PS Z9, Z17, K2, Z12                       // 62527542a8e1
-       //TODO: VFMADD213PS Z12, Z17, K2, Z12                      // 62527542a8e4
-       //TODO: VFMADD213PS Z8, Z3, K3, Z6                         // 62d2654ba8f0
-       //TODO: VFMADD213PS Z2, Z3, K3, Z6                         // 62f2654ba8f2
-       //TODO: VFMADD213PS 15(R8)(R14*8), Z3, K3, Z6              // 6292654ba8b4f00f000000
-       //TODO: VFMADD213PS -15(R14)(R15*2), Z3, K3, Z6            // 6292654ba8b47ef1ffffff
-       //TODO: VFMADD213PS Z8, Z21, K3, Z6                        // 62d25543a8f0
-       //TODO: VFMADD213PS Z2, Z21, K3, Z6                        // 62f25543a8f2
-       //TODO: VFMADD213PS 15(R8)(R14*8), Z21, K3, Z6             // 62925543a8b4f00f000000
-       //TODO: VFMADD213PS -15(R14)(R15*2), Z21, K3, Z6           // 62925543a8b47ef1ffffff
-       //TODO: VFMADD213PS Z8, Z3, K3, Z25                        // 6242654ba8c8
-       //TODO: VFMADD213PS Z2, Z3, K3, Z25                        // 6262654ba8ca
-       //TODO: VFMADD213PS 15(R8)(R14*8), Z3, K3, Z25             // 6202654ba88cf00f000000
-       //TODO: VFMADD213PS -15(R14)(R15*2), Z3, K3, Z25           // 6202654ba88c7ef1ffffff
-       //TODO: VFMADD213PS Z8, Z21, K3, Z25                       // 62425543a8c8
-       //TODO: VFMADD213PS Z2, Z21, K3, Z25                       // 62625543a8ca
-       //TODO: VFMADD213PS 15(R8)(R14*8), Z21, K3, Z25            // 62025543a88cf00f000000
-       //TODO: VFMADD213PS -15(R14)(R15*2), Z21, K3, Z25          // 62025543a88c7ef1ffffff
-       //TODO: VFMADD213SD X0, X11, K3, X15                       // 6272a50ba9f8
-       //TODO: VFMADD213SD X27, X8, K3, X18                       // 6282bd0ba9d3 or 6282bd2ba9d3 or 6282bd4ba9d3
-       //TODO: VFMADD213SD 7(SI)(DI*4), X8, K3, X18               // 62e2bd0ba994be07000000 or 62e2bd2ba994be07000000 or 62e2bd4ba994be07000000
-       //TODO: VFMADD213SD -7(DI)(R8*2), X8, K3, X18              // 62a2bd0ba99447f9ffffff or 62a2bd2ba99447f9ffffff or 62a2bd4ba99447f9ffffff
-       //TODO: VFMADD213SS X18, X3, K2, X25                       // 6222650aa9ca
-       //TODO: VFMADD213SS X15, X28, K1, X15                      // 62521d01a9ff or 62521d21a9ff or 62521d41a9ff
-       //TODO: VFMADD213SS 15(R8)(R14*8), X28, K1, X15            // 62121d01a9bcf00f000000 or 62121d21a9bcf00f000000 or 62121d41a9bcf00f000000
-       //TODO: VFMADD213SS -15(R14)(R15*2), X28, K1, X15          // 62121d01a9bc7ef1ffffff or 62121d21a9bc7ef1ffffff or 62121d41a9bc7ef1ffffff
-       //TODO: VFMADD231PD X8, X13, K2, X7                        // 62d2950ab8f8
-       //TODO: VFMADD231PD 15(R8)(R14*1), X13, K2, X7             // 6292950ab8bc300f000000
-       //TODO: VFMADD231PD 15(R8)(R14*2), X13, K2, X7             // 6292950ab8bc700f000000
-       //TODO: VFMADD231PD Y24, Y11, K1, Y20                      // 6282a529b8e0
-       //TODO: VFMADD231PD -17(BP)(SI*8), Y11, K1, Y20            // 62e2a529b8a4f5efffffff
-       //TODO: VFMADD231PD (R15), Y11, K1, Y20                    // 62c2a529b827
-       //TODO: VFMADD231PD Z0, Z7, K7, Z3                         // 62f2c54fb8d8
-       //TODO: VFMADD231PD Z6, Z7, K7, Z3                         // 62f2c54fb8de
-       //TODO: VFMADD231PD Z0, Z9, K7, Z3                         // 62f2b54fb8d8
-       //TODO: VFMADD231PD Z6, Z9, K7, Z3                         // 62f2b54fb8de
-       //TODO: VFMADD231PD Z0, Z7, K7, Z27                        // 6262c54fb8d8
-       //TODO: VFMADD231PD Z6, Z7, K7, Z27                        // 6262c54fb8de
-       //TODO: VFMADD231PD Z0, Z9, K7, Z27                        // 6262b54fb8d8
-       //TODO: VFMADD231PD Z6, Z9, K7, Z27                        // 6262b54fb8de
-       //TODO: VFMADD231PD Z9, Z3, K1, Z20                        // 62c2e549b8e1
-       //TODO: VFMADD231PD Z19, Z3, K1, Z20                       // 62a2e549b8e3
-       //TODO: VFMADD231PD -15(R14)(R15*1), Z3, K1, Z20           // 6282e549b8a43ef1ffffff
-       //TODO: VFMADD231PD -15(BX), Z3, K1, Z20                   // 62e2e549b8a3f1ffffff
-       //TODO: VFMADD231PD Z9, Z30, K1, Z20                       // 62c28d41b8e1
-       //TODO: VFMADD231PD Z19, Z30, K1, Z20                      // 62a28d41b8e3
-       //TODO: VFMADD231PD -15(R14)(R15*1), Z30, K1, Z20          // 62828d41b8a43ef1ffffff
-       //TODO: VFMADD231PD -15(BX), Z30, K1, Z20                  // 62e28d41b8a3f1ffffff
-       //TODO: VFMADD231PD Z9, Z3, K1, Z28                        // 6242e549b8e1
-       //TODO: VFMADD231PD Z19, Z3, K1, Z28                       // 6222e549b8e3
-       //TODO: VFMADD231PD -15(R14)(R15*1), Z3, K1, Z28           // 6202e549b8a43ef1ffffff
-       //TODO: VFMADD231PD -15(BX), Z3, K1, Z28                   // 6262e549b8a3f1ffffff
-       //TODO: VFMADD231PD Z9, Z30, K1, Z28                       // 62428d41b8e1
-       //TODO: VFMADD231PD Z19, Z30, K1, Z28                      // 62228d41b8e3
-       //TODO: VFMADD231PD -15(R14)(R15*1), Z30, K1, Z28          // 62028d41b8a43ef1ffffff
-       //TODO: VFMADD231PD -15(BX), Z30, K1, Z28                  // 62628d41b8a3f1ffffff
-       //TODO: VFMADD231PS X0, X7, K1, X24                        // 62624509b8c0
-       //TODO: VFMADD231PS (R14), X7, K1, X24                     // 62424509b806
-       //TODO: VFMADD231PS -7(DI)(R8*8), X7, K1, X24              // 62224509b884c7f9ffffff
-       //TODO: VFMADD231PS Y18, Y5, K1, Y1                        // 62b25529b8ca
-       //TODO: VFMADD231PS 7(SI)(DI*8), Y5, K1, Y1                // 62f25529b88cfe07000000
-       //TODO: VFMADD231PS -15(R14), Y5, K1, Y1                   // 62d25529b88ef1ffffff
-       //TODO: VFMADD231PS Z18, Z11, K7, Z12                      // 6232254fb8e2
-       //TODO: VFMADD231PS Z24, Z11, K7, Z12                      // 6212254fb8e0
-       //TODO: VFMADD231PS Z18, Z5, K7, Z12                       // 6232554fb8e2
-       //TODO: VFMADD231PS Z24, Z5, K7, Z12                       // 6212554fb8e0
-       //TODO: VFMADD231PS Z18, Z11, K7, Z22                      // 62a2254fb8f2
-       //TODO: VFMADD231PS Z24, Z11, K7, Z22                      // 6282254fb8f0
-       //TODO: VFMADD231PS Z18, Z5, K7, Z22                       // 62a2554fb8f2
-       //TODO: VFMADD231PS Z24, Z5, K7, Z22                       // 6282554fb8f0
-       //TODO: VFMADD231PS Z6, Z7, K2, Z2                         // 62f2454ab8d6
-       //TODO: VFMADD231PS Z16, Z7, K2, Z2                        // 62b2454ab8d0
-       //TODO: VFMADD231PS 7(AX)(CX*4), Z7, K2, Z2                // 62f2454ab8948807000000
-       //TODO: VFMADD231PS 7(AX)(CX*1), Z7, K2, Z2                // 62f2454ab8940807000000
-       //TODO: VFMADD231PS Z6, Z13, K2, Z2                        // 62f2154ab8d6
-       //TODO: VFMADD231PS Z16, Z13, K2, Z2                       // 62b2154ab8d0
-       //TODO: VFMADD231PS 7(AX)(CX*4), Z13, K2, Z2               // 62f2154ab8948807000000
-       //TODO: VFMADD231PS 7(AX)(CX*1), Z13, K2, Z2               // 62f2154ab8940807000000
-       //TODO: VFMADD231PS Z6, Z7, K2, Z21                        // 62e2454ab8ee
-       //TODO: VFMADD231PS Z16, Z7, K2, Z21                       // 62a2454ab8e8
-       //TODO: VFMADD231PS 7(AX)(CX*4), Z7, K2, Z21               // 62e2454ab8ac8807000000
-       //TODO: VFMADD231PS 7(AX)(CX*1), Z7, K2, Z21               // 62e2454ab8ac0807000000
-       //TODO: VFMADD231PS Z6, Z13, K2, Z21                       // 62e2154ab8ee
-       //TODO: VFMADD231PS Z16, Z13, K2, Z21                      // 62a2154ab8e8
-       //TODO: VFMADD231PS 7(AX)(CX*4), Z13, K2, Z21              // 62e2154ab8ac8807000000
-       //TODO: VFMADD231PS 7(AX)(CX*1), Z13, K2, Z21              // 62e2154ab8ac0807000000
-       //TODO: VFMADD231SD X11, X1, K4, X22                       // 62c2f50cb9f3
-       //TODO: VFMADD231SD X8, X7, K1, X6                         // 62d2c509b9f0 or 62d2c529b9f0 or 62d2c549b9f0
-       //TODO: VFMADD231SD 17(SP), X7, K1, X6                     // 62f2c509b9b42411000000 or 62f2c529b9b42411000000 or 62f2c549b9b42411000000
-       //TODO: VFMADD231SD -17(BP)(SI*4), X7, K1, X6              // 62f2c509b9b4b5efffffff or 62f2c529b9b4b5efffffff or 62f2c549b9b4b5efffffff
-       //TODO: VFMADD231SS X28, X3, K3, X31                       // 6202650bb9fc
-       //TODO: VFMADD231SS X7, X24, K4, X20                       // 62e23d04b9e7 or 62e23d24b9e7 or 62e23d44b9e7
-       //TODO: VFMADD231SS -15(R14)(R15*1), X24, K4, X20          // 62823d04b9a43ef1ffffff or 62823d24b9a43ef1ffffff or 62823d44b9a43ef1ffffff
-       //TODO: VFMADD231SS -15(BX), X24, K4, X20                  // 62e23d04b9a3f1ffffff or 62e23d24b9a3f1ffffff or 62e23d44b9a3f1ffffff
-       //TODO: VFMADDSUB132PD X12, X16, K5, X20                   // 62c2fd0596e4
-       //TODO: VFMADDSUB132PD 99(R15)(R15*4), X16, K5, X20        // 6282fd0596a4bf63000000
-       //TODO: VFMADDSUB132PD 15(DX), X16, K5, X20                // 62e2fd0596a20f000000
-       //TODO: VFMADDSUB132PD Y9, Y20, K7, Y20                    // 62c2dd2796e1
-       //TODO: VFMADDSUB132PD 7(SI)(DI*1), Y20, K7, Y20           // 62e2dd2796a43e07000000
-       //TODO: VFMADDSUB132PD 15(DX)(BX*8), Y20, K7, Y20          // 62e2dd2796a4da0f000000
-       //TODO: VFMADDSUB132PD Z13, Z1, K7, Z6                     // 62d2f54f96f5
-       //TODO: VFMADDSUB132PD Z13, Z15, K7, Z6                    // 62d2854f96f5
-       //TODO: VFMADDSUB132PD Z13, Z1, K7, Z22                    // 62c2f54f96f5
-       //TODO: VFMADDSUB132PD Z13, Z15, K7, Z22                   // 62c2854f96f5
-       //TODO: VFMADDSUB132PD Z2, Z22, K6, Z18                    // 62e2cd4696d2
-       //TODO: VFMADDSUB132PD Z31, Z22, K6, Z18                   // 6282cd4696d7
-       //TODO: VFMADDSUB132PD (SI), Z22, K6, Z18                  // 62e2cd469616
-       //TODO: VFMADDSUB132PD 7(SI)(DI*2), Z22, K6, Z18           // 62e2cd4696947e07000000
-       //TODO: VFMADDSUB132PD Z2, Z7, K6, Z18                     // 62e2c54e96d2
-       //TODO: VFMADDSUB132PD Z31, Z7, K6, Z18                    // 6282c54e96d7
-       //TODO: VFMADDSUB132PD (SI), Z7, K6, Z18                   // 62e2c54e9616
-       //TODO: VFMADDSUB132PD 7(SI)(DI*2), Z7, K6, Z18            // 62e2c54e96947e07000000
-       //TODO: VFMADDSUB132PD Z2, Z22, K6, Z8                     // 6272cd4696c2
-       //TODO: VFMADDSUB132PD Z31, Z22, K6, Z8                    // 6212cd4696c7
-       //TODO: VFMADDSUB132PD (SI), Z22, K6, Z8                   // 6272cd469606
-       //TODO: VFMADDSUB132PD 7(SI)(DI*2), Z22, K6, Z8            // 6272cd4696847e07000000
-       //TODO: VFMADDSUB132PD Z2, Z7, K6, Z8                      // 6272c54e96c2
-       //TODO: VFMADDSUB132PD Z31, Z7, K6, Z8                     // 6212c54e96c7
-       //TODO: VFMADDSUB132PD (SI), Z7, K6, Z8                    // 6272c54e9606
-       //TODO: VFMADDSUB132PD 7(SI)(DI*2), Z7, K6, Z8             // 6272c54e96847e07000000
-       //TODO: VFMADDSUB132PS X28, X17, K3, X6                    // 6292750396f4
-       //TODO: VFMADDSUB132PS (CX), X17, K3, X6                   // 62f275039631
-       //TODO: VFMADDSUB132PS 99(R15), X17, K3, X6                // 62d2750396b763000000
-       //TODO: VFMADDSUB132PS Y1, Y28, K7, Y28                    // 62621d2796e1
-       //TODO: VFMADDSUB132PS -7(DI)(R8*1), Y28, K7, Y28          // 62221d2796a407f9ffffff
-       //TODO: VFMADDSUB132PS (SP), Y28, K7, Y28                  // 62621d27962424
-       //TODO: VFMADDSUB132PS Z12, Z1, K4, Z20                    // 62c2754c96e4
-       //TODO: VFMADDSUB132PS Z16, Z1, K4, Z20                    // 62a2754c96e0
-       //TODO: VFMADDSUB132PS Z12, Z3, K4, Z20                    // 62c2654c96e4
-       //TODO: VFMADDSUB132PS Z16, Z3, K4, Z20                    // 62a2654c96e0
-       //TODO: VFMADDSUB132PS Z12, Z1, K4, Z9                     // 6252754c96cc
-       //TODO: VFMADDSUB132PS Z16, Z1, K4, Z9                     // 6232754c96c8
-       //TODO: VFMADDSUB132PS Z12, Z3, K4, Z9                     // 6252654c96cc
-       //TODO: VFMADDSUB132PS Z16, Z3, K4, Z9                     // 6232654c96c8
-       //TODO: VFMADDSUB132PS Z3, Z14, K4, Z28                    // 62620d4c96e3
-       //TODO: VFMADDSUB132PS Z12, Z14, K4, Z28                   // 62420d4c96e4
-       //TODO: VFMADDSUB132PS 17(SP)(BP*8), Z14, K4, Z28          // 62620d4c96a4ec11000000
-       //TODO: VFMADDSUB132PS 17(SP)(BP*4), Z14, K4, Z28          // 62620d4c96a4ac11000000
-       //TODO: VFMADDSUB132PS Z3, Z28, K4, Z28                    // 62621d4496e3
-       //TODO: VFMADDSUB132PS Z12, Z28, K4, Z28                   // 62421d4496e4
-       //TODO: VFMADDSUB132PS 17(SP)(BP*8), Z28, K4, Z28          // 62621d4496a4ec11000000
-       //TODO: VFMADDSUB132PS 17(SP)(BP*4), Z28, K4, Z28          // 62621d4496a4ac11000000
-       //TODO: VFMADDSUB132PS Z3, Z14, K4, Z13                    // 62720d4c96eb
-       //TODO: VFMADDSUB132PS Z12, Z14, K4, Z13                   // 62520d4c96ec
-       //TODO: VFMADDSUB132PS 17(SP)(BP*8), Z14, K4, Z13          // 62720d4c96acec11000000
-       //TODO: VFMADDSUB132PS 17(SP)(BP*4), Z14, K4, Z13          // 62720d4c96acac11000000
-       //TODO: VFMADDSUB132PS Z3, Z28, K4, Z13                    // 62721d4496eb
-       //TODO: VFMADDSUB132PS Z12, Z28, K4, Z13                   // 62521d4496ec
-       //TODO: VFMADDSUB132PS 17(SP)(BP*8), Z28, K4, Z13          // 62721d4496acec11000000
-       //TODO: VFMADDSUB132PS 17(SP)(BP*4), Z28, K4, Z13          // 62721d4496acac11000000
-       //TODO: VFMADDSUB213PD X8, X1, K7, X6                      // 62d2f50fa6f0
-       //TODO: VFMADDSUB213PD 99(R15)(R15*2), X1, K7, X6          // 6292f50fa6b47f63000000
-       //TODO: VFMADDSUB213PD -7(DI), X1, K7, X6                  // 62f2f50fa6b7f9ffffff
-       //TODO: VFMADDSUB213PD Y27, Y11, K2, Y8                    // 6212a52aa6c3
-       //TODO: VFMADDSUB213PD -7(CX), Y11, K2, Y8                 // 6272a52aa681f9ffffff
-       //TODO: VFMADDSUB213PD 15(DX)(BX*4), Y11, K2, Y8           // 6272a52aa6849a0f000000
-       //TODO: VFMADDSUB213PD Z5, Z19, K5, Z15                    // 6272e545a6fd
-       //TODO: VFMADDSUB213PD Z1, Z19, K5, Z15                    // 6272e545a6f9
-       //TODO: VFMADDSUB213PD Z5, Z15, K5, Z15                    // 6272854da6fd
-       //TODO: VFMADDSUB213PD Z1, Z15, K5, Z15                    // 6272854da6f9
-       //TODO: VFMADDSUB213PD Z5, Z19, K5, Z30                    // 6262e545a6f5
-       //TODO: VFMADDSUB213PD Z1, Z19, K5, Z30                    // 6262e545a6f1
-       //TODO: VFMADDSUB213PD Z5, Z15, K5, Z30                    // 6262854da6f5
-       //TODO: VFMADDSUB213PD Z1, Z15, K5, Z30                    // 6262854da6f1
-       //TODO: VFMADDSUB213PD Z21, Z14, K3, Z3                    // 62b28d4ba6dd
-       //TODO: VFMADDSUB213PD Z8, Z14, K3, Z3                     // 62d28d4ba6d8
-       //TODO: VFMADDSUB213PD 7(SI)(DI*4), Z14, K3, Z3            // 62f28d4ba69cbe07000000
-       //TODO: VFMADDSUB213PD -7(DI)(R8*2), Z14, K3, Z3           // 62b28d4ba69c47f9ffffff
-       //TODO: VFMADDSUB213PD Z21, Z15, K3, Z3                    // 62b2854ba6dd
-       //TODO: VFMADDSUB213PD Z8, Z15, K3, Z3                     // 62d2854ba6d8
-       //TODO: VFMADDSUB213PD 7(SI)(DI*4), Z15, K3, Z3            // 62f2854ba69cbe07000000
-       //TODO: VFMADDSUB213PD -7(DI)(R8*2), Z15, K3, Z3           // 62b2854ba69c47f9ffffff
-       //TODO: VFMADDSUB213PD Z21, Z14, K3, Z5                    // 62b28d4ba6ed
-       //TODO: VFMADDSUB213PD Z8, Z14, K3, Z5                     // 62d28d4ba6e8
-       //TODO: VFMADDSUB213PD 7(SI)(DI*4), Z14, K3, Z5            // 62f28d4ba6acbe07000000
-       //TODO: VFMADDSUB213PD -7(DI)(R8*2), Z14, K3, Z5           // 62b28d4ba6ac47f9ffffff
-       //TODO: VFMADDSUB213PD Z21, Z15, K3, Z5                    // 62b2854ba6ed
-       //TODO: VFMADDSUB213PD Z8, Z15, K3, Z5                     // 62d2854ba6e8
-       //TODO: VFMADDSUB213PD 7(SI)(DI*4), Z15, K3, Z5            // 62f2854ba6acbe07000000
-       //TODO: VFMADDSUB213PD -7(DI)(R8*2), Z15, K3, Z5           // 62b2854ba6ac47f9ffffff
-       //TODO: VFMADDSUB213PS X0, X6, K4, X8                      // 62724d0ca6c0
-       //TODO: VFMADDSUB213PS -7(CX)(DX*1), X6, K4, X8            // 62724d0ca68411f9ffffff
-       //TODO: VFMADDSUB213PS -15(R14)(R15*4), X6, K4, X8         // 62124d0ca684bef1ffffff
-       //TODO: VFMADDSUB213PS Y12, Y16, K2, Y17                   // 62c27d22a6cc
-       //TODO: VFMADDSUB213PS 99(R15)(R15*8), Y16, K2, Y17        // 62827d22a68cff63000000
-       //TODO: VFMADDSUB213PS 7(AX)(CX*8), Y16, K2, Y17           // 62e27d22a68cc807000000
-       //TODO: VFMADDSUB213PS Z23, Z20, K2, Z16                   // 62a25d42a6c7
-       //TODO: VFMADDSUB213PS Z19, Z20, K2, Z16                   // 62a25d42a6c3
-       //TODO: VFMADDSUB213PS Z23, Z0, K2, Z16                    // 62a27d4aa6c7
-       //TODO: VFMADDSUB213PS Z19, Z0, K2, Z16                    // 62a27d4aa6c3
-       //TODO: VFMADDSUB213PS Z23, Z20, K2, Z9                    // 62325d42a6cf
-       //TODO: VFMADDSUB213PS Z19, Z20, K2, Z9                    // 62325d42a6cb
-       //TODO: VFMADDSUB213PS Z23, Z0, K2, Z9                     // 62327d4aa6cf
-       //TODO: VFMADDSUB213PS Z19, Z0, K2, Z9                     // 62327d4aa6cb
-       //TODO: VFMADDSUB213PS Z24, Z0, K3, Z0                     // 62927d4ba6c0
-       //TODO: VFMADDSUB213PS Z12, Z0, K3, Z0                     // 62d27d4ba6c4
-       //TODO: VFMADDSUB213PS 17(SP), Z0, K3, Z0                  // 62f27d4ba6842411000000
-       //TODO: VFMADDSUB213PS -17(BP)(SI*4), Z0, K3, Z0           // 62f27d4ba684b5efffffff
-       //TODO: VFMADDSUB213PS Z24, Z25, K3, Z0                    // 62923543a6c0
-       //TODO: VFMADDSUB213PS Z12, Z25, K3, Z0                    // 62d23543a6c4
-       //TODO: VFMADDSUB213PS 17(SP), Z25, K3, Z0                 // 62f23543a6842411000000
-       //TODO: VFMADDSUB213PS -17(BP)(SI*4), Z25, K3, Z0          // 62f23543a684b5efffffff
-       //TODO: VFMADDSUB213PS Z24, Z0, K3, Z11                    // 62127d4ba6d8
-       //TODO: VFMADDSUB213PS Z12, Z0, K3, Z11                    // 62527d4ba6dc
-       //TODO: VFMADDSUB213PS 17(SP), Z0, K3, Z11                 // 62727d4ba69c2411000000
-       //TODO: VFMADDSUB213PS -17(BP)(SI*4), Z0, K3, Z11          // 62727d4ba69cb5efffffff
-       //TODO: VFMADDSUB213PS Z24, Z25, K3, Z11                   // 62123543a6d8
-       //TODO: VFMADDSUB213PS Z12, Z25, K3, Z11                   // 62523543a6dc
-       //TODO: VFMADDSUB213PS 17(SP), Z25, K3, Z11                // 62723543a69c2411000000
-       //TODO: VFMADDSUB213PS -17(BP)(SI*4), Z25, K3, Z11         // 62723543a69cb5efffffff
-       //TODO: VFMADDSUB231PD X6, X16, K3, X11                    // 6272fd03b6de
-       //TODO: VFMADDSUB231PD 15(DX)(BX*1), X16, K3, X11          // 6272fd03b69c1a0f000000
-       //TODO: VFMADDSUB231PD -7(CX)(DX*2), X16, K3, X11          // 6272fd03b69c51f9ffffff
-       //TODO: VFMADDSUB231PD Y3, Y26, K3, Y6                     // 62f2ad23b6f3
-       //TODO: VFMADDSUB231PD (AX), Y26, K3, Y6                   // 62f2ad23b630
-       //TODO: VFMADDSUB231PD 7(SI), Y26, K3, Y6                  // 62f2ad23b6b607000000
-       //TODO: VFMADDSUB231PD Z9, Z9, K2, Z0                      // 62d2b54ab6c1
-       //TODO: VFMADDSUB231PD Z25, Z9, K2, Z0                     // 6292b54ab6c1
-       //TODO: VFMADDSUB231PD Z9, Z3, K2, Z0                      // 62d2e54ab6c1
-       //TODO: VFMADDSUB231PD Z25, Z3, K2, Z0                     // 6292e54ab6c1
-       //TODO: VFMADDSUB231PD Z9, Z9, K2, Z26                     // 6242b54ab6d1
-       //TODO: VFMADDSUB231PD Z25, Z9, K2, Z26                    // 6202b54ab6d1
-       //TODO: VFMADDSUB231PD Z9, Z3, K2, Z26                     // 6242e54ab6d1
-       //TODO: VFMADDSUB231PD Z25, Z3, K2, Z26                    // 6202e54ab6d1
-       //TODO: VFMADDSUB231PD Z17, Z20, K1, Z9                    // 6232dd41b6c9
-       //TODO: VFMADDSUB231PD Z0, Z20, K1, Z9                     // 6272dd41b6c8
-       //TODO: VFMADDSUB231PD 7(AX), Z20, K1, Z9                  // 6272dd41b68807000000
-       //TODO: VFMADDSUB231PD (DI), Z20, K1, Z9                   // 6272dd41b60f
-       //TODO: VFMADDSUB231PD Z17, Z0, K1, Z9                     // 6232fd49b6c9
-       //TODO: VFMADDSUB231PD Z0, Z0, K1, Z9                      // 6272fd49b6c8
-       //TODO: VFMADDSUB231PD 7(AX), Z0, K1, Z9                   // 6272fd49b68807000000
-       //TODO: VFMADDSUB231PD (DI), Z0, K1, Z9                    // 6272fd49b60f
-       //TODO: VFMADDSUB231PD Z17, Z20, K1, Z28                   // 6222dd41b6e1
-       //TODO: VFMADDSUB231PD Z0, Z20, K1, Z28                    // 6262dd41b6e0
-       //TODO: VFMADDSUB231PD 7(AX), Z20, K1, Z28                 // 6262dd41b6a007000000
-       //TODO: VFMADDSUB231PD (DI), Z20, K1, Z28                  // 6262dd41b627
-       //TODO: VFMADDSUB231PD Z17, Z0, K1, Z28                    // 6222fd49b6e1
-       //TODO: VFMADDSUB231PD Z0, Z0, K1, Z28                     // 6262fd49b6e0
-       //TODO: VFMADDSUB231PD 7(AX), Z0, K1, Z28                  // 6262fd49b6a007000000
-       //TODO: VFMADDSUB231PD (DI), Z0, K1, Z28                   // 6262fd49b627
-       //TODO: VFMADDSUB231PS X12, X22, K2, X6                    // 62d24d02b6f4
-       //TODO: VFMADDSUB231PS -17(BP), X22, K2, X6                // 62f24d02b6b5efffffff
-       //TODO: VFMADDSUB231PS -15(R14)(R15*8), X22, K2, X6        // 62924d02b6b4fef1ffffff
-       //TODO: VFMADDSUB231PS Y1, Y28, K1, Y8                     // 62721d21b6c1
-       //TODO: VFMADDSUB231PS (BX), Y28, K1, Y8                   // 62721d21b603
-       //TODO: VFMADDSUB231PS -17(BP)(SI*1), Y28, K1, Y8          // 62721d21b68435efffffff
-       //TODO: VFMADDSUB231PS Z21, Z31, K7, Z17                   // 62a20547b6cd
-       //TODO: VFMADDSUB231PS Z9, Z31, K7, Z17                    // 62c20547b6c9
-       //TODO: VFMADDSUB231PS Z21, Z0, K7, Z17                    // 62a27d4fb6cd
-       //TODO: VFMADDSUB231PS Z9, Z0, K7, Z17                     // 62c27d4fb6c9
-       //TODO: VFMADDSUB231PS Z21, Z31, K7, Z23                   // 62a20547b6fd
-       //TODO: VFMADDSUB231PS Z9, Z31, K7, Z23                    // 62c20547b6f9
-       //TODO: VFMADDSUB231PS Z21, Z0, K7, Z23                    // 62a27d4fb6fd
-       //TODO: VFMADDSUB231PS Z9, Z0, K7, Z23                     // 62c27d4fb6f9
-       //TODO: VFMADDSUB231PS Z20, Z1, K1, Z6                     // 62b27549b6f4
-       //TODO: VFMADDSUB231PS Z9, Z1, K1, Z6                      // 62d27549b6f1
-       //TODO: VFMADDSUB231PS 99(R15)(R15*1), Z1, K1, Z6          // 62927549b6b43f63000000
-       //TODO: VFMADDSUB231PS (DX), Z1, K1, Z6                    // 62f27549b632
-       //TODO: VFMADDSUB231PS Z20, Z9, K1, Z6                     // 62b23549b6f4
-       //TODO: VFMADDSUB231PS Z9, Z9, K1, Z6                      // 62d23549b6f1
-       //TODO: VFMADDSUB231PS 99(R15)(R15*1), Z9, K1, Z6          // 62923549b6b43f63000000
-       //TODO: VFMADDSUB231PS (DX), Z9, K1, Z6                    // 62f23549b632
-       //TODO: VFMADDSUB231PS Z20, Z1, K1, Z9                     // 62327549b6cc
-       //TODO: VFMADDSUB231PS Z9, Z1, K1, Z9                      // 62527549b6c9
-       //TODO: VFMADDSUB231PS 99(R15)(R15*1), Z1, K1, Z9          // 62127549b68c3f63000000
-       //TODO: VFMADDSUB231PS (DX), Z1, K1, Z9                    // 62727549b60a
-       //TODO: VFMADDSUB231PS Z20, Z9, K1, Z9                     // 62323549b6cc
-       //TODO: VFMADDSUB231PS Z9, Z9, K1, Z9                      // 62523549b6c9
-       //TODO: VFMADDSUB231PS 99(R15)(R15*1), Z9, K1, Z9          // 62123549b68c3f63000000
-       //TODO: VFMADDSUB231PS (DX), Z9, K1, Z9                    // 62723549b60a
-       //TODO: VFMSUB132PD X8, X28, K1, X16                       // 62c29d019ac0
-       //TODO: VFMSUB132PD 17(SP)(BP*2), X28, K1, X16             // 62e29d019a846c11000000
-       //TODO: VFMSUB132PD -7(DI)(R8*4), X28, K1, X16             // 62a29d019a8487f9ffffff
-       //TODO: VFMSUB132PD Y31, Y14, K1, Y23                      // 62828d299aff
-       //TODO: VFMSUB132PD 15(R8)(R14*4), Y14, K1, Y23            // 62828d299abcb00f000000
-       //TODO: VFMSUB132PD -7(CX)(DX*4), Y14, K1, Y23             // 62e28d299abc91f9ffffff
-       //TODO: VFMSUB132PD Z7, Z26, K7, Z30                       // 6262ad479af7
-       //TODO: VFMSUB132PD Z21, Z26, K7, Z30                      // 6222ad479af5
-       //TODO: VFMSUB132PD Z7, Z22, K7, Z30                       // 6262cd479af7
-       //TODO: VFMSUB132PD Z21, Z22, K7, Z30                      // 6222cd479af5
-       //TODO: VFMSUB132PD Z7, Z26, K7, Z5                        // 62f2ad479aef
-       //TODO: VFMSUB132PD Z21, Z26, K7, Z5                       // 62b2ad479aed
-       //TODO: VFMSUB132PD Z7, Z22, K7, Z5                        // 62f2cd479aef
-       //TODO: VFMSUB132PD Z21, Z22, K7, Z5                       // 62b2cd479aed
-       //TODO: VFMSUB132PD Z12, Z14, K2, Z16                      // 62c28d4a9ac4
-       //TODO: VFMSUB132PD Z13, Z14, K2, Z16                      // 62c28d4a9ac5
-       //TODO: VFMSUB132PD -17(BP)(SI*8), Z14, K2, Z16            // 62e28d4a9a84f5efffffff
-       //TODO: VFMSUB132PD (R15), Z14, K2, Z16                    // 62c28d4a9a07
-       //TODO: VFMSUB132PD Z12, Z13, K2, Z16                      // 62c2954a9ac4
-       //TODO: VFMSUB132PD Z13, Z13, K2, Z16                      // 62c2954a9ac5
-       //TODO: VFMSUB132PD -17(BP)(SI*8), Z13, K2, Z16            // 62e2954a9a84f5efffffff
-       //TODO: VFMSUB132PD (R15), Z13, K2, Z16                    // 62c2954a9a07
-       //TODO: VFMSUB132PD Z12, Z14, K2, Z25                      // 62428d4a9acc
-       //TODO: VFMSUB132PD Z13, Z14, K2, Z25                      // 62428d4a9acd
-       //TODO: VFMSUB132PD -17(BP)(SI*8), Z14, K2, Z25            // 62628d4a9a8cf5efffffff
-       //TODO: VFMSUB132PD (R15), Z14, K2, Z25                    // 62428d4a9a0f
-       //TODO: VFMSUB132PD Z12, Z13, K2, Z25                      // 6242954a9acc
-       //TODO: VFMSUB132PD Z13, Z13, K2, Z25                      // 6242954a9acd
-       //TODO: VFMSUB132PD -17(BP)(SI*8), Z13, K2, Z25            // 6262954a9a8cf5efffffff
-       //TODO: VFMSUB132PD (R15), Z13, K2, Z25                    // 6242954a9a0f
-       //TODO: VFMSUB132PS X1, X11, K4, X15                       // 6272250c9af9
-       //TODO: VFMSUB132PS 15(R8), X11, K4, X15                   // 6252250c9ab80f000000
-       //TODO: VFMSUB132PS (BP), X11, K4, X15                     // 6272250c9a7d00
-       //TODO: VFMSUB132PS Y22, Y2, K1, Y25                       // 62226d299ace
-       //TODO: VFMSUB132PS (R8), Y2, K1, Y25                      // 62426d299a08
-       //TODO: VFMSUB132PS 15(DX)(BX*2), Y2, K1, Y25              // 62626d299a8c5a0f000000
-       //TODO: VFMSUB132PS Z27, Z2, K3, Z21                       // 62826d4b9aeb
-       //TODO: VFMSUB132PS Z25, Z2, K3, Z21                       // 62826d4b9ae9
-       //TODO: VFMSUB132PS Z27, Z7, K3, Z21                       // 6282454b9aeb
-       //TODO: VFMSUB132PS Z25, Z7, K3, Z21                       // 6282454b9ae9
-       //TODO: VFMSUB132PS Z27, Z2, K3, Z9                        // 62126d4b9acb
-       //TODO: VFMSUB132PS Z25, Z2, K3, Z9                        // 62126d4b9ac9
-       //TODO: VFMSUB132PS Z27, Z7, K3, Z9                        // 6212454b9acb
-       //TODO: VFMSUB132PS Z25, Z7, K3, Z9                        // 6212454b9ac9
-       //TODO: VFMSUB132PS Z3, Z27, K4, Z23                       // 62e225449afb
-       //TODO: VFMSUB132PS Z0, Z27, K4, Z23                       // 62e225449af8
-       //TODO: VFMSUB132PS 7(SI)(DI*8), Z27, K4, Z23              // 62e225449abcfe07000000
-       //TODO: VFMSUB132PS -15(R14), Z27, K4, Z23                 // 62c225449abef1ffffff
-       //TODO: VFMSUB132PS Z3, Z14, K4, Z23                       // 62e20d4c9afb
-       //TODO: VFMSUB132PS Z0, Z14, K4, Z23                       // 62e20d4c9af8
-       //TODO: VFMSUB132PS 7(SI)(DI*8), Z14, K4, Z23              // 62e20d4c9abcfe07000000
-       //TODO: VFMSUB132PS -15(R14), Z14, K4, Z23                 // 62c20d4c9abef1ffffff
-       //TODO: VFMSUB132PS Z3, Z27, K4, Z9                        // 627225449acb
-       //TODO: VFMSUB132PS Z0, Z27, K4, Z9                        // 627225449ac8
-       //TODO: VFMSUB132PS 7(SI)(DI*8), Z27, K4, Z9               // 627225449a8cfe07000000
-       //TODO: VFMSUB132PS -15(R14), Z27, K4, Z9                  // 625225449a8ef1ffffff
-       //TODO: VFMSUB132PS Z3, Z14, K4, Z9                        // 62720d4c9acb
-       //TODO: VFMSUB132PS Z0, Z14, K4, Z9                        // 62720d4c9ac8
-       //TODO: VFMSUB132PS 7(SI)(DI*8), Z14, K4, Z9               // 62720d4c9a8cfe07000000
-       //TODO: VFMSUB132PS -15(R14), Z14, K4, Z9                  // 62520d4c9a8ef1ffffff
-       //TODO: VFMSUB132SD X2, X13, K5, X19                       // 62e2950d9bda
-       //TODO: VFMSUB132SD X0, X0, K7, X14                        // 6272fd0f9bf0 or 6272fd2f9bf0 or 6272fd4f9bf0
-       //TODO: VFMSUB132SD 7(AX), X0, K7, X14                     // 6272fd0f9bb007000000 or 6272fd2f9bb007000000 or 6272fd4f9bb007000000
-       //TODO: VFMSUB132SD (DI), X0, K7, X14                      // 6272fd0f9b37 or 6272fd2f9b37 or 6272fd4f9b37
-       //TODO: VFMSUB132SS X17, X11, K7, X25                      // 6222250f9bc9
-       //TODO: VFMSUB132SS X9, X11, K6, X18                       // 62c2250e9bd1 or 62c2252e9bd1 or 62c2254e9bd1
-       //TODO: VFMSUB132SS 7(AX)(CX*4), X11, K6, X18              // 62e2250e9b948807000000 or 62e2252e9b948807000000 or 62e2254e9b948807000000
-       //TODO: VFMSUB132SS 7(AX)(CX*1), X11, K6, X18              // 62e2250e9b940807000000 or 62e2252e9b940807000000 or 62e2254e9b940807000000
-       //TODO: VFMSUB213PD X2, X24, K3, X2                        // 62f2bd03aad2
-       //TODO: VFMSUB213PD 15(R8)(R14*8), X24, K3, X2             // 6292bd03aa94f00f000000
-       //TODO: VFMSUB213PD -15(R14)(R15*2), X24, K3, X2           // 6292bd03aa947ef1ffffff
-       //TODO: VFMSUB213PD Y9, Y8, K7, Y27                        // 6242bd2faad9
-       //TODO: VFMSUB213PD 17(SP)(BP*1), Y8, K7, Y27              // 6262bd2faa9c2c11000000
-       //TODO: VFMSUB213PD -7(CX)(DX*8), Y8, K7, Y27              // 6262bd2faa9cd1f9ffffff
-       //TODO: VFMSUB213PD Z22, Z8, K4, Z14                       // 6232bd4caaf6
-       //TODO: VFMSUB213PD Z25, Z8, K4, Z14                       // 6212bd4caaf1
-       //TODO: VFMSUB213PD Z22, Z24, K4, Z14                      // 6232bd44aaf6
-       //TODO: VFMSUB213PD Z25, Z24, K4, Z14                      // 6212bd44aaf1
-       //TODO: VFMSUB213PD Z22, Z8, K4, Z7                        // 62b2bd4caafe
-       //TODO: VFMSUB213PD Z25, Z8, K4, Z7                        // 6292bd4caaf9
-       //TODO: VFMSUB213PD Z22, Z24, K4, Z7                       // 62b2bd44aafe
-       //TODO: VFMSUB213PD Z25, Z24, K4, Z7                       // 6292bd44aaf9
-       //TODO: VFMSUB213PD Z0, Z6, K4, Z1                         // 62f2cd4caac8
-       //TODO: VFMSUB213PD Z8, Z6, K4, Z1                         // 62d2cd4caac8
-       //TODO: VFMSUB213PD 7(SI)(DI*1), Z6, K4, Z1                // 62f2cd4caa8c3e07000000
-       //TODO: VFMSUB213PD 15(DX)(BX*8), Z6, K4, Z1               // 62f2cd4caa8cda0f000000
-       //TODO: VFMSUB213PD Z0, Z2, K4, Z1                         // 62f2ed4caac8
-       //TODO: VFMSUB213PD Z8, Z2, K4, Z1                         // 62d2ed4caac8
-       //TODO: VFMSUB213PD 7(SI)(DI*1), Z2, K4, Z1                // 62f2ed4caa8c3e07000000
-       //TODO: VFMSUB213PD 15(DX)(BX*8), Z2, K4, Z1               // 62f2ed4caa8cda0f000000
-       //TODO: VFMSUB213PD Z0, Z6, K4, Z16                        // 62e2cd4caac0
-       //TODO: VFMSUB213PD Z8, Z6, K4, Z16                        // 62c2cd4caac0
-       //TODO: VFMSUB213PD 7(SI)(DI*1), Z6, K4, Z16               // 62e2cd4caa843e07000000
-       //TODO: VFMSUB213PD 15(DX)(BX*8), Z6, K4, Z16              // 62e2cd4caa84da0f000000
-       //TODO: VFMSUB213PD Z0, Z2, K4, Z16                        // 62e2ed4caac0
-       //TODO: VFMSUB213PD Z8, Z2, K4, Z16                        // 62c2ed4caac0
-       //TODO: VFMSUB213PD 7(SI)(DI*1), Z2, K4, Z16               // 62e2ed4caa843e07000000
-       //TODO: VFMSUB213PD 15(DX)(BX*8), Z2, K4, Z16              // 62e2ed4caa84da0f000000
-       //TODO: VFMSUB213PS X26, X27, K7, X2                       // 62922507aad2
-       //TODO: VFMSUB213PS -15(R14)(R15*1), X27, K7, X2           // 62922507aa943ef1ffffff
-       //TODO: VFMSUB213PS -15(BX), X27, K7, X2                   // 62f22507aa93f1ffffff
-       //TODO: VFMSUB213PS Y14, Y9, K2, Y22                       // 62c2352aaaf6
-       //TODO: VFMSUB213PS -17(BP)(SI*2), Y9, K2, Y22             // 62e2352aaab475efffffff
-       //TODO: VFMSUB213PS 7(AX)(CX*2), Y9, K2, Y22               // 62e2352aaab44807000000
-       //TODO: VFMSUB213PS Z11, Z14, K5, Z15                      // 62520d4daafb
-       //TODO: VFMSUB213PS Z5, Z14, K5, Z15                       // 62720d4daafd
-       //TODO: VFMSUB213PS Z11, Z27, K5, Z15                      // 62522545aafb
-       //TODO: VFMSUB213PS Z5, Z27, K5, Z15                       // 62722545aafd
-       //TODO: VFMSUB213PS Z11, Z14, K5, Z12                      // 62520d4daae3
-       //TODO: VFMSUB213PS Z5, Z14, K5, Z12                       // 62720d4daae5
-       //TODO: VFMSUB213PS Z11, Z27, K5, Z12                      // 62522545aae3
-       //TODO: VFMSUB213PS Z5, Z27, K5, Z12                       // 62722545aae5
-       //TODO: VFMSUB213PS Z2, Z5, K3, Z13                        // 6272554baaea
-       //TODO: VFMSUB213PS -7(DI)(R8*1), Z5, K3, Z13              // 6232554baaac07f9ffffff
-       //TODO: VFMSUB213PS (SP), Z5, K3, Z13                      // 6272554baa2c24
-       //TODO: VFMSUB213PS Z2, Z23, K3, Z13                       // 62724543aaea
-       //TODO: VFMSUB213PS -7(DI)(R8*1), Z23, K3, Z13             // 62324543aaac07f9ffffff
-       //TODO: VFMSUB213PS (SP), Z23, K3, Z13                     // 62724543aa2c24
-       //TODO: VFMSUB213PS Z2, Z5, K3, Z14                        // 6272554baaf2
-       //TODO: VFMSUB213PS -7(DI)(R8*1), Z5, K3, Z14              // 6232554baab407f9ffffff
-       //TODO: VFMSUB213PS (SP), Z5, K3, Z14                      // 6272554baa3424
-       //TODO: VFMSUB213PS Z2, Z23, K3, Z14                       // 62724543aaf2
-       //TODO: VFMSUB213PS -7(DI)(R8*1), Z23, K3, Z14             // 62324543aab407f9ffffff
-       //TODO: VFMSUB213PS (SP), Z23, K3, Z14                     // 62724543aa3424
-       //TODO: VFMSUB213SD X3, X30, K4, X22                       // 62e28d04abf3
-       //TODO: VFMSUB213SD X30, X15, K2, X11                      // 6212850aabde or 6212852aabde or 6212854aabde
-       //TODO: VFMSUB213SD 99(R15)(R15*1), X15, K2, X11           // 6212850aab9c3f63000000 or 6212852aab9c3f63000000 or 6212854aab9c3f63000000
-       //TODO: VFMSUB213SD (DX), X15, K2, X11                     // 6272850aab1a or 6272852aab1a or 6272854aab1a
-       //TODO: VFMSUB213SS X12, X6, K2, X13                       // 62524d0aabec
-       //TODO: VFMSUB213SS X8, X30, K3, X23                       // 62c20d03abf8 or 62c20d23abf8 or 62c20d43abf8
-       //TODO: VFMSUB213SS (SI), X30, K3, X23                     // 62e20d03ab3e or 62e20d23ab3e or 62e20d43ab3e
-       //TODO: VFMSUB213SS 7(SI)(DI*2), X30, K3, X23              // 62e20d03abbc7e07000000 or 62e20d23abbc7e07000000 or 62e20d43abbc7e07000000
-       //TODO: VFMSUB231PD X9, X2, K3, X20                        // 62c2ed0bbae1
-       //TODO: VFMSUB231PD 7(AX)(CX*4), X2, K3, X20               // 62e2ed0bbaa48807000000
-       //TODO: VFMSUB231PD 7(AX)(CX*1), X2, K3, X20               // 62e2ed0bbaa40807000000
-       //TODO: VFMSUB231PD Y1, Y6, K3, Y1                         // 62f2cd2bbac9
-       //TODO: VFMSUB231PD 15(R8)(R14*1), Y6, K3, Y1              // 6292cd2bba8c300f000000
-       //TODO: VFMSUB231PD 15(R8)(R14*2), Y6, K3, Y1              // 6292cd2bba8c700f000000
-       //TODO: VFMSUB231PD Z28, Z26, K2, Z6                       // 6292ad42baf4
-       //TODO: VFMSUB231PD Z6, Z26, K2, Z6                        // 62f2ad42baf6
-       //TODO: VFMSUB231PD Z28, Z14, K2, Z6                       // 62928d4abaf4
-       //TODO: VFMSUB231PD Z6, Z14, K2, Z6                        // 62f28d4abaf6
-       //TODO: VFMSUB231PD Z28, Z26, K2, Z14                      // 6212ad42baf4
-       //TODO: VFMSUB231PD Z6, Z26, K2, Z14                       // 6272ad42baf6
-       //TODO: VFMSUB231PD Z28, Z14, K2, Z14                      // 62128d4abaf4
-       //TODO: VFMSUB231PD Z6, Z14, K2, Z14                       // 62728d4abaf6
-       //TODO: VFMSUB231PD Z3, Z26, K1, Z13                       // 6272ad41baeb
-       //TODO: VFMSUB231PD Z0, Z26, K1, Z13                       // 6272ad41bae8
-       //TODO: VFMSUB231PD -7(CX), Z26, K1, Z13                   // 6272ad41baa9f9ffffff
-       //TODO: VFMSUB231PD 15(DX)(BX*4), Z26, K1, Z13             // 6272ad41baac9a0f000000
-       //TODO: VFMSUB231PD Z3, Z3, K1, Z13                        // 6272e549baeb
-       //TODO: VFMSUB231PD Z0, Z3, K1, Z13                        // 6272e549bae8
-       //TODO: VFMSUB231PD -7(CX), Z3, K1, Z13                    // 6272e549baa9f9ffffff
-       //TODO: VFMSUB231PD 15(DX)(BX*4), Z3, K1, Z13              // 6272e549baac9a0f000000
-       //TODO: VFMSUB231PD Z3, Z26, K1, Z21                       // 62e2ad41baeb
-       //TODO: VFMSUB231PD Z0, Z26, K1, Z21                       // 62e2ad41bae8
-       //TODO: VFMSUB231PD -7(CX), Z26, K1, Z21                   // 62e2ad41baa9f9ffffff
-       //TODO: VFMSUB231PD 15(DX)(BX*4), Z26, K1, Z21             // 62e2ad41baac9a0f000000
-       //TODO: VFMSUB231PD Z3, Z3, K1, Z21                        // 62e2e549baeb
-       //TODO: VFMSUB231PD Z0, Z3, K1, Z21                        // 62e2e549bae8
-       //TODO: VFMSUB231PD -7(CX), Z3, K1, Z21                    // 62e2e549baa9f9ffffff
-       //TODO: VFMSUB231PD 15(DX)(BX*4), Z3, K1, Z21              // 62e2e549baac9a0f000000
-       //TODO: VFMSUB231PS X0, X19, K2, X26                       // 62626502bad0
-       //TODO: VFMSUB231PS (SI), X19, K2, X26                     // 62626502ba16
-       //TODO: VFMSUB231PS 7(SI)(DI*2), X19, K2, X26              // 62626502ba947e07000000
-       //TODO: VFMSUB231PS Y19, Y0, K1, Y9                        // 62327d29bacb
-       //TODO: VFMSUB231PS (R14), Y0, K1, Y9                      // 62527d29ba0e
-       //TODO: VFMSUB231PS -7(DI)(R8*8), Y0, K1, Y9               // 62327d29ba8cc7f9ffffff
-       //TODO: VFMSUB231PS Z3, Z11, K7, Z21                       // 62e2254fbaeb
-       //TODO: VFMSUB231PS Z12, Z11, K7, Z21                      // 62c2254fbaec
-       //TODO: VFMSUB231PS Z3, Z25, K7, Z21                       // 62e23547baeb
-       //TODO: VFMSUB231PS Z12, Z25, K7, Z21                      // 62c23547baec
-       //TODO: VFMSUB231PS Z3, Z11, K7, Z13                       // 6272254fbaeb
-       //TODO: VFMSUB231PS Z12, Z11, K7, Z13                      // 6252254fbaec
-       //TODO: VFMSUB231PS Z3, Z25, K7, Z13                       // 62723547baeb
-       //TODO: VFMSUB231PS Z12, Z25, K7, Z13                      // 62523547baec
-       //TODO: VFMSUB231PS Z23, Z23, K1, Z27                      // 62224541badf
-       //TODO: VFMSUB231PS Z6, Z23, K1, Z27                       // 62624541bade
-       //TODO: VFMSUB231PS 99(R15)(R15*8), Z23, K1, Z27           // 62024541ba9cff63000000
-       //TODO: VFMSUB231PS 7(AX)(CX*8), Z23, K1, Z27              // 62624541ba9cc807000000
-       //TODO: VFMSUB231PS Z23, Z5, K1, Z27                       // 62225549badf
-       //TODO: VFMSUB231PS Z6, Z5, K1, Z27                        // 62625549bade
-       //TODO: VFMSUB231PS 99(R15)(R15*8), Z5, K1, Z27            // 62025549ba9cff63000000
-       //TODO: VFMSUB231PS 7(AX)(CX*8), Z5, K1, Z27               // 62625549ba9cc807000000
-       //TODO: VFMSUB231PS Z23, Z23, K1, Z15                      // 62324541baff
-       //TODO: VFMSUB231PS Z6, Z23, K1, Z15                       // 62724541bafe
-       //TODO: VFMSUB231PS 99(R15)(R15*8), Z23, K1, Z15           // 62124541babcff63000000
-       //TODO: VFMSUB231PS 7(AX)(CX*8), Z23, K1, Z15              // 62724541babcc807000000
-       //TODO: VFMSUB231PS Z23, Z5, K1, Z15                       // 62325549baff
-       //TODO: VFMSUB231PS Z6, Z5, K1, Z15                        // 62725549bafe
-       //TODO: VFMSUB231PS 99(R15)(R15*8), Z5, K1, Z15            // 62125549babcff63000000
-       //TODO: VFMSUB231PS 7(AX)(CX*8), Z5, K1, Z15               // 62725549babcc807000000
-       //TODO: VFMSUB231SD X7, X16, K1, X31                       // 6262fd01bbff
-       //TODO: VFMSUB231SD X0, X1, K1, X8                         // 6272f509bbc0 or 6272f529bbc0 or 6272f549bbc0
-       //TODO: VFMSUB231SD -17(BP)(SI*8), X1, K1, X8              // 6272f509bb84f5efffffff or 6272f529bb84f5efffffff or 6272f549bb84f5efffffff
-       //TODO: VFMSUB231SD (R15), X1, K1, X8                      // 6252f509bb07 or 6252f529bb07 or 6252f549bb07
-       //TODO: VFMSUB231SS X16, X0, K7, X15                       // 62327d0fbbf8
-       //TODO: VFMSUB231SS X28, X0, K2, X21                       // 62827d0abbec or 62827d2abbec or 62827d4abbec
-       //TODO: VFMSUB231SS 17(SP)(BP*8), X0, K2, X21              // 62e27d0abbacec11000000 or 62e27d2abbacec11000000 or 62e27d4abbacec11000000
-       //TODO: VFMSUB231SS 17(SP)(BP*4), X0, K2, X21              // 62e27d0abbacac11000000 or 62e27d2abbacac11000000 or 62e27d4abbacac11000000
-       //TODO: VFMSUBADD132PD X19, X7, K4, X22                    // 62a2c50c97f3
-       //TODO: VFMSUBADD132PD 17(SP)(BP*8), X7, K4, X22           // 62e2c50c97b4ec11000000
-       //TODO: VFMSUBADD132PD 17(SP)(BP*4), X7, K4, X22           // 62e2c50c97b4ac11000000
-       //TODO: VFMSUBADD132PD Y9, Y22, K1, Y31                    // 6242cd2197f9
-       //TODO: VFMSUBADD132PD 99(R15)(R15*4), Y22, K1, Y31        // 6202cd2197bcbf63000000
-       //TODO: VFMSUBADD132PD 15(DX), Y22, K1, Y31                // 6262cd2197ba0f000000
-       //TODO: VFMSUBADD132PD Z16, Z21, K3, Z8                    // 6232d54397c0
-       //TODO: VFMSUBADD132PD Z13, Z21, K3, Z8                    // 6252d54397c5
-       //TODO: VFMSUBADD132PD Z16, Z5, K3, Z8                     // 6232d54b97c0
-       //TODO: VFMSUBADD132PD Z13, Z5, K3, Z8                     // 6252d54b97c5
-       //TODO: VFMSUBADD132PD Z16, Z21, K3, Z28                   // 6222d54397e0
-       //TODO: VFMSUBADD132PD Z13, Z21, K3, Z28                   // 6242d54397e5
-       //TODO: VFMSUBADD132PD Z16, Z5, K3, Z28                    // 6222d54b97e0
-       //TODO: VFMSUBADD132PD Z13, Z5, K3, Z28                    // 6242d54b97e5
-       //TODO: VFMSUBADD132PD Z6, Z22, K4, Z12                    // 6272cd4497e6
-       //TODO: VFMSUBADD132PD Z8, Z22, K4, Z12                    // 6252cd4497e0
-       //TODO: VFMSUBADD132PD (AX), Z22, K4, Z12                  // 6272cd449720
-       //TODO: VFMSUBADD132PD 7(SI), Z22, K4, Z12                 // 6272cd4497a607000000
-       //TODO: VFMSUBADD132PD Z6, Z11, K4, Z12                    // 6272a54c97e6
-       //TODO: VFMSUBADD132PD Z8, Z11, K4, Z12                    // 6252a54c97e0
-       //TODO: VFMSUBADD132PD (AX), Z11, K4, Z12                  // 6272a54c9720
-       //TODO: VFMSUBADD132PD 7(SI), Z11, K4, Z12                 // 6272a54c97a607000000
-       //TODO: VFMSUBADD132PD Z6, Z22, K4, Z27                    // 6262cd4497de
-       //TODO: VFMSUBADD132PD Z8, Z22, K4, Z27                    // 6242cd4497d8
-       //TODO: VFMSUBADD132PD (AX), Z22, K4, Z27                  // 6262cd449718
-       //TODO: VFMSUBADD132PD 7(SI), Z22, K4, Z27                 // 6262cd44979e07000000
-       //TODO: VFMSUBADD132PD Z6, Z11, K4, Z27                    // 6262a54c97de
-       //TODO: VFMSUBADD132PD Z8, Z11, K4, Z27                    // 6242a54c97d8
-       //TODO: VFMSUBADD132PD (AX), Z11, K4, Z27                  // 6262a54c9718
-       //TODO: VFMSUBADD132PD 7(SI), Z11, K4, Z27                 // 6262a54c979e07000000
-       //TODO: VFMSUBADD132PS X31, X16, K5, X7                    // 62927d0597ff
-       //TODO: VFMSUBADD132PS 7(SI)(DI*4), X16, K5, X7            // 62f27d0597bcbe07000000
-       //TODO: VFMSUBADD132PS -7(DI)(R8*2), X16, K5, X7           // 62b27d0597bc47f9ffffff
-       //TODO: VFMSUBADD132PS Y5, Y31, K7, Y23                    // 62e2052797fd
-       //TODO: VFMSUBADD132PS (CX), Y31, K7, Y23                  // 62e205279739
-       //TODO: VFMSUBADD132PS 99(R15), Y31, K7, Y23               // 62c2052797bf63000000
-       //TODO: VFMSUBADD132PS Z9, Z12, K7, Z25                    // 62421d4f97c9
-       //TODO: VFMSUBADD132PS Z12, Z12, K7, Z25                   // 62421d4f97cc
-       //TODO: VFMSUBADD132PS Z9, Z17, K7, Z25                    // 6242754797c9
-       //TODO: VFMSUBADD132PS Z12, Z17, K7, Z25                   // 6242754797cc
-       //TODO: VFMSUBADD132PS Z9, Z12, K7, Z12                    // 62521d4f97e1
-       //TODO: VFMSUBADD132PS Z12, Z12, K7, Z12                   // 62521d4f97e4
-       //TODO: VFMSUBADD132PS Z9, Z17, K7, Z12                    // 6252754797e1
-       //TODO: VFMSUBADD132PS Z12, Z17, K7, Z12                   // 6252754797e4
-       //TODO: VFMSUBADD132PS Z8, Z3, K6, Z6                      // 62d2654e97f0
-       //TODO: VFMSUBADD132PS Z2, Z3, K6, Z6                      // 62f2654e97f2
-       //TODO: VFMSUBADD132PS (BX), Z3, K6, Z6                    // 62f2654e9733
-       //TODO: VFMSUBADD132PS -17(BP)(SI*1), Z3, K6, Z6           // 62f2654e97b435efffffff
-       //TODO: VFMSUBADD132PS Z8, Z21, K6, Z6                     // 62d2554697f0
-       //TODO: VFMSUBADD132PS Z2, Z21, K6, Z6                     // 62f2554697f2
-       //TODO: VFMSUBADD132PS (BX), Z21, K6, Z6                   // 62f255469733
-       //TODO: VFMSUBADD132PS -17(BP)(SI*1), Z21, K6, Z6          // 62f2554697b435efffffff
-       //TODO: VFMSUBADD132PS Z8, Z3, K6, Z25                     // 6242654e97c8
-       //TODO: VFMSUBADD132PS Z2, Z3, K6, Z25                     // 6262654e97ca
-       //TODO: VFMSUBADD132PS (BX), Z3, K6, Z25                   // 6262654e970b
-       //TODO: VFMSUBADD132PS -17(BP)(SI*1), Z3, K6, Z25          // 6262654e978c35efffffff
-       //TODO: VFMSUBADD132PS Z8, Z21, K6, Z25                    // 6242554697c8
-       //TODO: VFMSUBADD132PS Z2, Z21, K6, Z25                    // 6262554697ca
-       //TODO: VFMSUBADD132PS (BX), Z21, K6, Z25                  // 62625546970b
-       //TODO: VFMSUBADD132PS -17(BP)(SI*1), Z21, K6, Z25         // 62625546978c35efffffff
-       //TODO: VFMSUBADD213PD X9, X7, K3, X1                      // 62d2c50ba7c9
-       //TODO: VFMSUBADD213PD 17(SP), X7, K3, X1                  // 62f2c50ba78c2411000000
-       //TODO: VFMSUBADD213PD -17(BP)(SI*4), X7, K3, X1           // 62f2c50ba78cb5efffffff
-       //TODO: VFMSUBADD213PD Y19, Y5, K7, Y0                     // 62b2d52fa7c3
-       //TODO: VFMSUBADD213PD 99(R15)(R15*2), Y5, K7, Y0          // 6292d52fa7847f63000000
-       //TODO: VFMSUBADD213PD -7(DI), Y5, K7, Y0                  // 62f2d52fa787f9ffffff
-       //TODO: VFMSUBADD213PD Z0, Z7, K4, Z3                      // 62f2c54ca7d8
-       //TODO: VFMSUBADD213PD Z6, Z7, K4, Z3                      // 62f2c54ca7de
-       //TODO: VFMSUBADD213PD Z0, Z9, K4, Z3                      // 62f2b54ca7d8
-       //TODO: VFMSUBADD213PD Z6, Z9, K4, Z3                      // 62f2b54ca7de
-       //TODO: VFMSUBADD213PD Z0, Z7, K4, Z27                     // 6262c54ca7d8
-       //TODO: VFMSUBADD213PD Z6, Z7, K4, Z27                     // 6262c54ca7de
-       //TODO: VFMSUBADD213PD Z0, Z9, K4, Z27                     // 6262b54ca7d8
-       //TODO: VFMSUBADD213PD Z6, Z9, K4, Z27                     // 6262b54ca7de
-       //TODO: VFMSUBADD213PD Z9, Z3, K4, Z20                     // 62c2e54ca7e1
-       //TODO: VFMSUBADD213PD Z19, Z3, K4, Z20                    // 62a2e54ca7e3
-       //TODO: VFMSUBADD213PD 15(R8)(R14*4), Z3, K4, Z20          // 6282e54ca7a4b00f000000
-       //TODO: VFMSUBADD213PD -7(CX)(DX*4), Z3, K4, Z20           // 62e2e54ca7a491f9ffffff
-       //TODO: VFMSUBADD213PD Z9, Z30, K4, Z20                    // 62c28d44a7e1
-       //TODO: VFMSUBADD213PD Z19, Z30, K4, Z20                   // 62a28d44a7e3
-       //TODO: VFMSUBADD213PD 15(R8)(R14*4), Z30, K4, Z20         // 62828d44a7a4b00f000000
-       //TODO: VFMSUBADD213PD -7(CX)(DX*4), Z30, K4, Z20          // 62e28d44a7a491f9ffffff
-       //TODO: VFMSUBADD213PD Z9, Z3, K4, Z28                     // 6242e54ca7e1
-       //TODO: VFMSUBADD213PD Z19, Z3, K4, Z28                    // 6222e54ca7e3
-       //TODO: VFMSUBADD213PD 15(R8)(R14*4), Z3, K4, Z28          // 6202e54ca7a4b00f000000
-       //TODO: VFMSUBADD213PD -7(CX)(DX*4), Z3, K4, Z28           // 6262e54ca7a491f9ffffff
-       //TODO: VFMSUBADD213PD Z9, Z30, K4, Z28                    // 62428d44a7e1
-       //TODO: VFMSUBADD213PD Z19, Z30, K4, Z28                   // 62228d44a7e3
-       //TODO: VFMSUBADD213PD 15(R8)(R14*4), Z30, K4, Z28         // 62028d44a7a4b00f000000
-       //TODO: VFMSUBADD213PD -7(CX)(DX*4), Z30, K4, Z28          // 62628d44a7a491f9ffffff
-       //TODO: VFMSUBADD213PS X0, X12, K7, X15                    // 62721d0fa7f8
-       //TODO: VFMSUBADD213PS 7(AX), X12, K7, X15                 // 62721d0fa7b807000000
-       //TODO: VFMSUBADD213PS (DI), X12, K7, X15                  // 62721d0fa73f
-       //TODO: VFMSUBADD213PS Y2, Y28, K2, Y31                    // 62621d22a7fa
-       //TODO: VFMSUBADD213PS -7(CX)(DX*1), Y28, K2, Y31          // 62621d22a7bc11f9ffffff
-       //TODO: VFMSUBADD213PS -15(R14)(R15*4), Y28, K2, Y31       // 62021d22a7bcbef1ffffff
-       //TODO: VFMSUBADD213PS Z18, Z11, K5, Z12                   // 6232254da7e2
-       //TODO: VFMSUBADD213PS Z24, Z11, K5, Z12                   // 6212254da7e0
-       //TODO: VFMSUBADD213PS Z18, Z5, K5, Z12                    // 6232554da7e2
-       //TODO: VFMSUBADD213PS Z24, Z5, K5, Z12                    // 6212554da7e0
-       //TODO: VFMSUBADD213PS Z18, Z11, K5, Z22                   // 62a2254da7f2
-       //TODO: VFMSUBADD213PS Z24, Z11, K5, Z22                   // 6282254da7f0
-       //TODO: VFMSUBADD213PS Z18, Z5, K5, Z22                    // 62a2554da7f2
-       //TODO: VFMSUBADD213PS Z24, Z5, K5, Z22                    // 6282554da7f0
-       //TODO: VFMSUBADD213PS Z6, Z7, K3, Z2                      // 62f2454ba7d6
-       //TODO: VFMSUBADD213PS Z16, Z7, K3, Z2                     // 62b2454ba7d0
-       //TODO: VFMSUBADD213PS (R8), Z7, K3, Z2                    // 62d2454ba710
-       //TODO: VFMSUBADD213PS 15(DX)(BX*2), Z7, K3, Z2            // 62f2454ba7945a0f000000
-       //TODO: VFMSUBADD213PS Z6, Z13, K3, Z2                     // 62f2154ba7d6
-       //TODO: VFMSUBADD213PS Z16, Z13, K3, Z2                    // 62b2154ba7d0
-       //TODO: VFMSUBADD213PS (R8), Z13, K3, Z2                   // 62d2154ba710
-       //TODO: VFMSUBADD213PS 15(DX)(BX*2), Z13, K3, Z2           // 62f2154ba7945a0f000000
-       //TODO: VFMSUBADD213PS Z6, Z7, K3, Z21                     // 62e2454ba7ee
-       //TODO: VFMSUBADD213PS Z16, Z7, K3, Z21                    // 62a2454ba7e8
-       //TODO: VFMSUBADD213PS (R8), Z7, K3, Z21                   // 62c2454ba728
-       //TODO: VFMSUBADD213PS 15(DX)(BX*2), Z7, K3, Z21           // 62e2454ba7ac5a0f000000
-       //TODO: VFMSUBADD213PS Z6, Z13, K3, Z21                    // 62e2154ba7ee
-       //TODO: VFMSUBADD213PS Z16, Z13, K3, Z21                   // 62a2154ba7e8
-       //TODO: VFMSUBADD213PS (R8), Z13, K3, Z21                  // 62c2154ba728
-       //TODO: VFMSUBADD213PS 15(DX)(BX*2), Z13, K3, Z21          // 62e2154ba7ac5a0f000000
-       //TODO: VFMSUBADD231PD X5, X14, K4, X12                    // 62728d0cb7e5
-       //TODO: VFMSUBADD231PD 99(R15)(R15*1), X14, K4, X12        // 62128d0cb7a43f63000000
-       //TODO: VFMSUBADD231PD (DX), X14, K4, X12                  // 62728d0cb722
-       //TODO: VFMSUBADD231PD Y0, Y27, K2, Y24                    // 6262a522b7c0
-       //TODO: VFMSUBADD231PD 15(DX)(BX*1), Y27, K2, Y24          // 6262a522b7841a0f000000
-       //TODO: VFMSUBADD231PD -7(CX)(DX*2), Y27, K2, Y24          // 6262a522b78451f9ffffff
-       //TODO: VFMSUBADD231PD Z13, Z1, K2, Z6                     // 62d2f54ab7f5
-       //TODO: VFMSUBADD231PD Z13, Z15, K2, Z6                    // 62d2854ab7f5
-       //TODO: VFMSUBADD231PD Z13, Z1, K2, Z22                    // 62c2f54ab7f5
-       //TODO: VFMSUBADD231PD Z13, Z15, K2, Z22                   // 62c2854ab7f5
-       //TODO: VFMSUBADD231PD Z2, Z22, K3, Z18                    // 62e2cd43b7d2
-       //TODO: VFMSUBADD231PD Z31, Z22, K3, Z18                   // 6282cd43b7d7
-       //TODO: VFMSUBADD231PD 17(SP)(BP*1), Z22, K3, Z18          // 62e2cd43b7942c11000000
-       //TODO: VFMSUBADD231PD -7(CX)(DX*8), Z22, K3, Z18          // 62e2cd43b794d1f9ffffff
-       //TODO: VFMSUBADD231PD Z2, Z7, K3, Z18                     // 62e2c54bb7d2
-       //TODO: VFMSUBADD231PD Z31, Z7, K3, Z18                    // 6282c54bb7d7
-       //TODO: VFMSUBADD231PD 17(SP)(BP*1), Z7, K3, Z18           // 62e2c54bb7942c11000000
-       //TODO: VFMSUBADD231PD -7(CX)(DX*8), Z7, K3, Z18           // 62e2c54bb794d1f9ffffff
-       //TODO: VFMSUBADD231PD Z2, Z22, K3, Z8                     // 6272cd43b7c2
-       //TODO: VFMSUBADD231PD Z31, Z22, K3, Z8                    // 6212cd43b7c7
-       //TODO: VFMSUBADD231PD 17(SP)(BP*1), Z22, K3, Z8           // 6272cd43b7842c11000000
-       //TODO: VFMSUBADD231PD -7(CX)(DX*8), Z22, K3, Z8           // 6272cd43b784d1f9ffffff
-       //TODO: VFMSUBADD231PD Z2, Z7, K3, Z8                      // 6272c54bb7c2
-       //TODO: VFMSUBADD231PD Z31, Z7, K3, Z8                     // 6212c54bb7c7
-       //TODO: VFMSUBADD231PD 17(SP)(BP*1), Z7, K3, Z8            // 6272c54bb7842c11000000
-       //TODO: VFMSUBADD231PD -7(CX)(DX*8), Z7, K3, Z8            // 6272c54bb784d1f9ffffff
-       //TODO: VFMSUBADD231PS X8, X15, K3, X17                    // 62c2050bb7c8
-       //TODO: VFMSUBADD231PS -17(BP)(SI*8), X15, K3, X17         // 62e2050bb78cf5efffffff
-       //TODO: VFMSUBADD231PS (R15), X15, K3, X17                 // 62c2050bb70f
-       //TODO: VFMSUBADD231PS Y3, Y31, K3, Y11                    // 62720523b7db
-       //TODO: VFMSUBADD231PS -17(BP), Y31, K3, Y11               // 62720523b79defffffff
-       //TODO: VFMSUBADD231PS -15(R14)(R15*8), Y31, K3, Y11       // 62120523b79cfef1ffffff
-       //TODO: VFMSUBADD231PS Z12, Z1, K2, Z20                    // 62c2754ab7e4
-       //TODO: VFMSUBADD231PS Z16, Z1, K2, Z20                    // 62a2754ab7e0
-       //TODO: VFMSUBADD231PS Z12, Z3, K2, Z20                    // 62c2654ab7e4
-       //TODO: VFMSUBADD231PS Z16, Z3, K2, Z20                    // 62a2654ab7e0
-       //TODO: VFMSUBADD231PS Z12, Z1, K2, Z9                     // 6252754ab7cc
-       //TODO: VFMSUBADD231PS Z16, Z1, K2, Z9                     // 6232754ab7c8
-       //TODO: VFMSUBADD231PS Z12, Z3, K2, Z9                     // 6252654ab7cc
-       //TODO: VFMSUBADD231PS Z16, Z3, K2, Z9                     // 6232654ab7c8
-       //TODO: VFMSUBADD231PS Z3, Z14, K1, Z28                    // 62620d49b7e3
-       //TODO: VFMSUBADD231PS Z12, Z14, K1, Z28                   // 62420d49b7e4
-       //TODO: VFMSUBADD231PS -17(BP)(SI*2), Z14, K1, Z28         // 62620d49b7a475efffffff
-       //TODO: VFMSUBADD231PS 7(AX)(CX*2), Z14, K1, Z28           // 62620d49b7a44807000000
-       //TODO: VFMSUBADD231PS Z3, Z28, K1, Z28                    // 62621d41b7e3
-       //TODO: VFMSUBADD231PS Z12, Z28, K1, Z28                   // 62421d41b7e4
-       //TODO: VFMSUBADD231PS -17(BP)(SI*2), Z28, K1, Z28         // 62621d41b7a475efffffff
-       //TODO: VFMSUBADD231PS 7(AX)(CX*2), Z28, K1, Z28           // 62621d41b7a44807000000
-       //TODO: VFMSUBADD231PS Z3, Z14, K1, Z13                    // 62720d49b7eb
-       //TODO: VFMSUBADD231PS Z12, Z14, K1, Z13                   // 62520d49b7ec
-       //TODO: VFMSUBADD231PS -17(BP)(SI*2), Z14, K1, Z13         // 62720d49b7ac75efffffff
-       //TODO: VFMSUBADD231PS 7(AX)(CX*2), Z14, K1, Z13           // 62720d49b7ac4807000000
-       //TODO: VFMSUBADD231PS Z3, Z28, K1, Z13                    // 62721d41b7eb
-       //TODO: VFMSUBADD231PS Z12, Z28, K1, Z13                   // 62521d41b7ec
-       //TODO: VFMSUBADD231PS -17(BP)(SI*2), Z28, K1, Z13         // 62721d41b7ac75efffffff
-       //TODO: VFMSUBADD231PS 7(AX)(CX*2), Z28, K1, Z13           // 62721d41b7ac4807000000
-       //TODO: VFNMADD132PD X23, X26, K2, X3                      // 62b2ad029cdf
-       //TODO: VFNMADD132PD 7(SI)(DI*8), X26, K2, X3              // 62f2ad029c9cfe07000000
-       //TODO: VFNMADD132PD -15(R14), X26, K2, X3                 // 62d2ad029c9ef1ffffff
-       //TODO: VFNMADD132PD Y13, Y2, K1, Y14                      // 6252ed299cf5
-       //TODO: VFNMADD132PD 17(SP)(BP*2), Y2, K1, Y14             // 6272ed299cb46c11000000
-       //TODO: VFNMADD132PD -7(DI)(R8*4), Y2, K1, Y14             // 6232ed299cb487f9ffffff
-       //TODO: VFNMADD132PD Z5, Z19, K7, Z15                      // 6272e5479cfd
-       //TODO: VFNMADD132PD Z1, Z19, K7, Z15                      // 6272e5479cf9
-       //TODO: VFNMADD132PD Z5, Z15, K7, Z15                      // 6272854f9cfd
-       //TODO: VFNMADD132PD Z1, Z15, K7, Z15                      // 6272854f9cf9
-       //TODO: VFNMADD132PD Z5, Z19, K7, Z30                      // 6262e5479cf5
-       //TODO: VFNMADD132PD Z1, Z19, K7, Z30                      // 6262e5479cf1
-       //TODO: VFNMADD132PD Z5, Z15, K7, Z30                      // 6262854f9cf5
-       //TODO: VFNMADD132PD Z1, Z15, K7, Z30                      // 6262854f9cf1
-       //TODO: VFNMADD132PD Z21, Z14, K1, Z3                      // 62b28d499cdd
-       //TODO: VFNMADD132PD Z8, Z14, K1, Z3                       // 62d28d499cd8
-       //TODO: VFNMADD132PD 15(R8)(R14*1), Z14, K1, Z3            // 62928d499c9c300f000000
-       //TODO: VFNMADD132PD 15(R8)(R14*2), Z14, K1, Z3            // 62928d499c9c700f000000
-       //TODO: VFNMADD132PD Z21, Z15, K1, Z3                      // 62b285499cdd
-       //TODO: VFNMADD132PD Z8, Z15, K1, Z3                       // 62d285499cd8
-       //TODO: VFNMADD132PD 15(R8)(R14*1), Z15, K1, Z3            // 629285499c9c300f000000
-       //TODO: VFNMADD132PD 15(R8)(R14*2), Z15, K1, Z3            // 629285499c9c700f000000
-       //TODO: VFNMADD132PD Z21, Z14, K1, Z5                      // 62b28d499ced
-       //TODO: VFNMADD132PD Z8, Z14, K1, Z5                       // 62d28d499ce8
-       //TODO: VFNMADD132PD 15(R8)(R14*1), Z14, K1, Z5            // 62928d499cac300f000000
-       //TODO: VFNMADD132PD 15(R8)(R14*2), Z14, K1, Z5            // 62928d499cac700f000000
-       //TODO: VFNMADD132PD Z21, Z15, K1, Z5                      // 62b285499ced
-       //TODO: VFNMADD132PD Z8, Z15, K1, Z5                       // 62d285499ce8
-       //TODO: VFNMADD132PD 15(R8)(R14*1), Z15, K1, Z5            // 629285499cac300f000000
-       //TODO: VFNMADD132PD 15(R8)(R14*2), Z15, K1, Z5            // 629285499cac700f000000
-       //TODO: VFNMADD132PS X24, X28, K1, X13                     // 62121d019ce8
-       //TODO: VFNMADD132PS 7(SI)(DI*1), X28, K1, X13             // 62721d019cac3e07000000
-       //TODO: VFNMADD132PS 15(DX)(BX*8), X28, K1, X13            // 62721d019cacda0f000000
-       //TODO: VFNMADD132PS Y22, Y15, K1, Y27                     // 622205299cde
-       //TODO: VFNMADD132PS 15(R8), Y15, K1, Y27                  // 624205299c980f000000
-       //TODO: VFNMADD132PS (BP), Y15, K1, Y27                    // 626205299c5d00
-       //TODO: VFNMADD132PS Z23, Z20, K7, Z16                     // 62a25d479cc7
-       //TODO: VFNMADD132PS Z19, Z20, K7, Z16                     // 62a25d479cc3
-       //TODO: VFNMADD132PS Z23, Z0, K7, Z16                      // 62a27d4f9cc7
-       //TODO: VFNMADD132PS Z19, Z0, K7, Z16                      // 62a27d4f9cc3
-       //TODO: VFNMADD132PS Z23, Z20, K7, Z9                      // 62325d479ccf
-       //TODO: VFNMADD132PS Z19, Z20, K7, Z9                      // 62325d479ccb
-       //TODO: VFNMADD132PS Z23, Z0, K7, Z9                       // 62327d4f9ccf
-       //TODO: VFNMADD132PS Z19, Z0, K7, Z9                       // 62327d4f9ccb
-       //TODO: VFNMADD132PS Z24, Z0, K2, Z0                       // 62927d4a9cc0
-       //TODO: VFNMADD132PS Z12, Z0, K2, Z0                       // 62d27d4a9cc4
-       //TODO: VFNMADD132PS (R14), Z0, K2, Z0                     // 62d27d4a9c06
-       //TODO: VFNMADD132PS -7(DI)(R8*8), Z0, K2, Z0              // 62b27d4a9c84c7f9ffffff
-       //TODO: VFNMADD132PS Z24, Z25, K2, Z0                      // 629235429cc0
-       //TODO: VFNMADD132PS Z12, Z25, K2, Z0                      // 62d235429cc4
-       //TODO: VFNMADD132PS (R14), Z25, K2, Z0                    // 62d235429c06
-       //TODO: VFNMADD132PS -7(DI)(R8*8), Z25, K2, Z0             // 62b235429c84c7f9ffffff
-       //TODO: VFNMADD132PS Z24, Z0, K2, Z11                      // 62127d4a9cd8
-       //TODO: VFNMADD132PS Z12, Z0, K2, Z11                      // 62527d4a9cdc
-       //TODO: VFNMADD132PS (R14), Z0, K2, Z11                    // 62527d4a9c1e
-       //TODO: VFNMADD132PS -7(DI)(R8*8), Z0, K2, Z11             // 62327d4a9c9cc7f9ffffff
-       //TODO: VFNMADD132PS Z24, Z25, K2, Z11                     // 621235429cd8
-       //TODO: VFNMADD132PS Z12, Z25, K2, Z11                     // 625235429cdc
-       //TODO: VFNMADD132PS (R14), Z25, K2, Z11                   // 625235429c1e
-       //TODO: VFNMADD132PS -7(DI)(R8*8), Z25, K2, Z11            // 623235429c9cc7f9ffffff
-       //TODO: VFNMADD132SD X26, X15, K4, X9                      // 6212850c9dca
-       //TODO: VFNMADD132SD X1, X21, K1, X18                      // 62e2d5019dd1 or 62e2d5219dd1 or 62e2d5419dd1
-       //TODO: VFNMADD132SD 7(SI)(DI*8), X21, K1, X18             // 62e2d5019d94fe07000000 or 62e2d5219d94fe07000000 or 62e2d5419d94fe07000000
-       //TODO: VFNMADD132SD -15(R14), X21, K1, X18                // 62c2d5019d96f1ffffff or 62c2d5219d96f1ffffff or 62c2d5419d96f1ffffff
-       //TODO: VFNMADD132SS X3, X31, K3, X11                      // 627205039ddb
-       //TODO: VFNMADD132SS X0, X0, K4, X7                        // 62f27d0c9df8 or 62f27d2c9df8 or 62f27d4c9df8
-       //TODO: VFNMADD132SS 7(SI)(DI*4), X0, K4, X7               // 62f27d0c9dbcbe07000000 or 62f27d2c9dbcbe07000000 or 62f27d4c9dbcbe07000000
-       //TODO: VFNMADD132SS -7(DI)(R8*2), X0, K4, X7              // 62b27d0c9dbc47f9ffffff or 62b27d2c9dbc47f9ffffff or 62b27d4c9dbc47f9ffffff
-       //TODO: VFNMADD213PD X7, X20, K5, X24                      // 6262dd05acc7
-       //TODO: VFNMADD213PD -7(DI)(R8*1), X20, K5, X24            // 6222dd05ac8407f9ffffff
-       //TODO: VFNMADD213PD (SP), X20, K5, X24                    // 6262dd05ac0424
-       //TODO: VFNMADD213PD Y24, Y18, K7, Y20                     // 6282ed27ace0
-       //TODO: VFNMADD213PD 15(R8)(R14*8), Y18, K7, Y20           // 6282ed27aca4f00f000000
-       //TODO: VFNMADD213PD -15(R14)(R15*2), Y18, K7, Y20         // 6282ed27aca47ef1ffffff
-       //TODO: VFNMADD213PD Z9, Z9, K7, Z0                        // 62d2b54facc1
-       //TODO: VFNMADD213PD Z25, Z9, K7, Z0                       // 6292b54facc1
-       //TODO: VFNMADD213PD Z9, Z3, K7, Z0                        // 62d2e54facc1
-       //TODO: VFNMADD213PD Z25, Z3, K7, Z0                       // 6292e54facc1
-       //TODO: VFNMADD213PD Z9, Z9, K7, Z26                       // 6242b54facd1
-       //TODO: VFNMADD213PD Z25, Z9, K7, Z26                      // 6202b54facd1
-       //TODO: VFNMADD213PD Z9, Z3, K7, Z26                       // 6242e54facd1
-       //TODO: VFNMADD213PD Z25, Z3, K7, Z26                      // 6202e54facd1
-       //TODO: VFNMADD213PD Z17, Z20, K6, Z9                      // 6232dd46acc9
-       //TODO: VFNMADD213PD Z0, Z20, K6, Z9                       // 6272dd46acc8
-       //TODO: VFNMADD213PD 99(R15)(R15*4), Z20, K6, Z9           // 6212dd46ac8cbf63000000
-       //TODO: VFNMADD213PD 15(DX), Z20, K6, Z9                   // 6272dd46ac8a0f000000
-       //TODO: VFNMADD213PD Z17, Z0, K6, Z9                       // 6232fd4eacc9
-       //TODO: VFNMADD213PD Z0, Z0, K6, Z9                        // 6272fd4eacc8
-       //TODO: VFNMADD213PD 99(R15)(R15*4), Z0, K6, Z9            // 6212fd4eac8cbf63000000
-       //TODO: VFNMADD213PD 15(DX), Z0, K6, Z9                    // 6272fd4eac8a0f000000
-       //TODO: VFNMADD213PD Z17, Z20, K6, Z28                     // 6222dd46ace1
-       //TODO: VFNMADD213PD Z0, Z20, K6, Z28                      // 6262dd46ace0
-       //TODO: VFNMADD213PD 99(R15)(R15*4), Z20, K6, Z28          // 6202dd46aca4bf63000000
-       //TODO: VFNMADD213PD 15(DX), Z20, K6, Z28                  // 6262dd46aca20f000000
-       //TODO: VFNMADD213PD Z17, Z0, K6, Z28                      // 6222fd4eace1
-       //TODO: VFNMADD213PD Z0, Z0, K6, Z28                       // 6262fd4eace0
-       //TODO: VFNMADD213PD 99(R15)(R15*4), Z0, K6, Z28           // 6202fd4eaca4bf63000000
-       //TODO: VFNMADD213PD 15(DX), Z0, K6, Z28                   // 6262fd4eaca20f000000
-       //TODO: VFNMADD213PS X14, X7, K3, X9                       // 6252450bacce
-       //TODO: VFNMADD213PS -7(CX), X7, K3, X9                    // 6272450bac89f9ffffff
-       //TODO: VFNMADD213PS 15(DX)(BX*4), X7, K3, X9              // 6272450bac8c9a0f000000
-       //TODO: VFNMADD213PS Y19, Y3, K7, Y9                       // 6232652faccb
-       //TODO: VFNMADD213PS -15(R14)(R15*1), Y3, K7, Y9           // 6212652fac8c3ef1ffffff
-       //TODO: VFNMADD213PS -15(BX), Y3, K7, Y9                   // 6272652fac8bf1ffffff
-       //TODO: VFNMADD213PS Z21, Z31, K4, Z17                     // 62a20544accd
-       //TODO: VFNMADD213PS Z9, Z31, K4, Z17                      // 62c20544acc9
-       //TODO: VFNMADD213PS Z21, Z0, K4, Z17                      // 62a27d4caccd
-       //TODO: VFNMADD213PS Z9, Z0, K4, Z17                       // 62c27d4cacc9
-       //TODO: VFNMADD213PS Z21, Z31, K4, Z23                     // 62a20544acfd
-       //TODO: VFNMADD213PS Z9, Z31, K4, Z23                      // 62c20544acf9
-       //TODO: VFNMADD213PS Z21, Z0, K4, Z23                      // 62a27d4cacfd
-       //TODO: VFNMADD213PS Z9, Z0, K4, Z23                       // 62c27d4cacf9
-       //TODO: VFNMADD213PS Z20, Z1, K4, Z6                       // 62b2754cacf4
-       //TODO: VFNMADD213PS Z9, Z1, K4, Z6                        // 62d2754cacf1
-       //TODO: VFNMADD213PS (CX), Z1, K4, Z6                      // 62f2754cac31
-       //TODO: VFNMADD213PS 99(R15), Z1, K4, Z6                   // 62d2754cacb763000000
-       //TODO: VFNMADD213PS Z20, Z9, K4, Z6                       // 62b2354cacf4
-       //TODO: VFNMADD213PS Z9, Z9, K4, Z6                        // 62d2354cacf1
-       //TODO: VFNMADD213PS (CX), Z9, K4, Z6                      // 62f2354cac31
-       //TODO: VFNMADD213PS 99(R15), Z9, K4, Z6                   // 62d2354cacb763000000
-       //TODO: VFNMADD213PS Z20, Z1, K4, Z9                       // 6232754caccc
-       //TODO: VFNMADD213PS Z9, Z1, K4, Z9                        // 6252754cacc9
-       //TODO: VFNMADD213PS (CX), Z1, K4, Z9                      // 6272754cac09
-       //TODO: VFNMADD213PS 99(R15), Z1, K4, Z9                   // 6252754cac8f63000000
-       //TODO: VFNMADD213PS Z20, Z9, K4, Z9                       // 6232354caccc
-       //TODO: VFNMADD213PS Z9, Z9, K4, Z9                        // 6252354cacc9
-       //TODO: VFNMADD213PS (CX), Z9, K4, Z9                      // 6272354cac09
-       //TODO: VFNMADD213PS 99(R15), Z9, K4, Z9                   // 6252354cac8f63000000
-       //TODO: VFNMADD213SD X3, X31, K7, X5                       // 62f28507adeb
-       //TODO: VFNMADD213SD X11, X1, K2, X21                      // 62c2f50aadeb or 62c2f52aadeb or 62c2f54aadeb
-       //TODO: VFNMADD213SD 7(SI)(DI*1), X1, K2, X21              // 62e2f50aadac3e07000000 or 62e2f52aadac3e07000000 or 62e2f54aadac3e07000000
-       //TODO: VFNMADD213SD 15(DX)(BX*8), X1, K2, X21             // 62e2f50aadacda0f000000 or 62e2f52aadacda0f000000 or 62e2f54aadacda0f000000
-       //TODO: VFNMADD213SS X30, X0, K5, X13                      // 62127d0dadee
-       //TODO: VFNMADD213SS X11, X14, K3, X16                     // 62c20d0badc3 or 62c20d2badc3 or 62c20d4badc3
-       //TODO: VFNMADD213SS 17(SP), X14, K3, X16                  // 62e20d0bad842411000000 or 62e20d2bad842411000000 or 62e20d4bad842411000000
-       //TODO: VFNMADD213SS -17(BP)(SI*4), X14, K3, X16           // 62e20d0bad84b5efffffff or 62e20d2bad84b5efffffff or 62e20d4bad84b5efffffff
-       //TODO: VFNMADD231PD X8, X19, K4, X14                      // 6252e504bcf0
-       //TODO: VFNMADD231PD 99(R15)(R15*8), X19, K4, X14          // 6212e504bcb4ff63000000
-       //TODO: VFNMADD231PD 7(AX)(CX*8), X19, K4, X14             // 6272e504bcb4c807000000
-       //TODO: VFNMADD231PD Y14, Y19, K2, Y23                     // 62c2e522bcfe
-       //TODO: VFNMADD231PD 7(AX)(CX*4), Y19, K2, Y23             // 62e2e522bcbc8807000000
-       //TODO: VFNMADD231PD 7(AX)(CX*1), Y19, K2, Y23             // 62e2e522bcbc0807000000
-       //TODO: VFNMADD231PD Z7, Z26, K2, Z30                      // 6262ad42bcf7
-       //TODO: VFNMADD231PD Z21, Z26, K2, Z30                     // 6222ad42bcf5
-       //TODO: VFNMADD231PD Z7, Z22, K2, Z30                      // 6262cd42bcf7
-       //TODO: VFNMADD231PD Z21, Z22, K2, Z30                     // 6222cd42bcf5
-       //TODO: VFNMADD231PD Z7, Z26, K2, Z5                       // 62f2ad42bcef
-       //TODO: VFNMADD231PD Z21, Z26, K2, Z5                      // 62b2ad42bced
-       //TODO: VFNMADD231PD Z7, Z22, K2, Z5                       // 62f2cd42bcef
-       //TODO: VFNMADD231PD Z21, Z22, K2, Z5                      // 62b2cd42bced
-       //TODO: VFNMADD231PD Z12, Z14, K3, Z16                     // 62c28d4bbcc4
-       //TODO: VFNMADD231PD Z13, Z14, K3, Z16                     // 62c28d4bbcc5
-       //TODO: VFNMADD231PD 99(R15)(R15*2), Z14, K3, Z16          // 62828d4bbc847f63000000
-       //TODO: VFNMADD231PD -7(DI), Z14, K3, Z16                  // 62e28d4bbc87f9ffffff
-       //TODO: VFNMADD231PD Z12, Z13, K3, Z16                     // 62c2954bbcc4
-       //TODO: VFNMADD231PD Z13, Z13, K3, Z16                     // 62c2954bbcc5
-       //TODO: VFNMADD231PD 99(R15)(R15*2), Z13, K3, Z16          // 6282954bbc847f63000000
-       //TODO: VFNMADD231PD -7(DI), Z13, K3, Z16                  // 62e2954bbc87f9ffffff
-       //TODO: VFNMADD231PD Z12, Z14, K3, Z25                     // 62428d4bbccc
-       //TODO: VFNMADD231PD Z13, Z14, K3, Z25                     // 62428d4bbccd
-       //TODO: VFNMADD231PD 99(R15)(R15*2), Z14, K3, Z25          // 62028d4bbc8c7f63000000
-       //TODO: VFNMADD231PD -7(DI), Z14, K3, Z25                  // 62628d4bbc8ff9ffffff
-       //TODO: VFNMADD231PD Z12, Z13, K3, Z25                     // 6242954bbccc
-       //TODO: VFNMADD231PD Z13, Z13, K3, Z25                     // 6242954bbccd
-       //TODO: VFNMADD231PD 99(R15)(R15*2), Z13, K3, Z25          // 6202954bbc8c7f63000000
-       //TODO: VFNMADD231PD -7(DI), Z13, K3, Z25                  // 6262954bbc8ff9ffffff
-       //TODO: VFNMADD231PS X23, X26, K3, X8                      // 62322d03bcc7
-       //TODO: VFNMADD231PS (AX), X26, K3, X8                     // 62722d03bc00
-       //TODO: VFNMADD231PS 7(SI), X26, K3, X8                    // 62722d03bc8607000000
-       //TODO: VFNMADD231PS Y16, Y5, K3, Y21                      // 62a2552bbce8
-       //TODO: VFNMADD231PS (SI), Y5, K3, Y21                     // 62e2552bbc2e
-       //TODO: VFNMADD231PS 7(SI)(DI*2), Y5, K3, Y21              // 62e2552bbcac7e07000000
-       //TODO: VFNMADD231PS Z27, Z2, K2, Z21                      // 62826d4abceb
-       //TODO: VFNMADD231PS Z25, Z2, K2, Z21                      // 62826d4abce9
-       //TODO: VFNMADD231PS Z27, Z7, K2, Z21                      // 6282454abceb
-       //TODO: VFNMADD231PS Z25, Z7, K2, Z21                      // 6282454abce9
-       //TODO: VFNMADD231PS Z27, Z2, K2, Z9                       // 62126d4abccb
-       //TODO: VFNMADD231PS Z25, Z2, K2, Z9                       // 62126d4abcc9
-       //TODO: VFNMADD231PS Z27, Z7, K2, Z9                       // 6212454abccb
-       //TODO: VFNMADD231PS Z25, Z7, K2, Z9                       // 6212454abcc9
-       //TODO: VFNMADD231PS Z3, Z27, K1, Z23                      // 62e22541bcfb
-       //TODO: VFNMADD231PS Z0, Z27, K1, Z23                      // 62e22541bcf8
-       //TODO: VFNMADD231PS -7(CX)(DX*1), Z27, K1, Z23            // 62e22541bcbc11f9ffffff
-       //TODO: VFNMADD231PS -15(R14)(R15*4), Z27, K1, Z23         // 62822541bcbcbef1ffffff
-       //TODO: VFNMADD231PS Z3, Z14, K1, Z23                      // 62e20d49bcfb
-       //TODO: VFNMADD231PS Z0, Z14, K1, Z23                      // 62e20d49bcf8
-       //TODO: VFNMADD231PS -7(CX)(DX*1), Z14, K1, Z23            // 62e20d49bcbc11f9ffffff
-       //TODO: VFNMADD231PS -15(R14)(R15*4), Z14, K1, Z23         // 62820d49bcbcbef1ffffff
-       //TODO: VFNMADD231PS Z3, Z27, K1, Z9                       // 62722541bccb
-       //TODO: VFNMADD231PS Z0, Z27, K1, Z9                       // 62722541bcc8
-       //TODO: VFNMADD231PS -7(CX)(DX*1), Z27, K1, Z9             // 62722541bc8c11f9ffffff
-       //TODO: VFNMADD231PS -15(R14)(R15*4), Z27, K1, Z9          // 62122541bc8cbef1ffffff
-       //TODO: VFNMADD231PS Z3, Z14, K1, Z9                       // 62720d49bccb
-       //TODO: VFNMADD231PS Z0, Z14, K1, Z9                       // 62720d49bcc8
-       //TODO: VFNMADD231PS -7(CX)(DX*1), Z14, K1, Z9             // 62720d49bc8c11f9ffffff
-       //TODO: VFNMADD231PS -15(R14)(R15*4), Z14, K1, Z9          // 62120d49bc8cbef1ffffff
-       //TODO: VFNMADD231SD X23, X16, K2, X12                     // 6232fd02bde7
-       //TODO: VFNMADD231SD X31, X11, K1, X23                     // 6282a509bdff or 6282a529bdff or 6282a549bdff
-       //TODO: VFNMADD231SD -7(DI)(R8*1), X11, K1, X23            // 62a2a509bdbc07f9ffffff or 62a2a529bdbc07f9ffffff or 62a2a549bdbc07f9ffffff
-       //TODO: VFNMADD231SD (SP), X11, K1, X23                    // 62e2a509bd3c24 or 62e2a529bd3c24 or 62e2a549bd3c24
-       //TODO: VFNMADD231SS X0, X14, K7, X24                      // 62620d0fbdc0
-       //TODO: VFNMADD231SS X2, X23, K1, X11                      // 62724501bdda or 62724521bdda or 62724541bdda
-       //TODO: VFNMADD231SS 7(AX), X23, K1, X11                   // 62724501bd9807000000 or 62724521bd9807000000 or 62724541bd9807000000
-       //TODO: VFNMADD231SS (DI), X23, K1, X11                    // 62724501bd1f or 62724521bd1f or 62724541bd1f
-       //TODO: VFNMSUB132PD X25, X5, K1, X20                      // 6282d5099ee1
-       //TODO: VFNMSUB132PD (BX), X5, K1, X20                     // 62e2d5099e23
-       //TODO: VFNMSUB132PD -17(BP)(SI*1), X5, K1, X20            // 62e2d5099ea435efffffff
-       //TODO: VFNMSUB132PD Y20, Y21, K1, Y2                      // 62b2d5219ed4
-       //TODO: VFNMSUB132PD 17(SP)(BP*8), Y21, K1, Y2             // 62f2d5219e94ec11000000
-       //TODO: VFNMSUB132PD 17(SP)(BP*4), Y21, K1, Y2             // 62f2d5219e94ac11000000
-       //TODO: VFNMSUB132PD Z22, Z8, K7, Z14                      // 6232bd4f9ef6
-       //TODO: VFNMSUB132PD Z25, Z8, K7, Z14                      // 6212bd4f9ef1
-       //TODO: VFNMSUB132PD Z22, Z24, K7, Z14                     // 6232bd479ef6
-       //TODO: VFNMSUB132PD Z25, Z24, K7, Z14                     // 6212bd479ef1
-       //TODO: VFNMSUB132PD Z22, Z8, K7, Z7                       // 62b2bd4f9efe
-       //TODO: VFNMSUB132PD Z25, Z8, K7, Z7                       // 6292bd4f9ef9
-       //TODO: VFNMSUB132PD Z22, Z24, K7, Z7                      // 62b2bd479efe
-       //TODO: VFNMSUB132PD Z25, Z24, K7, Z7                      // 6292bd479ef9
-       //TODO: VFNMSUB132PD Z0, Z6, K2, Z1                        // 62f2cd4a9ec8
-       //TODO: VFNMSUB132PD Z8, Z6, K2, Z1                        // 62d2cd4a9ec8
-       //TODO: VFNMSUB132PD 15(DX)(BX*1), Z6, K2, Z1              // 62f2cd4a9e8c1a0f000000
-       //TODO: VFNMSUB132PD -7(CX)(DX*2), Z6, K2, Z1              // 62f2cd4a9e8c51f9ffffff
-       //TODO: VFNMSUB132PD Z0, Z2, K2, Z1                        // 62f2ed4a9ec8
-       //TODO: VFNMSUB132PD Z8, Z2, K2, Z1                        // 62d2ed4a9ec8
-       //TODO: VFNMSUB132PD 15(DX)(BX*1), Z2, K2, Z1              // 62f2ed4a9e8c1a0f000000
-       //TODO: VFNMSUB132PD -7(CX)(DX*2), Z2, K2, Z1              // 62f2ed4a9e8c51f9ffffff
-       //TODO: VFNMSUB132PD Z0, Z6, K2, Z16                       // 62e2cd4a9ec0
-       //TODO: VFNMSUB132PD Z8, Z6, K2, Z16                       // 62c2cd4a9ec0
-       //TODO: VFNMSUB132PD 15(DX)(BX*1), Z6, K2, Z16             // 62e2cd4a9e841a0f000000
-       //TODO: VFNMSUB132PD -7(CX)(DX*2), Z6, K2, Z16             // 62e2cd4a9e8451f9ffffff
-       //TODO: VFNMSUB132PD Z0, Z2, K2, Z16                       // 62e2ed4a9ec0
-       //TODO: VFNMSUB132PD Z8, Z2, K2, Z16                       // 62c2ed4a9ec0
-       //TODO: VFNMSUB132PD 15(DX)(BX*1), Z2, K2, Z16             // 62e2ed4a9e841a0f000000
-       //TODO: VFNMSUB132PD -7(CX)(DX*2), Z2, K2, Z16             // 62e2ed4a9e8451f9ffffff
-       //TODO: VFNMSUB132PS X13, X9, K4, X0                       // 62d2350c9ec5
-       //TODO: VFNMSUB132PS 15(R8)(R14*4), X9, K4, X0             // 6292350c9e84b00f000000
-       //TODO: VFNMSUB132PS -7(CX)(DX*4), X9, K4, X0              // 62f2350c9e8491f9ffffff
-       //TODO: VFNMSUB132PS Y6, Y31, K1, Y6                       // 62f205219ef6
-       //TODO: VFNMSUB132PS 7(SI)(DI*4), Y31, K1, Y6              // 62f205219eb4be07000000
-       //TODO: VFNMSUB132PS -7(DI)(R8*2), Y31, K1, Y6             // 62b205219eb447f9ffffff
-       //TODO: VFNMSUB132PS Z11, Z14, K3, Z15                     // 62520d4b9efb
-       //TODO: VFNMSUB132PS Z5, Z14, K3, Z15                      // 62720d4b9efd
-       //TODO: VFNMSUB132PS Z11, Z27, K3, Z15                     // 625225439efb
-       //TODO: VFNMSUB132PS Z5, Z27, K3, Z15                      // 627225439efd
-       //TODO: VFNMSUB132PS Z11, Z14, K3, Z12                     // 62520d4b9ee3
-       //TODO: VFNMSUB132PS Z5, Z14, K3, Z12                      // 62720d4b9ee5
-       //TODO: VFNMSUB132PS Z11, Z27, K3, Z12                     // 625225439ee3
-       //TODO: VFNMSUB132PS Z5, Z27, K3, Z12                      // 627225439ee5
-       //TODO: VFNMSUB132PS Z2, Z5, K4, Z13                       // 6272554c9eea
-       //TODO: VFNMSUB132PS -17(BP), Z5, K4, Z13                  // 6272554c9eadefffffff
-       //TODO: VFNMSUB132PS -15(R14)(R15*8), Z5, K4, Z13          // 6212554c9eacfef1ffffff
-       //TODO: VFNMSUB132PS Z2, Z23, K4, Z13                      // 627245449eea
-       //TODO: VFNMSUB132PS -17(BP), Z23, K4, Z13                 // 627245449eadefffffff
-       //TODO: VFNMSUB132PS -15(R14)(R15*8), Z23, K4, Z13         // 621245449eacfef1ffffff
-       //TODO: VFNMSUB132PS Z2, Z5, K4, Z14                       // 6272554c9ef2
-       //TODO: VFNMSUB132PS -17(BP), Z5, K4, Z14                  // 6272554c9eb5efffffff
-       //TODO: VFNMSUB132PS -15(R14)(R15*8), Z5, K4, Z14          // 6212554c9eb4fef1ffffff
-       //TODO: VFNMSUB132PS Z2, Z23, K4, Z14                      // 627245449ef2
-       //TODO: VFNMSUB132PS -17(BP), Z23, K4, Z14                 // 627245449eb5efffffff
-       //TODO: VFNMSUB132PS -15(R14)(R15*8), Z23, K4, Z14         // 621245449eb4fef1ffffff
-       //TODO: VFNMSUB132SD X9, X8, K5, X2                        // 62d2bd0d9fd1
-       //TODO: VFNMSUB132SD X11, X31, K7, X2                      // 62d285079fd3 or 62d285279fd3 or 62d285479fd3
-       //TODO: VFNMSUB132SD -7(CX), X31, K7, X2                   // 62f285079f91f9ffffff or 62f285279f91f9ffffff or 62f285479f91f9ffffff
-       //TODO: VFNMSUB132SD 15(DX)(BX*4), X31, K7, X2             // 62f285079f949a0f000000 or 62f285279f949a0f000000 or 62f285479f949a0f000000
-       //TODO: VFNMSUB132SS X14, X5, K7, X22                      // 62c2550f9ff6
-       //TODO: VFNMSUB132SS X7, X17, K6, X0                       // 62f275069fc7 or 62f275269fc7 or 62f275469fc7
-       //TODO: VFNMSUB132SS 99(R15)(R15*1), X17, K6, X0           // 629275069f843f63000000 or 629275269f843f63000000 or 629275469f843f63000000
-       //TODO: VFNMSUB132SS (DX), X17, K6, X0                     // 62f275069f02 or 62f275269f02 or 62f275469f02
-       //TODO: VFNMSUB213PD X0, X11, K3, X15                      // 6272a50baef8
-       //TODO: VFNMSUB213PD (R8), X11, K3, X15                    // 6252a50bae38
-       //TODO: VFNMSUB213PD 15(DX)(BX*2), X11, K3, X15            // 6272a50baebc5a0f000000
-       //TODO: VFNMSUB213PD Y7, Y19, K7, Y11                      // 6272e527aedf
-       //TODO: VFNMSUB213PD 17(SP), Y19, K7, Y11                  // 6272e527ae9c2411000000
-       //TODO: VFNMSUB213PD -17(BP)(SI*4), Y19, K7, Y11           // 6272e527ae9cb5efffffff
-       //TODO: VFNMSUB213PD Z28, Z26, K4, Z6                      // 6292ad44aef4
-       //TODO: VFNMSUB213PD Z6, Z26, K4, Z6                       // 62f2ad44aef6
-       //TODO: VFNMSUB213PD Z28, Z14, K4, Z6                      // 62928d4caef4
-       //TODO: VFNMSUB213PD Z6, Z14, K4, Z6                       // 62f28d4caef6
-       //TODO: VFNMSUB213PD Z28, Z26, K4, Z14                     // 6212ad44aef4
-       //TODO: VFNMSUB213PD Z6, Z26, K4, Z14                      // 6272ad44aef6
-       //TODO: VFNMSUB213PD Z28, Z14, K4, Z14                     // 62128d4caef4
-       //TODO: VFNMSUB213PD Z6, Z14, K4, Z14                      // 62728d4caef6
-       //TODO: VFNMSUB213PD Z3, Z26, K4, Z13                      // 6272ad44aeeb
-       //TODO: VFNMSUB213PD Z0, Z26, K4, Z13                      // 6272ad44aee8
-       //TODO: VFNMSUB213PD 17(SP)(BP*2), Z26, K4, Z13            // 6272ad44aeac6c11000000
-       //TODO: VFNMSUB213PD -7(DI)(R8*4), Z26, K4, Z13            // 6232ad44aeac87f9ffffff
-       //TODO: VFNMSUB213PD Z3, Z3, K4, Z13                       // 6272e54caeeb
-       //TODO: VFNMSUB213PD Z0, Z3, K4, Z13                       // 6272e54caee8
-       //TODO: VFNMSUB213PD 17(SP)(BP*2), Z3, K4, Z13             // 6272e54caeac6c11000000
-       //TODO: VFNMSUB213PD -7(DI)(R8*4), Z3, K4, Z13             // 6232e54caeac87f9ffffff
-       //TODO: VFNMSUB213PD Z3, Z26, K4, Z21                      // 62e2ad44aeeb
-       //TODO: VFNMSUB213PD Z0, Z26, K4, Z21                      // 62e2ad44aee8
-       //TODO: VFNMSUB213PD 17(SP)(BP*2), Z26, K4, Z21            // 62e2ad44aeac6c11000000
-       //TODO: VFNMSUB213PD -7(DI)(R8*4), Z26, K4, Z21            // 62a2ad44aeac87f9ffffff
-       //TODO: VFNMSUB213PD Z3, Z3, K4, Z21                       // 62e2e54caeeb
-       //TODO: VFNMSUB213PD Z0, Z3, K4, Z21                       // 62e2e54caee8
-       //TODO: VFNMSUB213PD 17(SP)(BP*2), Z3, K4, Z21             // 62e2e54caeac6c11000000
-       //TODO: VFNMSUB213PD -7(DI)(R8*4), Z3, K4, Z21             // 62a2e54caeac87f9ffffff
-       //TODO: VFNMSUB213PS X27, X8, K7, X18                      // 62823d0faed3
-       //TODO: VFNMSUB213PS 17(SP)(BP*1), X8, K7, X18             // 62e23d0fae942c11000000
-       //TODO: VFNMSUB213PS -7(CX)(DX*8), X8, K7, X18             // 62e23d0fae94d1f9ffffff
-       //TODO: VFNMSUB213PS Y3, Y0, K2, Y6                        // 62f27d2aaef3
-       //TODO: VFNMSUB213PS 7(AX), Y0, K2, Y6                     // 62f27d2aaeb007000000
-       //TODO: VFNMSUB213PS (DI), Y0, K2, Y6                      // 62f27d2aae37
-       //TODO: VFNMSUB213PS Z3, Z11, K5, Z21                      // 62e2254daeeb
-       //TODO: VFNMSUB213PS Z12, Z11, K5, Z21                     // 62c2254daeec
-       //TODO: VFNMSUB213PS Z3, Z25, K5, Z21                      // 62e23545aeeb
-       //TODO: VFNMSUB213PS Z12, Z25, K5, Z21                     // 62c23545aeec
-       //TODO: VFNMSUB213PS Z3, Z11, K5, Z13                      // 6272254daeeb
-       //TODO: VFNMSUB213PS Z12, Z11, K5, Z13                     // 6252254daeec
-       //TODO: VFNMSUB213PS Z3, Z25, K5, Z13                      // 62723545aeeb
-       //TODO: VFNMSUB213PS Z12, Z25, K5, Z13                     // 62523545aeec
-       //TODO: VFNMSUB213PS Z23, Z23, K3, Z27                     // 62224543aedf
-       //TODO: VFNMSUB213PS Z6, Z23, K3, Z27                      // 62624543aede
-       //TODO: VFNMSUB213PS 15(R8), Z23, K3, Z27                  // 62424543ae980f000000
-       //TODO: VFNMSUB213PS (BP), Z23, K3, Z27                    // 62624543ae5d00
-       //TODO: VFNMSUB213PS Z23, Z5, K3, Z27                      // 6222554baedf
-       //TODO: VFNMSUB213PS Z6, Z5, K3, Z27                       // 6262554baede
-       //TODO: VFNMSUB213PS 15(R8), Z5, K3, Z27                   // 6242554bae980f000000
-       //TODO: VFNMSUB213PS (BP), Z5, K3, Z27                     // 6262554bae5d00
-       //TODO: VFNMSUB213PS Z23, Z23, K3, Z15                     // 62324543aeff
-       //TODO: VFNMSUB213PS Z6, Z23, K3, Z15                      // 62724543aefe
-       //TODO: VFNMSUB213PS 15(R8), Z23, K3, Z15                  // 62524543aeb80f000000
-       //TODO: VFNMSUB213PS (BP), Z23, K3, Z15                    // 62724543ae7d00
-       //TODO: VFNMSUB213PS Z23, Z5, K3, Z15                      // 6232554baeff
-       //TODO: VFNMSUB213PS Z6, Z5, K3, Z15                       // 6272554baefe
-       //TODO: VFNMSUB213PS 15(R8), Z5, K3, Z15                   // 6252554baeb80f000000
-       //TODO: VFNMSUB213PS (BP), Z5, K3, Z15                     // 6272554bae7d00
-       //TODO: VFNMSUB213SD X18, X3, K4, X25                      // 6222e50cafca
-       //TODO: VFNMSUB213SD X15, X28, K2, X15                     // 62529d02afff or 62529d22afff or 62529d42afff
-       //TODO: VFNMSUB213SD 99(R15)(R15*8), X28, K2, X15          // 62129d02afbcff63000000 or 62129d22afbcff63000000 or 62129d42afbcff63000000
-       //TODO: VFNMSUB213SD 7(AX)(CX*8), X28, K2, X15             // 62729d02afbcc807000000 or 62729d22afbcc807000000 or 62729d42afbcc807000000
-       //TODO: VFNMSUB213SS X8, X13, K2, X7                       // 62d2150aaff8
-       //TODO: VFNMSUB213SS X0, X7, K3, X24                       // 6262450bafc0 or 6262452bafc0 or 6262454bafc0
-       //TODO: VFNMSUB213SS -17(BP)(SI*8), X7, K3, X24            // 6262450baf84f5efffffff or 6262452baf84f5efffffff or 6262454baf84f5efffffff
-       //TODO: VFNMSUB213SS (R15), X7, K3, X24                    // 6242450baf07 or 6242452baf07 or 6242454baf07
-       //TODO: VFNMSUB231PD X11, X1, K3, X22                      // 62c2f50bbef3
-       //TODO: VFNMSUB231PD -17(BP)(SI*2), X1, K3, X22            // 62e2f50bbeb475efffffff
-       //TODO: VFNMSUB231PD 7(AX)(CX*2), X1, K3, X22              // 62e2f50bbeb44807000000
-       //TODO: VFNMSUB231PD Y12, Y20, K3, Y5                      // 62d2dd23beec
-       //TODO: VFNMSUB231PD 99(R15)(R15*1), Y20, K3, Y5           // 6292dd23beac3f63000000
-       //TODO: VFNMSUB231PD (DX), Y20, K3, Y5                     // 62f2dd23be2a
-       //TODO: VFNMSUB231PD Z16, Z21, K2, Z8                      // 6232d542bec0
-       //TODO: VFNMSUB231PD Z13, Z21, K2, Z8                      // 6252d542bec5
-       //TODO: VFNMSUB231PD Z16, Z5, K2, Z8                       // 6232d54abec0
-       //TODO: VFNMSUB231PD Z13, Z5, K2, Z8                       // 6252d54abec5
-       //TODO: VFNMSUB231PD Z16, Z21, K2, Z28                     // 6222d542bee0
-       //TODO: VFNMSUB231PD Z13, Z21, K2, Z28                     // 6242d542bee5
-       //TODO: VFNMSUB231PD Z16, Z5, K2, Z28                      // 6222d54abee0
-       //TODO: VFNMSUB231PD Z13, Z5, K2, Z28                      // 6242d54abee5
-       //TODO: VFNMSUB231PD Z6, Z22, K1, Z12                      // 6272cd41bee6
-       //TODO: VFNMSUB231PD Z8, Z22, K1, Z12                      // 6252cd41bee0
-       //TODO: VFNMSUB231PD 15(R8)(R14*8), Z22, K1, Z12           // 6212cd41bea4f00f000000
-       //TODO: VFNMSUB231PD -15(R14)(R15*2), Z22, K1, Z12         // 6212cd41bea47ef1ffffff
-       //TODO: VFNMSUB231PD Z6, Z11, K1, Z12                      // 6272a549bee6
-       //TODO: VFNMSUB231PD Z8, Z11, K1, Z12                      // 6252a549bee0
-       //TODO: VFNMSUB231PD 15(R8)(R14*8), Z11, K1, Z12           // 6212a549bea4f00f000000
-       //TODO: VFNMSUB231PD -15(R14)(R15*2), Z11, K1, Z12         // 6212a549bea47ef1ffffff
-       //TODO: VFNMSUB231PD Z6, Z22, K1, Z27                      // 6262cd41bede
-       //TODO: VFNMSUB231PD Z8, Z22, K1, Z27                      // 6242cd41bed8
-       //TODO: VFNMSUB231PD 15(R8)(R14*8), Z22, K1, Z27           // 6202cd41be9cf00f000000
-       //TODO: VFNMSUB231PD -15(R14)(R15*2), Z22, K1, Z27         // 6202cd41be9c7ef1ffffff
-       //TODO: VFNMSUB231PD Z6, Z11, K1, Z27                      // 6262a549bede
-       //TODO: VFNMSUB231PD Z8, Z11, K1, Z27                      // 6242a549bed8
-       //TODO: VFNMSUB231PD 15(R8)(R14*8), Z11, K1, Z27           // 6202a549be9cf00f000000
-       //TODO: VFNMSUB231PD -15(R14)(R15*2), Z11, K1, Z27         // 6202a549be9c7ef1ffffff
-       //TODO: VFNMSUB231PS X8, X7, K2, X6                        // 62d2450abef0
-       //TODO: VFNMSUB231PS 15(R8)(R14*1), X7, K2, X6             // 6292450abeb4300f000000
-       //TODO: VFNMSUB231PS 15(R8)(R14*2), X7, K2, X6             // 6292450abeb4700f000000
-       //TODO: VFNMSUB231PS Y28, Y5, K1, Y3                       // 62925529bedc
-       //TODO: VFNMSUB231PS -17(BP)(SI*8), Y5, K1, Y3             // 62f25529be9cf5efffffff
-       //TODO: VFNMSUB231PS (R15), Y5, K1, Y3                     // 62d25529be1f
-       //TODO: VFNMSUB231PS Z9, Z12, K7, Z25                      // 62421d4fbec9
-       //TODO: VFNMSUB231PS Z12, Z12, K7, Z25                     // 62421d4fbecc
-       //TODO: VFNMSUB231PS Z9, Z17, K7, Z25                      // 62427547bec9
-       //TODO: VFNMSUB231PS Z12, Z17, K7, Z25                     // 62427547becc
-       //TODO: VFNMSUB231PS Z9, Z12, K7, Z12                      // 62521d4fbee1
-       //TODO: VFNMSUB231PS Z12, Z12, K7, Z12                     // 62521d4fbee4
-       //TODO: VFNMSUB231PS Z9, Z17, K7, Z12                      // 62527547bee1
-       //TODO: VFNMSUB231PS Z12, Z17, K7, Z12                     // 62527547bee4
-       //TODO: VFNMSUB231PS Z8, Z3, K1, Z6                        // 62d26549bef0
-       //TODO: VFNMSUB231PS Z2, Z3, K1, Z6                        // 62f26549bef2
-       //TODO: VFNMSUB231PS -15(R14)(R15*1), Z3, K1, Z6           // 62926549beb43ef1ffffff
-       //TODO: VFNMSUB231PS -15(BX), Z3, K1, Z6                   // 62f26549beb3f1ffffff
-       //TODO: VFNMSUB231PS Z8, Z21, K1, Z6                       // 62d25541bef0
-       //TODO: VFNMSUB231PS Z2, Z21, K1, Z6                       // 62f25541bef2
-       //TODO: VFNMSUB231PS -15(R14)(R15*1), Z21, K1, Z6          // 62925541beb43ef1ffffff
-       //TODO: VFNMSUB231PS -15(BX), Z21, K1, Z6                  // 62f25541beb3f1ffffff
-       //TODO: VFNMSUB231PS Z8, Z3, K1, Z25                       // 62426549bec8
-       //TODO: VFNMSUB231PS Z2, Z3, K1, Z25                       // 62626549beca
-       //TODO: VFNMSUB231PS -15(R14)(R15*1), Z3, K1, Z25          // 62026549be8c3ef1ffffff
-       //TODO: VFNMSUB231PS -15(BX), Z3, K1, Z25                  // 62626549be8bf1ffffff
-       //TODO: VFNMSUB231PS Z8, Z21, K1, Z25                      // 62425541bec8
-       //TODO: VFNMSUB231PS Z2, Z21, K1, Z25                      // 62625541beca
-       //TODO: VFNMSUB231PS -15(R14)(R15*1), Z21, K1, Z25         // 62025541be8c3ef1ffffff
-       //TODO: VFNMSUB231PS -15(BX), Z21, K1, Z25                 // 62625541be8bf1ffffff
-       //TODO: VFNMSUB231SD X28, X3, K1, X31                      // 6202e509bffc
-       //TODO: VFNMSUB231SD X7, X24, K1, X20                      // 62e2bd01bfe7 or 62e2bd21bfe7 or 62e2bd41bfe7
-       //TODO: VFNMSUB231SD (AX), X24, K1, X20                    // 62e2bd01bf20 or 62e2bd21bf20 or 62e2bd41bf20
-       //TODO: VFNMSUB231SD 7(SI), X24, K1, X20                   // 62e2bd01bfa607000000 or 62e2bd21bfa607000000 or 62e2bd41bfa607000000
-       //TODO: VFNMSUB231SS X12, X16, K7, X20                     // 62c27d07bfe4
-       //TODO: VFNMSUB231SS X28, X17, K2, X6                      // 62927502bff4 or 62927522bff4 or 62927542bff4
-       //TODO: VFNMSUB231SS 7(SI)(DI*8), X17, K2, X6              // 62f27502bfb4fe07000000 or 62f27522bfb4fe07000000 or 62f27542bfb4fe07000000
-       //TODO: VFNMSUB231SS -15(R14), X17, K2, X6                 // 62d27502bfb6f1ffffff or 62d27522bfb6f1ffffff or 62d27542bfb6f1ffffff
-       //TODO: VGATHERDPD (AX)(X4*1), K3, X6                      // 62f2fd0b923420
-       //TODO: VGATHERDPD (BP)(X10*2), K3, X6                     // 62b2fd0b92745500
-       //TODO: VGATHERDPD (R10)(X29*8), K3, X6                    // 6292fd039234ea
-       //TODO: VGATHERDPD (DX)(X10*4), K7, Y22                    // 62a2fd2f923492
-       //TODO: VGATHERDPD (SP)(X4*2), K7, Y22                     // 62e2fd2f923464
-       //TODO: VGATHERDPD (R14)(X29*8), K7, Y22                   // 6282fd279234ee
-       //TODO: VGATHERDPD (R10)(Y29*8), K4, Z0                    // 6292fd449204ea
-       //TODO: VGATHERDPD (SP)(Y4*2), K4, Z0                      // 62f2fd4c920464
-       //TODO: VGATHERDPD (DX)(Y10*4), K4, Z0                     // 62b2fd4c920492
-       //TODO: VGATHERDPD (R10)(Y29*8), K4, Z6                    // 6292fd449234ea
-       //TODO: VGATHERDPD (SP)(Y4*2), K4, Z6                      // 62f2fd4c923464
-       //TODO: VGATHERDPD (DX)(Y10*4), K4, Z6                     // 62b2fd4c923492
-       //TODO: VGATHERDPS (AX)(X4*1), K4, X0                      // 62f27d0c920420
-       //TODO: VGATHERDPS (BP)(X10*2), K4, X0                     // 62b27d0c92445500
-       //TODO: VGATHERDPS (R10)(X29*8), K4, X0                    // 62927d049204ea
-       //TODO: VGATHERDPS (R14)(Y29*8), K7, Y13                   // 62127d27922cee
-       //TODO: VGATHERDPS (AX)(Y4*1), K7, Y13                     // 62727d2f922c20
-       //TODO: VGATHERDPS (BP)(Y10*2), K7, Y13                    // 62327d2f926c5500
-       //TODO: VGATHERDPS (DX)(Z10*4), K2, Z20                    // 62a27d4a922492
-       //TODO: VGATHERDPS (AX)(Z4*1), K2, Z20                     // 62e27d4a922420
-       //TODO: VGATHERDPS (SP)(Z4*2), K2, Z20                     // 62e27d4a922464
-       //TODO: VGATHERDPS (DX)(Z10*4), K2, Z28                    // 62227d4a922492
-       //TODO: VGATHERDPS (AX)(Z4*1), K2, Z28                     // 62627d4a922420
-       //TODO: VGATHERDPS (SP)(Z4*2), K2, Z28                     // 62627d4a922464
-       //TODO: VGATHERQPD (AX)(X4*1), K2, X11                     // 6272fd0a931c20
-       //TODO: VGATHERQPD (BP)(X10*2), K2, X11                    // 6232fd0a935c5500
-       //TODO: VGATHERQPD (R10)(X29*8), K2, X11                   // 6212fd02931cea
-       //TODO: VGATHERQPD (R10)(Y29*8), K1, Y12                   // 6212fd219324ea
-       //TODO: VGATHERQPD (SP)(Y4*2), K1, Y12                     // 6272fd29932464
-       //TODO: VGATHERQPD (DX)(Y10*4), K1, Y12                    // 6232fd29932492
-       //TODO: VGATHERQPD (DX)(Z10*4), K2, Z3                     // 62b2fd4a931c92
-       //TODO: VGATHERQPD (AX)(Z4*1), K2, Z3                      // 62f2fd4a931c20
-       //TODO: VGATHERQPD (SP)(Z4*2), K2, Z3                      // 62f2fd4a931c64
-       //TODO: VGATHERQPD (DX)(Z10*4), K2, Z30                    // 6222fd4a933492
-       //TODO: VGATHERQPD (AX)(Z4*1), K2, Z30                     // 6262fd4a933420
-       //TODO: VGATHERQPD (SP)(Z4*2), K2, Z30                     // 6262fd4a933464
-       //TODO: VGATHERQPS (DX)(X10*4), K1, X16                    // 62a27d09930492
-       //TODO: VGATHERQPS (SP)(X4*2), K1, X16                     // 62e27d09930464
-       //TODO: VGATHERQPS (R14)(X29*8), K1, X16                   // 62827d019304ee
-       //TODO: VGATHERQPS (R14)(Y29*8), K7, X6                    // 62927d279334ee
-       //TODO: VGATHERQPS (AX)(Y4*1), K7, X6                      // 62f27d2f933420
-       //TODO: VGATHERQPS (BP)(Y10*2), K7, X6                     // 62b27d2f93745500
-       //TODO: VGATHERQPS (BP)(Z10*2), K1, Y1                     // 62b27d49934c5500
-       //TODO: VGATHERQPS (R10)(Z29*8), K1, Y1                    // 62927d41930cea
-       //TODO: VGATHERQPS (R14)(Z29*8), K1, Y1                    // 62927d41930cee
-       //TODO: VGETEXPPD X22, K1, X6                              // 62b2fd0942f6
-       //TODO: VGETEXPPD (CX), K1, X6                             // 62f2fd094231
-       //TODO: VGETEXPPD 99(R15), K1, X6                          // 62d2fd0942b763000000
-       //TODO: VGETEXPPD Y17, K1, Y14                             // 6232fd2942f1
-       //TODO: VGETEXPPD -7(DI)(R8*1), K1, Y14                    // 6232fd2942b407f9ffffff
-       //TODO: VGETEXPPD (SP), K1, Y14                            // 6272fd29423424
-       //TODO: VGETEXPPD Z12, K7, Z9                              // 6252fd4f42cc
-       //TODO: VGETEXPPD Z22, K7, Z9                              // 6232fd4f42ce
-       //TODO: VGETEXPPD Z12, K7, Z19                             // 62c2fd4f42dc
-       //TODO: VGETEXPPD Z22, K7, Z19                             // 62a2fd4f42de
-       //TODO: VGETEXPPD Z18, K2, Z11                             // 6232fd4a42da
-       //TODO: VGETEXPPD Z24, K2, Z11                             // 6212fd4a42d8
-       //TODO: VGETEXPPD 17(SP)(BP*8), K2, Z11                    // 6272fd4a429cec11000000
-       //TODO: VGETEXPPD 17(SP)(BP*4), K2, Z11                    // 6272fd4a429cac11000000
-       //TODO: VGETEXPPD Z18, K2, Z5                              // 62b2fd4a42ea
-       //TODO: VGETEXPPD Z24, K2, Z5                              // 6292fd4a42e8
-       //TODO: VGETEXPPD 17(SP)(BP*8), K2, Z5                     // 62f2fd4a42acec11000000
-       //TODO: VGETEXPPD 17(SP)(BP*4), K2, Z5                     // 62f2fd4a42acac11000000
-       //TODO: VGETEXPPS X16, K4, X12                             // 62327d0c42e0
-       //TODO: VGETEXPPS 99(R15)(R15*2), K4, X12                  // 62127d0c42a47f63000000
-       //TODO: VGETEXPPS -7(DI), K4, X12                          // 62727d0c42a7f9ffffff
-       //TODO: VGETEXPPS Y9, K1, Y7                               // 62d27d2942f9
-       //TODO: VGETEXPPS -7(CX), K1, Y7                           // 62f27d2942b9f9ffffff
-       //TODO: VGETEXPPS 15(DX)(BX*4), K1, Y7                     // 62f27d2942bc9a0f000000
-       //TODO: VGETEXPPS Z7, K3, Z2                               // 62f27d4b42d7
-       //TODO: VGETEXPPS Z13, K3, Z2                              // 62d27d4b42d5
-       //TODO: VGETEXPPS Z7, K3, Z21                              // 62e27d4b42ef
-       //TODO: VGETEXPPS Z13, K3, Z21                             // 62c27d4b42ed
-       //TODO: VGETEXPPS Z6, K4, Z6                               // 62f27d4c42f6
-       //TODO: VGETEXPPS Z22, K4, Z6                              // 62b27d4c42f6
-       //TODO: VGETEXPPS 7(SI)(DI*4), K4, Z6                      // 62f27d4c42b4be07000000
-       //TODO: VGETEXPPS -7(DI)(R8*2), K4, Z6                     // 62b27d4c42b447f9ffffff
-       //TODO: VGETEXPPS Z6, K4, Z16                              // 62e27d4c42c6
-       //TODO: VGETEXPPS Z22, K4, Z16                             // 62a27d4c42c6
-       //TODO: VGETEXPPS 7(SI)(DI*4), K4, Z16                     // 62e27d4c4284be07000000
-       //TODO: VGETEXPPS -7(DI)(R8*2), K4, Z16                    // 62a27d4c428447f9ffffff
-       //TODO: VGETEXPSD X15, X8, K5, X28                         // 6242bd0d43e7
-       //TODO: VGETEXPSD X19, X1, K7, X11                         // 6232f50f43db or 6232f52f43db or 6232f54f43db
-       //TODO: VGETEXPSD 15(R8)(R14*4), X1, K7, X11               // 6212f50f439cb00f000000 or 6212f52f439cb00f000000 or 6212f54f439cb00f000000
-       //TODO: VGETEXPSD -7(CX)(DX*4), X1, K7, X11                // 6272f50f439c91f9ffffff or 6272f52f439c91f9ffffff or 6272f54f439c91f9ffffff
-       //TODO: VGETEXPSS X14, X2, K7, X13                         // 62526d0f43ee
-       //TODO: VGETEXPSS X25, X0, K6, X0                          // 62927d0e43c1 or 62927d2e43c1 or 62927d4e43c1
-       //TODO: VGETEXPSS -7(DI)(R8*1), X0, K6, X0                 // 62b27d0e438407f9ffffff or 62b27d2e438407f9ffffff or 62b27d4e438407f9ffffff
-       //TODO: VGETEXPSS (SP), X0, K6, X0                         // 62f27d0e430424 or 62f27d2e430424 or 62f27d4e430424
-       //TODO: VGETMANTPD $15, X17, K3, X11                       // 6233fd0b26d90f
-       //TODO: VGETMANTPD $15, -7(CX)(DX*1), K3, X11              // 6273fd0b269c11f9ffffff0f
-       //TODO: VGETMANTPD $15, -15(R14)(R15*4), K3, X11           // 6213fd0b269cbef1ffffff0f
-       //TODO: VGETMANTPD $0, Y8, K7, Y31                         // 6243fd2f26f800
-       //TODO: VGETMANTPD $0, 99(R15)(R15*8), K7, Y31             // 6203fd2f26bcff6300000000
-       //TODO: VGETMANTPD $0, 7(AX)(CX*8), K7, Y31                // 6263fd2f26bcc80700000000
-       //TODO: VGETMANTPD $1, Z13, K4, Z1                         // 62d3fd4c26cd01
-       //TODO: VGETMANTPD $1, Z13, K4, Z15                        // 6253fd4c26fd01
-       //TODO: VGETMANTPD $2, Z22, K4, Z18                        // 62a3fd4c26d602
-       //TODO: VGETMANTPD $2, Z7, K4, Z18                         // 62e3fd4c26d702
-       //TODO: VGETMANTPD $2, 17(SP), K4, Z18                     // 62e3fd4c2694241100000002
-       //TODO: VGETMANTPD $2, -17(BP)(SI*4), K4, Z18              // 62e3fd4c2694b5efffffff02
-       //TODO: VGETMANTPD $2, Z22, K4, Z8                         // 6233fd4c26c602
-       //TODO: VGETMANTPD $2, Z7, K4, Z8                          // 6273fd4c26c702
-       //TODO: VGETMANTPD $2, 17(SP), K4, Z8                      // 6273fd4c2684241100000002
-       //TODO: VGETMANTPD $2, -17(BP)(SI*4), K4, Z8               // 6273fd4c2684b5efffffff02
-       //TODO: VGETMANTPS $3, X11, K7, X18                        // 62c37d0f26d303
-       //TODO: VGETMANTPS $3, 15(DX)(BX*1), K7, X18               // 62e37d0f26941a0f00000003
-       //TODO: VGETMANTPS $3, -7(CX)(DX*2), K7, X18               // 62e37d0f269451f9ffffff03
-       //TODO: VGETMANTPS $4, Y28, K2, Y1                         // 62937d2a26cc04
-       //TODO: VGETMANTPS $4, (AX), K2, Y1                        // 62f37d2a260804
-       //TODO: VGETMANTPS $4, 7(SI), K2, Y1                       // 62f37d2a268e0700000004
-       //TODO: VGETMANTPS $5, Z20, K5, Z2                         // 62b37d4d26d405
-       //TODO: VGETMANTPS $5, Z9, K5, Z2                          // 62d37d4d26d105
-       //TODO: VGETMANTPS $5, Z20, K5, Z31                        // 62237d4d26fc05
-       //TODO: VGETMANTPS $5, Z9, K5, Z31                         // 62437d4d26f905
-       //TODO: VGETMANTPS $6, Z12, K3, Z1                         // 62d37d4b26cc06
-       //TODO: VGETMANTPS $6, Z16, K3, Z1                         // 62b37d4b26c806
-       //TODO: VGETMANTPS $6, 7(AX), K3, Z1                       // 62f37d4b26880700000006
-       //TODO: VGETMANTPS $6, (DI), K3, Z1                        // 62f37d4b260f06
-       //TODO: VGETMANTPS $6, Z12, K3, Z3                         // 62d37d4b26dc06
-       //TODO: VGETMANTPS $6, Z16, K3, Z3                         // 62b37d4b26d806
-       //TODO: VGETMANTPS $6, 7(AX), K3, Z3                       // 62f37d4b26980700000006
-       //TODO: VGETMANTPS $6, (DI), K3, Z3                        // 62f37d4b261f06
-       //TODO: VGETMANTSD $7, X24, X2, K4, X9                     // 6213ed0c27c807
-       //TODO: VGETMANTSD $8, X27, X2, K2, X2                     // 6293ed0a27d308 or 6293ed2a27d308 or 6293ed4a27d308
-       //TODO: VGETMANTSD $8, (R8), X2, K2, X2                    // 62d3ed0a271008 or 62d3ed2a271008 or 62d3ed4a271008
-       //TODO: VGETMANTSD $8, 15(DX)(BX*2), X2, K2, X2            // 62f3ed0a27945a0f00000008 or 62f3ed2a27945a0f00000008 or 62f3ed4a27945a0f00000008
-       //TODO: VGETMANTSS $9, X30, X22, K2, X26                   // 62034d0227d609
-       //TODO: VGETMANTSS $10, X15, X11, K3, X3                   // 62d3250b27df0a or 62d3252b27df0a or 62d3254b27df0a
-       //TODO: VGETMANTSS $10, -7(CX), X11, K3, X3                // 62f3250b2799f9ffffff0a or 62f3252b2799f9ffffff0a or 62f3254b2799f9ffffff0a
-       //TODO: VGETMANTSS $10, 15(DX)(BX*4), X11, K3, X3          // 62f3250b279c9a0f0000000a or 62f3252b279c9a0f0000000a or 62f3254b279c9a0f0000000a
-       //TODO: VINSERTF32X4 $0, X9, Y9, K1, Y2                    // 62d3352918d100
-       //TODO: VINSERTF32X4 $0, 15(R8)(R14*8), Y9, K1, Y2         // 629335291894f00f00000000
-       //TODO: VINSERTF32X4 $0, -15(R14)(R15*2), Y9, K1, Y2       // 6293352918947ef1ffffff00
-       //TODO: VINSERTF32X4 $0, X26, Z20, K7, Z16                 // 62835d4718c200
-       //TODO: VINSERTF32X4 $0, -15(R14)(R15*1), Z20, K7, Z16     // 62835d4718843ef1ffffff00
-       //TODO: VINSERTF32X4 $0, -15(BX), Z20, K7, Z16             // 62e35d471883f1ffffff00
-       //TODO: VINSERTF32X4 $0, X26, Z0, K7, Z16                  // 62837d4f18c200
-       //TODO: VINSERTF32X4 $0, -15(R14)(R15*1), Z0, K7, Z16      // 62837d4f18843ef1ffffff00
-       //TODO: VINSERTF32X4 $0, -15(BX), Z0, K7, Z16              // 62e37d4f1883f1ffffff00
-       //TODO: VINSERTF32X4 $0, X26, Z20, K7, Z9                  // 62135d4718ca00
-       //TODO: VINSERTF32X4 $0, -15(R14)(R15*1), Z20, K7, Z9      // 62135d47188c3ef1ffffff00
-       //TODO: VINSERTF32X4 $0, -15(BX), Z20, K7, Z9              // 62735d47188bf1ffffff00
-       //TODO: VINSERTF32X4 $0, X26, Z0, K7, Z9                   // 62137d4f18ca00
-       //TODO: VINSERTF32X4 $0, -15(R14)(R15*1), Z0, K7, Z9       // 62137d4f188c3ef1ffffff00
-       //TODO: VINSERTF32X4 $0, -15(BX), Z0, K7, Z9               // 62737d4f188bf1ffffff00
-       //TODO: VINSERTF64X4 $1, Y30, Z9, K3, Z0                   // 6293b54b1ac601
-       //TODO: VINSERTF64X4 $1, -17(BP)(SI*2), Z9, K3, Z0         // 62f3b54b1a8475efffffff01
-       //TODO: VINSERTF64X4 $1, 7(AX)(CX*2), Z9, K3, Z0           // 62f3b54b1a84480700000001
-       //TODO: VINSERTF64X4 $1, Y30, Z3, K3, Z0                   // 6293e54b1ac601
-       //TODO: VINSERTF64X4 $1, -17(BP)(SI*2), Z3, K3, Z0         // 62f3e54b1a8475efffffff01
-       //TODO: VINSERTF64X4 $1, 7(AX)(CX*2), Z3, K3, Z0           // 62f3e54b1a84480700000001
-       //TODO: VINSERTF64X4 $1, Y30, Z9, K3, Z26                  // 6203b54b1ad601
-       //TODO: VINSERTF64X4 $1, -17(BP)(SI*2), Z9, K3, Z26        // 6263b54b1a9475efffffff01
-       //TODO: VINSERTF64X4 $1, 7(AX)(CX*2), Z9, K3, Z26          // 6263b54b1a94480700000001
-       //TODO: VINSERTF64X4 $1, Y30, Z3, K3, Z26                  // 6203e54b1ad601
-       //TODO: VINSERTF64X4 $1, -17(BP)(SI*2), Z3, K3, Z26        // 6263e54b1a9475efffffff01
-       //TODO: VINSERTF64X4 $1, 7(AX)(CX*2), Z3, K3, Z26          // 6263e54b1a94480700000001
-       //TODO: VINSERTI32X4 $0, X31, Y7, K4, Y26                  // 6203452c38d700
-       //TODO: VINSERTI32X4 $0, 17(SP)(BP*8), Y7, K4, Y26         // 6263452c3894ec1100000000
-       //TODO: VINSERTI32X4 $0, 17(SP)(BP*4), Y7, K4, Y26         // 6263452c3894ac1100000000
-       //TODO: VINSERTI32X4 $2, X16, Z9, K5, Z9                   // 6233354d38c802
-       //TODO: VINSERTI32X4 $2, 7(SI)(DI*4), Z9, K5, Z9           // 6273354d388cbe0700000002
-       //TODO: VINSERTI32X4 $2, -7(DI)(R8*2), Z9, K5, Z9          // 6233354d388c47f9ffffff02
-       //TODO: VINSERTI32X4 $2, X16, Z28, K5, Z9                  // 62331d4538c802
-       //TODO: VINSERTI32X4 $2, 7(SI)(DI*4), Z28, K5, Z9          // 62731d45388cbe0700000002
-       //TODO: VINSERTI32X4 $2, -7(DI)(R8*2), Z28, K5, Z9         // 62331d45388c47f9ffffff02
-       //TODO: VINSERTI32X4 $2, X16, Z9, K5, Z25                  // 6223354d38c802
-       //TODO: VINSERTI32X4 $2, 7(SI)(DI*4), Z9, K5, Z25          // 6263354d388cbe0700000002
-       //TODO: VINSERTI32X4 $2, -7(DI)(R8*2), Z9, K5, Z25         // 6223354d388c47f9ffffff02
-       //TODO: VINSERTI32X4 $2, X16, Z28, K5, Z25                 // 62231d4538c802
-       //TODO: VINSERTI32X4 $2, 7(SI)(DI*4), Z28, K5, Z25         // 62631d45388cbe0700000002
-       //TODO: VINSERTI32X4 $2, -7(DI)(R8*2), Z28, K5, Z25        // 62231d45388c47f9ffffff02
-       //TODO: VINSERTI64X4 $1, Y31, Z6, K3, Z21                  // 6283cd4b3aef01
-       //TODO: VINSERTI64X4 $1, (R14), Z6, K3, Z21                // 62c3cd4b3a2e01
-       //TODO: VINSERTI64X4 $1, -7(DI)(R8*8), Z6, K3, Z21         // 62a3cd4b3aacc7f9ffffff01
-       //TODO: VINSERTI64X4 $1, Y31, Z9, K3, Z21                  // 6283b54b3aef01
-       //TODO: VINSERTI64X4 $1, (R14), Z9, K3, Z21                // 62c3b54b3a2e01
-       //TODO: VINSERTI64X4 $1, -7(DI)(R8*8), Z9, K3, Z21         // 62a3b54b3aacc7f9ffffff01
-       //TODO: VINSERTI64X4 $1, Y31, Z6, K3, Z9                   // 6213cd4b3acf01
-       //TODO: VINSERTI64X4 $1, (R14), Z6, K3, Z9                 // 6253cd4b3a0e01
-       //TODO: VINSERTI64X4 $1, -7(DI)(R8*8), Z6, K3, Z9          // 6233cd4b3a8cc7f9ffffff01
-       //TODO: VINSERTI64X4 $1, Y31, Z9, K3, Z9                   // 6213b54b3acf01
-       //TODO: VINSERTI64X4 $1, (R14), Z9, K3, Z9                 // 6253b54b3a0e01
-       //TODO: VINSERTI64X4 $1, -7(DI)(R8*8), Z9, K3, Z9          // 6233b54b3a8cc7f9ffffff01
-       //TODO: VMAXPD X21, X16, K7, X0                            // 62b1fd075fc5
-       //TODO: VMAXPD 99(R15)(R15*1), X16, K7, X0                 // 6291fd075f843f63000000
-       //TODO: VMAXPD (DX), X16, K7, X0                           // 62f1fd075f02
-       //TODO: VMAXPD Y21, Y6, K4, Y22                            // 62a1cd2c5ff5
-       //TODO: VMAXPD 99(R15)(R15*4), Y6, K4, Y22                 // 6281cd2c5fb4bf63000000
-       //TODO: VMAXPD 15(DX), Y6, K4, Y22                         // 62e1cd2c5fb20f000000
-       //TODO: VMAXPD Z30, Z20, K4, Z1                            // 6291dd445fce
-       //TODO: VMAXPD Z5, Z20, K4, Z1                             // 62f1dd445fcd
-       //TODO: VMAXPD Z30, Z9, K4, Z1                             // 6291b54c5fce
-       //TODO: VMAXPD Z5, Z9, K4, Z1                              // 62f1b54c5fcd
-       //TODO: VMAXPD Z30, Z20, K4, Z9                            // 6211dd445fce
-       //TODO: VMAXPD Z5, Z20, K4, Z9                             // 6271dd445fcd
-       //TODO: VMAXPD Z30, Z9, K4, Z9                             // 6211b54c5fce
-       //TODO: VMAXPD Z5, Z9, K4, Z9                              // 6271b54c5fcd
-       //TODO: VMAXPD Z16, Z7, K7, Z26                            // 6221c54f5fd0
-       //TODO: VMAXPD Z25, Z7, K7, Z26                            // 6201c54f5fd1
-       //TODO: VMAXPD 7(SI)(DI*1), Z7, K7, Z26                    // 6261c54f5f943e07000000
-       //TODO: VMAXPD 15(DX)(BX*8), Z7, K7, Z26                   // 6261c54f5f94da0f000000
-       //TODO: VMAXPD Z16, Z21, K7, Z26                           // 6221d5475fd0
-       //TODO: VMAXPD Z25, Z21, K7, Z26                           // 6201d5475fd1
-       //TODO: VMAXPD 7(SI)(DI*1), Z21, K7, Z26                   // 6261d5475f943e07000000
-       //TODO: VMAXPD 15(DX)(BX*8), Z21, K7, Z26                  // 6261d5475f94da0f000000
-       //TODO: VMAXPD Z16, Z7, K7, Z22                            // 62a1c54f5ff0
-       //TODO: VMAXPD Z25, Z7, K7, Z22                            // 6281c54f5ff1
-       //TODO: VMAXPD 7(SI)(DI*1), Z7, K7, Z22                    // 62e1c54f5fb43e07000000
-       //TODO: VMAXPD 15(DX)(BX*8), Z7, K7, Z22                   // 62e1c54f5fb4da0f000000
-       //TODO: VMAXPD Z16, Z21, K7, Z22                           // 62a1d5475ff0
-       //TODO: VMAXPD Z25, Z21, K7, Z22                           // 6281d5475ff1
-       //TODO: VMAXPD 7(SI)(DI*1), Z21, K7, Z22                   // 62e1d5475fb43e07000000
-       //TODO: VMAXPD 15(DX)(BX*8), Z21, K7, Z22                  // 62e1d5475fb4da0f000000
-       //TODO: VMAXPS X22, X28, K2, X0                            // 62b11c025fc6
-       //TODO: VMAXPS -17(BP)(SI*8), X28, K2, X0                  // 62f11c025f84f5efffffff
-       //TODO: VMAXPS (R15), X28, K2, X0                          // 62d11c025f07
-       //TODO: VMAXPS Y28, Y0, K5, Y7                             // 62917c2d5ffc
-       //TODO: VMAXPS (CX), Y0, K5, Y7                            // 62f17c2d5f39
-       //TODO: VMAXPS 99(R15), Y0, K5, Y7                         // 62d17c2d5fbf63000000
-       //TODO: VMAXPS Z21, Z12, K3, Z14                           // 62311c4b5ff5
-       //TODO: VMAXPS Z9, Z12, K3, Z14                            // 62511c4b5ff1
-       //TODO: VMAXPS Z21, Z13, K3, Z14                           // 6231144b5ff5
-       //TODO: VMAXPS Z9, Z13, K3, Z14                            // 6251144b5ff1
-       //TODO: VMAXPS Z21, Z12, K3, Z13                           // 62311c4b5fed
-       //TODO: VMAXPS Z9, Z12, K3, Z13                            // 62511c4b5fe9
-       //TODO: VMAXPS Z21, Z13, K3, Z13                           // 6231144b5fed
-       //TODO: VMAXPS Z9, Z13, K3, Z13                            // 6251144b5fe9
-       //TODO: VMAXPS Z23, Z27, K4, Z2                            // 62b124445fd7
-       //TODO: VMAXPS Z9, Z27, K4, Z2                             // 62d124445fd1
-       //TODO: VMAXPS -7(DI)(R8*1), Z27, K4, Z2                   // 62b124445f9407f9ffffff
-       //TODO: VMAXPS (SP), Z27, K4, Z2                           // 62f124445f1424
-       //TODO: VMAXPS Z23, Z25, K4, Z2                            // 62b134445fd7
-       //TODO: VMAXPS Z9, Z25, K4, Z2                             // 62d134445fd1
-       //TODO: VMAXPS -7(DI)(R8*1), Z25, K4, Z2                   // 62b134445f9407f9ffffff
-       //TODO: VMAXPS (SP), Z25, K4, Z2                           // 62f134445f1424
-       //TODO: VMAXPS Z23, Z27, K4, Z7                            // 62b124445fff
-       //TODO: VMAXPS Z9, Z27, K4, Z7                             // 62d124445ff9
-       //TODO: VMAXPS -7(DI)(R8*1), Z27, K4, Z7                   // 62b124445fbc07f9ffffff
-       //TODO: VMAXPS (SP), Z27, K4, Z7                           // 62f124445f3c24
-       //TODO: VMAXPS Z23, Z25, K4, Z7                            // 62b134445fff
-       //TODO: VMAXPS Z9, Z25, K4, Z7                             // 62d134445ff9
-       //TODO: VMAXPS -7(DI)(R8*1), Z25, K4, Z7                   // 62b134445fbc07f9ffffff
-       //TODO: VMAXPS (SP), Z25, K4, Z7                           // 62f134445f3c24
-       //TODO: VMAXSD X7, X19, K2, X7                             // 62f1e7025fff
-       //TODO: VMAXSD X1, X31, K2, X16                            // 62e187025fc1 or 62e187225fc1 or 62e187425fc1
-       //TODO: VMAXSD 17(SP)(BP*1), X31, K2, X16                  // 62e187025f842c11000000 or 62e187225f842c11000000 or 62e187425f842c11000000
-       //TODO: VMAXSD -7(CX)(DX*8), X31, K2, X16                  // 62e187025f84d1f9ffffff or 62e187225f84d1f9ffffff or 62e187425f84d1f9ffffff
-       //TODO: VMAXSS X15, X9, K3, X7                             // 62d1360b5fff
-       //TODO: VMAXSS X12, X0, K3, X12                            // 62517e0b5fe4 or 62517e2b5fe4 or 62517e4b5fe4
-       //TODO: VMAXSS (AX), X0, K3, X12                           // 62717e0b5f20 or 62717e2b5f20 or 62717e4b5f20
-       //TODO: VMAXSS 7(SI), X0, K3, X12                          // 62717e0b5fa607000000 or 62717e2b5fa607000000 or 62717e4b5fa607000000
-       //TODO: VMINPD X17, X5, K3, X14                            // 6231d50b5df1
-       //TODO: VMINPD 7(SI)(DI*8), X5, K3, X14                    // 6271d50b5db4fe07000000
-       //TODO: VMINPD -15(R14), X5, K3, X14                       // 6251d50b5db6f1ffffff
-       //TODO: VMINPD Y24, Y14, K2, Y20                           // 62818d2a5de0
-       //TODO: VMINPD 99(R15)(R15*2), Y14, K2, Y20                // 62818d2a5da47f63000000
-       //TODO: VMINPD -7(DI), Y14, K2, Y20                        // 62e18d2a5da7f9ffffff
-       //TODO: VMINPD Z14, Z3, K1, Z27                            // 6241e5495dde
-       //TODO: VMINPD Z7, Z3, K1, Z27                             // 6261e5495ddf
-       //TODO: VMINPD Z14, Z0, K1, Z27                            // 6241fd495dde
-       //TODO: VMINPD Z7, Z0, K1, Z27                             // 6261fd495ddf
-       //TODO: VMINPD Z14, Z3, K1, Z14                            // 6251e5495df6
-       //TODO: VMINPD Z7, Z3, K1, Z14                             // 6271e5495df7
-       //TODO: VMINPD Z14, Z0, K1, Z14                            // 6251fd495df6
-       //TODO: VMINPD Z7, Z0, K1, Z14                             // 6271fd495df7
-       //TODO: VMINPD Z1, Z22, K2, Z8                             // 6271cd425dc1
-       //TODO: VMINPD Z16, Z22, K2, Z8                            // 6231cd425dc0
-       //TODO: VMINPD -7(CX), Z22, K2, Z8                         // 6271cd425d81f9ffffff
-       //TODO: VMINPD 15(DX)(BX*4), Z22, K2, Z8                   // 6271cd425d849a0f000000
-       //TODO: VMINPD Z1, Z25, K2, Z8                             // 6271b5425dc1
-       //TODO: VMINPD Z16, Z25, K2, Z8                            // 6231b5425dc0
-       //TODO: VMINPD -7(CX), Z25, K2, Z8                         // 6271b5425d81f9ffffff
-       //TODO: VMINPD 15(DX)(BX*4), Z25, K2, Z8                   // 6271b5425d849a0f000000
-       //TODO: VMINPD Z1, Z22, K2, Z24                            // 6261cd425dc1
-       //TODO: VMINPD Z16, Z22, K2, Z24                           // 6221cd425dc0
-       //TODO: VMINPD -7(CX), Z22, K2, Z24                        // 6261cd425d81f9ffffff
-       //TODO: VMINPD 15(DX)(BX*4), Z22, K2, Z24                  // 6261cd425d849a0f000000
-       //TODO: VMINPD Z1, Z25, K2, Z24                            // 6261b5425dc1
-       //TODO: VMINPD Z16, Z25, K2, Z24                           // 6221b5425dc0
-       //TODO: VMINPD -7(CX), Z25, K2, Z24                        // 6261b5425d81f9ffffff
-       //TODO: VMINPD 15(DX)(BX*4), Z25, K2, Z24                  // 6261b5425d849a0f000000
-       //TODO: VMINPS X3, X8, K1, X15                             // 62713c095dfb
-       //TODO: VMINPS 7(SI)(DI*1), X8, K1, X15                    // 62713c095dbc3e07000000
-       //TODO: VMINPS 15(DX)(BX*8), X8, K1, X15                   // 62713c095dbcda0f000000
-       //TODO: VMINPS Y14, Y20, K7, Y13                           // 62515c275dee
-       //TODO: VMINPS -7(CX)(DX*1), Y20, K7, Y13                  // 62715c275dac11f9ffffff
-       //TODO: VMINPS -15(R14)(R15*4), Y20, K7, Y13               // 62115c275dacbef1ffffff
-       //TODO: VMINPS Z15, Z0, K1, Z6                             // 62d17c495df7
-       //TODO: VMINPS Z12, Z0, K1, Z6                             // 62d17c495df4
-       //TODO: VMINPS Z15, Z8, K1, Z6                             // 62d13c495df7
-       //TODO: VMINPS Z12, Z8, K1, Z6                             // 62d13c495df4
-       //TODO: VMINPS Z15, Z0, K1, Z2                             // 62d17c495dd7
-       //TODO: VMINPS Z12, Z0, K1, Z2                             // 62d17c495dd4
-       //TODO: VMINPS Z15, Z8, K1, Z2                             // 62d13c495dd7
-       //TODO: VMINPS Z12, Z8, K1, Z2                             // 62d13c495dd4
-       //TODO: VMINPS Z13, Z11, K1, Z14                           // 625124495df5
-       //TODO: VMINPS Z14, Z11, K1, Z14                           // 625124495df6
-       //TODO: VMINPS 99(R15)(R15*8), Z11, K1, Z14                // 621124495db4ff63000000
-       //TODO: VMINPS 7(AX)(CX*8), Z11, K1, Z14                   // 627124495db4c807000000
-       //TODO: VMINPS Z13, Z5, K1, Z14                            // 625154495df5
-       //TODO: VMINPS Z14, Z5, K1, Z14                            // 625154495df6
-       //TODO: VMINPS 99(R15)(R15*8), Z5, K1, Z14                 // 621154495db4ff63000000
-       //TODO: VMINPS 7(AX)(CX*8), Z5, K1, Z14                    // 627154495db4c807000000
-       //TODO: VMINPS Z13, Z11, K1, Z27                           // 624124495ddd
-       //TODO: VMINPS Z14, Z11, K1, Z27                           // 624124495dde
-       //TODO: VMINPS 99(R15)(R15*8), Z11, K1, Z27                // 620124495d9cff63000000
-       //TODO: VMINPS 7(AX)(CX*8), Z11, K1, Z27                   // 626124495d9cc807000000
-       //TODO: VMINPS Z13, Z5, K1, Z27                            // 624154495ddd
-       //TODO: VMINPS Z14, Z5, K1, Z27                            // 624154495dde
-       //TODO: VMINPS 99(R15)(R15*8), Z5, K1, Z27                 // 620154495d9cff63000000
-       //TODO: VMINPS 7(AX)(CX*8), Z5, K1, Z27                    // 626154495d9cc807000000
-       //TODO: VMINSD X13, X23, K1, X26                           // 6241c7015dd5
-       //TODO: VMINSD X9, X24, K7, X28                            // 6241bf075de1 or 6241bf275de1 or 6241bf475de1
-       //TODO: VMINSD -17(BP)(SI*2), X24, K7, X28                 // 6261bf075da475efffffff or 6261bf275da475efffffff or 6261bf475da475efffffff
-       //TODO: VMINSD 7(AX)(CX*2), X24, K7, X28                   // 6261bf075da44807000000 or 6261bf275da44807000000 or 6261bf475da44807000000
-       //TODO: VMINSS X18, X26, K2, X15                           // 62312e025dfa
-       //TODO: VMINSS X11, X1, K4, X21                            // 62c1760c5deb or 62c1762c5deb or 62c1764c5deb
-       //TODO: VMINSS (BX), X1, K4, X21                           // 62e1760c5d2b or 62e1762c5d2b or 62e1764c5d2b
-       //TODO: VMINSS -17(BP)(SI*1), X1, K4, X21                  // 62e1760c5dac35efffffff or 62e1762c5dac35efffffff or 62e1764c5dac35efffffff
-       //TODO: VMOVAPD X3, K1, X31                                // 6291fd0929df
-       //TODO: VMOVAPD X3, K1, -7(DI)(R8*1)                       // 62b1fd09299c07f9ffffff
-       //TODO: VMOVAPD X3, K1, (SP)                               // 62f1fd09291c24
-       //TODO: VMOVAPD X0, K3, X7                                 // 62f1fd0b29c7
-       //TODO: VMOVAPD -7(CX), K3, X7                             // 62f1fd0b28b9f9ffffff
-       //TODO: VMOVAPD 15(DX)(BX*4), K3, X7                       // 62f1fd0b28bc9a0f000000
-       //TODO: VMOVAPD Y1, K4, Y21                                // 62b1fd2c29cd
-       //TODO: VMOVAPD Y1, K4, 15(DX)(BX*1)                       // 62f1fd2c298c1a0f000000
-       //TODO: VMOVAPD Y1, K4, -7(CX)(DX*2)                       // 62f1fd2c298c51f9ffffff
-       //TODO: VMOVAPD Y30, K5, Y26                               // 6201fd2d29f2
-       //TODO: VMOVAPD -17(BP), K5, Y26                           // 6261fd2d2895efffffff
-       //TODO: VMOVAPD -15(R14)(R15*8), K5, Y26                   // 6201fd2d2894fef1ffffff
-       //TODO: VMOVAPD Z2, K7, Z5                                 // 62f1fd4f29d5
-       //TODO: VMOVAPD Z2, K7, Z23                                // 62b1fd4f29d7
-       //TODO: VMOVAPD Z2, K7, (AX)                               // 62f1fd4f2910
-       //TODO: VMOVAPD Z2, K7, 7(SI)                              // 62f1fd4f299607000000
-       //TODO: VMOVAPD Z26, K7, Z6                                // 6261fd4f29d6
-       //TODO: VMOVAPD Z14, K7, Z6                                // 6271fd4f29f6
-       //TODO: VMOVAPD (BX), K7, Z6                               // 62f1fd4f2833
-       //TODO: VMOVAPD -17(BP)(SI*1), K7, Z6                      // 62f1fd4f28b435efffffff
-       //TODO: VMOVAPD Z26, K7, Z14                               // 6241fd4f29d6
-       //TODO: VMOVAPD Z14, K7, Z14                               // 6251fd4f29f6
-       //TODO: VMOVAPD (BX), K7, Z14                              // 6271fd4f2833
-       //TODO: VMOVAPD -17(BP)(SI*1), K7, Z14                     // 6271fd4f28b435efffffff
-       //TODO: VMOVAPS X24, K6, X0                                // 62617c0e29c0
-       //TODO: VMOVAPS X24, K6, 99(R15)(R15*8)                    // 62017c0e2984ff63000000
-       //TODO: VMOVAPS X24, K6, 7(AX)(CX*8)                       // 62617c0e2984c807000000
-       //TODO: VMOVAPS X7, K3, X20                                // 62b17c0b29fc
-       //TODO: VMOVAPS (AX), K3, X20                              // 62e17c0b2820
-       //TODO: VMOVAPS 7(SI), K3, X20                             // 62e17c0b28a607000000
-       //TODO: VMOVAPS Y22, K7, Y12                               // 62c17c2f29f4
-       //TODO: VMOVAPS Y22, K7, 17(SP)(BP*2)                      // 62e17c2f29b46c11000000
-       //TODO: VMOVAPS Y22, K7, -7(DI)(R8*4)                      // 62a17c2f29b487f9ffffff
-       //TODO: VMOVAPS Y15, K4, Y3                                // 62717c2c29fb
-       //TODO: VMOVAPS 15(R8), K4, Y3                             // 62d17c2c28980f000000
-       //TODO: VMOVAPS (BP), K4, Y3                               // 62f17c2c285d00
-       //TODO: VMOVAPS Z13, K4, Z28                               // 62117c4c29ec
-       //TODO: VMOVAPS Z21, K4, Z28                               // 62817c4c29ec
-       //TODO: VMOVAPS Z13, K4, Z6                                // 62717c4c29ee
-       //TODO: VMOVAPS Z21, K4, Z6                                // 62e17c4c29ee
-       //TODO: VMOVAPS Z13, K4, 15(R8)(R14*4)                     // 62117c4c29acb00f000000
-       //TODO: VMOVAPS Z21, K4, 15(R8)(R14*4)                     // 62817c4c29acb00f000000
-       //TODO: VMOVAPS Z13, K4, -7(CX)(DX*4)                      // 62717c4c29ac91f9ffffff
-       //TODO: VMOVAPS Z21, K4, -7(CX)(DX*4)                      // 62e17c4c29ac91f9ffffff
-       //TODO: VMOVAPS Z3, K7, Z26                                // 62917c4f29da
-       //TODO: VMOVAPS Z0, K7, Z26                                // 62917c4f29c2
-       //TODO: VMOVAPS (R8), K7, Z26                              // 62417c4f2810
-       //TODO: VMOVAPS 15(DX)(BX*2), K7, Z26                      // 62617c4f28945a0f000000
-       //TODO: VMOVAPS Z3, K7, Z3                                 // 62f17c4f29db
-       //TODO: VMOVAPS Z0, K7, Z3                                 // 62f17c4f29c3
-       //TODO: VMOVAPS (R8), K7, Z3                               // 62d17c4f2818
-       //TODO: VMOVAPS 15(DX)(BX*2), K7, Z3                       // 62f17c4f289c5a0f000000
-       //TODO: VMOVDDUP X5, K2, X14                               // 6271ff0a12f5
-       //TODO: VMOVDDUP 15(R8)(R14*1), K2, X14                    // 6211ff0a12b4300f000000
-       //TODO: VMOVDDUP 15(R8)(R14*2), K2, X14                    // 6211ff0a12b4700f000000
-       //TODO: VMOVDDUP Y27, K5, Y1                               // 6291ff2d12cb
-       //TODO: VMOVDDUP 15(R8)(R14*8), K5, Y1                     // 6291ff2d128cf00f000000
-       //TODO: VMOVDDUP -15(R14)(R15*2), K5, Y1                   // 6291ff2d128c7ef1ffffff
-       //TODO: VMOVDDUP Z11, K3, Z21                              // 62c1ff4b12eb
-       //TODO: VMOVDDUP Z25, K3, Z21                              // 6281ff4b12e9
-       //TODO: VMOVDDUP 17(SP)(BP*1), K3, Z21                     // 62e1ff4b12ac2c11000000
-       //TODO: VMOVDDUP -7(CX)(DX*8), K3, Z21                     // 62e1ff4b12acd1f9ffffff
-       //TODO: VMOVDDUP Z11, K3, Z13                              // 6251ff4b12eb
-       //TODO: VMOVDDUP Z25, K3, Z13                              // 6211ff4b12e9
-       //TODO: VMOVDDUP 17(SP)(BP*1), K3, Z13                     // 6271ff4b12ac2c11000000
-       //TODO: VMOVDDUP -7(CX)(DX*8), K3, Z13                     // 6271ff4b12acd1f9ffffff
-       //TODO: VMOVDQA32 X3, K4, X31                              // 62917d0c7fdf
-       //TODO: VMOVDQA32 X3, K4, (BX)                             // 62f17d0c7f1b
-       //TODO: VMOVDQA32 X3, K4, -17(BP)(SI*1)                    // 62f17d0c7f9c35efffffff
-       //TODO: VMOVDQA32 X1, K2, X21                              // 62b17d0a7fcd
-       //TODO: VMOVDQA32 15(R8)(R14*4), K2, X21                   // 62817d0a6facb00f000000
-       //TODO: VMOVDQA32 -7(CX)(DX*4), K2, X21                    // 62e17d0a6fac91f9ffffff
-       //TODO: VMOVDQA32 Y5, K2, Y19                              // 62b17d2a7feb
-       //TODO: VMOVDQA32 Y5, K2, -15(R14)(R15*1)                  // 62917d2a7fac3ef1ffffff
-       //TODO: VMOVDQA32 Y5, K2, -15(BX)                          // 62f17d2a7fabf1ffffff
-       //TODO: VMOVDQA32 Y13, K3, Y17                             // 62317d2b7fe9
-       //TODO: VMOVDQA32 7(AX)(CX*4), K3, Y17                     // 62e17d2b6f8c8807000000
-       //TODO: VMOVDQA32 7(AX)(CX*1), K3, Y17                     // 62e17d2b6f8c0807000000
-       //TODO: VMOVDQA32 Z27, K3, Z3                              // 62617d4b7fdb
-       //TODO: VMOVDQA32 Z15, K3, Z3                              // 62717d4b7ffb
-       //TODO: VMOVDQA32 Z27, K3, Z12                             // 62417d4b7fdc
-       //TODO: VMOVDQA32 Z15, K3, Z12                             // 62517d4b7ffc
-       //TODO: VMOVDQA32 Z27, K3, -17(BP)(SI*2)                   // 62617d4b7f9c75efffffff
-       //TODO: VMOVDQA32 Z15, K3, -17(BP)(SI*2)                   // 62717d4b7fbc75efffffff
-       //TODO: VMOVDQA32 Z27, K3, 7(AX)(CX*2)                     // 62617d4b7f9c4807000000
-       //TODO: VMOVDQA32 Z15, K3, 7(AX)(CX*2)                     // 62717d4b7fbc4807000000
-       //TODO: VMOVDQA32 Z23, K3, Z23                             // 62a17d4b7fff
-       //TODO: VMOVDQA32 Z6, K3, Z23                              // 62b17d4b7ff7
-       //TODO: VMOVDQA32 15(R8)(R14*1), K3, Z23                   // 62817d4b6fbc300f000000
-       //TODO: VMOVDQA32 15(R8)(R14*2), K3, Z23                   // 62817d4b6fbc700f000000
-       //TODO: VMOVDQA32 Z23, K3, Z5                              // 62e17d4b7ffd
-       //TODO: VMOVDQA32 Z6, K3, Z5                               // 62f17d4b7ff5
-       //TODO: VMOVDQA32 15(R8)(R14*1), K3, Z5                    // 62917d4b6fac300f000000
-       //TODO: VMOVDQA32 15(R8)(R14*2), K3, Z5                    // 62917d4b6fac700f000000
-       //TODO: VMOVDQA64 X13, K2, X11                             // 6251fd0a7feb
-       //TODO: VMOVDQA64 X13, K2, (R8)                            // 6251fd0a7f28
-       //TODO: VMOVDQA64 X13, K2, 15(DX)(BX*2)                    // 6271fd0a7fac5a0f000000
-       //TODO: VMOVDQA64 X30, K1, X0                              // 6261fd097ff0
-       //TODO: VMOVDQA64 17(SP)(BP*1), K1, X0                     // 62f1fd096f842c11000000
-       //TODO: VMOVDQA64 -7(CX)(DX*8), K1, X0                     // 62f1fd096f84d1f9ffffff
-       //TODO: VMOVDQA64 Y7, K2, Y21                              // 62b1fd2a7ffd
-       //TODO: VMOVDQA64 Y7, K2, (SI)                             // 62f1fd2a7f3e
-       //TODO: VMOVDQA64 Y7, K2, 7(SI)(DI*2)                      // 62f1fd2a7fbc7e07000000
-       //TODO: VMOVDQA64 Y13, K1, Y30                             // 6211fd297fee
-       //TODO: VMOVDQA64 17(SP)(BP*8), K1, Y30                    // 6261fd296fb4ec11000000
-       //TODO: VMOVDQA64 17(SP)(BP*4), K1, Y30                    // 6261fd296fb4ac11000000
-       //TODO: VMOVDQA64 Z21, K7, Z8                              // 62c1fd4f7fe8
-       //TODO: VMOVDQA64 Z5, K7, Z8                               // 62d1fd4f7fe8
-       //TODO: VMOVDQA64 Z21, K7, Z28                             // 6281fd4f7fec
-       //TODO: VMOVDQA64 Z5, K7, Z28                              // 6291fd4f7fec
-       //TODO: VMOVDQA64 Z21, K7, (R14)                           // 62c1fd4f7f2e
-       //TODO: VMOVDQA64 Z5, K7, (R14)                            // 62d1fd4f7f2e
-       //TODO: VMOVDQA64 Z21, K7, -7(DI)(R8*8)                    // 62a1fd4f7facc7f9ffffff
-       //TODO: VMOVDQA64 Z5, K7, -7(DI)(R8*8)                     // 62b1fd4f7facc7f9ffffff
-       //TODO: VMOVDQA64 Z12, K1, Z16                             // 6231fd497fe0
-       //TODO: VMOVDQA64 Z27, K1, Z16                             // 6221fd497fd8
-       //TODO: VMOVDQA64 99(R15)(R15*4), K1, Z16                  // 6281fd496f84bf63000000
-       //TODO: VMOVDQA64 15(DX), K1, Z16                          // 62e1fd496f820f000000
-       //TODO: VMOVDQA64 Z12, K1, Z13                             // 6251fd497fe5
-       //TODO: VMOVDQA64 Z27, K1, Z13                             // 6241fd497fdd
-       //TODO: VMOVDQA64 99(R15)(R15*4), K1, Z13                  // 6211fd496facbf63000000
-       //TODO: VMOVDQA64 15(DX), K1, Z13                          // 6271fd496faa0f000000
-       //TODO: VMOVDQU32 X8, K3, X19                              // 62317e0b7fc3
-       //TODO: VMOVDQU32 X8, K3, (R14)                            // 62517e0b7f06
-       //TODO: VMOVDQU32 X8, K3, -7(DI)(R8*8)                     // 62317e0b7f84c7f9ffffff
-       //TODO: VMOVDQU32 X26, K4, X8                              // 62417e0c7fd0
-       //TODO: VMOVDQU32 99(R15)(R15*4), K4, X8                   // 62117e0c6f84bf63000000
-       //TODO: VMOVDQU32 15(DX), K4, X8                           // 62717e0c6f820f000000
-       //TODO: VMOVDQU32 Y5, K5, Y24                              // 62917e2d7fe8
-       //TODO: VMOVDQU32 Y5, K5, 7(AX)                            // 62f17e2d7fa807000000
-       //TODO: VMOVDQU32 Y5, K5, (DI)                             // 62f17e2d7f2f
-       //TODO: VMOVDQU32 Y21, K7, Y24                             // 62817e2f7fe8
-       //TODO: VMOVDQU32 99(R15)(R15*1), K7, Y24                  // 62017e2f6f843f63000000
-       //TODO: VMOVDQU32 (DX), K7, Y24                            // 62617e2f6f02
-       //TODO: VMOVDQU32 Z6, K7, Z9                               // 62d17e4f7ff1
-       //TODO: VMOVDQU32 Z25, K7, Z9                              // 62417e4f7fc9
-       //TODO: VMOVDQU32 Z6, K7, Z12                              // 62d17e4f7ff4
-       //TODO: VMOVDQU32 Z25, K7, Z12                             // 62417e4f7fcc
-       //TODO: VMOVDQU32 Z6, K7, -7(CX)(DX*1)                     // 62f17e4f7fb411f9ffffff
-       //TODO: VMOVDQU32 Z25, K7, -7(CX)(DX*1)                    // 62617e4f7f8c11f9ffffff
-       //TODO: VMOVDQU32 Z6, K7, -15(R14)(R15*4)                  // 62917e4f7fb4bef1ffffff
-       //TODO: VMOVDQU32 Z25, K7, -15(R14)(R15*4)                 // 62017e4f7f8cbef1ffffff
-       //TODO: VMOVDQU32 Z8, K6, Z3                               // 62717e4e7fc3
-       //TODO: VMOVDQU32 Z2, K6, Z3                               // 62f17e4e7fd3
-       //TODO: VMOVDQU32 15(DX)(BX*1), K6, Z3                     // 62f17e4e6f9c1a0f000000
-       //TODO: VMOVDQU32 -7(CX)(DX*2), K6, Z3                     // 62f17e4e6f9c51f9ffffff
-       //TODO: VMOVDQU32 Z8, K6, Z21                              // 62317e4e7fc5
-       //TODO: VMOVDQU32 Z2, K6, Z21                              // 62b17e4e7fd5
-       //TODO: VMOVDQU32 15(DX)(BX*1), K6, Z21                    // 62e17e4e6fac1a0f000000
-       //TODO: VMOVDQU32 -7(CX)(DX*2), K6, Z21                    // 62e17e4e6fac51f9ffffff
-       //TODO: VMOVDQU64 X12, K3, X23                             // 6231fe0b7fe7
-       //TODO: VMOVDQU64 X12, K3, (CX)                            // 6271fe0b7f21
-       //TODO: VMOVDQU64 X12, K3, 99(R15)                         // 6251fe0b7fa763000000
-       //TODO: VMOVDQU64 X23, K7, X16                             // 62a1fe0f7ff8
-       //TODO: VMOVDQU64 99(R15)(R15*2), K7, X16                  // 6281fe0f6f847f63000000
-       //TODO: VMOVDQU64 -7(DI), K7, X16                          // 62e1fe0f6f87f9ffffff
-       //TODO: VMOVDQU64 Y9, K4, Y16                              // 6231fe2c7fc8
-       //TODO: VMOVDQU64 Y9, K4, -17(BP)(SI*8)                    // 6271fe2c7f8cf5efffffff
-       //TODO: VMOVDQU64 Y9, K4, (R15)                            // 6251fe2c7f0f
-       //TODO: VMOVDQU64 Y9, K4, Y13                              // 6251fe2c7fcd
-       //TODO: VMOVDQU64 7(SI)(DI*8), K4, Y13                     // 6271fe2c6facfe07000000
-       //TODO: VMOVDQU64 -15(R14), K4, Y13                        // 6251fe2c6faef1ffffff
-       //TODO: VMOVDQU64 Z7, K7, Z3                               // 62f1fe4f7ffb
-       //TODO: VMOVDQU64 Z9, K7, Z3                               // 6271fe4f7fcb
-       //TODO: VMOVDQU64 Z7, K7, Z27                              // 6291fe4f7ffb
-       //TODO: VMOVDQU64 Z9, K7, Z27                              // 6211fe4f7fcb
-       //TODO: VMOVDQU64 Z7, K7, -17(BP)                          // 62f1fe4f7fbdefffffff
-       //TODO: VMOVDQU64 Z9, K7, -17(BP)                          // 6271fe4f7f8defffffff
-       //TODO: VMOVDQU64 Z7, K7, -15(R14)(R15*8)                  // 6291fe4f7fbcfef1ffffff
-       //TODO: VMOVDQU64 Z9, K7, -15(R14)(R15*8)                  // 6211fe4f7f8cfef1ffffff
-       //TODO: VMOVDQU64 Z20, K2, Z0                              // 62e1fe4a7fe0
-       //TODO: VMOVDQU64 Z28, K2, Z0                              // 6261fe4a7fe0
-       //TODO: VMOVDQU64 17(SP)(BP*2), K2, Z0                     // 62f1fe4a6f846c11000000
-       //TODO: VMOVDQU64 -7(DI)(R8*4), K2, Z0                     // 62b1fe4a6f8487f9ffffff
-       //TODO: VMOVDQU64 Z20, K2, Z6                              // 62e1fe4a7fe6
-       //TODO: VMOVDQU64 Z28, K2, Z6                              // 6261fe4a7fe6
-       //TODO: VMOVDQU64 17(SP)(BP*2), K2, Z6                     // 62f1fe4a6fb46c11000000
-       //TODO: VMOVDQU64 -7(DI)(R8*4), K2, Z6                     // 62b1fe4a6fb487f9ffffff
-       //TODO: VMOVHPS (R14), X2, X23                             // 62c16c08163e
-       //TODO: VMOVHPS -7(DI)(R8*8), X2, X23                      // 62a16c0816bcc7f9ffffff
-       //TODO: VMOVHPS X20, 99(R15)(R15*4)                        // 62817c0817a4bf63000000
-       //TODO: VMOVHPS X20, 15(DX)                                // 62e17c0817a20f000000
-       //TODO: VMOVLHPS X0, X25, X5                               // 62f1340016e8
-       //TODO: VMOVNTDQ Y26, -7(CX)                               // 62617d28e791f9ffffff
-       //TODO: VMOVNTDQ Y26, 15(DX)(BX*4)                         // 62617d28e7949a0f000000
-       //TODO: VMOVNTDQ Z18, -15(R14)(R15*1)                      // 62817d48e7943ef1ffffff
-       //TODO: VMOVNTDQ Z24, -15(R14)(R15*1)                      // 62017d48e7843ef1ffffff
-       //TODO: VMOVNTDQ Z18, -15(BX)                              // 62e17d48e793f1ffffff
-       //TODO: VMOVNTDQ Z24, -15(BX)                              // 62617d48e783f1ffffff
-       //TODO: VMOVNTDQA 7(AX)(CX*4), Z2                          // 62f27d482a948807000000
-       //TODO: VMOVNTDQA 7(AX)(CX*1), Z2                          // 62f27d482a940807000000
-       //TODO: VMOVNTDQA 7(AX)(CX*4), Z21                         // 62e27d482aac8807000000
-       //TODO: VMOVNTDQA 7(AX)(CX*1), Z21                         // 62e27d482aac0807000000
-       //TODO: VMOVNTPD Y26, (AX)                                 // 6261fd282b10
-       //TODO: VMOVNTPD Y26, 7(SI)                                // 6261fd282b9607000000
-       //TODO: VMOVNTPD Z7, (SI)                                  // 62f1fd482b3e
-       //TODO: VMOVNTPD Z13, (SI)                                 // 6271fd482b2e
-       //TODO: VMOVNTPD Z7, 7(SI)(DI*2)                           // 62f1fd482bbc7e07000000
-       //TODO: VMOVNTPD Z13, 7(SI)(DI*2)                          // 6271fd482bac7e07000000
-       //TODO: VMOVNTPS X31, 15(R8)(R14*8)                        // 62017c082bbcf00f000000
-       //TODO: VMOVNTPS X31, -15(R14)(R15*2)                      // 62017c082bbc7ef1ffffff
-       //TODO: VMOVNTPS Z6, 17(SP)(BP*8)                          // 62f17c482bb4ec11000000
-       //TODO: VMOVNTPS Z16, 17(SP)(BP*8)                         // 62e17c482b84ec11000000
-       //TODO: VMOVNTPS Z6, 17(SP)(BP*4)                          // 62f17c482bb4ac11000000
-       //TODO: VMOVNTPS Z16, 17(SP)(BP*4)                         // 62e17c482b84ac11000000
-       //TODO: VMOVSD -7(CX)(DX*1), K3, X11                       // 6271ff0b109c11f9ffffff or 6271ff2b109c11f9ffffff or 6271ff4b109c11f9ffffff
-       //TODO: VMOVSD -15(R14)(R15*4), K3, X11                    // 6211ff0b109cbef1ffffff or 6211ff2b109cbef1ffffff or 6211ff4b109cbef1ffffff
-       //TODO: VMOVSD X14, X5, K3, X22                            // 6231d70b11f6 or 6231d72b11f6 or 6231d74b11f6
-       //TODO: VMOVSD X0, K2, 15(DX)(BX*1)                        // 62f1ff0a11841a0f000000 or 62f1ff2a11841a0f000000 or 62f1ff4a11841a0f000000
-       //TODO: VMOVSD X0, K2, -7(CX)(DX*2)                        // 62f1ff0a118451f9ffffff or 62f1ff2a118451f9ffffff or 62f1ff4a118451f9ffffff
-       //TODO: VMOVSD X15, X7, K1, X17                            // 6231c70911f9 or 6231c72911f9 or 6231c74911f9
-       //TODO: VMOVSHDUP X0, K2, X11                              // 62717e0a16d8
-       //TODO: VMOVSHDUP -15(R14)(R15*1), K2, X11                 // 62117e0a169c3ef1ffffff
-       //TODO: VMOVSHDUP -15(BX), K2, X11                         // 62717e0a169bf1ffffff
-       //TODO: VMOVSHDUP Y18, K1, Y14                             // 62317e2916f2
-       //TODO: VMOVSHDUP 15(R8)(R14*4), K1, Y14                   // 62117e2916b4b00f000000
-       //TODO: VMOVSHDUP -7(CX)(DX*4), K1, Y14                    // 62717e2916b491f9ffffff
-       //TODO: VMOVSHDUP Z1, K7, Z6                               // 62f17e4f16f1
-       //TODO: VMOVSHDUP Z15, K7, Z6                              // 62d17e4f16f7
-       //TODO: VMOVSHDUP 7(SI)(DI*4), K7, Z6                      // 62f17e4f16b4be07000000
-       //TODO: VMOVSHDUP -7(DI)(R8*2), K7, Z6                     // 62b17e4f16b447f9ffffff
-       //TODO: VMOVSHDUP Z1, K7, Z22                              // 62e17e4f16f1
-       //TODO: VMOVSHDUP Z15, K7, Z22                             // 62c17e4f16f7
-       //TODO: VMOVSHDUP 7(SI)(DI*4), K7, Z22                     // 62e17e4f16b4be07000000
-       //TODO: VMOVSHDUP -7(DI)(R8*2), K7, Z22                    // 62a17e4f16b447f9ffffff
-       //TODO: VMOVSLDUP X8, K1, X18                              // 62c17e0912d0
-       //TODO: VMOVSLDUP 7(AX)(CX*4), K1, X18                     // 62e17e0912948807000000
-       //TODO: VMOVSLDUP 7(AX)(CX*1), K1, X18                     // 62e17e0912940807000000
-       //TODO: VMOVSLDUP Y18, K1, Y31                             // 62217e2912fa
-       //TODO: VMOVSLDUP (R8), K1, Y31                            // 62417e291238
-       //TODO: VMOVSLDUP 15(DX)(BX*2), K1, Y31                    // 62617e2912bc5a0f000000
-       //TODO: VMOVSLDUP Z18, K1, Z13                             // 62317e4912ea
-       //TODO: VMOVSLDUP Z8, K1, Z13                              // 62517e4912e8
-       //TODO: VMOVSLDUP 17(SP), K1, Z13                          // 62717e4912ac2411000000
-       //TODO: VMOVSLDUP -17(BP)(SI*4), K1, Z13                   // 62717e4912acb5efffffff
-       //TODO: VMOVSS 17(SP)(BP*1), K7, X27                       // 62617e0f109c2c11000000 or 62617e2f109c2c11000000 or 62617e4f109c2c11000000
-       //TODO: VMOVSS -7(CX)(DX*8), K7, X27                       // 62617e0f109cd1f9ffffff or 62617e2f109cd1f9ffffff or 62617e4f109cd1f9ffffff
-       //TODO: VMOVSS X18, X3, K2, X25                            // 6281660a11d1 or 6281662a11d1 or 6281664a11d1
-       //TODO: VMOVSS X15, K4, -17(BP)(SI*2)                      // 62717e0c11bc75efffffff or 62717e2c11bc75efffffff or 62717e4c11bc75efffffff
-       //TODO: VMOVSS X15, K4, 7(AX)(CX*2)                        // 62717e0c11bc4807000000 or 62717e2c11bc4807000000 or 62717e4c11bc4807000000
-       //TODO: VMOVSS X7, X15, K1, X28                            // 6291060911fc or 6291062911fc or 6291064911fc
-       //TODO: VMOVUPD X8, K3, X13                                // 6251fd0b11c5
-       //TODO: VMOVUPD X8, K3, (SI)                               // 6271fd0b1106
-       //TODO: VMOVUPD X8, K3, 7(SI)(DI*2)                        // 6271fd0b11847e07000000
-       //TODO: VMOVUPD X7, K4, X24                                // 6291fd0c11f8
-       //TODO: VMOVUPD 17(SP)(BP*8), K4, X24                      // 6261fd0c1084ec11000000
-       //TODO: VMOVUPD 17(SP)(BP*4), K4, X24                      // 6261fd0c1084ac11000000
-       //TODO: VMOVUPD Y24, K5, Y3                                // 6261fd2d11c3
-       //TODO: VMOVUPD Y24, K5, 17(SP)(BP*1)                      // 6261fd2d11842c11000000
-       //TODO: VMOVUPD Y24, K5, -7(CX)(DX*8)                      // 6261fd2d1184d1f9ffffff
-       //TODO: VMOVUPD Y7, K7, Y2                                 // 62f1fd2f11fa
-       //TODO: VMOVUPD -17(BP)(SI*2), K7, Y2                      // 62f1fd2f109475efffffff
-       //TODO: VMOVUPD 7(AX)(CX*2), K7, Y2                        // 62f1fd2f10944807000000
-       //TODO: VMOVUPD Z2, K7, Z22                                // 62b1fd4f11d6
-       //TODO: VMOVUPD Z31, K7, Z22                               // 6221fd4f11fe
-       //TODO: VMOVUPD Z2, K7, Z7                                 // 62f1fd4f11d7
-       //TODO: VMOVUPD Z31, K7, Z7                                // 6261fd4f11ff
-       //TODO: VMOVUPD Z2, K7, 7(AX)                              // 62f1fd4f119007000000
-       //TODO: VMOVUPD Z31, K7, 7(AX)                             // 6261fd4f11b807000000
-       //TODO: VMOVUPD Z2, K7, (DI)                               // 62f1fd4f1117
-       //TODO: VMOVUPD Z31, K7, (DI)                              // 6261fd4f113f
-       //TODO: VMOVUPD Z1, K6, Z20                                // 62b1fd4e11cc
-       //TODO: VMOVUPD Z3, K6, Z20                                // 62b1fd4e11dc
-       //TODO: VMOVUPD 99(R15)(R15*1), K6, Z20                    // 6281fd4e10a43f63000000
-       //TODO: VMOVUPD (DX), K6, Z20                              // 62e1fd4e1022
-       //TODO: VMOVUPD Z1, K6, Z9                                 // 62d1fd4e11c9
-       //TODO: VMOVUPD Z3, K6, Z9                                 // 62d1fd4e11d9
-       //TODO: VMOVUPD 99(R15)(R15*1), K6, Z9                     // 6211fd4e108c3f63000000
-       //TODO: VMOVUPD (DX), K6, Z9                               // 6271fd4e100a
-       //TODO: VMOVUPS X22, K3, X0                                // 62e17c0b11f0
-       //TODO: VMOVUPS X22, K3, 7(SI)(DI*4)                       // 62e17c0b11b4be07000000
-       //TODO: VMOVUPS X22, K3, -7(DI)(R8*2)                      // 62a17c0b11b447f9ffffff
-       //TODO: VMOVUPS X11, K7, X1                                // 62717c0f11d9
-       //TODO: VMOVUPS 17(SP), K7, X1                             // 62f17c0f108c2411000000
-       //TODO: VMOVUPS -17(BP)(SI*4), K7, X1                      // 62f17c0f108cb5efffffff
-       //TODO: VMOVUPS Y14, K4, Y21                               // 62317c2c11f5
-       //TODO: VMOVUPS Y14, K4, 15(R8)(R14*1)                     // 62117c2c11b4300f000000
-       //TODO: VMOVUPS Y14, K4, 15(R8)(R14*2)                     // 62117c2c11b4700f000000
-       //TODO: VMOVUPS Y20, K4, Y8                                // 62c17c2c11e0
-       //TODO: VMOVUPS (R14), K4, Y8                              // 62517c2c1006
-       //TODO: VMOVUPS -7(DI)(R8*8), K4, Y8                       // 62317c2c1084c7f9ffffff
-       //TODO: VMOVUPS Z28, K7, Z12                               // 62417c4f11e4
-       //TODO: VMOVUPS Z13, K7, Z12                               // 62517c4f11ec
-       //TODO: VMOVUPS Z28, K7, Z16                               // 62217c4f11e0
-       //TODO: VMOVUPS Z13, K7, Z16                               // 62317c4f11e8
-       //TODO: VMOVUPS Z28, K7, -17(BP)(SI*8)                     // 62617c4f11a4f5efffffff
-       //TODO: VMOVUPS Z13, K7, -17(BP)(SI*8)                     // 62717c4f11acf5efffffff
-       //TODO: VMOVUPS Z28, K7, (R15)                             // 62417c4f1127
-       //TODO: VMOVUPS Z13, K7, (R15)                             // 62517c4f112f
-       //TODO: VMOVUPS Z3, K2, Z14                                // 62d17c4a11de
-       //TODO: VMOVUPS Z12, K2, Z14                               // 62517c4a11e6
-       //TODO: VMOVUPS 7(SI)(DI*8), K2, Z14                       // 62717c4a10b4fe07000000
-       //TODO: VMOVUPS -15(R14), K2, Z14                          // 62517c4a10b6f1ffffff
-       //TODO: VMOVUPS Z3, K2, Z28                                // 62917c4a11dc
-       //TODO: VMOVUPS Z12, K2, Z28                               // 62117c4a11e4
-       //TODO: VMOVUPS 7(SI)(DI*8), K2, Z28                       // 62617c4a10a4fe07000000
-       //TODO: VMOVUPS -15(R14), K2, Z28                          // 62417c4a10a6f1ffffff
-       //TODO: VMULPD X8, X7, K5, X6                              // 62d1c50d59f0
-       //TODO: VMULPD 7(AX), X7, K5, X6                           // 62f1c50d59b007000000
-       //TODO: VMULPD (DI), X7, K5, X6                            // 62f1c50d5937
-       //TODO: VMULPD Y1, Y24, K3, Y11                            // 6271bd2359d9
-       //TODO: VMULPD 99(R15)(R15*4), Y24, K3, Y11                // 6211bd23599cbf63000000
-       //TODO: VMULPD 15(DX), Y24, K3, Y11                        // 6271bd23599a0f000000
-       //TODO: VMULPD Z5, Z19, K4, Z15                            // 6271e54459fd
-       //TODO: VMULPD Z1, Z19, K4, Z15                            // 6271e54459f9
-       //TODO: VMULPD Z5, Z15, K4, Z15                            // 6271854c59fd
-       //TODO: VMULPD Z1, Z15, K4, Z15                            // 6271854c59f9
-       //TODO: VMULPD Z5, Z19, K4, Z30                            // 6261e54459f5
-       //TODO: VMULPD Z1, Z19, K4, Z30                            // 6261e54459f1
-       //TODO: VMULPD Z5, Z15, K4, Z30                            // 6261854c59f5
-       //TODO: VMULPD Z1, Z15, K4, Z30                            // 6261854c59f1
-       //TODO: VMULPD Z21, Z14, K2, Z3                            // 62b18d4a59dd
-       //TODO: VMULPD Z8, Z14, K2, Z3                             // 62d18d4a59d8
-       //TODO: VMULPD 7(SI)(DI*1), Z14, K2, Z3                    // 62f18d4a599c3e07000000
-       //TODO: VMULPD 15(DX)(BX*8), Z14, K2, Z3                   // 62f18d4a599cda0f000000
-       //TODO: VMULPD Z21, Z15, K2, Z3                            // 62b1854a59dd
-       //TODO: VMULPD Z8, Z15, K2, Z3                             // 62d1854a59d8
-       //TODO: VMULPD 7(SI)(DI*1), Z15, K2, Z3                    // 62f1854a599c3e07000000
-       //TODO: VMULPD 15(DX)(BX*8), Z15, K2, Z3                   // 62f1854a599cda0f000000
-       //TODO: VMULPD Z21, Z14, K2, Z5                            // 62b18d4a59ed
-       //TODO: VMULPD Z8, Z14, K2, Z5                             // 62d18d4a59e8
-       //TODO: VMULPD 7(SI)(DI*1), Z14, K2, Z5                    // 62f18d4a59ac3e07000000
-       //TODO: VMULPD 15(DX)(BX*8), Z14, K2, Z5                   // 62f18d4a59acda0f000000
-       //TODO: VMULPD Z21, Z15, K2, Z5                            // 62b1854a59ed
-       //TODO: VMULPD Z8, Z15, K2, Z5                             // 62d1854a59e8
-       //TODO: VMULPD 7(SI)(DI*1), Z15, K2, Z5                    // 62f1854a59ac3e07000000
-       //TODO: VMULPD 15(DX)(BX*8), Z15, K2, Z5                   // 62f1854a59acda0f000000
-       //TODO: VMULPS X28, X3, K2, X31                            // 6201640a59fc
-       //TODO: VMULPS 99(R15)(R15*1), X3, K2, X31                 // 6201640a59bc3f63000000
-       //TODO: VMULPS (DX), X3, K2, X31                           // 6261640a593a
-       //TODO: VMULPS Y20, Y18, K3, Y5                            // 62b16c2359ec
-       //TODO: VMULPS (CX), Y18, K3, Y5                           // 62f16c235929
-       //TODO: VMULPS 99(R15), Y18, K3, Y5                        // 62d16c2359af63000000
-       //TODO: VMULPS Z23, Z20, K3, Z16                           // 62a15c4359c7
-       //TODO: VMULPS Z19, Z20, K3, Z16                           // 62a15c4359c3
-       //TODO: VMULPS Z23, Z0, K3, Z16                            // 62a17c4b59c7
-       //TODO: VMULPS Z19, Z0, K3, Z16                            // 62a17c4b59c3
-       //TODO: VMULPS Z23, Z20, K3, Z9                            // 62315c4359cf
-       //TODO: VMULPS Z19, Z20, K3, Z9                            // 62315c4359cb
-       //TODO: VMULPS Z23, Z0, K3, Z9                             // 62317c4b59cf
-       //TODO: VMULPS Z19, Z0, K3, Z9                             // 62317c4b59cb
-       //TODO: VMULPS Z24, Z0, K3, Z0                             // 62917c4b59c0
-       //TODO: VMULPS Z12, Z0, K3, Z0                             // 62d17c4b59c4
-       //TODO: VMULPS -7(DI)(R8*1), Z0, K3, Z0                    // 62b17c4b598407f9ffffff
-       //TODO: VMULPS (SP), Z0, K3, Z0                            // 62f17c4b590424
-       //TODO: VMULPS Z24, Z25, K3, Z0                            // 6291344359c0
-       //TODO: VMULPS Z12, Z25, K3, Z0                            // 62d1344359c4
-       //TODO: VMULPS -7(DI)(R8*1), Z25, K3, Z0                   // 62b13443598407f9ffffff
-       //TODO: VMULPS (SP), Z25, K3, Z0                           // 62f13443590424
-       //TODO: VMULPS Z24, Z0, K3, Z11                            // 62117c4b59d8
-       //TODO: VMULPS Z12, Z0, K3, Z11                            // 62517c4b59dc
-       //TODO: VMULPS -7(DI)(R8*1), Z0, K3, Z11                   // 62317c4b599c07f9ffffff
-       //TODO: VMULPS (SP), Z0, K3, Z11                           // 62717c4b591c24
-       //TODO: VMULPS Z24, Z25, K3, Z11                           // 6211344359d8
-       //TODO: VMULPS Z12, Z25, K3, Z11                           // 6251344359dc
-       //TODO: VMULPS -7(DI)(R8*1), Z25, K3, Z11                  // 62313443599c07f9ffffff
-       //TODO: VMULPS (SP), Z25, K3, Z11                          // 62713443591c24
-       //TODO: VMULSD X7, X24, K2, X20                            // 62e1bf0259e7
-       //TODO: VMULSD X12, X16, K1, X20                           // 62c1ff0159e4 or 62c1ff2159e4 or 62c1ff4159e4
-       //TODO: VMULSD -17(BP), X16, K1, X20                       // 62e1ff0159a5efffffff or 62e1ff2159a5efffffff or 62e1ff4159a5efffffff
-       //TODO: VMULSD -15(R14)(R15*8), X16, K1, X20               // 6281ff0159a4fef1ffffff or 6281ff2159a4fef1ffffff or 6281ff4159a4fef1ffffff
-       //TODO: VMULSS X28, X17, K2, X6                            // 6291760259f4
-       //TODO: VMULSS X8, X1, K1, X6                              // 62d1760959f0 or 62d1762959f0 or 62d1764959f0
-       //TODO: VMULSS 15(R8)(R14*1), X1, K1, X6                   // 6291760959b4300f000000 or 6291762959b4300f000000 or 6291764959b4300f000000
-       //TODO: VMULSS 15(R8)(R14*2), X1, K1, X6                   // 6291760959b4700f000000 or 6291762959b4700f000000 or 6291764959b4700f000000
-       //TODO: VPABSD X16, K7, X12                                // 62327d0f1ee0
-       //TODO: VPABSD 99(R15)(R15*8), K7, X12                     // 62127d0f1ea4ff63000000
-       //TODO: VPABSD 7(AX)(CX*8), K7, X12                        // 62727d0f1ea4c807000000
-       //TODO: VPABSD Y16, K7, Y17                                // 62a27d2f1ec8
-       //TODO: VPABSD -17(BP), K7, Y17                            // 62e27d2f1e8defffffff
-       //TODO: VPABSD -15(R14)(R15*8), K7, Y17                    // 62827d2f1e8cfef1ffffff
-       //TODO: VPABSD Z20, K6, Z1                                 // 62b27d4e1ecc
-       //TODO: VPABSD Z9, K6, Z1                                  // 62d27d4e1ec9
-       //TODO: VPABSD (BX), K6, Z1                                // 62f27d4e1e0b
-       //TODO: VPABSD -17(BP)(SI*1), K6, Z1                       // 62f27d4e1e8c35efffffff
-       //TODO: VPABSD Z20, K6, Z9                                 // 62327d4e1ecc
-       //TODO: VPABSD Z9, K6, Z9                                  // 62527d4e1ec9
-       //TODO: VPABSD (BX), K6, Z9                                // 62727d4e1e0b
-       //TODO: VPABSD -17(BP)(SI*1), K6, Z9                       // 62727d4e1e8c35efffffff
-       //TODO: VPABSQ X8, K3, X28                                 // 6242fd0b1fe0
-       //TODO: VPABSQ (AX), K3, X28                               // 6262fd0b1f20
-       //TODO: VPABSQ 7(SI), K3, X28                              // 6262fd0b1fa607000000
-       //TODO: VPABSQ Y6, K7, Y12                                 // 6272fd2f1fe6
-       //TODO: VPABSQ 17(SP)(BP*2), K7, Y12                       // 6272fd2f1fa46c11000000
-       //TODO: VPABSQ -7(DI)(R8*4), K7, Y12                       // 6232fd2f1fa487f9ffffff
-       //TODO: VPABSQ Z26, K4, Z30                                // 6202fd4c1ff2
-       //TODO: VPABSQ Z22, K4, Z30                                // 6222fd4c1ff6
-       //TODO: VPABSQ 15(R8)(R14*4), K4, Z30                      // 6202fd4c1fb4b00f000000
-       //TODO: VPABSQ -7(CX)(DX*4), K4, Z30                       // 6262fd4c1fb491f9ffffff
-       //TODO: VPABSQ Z26, K4, Z5                                 // 6292fd4c1fea
-       //TODO: VPABSQ Z22, K4, Z5                                 // 62b2fd4c1fee
-       //TODO: VPABSQ 15(R8)(R14*4), K4, Z5                       // 6292fd4c1facb00f000000
-       //TODO: VPABSQ -7(CX)(DX*4), K4, Z5                        // 62f2fd4c1fac91f9ffffff
-       //TODO: VPADDD X27, X2, K1, X2                             // 62916d09fed3
-       //TODO: VPADDD (R14), X2, K1, X2                           // 62d16d09fe16
-       //TODO: VPADDD -7(DI)(R8*8), X2, K1, X2                    // 62b16d09fe94c7f9ffffff
-       //TODO: VPADDD Y1, Y6, K7, Y1                              // 62f14d2ffec9
-       //TODO: VPADDD 7(SI)(DI*4), Y6, K7, Y1                     // 62f14d2ffe8cbe07000000
-       //TODO: VPADDD -7(DI)(R8*2), Y6, K7, Y1                    // 62b14d2ffe8c47f9ffffff
-       //TODO: VPADDD Z13, Z11, K2, Z14                           // 6251254afef5
-       //TODO: VPADDD Z14, Z11, K2, Z14                           // 6251254afef6
-       //TODO: VPADDD (CX), Z11, K2, Z14                          // 6271254afe31
-       //TODO: VPADDD 99(R15), Z11, K2, Z14                       // 6251254afeb763000000
-       //TODO: VPADDD Z13, Z5, K2, Z14                            // 6251554afef5
-       //TODO: VPADDD Z14, Z5, K2, Z14                            // 6251554afef6
-       //TODO: VPADDD (CX), Z5, K2, Z14                           // 6271554afe31
-       //TODO: VPADDD 99(R15), Z5, K2, Z14                        // 6251554afeb763000000
-       //TODO: VPADDD Z13, Z11, K2, Z27                           // 6241254afedd
-       //TODO: VPADDD Z14, Z11, K2, Z27                           // 6241254afede
-       //TODO: VPADDD (CX), Z11, K2, Z27                          // 6261254afe19
-       //TODO: VPADDD 99(R15), Z11, K2, Z27                       // 6241254afe9f63000000
-       //TODO: VPADDD Z13, Z5, K2, Z27                            // 6241554afedd
-       //TODO: VPADDD Z14, Z5, K2, Z27                            // 6241554afede
-       //TODO: VPADDD (CX), Z5, K2, Z27                           // 6261554afe19
-       //TODO: VPADDD 99(R15), Z5, K2, Z27                        // 6241554afe9f63000000
-       //TODO: VPADDQ X30, X22, K4, X26                           // 6201cd04d4d6
-       //TODO: VPADDQ 99(R15)(R15*4), X22, K4, X26                // 6201cd04d494bf63000000
-       //TODO: VPADDQ 15(DX), X22, K4, X26                        // 6261cd04d4920f000000
-       //TODO: VPADDQ Y19, Y0, K1, Y9                             // 6231fd29d4cb
-       //TODO: VPADDQ 17(SP), Y0, K1, Y9                          // 6271fd29d48c2411000000
-       //TODO: VPADDQ -17(BP)(SI*4), Y0, K1, Y9                   // 6271fd29d48cb5efffffff
-       //TODO: VPADDQ Z6, Z2, K3, Z5                              // 62f1ed4bd4ee
-       //TODO: VPADDQ Z14, Z2, K3, Z5                             // 62d1ed4bd4ee
-       //TODO: VPADDQ 99(R15)(R15*2), Z2, K3, Z5                  // 6291ed4bd4ac7f63000000
-       //TODO: VPADDQ -7(DI), Z2, K3, Z5                          // 62f1ed4bd4aff9ffffff
-       //TODO: VPADDQ Z6, Z2, K3, Z23                             // 62e1ed4bd4fe
-       //TODO: VPADDQ Z14, Z2, K3, Z23                            // 62c1ed4bd4fe
-       //TODO: VPADDQ 99(R15)(R15*2), Z2, K3, Z23                 // 6281ed4bd4bc7f63000000
-       //TODO: VPADDQ -7(DI), Z2, K3, Z23                         // 62e1ed4bd4bff9ffffff
-       //TODO: VPANDD X1, X8, K3, X7                              // 62f13d0bdbf9
-       //TODO: VPANDD 15(R8), X8, K3, X7                          // 62d13d0bdbb80f000000
-       //TODO: VPANDD (BP), X8, K3, X7                            // 62f13d0bdb7d00
-       //TODO: VPANDD Y13, Y2, K2, Y14                            // 62516d2adbf5
-       //TODO: VPANDD -7(CX), Y2, K2, Y14                         // 62716d2adbb1f9ffffff
-       //TODO: VPANDD 15(DX)(BX*4), Y2, K2, Y14                   // 62716d2adbb49a0f000000
-       //TODO: VPANDD Z6, Z9, K1, Z12                             // 62713549dbe6
-       //TODO: VPANDD Z25, Z9, K1, Z12                            // 62113549dbe1
-       //TODO: VPANDD -15(R14)(R15*1), Z9, K1, Z12                // 62113549dba43ef1ffffff
-       //TODO: VPANDD -15(BX), Z9, K1, Z12                        // 62713549dba3f1ffffff
-       //TODO: VPANDD Z6, Z12, K1, Z12                            // 62711d49dbe6
-       //TODO: VPANDD Z25, Z12, K1, Z12                           // 62111d49dbe1
-       //TODO: VPANDD -15(R14)(R15*1), Z12, K1, Z12               // 62111d49dba43ef1ffffff
-       //TODO: VPANDD -15(BX), Z12, K1, Z12                       // 62711d49dba3f1ffffff
-       //TODO: VPANDD Z6, Z9, K1, Z17                             // 62e13549dbce
-       //TODO: VPANDD Z25, Z9, K1, Z17                            // 62813549dbc9
-       //TODO: VPANDD -15(R14)(R15*1), Z9, K1, Z17                // 62813549db8c3ef1ffffff
-       //TODO: VPANDD -15(BX), Z9, K1, Z17                        // 62e13549db8bf1ffffff
-       //TODO: VPANDD Z6, Z12, K1, Z17                            // 62e11d49dbce
-       //TODO: VPANDD Z25, Z12, K1, Z17                           // 62811d49dbc9
-       //TODO: VPANDD -15(R14)(R15*1), Z12, K1, Z17               // 62811d49db8c3ef1ffffff
-       //TODO: VPANDD -15(BX), Z12, K1, Z17                       // 62e11d49db8bf1ffffff
-       //TODO: VPANDND X0, X15, K2, X0                            // 62f1050adfc0
-       //TODO: VPANDND 15(R8)(R14*8), X15, K2, X0                 // 6291050adf84f00f000000
-       //TODO: VPANDND -15(R14)(R15*2), X15, K2, X0               // 6291050adf847ef1ffffff
-       //TODO: VPANDND Y22, Y15, K1, Y27                          // 62210529dfde
-       //TODO: VPANDND 99(R15)(R15*8), Y15, K1, Y27               // 62010529df9cff63000000
-       //TODO: VPANDND 7(AX)(CX*8), Y15, K1, Y27                  // 62610529df9cc807000000
-       //TODO: VPANDND Z3, Z8, K7, Z3                             // 62f13d4fdfdb
-       //TODO: VPANDND Z27, Z8, K7, Z3                            // 62913d4fdfdb
-       //TODO: VPANDND 7(AX)(CX*4), Z8, K7, Z3                    // 62f13d4fdf9c8807000000
-       //TODO: VPANDND 7(AX)(CX*1), Z8, K7, Z3                    // 62f13d4fdf9c0807000000
-       //TODO: VPANDND Z3, Z2, K7, Z3                             // 62f16d4fdfdb
-       //TODO: VPANDND Z27, Z2, K7, Z3                            // 62916d4fdfdb
-       //TODO: VPANDND 7(AX)(CX*4), Z2, K7, Z3                    // 62f16d4fdf9c8807000000
-       //TODO: VPANDND 7(AX)(CX*1), Z2, K7, Z3                    // 62f16d4fdf9c0807000000
-       //TODO: VPANDND Z3, Z8, K7, Z21                            // 62e13d4fdfeb
-       //TODO: VPANDND Z27, Z8, K7, Z21                           // 62813d4fdfeb
-       //TODO: VPANDND 7(AX)(CX*4), Z8, K7, Z21                   // 62e13d4fdfac8807000000
-       //TODO: VPANDND 7(AX)(CX*1), Z8, K7, Z21                   // 62e13d4fdfac0807000000
-       //TODO: VPANDND Z3, Z2, K7, Z21                            // 62e16d4fdfeb
-       //TODO: VPANDND Z27, Z2, K7, Z21                           // 62816d4fdfeb
-       //TODO: VPANDND 7(AX)(CX*4), Z2, K7, Z21                   // 62e16d4fdfac8807000000
-       //TODO: VPANDND 7(AX)(CX*1), Z2, K7, Z21                   // 62e16d4fdfac0807000000
-       //TODO: VPANDNQ X0, X21, K1, X16                           // 62e1d501dfc0
-       //TODO: VPANDNQ -15(R14)(R15*1), X21, K1, X16              // 6281d501df843ef1ffffff
-       //TODO: VPANDNQ -15(BX), X21, K1, X16                      // 62e1d501df83f1ffffff
-       //TODO: VPANDNQ Y24, Y18, K1, Y20                          // 6281ed21dfe0
-       //TODO: VPANDNQ (AX), Y18, K1, Y20                         // 62e1ed21df20
-       //TODO: VPANDNQ 7(SI), Y18, K1, Y20                        // 62e1ed21dfa607000000
-       //TODO: VPANDNQ Z20, Z0, K1, Z7                            // 62b1fd49dffc
-       //TODO: VPANDNQ Z28, Z0, K1, Z7                            // 6291fd49dffc
-       //TODO: VPANDNQ (SI), Z0, K1, Z7                           // 62f1fd49df3e
-       //TODO: VPANDNQ 7(SI)(DI*2), Z0, K1, Z7                    // 62f1fd49dfbc7e07000000
-       //TODO: VPANDNQ Z20, Z6, K1, Z7                            // 62b1cd49dffc
-       //TODO: VPANDNQ Z28, Z6, K1, Z7                            // 6291cd49dffc
-       //TODO: VPANDNQ (SI), Z6, K1, Z7                           // 62f1cd49df3e
-       //TODO: VPANDNQ 7(SI)(DI*2), Z6, K1, Z7                    // 62f1cd49dfbc7e07000000
-       //TODO: VPANDNQ Z20, Z0, K1, Z9                            // 6231fd49dfcc
-       //TODO: VPANDNQ Z28, Z0, K1, Z9                            // 6211fd49dfcc
-       //TODO: VPANDNQ (SI), Z0, K1, Z9                           // 6271fd49df0e
-       //TODO: VPANDNQ 7(SI)(DI*2), Z0, K1, Z9                    // 6271fd49df8c7e07000000
-       //TODO: VPANDNQ Z20, Z6, K1, Z9                            // 6231cd49dfcc
-       //TODO: VPANDNQ Z28, Z6, K1, Z9                            // 6211cd49dfcc
-       //TODO: VPANDNQ (SI), Z6, K1, Z9                           // 6271cd49df0e
-       //TODO: VPANDNQ 7(SI)(DI*2), Z6, K1, Z9                    // 6271cd49df8c7e07000000
-       //TODO: VPANDQ X7, X22, K7, X28                            // 6261cd07dbe7
-       //TODO: VPANDQ 7(AX)(CX*4), X22, K7, X28                   // 6261cd07dba48807000000
-       //TODO: VPANDQ 7(AX)(CX*1), X22, K7, X28                   // 6261cd07dba40807000000
-       //TODO: VPANDQ Y19, Y3, K2, Y9                             // 6231e52adbcb
-       //TODO: VPANDQ (BX), Y3, K2, Y9                            // 6271e52adb0b
-       //TODO: VPANDQ -17(BP)(SI*1), Y3, K2, Y9                   // 6271e52adb8c35efffffff
-       //TODO: VPANDQ Z12, Z9, K4, Z3                             // 62d1b54cdbdc
-       //TODO: VPANDQ Z22, Z9, K4, Z3                             // 62b1b54cdbde
-       //TODO: VPANDQ 17(SP)(BP*8), Z9, K4, Z3                    // 62f1b54cdb9cec11000000
-       //TODO: VPANDQ 17(SP)(BP*4), Z9, K4, Z3                    // 62f1b54cdb9cac11000000
-       //TODO: VPANDQ Z12, Z19, K4, Z3                            // 62d1e544dbdc
-       //TODO: VPANDQ Z22, Z19, K4, Z3                            // 62b1e544dbde
-       //TODO: VPANDQ 17(SP)(BP*8), Z19, K4, Z3                   // 62f1e544db9cec11000000
-       //TODO: VPANDQ 17(SP)(BP*4), Z19, K4, Z3                   // 62f1e544db9cac11000000
-       //TODO: VPANDQ Z12, Z9, K4, Z30                            // 6241b54cdbf4
-       //TODO: VPANDQ Z22, Z9, K4, Z30                            // 6221b54cdbf6
-       //TODO: VPANDQ 17(SP)(BP*8), Z9, K4, Z30                   // 6261b54cdbb4ec11000000
-       //TODO: VPANDQ 17(SP)(BP*4), Z9, K4, Z30                   // 6261b54cdbb4ac11000000
-       //TODO: VPANDQ Z12, Z19, K4, Z30                           // 6241e544dbf4
-       //TODO: VPANDQ Z22, Z19, K4, Z30                           // 6221e544dbf6
-       //TODO: VPANDQ 17(SP)(BP*8), Z19, K4, Z30                  // 6261e544dbb4ec11000000
-       //TODO: VPANDQ 17(SP)(BP*4), Z19, K4, Z30                  // 6261e544dbb4ac11000000
-       //TODO: VPBLENDMD X14, X12, K4, X0                         // 62d21d0c64c6
-       //TODO: VPBLENDMD 17(SP), X12, K4, X0                      // 62f21d0c64842411000000
-       //TODO: VPBLENDMD -17(BP)(SI*4), X12, K4, X0               // 62f21d0c6484b5efffffff
-       //TODO: VPBLENDMD Y6, Y31, K4, Y6                          // 62f2052464f6
-       //TODO: VPBLENDMD -17(BP)(SI*2), Y31, K4, Y6               // 62f2052464b475efffffff
-       //TODO: VPBLENDMD 7(AX)(CX*2), Y31, K4, Y6                 // 62f2052464b44807000000
-       //TODO: VPBLENDMD Z20, Z2, K7, Z22                         // 62a26d4f64f4
-       //TODO: VPBLENDMD Z9, Z2, K7, Z22                          // 62c26d4f64f1
-       //TODO: VPBLENDMD 99(R15)(R15*1), Z2, K7, Z22              // 62826d4f64b43f63000000
-       //TODO: VPBLENDMD (DX), Z2, K7, Z22                        // 62e26d4f6432
-       //TODO: VPBLENDMD Z20, Z31, K7, Z22                        // 62a2054764f4
-       //TODO: VPBLENDMD Z9, Z31, K7, Z22                         // 62c2054764f1
-       //TODO: VPBLENDMD 99(R15)(R15*1), Z31, K7, Z22             // 6282054764b43f63000000
-       //TODO: VPBLENDMD (DX), Z31, K7, Z22                       // 62e205476432
-       //TODO: VPBLENDMD Z20, Z2, K7, Z7                          // 62b26d4f64fc
-       //TODO: VPBLENDMD Z9, Z2, K7, Z7                           // 62d26d4f64f9
-       //TODO: VPBLENDMD 99(R15)(R15*1), Z2, K7, Z7               // 62926d4f64bc3f63000000
-       //TODO: VPBLENDMD (DX), Z2, K7, Z7                         // 62f26d4f643a
-       //TODO: VPBLENDMD Z20, Z31, K7, Z7                         // 62b2054764fc
-       //TODO: VPBLENDMD Z9, Z31, K7, Z7                          // 62d2054764f9
-       //TODO: VPBLENDMD 99(R15)(R15*1), Z31, K7, Z7              // 6292054764bc3f63000000
-       //TODO: VPBLENDMD (DX), Z31, K7, Z7                        // 62f20547643a
-       //TODO: VPBLENDMQ X15, X17, K2, X5                         // 62d2f50264ef
-       //TODO: VPBLENDMQ 7(AX), X17, K2, X5                       // 62f2f50264a807000000
-       //TODO: VPBLENDMQ (DI), X17, K2, X5                        // 62f2f502642f
-       //TODO: VPBLENDMQ Y7, Y19, K5, Y11                         // 6272e52564df
-       //TODO: VPBLENDMQ 15(R8)(R14*1), Y19, K5, Y11              // 6212e525649c300f000000
-       //TODO: VPBLENDMQ 15(R8)(R14*2), Y19, K5, Y11              // 6212e525649c700f000000
-       //TODO: VPBLENDMQ Z28, Z12, K3, Z1                         // 62929d4b64cc
-       //TODO: VPBLENDMQ Z13, Z12, K3, Z1                         // 62d29d4b64cd
-       //TODO: VPBLENDMQ -17(BP)(SI*8), Z12, K3, Z1               // 62f29d4b648cf5efffffff
-       //TODO: VPBLENDMQ (R15), Z12, K3, Z1                       // 62d29d4b640f
-       //TODO: VPBLENDMQ Z28, Z16, K3, Z1                         // 6292fd4364cc
-       //TODO: VPBLENDMQ Z13, Z16, K3, Z1                         // 62d2fd4364cd
-       //TODO: VPBLENDMQ -17(BP)(SI*8), Z16, K3, Z1               // 62f2fd43648cf5efffffff
-       //TODO: VPBLENDMQ (R15), Z16, K3, Z1                       // 62d2fd43640f
-       //TODO: VPBLENDMQ Z28, Z12, K3, Z3                         // 62929d4b64dc
-       //TODO: VPBLENDMQ Z13, Z12, K3, Z3                         // 62d29d4b64dd
-       //TODO: VPBLENDMQ -17(BP)(SI*8), Z12, K3, Z3               // 62f29d4b649cf5efffffff
-       //TODO: VPBLENDMQ (R15), Z12, K3, Z3                       // 62d29d4b641f
-       //TODO: VPBLENDMQ Z28, Z16, K3, Z3                         // 6292fd4364dc
-       //TODO: VPBLENDMQ Z13, Z16, K3, Z3                         // 62d2fd4364dd
-       //TODO: VPBLENDMQ -17(BP)(SI*8), Z16, K3, Z3               // 62f2fd43649cf5efffffff
-       //TODO: VPBLENDMQ (R15), Z16, K3, Z3                       // 62d2fd43641f
-       //TODO: VPBROADCASTD SP, K1, X15                           // 62727d097cfc
-       //TODO: VPBROADCASTD R14, K1, X15                          // 62527d097cfe
-       //TODO: VPBROADCASTD AX, K7, Y12                           // 62727d2f7ce0
-       //TODO: VPBROADCASTD R9, K7, Y12                           // 62527d2f7ce1
-       //TODO: VPBROADCASTD CX, K1, Z3                            // 62f27d497cd9
-       //TODO: VPBROADCASTD SP, K1, Z3                            // 62f27d497cdc
-       //TODO: VPBROADCASTD CX, K1, Z5                            // 62f27d497ce9
-       //TODO: VPBROADCASTD SP, K1, Z5                            // 62f27d497cec
-       //TODO: VPBROADCASTD X18, K1, X26                          // 62227d0958d2
-       //TODO: VPBROADCASTD (R14), K1, X26                        // 62427d095816
-       //TODO: VPBROADCASTD -7(DI)(R8*8), K1, X26                 // 62227d095894c7f9ffffff
-       //TODO: VPBROADCASTD X21, K1, Y3                           // 62b27d2958dd
-       //TODO: VPBROADCASTD 99(R15)(R15*4), K1, Y3                // 62927d29589cbf63000000
-       //TODO: VPBROADCASTD 15(DX), K1, Y3                        // 62f27d29589a0f000000
-       //TODO: VPBROADCASTD X1, K7, Z14                           // 62727d4f58f1
-       //TODO: VPBROADCASTD (CX), K7, Z14                         // 62727d4f5831
-       //TODO: VPBROADCASTD 99(R15), K7, Z14                      // 62527d4f58b763000000
-       //TODO: VPBROADCASTD X1, K7, Z15                           // 62727d4f58f9
-       //TODO: VPBROADCASTD (CX), K7, Z15                         // 62727d4f5839
-       //TODO: VPBROADCASTD 99(R15), K7, Z15                      // 62527d4f58bf63000000
-       //TODO: VPBROADCASTQ R9, K2, X3                            // 62d2fd0a7cd9
-       //TODO: VPBROADCASTQ R13, K2, X3                           // 62d2fd0a7cdd
-       //TODO: VPBROADCASTQ DX, K4, Y7                            // 62f2fd2c7cfa
-       //TODO: VPBROADCASTQ BP, K4, Y7                            // 62f2fd2c7cfd
-       //TODO: VPBROADCASTQ R10, K1, Z20                          // 62c2fd497ce2
-       //TODO: VPBROADCASTQ CX, K1, Z20                           // 62e2fd497ce1
-       //TODO: VPBROADCASTQ R10, K1, Z0                           // 62d2fd497cc2
-       //TODO: VPBROADCASTQ CX, K1, Z0                            // 62f2fd497cc1
-       //TODO: VPBROADCASTQ X0, K3, X7                            // 62f2fd0b59f8
-       //TODO: VPBROADCASTQ 17(SP)(BP*2), K3, X7                  // 62f2fd0b59bc6c11000000
-       //TODO: VPBROADCASTQ -7(DI)(R8*4), K3, X7                  // 62b2fd0b59bc87f9ffffff
-       //TODO: VPBROADCASTQ X0, K4, Y0                            // 62f2fd2c59c0
-       //TODO: VPBROADCASTQ 15(R8), K4, Y0                        // 62d2fd2c59800f000000
-       //TODO: VPBROADCASTQ (BP), K4, Y0                          // 62f2fd2c594500
-       //TODO: VPBROADCASTQ X24, K5, Z23                          // 6282fd4d59f8
-       //TODO: VPBROADCASTQ 15(R8)(R14*8), K5, Z23                // 6282fd4d59bcf00f000000
-       //TODO: VPBROADCASTQ -15(R14)(R15*2), K5, Z23              // 6282fd4d59bc7ef1ffffff
-       //TODO: VPBROADCASTQ X24, K5, Z19                          // 6282fd4d59d8
-       //TODO: VPBROADCASTQ 15(R8)(R14*8), K5, Z19                // 6282fd4d599cf00f000000
-       //TODO: VPBROADCASTQ -15(R14)(R15*2), K5, Z19              // 6282fd4d599c7ef1ffffff
-       //TODO: VPCMPD $64, X13, X11, K5, K6                       // 62d3250d1ff540
-       //TODO: VPCMPD $64, 7(SI)(DI*1), X11, K5, K6               // 62f3250d1fb43e0700000040
-       //TODO: VPCMPD $64, 15(DX)(BX*8), X11, K5, K6              // 62f3250d1fb4da0f00000040
-       //TODO: VPCMPD $64, X13, X11, K5, K7                       // 62d3250d1ffd40
-       //TODO: VPCMPD $64, 7(SI)(DI*1), X11, K5, K7               // 62f3250d1fbc3e0700000040
-       //TODO: VPCMPD $64, 15(DX)(BX*8), X11, K5, K7              // 62f3250d1fbcda0f00000040
-       //TODO: VPCMPD $27, Y31, Y9, K3, K6                        // 6293352b1ff71b
-       //TODO: VPCMPD $27, 99(R15)(R15*2), Y9, K3, K6             // 6293352b1fb47f630000001b
-       //TODO: VPCMPD $27, -7(DI), Y9, K3, K6                     // 62f3352b1fb7f9ffffff1b
-       //TODO: VPCMPD $27, Y31, Y9, K3, K4                        // 6293352b1fe71b
-       //TODO: VPCMPD $27, 99(R15)(R15*2), Y9, K3, K4             // 6293352b1fa47f630000001b
-       //TODO: VPCMPD $27, -7(DI), Y9, K3, K4                     // 62f3352b1fa7f9ffffff1b
-       //TODO: VPCMPD $47, Z17, Z20, K4, K4                       // 62b35d441fe12f
-       //TODO: VPCMPD $47, Z0, Z20, K4, K4                        // 62f35d441fe02f
-       //TODO: VPCMPD $47, -7(CX), Z20, K4, K4                    // 62f35d441fa1f9ffffff2f
-       //TODO: VPCMPD $47, 15(DX)(BX*4), Z20, K4, K4              // 62f35d441fa49a0f0000002f
-       //TODO: VPCMPD $47, Z17, Z0, K4, K4                        // 62b37d4c1fe12f
-       //TODO: VPCMPD $47, Z0, Z0, K4, K4                         // 62f37d4c1fe02f
-       //TODO: VPCMPD $47, -7(CX), Z0, K4, K4                     // 62f37d4c1fa1f9ffffff2f
-       //TODO: VPCMPD $47, 15(DX)(BX*4), Z0, K4, K4               // 62f37d4c1fa49a0f0000002f
-       //TODO: VPCMPD $47, Z17, Z20, K4, K6                       // 62b35d441ff12f
-       //TODO: VPCMPD $47, Z0, Z20, K4, K6                        // 62f35d441ff02f
-       //TODO: VPCMPD $47, -7(CX), Z20, K4, K6                    // 62f35d441fb1f9ffffff2f
-       //TODO: VPCMPD $47, 15(DX)(BX*4), Z20, K4, K6              // 62f35d441fb49a0f0000002f
-       //TODO: VPCMPD $47, Z17, Z0, K4, K6                        // 62b37d4c1ff12f
-       //TODO: VPCMPD $47, Z0, Z0, K4, K6                         // 62f37d4c1ff02f
-       //TODO: VPCMPD $47, -7(CX), Z0, K4, K6                     // 62f37d4c1fb1f9ffffff2f
-       //TODO: VPCMPD $47, 15(DX)(BX*4), Z0, K4, K6               // 62f37d4c1fb49a0f0000002f
-       //TODO: VPCMPEQD X14, X16, K3, K6                          // 62d17d0376f6
-       //TODO: VPCMPEQD -7(CX), X16, K3, K6                       // 62f17d0376b1f9ffffff
-       //TODO: VPCMPEQD 15(DX)(BX*4), X16, K3, K6                 // 62f17d0376b49a0f000000
-       //TODO: VPCMPEQD X14, X16, K3, K5                          // 62d17d0376ee
-       //TODO: VPCMPEQD -7(CX), X16, K3, K5                       // 62f17d0376a9f9ffffff
-       //TODO: VPCMPEQD 15(DX)(BX*4), X16, K3, K5                 // 62f17d0376ac9a0f000000
-       //TODO: VPCMPEQD Y13, Y28, K3, K1                          // 62d11d2376cd
-       //TODO: VPCMPEQD 15(DX)(BX*1), Y28, K3, K1                 // 62f11d23768c1a0f000000
-       //TODO: VPCMPEQD -7(CX)(DX*2), Y28, K3, K1                 // 62f11d23768c51f9ffffff
-       //TODO: VPCMPEQD Y13, Y28, K3, K5                          // 62d11d2376ed
-       //TODO: VPCMPEQD 15(DX)(BX*1), Y28, K3, K5                 // 62f11d2376ac1a0f000000
-       //TODO: VPCMPEQD -7(CX)(DX*2), Y28, K3, K5                 // 62f11d2376ac51f9ffffff
-       //TODO: VPCMPEQD Z6, Z21, K2, K3                           // 62f1554276de
-       //TODO: VPCMPEQD Z9, Z21, K2, K3                           // 62d1554276d9
-       //TODO: VPCMPEQD (AX), Z21, K2, K3                         // 62f155427618
-       //TODO: VPCMPEQD 7(SI), Z21, K2, K3                        // 62f15542769e07000000
-       //TODO: VPCMPEQD Z6, Z9, K2, K3                            // 62f1354a76de
-       //TODO: VPCMPEQD Z9, Z9, K2, K3                            // 62d1354a76d9
-       //TODO: VPCMPEQD (AX), Z9, K2, K3                          // 62f1354a7618
-       //TODO: VPCMPEQD 7(SI), Z9, K2, K3                         // 62f1354a769e07000000
-       //TODO: VPCMPEQD Z6, Z21, K2, K1                           // 62f1554276ce
-       //TODO: VPCMPEQD Z9, Z21, K2, K1                           // 62d1554276c9
-       //TODO: VPCMPEQD (AX), Z21, K2, K1                         // 62f155427608
-       //TODO: VPCMPEQD 7(SI), Z21, K2, K1                        // 62f15542768e07000000
-       //TODO: VPCMPEQD Z6, Z9, K2, K1                            // 62f1354a76ce
-       //TODO: VPCMPEQD Z9, Z9, K2, K1                            // 62d1354a76c9
-       //TODO: VPCMPEQD (AX), Z9, K2, K1                          // 62f1354a7608
-       //TODO: VPCMPEQD 7(SI), Z9, K2, K1                         // 62f1354a768e07000000
-       //TODO: VPCMPEQQ X14, X11, K1, K5                          // 62d2a50929ee
-       //TODO: VPCMPEQQ 99(R15)(R15*8), X11, K1, K5               // 6292a50929acff63000000
-       //TODO: VPCMPEQQ 7(AX)(CX*8), X11, K1, K5                  // 62f2a50929acc807000000
-       //TODO: VPCMPEQQ X14, X11, K1, K4                          // 62d2a50929e6
-       //TODO: VPCMPEQQ 99(R15)(R15*8), X11, K1, K4               // 6292a50929a4ff63000000
-       //TODO: VPCMPEQQ 7(AX)(CX*8), X11, K1, K4                  // 62f2a50929a4c807000000
-       //TODO: VPCMPEQQ Y2, Y7, K2, K7                            // 62f2c52a29fa
-       //TODO: VPCMPEQQ -17(BP), Y7, K2, K7                       // 62f2c52a29bdefffffff
-       //TODO: VPCMPEQQ -15(R14)(R15*8), Y7, K2, K7               // 6292c52a29bcfef1ffffff
-       //TODO: VPCMPEQQ Y2, Y7, K2, K6                            // 62f2c52a29f2
-       //TODO: VPCMPEQQ -17(BP), Y7, K2, K6                       // 62f2c52a29b5efffffff
-       //TODO: VPCMPEQQ -15(R14)(R15*8), Y7, K2, K6               // 6292c52a29b4fef1ffffff
-       //TODO: VPCMPEQQ Z20, Z1, K1, K4                           // 62b2f54929e4
-       //TODO: VPCMPEQQ Z9, Z1, K1, K4                            // 62d2f54929e1
-       //TODO: VPCMPEQQ (BX), Z1, K1, K4                          // 62f2f5492923
-       //TODO: VPCMPEQQ -17(BP)(SI*1), Z1, K1, K4                 // 62f2f54929a435efffffff
-       //TODO: VPCMPEQQ Z20, Z9, K1, K4                           // 62b2b54929e4
-       //TODO: VPCMPEQQ Z9, Z9, K1, K4                            // 62d2b54929e1
-       //TODO: VPCMPEQQ (BX), Z9, K1, K4                          // 62f2b5492923
-       //TODO: VPCMPEQQ -17(BP)(SI*1), Z9, K1, K4                 // 62f2b54929a435efffffff
-       //TODO: VPCMPEQQ Z20, Z1, K1, K6                           // 62b2f54929f4
-       //TODO: VPCMPEQQ Z9, Z1, K1, K6                            // 62d2f54929f1
-       //TODO: VPCMPEQQ (BX), Z1, K1, K6                          // 62f2f5492933
-       //TODO: VPCMPEQQ -17(BP)(SI*1), Z1, K1, K6                 // 62f2f54929b435efffffff
-       //TODO: VPCMPEQQ Z20, Z9, K1, K6                           // 62b2b54929f4
-       //TODO: VPCMPEQQ Z9, Z9, K1, K6                            // 62d2b54929f1
-       //TODO: VPCMPEQQ (BX), Z9, K1, K6                          // 62f2b5492933
-       //TODO: VPCMPEQQ -17(BP)(SI*1), Z9, K1, K6                 // 62f2b54929b435efffffff
-       //TODO: VPCMPGTD X12, X23, K4, K4                          // 62d1450466e4
-       //TODO: VPCMPGTD 15(R8)(R14*4), X23, K4, K4                // 6291450466a4b00f000000
-       //TODO: VPCMPGTD -7(CX)(DX*4), X23, K4, K4                 // 62f1450466a491f9ffffff
-       //TODO: VPCMPGTD X12, X23, K4, K6                          // 62d1450466f4
-       //TODO: VPCMPGTD 15(R8)(R14*4), X23, K4, K6                // 6291450466b4b00f000000
-       //TODO: VPCMPGTD -7(CX)(DX*4), X23, K4, K6                 // 62f1450466b491f9ffffff
-       //TODO: VPCMPGTD Y3, Y9, K1, K4                            // 62f1352966e3
-       //TODO: VPCMPGTD 15(R8)(R14*8), Y9, K1, K4                 // 6291352966a4f00f000000
-       //TODO: VPCMPGTD -15(R14)(R15*2), Y9, K1, K4               // 6291352966a47ef1ffffff
-       //TODO: VPCMPGTD Y3, Y9, K1, K5                            // 62f1352966eb
-       //TODO: VPCMPGTD 15(R8)(R14*8), Y9, K1, K5                 // 6291352966acf00f000000
-       //TODO: VPCMPGTD -15(R14)(R15*2), Y9, K1, K5               // 6291352966ac7ef1ffffff
-       //TODO: VPCMPGTD Z12, Z14, K3, K2                          // 62d10d4b66d4
-       //TODO: VPCMPGTD Z13, Z14, K3, K2                          // 62d10d4b66d5
-       //TODO: VPCMPGTD 17(SP)(BP*1), Z14, K3, K2                 // 62f10d4b66942c11000000
-       //TODO: VPCMPGTD -7(CX)(DX*8), Z14, K3, K2                 // 62f10d4b6694d1f9ffffff
-       //TODO: VPCMPGTD Z12, Z13, K3, K2                          // 62d1154b66d4
-       //TODO: VPCMPGTD Z13, Z13, K3, K2                          // 62d1154b66d5
-       //TODO: VPCMPGTD 17(SP)(BP*1), Z13, K3, K2                 // 62f1154b66942c11000000
-       //TODO: VPCMPGTD -7(CX)(DX*8), Z13, K3, K2                 // 62f1154b6694d1f9ffffff
-       //TODO: VPCMPGTD Z12, Z14, K3, K7                          // 62d10d4b66fc
-       //TODO: VPCMPGTD Z13, Z14, K3, K7                          // 62d10d4b66fd
-       //TODO: VPCMPGTD 17(SP)(BP*1), Z14, K3, K7                 // 62f10d4b66bc2c11000000
-       //TODO: VPCMPGTD -7(CX)(DX*8), Z14, K3, K7                 // 62f10d4b66bcd1f9ffffff
-       //TODO: VPCMPGTD Z12, Z13, K3, K7                          // 62d1154b66fc
-       //TODO: VPCMPGTD Z13, Z13, K3, K7                          // 62d1154b66fd
-       //TODO: VPCMPGTD 17(SP)(BP*1), Z13, K3, K7                 // 62f1154b66bc2c11000000
-       //TODO: VPCMPGTD -7(CX)(DX*8), Z13, K3, K7                 // 62f1154b66bcd1f9ffffff
-       //TODO: VPCMPGTQ X23, X16, K4, K0                          // 62b2fd0437c7
-       //TODO: VPCMPGTQ (R8), X16, K4, K0                         // 62d2fd043700
-       //TODO: VPCMPGTQ 15(DX)(BX*2), X16, K4, K0                 // 62f2fd0437845a0f000000
-       //TODO: VPCMPGTQ X23, X16, K4, K5                          // 62b2fd0437ef
-       //TODO: VPCMPGTQ (R8), X16, K4, K5                         // 62d2fd043728
-       //TODO: VPCMPGTQ 15(DX)(BX*2), X16, K4, K5                 // 62f2fd0437ac5a0f000000
-       //TODO: VPCMPGTQ Y9, Y2, K5, K6                            // 62d2ed2d37f1
-       //TODO: VPCMPGTQ -15(R14)(R15*1), Y2, K5, K6               // 6292ed2d37b43ef1ffffff
-       //TODO: VPCMPGTQ -15(BX), Y2, K5, K6                       // 62f2ed2d37b3f1ffffff
-       //TODO: VPCMPGTQ Y9, Y2, K5, K5                            // 62d2ed2d37e9
-       //TODO: VPCMPGTQ -15(R14)(R15*1), Y2, K5, K5               // 6292ed2d37ac3ef1ffffff
-       //TODO: VPCMPGTQ -15(BX), Y2, K5, K5                       // 62f2ed2d37abf1ffffff
-       //TODO: VPCMPGTQ Z2, Z21, K7, K1                           // 62f2d54737ca
-       //TODO: VPCMPGTQ Z7, Z21, K7, K1                           // 62f2d54737cf
-       //TODO: VPCMPGTQ -17(BP)(SI*2), Z21, K7, K1                // 62f2d547378c75efffffff
-       //TODO: VPCMPGTQ 7(AX)(CX*2), Z21, K7, K1                  // 62f2d547378c4807000000
-       //TODO: VPCMPGTQ Z2, Z9, K7, K1                            // 62f2b54f37ca
-       //TODO: VPCMPGTQ Z7, Z9, K7, K1                            // 62f2b54f37cf
-       //TODO: VPCMPGTQ -17(BP)(SI*2), Z9, K7, K1                 // 62f2b54f378c75efffffff
-       //TODO: VPCMPGTQ 7(AX)(CX*2), Z9, K7, K1                   // 62f2b54f378c4807000000
-       //TODO: VPCMPGTQ Z2, Z21, K7, K5                           // 62f2d54737ea
-       //TODO: VPCMPGTQ Z7, Z21, K7, K5                           // 62f2d54737ef
-       //TODO: VPCMPGTQ -17(BP)(SI*2), Z21, K7, K5                // 62f2d54737ac75efffffff
-       //TODO: VPCMPGTQ 7(AX)(CX*2), Z21, K7, K5                  // 62f2d54737ac4807000000
-       //TODO: VPCMPGTQ Z2, Z9, K7, K5                            // 62f2b54f37ea
-       //TODO: VPCMPGTQ Z7, Z9, K7, K5                            // 62f2b54f37ef
-       //TODO: VPCMPGTQ -17(BP)(SI*2), Z9, K7, K5                 // 62f2b54f37ac75efffffff
-       //TODO: VPCMPGTQ 7(AX)(CX*2), Z9, K7, K5                   // 62f2b54f37ac4807000000
-       //TODO: VPCMPQ $82, X24, X31, K7, K4                       // 629385071fe052
-       //TODO: VPCMPQ $82, -17(BP)(SI*2), X31, K7, K4             // 62f385071fa475efffffff52
-       //TODO: VPCMPQ $82, 7(AX)(CX*2), X31, K7, K4               // 62f385071fa4480700000052
-       //TODO: VPCMPQ $82, X24, X31, K7, K6                       // 629385071ff052
-       //TODO: VPCMPQ $82, -17(BP)(SI*2), X31, K7, K6             // 62f385071fb475efffffff52
-       //TODO: VPCMPQ $82, 7(AX)(CX*2), X31, K7, K6               // 62f385071fb4480700000052
-       //TODO: VPCMPQ $126, Y30, Y14, K4, K0                      // 62938d2c1fc67e
-       //TODO: VPCMPQ $126, (SI), Y14, K4, K0                     // 62f38d2c1f067e
-       //TODO: VPCMPQ $126, 7(SI)(DI*2), Y14, K4, K0              // 62f38d2c1f847e070000007e
-       //TODO: VPCMPQ $126, Y30, Y14, K4, K7                      // 62938d2c1ffe7e
-       //TODO: VPCMPQ $126, (SI), Y14, K4, K7                     // 62f38d2c1f3e7e
-       //TODO: VPCMPQ $126, 7(SI)(DI*2), Y14, K4, K7              // 62f38d2c1fbc7e070000007e
-       //TODO: VPCMPQ $94, Z3, Z27, K4, K5                        // 62f3a5441feb5e
-       //TODO: VPCMPQ $94, Z0, Z27, K4, K5                        // 62f3a5441fe85e
-       //TODO: VPCMPQ $94, (R14), Z27, K4, K5                     // 62d3a5441f2e5e
-       //TODO: VPCMPQ $94, -7(DI)(R8*8), Z27, K4, K5              // 62b3a5441facc7f9ffffff5e
-       //TODO: VPCMPQ $94, Z3, Z14, K4, K5                        // 62f38d4c1feb5e
-       //TODO: VPCMPQ $94, Z0, Z14, K4, K5                        // 62f38d4c1fe85e
-       //TODO: VPCMPQ $94, (R14), Z14, K4, K5                     // 62d38d4c1f2e5e
-       //TODO: VPCMPQ $94, -7(DI)(R8*8), Z14, K4, K5              // 62b38d4c1facc7f9ffffff5e
-       //TODO: VPCMPQ $94, Z3, Z27, K4, K4                        // 62f3a5441fe35e
-       //TODO: VPCMPQ $94, Z0, Z27, K4, K4                        // 62f3a5441fe05e
-       //TODO: VPCMPQ $94, (R14), Z27, K4, K4                     // 62d3a5441f265e
-       //TODO: VPCMPQ $94, -7(DI)(R8*8), Z27, K4, K4              // 62b3a5441fa4c7f9ffffff5e
-       //TODO: VPCMPQ $94, Z3, Z14, K4, K4                        // 62f38d4c1fe35e
-       //TODO: VPCMPQ $94, Z0, Z14, K4, K4                        // 62f38d4c1fe05e
-       //TODO: VPCMPQ $94, (R14), Z14, K4, K4                     // 62d38d4c1f265e
-       //TODO: VPCMPQ $94, -7(DI)(R8*8), Z14, K4, K4              // 62b38d4c1fa4c7f9ffffff5e
-       //TODO: VPCMPUD $67, X23, X11, K3, K6                      // 62b3250b1ef743
-       //TODO: VPCMPUD $67, (R14), X11, K3, K6                    // 62d3250b1e3643
-       //TODO: VPCMPUD $67, -7(DI)(R8*8), X11, K3, K6             // 62b3250b1eb4c7f9ffffff43
-       //TODO: VPCMPUD $67, X23, X11, K3, K4                      // 62b3250b1ee743
-       //TODO: VPCMPUD $67, (R14), X11, K3, K4                    // 62d3250b1e2643
-       //TODO: VPCMPUD $67, -7(DI)(R8*8), X11, K3, K4             // 62b3250b1ea4c7f9ffffff43
-       //TODO: VPCMPUD $127, Y1, Y16, K4, K4                      // 62f37d241ee17f
-       //TODO: VPCMPUD $127, 7(SI)(DI*4), Y16, K4, K4             // 62f37d241ea4be070000007f
-       //TODO: VPCMPUD $127, -7(DI)(R8*2), Y16, K4, K4            // 62b37d241ea447f9ffffff7f
-       //TODO: VPCMPUD $127, Y1, Y16, K4, K6                      // 62f37d241ef17f
-       //TODO: VPCMPUD $127, 7(SI)(DI*4), Y16, K4, K6             // 62f37d241eb4be070000007f
-       //TODO: VPCMPUD $127, -7(DI)(R8*2), Y16, K4, K6            // 62b37d241eb447f9ffffff7f
-       //TODO: VPCMPUD $0, Z1, Z22, K2, K4                        // 62f34d421ee100
-       //TODO: VPCMPUD $0, Z16, Z22, K2, K4                       // 62b34d421ee000
-       //TODO: VPCMPUD $0, (CX), Z22, K2, K4                      // 62f34d421e2100
-       //TODO: VPCMPUD $0, 99(R15), Z22, K2, K4                   // 62d34d421ea76300000000
-       //TODO: VPCMPUD $0, Z1, Z25, K2, K4                        // 62f335421ee100
-       //TODO: VPCMPUD $0, Z16, Z25, K2, K4                       // 62b335421ee000
-       //TODO: VPCMPUD $0, (CX), Z25, K2, K4                      // 62f335421e2100
-       //TODO: VPCMPUD $0, 99(R15), Z25, K2, K4                   // 62d335421ea76300000000
-       //TODO: VPCMPUD $0, Z1, Z22, K2, K5                        // 62f34d421ee900
-       //TODO: VPCMPUD $0, Z16, Z22, K2, K5                       // 62b34d421ee800
-       //TODO: VPCMPUD $0, (CX), Z22, K2, K5                      // 62f34d421e2900
-       //TODO: VPCMPUD $0, 99(R15), Z22, K2, K5                   // 62d34d421eaf6300000000
-       //TODO: VPCMPUD $0, Z1, Z25, K2, K5                        // 62f335421ee900
-       //TODO: VPCMPUD $0, Z16, Z25, K2, K5                       // 62b335421ee800
-       //TODO: VPCMPUD $0, (CX), Z25, K2, K5                      // 62f335421e2900
-       //TODO: VPCMPUD $0, 99(R15), Z25, K2, K5                   // 62d335421eaf6300000000
-       //TODO: VPCMPUQ $97, X20, X2, K2, K2                       // 62b3ed0a1ed461
-       //TODO: VPCMPUQ $97, 99(R15)(R15*4), X2, K2, K2            // 6293ed0a1e94bf6300000061
-       //TODO: VPCMPUQ $97, 15(DX), X2, K2, K2                    // 62f3ed0a1e920f00000061
-       //TODO: VPCMPUQ $97, X20, X2, K2, K7                       // 62b3ed0a1efc61
-       //TODO: VPCMPUQ $97, 99(R15)(R15*4), X2, K2, K7            // 6293ed0a1ebcbf6300000061
-       //TODO: VPCMPUQ $97, 15(DX), X2, K2, K7                    // 62f3ed0a1eba0f00000061
-       //TODO: VPCMPUQ $81, Y31, Y30, K3, K0                      // 62938d231ec751
-       //TODO: VPCMPUQ $81, 17(SP), Y30, K3, K0                   // 62f38d231e84241100000051
-       //TODO: VPCMPUQ $81, -17(BP)(SI*4), Y30, K3, K0            // 62f38d231e84b5efffffff51
-       //TODO: VPCMPUQ $81, Y31, Y30, K3, K5                      // 62938d231eef51
-       //TODO: VPCMPUQ $81, 17(SP), Y30, K3, K5                   // 62f38d231eac241100000051
-       //TODO: VPCMPUQ $81, -17(BP)(SI*4), Y30, K3, K5            // 62f38d231eacb5efffffff51
-       //TODO: VPCMPUQ $42, Z0, Z6, K3, K6                        // 62f3cd4b1ef02a
-       //TODO: VPCMPUQ $42, Z8, Z6, K3, K6                        // 62d3cd4b1ef02a
-       //TODO: VPCMPUQ $42, 99(R15)(R15*2), Z6, K3, K6            // 6293cd4b1eb47f630000002a
-       //TODO: VPCMPUQ $42, -7(DI), Z6, K3, K6                    // 62f3cd4b1eb7f9ffffff2a
-       //TODO: VPCMPUQ $42, Z0, Z2, K3, K6                        // 62f3ed4b1ef02a
-       //TODO: VPCMPUQ $42, Z8, Z2, K3, K6                        // 62d3ed4b1ef02a
-       //TODO: VPCMPUQ $42, 99(R15)(R15*2), Z2, K3, K6            // 6293ed4b1eb47f630000002a
-       //TODO: VPCMPUQ $42, -7(DI), Z2, K3, K6                    // 62f3ed4b1eb7f9ffffff2a
-       //TODO: VPCMPUQ $42, Z0, Z6, K3, K5                        // 62f3cd4b1ee82a
-       //TODO: VPCMPUQ $42, Z8, Z6, K3, K5                        // 62d3cd4b1ee82a
-       //TODO: VPCMPUQ $42, 99(R15)(R15*2), Z6, K3, K5            // 6293cd4b1eac7f630000002a
-       //TODO: VPCMPUQ $42, -7(DI), Z6, K3, K5                    // 62f3cd4b1eaff9ffffff2a
-       //TODO: VPCMPUQ $42, Z0, Z2, K3, K5                        // 62f3ed4b1ee82a
-       //TODO: VPCMPUQ $42, Z8, Z2, K3, K5                        // 62d3ed4b1ee82a
-       //TODO: VPCMPUQ $42, 99(R15)(R15*2), Z2, K3, K5            // 6293ed4b1eac7f630000002a
-       //TODO: VPCMPUQ $42, -7(DI), Z2, K3, K5                    // 62f3ed4b1eaff9ffffff2a
-       //TODO: VPCOMPRESSD X9, K7, X8                             // 62527d0f8bc8
-       //TODO: VPCOMPRESSD X9, K7, 15(DX)(BX*1)                   // 62727d0f8b8c1a0f000000
-       //TODO: VPCOMPRESSD X9, K7, -7(CX)(DX*2)                   // 62727d0f8b8c51f9ffffff
-       //TODO: VPCOMPRESSD Y14, K2, Y20                           // 62327d2a8bf4
-       //TODO: VPCOMPRESSD Y14, K2, 7(SI)(DI*8)                   // 62727d2a8bb4fe07000000
-       //TODO: VPCOMPRESSD Y14, K2, -15(R14)                      // 62527d2a8bb6f1ffffff
-       //TODO: VPCOMPRESSD Z26, K4, Z6                            // 62627d4c8bd6
-       //TODO: VPCOMPRESSD Z14, K4, Z6                            // 62727d4c8bf6
-       //TODO: VPCOMPRESSD Z26, K4, Z14                           // 62427d4c8bd6
-       //TODO: VPCOMPRESSD Z14, K4, Z14                           // 62527d4c8bf6
-       //TODO: VPCOMPRESSD Z26, K4, 17(SP)(BP*2)                  // 62627d4c8b946c11000000
-       //TODO: VPCOMPRESSD Z14, K4, 17(SP)(BP*2)                  // 62727d4c8bb46c11000000
-       //TODO: VPCOMPRESSD Z26, K4, -7(DI)(R8*4)                  // 62227d4c8b9487f9ffffff
-       //TODO: VPCOMPRESSD Z14, K4, -7(DI)(R8*4)                  // 62327d4c8bb487f9ffffff
-       //TODO: VPCOMPRESSQ X31, K1, X2                            // 6262fd098bfa
-       //TODO: VPCOMPRESSQ X31, K1, -17(BP)                       // 6262fd098bbdefffffff
-       //TODO: VPCOMPRESSQ X31, K1, -15(R14)(R15*8)               // 6202fd098bbcfef1ffffff
-       //TODO: VPCOMPRESSQ Y13, K3, Y24                           // 6212fd2b8be8
-       //TODO: VPCOMPRESSQ Y13, K3, 7(SI)(DI*1)                   // 6272fd2b8bac3e07000000
-       //TODO: VPCOMPRESSQ Y13, K3, 15(DX)(BX*8)                  // 6272fd2b8bacda0f000000
-       //TODO: VPCOMPRESSQ Z13, K4, Z28                           // 6212fd4c8bec
-       //TODO: VPCOMPRESSQ Z21, K4, Z28                           // 6282fd4c8bec
-       //TODO: VPCOMPRESSQ Z13, K4, Z6                            // 6272fd4c8bee
-       //TODO: VPCOMPRESSQ Z21, K4, Z6                            // 62e2fd4c8bee
-       //TODO: VPCOMPRESSQ Z13, K4, 15(R8)                        // 6252fd4c8ba80f000000
-       //TODO: VPCOMPRESSQ Z21, K4, 15(R8)                        // 62c2fd4c8ba80f000000
-       //TODO: VPCOMPRESSQ Z13, K4, (BP)                          // 6272fd4c8b6d00
-       //TODO: VPCOMPRESSQ Z21, K4, (BP)                          // 62e2fd4c8b6d00
-       //TODO: VPERMD Y11, Y8, K1, Y24                            // 62423d2936c3
-       //TODO: VPERMD -17(BP)(SI*2), Y8, K1, Y24                  // 62623d29368475efffffff
-       //TODO: VPERMD 7(AX)(CX*2), Y8, K1, Y24                    // 62623d2936844807000000
-       //TODO: VPERMD Z20, Z0, K1, Z7                             // 62b27d4936fc
-       //TODO: VPERMD Z28, Z0, K1, Z7                             // 62927d4936fc
-       //TODO: VPERMD 99(R15)(R15*1), Z0, K1, Z7                  // 62927d4936bc3f63000000
-       //TODO: VPERMD (DX), Z0, K1, Z7                            // 62f27d49363a
-       //TODO: VPERMD Z20, Z6, K1, Z7                             // 62b24d4936fc
-       //TODO: VPERMD Z28, Z6, K1, Z7                             // 62924d4936fc
-       //TODO: VPERMD 99(R15)(R15*1), Z6, K1, Z7                  // 62924d4936bc3f63000000
-       //TODO: VPERMD (DX), Z6, K1, Z7                            // 62f24d49363a
-       //TODO: VPERMD Z20, Z0, K1, Z9                             // 62327d4936cc
-       //TODO: VPERMD Z28, Z0, K1, Z9                             // 62127d4936cc
-       //TODO: VPERMD 99(R15)(R15*1), Z0, K1, Z9                  // 62127d49368c3f63000000
-       //TODO: VPERMD (DX), Z0, K1, Z9                            // 62727d49360a
-       //TODO: VPERMD Z20, Z6, K1, Z9                             // 62324d4936cc
-       //TODO: VPERMD Z28, Z6, K1, Z9                             // 62124d4936cc
-       //TODO: VPERMD 99(R15)(R15*1), Z6, K1, Z9                  // 62124d49368c3f63000000
-       //TODO: VPERMD (DX), Z6, K1, Z9                            // 62724d49360a
-       //TODO: VPERMI2D X1, X22, K1, X0                           // 62f24d0176c1
-       //TODO: VPERMI2D 7(AX), X22, K1, X0                        // 62f24d01768007000000
-       //TODO: VPERMI2D (DI), X22, K1, X0                         // 62f24d017607
-       //TODO: VPERMI2D Y9, Y16, K3, Y21                          // 62c27d2376e9
-       //TODO: VPERMI2D (R14), Y16, K3, Y21                       // 62c27d23762e
-       //TODO: VPERMI2D -7(DI)(R8*8), Y16, K3, Y21                // 62a27d2376acc7f9ffffff
-       //TODO: VPERMI2D Z2, Z18, K4, Z11                          // 62726d4476da
-       //TODO: VPERMI2D Z21, Z18, K4, Z11                         // 62326d4476dd
-       //TODO: VPERMI2D 7(SI)(DI*8), Z18, K4, Z11                 // 62726d44769cfe07000000
-       //TODO: VPERMI2D -15(R14), Z18, K4, Z11                    // 62526d44769ef1ffffff
-       //TODO: VPERMI2D Z2, Z24, K4, Z11                          // 62723d4476da
-       //TODO: VPERMI2D Z21, Z24, K4, Z11                         // 62323d4476dd
-       //TODO: VPERMI2D 7(SI)(DI*8), Z24, K4, Z11                 // 62723d44769cfe07000000
-       //TODO: VPERMI2D -15(R14), Z24, K4, Z11                    // 62523d44769ef1ffffff
-       //TODO: VPERMI2D Z2, Z18, K4, Z5                           // 62f26d4476ea
-       //TODO: VPERMI2D Z21, Z18, K4, Z5                          // 62b26d4476ed
-       //TODO: VPERMI2D 7(SI)(DI*8), Z18, K4, Z5                  // 62f26d4476acfe07000000
-       //TODO: VPERMI2D -15(R14), Z18, K4, Z5                     // 62d26d4476aef1ffffff
-       //TODO: VPERMI2D Z2, Z24, K4, Z5                           // 62f23d4476ea
-       //TODO: VPERMI2D Z21, Z24, K4, Z5                          // 62b23d4476ed
-       //TODO: VPERMI2D 7(SI)(DI*8), Z24, K4, Z5                  // 62f23d4476acfe07000000
-       //TODO: VPERMI2D -15(R14), Z24, K4, Z5                     // 62d23d4476aef1ffffff
-       //TODO: VPERMI2PD X7, X6, K5, X11                          // 6272cd0d77df
-       //TODO: VPERMI2PD 99(R15)(R15*1), X6, K5, X11              // 6212cd0d779c3f63000000
-       //TODO: VPERMI2PD (DX), X6, K5, X11                        // 6272cd0d771a
-       //TODO: VPERMI2PD Y6, Y9, K7, Y13                          // 6272b52f77ee
-       //TODO: VPERMI2PD 99(R15)(R15*4), Y9, K7, Y13              // 6212b52f77acbf63000000
-       //TODO: VPERMI2PD 15(DX), Y9, K7, Y13                      // 6272b52f77aa0f000000
-       //TODO: VPERMI2PD Z6, Z6, K7, Z7                           // 62f2cd4f77fe
-       //TODO: VPERMI2PD Z22, Z6, K7, Z7                          // 62b2cd4f77fe
-       //TODO: VPERMI2PD 7(SI)(DI*1), Z6, K7, Z7                  // 62f2cd4f77bc3e07000000
-       //TODO: VPERMI2PD 15(DX)(BX*8), Z6, K7, Z7                 // 62f2cd4f77bcda0f000000
-       //TODO: VPERMI2PD Z6, Z16, K7, Z7                          // 62f2fd4777fe
-       //TODO: VPERMI2PD Z22, Z16, K7, Z7                         // 62b2fd4777fe
-       //TODO: VPERMI2PD 7(SI)(DI*1), Z16, K7, Z7                 // 62f2fd4777bc3e07000000
-       //TODO: VPERMI2PD 15(DX)(BX*8), Z16, K7, Z7                // 62f2fd4777bcda0f000000
-       //TODO: VPERMI2PD Z6, Z6, K7, Z13                          // 6272cd4f77ee
-       //TODO: VPERMI2PD Z22, Z6, K7, Z13                         // 6232cd4f77ee
-       //TODO: VPERMI2PD 7(SI)(DI*1), Z6, K7, Z13                 // 6272cd4f77ac3e07000000
-       //TODO: VPERMI2PD 15(DX)(BX*8), Z6, K7, Z13                // 6272cd4f77acda0f000000
-       //TODO: VPERMI2PD Z6, Z16, K7, Z13                         // 6272fd4777ee
-       //TODO: VPERMI2PD Z22, Z16, K7, Z13                        // 6232fd4777ee
-       //TODO: VPERMI2PD 7(SI)(DI*1), Z16, K7, Z13                // 6272fd4777ac3e07000000
-       //TODO: VPERMI2PD 15(DX)(BX*8), Z16, K7, Z13               // 6272fd4777acda0f000000
-       //TODO: VPERMI2PS X3, X31, K6, X8                          // 6272050677c3
-       //TODO: VPERMI2PS -17(BP)(SI*8), X31, K6, X8               // 627205067784f5efffffff
-       //TODO: VPERMI2PS (R15), X31, K6, X8                       // 625205067707
-       //TODO: VPERMI2PS Y6, Y7, K3, Y3                           // 62f2452b77de
-       //TODO: VPERMI2PS (CX), Y7, K3, Y3                         // 62f2452b7719
-       //TODO: VPERMI2PS 99(R15), Y7, K3, Y3                      // 62d2452b779f63000000
-       //TODO: VPERMI2PS Z18, Z13, K7, Z1                         // 62b2154f77ca
-       //TODO: VPERMI2PS Z8, Z13, K7, Z1                          // 62d2154f77c8
-       //TODO: VPERMI2PS -7(DI)(R8*1), Z13, K7, Z1                // 62b2154f778c07f9ffffff
-       //TODO: VPERMI2PS (SP), Z13, K7, Z1                        // 62f2154f770c24
-       //TODO: VPERMI2PS Z18, Z13, K7, Z15                        // 6232154f77fa
-       //TODO: VPERMI2PS Z8, Z13, K7, Z15                         // 6252154f77f8
-       //TODO: VPERMI2PS -7(DI)(R8*1), Z13, K7, Z15               // 6232154f77bc07f9ffffff
-       //TODO: VPERMI2PS (SP), Z13, K7, Z15                       // 6272154f773c24
-       //TODO: VPERMI2Q X24, X20, K4, X28                         // 6202dd0476e0
-       //TODO: VPERMI2Q 7(SI)(DI*8), X20, K4, X28                 // 6262dd0476a4fe07000000
-       //TODO: VPERMI2Q -15(R14), X20, K4, X28                    // 6242dd0476a6f1ffffff
-       //TODO: VPERMI2Q Y26, Y11, K4, Y26                         // 6202a52c76d2
-       //TODO: VPERMI2Q 99(R15)(R15*2), Y11, K4, Y26              // 6202a52c76947f63000000
-       //TODO: VPERMI2Q -7(DI), Y11, K4, Y26                      // 6262a52c7697f9ffffff
-       //TODO: VPERMI2Q Z20, Z2, K7, Z22                          // 62a2ed4f76f4
-       //TODO: VPERMI2Q Z9, Z2, K7, Z22                           // 62c2ed4f76f1
-       //TODO: VPERMI2Q -7(CX), Z2, K7, Z22                       // 62e2ed4f76b1f9ffffff
-       //TODO: VPERMI2Q 15(DX)(BX*4), Z2, K7, Z22                 // 62e2ed4f76b49a0f000000
-       //TODO: VPERMI2Q Z20, Z31, K7, Z22                         // 62a2854776f4
-       //TODO: VPERMI2Q Z9, Z31, K7, Z22                          // 62c2854776f1
-       //TODO: VPERMI2Q -7(CX), Z31, K7, Z22                      // 62e2854776b1f9ffffff
-       //TODO: VPERMI2Q 15(DX)(BX*4), Z31, K7, Z22                // 62e2854776b49a0f000000
-       //TODO: VPERMI2Q Z20, Z2, K7, Z7                           // 62b2ed4f76fc
-       //TODO: VPERMI2Q Z9, Z2, K7, Z7                            // 62d2ed4f76f9
-       //TODO: VPERMI2Q -7(CX), Z2, K7, Z7                        // 62f2ed4f76b9f9ffffff
-       //TODO: VPERMI2Q 15(DX)(BX*4), Z2, K7, Z7                  // 62f2ed4f76bc9a0f000000
-       //TODO: VPERMI2Q Z20, Z31, K7, Z7                          // 62b2854776fc
-       //TODO: VPERMI2Q Z9, Z31, K7, Z7                           // 62d2854776f9
-       //TODO: VPERMI2Q -7(CX), Z31, K7, Z7                       // 62f2854776b9f9ffffff
-       //TODO: VPERMI2Q 15(DX)(BX*4), Z31, K7, Z7                 // 62f2854776bc9a0f000000
-       //TODO: VPERMILPD $94, X6, K4, X12                         // 6273fd0c05e65e
-       //TODO: VPERMILPD $94, -7(DI)(R8*1), K4, X12               // 6233fd0c05a407f9ffffff5e
-       //TODO: VPERMILPD $94, (SP), K4, X12                       // 6273fd0c0524245e
-       //TODO: VPERMILPD $121, Y18, K2, Y31                       // 6223fd2a05fa79
-       //TODO: VPERMILPD $121, 15(DX)(BX*1), K2, Y31              // 6263fd2a05bc1a0f00000079
-       //TODO: VPERMILPD $121, -7(CX)(DX*2), K2, Y31              // 6263fd2a05bc51f9ffffff79
-       //TODO: VPERMILPD $13, Z3, K2, Z14                         // 6273fd4a05f30d
-       //TODO: VPERMILPD $13, Z12, K2, Z14                        // 6253fd4a05f40d
-       //TODO: VPERMILPD $13, (AX), K2, Z14                       // 6273fd4a05300d
-       //TODO: VPERMILPD $13, 7(SI), K2, Z14                      // 6273fd4a05b6070000000d
-       //TODO: VPERMILPD $13, Z3, K2, Z28                         // 6263fd4a05e30d
-       //TODO: VPERMILPD $13, Z12, K2, Z28                        // 6243fd4a05e40d
-       //TODO: VPERMILPD $13, (AX), K2, Z28                       // 6263fd4a05200d
-       //TODO: VPERMILPD $13, 7(SI), K2, Z28                      // 6263fd4a05a6070000000d
-       //TODO: VPERMILPD X6, X28, K3, X17                         // 62e29d030dce
-       //TODO: VPERMILPD -7(CX), X28, K3, X17                     // 62e29d030d89f9ffffff
-       //TODO: VPERMILPD 15(DX)(BX*4), X28, K3, X17               // 62e29d030d8c9a0f000000
-       //TODO: VPERMILPD Y2, Y24, K3, Y3                          // 62f2bd230dda
-       //TODO: VPERMILPD -17(BP), Y24, K3, Y3                     // 62f2bd230d9defffffff
-       //TODO: VPERMILPD -15(R14)(R15*8), Y24, K3, Y3             // 6292bd230d9cfef1ffffff
-       //TODO: VPERMILPD Z5, Z19, K3, Z15                         // 6272e5430dfd
-       //TODO: VPERMILPD Z1, Z19, K3, Z15                         // 6272e5430df9
-       //TODO: VPERMILPD (BX), Z19, K3, Z15                       // 6272e5430d3b
-       //TODO: VPERMILPD -17(BP)(SI*1), Z19, K3, Z15              // 6272e5430dbc35efffffff
-       //TODO: VPERMILPD Z5, Z15, K3, Z15                         // 6272854b0dfd
-       //TODO: VPERMILPD Z1, Z15, K3, Z15                         // 6272854b0df9
-       //TODO: VPERMILPD (BX), Z15, K3, Z15                       // 6272854b0d3b
-       //TODO: VPERMILPD -17(BP)(SI*1), Z15, K3, Z15              // 6272854b0dbc35efffffff
-       //TODO: VPERMILPD Z5, Z19, K3, Z30                         // 6262e5430df5
-       //TODO: VPERMILPD Z1, Z19, K3, Z30                         // 6262e5430df1
-       //TODO: VPERMILPD (BX), Z19, K3, Z30                       // 6262e5430d33
-       //TODO: VPERMILPD -17(BP)(SI*1), Z19, K3, Z30              // 6262e5430db435efffffff
-       //TODO: VPERMILPD Z5, Z15, K3, Z30                         // 6262854b0df5
-       //TODO: VPERMILPD Z1, Z15, K3, Z30                         // 6262854b0df1
-       //TODO: VPERMILPD (BX), Z15, K3, Z30                       // 6262854b0d33
-       //TODO: VPERMILPD -17(BP)(SI*1), Z15, K3, Z30              // 6262854b0db435efffffff
-       //TODO: VPERMILPS $65, X8, K2, X1                          // 62d37d0a04c841
-       //TODO: VPERMILPS $65, 99(R15)(R15*8), K2, X1              // 62937d0a048cff6300000041
-       //TODO: VPERMILPS $65, 7(AX)(CX*8), K2, X1                 // 62f37d0a048cc80700000041
-       //TODO: VPERMILPS $67, Y21, K1, Y7                         // 62b37d2904fd43
-       //TODO: VPERMILPS $67, 17(SP)(BP*2), K1, Y7                // 62f37d2904bc6c1100000043
-       //TODO: VPERMILPS $67, -7(DI)(R8*4), K1, Y7                // 62b37d2904bc87f9ffffff43
-       //TODO: VPERMILPS $127, Z14, K2, Z3                        // 62d37d4a04de7f
-       //TODO: VPERMILPS $127, Z15, K2, Z3                        // 62d37d4a04df7f
-       //TODO: VPERMILPS $127, 15(R8)(R14*4), K2, Z3              // 62937d4a049cb00f0000007f
-       //TODO: VPERMILPS $127, -7(CX)(DX*4), K2, Z3               // 62f37d4a049c91f9ffffff7f
-       //TODO: VPERMILPS $127, Z14, K2, Z5                        // 62d37d4a04ee7f
-       //TODO: VPERMILPS $127, Z15, K2, Z5                        // 62d37d4a04ef7f
-       //TODO: VPERMILPS $127, 15(R8)(R14*4), K2, Z5              // 62937d4a04acb00f0000007f
-       //TODO: VPERMILPS $127, -7(CX)(DX*4), K2, Z5               // 62f37d4a04ac91f9ffffff7f
-       //TODO: VPERMILPS X0, X6, K1, X8                           // 62724d090cc0
-       //TODO: VPERMILPS (AX), X6, K1, X8                         // 62724d090c00
-       //TODO: VPERMILPS 7(SI), X6, K1, X8                        // 62724d090c8607000000
-       //TODO: VPERMILPS Y20, Y8, K7, Y14                         // 62323d2f0cf4
-       //TODO: VPERMILPS 15(R8), Y8, K7, Y14                      // 62523d2f0cb00f000000
-       //TODO: VPERMILPS (BP), Y8, K7, Y14                        // 62723d2f0c7500
-       //TODO: VPERMILPS Z20, Z16, K1, Z21                        // 62a27d410cec
-       //TODO: VPERMILPS Z0, Z16, K1, Z21                         // 62e27d410ce8
-       //TODO: VPERMILPS (R8), Z16, K1, Z21                       // 62c27d410c28
-       //TODO: VPERMILPS 15(DX)(BX*2), Z16, K1, Z21               // 62e27d410cac5a0f000000
-       //TODO: VPERMILPS Z20, Z9, K1, Z21                         // 62a235490cec
-       //TODO: VPERMILPS Z0, Z9, K1, Z21                          // 62e235490ce8
-       //TODO: VPERMILPS (R8), Z9, K1, Z21                        // 62c235490c28
-       //TODO: VPERMILPS 15(DX)(BX*2), Z9, K1, Z21                // 62e235490cac5a0f000000
-       //TODO: VPERMILPS Z20, Z16, K1, Z8                         // 62327d410cc4
-       //TODO: VPERMILPS Z0, Z16, K1, Z8                          // 62727d410cc0
-       //TODO: VPERMILPS (R8), Z16, K1, Z8                        // 62527d410c00
-       //TODO: VPERMILPS 15(DX)(BX*2), Z16, K1, Z8                // 62727d410c845a0f000000
-       //TODO: VPERMILPS Z20, Z9, K1, Z8                          // 623235490cc4
-       //TODO: VPERMILPS Z0, Z9, K1, Z8                           // 627235490cc0
-       //TODO: VPERMILPS (R8), Z9, K1, Z8                         // 625235490c00
-       //TODO: VPERMILPS 15(DX)(BX*2), Z9, K1, Z8                 // 627235490c845a0f000000
-       //TODO: VPERMPD $0, Y24, K1, Y11                           // 6213fd2901d800
-       //TODO: VPERMPD $0, 15(R8)(R14*8), K1, Y11                 // 6213fd29019cf00f00000000
-       //TODO: VPERMPD $0, -15(R14)(R15*2), K1, Y11               // 6213fd29019c7ef1ffffff00
-       //TODO: VPERMPD $97, Z0, K1, Z23                           // 62e3fd4901f861
-       //TODO: VPERMPD $97, Z11, K1, Z23                          // 62c3fd4901fb61
-       //TODO: VPERMPD $97, 17(SP)(BP*1), K1, Z23                 // 62e3fd4901bc2c1100000061
-       //TODO: VPERMPD $97, -7(CX)(DX*8), K1, Z23                 // 62e3fd4901bcd1f9ffffff61
-       //TODO: VPERMPD $97, Z0, K1, Z19                           // 62e3fd4901d861
-       //TODO: VPERMPD $97, Z11, K1, Z19                          // 62c3fd4901db61
-       //TODO: VPERMPD $97, 17(SP)(BP*1), K1, Z19                 // 62e3fd49019c2c1100000061
-       //TODO: VPERMPD $97, -7(CX)(DX*8), K1, Z19                 // 62e3fd49019cd1f9ffffff61
-       //TODO: VPERMPD Y18, Y5, K7, Y1                            // 62b2d52f16ca
-       //TODO: VPERMPD -15(R14)(R15*1), Y5, K7, Y1                // 6292d52f168c3ef1ffffff
-       //TODO: VPERMPD -15(BX), Y5, K7, Y1                        // 62f2d52f168bf1ffffff
-       //TODO: VPERMPD Z0, Z24, K2, Z0                            // 62f2bd4216c0
-       //TODO: VPERMPD Z26, Z24, K2, Z0                           // 6292bd4216c2
-       //TODO: VPERMPD -17(BP)(SI*2), Z24, K2, Z0                 // 62f2bd42168475efffffff
-       //TODO: VPERMPD 7(AX)(CX*2), Z24, K2, Z0                   // 62f2bd4216844807000000
-       //TODO: VPERMPD Z0, Z12, K2, Z0                            // 62f29d4a16c0
-       //TODO: VPERMPD Z26, Z12, K2, Z0                           // 62929d4a16c2
-       //TODO: VPERMPD -17(BP)(SI*2), Z12, K2, Z0                 // 62f29d4a168475efffffff
-       //TODO: VPERMPD 7(AX)(CX*2), Z12, K2, Z0                   // 62f29d4a16844807000000
-       //TODO: VPERMPD Z0, Z24, K2, Z25                           // 6262bd4216c8
-       //TODO: VPERMPD Z26, Z24, K2, Z25                          // 6202bd4216ca
-       //TODO: VPERMPD -17(BP)(SI*2), Z24, K2, Z25                // 6262bd42168c75efffffff
-       //TODO: VPERMPD 7(AX)(CX*2), Z24, K2, Z25                  // 6262bd42168c4807000000
-       //TODO: VPERMPD Z0, Z12, K2, Z25                           // 62629d4a16c8
-       //TODO: VPERMPD Z26, Z12, K2, Z25                          // 62029d4a16ca
-       //TODO: VPERMPD -17(BP)(SI*2), Z12, K2, Z25                // 62629d4a168c75efffffff
-       //TODO: VPERMPD 7(AX)(CX*2), Z12, K2, Z25                  // 62629d4a168c4807000000
-       //TODO: VPERMPS Y9, Y20, K4, Y20                           // 62c25d2416e1
-       //TODO: VPERMPS 7(AX)(CX*4), Y20, K4, Y20                  // 62e25d2416a48807000000
-       //TODO: VPERMPS 7(AX)(CX*1), Y20, K4, Y20                  // 62e25d2416a40807000000
-       //TODO: VPERMPS Z9, Z9, K1, Z9                             // 6252354916c9
-       //TODO: VPERMPS Z28, Z9, K1, Z9                            // 6212354916cc
-       //TODO: VPERMPS 15(R8)(R14*1), Z9, K1, Z9                  // 62123549168c300f000000
-       //TODO: VPERMPS 15(R8)(R14*2), Z9, K1, Z9                  // 62123549168c700f000000
-       //TODO: VPERMPS Z9, Z25, K1, Z9                            // 6252354116c9
-       //TODO: VPERMPS Z28, Z25, K1, Z9                           // 6212354116cc
-       //TODO: VPERMPS 15(R8)(R14*1), Z25, K1, Z9                 // 62123541168c300f000000
-       //TODO: VPERMPS 15(R8)(R14*2), Z25, K1, Z9                 // 62123541168c700f000000
-       //TODO: VPERMPS Z9, Z9, K1, Z3                             // 62d2354916d9
-       //TODO: VPERMPS Z28, Z9, K1, Z3                            // 6292354916dc
-       //TODO: VPERMPS 15(R8)(R14*1), Z9, K1, Z3                  // 62923549169c300f000000
-       //TODO: VPERMPS 15(R8)(R14*2), Z9, K1, Z3                  // 62923549169c700f000000
-       //TODO: VPERMPS Z9, Z25, K1, Z3                            // 62d2354116d9
-       //TODO: VPERMPS Z28, Z25, K1, Z3                           // 6292354116dc
-       //TODO: VPERMPS 15(R8)(R14*1), Z25, K1, Z3                 // 62923541169c300f000000
-       //TODO: VPERMPS 15(R8)(R14*2), Z25, K1, Z3                 // 62923541169c700f000000
-       //TODO: VPERMQ $81, Y28, K3, Y28                           // 6203fd2b00e451
-       //TODO: VPERMQ $81, (SI), K3, Y28                          // 6263fd2b002651
-       //TODO: VPERMQ $81, 7(SI)(DI*2), K3, Y28                   // 6263fd2b00a47e0700000051
-       //TODO: VPERMQ $42, Z17, K4, Z20                           // 62a3fd4c00e12a
-       //TODO: VPERMQ $42, Z0, K4, Z20                            // 62e3fd4c00e02a
-       //TODO: VPERMQ $42, (R14), K4, Z20                         // 62c3fd4c00262a
-       //TODO: VPERMQ $42, -7(DI)(R8*8), K4, Z20                  // 62a3fd4c00a4c7f9ffffff2a
-       //TODO: VPERMQ $42, Z17, K4, Z0                            // 62b3fd4c00c12a
-       //TODO: VPERMQ $42, Z0, K4, Z0                             // 62f3fd4c00c02a
-       //TODO: VPERMQ $42, (R14), K4, Z0                          // 62d3fd4c00062a
-       //TODO: VPERMQ $42, -7(DI)(R8*8), K4, Z0                   // 62b3fd4c0084c7f9ffffff2a
-       //TODO: VPERMQ Y11, Y8, K5, Y1                             // 62d2bd2d36cb
-       //TODO: VPERMQ 17(SP)(BP*8), Y8, K5, Y1                    // 62f2bd2d368cec11000000
-       //TODO: VPERMQ 17(SP)(BP*4), Y8, K5, Y1                    // 62f2bd2d368cac11000000
-       //TODO: VPERMQ Z21, Z31, K7, Z17                           // 62a2854736cd
-       //TODO: VPERMQ Z9, Z31, K7, Z17                            // 62c2854736c9
-       //TODO: VPERMQ 99(R15)(R15*4), Z31, K7, Z17                // 62828547368cbf63000000
-       //TODO: VPERMQ 15(DX), Z31, K7, Z17                        // 62e28547368a0f000000
-       //TODO: VPERMQ Z21, Z0, K7, Z17                            // 62a2fd4f36cd
-       //TODO: VPERMQ Z9, Z0, K7, Z17                             // 62c2fd4f36c9
-       //TODO: VPERMQ 99(R15)(R15*4), Z0, K7, Z17                 // 6282fd4f368cbf63000000
-       //TODO: VPERMQ 15(DX), Z0, K7, Z17                         // 62e2fd4f368a0f000000
-       //TODO: VPERMQ Z21, Z31, K7, Z23                           // 62a2854736fd
-       //TODO: VPERMQ Z9, Z31, K7, Z23                            // 62c2854736f9
-       //TODO: VPERMQ 99(R15)(R15*4), Z31, K7, Z23                // 6282854736bcbf63000000
-       //TODO: VPERMQ 15(DX), Z31, K7, Z23                        // 62e2854736ba0f000000
-       //TODO: VPERMQ Z21, Z0, K7, Z23                            // 62a2fd4f36fd
-       //TODO: VPERMQ Z9, Z0, K7, Z23                             // 62c2fd4f36f9
-       //TODO: VPERMQ 99(R15)(R15*4), Z0, K7, Z23                 // 6282fd4f36bcbf63000000
-       //TODO: VPERMQ 15(DX), Z0, K7, Z23                         // 62e2fd4f36ba0f000000
-       //TODO: VPERMT2D X12, X22, K7, X6                          // 62d24d077ef4
-       //TODO: VPERMT2D 15(R8)(R14*4), X22, K7, X6                // 62924d077eb4b00f000000
-       //TODO: VPERMT2D -7(CX)(DX*4), X22, K7, X6                 // 62f24d077eb491f9ffffff
-       //TODO: VPERMT2D Y26, Y6, K4, Y12                          // 62124d2c7ee2
-       //TODO: VPERMT2D 17(SP), Y6, K4, Y12                       // 62724d2c7ea42411000000
-       //TODO: VPERMT2D -17(BP)(SI*4), Y6, K4, Y12                // 62724d2c7ea4b5efffffff
-       //TODO: VPERMT2D Z7, Z26, K4, Z30                          // 62622d447ef7
-       //TODO: VPERMT2D Z21, Z26, K4, Z30                         // 62222d447ef5
-       //TODO: VPERMT2D 99(R15)(R15*2), Z26, K4, Z30              // 62022d447eb47f63000000
-       //TODO: VPERMT2D -7(DI), Z26, K4, Z30                      // 62622d447eb7f9ffffff
-       //TODO: VPERMT2D Z7, Z22, K4, Z30                          // 62624d447ef7
-       //TODO: VPERMT2D Z21, Z22, K4, Z30                         // 62224d447ef5
-       //TODO: VPERMT2D 99(R15)(R15*2), Z22, K4, Z30              // 62024d447eb47f63000000
-       //TODO: VPERMT2D -7(DI), Z22, K4, Z30                      // 62624d447eb7f9ffffff
-       //TODO: VPERMT2D Z7, Z26, K4, Z5                           // 62f22d447eef
-       //TODO: VPERMT2D Z21, Z26, K4, Z5                          // 62b22d447eed
-       //TODO: VPERMT2D 99(R15)(R15*2), Z26, K4, Z5               // 62922d447eac7f63000000
-       //TODO: VPERMT2D -7(DI), Z26, K4, Z5                       // 62f22d447eaff9ffffff
-       //TODO: VPERMT2D Z7, Z22, K4, Z5                           // 62f24d447eef
-       //TODO: VPERMT2D Z21, Z22, K4, Z5                          // 62b24d447eed
-       //TODO: VPERMT2D 99(R15)(R15*2), Z22, K4, Z5               // 62924d447eac7f63000000
-       //TODO: VPERMT2D -7(DI), Z22, K4, Z5                       // 62f24d447eaff9ffffff
-       //TODO: VPERMT2PD X8, X28, K7, X16                         // 62c29d077fc0
-       //TODO: VPERMT2PD (R8), X28, K7, X16                       // 62c29d077f00
-       //TODO: VPERMT2PD 15(DX)(BX*2), X28, K7, X16               // 62e29d077f845a0f000000
-       //TODO: VPERMT2PD Y28, Y8, K2, Y3                          // 6292bd2a7fdc
-       //TODO: VPERMT2PD 7(AX), Y8, K2, Y3                        // 62f2bd2a7f9807000000
-       //TODO: VPERMT2PD (DI), Y8, K2, Y3                         // 62f2bd2a7f1f
-       //TODO: VPERMT2PD Z12, Z14, K5, Z16                        // 62c28d4d7fc4
-       //TODO: VPERMT2PD Z13, Z14, K5, Z16                        // 62c28d4d7fc5
-       //TODO: VPERMT2PD -7(CX)(DX*1), Z14, K5, Z16               // 62e28d4d7f8411f9ffffff
-       //TODO: VPERMT2PD -15(R14)(R15*4), Z14, K5, Z16            // 62828d4d7f84bef1ffffff
-       //TODO: VPERMT2PD Z12, Z13, K5, Z16                        // 62c2954d7fc4
-       //TODO: VPERMT2PD Z13, Z13, K5, Z16                        // 62c2954d7fc5
-       //TODO: VPERMT2PD -7(CX)(DX*1), Z13, K5, Z16               // 62e2954d7f8411f9ffffff
-       //TODO: VPERMT2PD -15(R14)(R15*4), Z13, K5, Z16            // 6282954d7f84bef1ffffff
-       //TODO: VPERMT2PD Z12, Z14, K5, Z25                        // 62428d4d7fcc
-       //TODO: VPERMT2PD Z13, Z14, K5, Z25                        // 62428d4d7fcd
-       //TODO: VPERMT2PD -7(CX)(DX*1), Z14, K5, Z25               // 62628d4d7f8c11f9ffffff
-       //TODO: VPERMT2PD -15(R14)(R15*4), Z14, K5, Z25            // 62028d4d7f8cbef1ffffff
-       //TODO: VPERMT2PD Z12, Z13, K5, Z25                        // 6242954d7fcc
-       //TODO: VPERMT2PD Z13, Z13, K5, Z25                        // 6242954d7fcd
-       //TODO: VPERMT2PD -7(CX)(DX*1), Z13, K5, Z25               // 6262954d7f8c11f9ffffff
-       //TODO: VPERMT2PD -15(R14)(R15*4), Z13, K5, Z25            // 6202954d7f8cbef1ffffff
-       //TODO: VPERMT2PS X1, X11, K3, X15                         // 6272250b7ff9
-       //TODO: VPERMT2PS 17(SP)(BP*1), X11, K3, X15               // 6272250b7fbc2c11000000
-       //TODO: VPERMT2PS -7(CX)(DX*8), X11, K3, X15               // 6272250b7fbcd1f9ffffff
-       //TODO: VPERMT2PS Y14, Y23, K4, Y1                         // 62d245247fce
-       //TODO: VPERMT2PS 99(R15)(R15*1), Y23, K4, Y1              // 629245247f8c3f63000000
-       //TODO: VPERMT2PS (DX), Y23, K4, Y1                        // 62f245247f0a
-       //TODO: VPERMT2PS Z27, Z2, K2, Z21                         // 62826d4a7feb
-       //TODO: VPERMT2PS Z25, Z2, K2, Z21                         // 62826d4a7fe9
-       //TODO: VPERMT2PS 15(DX)(BX*1), Z2, K2, Z21                // 62e26d4a7fac1a0f000000
-       //TODO: VPERMT2PS -7(CX)(DX*2), Z2, K2, Z21                // 62e26d4a7fac51f9ffffff
-       //TODO: VPERMT2PS Z27, Z7, K2, Z21                         // 6282454a7feb
-       //TODO: VPERMT2PS Z25, Z7, K2, Z21                         // 6282454a7fe9
-       //TODO: VPERMT2PS 15(DX)(BX*1), Z7, K2, Z21                // 62e2454a7fac1a0f000000
-       //TODO: VPERMT2PS -7(CX)(DX*2), Z7, K2, Z21                // 62e2454a7fac51f9ffffff
-       //TODO: VPERMT2PS Z27, Z2, K2, Z9                          // 62126d4a7fcb
-       //TODO: VPERMT2PS Z25, Z2, K2, Z9                          // 62126d4a7fc9
-       //TODO: VPERMT2PS 15(DX)(BX*1), Z2, K2, Z9                 // 62726d4a7f8c1a0f000000
-       //TODO: VPERMT2PS -7(CX)(DX*2), Z2, K2, Z9                 // 62726d4a7f8c51f9ffffff
-       //TODO: VPERMT2PS Z27, Z7, K2, Z9                          // 6212454a7fcb
-       //TODO: VPERMT2PS Z25, Z7, K2, Z9                          // 6212454a7fc9
-       //TODO: VPERMT2PS 15(DX)(BX*1), Z7, K2, Z9                 // 6272454a7f8c1a0f000000
-       //TODO: VPERMT2PS -7(CX)(DX*2), Z7, K2, Z9                 // 6272454a7f8c51f9ffffff
-       //TODO: VPERMT2Q X2, X13, K2, X19                          // 62e2950a7eda
-       //TODO: VPERMT2Q -17(BP)(SI*2), X13, K2, X19               // 62e2950a7e9c75efffffff
-       //TODO: VPERMT2Q 7(AX)(CX*2), X13, K2, X19                 // 62e2950a7e9c4807000000
-       //TODO: VPERMT2Q Y2, Y25, K3, Y31                          // 6262b5237efa
-       //TODO: VPERMT2Q -17(BP)(SI*8), Y25, K3, Y31               // 6262b5237ebcf5efffffff
-       //TODO: VPERMT2Q (R15), Y25, K3, Y31                       // 6242b5237e3f
-       //TODO: VPERMT2Q Z3, Z27, K3, Z23                          // 62e2a5437efb
-       //TODO: VPERMT2Q Z0, Z27, K3, Z23                          // 62e2a5437ef8
-       //TODO: VPERMT2Q -17(BP), Z27, K3, Z23                     // 62e2a5437ebdefffffff
-       //TODO: VPERMT2Q -15(R14)(R15*8), Z27, K3, Z23             // 6282a5437ebcfef1ffffff
-       //TODO: VPERMT2Q Z3, Z14, K3, Z23                          // 62e28d4b7efb
-       //TODO: VPERMT2Q Z0, Z14, K3, Z23                          // 62e28d4b7ef8
-       //TODO: VPERMT2Q -17(BP), Z14, K3, Z23                     // 62e28d4b7ebdefffffff
-       //TODO: VPERMT2Q -15(R14)(R15*8), Z14, K3, Z23             // 62828d4b7ebcfef1ffffff
-       //TODO: VPERMT2Q Z3, Z27, K3, Z9                           // 6272a5437ecb
-       //TODO: VPERMT2Q Z0, Z27, K3, Z9                           // 6272a5437ec8
-       //TODO: VPERMT2Q -17(BP), Z27, K3, Z9                      // 6272a5437e8defffffff
-       //TODO: VPERMT2Q -15(R14)(R15*8), Z27, K3, Z9              // 6212a5437e8cfef1ffffff
-       //TODO: VPERMT2Q Z3, Z14, K3, Z9                           // 62728d4b7ecb
-       //TODO: VPERMT2Q Z0, Z14, K3, Z9                           // 62728d4b7ec8
-       //TODO: VPERMT2Q -17(BP), Z14, K3, Z9                      // 62728d4b7e8defffffff
-       //TODO: VPERMT2Q -15(R14)(R15*8), Z14, K3, Z9              // 62128d4b7e8cfef1ffffff
-       //TODO: VPEXPANDD X2, K7, X9                               // 62727d0f89ca
-       //TODO: VPEXPANDD (CX), K7, X9                             // 62727d0f8909
-       //TODO: VPEXPANDD 99(R15), K7, X9                          // 62527d0f898f63000000
-       //TODO: VPEXPANDD Y1, K2, Y6                               // 62f27d2a89f1
-       //TODO: VPEXPANDD -7(CX), K2, Y6                           // 62f27d2a89b1f9ffffff
-       //TODO: VPEXPANDD 15(DX)(BX*4), K2, Y6                     // 62f27d2a89b49a0f000000
-       //TODO: VPEXPANDD Z13, K4, Z11                             // 62527d4c89dd
-       //TODO: VPEXPANDD Z14, K4, Z11                             // 62527d4c89de
-       //TODO: VPEXPANDD -15(R14)(R15*1), K4, Z11                 // 62127d4c899c3ef1ffffff
-       //TODO: VPEXPANDD -15(BX), K4, Z11                         // 62727d4c899bf1ffffff
-       //TODO: VPEXPANDD Z13, K4, Z5                              // 62d27d4c89ed
-       //TODO: VPEXPANDD Z14, K4, Z5                              // 62d27d4c89ee
-       //TODO: VPEXPANDD -15(R14)(R15*1), K4, Z5                  // 62927d4c89ac3ef1ffffff
-       //TODO: VPEXPANDD -15(BX), K4, Z5                          // 62f27d4c89abf1ffffff
-       //TODO: VPEXPANDQ X2, K1, X24                              // 6262fd0989c2
-       //TODO: VPEXPANDQ 99(R15)(R15*2), K1, X24                  // 6202fd0989847f63000000
-       //TODO: VPEXPANDQ -7(DI), K1, X24                          // 6262fd098987f9ffffff
-       //TODO: VPEXPANDQ Y0, K3, Y9                               // 6272fd2b89c8
-       //TODO: VPEXPANDQ 99(R15)(R15*8), K3, Y9                   // 6212fd2b898cff63000000
-       //TODO: VPEXPANDQ 7(AX)(CX*8), K3, Y9                      // 6272fd2b898cc807000000
-       //TODO: VPEXPANDQ Z2, K4, Z5                               // 62f2fd4c89ea
-       //TODO: VPEXPANDQ 7(AX)(CX*4), K4, Z5                      // 62f2fd4c89ac8807000000
-       //TODO: VPEXPANDQ 7(AX)(CX*1), K4, Z5                      // 62f2fd4c89ac0807000000
-       //TODO: VPEXPANDQ Z2, K4, Z23                              // 62e2fd4c89fa
-       //TODO: VPEXPANDQ 7(AX)(CX*4), K4, Z23                     // 62e2fd4c89bc8807000000
-       //TODO: VPEXPANDQ 7(AX)(CX*1), K4, Z23                     // 62e2fd4c89bc0807000000
-       //TODO: VPGATHERDD (DX)(X10*4), K6, X3                     // 62b27d0e901c92
-       //TODO: VPGATHERDD (SP)(X4*2), K6, X3                      // 62f27d0e901c64
-       //TODO: VPGATHERDD (R14)(X29*8), K6, X3                    // 62927d06901cee
-       //TODO: VPGATHERDD (R10)(Y29*8), K3, Y22                   // 62827d239034ea
-       //TODO: VPGATHERDD (SP)(Y4*2), K3, Y22                     // 62e27d2b903464
-       //TODO: VPGATHERDD (DX)(Y10*4), K3, Y22                    // 62a27d2b903492
-       //TODO: VPGATHERDD (BP)(Z10*2), K7, Z28                    // 62227d4f90645500
-       //TODO: VPGATHERDD (R10)(Z29*8), K7, Z28                   // 62027d479024ea
-       //TODO: VPGATHERDD (R14)(Z29*8), K7, Z28                   // 62027d479024ee
-       //TODO: VPGATHERDD (BP)(Z10*2), K7, Z6                     // 62b27d4f90745500
-       //TODO: VPGATHERDD (R10)(Z29*8), K7, Z6                    // 62927d479034ea
-       //TODO: VPGATHERDD (R14)(Z29*8), K7, Z6                    // 62927d479034ee
-       //TODO: VPGATHERDQ (AX)(X4*1), K4, X11                     // 6272fd0c901c20
-       //TODO: VPGATHERDQ (BP)(X10*2), K4, X11                    // 6232fd0c905c5500
-       //TODO: VPGATHERDQ (R10)(X29*8), K4, X11                   // 6212fd04901cea
-       //TODO: VPGATHERDQ (DX)(X10*4), K4, Y9                     // 6232fd2c900c92
-       //TODO: VPGATHERDQ (SP)(X4*2), K4, Y9                      // 6272fd2c900c64
-       //TODO: VPGATHERDQ (R14)(X29*8), K4, Y9                    // 6212fd24900cee
-       //TODO: VPGATHERDQ (R14)(Y29*8), K7, Z13                   // 6212fd47902cee
-       //TODO: VPGATHERDQ (AX)(Y4*1), K7, Z13                     // 6272fd4f902c20
-       //TODO: VPGATHERDQ (BP)(Y10*2), K7, Z13                    // 6232fd4f906c5500
-       //TODO: VPGATHERDQ (R14)(Y29*8), K7, Z21                   // 6282fd47902cee
-       //TODO: VPGATHERDQ (AX)(Y4*1), K7, Z21                     // 62e2fd4f902c20
-       //TODO: VPGATHERDQ (BP)(Y10*2), K7, Z21                    // 62a2fd4f906c5500
-       //TODO: VPGATHERQD (AX)(X4*1), K2, X15                     // 62727d0a913c20
-       //TODO: VPGATHERQD (BP)(X10*2), K2, X15                    // 62327d0a917c5500
-       //TODO: VPGATHERQD (R10)(X29*8), K2, X15                   // 62127d02913cea
-       //TODO: VPGATHERQD (R10)(Y29*8), K5, X30                   // 62027d259134ea
-       //TODO: VPGATHERQD (SP)(Y4*2), K5, X30                     // 62627d2d913464
-       //TODO: VPGATHERQD (DX)(Y10*4), K5, X30                    // 62227d2d913492
-       //TODO: VPGATHERQD (DX)(Z10*4), K3, Y23                    // 62a27d4b913c92
-       //TODO: VPGATHERQD (AX)(Z4*1), K3, Y23                     // 62e27d4b913c20
-       //TODO: VPGATHERQD (SP)(Z4*2), K3, Y23                     // 62e27d4b913c64
-       //TODO: VPGATHERQQ (DX)(X10*4), K4, X13                    // 6232fd0c912c92
-       //TODO: VPGATHERQQ (SP)(X4*2), K4, X13                     // 6272fd0c912c64
-       //TODO: VPGATHERQQ (R14)(X29*8), K4, X13                   // 6212fd04912cee
-       //TODO: VPGATHERQQ (R14)(Y29*8), K2, Y31                   // 6202fd22913cee
-       //TODO: VPGATHERQQ (AX)(Y4*1), K2, Y31                     // 6262fd2a913c20
-       //TODO: VPGATHERQQ (BP)(Y10*2), K2, Y31                    // 6222fd2a917c5500
-       //TODO: VPGATHERQQ (BP)(Z10*2), K2, Z26                    // 6222fd4a91545500
-       //TODO: VPGATHERQQ (R10)(Z29*8), K2, Z26                   // 6202fd429114ea
-       //TODO: VPGATHERQQ (R14)(Z29*8), K2, Z26                   // 6202fd429114ee
-       //TODO: VPGATHERQQ (BP)(Z10*2), K2, Z3                     // 62b2fd4a915c5500
-       //TODO: VPGATHERQQ (R10)(Z29*8), K2, Z3                    // 6292fd42911cea
-       //TODO: VPGATHERQQ (R14)(Z29*8), K2, Z3                    // 6292fd42911cee
-       //TODO: VPMAXSD X1, X31, K3, X16                           // 62e205033dc1
-       //TODO: VPMAXSD (SI), X31, K3, X16                         // 62e205033d06
-       //TODO: VPMAXSD 7(SI)(DI*2), X31, K3, X16                  // 62e205033d847e07000000
-       //TODO: VPMAXSD Y24, Y18, K7, Y20                          // 62826d273de0
-       //TODO: VPMAXSD 99(R15)(R15*4), Y18, K7, Y20               // 62826d273da4bf63000000
-       //TODO: VPMAXSD 15(DX), Y18, K7, Y20                       // 62e26d273da20f000000
-       //TODO: VPMAXSD Z0, Z7, K4, Z3                             // 62f2454c3dd8
-       //TODO: VPMAXSD Z6, Z7, K4, Z3                             // 62f2454c3dde
-       //TODO: VPMAXSD 7(SI)(DI*1), Z7, K4, Z3                    // 62f2454c3d9c3e07000000
-       //TODO: VPMAXSD 15(DX)(BX*8), Z7, K4, Z3                   // 62f2454c3d9cda0f000000
-       //TODO: VPMAXSD Z0, Z9, K4, Z3                             // 62f2354c3dd8
-       //TODO: VPMAXSD Z6, Z9, K4, Z3                             // 62f2354c3dde
-       //TODO: VPMAXSD 7(SI)(DI*1), Z9, K4, Z3                    // 62f2354c3d9c3e07000000
-       //TODO: VPMAXSD 15(DX)(BX*8), Z9, K4, Z3                   // 62f2354c3d9cda0f000000
-       //TODO: VPMAXSD Z0, Z7, K4, Z27                            // 6262454c3dd8
-       //TODO: VPMAXSD Z6, Z7, K4, Z27                            // 6262454c3dde
-       //TODO: VPMAXSD 7(SI)(DI*1), Z7, K4, Z27                   // 6262454c3d9c3e07000000
-       //TODO: VPMAXSD 15(DX)(BX*8), Z7, K4, Z27                  // 6262454c3d9cda0f000000
-       //TODO: VPMAXSD Z0, Z9, K4, Z27                            // 6262354c3dd8
-       //TODO: VPMAXSD Z6, Z9, K4, Z27                            // 6262354c3dde
-       //TODO: VPMAXSD 7(SI)(DI*1), Z9, K4, Z27                   // 6262354c3d9c3e07000000
-       //TODO: VPMAXSD 15(DX)(BX*8), Z9, K4, Z27                  // 6262354c3d9cda0f000000
-       //TODO: VPMAXSQ X15, X9, K4, X7                            // 62d2b50c3dff
-       //TODO: VPMAXSQ 17(SP)(BP*8), X9, K4, X7                   // 62f2b50c3dbcec11000000
-       //TODO: VPMAXSQ 17(SP)(BP*4), X9, K4, X7                   // 62f2b50c3dbcac11000000
-       //TODO: VPMAXSQ Y19, Y3, K7, Y9                            // 6232e52f3dcb
-       //TODO: VPMAXSQ (CX), Y3, K7, Y9                           // 6272e52f3d09
-       //TODO: VPMAXSQ 99(R15), Y3, K7, Y9                        // 6252e52f3d8f63000000
-       //TODO: VPMAXSQ Z9, Z3, K2, Z20                            // 62c2e54a3de1
-       //TODO: VPMAXSQ Z19, Z3, K2, Z20                           // 62a2e54a3de3
-       //TODO: VPMAXSQ -7(DI)(R8*1), Z3, K2, Z20                  // 62a2e54a3da407f9ffffff
-       //TODO: VPMAXSQ (SP), Z3, K2, Z20                          // 62e2e54a3d2424
-       //TODO: VPMAXSQ Z9, Z30, K2, Z20                           // 62c28d423de1
-       //TODO: VPMAXSQ Z19, Z30, K2, Z20                          // 62a28d423de3
-       //TODO: VPMAXSQ -7(DI)(R8*1), Z30, K2, Z20                 // 62a28d423da407f9ffffff
-       //TODO: VPMAXSQ (SP), Z30, K2, Z20                         // 62e28d423d2424
-       //TODO: VPMAXSQ Z9, Z3, K2, Z28                            // 6242e54a3de1
-       //TODO: VPMAXSQ Z19, Z3, K2, Z28                           // 6222e54a3de3
-       //TODO: VPMAXSQ -7(DI)(R8*1), Z3, K2, Z28                  // 6222e54a3da407f9ffffff
-       //TODO: VPMAXSQ (SP), Z3, K2, Z28                          // 6262e54a3d2424
-       //TODO: VPMAXSQ Z9, Z30, K2, Z28                           // 62428d423de1
-       //TODO: VPMAXSQ Z19, Z30, K2, Z28                          // 62228d423de3
-       //TODO: VPMAXSQ -7(DI)(R8*1), Z30, K2, Z28                 // 62228d423da407f9ffffff
-       //TODO: VPMAXSQ (SP), Z30, K2, Z28                         // 62628d423d2424
-       //TODO: VPMAXUD X3, X8, K3, X15                            // 62723d0b3ffb
-       //TODO: VPMAXUD 7(AX), X8, K3, X15                         // 62723d0b3fb807000000
-       //TODO: VPMAXUD (DI), X8, K3, X15                          // 62723d0b3f3f
-       //TODO: VPMAXUD Y20, Y21, K3, Y2                           // 62b255233fd4
-       //TODO: VPMAXUD 15(DX)(BX*1), Y21, K3, Y2                  // 62f255233f941a0f000000
-       //TODO: VPMAXUD -7(CX)(DX*2), Y21, K3, Y2                  // 62f255233f9451f9ffffff
-       //TODO: VPMAXUD Z13, Z1, K2, Z6                            // 62d2754a3ff5
-       //TODO: VPMAXUD (AX), Z1, K2, Z6                           // 62f2754a3f30
-       //TODO: VPMAXUD 7(SI), Z1, K2, Z6                          // 62f2754a3fb607000000
-       //TODO: VPMAXUD Z13, Z15, K2, Z6                           // 62d2054a3ff5
-       //TODO: VPMAXUD (AX), Z15, K2, Z6                          // 62f2054a3f30
-       //TODO: VPMAXUD 7(SI), Z15, K2, Z6                         // 62f2054a3fb607000000
-       //TODO: VPMAXUD Z13, Z1, K2, Z22                           // 62c2754a3ff5
-       //TODO: VPMAXUD (AX), Z1, K2, Z22                          // 62e2754a3f30
-       //TODO: VPMAXUD 7(SI), Z1, K2, Z22                         // 62e2754a3fb607000000
-       //TODO: VPMAXUD Z13, Z15, K2, Z22                          // 62c2054a3ff5
-       //TODO: VPMAXUD (AX), Z15, K2, Z22                         // 62e2054a3f30
-       //TODO: VPMAXUD 7(SI), Z15, K2, Z22                        // 62e2054a3fb607000000
-       //TODO: VPMAXUQ X13, X23, K1, X26                          // 6242c5013fd5
-       //TODO: VPMAXUQ 99(R15)(R15*1), X23, K1, X26               // 6202c5013f943f63000000
-       //TODO: VPMAXUQ (DX), X23, K1, X26                         // 6262c5013f12
-       //TODO: VPMAXUQ Y6, Y31, K2, Y6                            // 62f285223ff6
-       //TODO: VPMAXUQ -17(BP), Y31, K2, Y6                       // 62f285223fb5efffffff
-       //TODO: VPMAXUQ -15(R14)(R15*8), Y31, K2, Y6               // 629285223fb4fef1ffffff
-       //TODO: VPMAXUQ Z2, Z22, K1, Z18                           // 62e2cd413fd2
-       //TODO: VPMAXUQ Z31, Z22, K1, Z18                          // 6282cd413fd7
-       //TODO: VPMAXUQ (BX), Z22, K1, Z18                         // 62e2cd413f13
-       //TODO: VPMAXUQ -17(BP)(SI*1), Z22, K1, Z18                // 62e2cd413f9435efffffff
-       //TODO: VPMAXUQ Z2, Z7, K1, Z18                            // 62e2c5493fd2
-       //TODO: VPMAXUQ Z31, Z7, K1, Z18                           // 6282c5493fd7
-       //TODO: VPMAXUQ (BX), Z7, K1, Z18                          // 62e2c5493f13
-       //TODO: VPMAXUQ -17(BP)(SI*1), Z7, K1, Z18                 // 62e2c5493f9435efffffff
-       //TODO: VPMAXUQ Z2, Z22, K1, Z8                            // 6272cd413fc2
-       //TODO: VPMAXUQ Z31, Z22, K1, Z8                           // 6212cd413fc7
-       //TODO: VPMAXUQ (BX), Z22, K1, Z8                          // 6272cd413f03
-       //TODO: VPMAXUQ -17(BP)(SI*1), Z22, K1, Z8                 // 6272cd413f8435efffffff
-       //TODO: VPMAXUQ Z2, Z7, K1, Z8                             // 6272c5493fc2
-       //TODO: VPMAXUQ Z31, Z7, K1, Z8                            // 6212c5493fc7
-       //TODO: VPMAXUQ (BX), Z7, K1, Z8                           // 6272c5493f03
-       //TODO: VPMAXUQ -17(BP)(SI*1), Z7, K1, Z8                  // 6272c5493f8435efffffff
-       //TODO: VPMINSD X11, X1, K4, X21                           // 62c2750c39eb
-       //TODO: VPMINSD 7(SI)(DI*1), X1, K4, X21                   // 62e2750c39ac3e07000000
-       //TODO: VPMINSD 15(DX)(BX*8), X1, K4, X21                  // 62e2750c39acda0f000000
-       //TODO: VPMINSD Y12, Y20, K1, Y5                           // 62d25d2139ec
-       //TODO: VPMINSD 15(R8)(R14*8), Y20, K1, Y5                 // 62925d2139acf00f000000
-       //TODO: VPMINSD -15(R14)(R15*2), Y20, K1, Y5               // 62925d2139ac7ef1ffffff
-       //TODO: VPMINSD Z5, Z19, K3, Z15                           // 6272654339fd
-       //TODO: VPMINSD Z1, Z19, K3, Z15                           // 6272654339f9
-       //TODO: VPMINSD 17(SP)(BP*1), Z19, K3, Z15                 // 6272654339bc2c11000000
-       //TODO: VPMINSD -7(CX)(DX*8), Z19, K3, Z15                 // 6272654339bcd1f9ffffff
-       //TODO: VPMINSD Z5, Z15, K3, Z15                           // 6272054b39fd
-       //TODO: VPMINSD Z1, Z15, K3, Z15                           // 6272054b39f9
-       //TODO: VPMINSD 17(SP)(BP*1), Z15, K3, Z15                 // 6272054b39bc2c11000000
-       //TODO: VPMINSD -7(CX)(DX*8), Z15, K3, Z15                 // 6272054b39bcd1f9ffffff
-       //TODO: VPMINSD Z5, Z19, K3, Z30                           // 6262654339f5
-       //TODO: VPMINSD Z1, Z19, K3, Z30                           // 6262654339f1
-       //TODO: VPMINSD 17(SP)(BP*1), Z19, K3, Z30                 // 6262654339b42c11000000
-       //TODO: VPMINSD -7(CX)(DX*8), Z19, K3, Z30                 // 6262654339b4d1f9ffffff
-       //TODO: VPMINSD Z5, Z15, K3, Z30                           // 6262054b39f5
-       //TODO: VPMINSD Z1, Z15, K3, Z30                           // 6262054b39f1
-       //TODO: VPMINSD 17(SP)(BP*1), Z15, K3, Z30                 // 6262054b39b42c11000000
-       //TODO: VPMINSD -7(CX)(DX*8), Z15, K3, Z30                 // 6262054b39b4d1f9ffffff
-       //TODO: VPMINSQ X7, X3, K4, X31                            // 6262e50c39ff
-       //TODO: VPMINSQ -7(DI)(R8*1), X3, K4, X31                  // 6222e50c39bc07f9ffffff
-       //TODO: VPMINSQ (SP), X3, K4, X31                          // 6262e50c393c24
-       //TODO: VPMINSQ Y28, Y5, K5, Y3                            // 6292d52d39dc
-       //TODO: VPMINSQ -15(R14)(R15*1), Y5, K5, Y3                // 6292d52d399c3ef1ffffff
-       //TODO: VPMINSQ -15(BX), Y5, K5, Y3                        // 62f2d52d399bf1ffffff
-       //TODO: VPMINSQ Z21, Z14, K7, Z3                           // 62b28d4f39dd
-       //TODO: VPMINSQ Z8, Z14, K7, Z3                            // 62d28d4f39d8
-       //TODO: VPMINSQ -17(BP)(SI*2), Z14, K7, Z3                 // 62f28d4f399c75efffffff
-       //TODO: VPMINSQ 7(AX)(CX*2), Z14, K7, Z3                   // 62f28d4f399c4807000000
-       //TODO: VPMINSQ Z21, Z15, K7, Z3                           // 62b2854f39dd
-       //TODO: VPMINSQ Z8, Z15, K7, Z3                            // 62d2854f39d8
-       //TODO: VPMINSQ -17(BP)(SI*2), Z15, K7, Z3                 // 62f2854f399c75efffffff
-       //TODO: VPMINSQ 7(AX)(CX*2), Z15, K7, Z3                   // 62f2854f399c4807000000
-       //TODO: VPMINSQ Z21, Z14, K7, Z5                           // 62b28d4f39ed
-       //TODO: VPMINSQ Z8, Z14, K7, Z5                            // 62d28d4f39e8
-       //TODO: VPMINSQ -17(BP)(SI*2), Z14, K7, Z5                 // 62f28d4f39ac75efffffff
-       //TODO: VPMINSQ 7(AX)(CX*2), Z14, K7, Z5                   // 62f28d4f39ac4807000000
-       //TODO: VPMINSQ Z21, Z15, K7, Z5                           // 62b2854f39ed
-       //TODO: VPMINSQ Z8, Z15, K7, Z5                            // 62d2854f39e8
-       //TODO: VPMINSQ -17(BP)(SI*2), Z15, K7, Z5                 // 62f2854f39ac75efffffff
-       //TODO: VPMINSQ 7(AX)(CX*2), Z15, K7, Z5                   // 62f2854f39ac4807000000
-       //TODO: VPMINUD X5, X14, K7, X7                            // 62f20d0f3bfd
-       //TODO: VPMINUD (AX), X14, K7, X7                          // 62f20d0f3b38
-       //TODO: VPMINUD 7(SI), X14, K7, X7                         // 62f20d0f3bbe07000000
-       //TODO: VPMINUD Y7, Y17, K2, Y14                           // 627275223bf7
-       //TODO: VPMINUD 17(SP)(BP*8), Y17, K2, Y14                 // 627275223bb4ec11000000
-       //TODO: VPMINUD 17(SP)(BP*4), Y17, K2, Y14                 // 627275223bb4ac11000000
-       //TODO: VPMINUD Z9, Z9, K5, Z0                             // 62d2354d3bc1
-       //TODO: VPMINUD Z25, Z9, K5, Z0                            // 6292354d3bc1
-       //TODO: VPMINUD 99(R15)(R15*4), Z9, K5, Z0                 // 6292354d3b84bf63000000
-       //TODO: VPMINUD 15(DX), Z9, K5, Z0                         // 62f2354d3b820f000000
-       //TODO: VPMINUD Z9, Z3, K5, Z0                             // 62d2654d3bc1
-       //TODO: VPMINUD Z25, Z3, K5, Z0                            // 6292654d3bc1
-       //TODO: VPMINUD 99(R15)(R15*4), Z3, K5, Z0                 // 6292654d3b84bf63000000
-       //TODO: VPMINUD 15(DX), Z3, K5, Z0                         // 62f2654d3b820f000000
-       //TODO: VPMINUD Z9, Z9, K5, Z26                            // 6242354d3bd1
-       //TODO: VPMINUD Z25, Z9, K5, Z26                           // 6202354d3bd1
-       //TODO: VPMINUD 99(R15)(R15*4), Z9, K5, Z26                // 6202354d3b94bf63000000
-       //TODO: VPMINUD 15(DX), Z9, K5, Z26                        // 6262354d3b920f000000
-       //TODO: VPMINUD Z9, Z3, K5, Z26                            // 6242654d3bd1
-       //TODO: VPMINUD Z25, Z3, K5, Z26                           // 6202654d3bd1
-       //TODO: VPMINUD 99(R15)(R15*4), Z3, K5, Z26                // 6202654d3b94bf63000000
-       //TODO: VPMINUD 15(DX), Z3, K5, Z26                        // 6262654d3b920f000000
-       //TODO: VPMINUQ X21, X3, K3, X31                           // 6222e50b3bfd
-       //TODO: VPMINUQ (BX), X3, K3, X31                          // 6262e50b3b3b
-       //TODO: VPMINUQ -17(BP)(SI*1), X3, K3, X31                 // 6262e50b3bbc35efffffff
-       //TODO: VPMINUQ Y8, Y31, K4, Y9                            // 625285243bc8
-       //TODO: VPMINUQ 7(SI)(DI*4), Y31, K4, Y9                   // 627285243b8cbe07000000
-       //TODO: VPMINUQ -7(DI)(R8*2), Y31, K4, Y9                  // 623285243b8c47f9ffffff
-       //TODO: VPMINUQ Z17, Z20, K2, Z9                           // 6232dd423bc9
-       //TODO: VPMINUQ Z0, Z20, K2, Z9                            // 6272dd423bc8
-       //TODO: VPMINUQ (CX), Z20, K2, Z9                          // 6272dd423b09
-       //TODO: VPMINUQ 99(R15), Z20, K2, Z9                       // 6252dd423b8f63000000
-       //TODO: VPMINUQ Z17, Z0, K2, Z9                            // 6232fd4a3bc9
-       //TODO: VPMINUQ Z0, Z0, K2, Z9                             // 6272fd4a3bc8
-       //TODO: VPMINUQ (CX), Z0, K2, Z9                           // 6272fd4a3b09
-       //TODO: VPMINUQ 99(R15), Z0, K2, Z9                        // 6252fd4a3b8f63000000
-       //TODO: VPMINUQ Z17, Z20, K2, Z28                          // 6222dd423be1
-       //TODO: VPMINUQ Z0, Z20, K2, Z28                           // 6262dd423be0
-       //TODO: VPMINUQ (CX), Z20, K2, Z28                         // 6262dd423b21
-       //TODO: VPMINUQ 99(R15), Z20, K2, Z28                      // 6242dd423ba763000000
-       //TODO: VPMINUQ Z17, Z0, K2, Z28                           // 6222fd4a3be1
-       //TODO: VPMINUQ Z0, Z0, K2, Z28                            // 6262fd4a3be0
-       //TODO: VPMINUQ (CX), Z0, K2, Z28                          // 6262fd4a3b21
-       //TODO: VPMINUQ 99(R15), Z0, K2, Z28                       // 6242fd4a3ba763000000
-       //TODO: VPMOVDB X14, K3, X16                               // 62327e0b31f0
-       //TODO: VPMOVDB X14, K3, 15(DX)(BX*1)                      // 62727e0b31b41a0f000000
-       //TODO: VPMOVDB X14, K3, -7(CX)(DX*2)                      // 62727e0b31b451f9ffffff
-       //TODO: VPMOVDB Y21, K2, X11                               // 62c27e2a31eb
-       //TODO: VPMOVDB Y21, K2, (SI)                              // 62e27e2a312e
-       //TODO: VPMOVDB Y21, K2, 7(SI)(DI*2)                       // 62e27e2a31ac7e07000000
-       //TODO: VPMOVDB Z20, K1, X14                               // 62c27e4931e6
-       //TODO: VPMOVDB Z9, K1, X14                                // 62527e4931ce
-       //TODO: VPMOVDB Z20, K1, (R8)                              // 62c27e493120
-       //TODO: VPMOVDB Z9, K1, (R8)                               // 62527e493108
-       //TODO: VPMOVDB Z20, K1, 15(DX)(BX*2)                      // 62e27e4931a45a0f000000
-       //TODO: VPMOVDB Z9, K1, 15(DX)(BX*2)                       // 62727e49318c5a0f000000
-       //TODO: VPMOVDW X8, K2, X19                                // 62327e0a33c3
-       //TODO: VPMOVDW X8, K2, 17(SP)(BP*8)                       // 62727e0a3384ec11000000
-       //TODO: VPMOVDW X8, K2, 17(SP)(BP*4)                       // 62727e0a3384ac11000000
-       //TODO: VPMOVDW Y12, K1, X8                                // 62527e2933e0
-       //TODO: VPMOVDW Y12, K1, 17(SP)(BP*1)                      // 62727e2933a42c11000000
-       //TODO: VPMOVDW Y12, K1, -7(CX)(DX*8)                      // 62727e2933a4d1f9ffffff
-       //TODO: VPMOVDW Z30, K7, Y9                                // 62427e4f33f1
-       //TODO: VPMOVDW Z5, K7, Y9                                 // 62d27e4f33e9
-       //TODO: VPMOVDW Z30, K7, 7(AX)                             // 62627e4f33b007000000
-       //TODO: VPMOVDW Z5, K7, 7(AX)                              // 62f27e4f33a807000000
-       //TODO: VPMOVDW Z30, K7, (DI)                              // 62627e4f3337
-       //TODO: VPMOVDW Z5, K7, (DI)                               // 62f27e4f332f
-       //TODO: VPMOVQB X11, K1, X23                               // 62327e0932df
-       //TODO: VPMOVQB X11, K1, -7(DI)(R8*1)                      // 62327e09329c07f9ffffff
-       //TODO: VPMOVQB X11, K1, (SP)                              // 62727e09321c24
-       //TODO: VPMOVQB Y12, K1, X31                               // 62127e2932e7
-       //TODO: VPMOVQB Y12, K1, -17(BP)                           // 62727e2932a5efffffff
-       //TODO: VPMOVQB Y12, K1, -15(R14)(R15*8)                   // 62127e2932a4fef1ffffff
-       //TODO: VPMOVQB Z21, K1, X24                               // 62827e4932e8
-       //TODO: VPMOVQB Z9, K1, X24                                // 62127e4932c8
-       //TODO: VPMOVQB Z21, K1, 7(SI)(DI*4)                       // 62e27e4932acbe07000000
-       //TODO: VPMOVQB Z9, K1, 7(SI)(DI*4)                        // 62727e49328cbe07000000
-       //TODO: VPMOVQB Z21, K1, -7(DI)(R8*2)                      // 62a27e4932ac47f9ffffff
-       //TODO: VPMOVQB Z9, K1, -7(DI)(R8*2)                       // 62327e49328c47f9ffffff
-       //TODO: VPMOVQD X0, K7, X14                                // 62d27e0f35c6
-       //TODO: VPMOVQD X0, K7, 17(SP)                             // 62f27e0f35842411000000
-       //TODO: VPMOVQD X0, K7, -17(BP)(SI*4)                      // 62f27e0f3584b5efffffff
-       //TODO: VPMOVQD Y21, K2, X11                               // 62c27e2a35eb
-       //TODO: VPMOVQD Y21, K2, -17(BP)(SI*2)                     // 62e27e2a35ac75efffffff
-       //TODO: VPMOVQD Y21, K2, 7(AX)(CX*2)                       // 62e27e2a35ac4807000000
-       //TODO: VPMOVQD Z2, K4, Y14                                // 62d27e4c35d6
-       //TODO: VPMOVQD Z7, K4, Y14                                // 62d27e4c35fe
-       //TODO: VPMOVQD Z2, K4, 99(R15)(R15*1)                     // 62927e4c35943f63000000
-       //TODO: VPMOVQD Z7, K4, 99(R15)(R15*1)                     // 62927e4c35bc3f63000000
-       //TODO: VPMOVQD Z2, K4, (DX)                               // 62f27e4c3512
-       //TODO: VPMOVQD Z7, K4, (DX)                               // 62f27e4c353a
-       //TODO: VPMOVQW X2, K1, X23                                // 62b27e0934d7
-       //TODO: VPMOVQW X2, K1, 17(SP)(BP*2)                       // 62f27e0934946c11000000
-       //TODO: VPMOVQW X2, K1, -7(DI)(R8*4)                       // 62b27e09349487f9ffffff
-       //TODO: VPMOVQW Y30, K3, X20                               // 62227e2b34f4
-       //TODO: VPMOVQW Y30, K3, 7(AX)                             // 62627e2b34b007000000
-       //TODO: VPMOVQW Y30, K3, (DI)                              // 62627e2b3437
-       //TODO: VPMOVQW Z27, K4, X5                                // 62627e4c34dd
-       //TODO: VPMOVQW Z25, K4, X5                                // 62627e4c34cd
-       //TODO: VPMOVQW Z27, K4, 15(R8)(R14*1)                     // 62027e4c349c300f000000
-       //TODO: VPMOVQW Z25, K4, 15(R8)(R14*1)                     // 62027e4c348c300f000000
-       //TODO: VPMOVQW Z27, K4, 15(R8)(R14*2)                     // 62027e4c349c700f000000
-       //TODO: VPMOVQW Z25, K4, 15(R8)(R14*2)                     // 62027e4c348c700f000000
-       //TODO: VPMOVSDB X0, K5, X25                               // 62927e0d21c1
-       //TODO: VPMOVSDB X0, K5, 15(R8)                            // 62d27e0d21800f000000
-       //TODO: VPMOVSDB X0, K5, (BP)                              // 62f27e0d214500
-       //TODO: VPMOVSDB Y26, K7, X9                               // 62427e2f21d1
-       //TODO: VPMOVSDB Y26, K7, 99(R15)(R15*1)                   // 62027e2f21943f63000000
-       //TODO: VPMOVSDB Y26, K7, (DX)                             // 62627e2f2112
-       //TODO: VPMOVSDB Z23, K7, X13                              // 62c27e4f21fd
-       //TODO: VPMOVSDB Z9, K7, X13                               // 62527e4f21cd
-       //TODO: VPMOVSDB Z23, K7, (R14)                            // 62c27e4f213e
-       //TODO: VPMOVSDB Z9, K7, (R14)                             // 62527e4f210e
-       //TODO: VPMOVSDB Z23, K7, -7(DI)(R8*8)                     // 62a27e4f21bcc7f9ffffff
-       //TODO: VPMOVSDB Z9, K7, -7(DI)(R8*8)                      // 62327e4f218cc7f9ffffff
-       //TODO: VPMOVSDW X8, K6, X2                                // 62727e0e23c2
-       //TODO: VPMOVSDW X8, K6, -17(BP)(SI*8)                     // 62727e0e2384f5efffffff
-       //TODO: VPMOVSDW X8, K6, (R15)                             // 62527e0e2307
-       //TODO: VPMOVSDW Y7, K3, X9                                // 62d27e2b23f9
-       //TODO: VPMOVSDW Y7, K3, 99(R15)(R15*4)                    // 62927e2b23bcbf63000000
-       //TODO: VPMOVSDW Y7, K3, 15(DX)                            // 62f27e2b23ba0f000000
-       //TODO: VPMOVSDW Z27, K7, Y16                              // 62227e4f23d8
-       //TODO: VPMOVSDW Z14, K7, Y16                              // 62327e4f23f0
-       //TODO: VPMOVSDW Z27, K7, -17(BP)(SI*8)                    // 62627e4f239cf5efffffff
-       //TODO: VPMOVSDW Z14, K7, -17(BP)(SI*8)                    // 62727e4f23b4f5efffffff
-       //TODO: VPMOVSDW Z27, K7, (R15)                            // 62427e4f231f
-       //TODO: VPMOVSDW Z14, K7, (R15)                            // 62527e4f2337
-       //TODO: VPMOVSQB X31, K4, X2                               // 62627e0c22fa
-       //TODO: VPMOVSQB X31, K4, -7(CX)                           // 62627e0c22b9f9ffffff
-       //TODO: VPMOVSQB X31, K4, 15(DX)(BX*4)                     // 62627e0c22bc9a0f000000
-       //TODO: VPMOVSQB Y1, K4, X11                               // 62d27e2c22cb
-       //TODO: VPMOVSQB Y1, K4, 15(R8)(R14*8)                     // 62927e2c228cf00f000000
-       //TODO: VPMOVSQB Y1, K4, -15(R14)(R15*2)                   // 62927e2c228c7ef1ffffff
-       //TODO: VPMOVSQB Z3, K7, X22                               // 62b27e4f22de
-       //TODO: VPMOVSQB Z0, K7, X22                               // 62b27e4f22c6
-       //TODO: VPMOVSQB Z3, K7, 7(SI)(DI*8)                       // 62f27e4f229cfe07000000
-       //TODO: VPMOVSQB Z0, K7, 7(SI)(DI*8)                       // 62f27e4f2284fe07000000
-       //TODO: VPMOVSQB Z3, K7, -15(R14)                          // 62d27e4f229ef1ffffff
-       //TODO: VPMOVSQB Z0, K7, -15(R14)                          // 62d27e4f2286f1ffffff
-       //TODO: VPMOVSQD X14, K2, X5                               // 62727e0a25f5
-       //TODO: VPMOVSQD X14, K2, 7(SI)(DI*1)                      // 62727e0a25b43e07000000
-       //TODO: VPMOVSQD X14, K2, 15(DX)(BX*8)                     // 62727e0a25b4da0f000000
-       //TODO: VPMOVSQD Y30, K5, X0                               // 62627e2d25f0
-       //TODO: VPMOVSQD Y30, K5, (CX)                             // 62627e2d2531
-       //TODO: VPMOVSQD Y30, K5, 99(R15)                          // 62427e2d25b763000000
-       //TODO: VPMOVSQD Z14, K3, Y31                              // 62127e4b25f7
-       //TODO: VPMOVSQD Z7, K3, Y31                               // 62927e4b25ff
-       //TODO: VPMOVSQD Z14, K3, 7(SI)(DI*8)                      // 62727e4b25b4fe07000000
-       //TODO: VPMOVSQD Z7, K3, 7(SI)(DI*8)                       // 62f27e4b25bcfe07000000
-       //TODO: VPMOVSQD Z14, K3, -15(R14)                         // 62527e4b25b6f1ffffff
-       //TODO: VPMOVSQD Z7, K3, -15(R14)                          // 62d27e4b25bef1ffffff
-       //TODO: VPMOVSQW X7, K4, X17                               // 62b27e0c24f9
-       //TODO: VPMOVSQW X7, K4, -15(R14)(R15*1)                   // 62927e0c24bc3ef1ffffff
-       //TODO: VPMOVSQW X7, K4, -15(BX)                           // 62f27e0c24bbf1ffffff
-       //TODO: VPMOVSQW Y22, K2, X15                              // 62c27e2a24f7
-       //TODO: VPMOVSQW Y22, K2, -7(DI)(R8*1)                     // 62a27e2a24b407f9ffffff
-       //TODO: VPMOVSQW Y22, K2, (SP)                             // 62e27e2a243424
-       //TODO: VPMOVSQW Z8, K2, X11                               // 62527e4a24c3
-       //TODO: VPMOVSQW Z24, K2, X11                              // 62427e4a24c3
-       //TODO: VPMOVSQW Z8, K2, 99(R15)(R15*2)                    // 62127e4a24847f63000000
-       //TODO: VPMOVSQW Z24, K2, 99(R15)(R15*2)                   // 62027e4a24847f63000000
-       //TODO: VPMOVSQW Z8, K2, -7(DI)                            // 62727e4a2487f9ffffff
-       //TODO: VPMOVSQW Z24, K2, -7(DI)                           // 62627e4a2487f9ffffff
-       //TODO: VPMOVSXBD X27, K2, Z1                              // 62927d4a21cb or 6292fd4a21cb
-       //TODO: VPMOVSXBD 15(DX)(BX*1), K2, Z1                     // 62f27d4a218c1a0f000000 or 62f2fd4a218c1a0f000000
-       //TODO: VPMOVSXBD -7(CX)(DX*2), K2, Z1                     // 62f27d4a218c51f9ffffff or 62f2fd4a218c51f9ffffff
-       //TODO: VPMOVSXBD X27, K2, Z16                             // 62827d4a21c3 or 6282fd4a21c3
-       //TODO: VPMOVSXBD 15(DX)(BX*1), K2, Z16                    // 62e27d4a21841a0f000000 or 62e2fd4a21841a0f000000
-       //TODO: VPMOVSXBD -7(CX)(DX*2), K2, Z16                    // 62e27d4a218451f9ffffff or 62e2fd4a218451f9ffffff
-       //TODO: VPMOVSXBD X3, K1, X25                              // 62627d0921cb or 6262fd0921cb
-       //TODO: VPMOVSXBD 7(AX)(CX*4), K1, X25                     // 62627d09218c8807000000 or 6262fd09218c8807000000
-       //TODO: VPMOVSXBD 7(AX)(CX*1), K1, X25                     // 62627d09218c0807000000 or 6262fd09218c0807000000
-       //TODO: VPMOVSXBD X18, K2, Y7                              // 62b27d2a21fa or 62b2fd2a21fa
-       //TODO: VPMOVSXBD 99(R15)(R15*8), K2, Y7                   // 62927d2a21bcff63000000 or 6292fd2a21bcff63000000
-       //TODO: VPMOVSXBD 7(AX)(CX*8), K2, Y7                      // 62f27d2a21bcc807000000 or 62f2fd2a21bcc807000000
-       //TODO: VPMOVSXBQ X28, K1, X15                             // 62127d0922fc or 6212fd0922fc
-       //TODO: VPMOVSXBQ 99(R15)(R15*8), K1, X15                  // 62127d0922bcff63000000 or 6212fd0922bcff63000000
-       //TODO: VPMOVSXBQ 7(AX)(CX*8), K1, X15                     // 62727d0922bcc807000000 or 6272fd0922bcc807000000
-       //TODO: VPMOVSXBQ X15, K7, Y0                              // 62d27d2f22c7 or 62d2fd2f22c7
-       //TODO: VPMOVSXBQ (SI), K7, Y0                             // 62f27d2f2206 or 62f2fd2f2206
-       //TODO: VPMOVSXBQ 7(SI)(DI*2), K7, Y0                      // 62f27d2f22847e07000000 or 62f2fd2f22847e07000000
-       //TODO: VPMOVSXBQ X7, K1, Z6                               // 62f27d4922f7 or 62f2fd4922f7
-       //TODO: VPMOVSXBQ (AX), K1, Z6                             // 62f27d492230 or 62f2fd492230
-       //TODO: VPMOVSXBQ 7(SI), K1, Z6                            // 62f27d4922b607000000 or 62f2fd4922b607000000
-       //TODO: VPMOVSXBQ X7, K1, Z2                               // 62f27d4922d7 or 62f2fd4922d7
-       //TODO: VPMOVSXBQ (AX), K1, Z2                             // 62f27d492210 or 62f2fd492210
-       //TODO: VPMOVSXBQ 7(SI), K1, Z2                            // 62f27d49229607000000 or 62f2fd49229607000000
-       //TODO: VPMOVSXDQ X7, K2, Y14                              // 62727d2a25f7
-       //TODO: VPMOVSXDQ 17(SP)(BP*2), K2, Y14                    // 62727d2a25b46c11000000
-       //TODO: VPMOVSXDQ -7(DI)(R8*4), K2, Y14                    // 62327d2a25b487f9ffffff
-       //TODO: VPMOVSXDQ X22, K4, X0                              // 62b27d0c25c6
-       //TODO: VPMOVSXDQ 15(R8)(R14*4), K4, X0                    // 62927d0c2584b00f000000
-       //TODO: VPMOVSXDQ -7(CX)(DX*4), K4, X0                     // 62f27d0c258491f9ffffff
-       //TODO: VPMOVSXDQ Y24, K1, Z15                             // 62127d4925f8
-       //TODO: VPMOVSXDQ -7(CX), K1, Z15                          // 62727d4925b9f9ffffff
-       //TODO: VPMOVSXDQ 15(DX)(BX*4), K1, Z15                    // 62727d4925bc9a0f000000
-       //TODO: VPMOVSXDQ Y24, K1, Z12                             // 62127d4925e0
-       //TODO: VPMOVSXDQ -7(CX), K1, Z12                          // 62727d4925a1f9ffffff
-       //TODO: VPMOVSXDQ 15(DX)(BX*4), K1, Z12                    // 62727d4925a49a0f000000
-       //TODO: VPMOVSXWD X1, K3, Y13                              // 62727d2b23e9 or 6272fd2b23e9
-       //TODO: VPMOVSXWD 15(R8), K3, Y13                          // 62527d2b23a80f000000 or 6252fd2b23a80f000000
-       //TODO: VPMOVSXWD (BP), K3, Y13                            // 62727d2b236d00 or 6272fd2b236d00
-       //TODO: VPMOVSXWD X6, K4, X11                              // 62727d0c23de or 6272fd0c23de
-       //TODO: VPMOVSXWD (R8), K4, X11                            // 62527d0c2318 or 6252fd0c2318
-       //TODO: VPMOVSXWD 15(DX)(BX*2), K4, X11                    // 62727d0c239c5a0f000000 or 6272fd0c239c5a0f000000
-       //TODO: VPMOVSXWD Y20, K5, Z14                             // 62327d4d23f4 or 6232fd4d23f4
-       //TODO: VPMOVSXWD 99(R15)(R15*8), K5, Z14                  // 62127d4d23b4ff63000000 or 6212fd4d23b4ff63000000
-       //TODO: VPMOVSXWD 7(AX)(CX*8), K5, Z14                     // 62727d4d23b4c807000000 or 6272fd4d23b4c807000000
-       //TODO: VPMOVSXWD Y20, K5, Z27                             // 62227d4d23dc or 6222fd4d23dc
-       //TODO: VPMOVSXWD 99(R15)(R15*8), K5, Z27                  // 62027d4d239cff63000000 or 6202fd4d239cff63000000
-       //TODO: VPMOVSXWD 7(AX)(CX*8), K5, Z27                     // 62627d4d239cc807000000 or 6262fd4d239cc807000000
-       //TODO: VPMOVSXWQ X7, K7, Z11                              // 62727d4f24df or 6272fd4f24df
-       //TODO: VPMOVSXWQ 15(R8)(R14*8), K7, Z11                   // 62127d4f249cf00f000000 or 6212fd4f249cf00f000000
-       //TODO: VPMOVSXWQ -15(R14)(R15*2), K7, Z11                 // 62127d4f249c7ef1ffffff or 6212fd4f249c7ef1ffffff
-       //TODO: VPMOVSXWQ X7, K7, Z5                               // 62f27d4f24ef or 62f2fd4f24ef
-       //TODO: VPMOVSXWQ 15(R8)(R14*8), K7, Z5                    // 62927d4f24acf00f000000 or 6292fd4f24acf00f000000
-       //TODO: VPMOVSXWQ -15(R14)(R15*2), K7, Z5                  // 62927d4f24ac7ef1ffffff or 6292fd4f24ac7ef1ffffff
-       //TODO: VPMOVSXWQ X31, K7, X8                              // 62127d0f24c7 or 6212fd0f24c7
-       //TODO: VPMOVSXWQ 17(SP)(BP*8), K7, X8                     // 62727d0f2484ec11000000 or 6272fd0f2484ec11000000
-       //TODO: VPMOVSXWQ 17(SP)(BP*4), K7, X8                     // 62727d0f2484ac11000000 or 6272fd0f2484ac11000000
-       //TODO: VPMOVSXWQ X3, K6, Y14                              // 62727d2e24f3 or 6272fd2e24f3
-       //TODO: VPMOVSXWQ 17(SP)(BP*1), K6, Y14                    // 62727d2e24b42c11000000 or 6272fd2e24b42c11000000
-       //TODO: VPMOVSXWQ -7(CX)(DX*8), K6, Y14                    // 62727d2e24b4d1f9ffffff or 6272fd2e24b4d1f9ffffff
-       //TODO: VPMOVUSDB X20, K3, X28                             // 62827e0b11e4
-       //TODO: VPMOVUSDB X20, K3, 7(SI)(DI*4)                     // 62e27e0b11a4be07000000
-       //TODO: VPMOVUSDB X20, K3, -7(DI)(R8*2)                    // 62a27e0b11a447f9ffffff
-       //TODO: VPMOVUSDB Y21, K7, X24                             // 62827e2f11e8
-       //TODO: VPMOVUSDB Y21, K7, -17(BP)(SI*2)                   // 62e27e2f11ac75efffffff
-       //TODO: VPMOVUSDB Y21, K7, 7(AX)(CX*2)                     // 62e27e2f11ac4807000000
-       //TODO: VPMOVUSDB Z13, K4, X7                              // 62727e4c11ef
-       //TODO: VPMOVUSDB Z14, K4, X7                              // 62727e4c11f7
-       //TODO: VPMOVUSDB Z13, K4, -15(R14)(R15*1)                 // 62127e4c11ac3ef1ffffff
-       //TODO: VPMOVUSDB Z14, K4, -15(R14)(R15*1)                 // 62127e4c11b43ef1ffffff
-       //TODO: VPMOVUSDB Z13, K4, -15(BX)                         // 62727e4c11abf1ffffff
-       //TODO: VPMOVUSDB Z14, K4, -15(BX)                         // 62727e4c11b3f1ffffff
-       //TODO: VPMOVUSDW X16, K4, X20                             // 62a27e0c13c4
-       //TODO: VPMOVUSDW X16, K4, 15(R8)(R14*1)                   // 62827e0c1384300f000000
-       //TODO: VPMOVUSDW X16, K4, 15(R8)(R14*2)                   // 62827e0c1384700f000000
-       //TODO: VPMOVUSDW Y1, K7, X12                              // 62d27e2f13cc
-       //TODO: VPMOVUSDW Y1, K7, 7(AX)(CX*4)                      // 62f27e2f138c8807000000
-       //TODO: VPMOVUSDW Y1, K7, 7(AX)(CX*1)                      // 62f27e2f138c0807000000
-       //TODO: VPMOVUSDW Z5, K2, Y26                              // 62927e4a13ea
-       //TODO: VPMOVUSDW Z23, K2, Y26                             // 62827e4a13fa
-       //TODO: VPMOVUSDW Z5, K2, (AX)                             // 62f27e4a1328
-       //TODO: VPMOVUSDW Z23, K2, (AX)                            // 62e27e4a1338
-       //TODO: VPMOVUSDW Z5, K2, 7(SI)                            // 62f27e4a13ae07000000
-       //TODO: VPMOVUSDW Z23, K2, 7(SI)                           // 62e27e4a13be07000000
-       //TODO: VPMOVUSQB X17, K5, X6                              // 62e27e0d12ce
-       //TODO: VPMOVUSQB X17, K5, (AX)                            // 62e27e0d1208
-       //TODO: VPMOVUSQB X17, K5, 7(SI)                           // 62e27e0d128e07000000
-       //TODO: VPMOVUSQB Y30, K3, X28                             // 62027e2b12f4
-       //TODO: VPMOVUSQB Y30, K3, 17(SP)                          // 62627e2b12b42411000000
-       //TODO: VPMOVUSQB Y30, K3, -17(BP)(SI*4)                   // 62627e2b12b4b5efffffff
-       //TODO: VPMOVUSQB Z2, K4, X6                               // 62f27e4c12d6
-       //TODO: VPMOVUSQB Z2, K4, (R14)                            // 62d27e4c1216
-       //TODO: VPMOVUSQB Z2, K4, -7(DI)(R8*8)                     // 62b27e4c1294c7f9ffffff
-       //TODO: VPMOVUSQD X8, K2, X1                               // 62727e0a15c1
-       //TODO: VPMOVUSQD X8, K2, 99(R15)(R15*4)                   // 62127e0a1584bf63000000
-       //TODO: VPMOVUSQD X8, K2, 15(DX)                           // 62727e0a15820f000000
-       //TODO: VPMOVUSQD Y12, K2, X8                              // 62527e2a15e0
-       //TODO: VPMOVUSQD Y12, K2, (SI)                            // 62727e2a1526
-       //TODO: VPMOVUSQD Y12, K2, 7(SI)(DI*2)                     // 62727e2a15a47e07000000
-       //TODO: VPMOVUSQD Z6, K3, Y22                              // 62b27e4b15f6
-       //TODO: VPMOVUSQD Z14, K3, Y22                             // 62327e4b15f6
-       //TODO: VPMOVUSQD Z6, K3, (BX)                             // 62f27e4b1533
-       //TODO: VPMOVUSQD Z14, K3, (BX)                            // 62727e4b1533
-       //TODO: VPMOVUSQD Z6, K3, -17(BP)(SI*1)                    // 62f27e4b15b435efffffff
-       //TODO: VPMOVUSQD Z14, K3, -17(BP)(SI*1)                   // 62727e4b15b435efffffff
-       //TODO: VPMOVUSQW X0, K3, X6                               // 62f27e0b14c6
-       //TODO: VPMOVUSQW X0, K3, 7(AX)                            // 62f27e0b148007000000
-       //TODO: VPMOVUSQW X0, K3, (DI)                             // 62f27e0b1407
-       //TODO: VPMOVUSQW Y3, K3, X11                              // 62d27e2b14db
-       //TODO: VPMOVUSQW Y3, K3, (CX)                             // 62f27e2b1419
-       //TODO: VPMOVUSQW Y3, K3, 99(R15)                          // 62d27e2b149f63000000
-       //TODO: VPMOVUSQW Z26, K2, X16                             // 62227e4a14d0
-       //TODO: VPMOVUSQW Z14, K2, X16                             // 62327e4a14f0
-       //TODO: VPMOVUSQW Z26, K2, 17(SP)(BP*8)                    // 62627e4a1494ec11000000
-       //TODO: VPMOVUSQW Z14, K2, 17(SP)(BP*8)                    // 62727e4a14b4ec11000000
-       //TODO: VPMOVUSQW Z26, K2, 17(SP)(BP*4)                    // 62627e4a1494ac11000000
-       //TODO: VPMOVUSQW Z14, K2, 17(SP)(BP*4)                    // 62727e4a14b4ac11000000
-       //TODO: VPMOVZXBD X15, K1, Z3                              // 62d27d4931df or 62d2fd4931df
-       //TODO: VPMOVZXBD 7(AX), K1, Z3                            // 62f27d49319807000000 or 62f2fd49319807000000
-       //TODO: VPMOVZXBD (DI), K1, Z3                             // 62f27d49311f or 62f2fd49311f
-       //TODO: VPMOVZXBD X15, K1, Z0                              // 62d27d4931c7 or 62d2fd4931c7
-       //TODO: VPMOVZXBD 7(AX), K1, Z0                            // 62f27d49318007000000 or 62f2fd49318007000000
-       //TODO: VPMOVZXBD (DI), K1, Z0                             // 62f27d493107 or 62f2fd493107
-       //TODO: VPMOVZXBD X1, K7, X11                              // 62727d0f31d9 or 6272fd0f31d9
-       //TODO: VPMOVZXBD 99(R15)(R15*1), K7, X11                  // 62127d0f319c3f63000000 or 6212fd0f319c3f63000000
-       //TODO: VPMOVZXBD (DX), K7, X11                            // 62727d0f311a or 6272fd0f311a
-       //TODO: VPMOVZXBD X19, K2, Y17                             // 62a27d2a31cb or 62a2fd2a31cb
-       //TODO: VPMOVZXBD 15(DX)(BX*1), K2, Y17                    // 62e27d2a318c1a0f000000 or 62e2fd2a318c1a0f000000
-       //TODO: VPMOVZXBD -7(CX)(DX*2), K2, Y17                    // 62e27d2a318c51f9ffffff or 62e2fd2a318c51f9ffffff
-       //TODO: VPMOVZXBQ X2, K4, X13                              // 62727d0c32ea or 6272fd0c32ea
-       //TODO: VPMOVZXBQ (BX), K4, X13                            // 62727d0c322b or 6272fd0c322b
-       //TODO: VPMOVZXBQ -17(BP)(SI*1), K4, X13                   // 62727d0c32ac35efffffff or 6272fd0c32ac35efffffff
-       //TODO: VPMOVZXBQ X14, K1, Y13                             // 62527d2932ee or 6252fd2932ee
-       //TODO: VPMOVZXBQ -17(BP)(SI*8), K1, Y13                   // 62727d2932acf5efffffff or 6272fd2932acf5efffffff
-       //TODO: VPMOVZXBQ (R15), K1, Y13                           // 62527d29322f or 6252fd29322f
-       //TODO: VPMOVZXBQ X0, K3, Z21                              // 62e27d4b32e8 or 62e2fd4b32e8
-       //TODO: VPMOVZXBQ -17(BP), K3, Z21                         // 62e27d4b32adefffffff or 62e2fd4b32adefffffff
-       //TODO: VPMOVZXBQ -15(R14)(R15*8), K3, Z21                 // 62827d4b32acfef1ffffff or 6282fd4b32acfef1ffffff
-       //TODO: VPMOVZXBQ X0, K3, Z13                              // 62727d4b32e8 or 6272fd4b32e8
-       //TODO: VPMOVZXBQ -17(BP), K3, Z13                         // 62727d4b32adefffffff or 6272fd4b32adefffffff
-       //TODO: VPMOVZXBQ -15(R14)(R15*8), K3, Z13                 // 62127d4b32acfef1ffffff or 6212fd4b32acfef1ffffff
-       //TODO: VPMOVZXDQ X17, K7, Y30                             // 62227d2f35f1
-       //TODO: VPMOVZXDQ -17(BP)(SI*8), K7, Y30                   // 62627d2f35b4f5efffffff
-       //TODO: VPMOVZXDQ (R15), K7, Y30                           // 62427d2f3537
-       //TODO: VPMOVZXDQ X11, K6, X18                             // 62c27d0e35d3
-       //TODO: VPMOVZXDQ 15(R8), K6, X18                          // 62c27d0e35900f000000
-       //TODO: VPMOVZXDQ (BP), K6, X18                            // 62e27d0e355500
-       //TODO: VPMOVZXDQ Y13, K3, Z3                              // 62d27d4b35dd
-       //TODO: VPMOVZXDQ -17(BP)(SI*2), K3, Z3                    // 62f27d4b359c75efffffff
-       //TODO: VPMOVZXDQ 7(AX)(CX*2), K3, Z3                      // 62f27d4b359c4807000000
-       //TODO: VPMOVZXDQ Y13, K3, Z12                             // 62527d4b35e5
-       //TODO: VPMOVZXDQ -17(BP)(SI*2), K3, Z12                   // 62727d4b35a475efffffff
-       //TODO: VPMOVZXDQ 7(AX)(CX*2), K3, Z12                     // 62727d4b35a44807000000
-       //TODO: VPMOVZXWD X9, K7, Y18                              // 62c27d2f33d1 or 62c2fd2f33d1
-       //TODO: VPMOVZXWD 7(SI)(DI*8), K7, Y18                     // 62e27d2f3394fe07000000 or 62e2fd2f3394fe07000000
-       //TODO: VPMOVZXWD -15(R14), K7, Y18                        // 62c27d2f3396f1ffffff or 62c2fd2f3396f1ffffff
-       //TODO: VPMOVZXWD X24, K4, X2                              // 62927d0c33d0 or 6292fd0c33d0
-       //TODO: VPMOVZXWD 15(R8)(R14*8), K4, X2                    // 62927d0c3394f00f000000 or 6292fd0c3394f00f000000
-       //TODO: VPMOVZXWD -15(R14)(R15*2), K4, X2                  // 62927d0c33947ef1ffffff or 6292fd0c33947ef1ffffff
-       //TODO: VPMOVZXWD Y24, K4, Z27                             // 62027d4c33d8 or 6202fd4c33d8
-       //TODO: VPMOVZXWD 15(R8)(R14*1), K4, Z27                   // 62027d4c339c300f000000 or 6202fd4c339c300f000000
-       //TODO: VPMOVZXWD 15(R8)(R14*2), K4, Z27                   // 62027d4c339c700f000000 or 6202fd4c339c700f000000
-       //TODO: VPMOVZXWD Y24, K4, Z15                             // 62127d4c33f8 or 6212fd4c33f8
-       //TODO: VPMOVZXWD 15(R8)(R14*1), K4, Z15                   // 62127d4c33bc300f000000 or 6212fd4c33bc300f000000
-       //TODO: VPMOVZXWD 15(R8)(R14*2), K4, Z15                   // 62127d4c33bc700f000000 or 6212fd4c33bc700f000000
-       //TODO: VPMOVZXWQ X2, K7, Z23                              // 62e27d4f34fa or 62e2fd4f34fa
-       //TODO: VPMOVZXWQ 7(SI)(DI*1), K7, Z23                     // 62e27d4f34bc3e07000000 or 62e2fd4f34bc3e07000000
-       //TODO: VPMOVZXWQ 15(DX)(BX*8), K7, Z23                    // 62e27d4f34bcda0f000000 or 62e2fd4f34bcda0f000000
-       //TODO: VPMOVZXWQ X2, K7, Z5                               // 62f27d4f34ea or 62f2fd4f34ea
-       //TODO: VPMOVZXWQ 7(SI)(DI*1), K7, Z5                      // 62f27d4f34ac3e07000000 or 62f2fd4f34ac3e07000000
-       //TODO: VPMOVZXWQ 15(DX)(BX*8), K7, Z5                     // 62f27d4f34acda0f000000 or 62f2fd4f34acda0f000000
-       //TODO: VPMOVZXWQ X27, K2, X2                              // 62927d0a34d3 or 6292fd0a34d3
-       //TODO: VPMOVZXWQ 7(SI)(DI*8), K2, X2                      // 62f27d0a3494fe07000000 or 62f2fd0a3494fe07000000
-       //TODO: VPMOVZXWQ -15(R14), K2, X2                         // 62d27d0a3496f1ffffff or 62d2fd0a3496f1ffffff
-       //TODO: VPMOVZXWQ X26, K5, Y8                              // 62127d2d34c2 or 6212fd2d34c2
-       //TODO: VPMOVZXWQ -15(R14)(R15*1), K5, Y8                  // 62127d2d34843ef1ffffff or 6212fd2d34843ef1ffffff
-       //TODO: VPMOVZXWQ -15(BX), K5, Y8                          // 62727d2d3483f1ffffff or 6272fd2d3483f1ffffff
-       //TODO: VPMULDQ X3, X30, K3, X22                           // 62e28d0328f3
-       //TODO: VPMULDQ -7(DI)(R8*1), X30, K3, X22                 // 62a28d0328b407f9ffffff
-       //TODO: VPMULDQ (SP), X30, K3, X22                         // 62e28d03283424
-       //TODO: VPMULDQ Y5, Y24, K4, Y11                           // 6272bd2428dd
-       //TODO: VPMULDQ (R14), Y24, K4, Y11                        // 6252bd24281e
-       //TODO: VPMULDQ -7(DI)(R8*8), Y24, K4, Y11                 // 6232bd24289cc7f9ffffff
-       //TODO: VPMULDQ Z21, Z8, K2, Z23                           // 62a2bd4a28fd
-       //TODO: VPMULDQ Z5, Z8, K2, Z23                            // 62e2bd4a28fd
-       //TODO: VPMULDQ -7(CX)(DX*1), Z8, K2, Z23                  // 62e2bd4a28bc11f9ffffff
-       //TODO: VPMULDQ -15(R14)(R15*4), Z8, K2, Z23               // 6282bd4a28bcbef1ffffff
-       //TODO: VPMULDQ Z21, Z28, K2, Z23                          // 62a29d4228fd
-       //TODO: VPMULDQ Z5, Z28, K2, Z23                           // 62e29d4228fd
-       //TODO: VPMULDQ -7(CX)(DX*1), Z28, K2, Z23                 // 62e29d4228bc11f9ffffff
-       //TODO: VPMULDQ -15(R14)(R15*4), Z28, K2, Z23              // 62829d4228bcbef1ffffff
-       //TODO: VPMULDQ Z21, Z8, K2, Z6                            // 62b2bd4a28f5
-       //TODO: VPMULDQ Z5, Z8, K2, Z6                             // 62f2bd4a28f5
-       //TODO: VPMULDQ -7(CX)(DX*1), Z8, K2, Z6                   // 62f2bd4a28b411f9ffffff
-       //TODO: VPMULDQ -15(R14)(R15*4), Z8, K2, Z6                // 6292bd4a28b4bef1ffffff
-       //TODO: VPMULDQ Z21, Z28, K2, Z6                           // 62b29d4228f5
-       //TODO: VPMULDQ Z5, Z28, K2, Z6                            // 62f29d4228f5
-       //TODO: VPMULDQ -7(CX)(DX*1), Z28, K2, Z6                  // 62f29d4228b411f9ffffff
-       //TODO: VPMULDQ -15(R14)(R15*4), Z28, K2, Z6               // 62929d4228b4bef1ffffff
-       //TODO: VPMULLD X9, X2, K1, X20                            // 62c26d0940e1
-       //TODO: VPMULLD (BX), X2, K1, X20                          // 62e26d094023
-       //TODO: VPMULLD -17(BP)(SI*1), X2, K1, X20                 // 62e26d0940a435efffffff
-       //TODO: VPMULLD Y11, Y26, K1, Y6                           // 62d22d2140f3
-       //TODO: VPMULLD -7(CX)(DX*1), Y26, K1, Y6                  // 62f22d2140b411f9ffffff
-       //TODO: VPMULLD -15(R14)(R15*4), Y26, K1, Y6               // 62922d2140b4bef1ffffff
-       //TODO: VPMULLD Z7, Z3, K1, Z8                             // 6272654940c7
-       //TODO: VPMULLD Z9, Z3, K1, Z8                             // 6252654940c1
-       //TODO: VPMULLD 15(R8), Z3, K1, Z8                         // 6252654940800f000000
-       //TODO: VPMULLD (BP), Z3, K1, Z8                           // 62726549404500
-       //TODO: VPMULLD Z7, Z27, K1, Z8                            // 6272254140c7
-       //TODO: VPMULLD Z9, Z27, K1, Z8                            // 6252254140c1
-       //TODO: VPMULLD 15(R8), Z27, K1, Z8                        // 6252254140800f000000
-       //TODO: VPMULLD (BP), Z27, K1, Z8                          // 62722541404500
-       //TODO: VPMULLD Z7, Z3, K1, Z2                             // 62f2654940d7
-       //TODO: VPMULLD Z9, Z3, K1, Z2                             // 62d2654940d1
-       //TODO: VPMULLD 15(R8), Z3, K1, Z2                         // 62d2654940900f000000
-       //TODO: VPMULLD (BP), Z3, K1, Z2                           // 62f26549405500
-       //TODO: VPMULLD Z7, Z27, K1, Z2                            // 62f2254140d7
-       //TODO: VPMULLD Z9, Z27, K1, Z2                            // 62d2254140d1
-       //TODO: VPMULLD 15(R8), Z27, K1, Z2                        // 62d2254140900f000000
-       //TODO: VPMULLD (BP), Z27, K1, Z2                          // 62f22541405500
-       //TODO: VPMULUDQ X16, X0, K6, X15                          // 6231fd0ef4f8
-       //TODO: VPMULUDQ -17(BP)(SI*2), X0, K6, X15                // 6271fd0ef4bc75efffffff
-       //TODO: VPMULUDQ 7(AX)(CX*2), X0, K6, X15                  // 6271fd0ef4bc4807000000
-       //TODO: VPMULUDQ Y14, Y21, K3, Y7                          // 62d1d523f4fe
-       //TODO: VPMULUDQ 15(R8), Y21, K3, Y7                       // 62d1d523f4b80f000000
-       //TODO: VPMULUDQ (BP), Y21, K3, Y7                         // 62f1d523f47d00
-       //TODO: VPMULUDQ Z1, Z6, K7, Z6                            // 62f1cd4ff4f1
-       //TODO: VPMULUDQ Z15, Z6, K7, Z6                           // 62d1cd4ff4f7
-       //TODO: VPMULUDQ (SI), Z6, K7, Z6                          // 62f1cd4ff436
-       //TODO: VPMULUDQ 7(SI)(DI*2), Z6, K7, Z6                   // 62f1cd4ff4b47e07000000
-       //TODO: VPMULUDQ Z1, Z22, K7, Z6                           // 62f1cd47f4f1
-       //TODO: VPMULUDQ Z15, Z22, K7, Z6                          // 62d1cd47f4f7
-       //TODO: VPMULUDQ (SI), Z22, K7, Z6                         // 62f1cd47f436
-       //TODO: VPMULUDQ 7(SI)(DI*2), Z22, K7, Z6                  // 62f1cd47f4b47e07000000
-       //TODO: VPMULUDQ Z1, Z6, K7, Z16                           // 62e1cd4ff4c1
-       //TODO: VPMULUDQ Z15, Z6, K7, Z16                          // 62c1cd4ff4c7
-       //TODO: VPMULUDQ (SI), Z6, K7, Z16                         // 62e1cd4ff406
-       //TODO: VPMULUDQ 7(SI)(DI*2), Z6, K7, Z16                  // 62e1cd4ff4847e07000000
-       //TODO: VPMULUDQ Z1, Z22, K7, Z16                          // 62e1cd47f4c1
-       //TODO: VPMULUDQ Z15, Z22, K7, Z16                         // 62c1cd47f4c7
-       //TODO: VPMULUDQ (SI), Z22, K7, Z16                        // 62e1cd47f406
-       //TODO: VPMULUDQ 7(SI)(DI*2), Z22, K7, Z16                 // 62e1cd47f4847e07000000
-       //TODO: VPORD X7, X1, K2, X31                              // 6261750aebff
-       //TODO: VPORD 99(R15)(R15*2), X1, K2, X31                  // 6201750aebbc7f63000000
-       //TODO: VPORD -7(DI), X1, K2, X31                          // 6261750aebbff9ffffff
-       //TODO: VPORD Y28, Y9, K1, Y20                             // 62813529ebe4
-       //TODO: VPORD 17(SP)(BP*8), Y9, K1, Y20                    // 62e13529eba4ec11000000
-       //TODO: VPORD 17(SP)(BP*4), Y9, K1, Y20                    // 62e13529eba4ac11000000
-       //TODO: VPORD Z15, Z3, K2, Z14                             // 6251654aebf7
-       //TODO: VPORD Z30, Z3, K2, Z14                             // 6211654aebf6
-       //TODO: VPORD 99(R15)(R15*1), Z3, K2, Z14                  // 6211654aebb43f63000000
-       //TODO: VPORD (DX), Z3, K2, Z14                            // 6271654aeb32
-       //TODO: VPORD Z15, Z12, K2, Z14                            // 62511d4aebf7
-       //TODO: VPORD Z30, Z12, K2, Z14                            // 62111d4aebf6
-       //TODO: VPORD 99(R15)(R15*1), Z12, K2, Z14                 // 62111d4aebb43f63000000
-       //TODO: VPORD (DX), Z12, K2, Z14                           // 62711d4aeb32
-       //TODO: VPORD Z15, Z3, K2, Z28                             // 6241654aebe7
-       //TODO: VPORD Z30, Z3, K2, Z28                             // 6201654aebe6
-       //TODO: VPORD 99(R15)(R15*1), Z3, K2, Z28                  // 6201654aeba43f63000000
-       //TODO: VPORD (DX), Z3, K2, Z28                            // 6261654aeb22
-       //TODO: VPORD Z15, Z12, K2, Z28                            // 62411d4aebe7
-       //TODO: VPORD Z30, Z12, K2, Z28                            // 62011d4aebe6
-       //TODO: VPORD 99(R15)(R15*1), Z12, K2, Z28                 // 62011d4aeba43f63000000
-       //TODO: VPORD (DX), Z12, K2, Z28                           // 62611d4aeb22
-       //TODO: VPORQ X12, X15, K1, X9                             // 62518509ebcc
-       //TODO: VPORQ -7(CX)(DX*1), X15, K1, X9                    // 62718509eb8c11f9ffffff
-       //TODO: VPORQ -15(R14)(R15*4), X15, K1, X9                 // 62118509eb8cbef1ffffff
-       //TODO: VPORQ Y8, Y1, K7, Y28                              // 6241f52febe0
-       //TODO: VPORQ 7(SI)(DI*4), Y1, K7, Y28                     // 6261f52feba4be07000000
-       //TODO: VPORQ -7(DI)(R8*2), Y1, K7, Y28                    // 6221f52feba447f9ffffff
-       //TODO: VPORQ Z3, Z5, K1, Z19                              // 62e1d549ebdb
-       //TODO: VPORQ Z5, Z5, K1, Z19                              // 62e1d549ebdd
-       //TODO: VPORQ -17(BP)(SI*8), Z5, K1, Z19                   // 62e1d549eb9cf5efffffff
-       //TODO: VPORQ (R15), Z5, K1, Z19                           // 62c1d549eb1f
-       //TODO: VPORQ Z3, Z1, K1, Z19                              // 62e1f549ebdb
-       //TODO: VPORQ Z5, Z1, K1, Z19                              // 62e1f549ebdd
-       //TODO: VPORQ -17(BP)(SI*8), Z1, K1, Z19                   // 62e1f549eb9cf5efffffff
-       //TODO: VPORQ (R15), Z1, K1, Z19                           // 62c1f549eb1f
-       //TODO: VPORQ Z3, Z5, K1, Z15                              // 6271d549ebfb
-       //TODO: VPORQ Z5, Z5, K1, Z15                              // 6271d549ebfd
-       //TODO: VPORQ -17(BP)(SI*8), Z5, K1, Z15                   // 6271d549ebbcf5efffffff
-       //TODO: VPORQ (R15), Z5, K1, Z15                           // 6251d549eb3f
-       //TODO: VPORQ Z3, Z1, K1, Z15                              // 6271f549ebfb
-       //TODO: VPORQ Z5, Z1, K1, Z15                              // 6271f549ebfd
-       //TODO: VPORQ -17(BP)(SI*8), Z1, K1, Z15                   // 6271f549ebbcf5efffffff
-       //TODO: VPORQ (R15), Z1, K1, Z15                           // 6251f549eb3f
-       //TODO: VPROLD $121, X12, K1, X0                           // 62d17d0972cc79
-       //TODO: VPROLD $121, 15(DX)(BX*1), K1, X0                  // 62f17d09728c1a0f00000079
-       //TODO: VPROLD $121, -7(CX)(DX*2), K1, X0                  // 62f17d09728c51f9ffffff79
-       //TODO: VPROLD $13, Y27, K1, Y11                           // 6291252972cb0d
-       //TODO: VPROLD $13, 17(SP), K1, Y11                        // 62f12529728c24110000000d
-       //TODO: VPROLD $13, -17(BP)(SI*4), K1, Y11                 // 62f12529728cb5efffffff0d
-       //TODO: VPROLD $65, Z21, K7, Z14                           // 62b10d4f72cd41
-       //TODO: VPROLD $65, Z8, K7, Z14                            // 62d10d4f72c841
-       //TODO: VPROLD $65, 7(SI)(DI*8), K7, Z14                   // 62f10d4f728cfe0700000041
-       //TODO: VPROLD $65, -15(R14), K7, Z14                      // 62d10d4f728ef1ffffff41
-       //TODO: VPROLD $65, Z21, K7, Z15                           // 62b1054f72cd41
-       //TODO: VPROLD $65, Z8, K7, Z15                            // 62d1054f72c841
-       //TODO: VPROLD $65, 7(SI)(DI*8), K7, Z15                   // 62f1054f728cfe0700000041
-       //TODO: VPROLD $65, -15(R14), K7, Z15                      // 62d1054f728ef1ffffff41
-       //TODO: VPROLQ $67, X5, K2, X14                            // 62f18d0a72cd43
-       //TODO: VPROLQ $67, -17(BP), K2, X14                       // 62f18d0a728defffffff43
-       //TODO: VPROLQ $67, -15(R14)(R15*8), K2, X14               // 62918d0a728cfef1ffffff43
-       //TODO: VPROLQ $127, Y16, K4, Y17                          // 62b1f52472c87f
-       //TODO: VPROLQ $127, 7(AX), K4, Y17                        // 62f1f5247288070000007f
-       //TODO: VPROLQ $127, (DI), K4, Y17                         // 62f1f524720f7f
-       //TODO: VPROLQ $0, Z20, K1, Z16                            // 62b1fd4172cc00
-       //TODO: VPROLQ $0, Z0, K1, Z16                             // 62f1fd4172c800
-       //TODO: VPROLQ $0, 7(SI)(DI*1), K1, Z16                    // 62f1fd41728c3e0700000000
-       //TODO: VPROLQ $0, 15(DX)(BX*8), K1, Z16                   // 62f1fd41728cda0f00000000
-       //TODO: VPROLQ $0, Z20, K1, Z9                             // 62b1b54972cc00
-       //TODO: VPROLQ $0, Z0, K1, Z9                              // 62f1b54972c800
-       //TODO: VPROLQ $0, 7(SI)(DI*1), K1, Z9                     // 62f1b549728c3e0700000000
-       //TODO: VPROLQ $0, 15(DX)(BX*8), K1, Z9                    // 62f1b549728cda0f00000000
-       //TODO: VPROLVD X8, X15, K3, X17                           // 62c2050b15c8
-       //TODO: VPROLVD 17(SP)(BP*2), X15, K3, X17                 // 62e2050b158c6c11000000
-       //TODO: VPROLVD -7(DI)(R8*4), X15, K3, X17                 // 62a2050b158c87f9ffffff
-       //TODO: VPROLVD Y26, Y6, K4, Y12                           // 62124d2c15e2
-       //TODO: VPROLVD 99(R15)(R15*1), Y6, K4, Y12                // 62124d2c15a43f63000000
-       //TODO: VPROLVD (DX), Y6, K4, Y12                          // 62724d2c1522
-       //TODO: VPROLVD Z0, Z0, K5, Z23                            // 62e27d4d15f8
-       //TODO: VPROLVD Z25, Z0, K5, Z23                           // 62827d4d15f9
-       //TODO: VPROLVD -7(DI)(R8*1), Z0, K5, Z23                  // 62a27d4d15bc07f9ffffff
-       //TODO: VPROLVD (SP), Z0, K5, Z23                          // 62e27d4d153c24
-       //TODO: VPROLVD Z0, Z11, K5, Z23                           // 62e2254d15f8
-       //TODO: VPROLVD Z25, Z11, K5, Z23                          // 6282254d15f9
-       //TODO: VPROLVD -7(DI)(R8*1), Z11, K5, Z23                 // 62a2254d15bc07f9ffffff
-       //TODO: VPROLVD (SP), Z11, K5, Z23                         // 62e2254d153c24
-       //TODO: VPROLVD Z0, Z0, K5, Z19                            // 62e27d4d15d8
-       //TODO: VPROLVD Z25, Z0, K5, Z19                           // 62827d4d15d9
-       //TODO: VPROLVD -7(DI)(R8*1), Z0, K5, Z19                  // 62a27d4d159c07f9ffffff
-       //TODO: VPROLVD (SP), Z0, K5, Z19                          // 62e27d4d151c24
-       //TODO: VPROLVD Z0, Z11, K5, Z19                           // 62e2254d15d8
-       //TODO: VPROLVD Z25, Z11, K5, Z19                          // 6282254d15d9
-       //TODO: VPROLVD -7(DI)(R8*1), Z11, K5, Z19                 // 62a2254d159c07f9ffffff
-       //TODO: VPROLVD (SP), Z11, K5, Z19                         // 62e2254d151c24
-       //TODO: VPROLVQ X23, X26, K7, X3                           // 62b2ad0715df
-       //TODO: VPROLVQ 15(R8), X26, K7, X3                        // 62d2ad0715980f000000
-       //TODO: VPROLVQ (BP), X26, K7, X3                          // 62f2ad07155d00
-       //TODO: VPROLVQ Y28, Y8, K7, Y3                            // 6292bd2f15dc
-       //TODO: VPROLVQ -17(BP)(SI*8), Y8, K7, Y3                  // 62f2bd2f159cf5efffffff
-       //TODO: VPROLVQ (R15), Y8, K7, Y3                          // 62d2bd2f151f
-       //TODO: VPROLVQ Z9, Z0, K6, Z24                            // 6242fd4e15c1
-       //TODO: VPROLVQ Z3, Z0, K6, Z24                            // 6262fd4e15c3
-       //TODO: VPROLVQ -7(CX), Z0, K6, Z24                        // 6262fd4e1581f9ffffff
-       //TODO: VPROLVQ 15(DX)(BX*4), Z0, K6, Z24                  // 6262fd4e15849a0f000000
-       //TODO: VPROLVQ Z9, Z26, K6, Z24                           // 6242ad4615c1
-       //TODO: VPROLVQ Z3, Z26, K6, Z24                           // 6262ad4615c3
-       //TODO: VPROLVQ -7(CX), Z26, K6, Z24                       // 6262ad461581f9ffffff
-       //TODO: VPROLVQ 15(DX)(BX*4), Z26, K6, Z24                 // 6262ad4615849a0f000000
-       //TODO: VPROLVQ Z9, Z0, K6, Z12                            // 6252fd4e15e1
-       //TODO: VPROLVQ Z3, Z0, K6, Z12                            // 6272fd4e15e3
-       //TODO: VPROLVQ -7(CX), Z0, K6, Z12                        // 6272fd4e15a1f9ffffff
-       //TODO: VPROLVQ 15(DX)(BX*4), Z0, K6, Z12                  // 6272fd4e15a49a0f000000
-       //TODO: VPROLVQ Z9, Z26, K6, Z12                           // 6252ad4615e1
-       //TODO: VPROLVQ Z3, Z26, K6, Z12                           // 6272ad4615e3
-       //TODO: VPROLVQ -7(CX), Z26, K6, Z12                       // 6272ad4615a1f9ffffff
-       //TODO: VPROLVQ 15(DX)(BX*4), Z26, K6, Z12                 // 6272ad4615a49a0f000000
-       //TODO: VPRORD $97, X28, K3, X13                           // 6291150b72c461
-       //TODO: VPRORD $97, 15(R8)(R14*8), K3, X13                 // 6291150b7284f00f00000061
-       //TODO: VPRORD $97, -15(R14)(R15*2), K3, X13               // 6291150b72847ef1ffffff61
-       //TODO: VPRORD $81, Y23, K7, Y1                            // 62b1752f72c751
-       //TODO: VPRORD $81, 7(SI)(DI*8), K7, Y1                    // 62f1752f7284fe0700000051
-       //TODO: VPRORD $81, -15(R14), K7, Y1                       // 62d1752f7286f1ffffff51
-       //TODO: VPRORD $42, Z9, K4, Z9                             // 62d1354c72c12a
-       //TODO: VPRORD $42, Z28, K4, Z9                            // 6291354c72c42a
-       //TODO: VPRORD $42, 99(R15)(R15*8), K4, Z9                 // 6291354c7284ff630000002a
-       //TODO: VPRORD $42, 7(AX)(CX*8), K4, Z9                    // 62f1354c7284c8070000002a
-       //TODO: VPRORD $42, Z9, K4, Z25                            // 62d1354472c12a
-       //TODO: VPRORD $42, Z28, K4, Z25                           // 6291354472c42a
-       //TODO: VPRORD $42, 99(R15)(R15*8), K4, Z25                // 629135447284ff630000002a
-       //TODO: VPRORD $42, 7(AX)(CX*8), K4, Z25                   // 62f135447284c8070000002a
-       //TODO: VPRORQ $79, X9, K4, X24                            // 62d1bd0472c14f
-       //TODO: VPRORQ $79, -15(R14)(R15*1), K4, X24               // 6291bd0472843ef1ffffff4f
-       //TODO: VPRORQ $79, -15(BX), K4, X24                       // 62f1bd047283f1ffffff4f
-       //TODO: VPRORQ $64, Y31, K7, Y14                           // 62918d2f72c740
-       //TODO: VPRORQ $64, 7(SI)(DI*1), K7, Y14                   // 62f18d2f72843e0700000040
-       //TODO: VPRORQ $64, 15(DX)(BX*8), K7, Y14                  // 62f18d2f7284da0f00000040
-       //TODO: VPRORQ $27, Z17, K2, Z20                           // 62b1dd4272c11b
-       //TODO: VPRORQ $27, Z0, K2, Z20                            // 62f1dd4272c01b
-       //TODO: VPRORQ $27, (AX), K2, Z20                          // 62f1dd4272001b
-       //TODO: VPRORQ $27, 7(SI), K2, Z20                         // 62f1dd427286070000001b
-       //TODO: VPRORQ $27, Z17, K2, Z0                            // 62b1fd4a72c11b
-       //TODO: VPRORQ $27, Z0, K2, Z0                             // 62f1fd4a72c01b
-       //TODO: VPRORQ $27, (AX), K2, Z0                           // 62f1fd4a72001b
-       //TODO: VPRORQ $27, 7(SI), K2, Z0                          // 62f1fd4a7286070000001b
-       //TODO: VPRORVD X18, X26, K5, X15                          // 62322d0514fa
-       //TODO: VPRORVD 7(AX)(CX*4), X26, K5, X15                  // 62722d0514bc8807000000
-       //TODO: VPRORVD 7(AX)(CX*1), X26, K5, X15                  // 62722d0514bc0807000000
-       //TODO: VPRORVD Y22, Y2, K3, Y25                           // 62226d2b14ce
-       //TODO: VPRORVD -7(DI)(R8*1), Y2, K3, Y25                  // 62226d2b148c07f9ffffff
-       //TODO: VPRORVD (SP), Y2, K3, Y25                          // 62626d2b140c24
-       //TODO: VPRORVD Z21, Z31, K4, Z17                          // 62a2054414cd
-       //TODO: VPRORVD Z9, Z31, K4, Z17                           // 62c2054414c9
-       //TODO: VPRORVD (BX), Z31, K4, Z17                         // 62e20544140b
-       //TODO: VPRORVD -17(BP)(SI*1), Z31, K4, Z17                // 62e20544148c35efffffff
-       //TODO: VPRORVD Z21, Z0, K4, Z17                           // 62a27d4c14cd
-       //TODO: VPRORVD Z9, Z0, K4, Z17                            // 62c27d4c14c9
-       //TODO: VPRORVD (BX), Z0, K4, Z17                          // 62e27d4c140b
-       //TODO: VPRORVD -17(BP)(SI*1), Z0, K4, Z17                 // 62e27d4c148c35efffffff
-       //TODO: VPRORVD Z21, Z31, K4, Z23                          // 62a2054414fd
-       //TODO: VPRORVD Z9, Z31, K4, Z23                           // 62c2054414f9
-       //TODO: VPRORVD (BX), Z31, K4, Z23                         // 62e20544143b
-       //TODO: VPRORVD -17(BP)(SI*1), Z31, K4, Z23                // 62e2054414bc35efffffff
-       //TODO: VPRORVD Z21, Z0, K4, Z23                           // 62a27d4c14fd
-       //TODO: VPRORVD Z9, Z0, K4, Z23                            // 62c27d4c14f9
-       //TODO: VPRORVD (BX), Z0, K4, Z23                          // 62e27d4c143b
-       //TODO: VPRORVD -17(BP)(SI*1), Z0, K4, Z23                 // 62e27d4c14bc35efffffff
-       //TODO: VPRORVQ X11, X1, K2, X21                           // 62c2f50a14eb
-       //TODO: VPRORVQ (SI), X1, K2, X21                          // 62e2f50a142e
-       //TODO: VPRORVQ 7(SI)(DI*2), X1, K2, X21                   // 62e2f50a14ac7e07000000
-       //TODO: VPRORVQ Y9, Y8, K2, Y27                            // 6242bd2a14d9
-       //TODO: VPRORVQ -7(CX), Y8, K2, Y27                        // 6262bd2a1499f9ffffff
-       //TODO: VPRORVQ 15(DX)(BX*4), Y8, K2, Y27                  // 6262bd2a149c9a0f000000
-       //TODO: VPRORVQ Z20, Z1, K3, Z6                            // 62b2f54b14f4
-       //TODO: VPRORVQ Z9, Z1, K3, Z6                             // 62d2f54b14f1
-       //TODO: VPRORVQ 15(R8)(R14*4), Z1, K3, Z6                  // 6292f54b14b4b00f000000
-       //TODO: VPRORVQ -7(CX)(DX*4), Z1, K3, Z6                   // 62f2f54b14b491f9ffffff
-       //TODO: VPRORVQ Z20, Z9, K3, Z6                            // 62b2b54b14f4
-       //TODO: VPRORVQ Z9, Z9, K3, Z6                             // 62d2b54b14f1
-       //TODO: VPRORVQ 15(R8)(R14*4), Z9, K3, Z6                  // 6292b54b14b4b00f000000
-       //TODO: VPRORVQ -7(CX)(DX*4), Z9, K3, Z6                   // 62f2b54b14b491f9ffffff
-       //TODO: VPRORVQ Z20, Z1, K3, Z9                            // 6232f54b14cc
-       //TODO: VPRORVQ Z9, Z1, K3, Z9                             // 6252f54b14c9
-       //TODO: VPRORVQ 15(R8)(R14*4), Z1, K3, Z9                  // 6212f54b148cb00f000000
-       //TODO: VPRORVQ -7(CX)(DX*4), Z1, K3, Z9                   // 6272f54b148c91f9ffffff
-       //TODO: VPRORVQ Z20, Z9, K3, Z9                            // 6232b54b14cc
-       //TODO: VPRORVQ Z9, Z9, K3, Z9                             // 6252b54b14c9
-       //TODO: VPRORVQ 15(R8)(R14*4), Z9, K3, Z9                  // 6212b54b148cb00f000000
-       //TODO: VPRORVQ -7(CX)(DX*4), Z9, K3, Z9                   // 6272b54b148c91f9ffffff
-       //TODO: VPSCATTERDD X0, K3, (AX)(X4*1)                     // 62f27d0ba00420
-       //TODO: VPSCATTERDD X0, K3, (BP)(X10*2)                    // 62b27d0ba0445500
-       //TODO: VPSCATTERDD X0, K3, (R10)(X29*8)                   // 62927d03a004ea
-       //TODO: VPSCATTERDD Y1, K3, (R10)(Y29*8)                   // 62927d23a00cea
-       //TODO: VPSCATTERDD Y1, K3, (SP)(Y4*2)                     // 62f27d2ba00c64
-       //TODO: VPSCATTERDD Y1, K3, (DX)(Y10*4)                    // 62b27d2ba00c92
-       //TODO: VPSCATTERDD Z16, K2, (DX)(Z10*4)                   // 62a27d4aa00492
-       //TODO: VPSCATTERDD Z25, K2, (DX)(Z10*4)                   // 62227d4aa00c92
-       //TODO: VPSCATTERDD Z16, K2, (AX)(Z4*1)                    // 62e27d4aa00420
-       //TODO: VPSCATTERDD Z25, K2, (AX)(Z4*1)                    // 62627d4aa00c20
-       //TODO: VPSCATTERDD Z16, K2, (SP)(Z4*2)                    // 62e27d4aa00464
-       //TODO: VPSCATTERDD Z25, K2, (SP)(Z4*2)                    // 62627d4aa00c64
-       //TODO: VPSCATTERDQ X0, K1, (DX)(X10*4)                    // 62b2fd09a00492
-       //TODO: VPSCATTERDQ X0, K1, (SP)(X4*2)                     // 62f2fd09a00464
-       //TODO: VPSCATTERDQ X0, K1, (R14)(X29*8)                   // 6292fd01a004ee
-       //TODO: VPSCATTERDQ Y6, K2, (AX)(X4*1)                     // 62f2fd2aa03420
-       //TODO: VPSCATTERDQ Y6, K2, (BP)(X10*2)                    // 62b2fd2aa0745500
-       //TODO: VPSCATTERDQ Y6, K2, (R10)(X29*8)                   // 6292fd22a034ea
-       //TODO: VPSCATTERDQ Z14, K1, (R14)(Y29*8)                  // 6212fd41a034ee
-       //TODO: VPSCATTERDQ Z13, K1, (R14)(Y29*8)                  // 6212fd41a02cee
-       //TODO: VPSCATTERDQ Z14, K1, (AX)(Y4*1)                    // 6272fd49a03420
-       //TODO: VPSCATTERDQ Z13, K1, (AX)(Y4*1)                    // 6272fd49a02c20
-       //TODO: VPSCATTERDQ Z14, K1, (BP)(Y10*2)                   // 6232fd49a0745500
-       //TODO: VPSCATTERDQ Z13, K1, (BP)(Y10*2)                   // 6232fd49a06c5500
-       //TODO: VPSCATTERQD X24, K7, (AX)(X4*1)                    // 62627d0fa10420
-       //TODO: VPSCATTERQD X24, K7, (BP)(X10*2)                   // 62227d0fa1445500
-       //TODO: VPSCATTERQD X24, K7, (R10)(X29*8)                  // 62027d07a104ea
-       //TODO: VPSCATTERQD X20, K1, (R10)(Y29*8)                  // 62827d21a124ea
-       //TODO: VPSCATTERQD X20, K1, (SP)(Y4*2)                    // 62e27d29a12464
-       //TODO: VPSCATTERQD X20, K1, (DX)(Y10*4)                   // 62a27d29a12492
-       //TODO: VPSCATTERQD Y1, K1, (DX)(Z10*4)                    // 62b27d49a10c92
-       //TODO: VPSCATTERQD Y1, K1, (AX)(Z4*1)                     // 62f27d49a10c20
-       //TODO: VPSCATTERQD Y1, K1, (SP)(Z4*2)                     // 62f27d49a10c64
-       //TODO: VPSCATTERQQ X7, K1, (DX)(X10*4)                    // 62b2fd09a13c92
-       //TODO: VPSCATTERQQ X7, K1, (SP)(X4*2)                     // 62f2fd09a13c64
-       //TODO: VPSCATTERQQ X7, K1, (R14)(X29*8)                   // 6292fd01a13cee
-       //TODO: VPSCATTERQQ Y9, K7, (R14)(Y29*8)                   // 6212fd27a10cee
-       //TODO: VPSCATTERQQ Y9, K7, (AX)(Y4*1)                     // 6272fd2fa10c20
-       //TODO: VPSCATTERQQ Y9, K7, (BP)(Y10*2)                    // 6232fd2fa14c5500
-       //TODO: VPSCATTERQQ Z12, K2, (BP)(Z10*2)                   // 6232fd4aa1645500
-       //TODO: VPSCATTERQQ Z13, K2, (BP)(Z10*2)                   // 6232fd4aa16c5500
-       //TODO: VPSCATTERQQ Z12, K2, (R10)(Z29*8)                  // 6212fd42a124ea
-       //TODO: VPSCATTERQQ Z13, K2, (R10)(Z29*8)                  // 6212fd42a12cea
-       //TODO: VPSCATTERQQ Z12, K2, (R14)(Z29*8)                  // 6212fd42a124ee
-       //TODO: VPSCATTERQQ Z13, K2, (R14)(Z29*8)                  // 6212fd42a12cee
-       //TODO: VPSHUFD $126, X2, K4, X9                           // 62717d0c70ca7e
-       //TODO: VPSHUFD $126, 17(SP)(BP*1), K4, X9                 // 62717d0c708c2c110000007e
-       //TODO: VPSHUFD $126, -7(CX)(DX*8), K4, X9                 // 62717d0c708cd1f9ffffff7e
-       //TODO: VPSHUFD $94, Y31, K4, Y6                           // 62917d2c70f75e
-       //TODO: VPSHUFD $94, 17(SP)(BP*2), K4, Y6                  // 62f17d2c70b46c110000005e
-       //TODO: VPSHUFD $94, -7(DI)(R8*4), K4, Y6                  // 62b17d2c70b487f9ffffff5e
-       //TODO: VPSHUFD $121, Z3, K7, Z8                           // 62717d4f70c379
-       //TODO: VPSHUFD $121, Z27, K7, Z8                          // 62117d4f70c379
-       //TODO: VPSHUFD $121, 7(AX)(CX*4), K7, Z8                  // 62717d4f7084880700000079
-       //TODO: VPSHUFD $121, 7(AX)(CX*1), K7, Z8                  // 62717d4f7084080700000079
-       //TODO: VPSHUFD $121, Z3, K7, Z2                           // 62f17d4f70d379
-       //TODO: VPSHUFD $121, Z27, K7, Z2                          // 62917d4f70d379
-       //TODO: VPSHUFD $121, 7(AX)(CX*4), K7, Z2                  // 62f17d4f7094880700000079
-       //TODO: VPSHUFD $121, 7(AX)(CX*1), K7, Z2                  // 62f17d4f7094080700000079
-       //TODO: VPSLLD $81, X0, K3, X14                            // 62f10d0b72f051
-       //TODO: VPSLLD $81, (R14), K3, X14                         // 62d10d0b723651
-       //TODO: VPSLLD $81, -7(DI)(R8*8), K3, X14                  // 62b10d0b72b4c7f9ffffff51
-       //TODO: VPSLLD $42, Y0, K3, Y6                             // 62f14d2b72f02a
-       //TODO: VPSLLD $42, -15(R14)(R15*1), K3, Y6                // 62914d2b72b43ef1ffffff2a
-       //TODO: VPSLLD $42, -15(BX), K3, Y6                        // 62f14d2b72b3f1ffffff2a
-       //TODO: VPSLLD $79, Z12, K3, Z9                            // 62d1354b72f44f
-       //TODO: VPSLLD $79, Z22, K3, Z9                            // 62b1354b72f64f
-       //TODO: VPSLLD $79, 7(SI)(DI*4), K3, Z9                    // 62f1354b72b4be070000004f
-       //TODO: VPSLLD $79, -7(DI)(R8*2), K3, Z9                   // 62b1354b72b447f9ffffff4f
-       //TODO: VPSLLD $79, Z12, K3, Z19                           // 62d1654372f44f
-       //TODO: VPSLLD $79, Z22, K3, Z19                           // 62b1654372f64f
-       //TODO: VPSLLD $79, 7(SI)(DI*4), K3, Z19                   // 62f1654372b4be070000004f
-       //TODO: VPSLLD $79, -7(DI)(R8*2), K3, Z19                  // 62b1654372b447f9ffffff4f
-       //TODO: VPSLLD X15, X7, K2, X17                            // 62c1450af2cf
-       //TODO: VPSLLD 99(R15)(R15*4), X7, K2, X17                 // 6281450af28cbf63000000
-       //TODO: VPSLLD 15(DX), X7, K2, X17                         // 62e1450af28a0f000000
-       //TODO: VPSLLD X11, Y5, K1, Y3                             // 62d15529f2db
-       //TODO: VPSLLD (CX), Y5, K1, Y3                            // 62f15529f219
-       //TODO: VPSLLD 99(R15), Y5, K1, Y3                         // 62d15529f29f63000000
-       //TODO: VPSLLD X0, Z18, K2, Z11                            // 62716d42f2d8
-       //TODO: VPSLLD 99(R15)(R15*2), Z18, K2, Z11                // 62116d42f29c7f63000000
-       //TODO: VPSLLD -7(DI), Z18, K2, Z11                        // 62716d42f29ff9ffffff
-       //TODO: VPSLLD X0, Z24, K2, Z11                            // 62713d42f2d8
-       //TODO: VPSLLD 99(R15)(R15*2), Z24, K2, Z11                // 62113d42f29c7f63000000
-       //TODO: VPSLLD -7(DI), Z24, K2, Z11                        // 62713d42f29ff9ffffff
-       //TODO: VPSLLD X0, Z18, K2, Z5                             // 62f16d42f2e8
-       //TODO: VPSLLD 99(R15)(R15*2), Z18, K2, Z5                 // 62916d42f2ac7f63000000
-       //TODO: VPSLLD -7(DI), Z18, K2, Z5                         // 62f16d42f2aff9ffffff
-       //TODO: VPSLLD X0, Z24, K2, Z5                             // 62f13d42f2e8
-       //TODO: VPSLLD 99(R15)(R15*2), Z24, K2, Z5                 // 62913d42f2ac7f63000000
-       //TODO: VPSLLD -7(DI), Z24, K2, Z5                         // 62f13d42f2aff9ffffff
-       //TODO: VPSLLQ $82, X25, K1, X27                           // 6291a50173f152
-       //TODO: VPSLLQ $82, 15(DX)(BX*1), K1, X27                  // 62f1a50173b41a0f00000052
-       //TODO: VPSLLQ $82, -7(CX)(DX*2), K1, X27                  // 62f1a50173b451f9ffffff52
-       //TODO: VPSLLQ $126, Y5, K7, Y3                            // 62f1e52f73f57e
-       //TODO: VPSLLQ $126, (SI), K7, Y3                          // 62f1e52f73367e
-       //TODO: VPSLLQ $126, 7(SI)(DI*2), K7, Y3                   // 62f1e52f73b47e070000007e
-       //TODO: VPSLLQ $94, Z6, K1, Z6                             // 62f1cd4973f65e
-       //TODO: VPSLLQ $94, Z22, K1, Z6                            // 62b1cd4973f65e
-       //TODO: VPSLLQ $94, 7(AX), K1, Z6                          // 62f1cd4973b0070000005e
-       //TODO: VPSLLQ $94, (DI), K1, Z6                           // 62f1cd4973375e
-       //TODO: VPSLLQ $94, Z6, K1, Z16                            // 62f1fd4173f65e
-       //TODO: VPSLLQ $94, Z22, K1, Z16                           // 62b1fd4173f65e
-       //TODO: VPSLLQ $94, 7(AX), K1, Z16                         // 62f1fd4173b0070000005e
-       //TODO: VPSLLQ $94, (DI), K1, Z16                          // 62f1fd4173375e
-       //TODO: VPSLLQ X15, X18, K1, X3                            // 62d1ed01f3df
-       //TODO: VPSLLQ -17(BP), X18, K1, X3                        // 62f1ed01f39defffffff
-       //TODO: VPSLLQ -15(R14)(R15*8), X18, K1, X3                // 6291ed01f39cfef1ffffff
-       //TODO: VPSLLQ X28, Y7, K1, Y28                            // 6201c529f3e4
-       //TODO: VPSLLQ 17(SP)(BP*2), Y7, K1, Y28                   // 6261c529f3a46c11000000
-       //TODO: VPSLLQ -7(DI)(R8*4), Y7, K1, Y28                   // 6221c529f3a487f9ffffff
-       //TODO: VPSLLQ X15, Z13, K7, Z1                            // 62d1954ff3cf
-       //TODO: VPSLLQ 15(R8), Z13, K7, Z1                         // 62d1954ff3880f000000
-       //TODO: VPSLLQ (BP), Z13, K7, Z1                           // 62f1954ff34d00
-       //TODO: VPSLLQ X15, Z13, K7, Z15                           // 6251954ff3ff
-       //TODO: VPSLLQ 15(R8), Z13, K7, Z15                        // 6251954ff3b80f000000
-       //TODO: VPSLLQ (BP), Z13, K7, Z15                          // 6271954ff37d00
-       //TODO: VPSLLVD X8, X13, K2, X7                            // 62d2150a47f8
-       //TODO: VPSLLVD 15(R8)(R14*8), X13, K2, X7                 // 6292150a47bcf00f000000
-       //TODO: VPSLLVD -15(R14)(R15*2), X13, K2, X7               // 6292150a47bc7ef1ffffff
-       //TODO: VPSLLVD Y13, Y22, K4, Y0                           // 62d24d2447c5
-       //TODO: VPSLLVD 17(SP)(BP*8), Y22, K4, Y0                  // 62f24d244784ec11000000
-       //TODO: VPSLLVD 17(SP)(BP*4), Y22, K4, Y0                  // 62f24d244784ac11000000
-       //TODO: VPSLLVD Z2, Z22, K1, Z18                           // 62e24d4147d2
-       //TODO: VPSLLVD Z31, Z22, K1, Z18                          // 62824d4147d7
-       //TODO: VPSLLVD 99(R15)(R15*1), Z22, K1, Z18               // 62824d4147943f63000000
-       //TODO: VPSLLVD (DX), Z22, K1, Z18                         // 62e24d414712
-       //TODO: VPSLLVD Z2, Z7, K1, Z18                            // 62e2454947d2
-       //TODO: VPSLLVD Z31, Z7, K1, Z18                           // 6282454947d7
-       //TODO: VPSLLVD 99(R15)(R15*1), Z7, K1, Z18                // 6282454947943f63000000
-       //TODO: VPSLLVD (DX), Z7, K1, Z18                          // 62e245494712
-       //TODO: VPSLLVD Z2, Z22, K1, Z8                            // 62724d4147c2
-       //TODO: VPSLLVD Z31, Z22, K1, Z8                           // 62124d4147c7
-       //TODO: VPSLLVD 99(R15)(R15*1), Z22, K1, Z8                // 62124d4147843f63000000
-       //TODO: VPSLLVD (DX), Z22, K1, Z8                          // 62724d414702
-       //TODO: VPSLLVD Z2, Z7, K1, Z8                             // 6272454947c2
-       //TODO: VPSLLVD Z31, Z7, K1, Z8                            // 6212454947c7
-       //TODO: VPSLLVD 99(R15)(R15*1), Z7, K1, Z8                 // 6212454947843f63000000
-       //TODO: VPSLLVD (DX), Z7, K1, Z8                           // 627245494702
-       //TODO: VPSLLVQ X0, X7, K3, X24                            // 6262c50b47c0
-       //TODO: VPSLLVQ -15(R14)(R15*1), X7, K3, X24               // 6202c50b47843ef1ffffff
-       //TODO: VPSLLVQ -15(BX), X7, K3, X24                       // 6262c50b4783f1ffffff
-       //TODO: VPSLLVQ Y14, Y1, K4, Y12                           // 6252f52c47e6
-       //TODO: VPSLLVQ 7(SI)(DI*4), Y1, K4, Y12                   // 6272f52c47a4be07000000
-       //TODO: VPSLLVQ -7(DI)(R8*2), Y1, K4, Y12                  // 6232f52c47a447f9ffffff
-       //TODO: VPSLLVQ Z12, Z1, K5, Z20                           // 62c2f54d47e4
-       //TODO: VPSLLVQ Z16, Z1, K5, Z20                           // 62a2f54d47e0
-       //TODO: VPSLLVQ -17(BP)(SI*8), Z1, K5, Z20                 // 62e2f54d47a4f5efffffff
-       //TODO: VPSLLVQ (R15), Z1, K5, Z20                         // 62c2f54d4727
-       //TODO: VPSLLVQ Z12, Z3, K5, Z20                           // 62c2e54d47e4
-       //TODO: VPSLLVQ Z16, Z3, K5, Z20                           // 62a2e54d47e0
-       //TODO: VPSLLVQ -17(BP)(SI*8), Z3, K5, Z20                 // 62e2e54d47a4f5efffffff
-       //TODO: VPSLLVQ (R15), Z3, K5, Z20                         // 62c2e54d4727
-       //TODO: VPSLLVQ Z12, Z1, K5, Z9                            // 6252f54d47cc
-       //TODO: VPSLLVQ Z16, Z1, K5, Z9                            // 6232f54d47c8
-       //TODO: VPSLLVQ -17(BP)(SI*8), Z1, K5, Z9                  // 6272f54d478cf5efffffff
-       //TODO: VPSLLVQ (R15), Z1, K5, Z9                          // 6252f54d470f
-       //TODO: VPSLLVQ Z12, Z3, K5, Z9                            // 6252e54d47cc
-       //TODO: VPSLLVQ Z16, Z3, K5, Z9                            // 6232e54d47c8
-       //TODO: VPSLLVQ -17(BP)(SI*8), Z3, K5, Z9                  // 6272e54d478cf5efffffff
-       //TODO: VPSLLVQ (R15), Z3, K5, Z9                          // 6252e54d470f
-       //TODO: VPSRAD $67, X7, K5, X24                            // 62f13d0572e743
-       //TODO: VPSRAD $67, 7(AX), K5, X24                         // 62f13d0572a00700000043
-       //TODO: VPSRAD $67, (DI), K5, X24                          // 62f13d05722743
-       //TODO: VPSRAD $127, Y7, K3, Y13                           // 62f1152b72e77f
-       //TODO: VPSRAD $127, 99(R15)(R15*1), K3, Y13               // 6291152b72a43f630000007f
-       //TODO: VPSRAD $127, (DX), K3, Y13                         // 62f1152b72227f
-       //TODO: VPSRAD $0, Z21, K4, Z14                            // 62b10d4c72e500
-       //TODO: VPSRAD $0, Z8, K4, Z14                             // 62d10d4c72e000
-       //TODO: VPSRAD $0, -7(DI)(R8*1), K4, Z14                   // 62b10d4c72a407f9ffffff00
-       //TODO: VPSRAD $0, (SP), K4, Z14                           // 62f10d4c72242400
-       //TODO: VPSRAD $0, Z21, K4, Z15                            // 62b1054c72e500
-       //TODO: VPSRAD $0, Z8, K4, Z15                             // 62d1054c72e000
-       //TODO: VPSRAD $0, -7(DI)(R8*1), K4, Z15                   // 62b1054c72a407f9ffffff00
-       //TODO: VPSRAD $0, (SP), K4, Z15                           // 62f1054c72242400
-       //TODO: VPSRAD X12, X16, K2, X20                           // 62c17d02e2e4
-       //TODO: VPSRAD 99(R15)(R15*1), X16, K2, X20                // 62817d02e2a43f63000000
-       //TODO: VPSRAD (DX), X16, K2, X20                          // 62e17d02e222
-       //TODO: VPSRAD X6, Y21, K2, Y2                             // 62f15522e2d6
-       //TODO: VPSRAD -17(BP)(SI*8), Y21, K2, Y2                  // 62f15522e294f5efffffff
-       //TODO: VPSRAD (R15), Y21, K2, Y2                          // 62d15522e217
-       //TODO: VPSRAD X17, Z20, K3, Z16                           // 62a15d43e2c1
-       //TODO: VPSRAD 7(SI)(DI*8), Z20, K3, Z16                   // 62e15d43e284fe07000000
-       //TODO: VPSRAD -15(R14), Z20, K3, Z16                      // 62c15d43e286f1ffffff
-       //TODO: VPSRAD X17, Z0, K3, Z16                            // 62a17d4be2c1
-       //TODO: VPSRAD 7(SI)(DI*8), Z0, K3, Z16                    // 62e17d4be284fe07000000
-       //TODO: VPSRAD -15(R14), Z0, K3, Z16                       // 62c17d4be286f1ffffff
-       //TODO: VPSRAD X17, Z20, K3, Z9                            // 62315d43e2c9
-       //TODO: VPSRAD 7(SI)(DI*8), Z20, K3, Z9                    // 62715d43e28cfe07000000
-       //TODO: VPSRAD -15(R14), Z20, K3, Z9                       // 62515d43e28ef1ffffff
-       //TODO: VPSRAD X17, Z0, K3, Z9                             // 62317d4be2c9
-       //TODO: VPSRAD 7(SI)(DI*8), Z0, K3, Z9                     // 62717d4be28cfe07000000
-       //TODO: VPSRAD -15(R14), Z0, K3, Z9                        // 62517d4be28ef1ffffff
-       //TODO: VPSRAQ $97, X6, K3, X28                            // 62f19d0372e661
-       //TODO: VPSRAQ $97, 7(SI)(DI*1), K3, X28                   // 62f19d0372a43e0700000061
-       //TODO: VPSRAQ $97, 15(DX)(BX*8), K3, X28                  // 62f19d0372a4da0f00000061
-       //TODO: VPSRAQ $81, Y9, K3, Y12                            // 62d19d2b72e151
-       //TODO: VPSRAQ $81, -17(BP)(SI*8), K3, Y12                 // 62f19d2b72a4f5efffffff51
-       //TODO: VPSRAQ $81, (R15), K3, Y12                         // 62d19d2b722751
-       //TODO: VPSRAQ $42, Z0, K2, Z23                            // 62f1c54272e02a
-       //TODO: VPSRAQ $42, Z11, K2, Z23                           // 62d1c54272e32a
-       //TODO: VPSRAQ $42, -7(CX), K2, Z23                        // 62f1c54272a1f9ffffff2a
-       //TODO: VPSRAQ $42, 15(DX)(BX*4), K2, Z23                  // 62f1c54272a49a0f0000002a
-       //TODO: VPSRAQ $42, Z0, K2, Z19                            // 62f1e54272e02a
-       //TODO: VPSRAQ $42, Z11, K2, Z19                           // 62d1e54272e32a
-       //TODO: VPSRAQ $42, -7(CX), K2, Z19                        // 62f1e54272a1f9ffffff2a
-       //TODO: VPSRAQ $42, 15(DX)(BX*4), K2, Z19                  // 62f1e54272a49a0f0000002a
-       //TODO: VPSRAQ X8, X8, K1, X1                              // 62d1bd09e2c8
-       //TODO: VPSRAQ -7(DI)(R8*1), X8, K1, X1                    // 62b1bd09e28c07f9ffffff
-       //TODO: VPSRAQ (SP), X8, K1, X1                            // 62f1bd09e20c24
-       //TODO: VPSRAQ X6, Y9, K2, Y1                              // 62f1b52ae2ce
-       //TODO: VPSRAQ -7(CX), Y9, K2, Y1                          // 62f1b52ae289f9ffffff
-       //TODO: VPSRAQ 15(DX)(BX*4), Y9, K2, Y1                    // 62f1b52ae28c9a0f000000
-       //TODO: VPSRAQ X0, Z24, K1, Z0                             // 62f1bd41e2c0
-       //TODO: VPSRAQ 99(R15)(R15*8), Z24, K1, Z0                 // 6291bd41e284ff63000000
-       //TODO: VPSRAQ 7(AX)(CX*8), Z24, K1, Z0                    // 62f1bd41e284c807000000
-       //TODO: VPSRAQ X0, Z12, K1, Z0                             // 62f19d49e2c0
-       //TODO: VPSRAQ 99(R15)(R15*8), Z12, K1, Z0                 // 62919d49e284ff63000000
-       //TODO: VPSRAQ 7(AX)(CX*8), Z12, K1, Z0                    // 62f19d49e284c807000000
-       //TODO: VPSRAQ X0, Z24, K1, Z25                            // 6261bd41e2c8
-       //TODO: VPSRAQ 99(R15)(R15*8), Z24, K1, Z25                // 6201bd41e28cff63000000
-       //TODO: VPSRAQ 7(AX)(CX*8), Z24, K1, Z25                   // 6261bd41e28cc807000000
-       //TODO: VPSRAQ X0, Z12, K1, Z25                            // 62619d49e2c8
-       //TODO: VPSRAQ 99(R15)(R15*8), Z12, K1, Z25                // 62019d49e28cff63000000
-       //TODO: VPSRAQ 7(AX)(CX*8), Z12, K1, Z25                   // 62619d49e28cc807000000
-       //TODO: VPSRAVD X6, X16, K7, X11                           // 62727d0746de
-       //TODO: VPSRAVD (AX), X16, K7, X11                         // 62727d074618
-       //TODO: VPSRAVD 7(SI), X16, K7, X11                        // 62727d07469e07000000
-       //TODO: VPSRAVD Y9, Y2, K1, Y3                             // 62d26d2946d9
-       //TODO: VPSRAVD 7(SI)(DI*8), Y2, K1, Y3                    // 62f26d29469cfe07000000
-       //TODO: VPSRAVD -15(R14), Y2, K1, Y3                       // 62d26d29469ef1ffffff
-       //TODO: VPSRAVD Z9, Z9, K1, Z0                             // 62d2354946c1
-       //TODO: VPSRAVD Z25, Z9, K1, Z0                            // 6292354946c1
-       //TODO: VPSRAVD 99(R15)(R15*8), Z9, K1, Z0                 // 629235494684ff63000000
-       //TODO: VPSRAVD 7(AX)(CX*8), Z9, K1, Z0                    // 62f235494684c807000000
-       //TODO: VPSRAVD Z9, Z3, K1, Z0                             // 62d2654946c1
-       //TODO: VPSRAVD Z25, Z3, K1, Z0                            // 6292654946c1
-       //TODO: VPSRAVD 99(R15)(R15*8), Z3, K1, Z0                 // 629265494684ff63000000
-       //TODO: VPSRAVD 7(AX)(CX*8), Z3, K1, Z0                    // 62f265494684c807000000
-       //TODO: VPSRAVD Z9, Z9, K1, Z26                            // 6242354946d1
-       //TODO: VPSRAVD Z25, Z9, K1, Z26                           // 6202354946d1
-       //TODO: VPSRAVD 99(R15)(R15*8), Z9, K1, Z26                // 620235494694ff63000000
-       //TODO: VPSRAVD 7(AX)(CX*8), Z9, K1, Z26                   // 626235494694c807000000
-       //TODO: VPSRAVD Z9, Z3, K1, Z26                            // 6242654946d1
-       //TODO: VPSRAVD Z25, Z3, K1, Z26                           // 6202654946d1
-       //TODO: VPSRAVD 99(R15)(R15*8), Z3, K1, Z26                // 620265494694ff63000000
-       //TODO: VPSRAVD 7(AX)(CX*8), Z3, K1, Z26                   // 626265494694c807000000
-       //TODO: VPSRAVQ X12, X22, K1, X6                           // 62d2cd0146f4
-       //TODO: VPSRAVQ (BX), X22, K1, X6                          // 62f2cd014633
-       //TODO: VPSRAVQ -17(BP)(SI*1), X22, K1, X6                 // 62f2cd0146b435efffffff
-       //TODO: VPSRAVQ Y14, Y21, K7, Y12                          // 6252d52746e6
-       //TODO: VPSRAVQ 7(SI)(DI*1), Y21, K7, Y12                  // 6272d52746a43e07000000
-       //TODO: VPSRAVQ 15(DX)(BX*8), Y21, K7, Y12                 // 6272d52746a4da0f000000
-       //TODO: VPSRAVQ Z17, Z20, K2, Z9                           // 6232dd4246c9
-       //TODO: VPSRAVQ Z0, Z20, K2, Z9                            // 6272dd4246c8
-       //TODO: VPSRAVQ (AX), Z20, K2, Z9                          // 6272dd424608
-       //TODO: VPSRAVQ 7(SI), Z20, K2, Z9                         // 6272dd42468e07000000
-       //TODO: VPSRAVQ Z17, Z0, K2, Z9                            // 6232fd4a46c9
-       //TODO: VPSRAVQ Z0, Z0, K2, Z9                             // 6272fd4a46c8
-       //TODO: VPSRAVQ (AX), Z0, K2, Z9                           // 6272fd4a4608
-       //TODO: VPSRAVQ 7(SI), Z0, K2, Z9                          // 6272fd4a468e07000000
-       //TODO: VPSRAVQ Z17, Z20, K2, Z28                          // 6222dd4246e1
-       //TODO: VPSRAVQ Z0, Z20, K2, Z28                           // 6262dd4246e0
-       //TODO: VPSRAVQ (AX), Z20, K2, Z28                         // 6262dd424620
-       //TODO: VPSRAVQ 7(SI), Z20, K2, Z28                        // 6262dd4246a607000000
-       //TODO: VPSRAVQ Z17, Z0, K2, Z28                           // 6222fd4a46e1
-       //TODO: VPSRAVQ Z0, Z0, K2, Z28                            // 6262fd4a46e0
-       //TODO: VPSRAVQ (AX), Z0, K2, Z28                          // 6262fd4a4620
-       //TODO: VPSRAVQ 7(SI), Z0, K2, Z28                         // 6262fd4a46a607000000
-       //TODO: VPSRLD $47, X0, K7, X0                             // 62f17d0f72d02f
-       //TODO: VPSRLD $47, (R14), K7, X0                          // 62d17d0f72162f
-       //TODO: VPSRLD $47, -7(DI)(R8*8), K7, X0                   // 62b17d0f7294c7f9ffffff2f
-       //TODO: VPSRLD $82, Y6, K4, Y22                            // 62f14d2472d652
-       //TODO: VPSRLD $82, 99(R15)(R15*8), K4, Y22                // 62914d247294ff6300000052
-       //TODO: VPSRLD $82, 7(AX)(CX*8), K4, Y22                   // 62f14d247294c80700000052
-       //TODO: VPSRLD $126, Z7, K4, Z26                           // 62f12d4472d77e
-       //TODO: VPSRLD $126, Z21, K4, Z26                          // 62b12d4472d57e
-       //TODO: VPSRLD $126, (R8), K4, Z26                         // 62d12d4472107e
-       //TODO: VPSRLD $126, 15(DX)(BX*2), K4, Z26                 // 62f12d4472945a0f0000007e
-       //TODO: VPSRLD $126, Z7, K4, Z22                           // 62f14d4472d77e
-       //TODO: VPSRLD $126, Z21, K4, Z22                          // 62b14d4472d57e
-       //TODO: VPSRLD $126, (R8), K4, Z22                         // 62d14d4472107e
-       //TODO: VPSRLD $126, 15(DX)(BX*2), K4, Z22                 // 62f14d4472945a0f0000007e
-       //TODO: VPSRLD X17, X11, K7, X25                           // 6221250fd2c9
-       //TODO: VPSRLD 99(R15)(R15*4), X11, K7, X25                // 6201250fd28cbf63000000
-       //TODO: VPSRLD 15(DX), X11, K7, X25                        // 6261250fd28a0f000000
-       //TODO: VPSRLD X18, Y7, K2, Y21                            // 62a1452ad2ea
-       //TODO: VPSRLD (CX), Y7, K2, Y21                           // 62e1452ad229
-       //TODO: VPSRLD 99(R15), Y7, K2, Y21                        // 62c1452ad2af63000000
-       //TODO: VPSRLD X11, Z14, K5, Z16                           // 62c10d4dd2c3
-       //TODO: VPSRLD 99(R15)(R15*2), Z14, K5, Z16                // 62810d4dd2847f63000000
-       //TODO: VPSRLD -7(DI), Z14, K5, Z16                        // 62e10d4dd287f9ffffff
-       //TODO: VPSRLD X11, Z13, K5, Z16                           // 62c1154dd2c3
-       //TODO: VPSRLD 99(R15)(R15*2), Z13, K5, Z16                // 6281154dd2847f63000000
-       //TODO: VPSRLD -7(DI), Z13, K5, Z16                        // 62e1154dd287f9ffffff
-       //TODO: VPSRLD X11, Z14, K5, Z25                           // 62410d4dd2cb
-       //TODO: VPSRLD 99(R15)(R15*2), Z14, K5, Z25                // 62010d4dd28c7f63000000
-       //TODO: VPSRLD -7(DI), Z14, K5, Z25                        // 62610d4dd28ff9ffffff
-       //TODO: VPSRLD X11, Z13, K5, Z25                           // 6241154dd2cb
-       //TODO: VPSRLD 99(R15)(R15*2), Z13, K5, Z25                // 6201154dd28c7f63000000
-       //TODO: VPSRLD -7(DI), Z13, K5, Z25                        // 6261154dd28ff9ffffff
-       //TODO: VPSRLQ $65, X2, K3, X24                            // 62f1bd0373d241
-       //TODO: VPSRLQ $65, 15(DX)(BX*1), K3, X24                  // 62f1bd0373941a0f00000041
-       //TODO: VPSRLQ $65, -7(CX)(DX*2), K3, X24                  // 62f1bd03739451f9ffffff41
-       //TODO: VPSRLQ $67, Y14, K4, Y20                           // 62d1dd2473d643
-       //TODO: VPSRLQ $67, (BX), K4, Y20                          // 62f1dd24731343
-       //TODO: VPSRLQ $67, -17(BP)(SI*1), K4, Y20                 // 62f1dd24739435efffffff43
-       //TODO: VPSRLQ $127, Z27, K2, Z2                           // 6291ed4a73d37f
-       //TODO: VPSRLQ $127, Z25, K2, Z2                           // 6291ed4a73d17f
-       //TODO: VPSRLQ $127, -17(BP)(SI*2), K2, Z2                 // 62f1ed4a739475efffffff7f
-       //TODO: VPSRLQ $127, 7(AX)(CX*2), K2, Z2                   // 62f1ed4a739448070000007f
-       //TODO: VPSRLQ $127, Z27, K2, Z7                           // 6291c54a73d37f
-       //TODO: VPSRLQ $127, Z25, K2, Z7                           // 6291c54a73d17f
-       //TODO: VPSRLQ $127, -17(BP)(SI*2), K2, Z7                 // 62f1c54a739475efffffff7f
-       //TODO: VPSRLQ $127, 7(AX)(CX*2), K2, Z7                   // 62f1c54a739448070000007f
-       //TODO: VPSRLQ X26, X27, K2, X2                            // 6291a502d3d2
-       //TODO: VPSRLQ -17(BP), X27, K2, X2                        // 62f1a502d395efffffff
-       //TODO: VPSRLQ -15(R14)(R15*8), X27, K2, X2                // 6291a502d394fef1ffffff
-       //TODO: VPSRLQ X22, Y13, K3, Y24                           // 6221952bd3c6
-       //TODO: VPSRLQ 17(SP)(BP*2), Y13, K3, Y24                  // 6261952bd3846c11000000
-       //TODO: VPSRLQ -7(DI)(R8*4), Y13, K3, Y24                  // 6221952bd38487f9ffffff
-       //TODO: VPSRLQ X30, Z27, K3, Z23                           // 6281a543d3fe
-       //TODO: VPSRLQ 15(R8), Z27, K3, Z23                        // 62c1a543d3b80f000000
-       //TODO: VPSRLQ (BP), Z27, K3, Z23                          // 62e1a543d37d00
-       //TODO: VPSRLQ X30, Z14, K3, Z23                           // 62818d4bd3fe
-       //TODO: VPSRLQ 15(R8), Z14, K3, Z23                        // 62c18d4bd3b80f000000
-       //TODO: VPSRLQ (BP), Z14, K3, Z23                          // 62e18d4bd37d00
-       //TODO: VPSRLQ X30, Z27, K3, Z9                            // 6211a543d3ce
-       //TODO: VPSRLQ 15(R8), Z27, K3, Z9                         // 6251a543d3880f000000
-       //TODO: VPSRLQ (BP), Z27, K3, Z9                           // 6271a543d34d00
-       //TODO: VPSRLQ X30, Z14, K3, Z9                            // 62118d4bd3ce
-       //TODO: VPSRLQ 15(R8), Z14, K3, Z9                         // 62518d4bd3880f000000
-       //TODO: VPSRLQ (BP), Z14, K3, Z9                           // 62718d4bd34d00
-       //TODO: VPSRLVD X15, X11, K3, X3                           // 62d2250b45df
-       //TODO: VPSRLVD 15(R8)(R14*8), X11, K3, X3                 // 6292250b459cf00f000000
-       //TODO: VPSRLVD -15(R14)(R15*2), X11, K3, X3               // 6292250b459c7ef1ffffff
-       //TODO: VPSRLVD Y21, Y14, K2, Y20                          // 62a20d2a45e5
-       //TODO: VPSRLVD 15(R8)(R14*4), Y14, K2, Y20                // 62820d2a45a4b00f000000
-       //TODO: VPSRLVD -7(CX)(DX*4), Y14, K2, Y20                 // 62e20d2a45a491f9ffffff
-       //TODO: VPSRLVD Z8, Z14, K1, Z3                            // 62d20d4945d8
-       //TODO: VPSRLVD Z24, Z14, K1, Z3                           // 62920d4945d8
-       //TODO: VPSRLVD 15(R8)(R14*1), Z14, K1, Z3                 // 62920d49459c300f000000
-       //TODO: VPSRLVD 15(R8)(R14*2), Z14, K1, Z3                 // 62920d49459c700f000000
-       //TODO: VPSRLVD Z8, Z7, K1, Z3                             // 62d2454945d8
-       //TODO: VPSRLVD Z24, Z7, K1, Z3                            // 6292454945d8
-       //TODO: VPSRLVD 15(R8)(R14*1), Z7, K1, Z3                  // 62924549459c300f000000
-       //TODO: VPSRLVD 15(R8)(R14*2), Z7, K1, Z3                  // 62924549459c700f000000
-       //TODO: VPSRLVD Z8, Z14, K1, Z0                            // 62d20d4945c0
-       //TODO: VPSRLVD Z24, Z14, K1, Z0                           // 62920d4945c0
-       //TODO: VPSRLVD 15(R8)(R14*1), Z14, K1, Z0                 // 62920d494584300f000000
-       //TODO: VPSRLVD 15(R8)(R14*2), Z14, K1, Z0                 // 62920d494584700f000000
-       //TODO: VPSRLVD Z8, Z7, K1, Z0                             // 62d2454945c0
-       //TODO: VPSRLVD Z24, Z7, K1, Z0                            // 6292454945c0
-       //TODO: VPSRLVD 15(R8)(R14*1), Z7, K1, Z0                  // 629245494584300f000000
-       //TODO: VPSRLVD 15(R8)(R14*2), Z7, K1, Z0                  // 629245494584700f000000
-       //TODO: VPSRLVQ X6, X13, K2, X30                           // 6262950a45f6
-       //TODO: VPSRLVQ -15(R14)(R15*1), X13, K2, X30              // 6202950a45b43ef1ffffff
-       //TODO: VPSRLVQ -15(BX), X13, K2, X30                      // 6262950a45b3f1ffffff
-       //TODO: VPSRLVQ Y30, Y26, K1, Y1                           // 6292ad2145ce
-       //TODO: VPSRLVQ (R8), Y26, K1, Y1                          // 62d2ad214508
-       //TODO: VPSRLVQ 15(DX)(BX*2), Y26, K1, Y1                  // 62f2ad21458c5a0f000000
-       //TODO: VPSRLVQ Z6, Z1, K7, Z22                            // 62e2f54f45f6
-       //TODO: VPSRLVQ Z2, Z1, K7, Z22                            // 62e2f54f45f2
-       //TODO: VPSRLVQ (R14), Z1, K7, Z22                         // 62c2f54f4536
-       //TODO: VPSRLVQ -7(DI)(R8*8), Z1, K7, Z22                  // 62a2f54f45b4c7f9ffffff
-       //TODO: VPSRLVQ Z6, Z16, K7, Z22                           // 62e2fd4745f6
-       //TODO: VPSRLVQ Z2, Z16, K7, Z22                           // 62e2fd4745f2
-       //TODO: VPSRLVQ (R14), Z16, K7, Z22                        // 62c2fd474536
-       //TODO: VPSRLVQ -7(DI)(R8*8), Z16, K7, Z22                 // 62a2fd4745b4c7f9ffffff
-       //TODO: VPSRLVQ Z6, Z1, K7, Z25                            // 6262f54f45ce
-       //TODO: VPSRLVQ Z2, Z1, K7, Z25                            // 6262f54f45ca
-       //TODO: VPSRLVQ (R14), Z1, K7, Z25                         // 6242f54f450e
-       //TODO: VPSRLVQ -7(DI)(R8*8), Z1, K7, Z25                  // 6222f54f458cc7f9ffffff
-       //TODO: VPSRLVQ Z6, Z16, K7, Z25                           // 6262fd4745ce
-       //TODO: VPSRLVQ Z2, Z16, K7, Z25                           // 6262fd4745ca
-       //TODO: VPSRLVQ (R14), Z16, K7, Z25                        // 6242fd47450e
-       //TODO: VPSRLVQ -7(DI)(R8*8), Z16, K7, Z25                 // 6222fd47458cc7f9ffffff
-       //TODO: VPSUBD X0, X1, K6, X8                              // 6271750efac0
-       //TODO: VPSUBD 99(R15)(R15*1), X1, K6, X8                  // 6211750efa843f63000000
-       //TODO: VPSUBD (DX), X1, K6, X8                            // 6271750efa02
-       //TODO: VPSUBD Y30, Y7, K3, Y21                            // 6281452bfaee
-       //TODO: VPSUBD (R14), Y7, K3, Y21                          // 62c1452bfa2e
-       //TODO: VPSUBD -7(DI)(R8*8), Y7, K3, Y21                   // 62a1452bfaacc7f9ffffff
-       //TODO: VPSUBD Z3, Z26, K7, Z13                            // 62712d47faeb
-       //TODO: VPSUBD Z0, Z26, K7, Z13                            // 62712d47fae8
-       //TODO: VPSUBD -7(CX)(DX*1), Z26, K7, Z13                  // 62712d47faac11f9ffffff
-       //TODO: VPSUBD -15(R14)(R15*4), Z26, K7, Z13               // 62112d47faacbef1ffffff
-       //TODO: VPSUBD Z3, Z3, K7, Z13                             // 6271654ffaeb
-       //TODO: VPSUBD Z0, Z3, K7, Z13                             // 6271654ffae8
-       //TODO: VPSUBD -7(CX)(DX*1), Z3, K7, Z13                   // 6271654ffaac11f9ffffff
-       //TODO: VPSUBD -15(R14)(R15*4), Z3, K7, Z13                // 6211654ffaacbef1ffffff
-       //TODO: VPSUBD Z3, Z26, K7, Z21                            // 62e12d47faeb
-       //TODO: VPSUBD Z0, Z26, K7, Z21                            // 62e12d47fae8
-       //TODO: VPSUBD -7(CX)(DX*1), Z26, K7, Z21                  // 62e12d47faac11f9ffffff
-       //TODO: VPSUBD -15(R14)(R15*4), Z26, K7, Z21               // 62812d47faacbef1ffffff
-       //TODO: VPSUBD Z3, Z3, K7, Z21                             // 62e1654ffaeb
-       //TODO: VPSUBD Z0, Z3, K7, Z21                             // 62e1654ffae8
-       //TODO: VPSUBD -7(CX)(DX*1), Z3, K7, Z21                   // 62e1654ffaac11f9ffffff
-       //TODO: VPSUBD -15(R14)(R15*4), Z3, K7, Z21                // 6281654ffaacbef1ffffff
-       //TODO: VPSUBQ X16, X0, K4, X15                            // 6231fd0cfbf8
-       //TODO: VPSUBQ -17(BP)(SI*8), X0, K4, X15                  // 6271fd0cfbbcf5efffffff
-       //TODO: VPSUBQ (R15), X0, K4, X15                          // 6251fd0cfb3f
-       //TODO: VPSUBQ Y24, Y18, K4, Y13                           // 6211ed24fbe8
-       //TODO: VPSUBQ 99(R15)(R15*4), Y18, K4, Y13                // 6211ed24fbacbf63000000
-       //TODO: VPSUBQ 15(DX), Y18, K4, Y13                        // 6271ed24fbaa0f000000
-       //TODO: VPSUBQ Z3, Z11, K7, Z21                            // 62e1a54ffbeb
-       //TODO: VPSUBQ Z12, Z11, K7, Z21                           // 62c1a54ffbec
-       //TODO: VPSUBQ 15(DX)(BX*1), Z11, K7, Z21                  // 62e1a54ffbac1a0f000000
-       //TODO: VPSUBQ -7(CX)(DX*2), Z11, K7, Z21                  // 62e1a54ffbac51f9ffffff
-       //TODO: VPSUBQ Z3, Z25, K7, Z21                            // 62e1b547fbeb
-       //TODO: VPSUBQ Z12, Z25, K7, Z21                           // 62c1b547fbec
-       //TODO: VPSUBQ 15(DX)(BX*1), Z25, K7, Z21                  // 62e1b547fbac1a0f000000
-       //TODO: VPSUBQ -7(CX)(DX*2), Z25, K7, Z21                  // 62e1b547fbac51f9ffffff
-       //TODO: VPSUBQ Z3, Z11, K7, Z13                            // 6271a54ffbeb
-       //TODO: VPSUBQ Z12, Z11, K7, Z13                           // 6251a54ffbec
-       //TODO: VPSUBQ 15(DX)(BX*1), Z11, K7, Z13                  // 6271a54ffbac1a0f000000
-       //TODO: VPSUBQ -7(CX)(DX*2), Z11, K7, Z13                  // 6271a54ffbac51f9ffffff
-       //TODO: VPSUBQ Z3, Z25, K7, Z13                            // 6271b547fbeb
-       //TODO: VPSUBQ Z12, Z25, K7, Z13                           // 6251b547fbec
-       //TODO: VPSUBQ 15(DX)(BX*1), Z25, K7, Z13                  // 6271b547fbac1a0f000000
-       //TODO: VPSUBQ -7(CX)(DX*2), Z25, K7, Z13                  // 6271b547fbac51f9ffffff
-       //TODO: VPTERNLOGD $42, X5, X14, K1, X12                   // 62730d0925e52a
-       //TODO: VPTERNLOGD $42, (AX), X14, K1, X12                 // 62730d0925202a
-       //TODO: VPTERNLOGD $42, 7(SI), X14, K1, X12                // 62730d0925a6070000002a
-       //TODO: VPTERNLOGD $79, Y12, Y26, K1, Y11                  // 62532d2125dc4f
-       //TODO: VPTERNLOGD $79, 17(SP)(BP*2), Y26, K1, Y11         // 62732d21259c6c110000004f
-       //TODO: VPTERNLOGD $79, -7(DI)(R8*4), Y26, K1, Y11         // 62332d21259c87f9ffffff4f
-       //TODO: VPTERNLOGD $64, Z0, Z7, K7, Z3                     // 62f3454f25d840
-       //TODO: VPTERNLOGD $64, Z6, Z7, K7, Z3                     // 62f3454f25de40
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*4), Z7, K7, Z3            // 62f3454f259c880700000040
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*1), Z7, K7, Z3            // 62f3454f259c080700000040
-       //TODO: VPTERNLOGD $64, Z0, Z9, K7, Z3                     // 62f3354f25d840
-       //TODO: VPTERNLOGD $64, Z6, Z9, K7, Z3                     // 62f3354f25de40
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*4), Z9, K7, Z3            // 62f3354f259c880700000040
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*1), Z9, K7, Z3            // 62f3354f259c080700000040
-       //TODO: VPTERNLOGD $64, Z0, Z7, K7, Z27                    // 6263454f25d840
-       //TODO: VPTERNLOGD $64, Z6, Z7, K7, Z27                    // 6263454f25de40
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*4), Z7, K7, Z27           // 6263454f259c880700000040
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*1), Z7, K7, Z27           // 6263454f259c080700000040
-       //TODO: VPTERNLOGD $64, Z0, Z9, K7, Z27                    // 6263354f25d840
-       //TODO: VPTERNLOGD $64, Z6, Z9, K7, Z27                    // 6263354f25de40
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*4), Z9, K7, Z27           // 6263354f259c880700000040
-       //TODO: VPTERNLOGD $64, 7(AX)(CX*1), Z9, K7, Z27           // 6263354f259c080700000040
-       //TODO: VPTERNLOGQ $27, X8, X15, K2, X17                   // 62c3850a25c81b
-       //TODO: VPTERNLOGQ $27, (BX), X15, K2, X17                 // 62e3850a250b1b
-       //TODO: VPTERNLOGQ $27, -17(BP)(SI*1), X15, K2, X17        // 62e3850a258c35efffffff1b
-       //TODO: VPTERNLOGQ $47, Y31, Y18, K4, Y14                  // 6213ed2425f72f
-       //TODO: VPTERNLOGQ $47, 15(R8), Y18, K4, Y14               // 6253ed2425b00f0000002f
-       //TODO: VPTERNLOGQ $47, (BP), Y18, K4, Y14                 // 6273ed242575002f
-       //TODO: VPTERNLOGQ $82, Z9, Z3, K1, Z20                    // 62c3e54925e152
-       //TODO: VPTERNLOGQ $82, Z19, Z3, K1, Z20                   // 62a3e54925e352
-       //TODO: VPTERNLOGQ $82, (SI), Z3, K1, Z20                  // 62e3e549252652
-       //TODO: VPTERNLOGQ $82, 7(SI)(DI*2), Z3, K1, Z20           // 62e3e54925a47e0700000052
-       //TODO: VPTERNLOGQ $82, Z9, Z30, K1, Z20                   // 62c38d4125e152
-       //TODO: VPTERNLOGQ $82, Z19, Z30, K1, Z20                  // 62a38d4125e352
-       //TODO: VPTERNLOGQ $82, (SI), Z30, K1, Z20                 // 62e38d41252652
-       //TODO: VPTERNLOGQ $82, 7(SI)(DI*2), Z30, K1, Z20          // 62e38d4125a47e0700000052
-       //TODO: VPTERNLOGQ $82, Z9, Z3, K1, Z28                    // 6243e54925e152
-       //TODO: VPTERNLOGQ $82, Z19, Z3, K1, Z28                   // 6223e54925e352
-       //TODO: VPTERNLOGQ $82, (SI), Z3, K1, Z28                  // 6263e549252652
-       //TODO: VPTERNLOGQ $82, 7(SI)(DI*2), Z3, K1, Z28           // 6263e54925a47e0700000052
-       //TODO: VPTERNLOGQ $82, Z9, Z30, K1, Z28                   // 62438d4125e152
-       //TODO: VPTERNLOGQ $82, Z19, Z30, K1, Z28                  // 62238d4125e352
-       //TODO: VPTERNLOGQ $82, (SI), Z30, K1, Z28                 // 62638d41252652
-       //TODO: VPTERNLOGQ $82, 7(SI)(DI*2), Z30, K1, Z28          // 62638d4125a47e0700000052
-       //TODO: VPTESTMD X13, X23, K7, K4                          // 62d2450727e5
-       //TODO: VPTESTMD (R8), X23, K7, K4                         // 62d245072720
-       //TODO: VPTESTMD 15(DX)(BX*2), X23, K7, K4                 // 62f2450727a45a0f000000
-       //TODO: VPTESTMD X13, X23, K7, K6                          // 62d2450727f5
-       //TODO: VPTESTMD (R8), X23, K7, K6                         // 62d245072730
-       //TODO: VPTESTMD 15(DX)(BX*2), X23, K7, K6                 // 62f2450727b45a0f000000
-       //TODO: VPTESTMD Y2, Y24, K7, K0                           // 62f23d2727c2
-       //TODO: VPTESTMD -15(R14)(R15*1), Y24, K7, K0              // 62923d2727843ef1ffffff
-       //TODO: VPTESTMD -15(BX), Y24, K7, K0                      // 62f23d272783f1ffffff
-       //TODO: VPTESTMD Y2, Y24, K7, K7                           // 62f23d2727fa
-       //TODO: VPTESTMD -15(R14)(R15*1), Y24, K7, K7              // 62923d2727bc3ef1ffffff
-       //TODO: VPTESTMD -15(BX), Y24, K7, K7                      // 62f23d2727bbf1ffffff
-       //TODO: VPTESTMD Z2, Z18, K6, K5                           // 62f26d4627ea
-       //TODO: VPTESTMD Z21, Z18, K6, K5                          // 62b26d4627ed
-       //TODO: VPTESTMD 7(SI)(DI*4), Z18, K6, K5                  // 62f26d4627acbe07000000
-       //TODO: VPTESTMD -7(DI)(R8*2), Z18, K6, K5                 // 62b26d4627ac47f9ffffff
-       //TODO: VPTESTMD Z2, Z24, K6, K5                           // 62f23d4627ea
-       //TODO: VPTESTMD Z21, Z24, K6, K5                          // 62b23d4627ed
-       //TODO: VPTESTMD 7(SI)(DI*4), Z24, K6, K5                  // 62f23d4627acbe07000000
-       //TODO: VPTESTMD -7(DI)(R8*2), Z24, K6, K5                 // 62b23d4627ac47f9ffffff
-       //TODO: VPTESTMD Z2, Z18, K6, K4                           // 62f26d4627e2
-       //TODO: VPTESTMD Z21, Z18, K6, K4                          // 62b26d4627e5
-       //TODO: VPTESTMD 7(SI)(DI*4), Z18, K6, K4                  // 62f26d4627a4be07000000
-       //TODO: VPTESTMD -7(DI)(R8*2), Z18, K6, K4                 // 62b26d4627a447f9ffffff
-       //TODO: VPTESTMD Z2, Z24, K6, K4                           // 62f23d4627e2
-       //TODO: VPTESTMD Z21, Z24, K6, K4                          // 62b23d4627e5
-       //TODO: VPTESTMD 7(SI)(DI*4), Z24, K6, K4                  // 62f23d4627a4be07000000
-       //TODO: VPTESTMD -7(DI)(R8*2), Z24, K6, K4                 // 62b23d4627a447f9ffffff
-       //TODO: VPTESTMQ X24, X28, K3, K4                          // 62929d0327e0
-       //TODO: VPTESTMQ 17(SP)(BP*1), X28, K3, K4                 // 62f29d0327a42c11000000
-       //TODO: VPTESTMQ -7(CX)(DX*8), X28, K3, K4                 // 62f29d0327a4d1f9ffffff
-       //TODO: VPTESTMQ X24, X28, K3, K6                          // 62929d0327f0
-       //TODO: VPTESTMQ 17(SP)(BP*1), X28, K3, K6                 // 62f29d0327b42c11000000
-       //TODO: VPTESTMQ -7(CX)(DX*8), X28, K3, K6                 // 62f29d0327b4d1f9ffffff
-       //TODO: VPTESTMQ Y21, Y7, K7, K1                           // 62b2c52f27cd
-       //TODO: VPTESTMQ 7(AX)(CX*4), Y7, K7, K1                   // 62f2c52f278c8807000000
-       //TODO: VPTESTMQ 7(AX)(CX*1), Y7, K7, K1                   // 62f2c52f278c0807000000
-       //TODO: VPTESTMQ Y21, Y7, K7, K3                           // 62b2c52f27dd
-       //TODO: VPTESTMQ 7(AX)(CX*4), Y7, K7, K3                   // 62f2c52f279c8807000000
-       //TODO: VPTESTMQ 7(AX)(CX*1), Y7, K7, K3                   // 62f2c52f279c0807000000
-       //TODO: VPTESTMQ Z6, Z7, K4, K6                            // 62f2c54c27f6
-       //TODO: VPTESTMQ Z16, Z7, K4, K6                           // 62b2c54c27f0
-       //TODO: VPTESTMQ 17(SP), Z7, K4, K6                        // 62f2c54c27b42411000000
-       //TODO: VPTESTMQ -17(BP)(SI*4), Z7, K4, K6                 // 62f2c54c27b4b5efffffff
-       //TODO: VPTESTMQ Z6, Z13, K4, K6                           // 62f2954c27f6
-       //TODO: VPTESTMQ Z16, Z13, K4, K6                          // 62b2954c27f0
-       //TODO: VPTESTMQ 17(SP), Z13, K4, K6                       // 62f2954c27b42411000000
-       //TODO: VPTESTMQ -17(BP)(SI*4), Z13, K4, K6                // 62f2954c27b4b5efffffff
-       //TODO: VPTESTMQ Z6, Z7, K4, K7                            // 62f2c54c27fe
-       //TODO: VPTESTMQ Z16, Z7, K4, K7                           // 62b2c54c27f8
-       //TODO: VPTESTMQ 17(SP), Z7, K4, K7                        // 62f2c54c27bc2411000000
-       //TODO: VPTESTMQ -17(BP)(SI*4), Z7, K4, K7                 // 62f2c54c27bcb5efffffff
-       //TODO: VPTESTMQ Z6, Z13, K4, K7                           // 62f2954c27fe
-       //TODO: VPTESTMQ Z16, Z13, K4, K7                          // 62b2954c27f8
-       //TODO: VPTESTMQ 17(SP), Z13, K4, K7                       // 62f2954c27bc2411000000
-       //TODO: VPTESTMQ -17(BP)(SI*4), Z13, K4, K7                // 62f2954c27bcb5efffffff
-       //TODO: VPTESTNMD X1, X21, K2, K1                          // 62f2560227c9
-       //TODO: VPTESTNMD (R14), X21, K2, K1                       // 62d25602270e
-       //TODO: VPTESTNMD -7(DI)(R8*8), X21, K2, K1                // 62b25602278cc7f9ffffff
-       //TODO: VPTESTNMD X1, X21, K2, K5                          // 62f2560227e9
-       //TODO: VPTESTNMD (R14), X21, K2, K5                       // 62d25602272e
-       //TODO: VPTESTNMD -7(DI)(R8*8), X21, K2, K5                // 62b2560227acc7f9ffffff
-       //TODO: VPTESTNMD Y1, Y24, K2, K3                          // 62f23e2227d9
-       //TODO: VPTESTNMD 7(SI)(DI*4), Y24, K2, K3                 // 62f23e22279cbe07000000
-       //TODO: VPTESTNMD -7(DI)(R8*2), Y24, K2, K3                // 62b23e22279c47f9ffffff
-       //TODO: VPTESTNMD Y1, Y24, K2, K1                          // 62f23e2227c9
-       //TODO: VPTESTNMD 7(SI)(DI*4), Y24, K2, K1                 // 62f23e22278cbe07000000
-       //TODO: VPTESTNMD -7(DI)(R8*2), Y24, K2, K1                // 62b23e22278c47f9ffffff
-       //TODO: VPTESTNMD Z2, Z22, K3, K5                          // 62f24e4327ea
-       //TODO: VPTESTNMD Z31, Z22, K3, K5                         // 62924e4327ef
-       //TODO: VPTESTNMD -17(BP)(SI*8), Z22, K3, K5               // 62f24e4327acf5efffffff
-       //TODO: VPTESTNMD (R15), Z22, K3, K5                       // 62d24e43272f
-       //TODO: VPTESTNMD Z2, Z7, K3, K5                           // 62f2464b27ea
-       //TODO: VPTESTNMD Z31, Z7, K3, K5                          // 6292464b27ef
-       //TODO: VPTESTNMD -17(BP)(SI*8), Z7, K3, K5                // 62f2464b27acf5efffffff
-       //TODO: VPTESTNMD (R15), Z7, K3, K5                        // 62d2464b272f
-       //TODO: VPTESTNMD Z2, Z22, K3, K4                          // 62f24e4327e2
-       //TODO: VPTESTNMD Z31, Z22, K3, K4                         // 62924e4327e7
-       //TODO: VPTESTNMD -17(BP)(SI*8), Z22, K3, K4               // 62f24e4327a4f5efffffff
-       //TODO: VPTESTNMD (R15), Z22, K3, K4                       // 62d24e432727
-       //TODO: VPTESTNMD Z2, Z7, K3, K4                           // 62f2464b27e2
-       //TODO: VPTESTNMD Z31, Z7, K3, K4                          // 6292464b27e7
-       //TODO: VPTESTNMD -17(BP)(SI*8), Z7, K3, K4                // 62f2464b27a4f5efffffff
-       //TODO: VPTESTNMD (R15), Z7, K3, K4                        // 62d2464b2727
-       //TODO: VPTESTNMQ X31, X11, K3, K7                         // 6292a60b27ff
-       //TODO: VPTESTNMQ 99(R15)(R15*4), X11, K3, K7              // 6292a60b27bcbf63000000
-       //TODO: VPTESTNMQ 15(DX), X11, K3, K7                      // 62f2a60b27ba0f000000
-       //TODO: VPTESTNMQ X31, X11, K3, K6                         // 6292a60b27f7
-       //TODO: VPTESTNMQ 99(R15)(R15*4), X11, K3, K6              // 6292a60b27b4bf63000000
-       //TODO: VPTESTNMQ 15(DX), X11, K3, K6                      // 62f2a60b27b20f000000
-       //TODO: VPTESTNMQ Y18, Y5, K3, K4                          // 62b2d62b27e2
-       //TODO: VPTESTNMQ 17(SP), Y5, K3, K4                       // 62f2d62b27a42411000000
-       //TODO: VPTESTNMQ -17(BP)(SI*4), Y5, K3, K4                // 62f2d62b27a4b5efffffff
-       //TODO: VPTESTNMQ Y18, Y5, K3, K6                          // 62b2d62b27f2
-       //TODO: VPTESTNMQ 17(SP), Y5, K3, K6                       // 62f2d62b27b42411000000
-       //TODO: VPTESTNMQ -17(BP)(SI*4), Y5, K3, K6                // 62f2d62b27b4b5efffffff
-       //TODO: VPTESTNMQ Z1, Z20, K2, K0                          // 62f2de4227c1
-       //TODO: VPTESTNMQ Z3, Z20, K2, K0                          // 62f2de4227c3
-       //TODO: VPTESTNMQ 7(SI)(DI*8), Z20, K2, K0                 // 62f2de422784fe07000000
-       //TODO: VPTESTNMQ -15(R14), Z20, K2, K0                    // 62d2de422786f1ffffff
-       //TODO: VPTESTNMQ Z1, Z9, K2, K0                           // 62f2b64a27c1
-       //TODO: VPTESTNMQ Z3, Z9, K2, K0                           // 62f2b64a27c3
-       //TODO: VPTESTNMQ 7(SI)(DI*8), Z9, K2, K0                  // 62f2b64a2784fe07000000
-       //TODO: VPTESTNMQ -15(R14), Z9, K2, K0                     // 62d2b64a2786f1ffffff
-       //TODO: VPTESTNMQ Z1, Z20, K2, K7                          // 62f2de4227f9
-       //TODO: VPTESTNMQ Z3, Z20, K2, K7                          // 62f2de4227fb
-       //TODO: VPTESTNMQ 7(SI)(DI*8), Z20, K2, K7                 // 62f2de4227bcfe07000000
-       //TODO: VPTESTNMQ -15(R14), Z20, K2, K7                    // 62d2de4227bef1ffffff
-       //TODO: VPTESTNMQ Z1, Z9, K2, K7                           // 62f2b64a27f9
-       //TODO: VPTESTNMQ Z3, Z9, K2, K7                           // 62f2b64a27fb
-       //TODO: VPTESTNMQ 7(SI)(DI*8), Z9, K2, K7                  // 62f2b64a27bcfe07000000
-       //TODO: VPTESTNMQ -15(R14), Z9, K2, K7                     // 62d2b64a27bef1ffffff
-       //TODO: VPUNPCKHDQ X9, X7, K1, X20                         // 62c145096ae1
-       //TODO: VPUNPCKHDQ -7(CX)(DX*1), X7, K1, X20               // 62e145096aa411f9ffffff
-       //TODO: VPUNPCKHDQ -15(R14)(R15*4), X7, K1, X20            // 628145096aa4bef1ffffff
-       //TODO: VPUNPCKHDQ Y11, Y8, K7, Y1                         // 62d13d2f6acb
-       //TODO: VPUNPCKHDQ -17(BP)(SI*8), Y8, K7, Y1               // 62f13d2f6a8cf5efffffff
-       //TODO: VPUNPCKHDQ (R15), Y8, K7, Y1                       // 62d13d2f6a0f
-       //TODO: VPUNPCKHDQ Z3, Z5, K2, Z19                         // 62e1554a6adb
-       //TODO: VPUNPCKHDQ Z5, Z5, K2, Z19                         // 62e1554a6add
-       //TODO: VPUNPCKHDQ -7(CX), Z5, K2, Z19                     // 62e1554a6a99f9ffffff
-       //TODO: VPUNPCKHDQ 15(DX)(BX*4), Z5, K2, Z19               // 62e1554a6a9c9a0f000000
-       //TODO: VPUNPCKHDQ Z3, Z1, K2, Z19                         // 62e1754a6adb
-       //TODO: VPUNPCKHDQ Z5, Z1, K2, Z19                         // 62e1754a6add
-       //TODO: VPUNPCKHDQ -7(CX), Z1, K2, Z19                     // 62e1754a6a99f9ffffff
-       //TODO: VPUNPCKHDQ 15(DX)(BX*4), Z1, K2, Z19               // 62e1754a6a9c9a0f000000
-       //TODO: VPUNPCKHDQ Z3, Z5, K2, Z15                         // 6271554a6afb
-       //TODO: VPUNPCKHDQ Z5, Z5, K2, Z15                         // 6271554a6afd
-       //TODO: VPUNPCKHDQ -7(CX), Z5, K2, Z15                     // 6271554a6ab9f9ffffff
-       //TODO: VPUNPCKHDQ 15(DX)(BX*4), Z5, K2, Z15               // 6271554a6abc9a0f000000
-       //TODO: VPUNPCKHDQ Z3, Z1, K2, Z15                         // 6271754a6afb
-       //TODO: VPUNPCKHDQ Z5, Z1, K2, Z15                         // 6271754a6afd
-       //TODO: VPUNPCKHDQ -7(CX), Z1, K2, Z15                     // 6271754a6ab9f9ffffff
-       //TODO: VPUNPCKHDQ 15(DX)(BX*4), Z1, K2, Z15               // 6271754a6abc9a0f000000
-       //TODO: VPUNPCKHQDQ X5, X14, K4, X7                        // 62f18d0c6dfd
-       //TODO: VPUNPCKHQDQ 15(DX)(BX*1), X14, K4, X7              // 62f18d0c6dbc1a0f000000
-       //TODO: VPUNPCKHQDQ -7(CX)(DX*2), X14, K4, X7              // 62f18d0c6dbc51f9ffffff
-       //TODO: VPUNPCKHQDQ Y16, Y17, K1, Y27                      // 6221f5216dd8
-       //TODO: VPUNPCKHQDQ 7(SI)(DI*8), Y17, K1, Y27              // 6261f5216d9cfe07000000
-       //TODO: VPUNPCKHQDQ -15(R14), Y17, K1, Y27                 // 6241f5216d9ef1ffffff
-       //TODO: VPUNPCKHQDQ Z16, Z21, K3, Z14                      // 6231d5436df0
-       //TODO: VPUNPCKHQDQ Z9, Z21, K3, Z14                       // 6251d5436df1
-       //TODO: VPUNPCKHQDQ 99(R15)(R15*8), Z21, K3, Z14           // 6211d5436db4ff63000000
-       //TODO: VPUNPCKHQDQ 7(AX)(CX*8), Z21, K3, Z14              // 6271d5436db4c807000000
-       //TODO: VPUNPCKHQDQ Z16, Z8, K3, Z14                       // 6231bd4b6df0
-       //TODO: VPUNPCKHQDQ Z9, Z8, K3, Z14                        // 6251bd4b6df1
-       //TODO: VPUNPCKHQDQ 99(R15)(R15*8), Z8, K3, Z14            // 6211bd4b6db4ff63000000
-       //TODO: VPUNPCKHQDQ 7(AX)(CX*8), Z8, K3, Z14               // 6271bd4b6db4c807000000
-       //TODO: VPUNPCKHQDQ Z16, Z21, K3, Z15                      // 6231d5436df8
-       //TODO: VPUNPCKHQDQ Z9, Z21, K3, Z15                       // 6251d5436df9
-       //TODO: VPUNPCKHQDQ 99(R15)(R15*8), Z21, K3, Z15           // 6211d5436dbcff63000000
-       //TODO: VPUNPCKHQDQ 7(AX)(CX*8), Z21, K3, Z15              // 6271d5436dbcc807000000
-       //TODO: VPUNPCKHQDQ Z16, Z8, K3, Z15                       // 6231bd4b6df8
-       //TODO: VPUNPCKHQDQ Z9, Z8, K3, Z15                        // 6251bd4b6df9
-       //TODO: VPUNPCKHQDQ 99(R15)(R15*8), Z8, K3, Z15            // 6211bd4b6dbcff63000000
-       //TODO: VPUNPCKHQDQ 7(AX)(CX*8), Z8, K3, Z15               // 6271bd4b6dbcc807000000
-       //TODO: VPUNPCKLDQ X16, X30, K7, X0                        // 62b10d0762c0
-       //TODO: VPUNPCKLDQ 15(R8), X30, K7, X0                     // 62d10d0762800f000000
-       //TODO: VPUNPCKLDQ (BP), X30, K7, X0                       // 62f10d07624500
-       //TODO: VPUNPCKLDQ Y14, Y23, K4, Y1                        // 62d1452462ce
-       //TODO: VPUNPCKLDQ -7(CX), Y23, K4, Y1                     // 62f145246289f9ffffff
-       //TODO: VPUNPCKLDQ 15(DX)(BX*4), Y23, K4, Y1               // 62f14524628c9a0f000000
-       //TODO: VPUNPCKLDQ Z9, Z9, K4, Z9                          // 6251354c62c9
-       //TODO: VPUNPCKLDQ Z28, Z9, K4, Z9                         // 6211354c62cc
-       //TODO: VPUNPCKLDQ 15(R8)(R14*4), Z9, K4, Z9               // 6211354c628cb00f000000
-       //TODO: VPUNPCKLDQ -7(CX)(DX*4), Z9, K4, Z9                // 6271354c628c91f9ffffff
-       //TODO: VPUNPCKLDQ Z9, Z25, K4, Z9                         // 6251354462c9
-       //TODO: VPUNPCKLDQ Z28, Z25, K4, Z9                        // 6211354462cc
-       //TODO: VPUNPCKLDQ 15(R8)(R14*4), Z25, K4, Z9              // 62113544628cb00f000000
-       //TODO: VPUNPCKLDQ -7(CX)(DX*4), Z25, K4, Z9               // 62713544628c91f9ffffff
-       //TODO: VPUNPCKLDQ Z9, Z9, K4, Z3                          // 62d1354c62d9
-       //TODO: VPUNPCKLDQ Z28, Z9, K4, Z3                         // 6291354c62dc
-       //TODO: VPUNPCKLDQ 15(R8)(R14*4), Z9, K4, Z3               // 6291354c629cb00f000000
-       //TODO: VPUNPCKLDQ -7(CX)(DX*4), Z9, K4, Z3                // 62f1354c629c91f9ffffff
-       //TODO: VPUNPCKLDQ Z9, Z25, K4, Z3                         // 62d1354462d9
-       //TODO: VPUNPCKLDQ Z28, Z25, K4, Z3                        // 6291354462dc
-       //TODO: VPUNPCKLDQ 15(R8)(R14*4), Z25, K4, Z3              // 62913544629cb00f000000
-       //TODO: VPUNPCKLDQ -7(CX)(DX*4), Z25, K4, Z3               // 62f13544629c91f9ffffff
-       //TODO: VPUNPCKLQDQ X14, X11, K7, X14                      // 6251a50f6cf6
-       //TODO: VPUNPCKLQDQ 15(R8)(R14*8), X11, K7, X14            // 6211a50f6cb4f00f000000
-       //TODO: VPUNPCKLQDQ -15(R14)(R15*2), X11, K7, X14          // 6211a50f6cb47ef1ffffff
-       //TODO: VPUNPCKLQDQ Y2, Y25, K2, Y31                       // 6261b5226cfa
-       //TODO: VPUNPCKLQDQ 99(R15)(R15*8), Y25, K2, Y31           // 6201b5226cbcff63000000
-       //TODO: VPUNPCKLQDQ 7(AX)(CX*8), Y25, K2, Y31              // 6261b5226cbcc807000000
-       //TODO: VPUNPCKLQDQ Z17, Z17, K5, Z20                      // 62a1f5456ce1
-       //TODO: VPUNPCKLQDQ Z23, Z17, K5, Z20                      // 62a1f5456ce7
-       //TODO: VPUNPCKLQDQ (R8), Z17, K5, Z20                     // 62c1f5456c20
-       //TODO: VPUNPCKLQDQ 15(DX)(BX*2), Z17, K5, Z20             // 62e1f5456ca45a0f000000
-       //TODO: VPUNPCKLQDQ Z17, Z0, K5, Z20                       // 62a1fd4d6ce1
-       //TODO: VPUNPCKLQDQ Z23, Z0, K5, Z20                       // 62a1fd4d6ce7
-       //TODO: VPUNPCKLQDQ (R8), Z0, K5, Z20                      // 62c1fd4d6c20
-       //TODO: VPUNPCKLQDQ 15(DX)(BX*2), Z0, K5, Z20              // 62e1fd4d6ca45a0f000000
-       //TODO: VPUNPCKLQDQ Z17, Z17, K5, Z0                       // 62b1f5456cc1
-       //TODO: VPUNPCKLQDQ Z23, Z17, K5, Z0                       // 62b1f5456cc7
-       //TODO: VPUNPCKLQDQ (R8), Z17, K5, Z0                      // 62d1f5456c00
-       //TODO: VPUNPCKLQDQ 15(DX)(BX*2), Z17, K5, Z0              // 62f1f5456c845a0f000000
-       //TODO: VPUNPCKLQDQ Z17, Z0, K5, Z0                        // 62b1fd4d6cc1
-       //TODO: VPUNPCKLQDQ Z23, Z0, K5, Z0                        // 62b1fd4d6cc7
-       //TODO: VPUNPCKLQDQ (R8), Z0, K5, Z0                       // 62d1fd4d6c00
-       //TODO: VPUNPCKLQDQ 15(DX)(BX*2), Z0, K5, Z0               // 62f1fd4d6c845a0f000000
-       //TODO: VPXORD X12, X23, K2, X26                           // 62414502efd4
-       //TODO: VPXORD 7(AX)(CX*4), X23, K2, X26                   // 62614502ef948807000000
-       //TODO: VPXORD 7(AX)(CX*1), X23, K2, X26                   // 62614502ef940807000000
-       //TODO: VPXORD Y9, Y22, K3, Y9                             // 62514d23efc9
-       //TODO: VPXORD (BX), Y22, K3, Y9                           // 62714d23ef0b
-       //TODO: VPXORD -17(BP)(SI*1), Y22, K3, Y9                  // 62714d23ef8c35efffffff
-       //TODO: VPXORD Z30, Z20, K3, Z1                            // 62915d43efce
-       //TODO: VPXORD Z5, Z20, K3, Z1                             // 62f15d43efcd
-       //TODO: VPXORD -17(BP)(SI*2), Z20, K3, Z1                  // 62f15d43ef8c75efffffff
-       //TODO: VPXORD 7(AX)(CX*2), Z20, K3, Z1                    // 62f15d43ef8c4807000000
-       //TODO: VPXORD Z30, Z9, K3, Z1                             // 6291354befce
-       //TODO: VPXORD Z5, Z9, K3, Z1                              // 62f1354befcd
-       //TODO: VPXORD -17(BP)(SI*2), Z9, K3, Z1                   // 62f1354bef8c75efffffff
-       //TODO: VPXORD 7(AX)(CX*2), Z9, K3, Z1                     // 62f1354bef8c4807000000
-       //TODO: VPXORD Z30, Z20, K3, Z9                            // 62115d43efce
-       //TODO: VPXORD Z5, Z20, K3, Z9                             // 62715d43efcd
-       //TODO: VPXORD -17(BP)(SI*2), Z20, K3, Z9                  // 62715d43ef8c75efffffff
-       //TODO: VPXORD 7(AX)(CX*2), Z20, K3, Z9                    // 62715d43ef8c4807000000
-       //TODO: VPXORD Z30, Z9, K3, Z9                             // 6211354befce
-       //TODO: VPXORD Z5, Z9, K3, Z9                              // 6271354befcd
-       //TODO: VPXORD -17(BP)(SI*2), Z9, K3, Z9                   // 6271354bef8c75efffffff
-       //TODO: VPXORD 7(AX)(CX*2), Z9, K3, Z9                     // 6271354bef8c4807000000
-       //TODO: VPXORQ X23, X23, K3, X16                           // 62a1c503efc7
-       //TODO: VPXORQ (SI), X23, K3, X16                          // 62e1c503ef06
-       //TODO: VPXORQ 7(SI)(DI*2), X23, K3, X16                   // 62e1c503ef847e07000000
-       //TODO: VPXORQ Y6, Y1, K2, Y14                             // 6271f52aeff6
-       //TODO: VPXORQ 15(R8)(R14*4), Y1, K2, Y14                  // 6211f52aefb4b00f000000
-       //TODO: VPXORQ -7(CX)(DX*4), Y1, K2, Y14                   // 6271f52aefb491f9ffffff
-       //TODO: VPXORQ Z16, Z7, K1, Z26                            // 6221c549efd0
-       //TODO: VPXORQ Z25, Z7, K1, Z26                            // 6201c549efd1
-       //TODO: VPXORQ 15(R8)(R14*1), Z7, K1, Z26                  // 6201c549ef94300f000000
-       //TODO: VPXORQ 15(R8)(R14*2), Z7, K1, Z26                  // 6201c549ef94700f000000
-       //TODO: VPXORQ Z16, Z21, K1, Z26                           // 6221d541efd0
-       //TODO: VPXORQ Z25, Z21, K1, Z26                           // 6201d541efd1
-       //TODO: VPXORQ 15(R8)(R14*1), Z21, K1, Z26                 // 6201d541ef94300f000000
-       //TODO: VPXORQ 15(R8)(R14*2), Z21, K1, Z26                 // 6201d541ef94700f000000
-       //TODO: VPXORQ Z16, Z7, K1, Z22                            // 62a1c549eff0
-       //TODO: VPXORQ Z25, Z7, K1, Z22                            // 6281c549eff1
-       //TODO: VPXORQ 15(R8)(R14*1), Z7, K1, Z22                  // 6281c549efb4300f000000
-       //TODO: VPXORQ 15(R8)(R14*2), Z7, K1, Z22                  // 6281c549efb4700f000000
-       //TODO: VPXORQ Z16, Z21, K1, Z22                           // 62a1d541eff0
-       //TODO: VPXORQ Z25, Z21, K1, Z22                           // 6281d541eff1
-       //TODO: VPXORQ 15(R8)(R14*1), Z21, K1, Z22                 // 6281d541efb4300f000000
-       //TODO: VPXORQ 15(R8)(R14*2), Z21, K1, Z22                 // 6281d541efb4700f000000
-       //TODO: VRCP14PD X11, K5, X31                              // 6242fd0d4cfb
-       //TODO: VRCP14PD 17(SP), K5, X31                           // 6262fd0d4cbc2411000000
-       //TODO: VRCP14PD -17(BP)(SI*4), K5, X31                    // 6262fd0d4cbcb5efffffff
-       //TODO: VRCP14PD Y23, K7, Y9                               // 6232fd2f4ccf
-       //TODO: VRCP14PD -17(BP)(SI*2), K7, Y9                     // 6272fd2f4c8c75efffffff
-       //TODO: VRCP14PD 7(AX)(CX*2), K7, Y9                       // 6272fd2f4c8c4807000000
-       //TODO: VRCP14PD Z0, K7, Z6                                // 62f2fd4f4cf0
-       //TODO: VRCP14PD Z8, K7, Z6                                // 62d2fd4f4cf0
-       //TODO: VRCP14PD (CX), K7, Z6                              // 62f2fd4f4c31
-       //TODO: VRCP14PD 99(R15), K7, Z6                           // 62d2fd4f4cb763000000
-       //TODO: VRCP14PD Z0, K7, Z2                                // 62f2fd4f4cd0
-       //TODO: VRCP14PD Z8, K7, Z2                                // 62d2fd4f4cd0
-       //TODO: VRCP14PD (CX), K7, Z2                              // 62f2fd4f4c11
-       //TODO: VRCP14PD 99(R15), K7, Z2                           // 62d2fd4f4c9763000000
-       //TODO: VRCP14PS X5, K6, X22                               // 62e27d0e4cf5
-       //TODO: VRCP14PS 7(AX), K6, X22                            // 62e27d0e4cb007000000
-       //TODO: VRCP14PS (DI), K6, X22                             // 62e27d0e4c37
-       //TODO: VRCP14PS Y5, K3, Y31                               // 62627d2b4cfd
-       //TODO: VRCP14PS 15(R8)(R14*1), K3, Y31                    // 62027d2b4cbc300f000000
-       //TODO: VRCP14PS 15(R8)(R14*2), K3, Y31                    // 62027d2b4cbc700f000000
-       //TODO: VRCP14PS Z14, K7, Z15                              // 62527d4f4cfe
-       //TODO: VRCP14PS Z27, K7, Z15                              // 62127d4f4cfb
-       //TODO: VRCP14PS 99(R15)(R15*2), K7, Z15                   // 62127d4f4cbc7f63000000
-       //TODO: VRCP14PS -7(DI), K7, Z15                           // 62727d4f4cbff9ffffff
-       //TODO: VRCP14PS Z14, K7, Z12                              // 62527d4f4ce6
-       //TODO: VRCP14PS Z27, K7, Z12                              // 62127d4f4ce3
-       //TODO: VRCP14PS 99(R15)(R15*2), K7, Z12                   // 62127d4f4ca47f63000000
-       //TODO: VRCP14PS -7(DI), K7, Z12                           // 62727d4f4ca7f9ffffff
-       //TODO: VRCP14SD X17, X0, K4, X14                          // 6232fd0c4df1 or 6232fd2c4df1 or 6232fd4c4df1
-       //TODO: VRCP14SD (SI), X0, K4, X14                         // 6272fd0c4d36 or 6272fd2c4d36 or 6272fd4c4d36
-       //TODO: VRCP14SD 7(SI)(DI*2), X0, K4, X14                  // 6272fd0c4db47e07000000 or 6272fd2c4db47e07000000 or 6272fd4c4db47e07000000
-       //TODO: VRCP14SS X11, X15, K4, X7                          // 62d2050c4dfb or 62d2052c4dfb or 62d2054c4dfb
-       //TODO: VRCP14SS -7(DI)(R8*1), X15, K4, X7                 // 62b2050c4dbc07f9ffffff or 62b2052c4dbc07f9ffffff or 62b2054c4dbc07f9ffffff
-       //TODO: VRCP14SS (SP), X15, K4, X7                         // 62f2050c4d3c24 or 62f2052c4d3c24 or 62f2054c4d3c24
-       //TODO: VRNDSCALEPD $64, X16, K4, X20                      // 62a3fd0c09e040
-       //TODO: VRNDSCALEPD $64, 7(SI)(DI*8), K4, X20              // 62e3fd0c09a4fe0700000040
-       //TODO: VRNDSCALEPD $64, -15(R14), K4, X20                 // 62c3fd0c09a6f1ffffff40
-       //TODO: VRNDSCALEPD $27, Y2, K1, Y28                       // 6263fd2909e21b
-       //TODO: VRNDSCALEPD $27, (CX), K1, Y28                     // 6263fd2909211b
-       //TODO: VRNDSCALEPD $27, 99(R15), K1, Y28                  // 6243fd2909a7630000001b
-       //TODO: VRNDSCALEPD $47, Z21, K3, Z8                       // 6233fd4b09c52f
-       //TODO: VRNDSCALEPD $47, Z5, K3, Z8                        // 6273fd4b09c52f
-       //TODO: VRNDSCALEPD $47, Z21, K3, Z28                      // 6223fd4b09e52f
-       //TODO: VRNDSCALEPD $47, Z5, K3, Z28                       // 6263fd4b09e52f
-       //TODO: VRNDSCALEPD $82, Z12, K4, Z16                      // 62c3fd4c09c452
-       //TODO: VRNDSCALEPD $82, Z27, K4, Z16                      // 6283fd4c09c352
-       //TODO: VRNDSCALEPD $82, 15(R8), K4, Z16                   // 62c3fd4c09800f00000052
-       //TODO: VRNDSCALEPD $82, (BP), K4, Z16                     // 62e3fd4c09450052
-       //TODO: VRNDSCALEPD $82, Z12, K4, Z13                      // 6253fd4c09ec52
-       //TODO: VRNDSCALEPD $82, Z27, K4, Z13                      // 6213fd4c09eb52
-       //TODO: VRNDSCALEPD $82, 15(R8), K4, Z13                   // 6253fd4c09a80f00000052
-       //TODO: VRNDSCALEPD $82, (BP), K4, Z13                     // 6273fd4c096d0052
-       //TODO: VRNDSCALEPS $126, X6, K5, X12                      // 62737d0d08e67e
-       //TODO: VRNDSCALEPS $126, 7(SI)(DI*1), K5, X12             // 62737d0d08a43e070000007e
-       //TODO: VRNDSCALEPS $126, 15(DX)(BX*8), K5, X12            // 62737d0d08a4da0f0000007e
-       //TODO: VRNDSCALEPS $94, Y27, K7, Y24                      // 62037d2f08c35e
-       //TODO: VRNDSCALEPS $94, 99(R15)(R15*2), K7, Y24           // 62037d2f08847f630000005e
-       //TODO: VRNDSCALEPS $94, -7(DI), K7, Y24                   // 62637d2f0887f9ffffff5e
-       //TODO: VRNDSCALEPS $121, Z6, K7, Z22                      // 62e37d4f08f679
-       //TODO: VRNDSCALEPS $121, Z8, K7, Z22                      // 62c37d4f08f079
-       //TODO: VRNDSCALEPS $121, Z6, K7, Z11                      // 62737d4f08de79
-       //TODO: VRNDSCALEPS $121, Z8, K7, Z11                      // 62537d4f08d879
-       //TODO: VRNDSCALEPS $13, Z12, K6, Z25                      // 62437d4e08cc0d
-       //TODO: VRNDSCALEPS $13, Z17, K6, Z25                      // 62237d4e08c90d
-       //TODO: VRNDSCALEPS $13, 15(R8)(R14*8), K6, Z25            // 62037d4e088cf00f0000000d
-       //TODO: VRNDSCALEPS $13, -15(R14)(R15*2), K6, Z25          // 62037d4e088c7ef1ffffff0d
-       //TODO: VRNDSCALEPS $13, Z12, K6, Z12                      // 62537d4e08e40d
-       //TODO: VRNDSCALEPS $13, Z17, K6, Z12                      // 62337d4e08e10d
-       //TODO: VRNDSCALEPS $13, 15(R8)(R14*8), K6, Z12            // 62137d4e08a4f00f0000000d
-       //TODO: VRNDSCALEPS $13, -15(R14)(R15*2), K6, Z12          // 62137d4e08a47ef1ffffff0d
-       //TODO: VRNDSCALESD $65, X6, X28, K3, X17                  // 62e39d030bce41
-       //TODO: VRNDSCALESD $67, X8, X8, K7, X1                    // 62d3bd0f0bc843 or 62d3bd2f0bc843 or 62d3bd4f0bc843
-       //TODO: VRNDSCALESD $67, 17(SP), X8, K7, X1                // 62f3bd0f0b8c241100000043 or 62f3bd2f0b8c241100000043 or 62f3bd4f0b8c241100000043
-       //TODO: VRNDSCALESD $67, -17(BP)(SI*4), X8, K7, X1         // 62f3bd0f0b8cb5efffffff43 or 62f3bd2f0b8cb5efffffff43 or 62f3bd4f0b8cb5efffffff43
-       //TODO: VRNDSCALESS $127, X11, X0, K4, X6                  // 62d37d0c0af37f
-       //TODO: VRNDSCALESS $0, X6, X6, K4, X16                    // 62e34d0c0ac600 or 62e34d2c0ac600 or 62e34d4c0ac600
-       //TODO: VRNDSCALESS $0, (AX), X6, K4, X16                  // 62e34d0c0a0000 or 62e34d2c0a0000 or 62e34d4c0a0000
-       //TODO: VRNDSCALESS $0, 7(SI), X6, K4, X16                 // 62e34d0c0a860700000000 or 62e34d2c0a860700000000 or 62e34d4c0a860700000000
-       //TODO: VRSQRT14PD X12, K7, X22                            // 62c2fd0f4ef4
-       //TODO: VRSQRT14PD -7(DI)(R8*1), K7, X22                   // 62a2fd0f4eb407f9ffffff
-       //TODO: VRSQRT14PD (SP), K7, X22                           // 62e2fd0f4e3424
-       //TODO: VRSQRT14PD Y11, K2, Y0                             // 62d2fd2a4ec3
-       //TODO: VRSQRT14PD -7(CX)(DX*1), K2, Y0                    // 62f2fd2a4e8411f9ffffff
-       //TODO: VRSQRT14PD -15(R14)(R15*4), K2, Y0                 // 6292fd2a4e84bef1ffffff
-       //TODO: VRSQRT14PD Z6, K5, Z9                              // 6272fd4d4ece
-       //TODO: VRSQRT14PD Z25, K5, Z9                             // 6212fd4d4ec9
-       //TODO: VRSQRT14PD -15(R14)(R15*1), K5, Z9                 // 6212fd4d4e8c3ef1ffffff
-       //TODO: VRSQRT14PD -15(BX), K5, Z9                         // 6272fd4d4e8bf1ffffff
-       //TODO: VRSQRT14PD Z6, K5, Z12                             // 6272fd4d4ee6
-       //TODO: VRSQRT14PD Z25, K5, Z12                            // 6212fd4d4ee1
-       //TODO: VRSQRT14PD -15(R14)(R15*1), K5, Z12                // 6212fd4d4ea43ef1ffffff
-       //TODO: VRSQRT14PD -15(BX), K5, Z12                        // 6272fd4d4ea3f1ffffff
-       //TODO: VRSQRT14PS X28, K3, X16                            // 62827d0b4ec4
-       //TODO: VRSQRT14PS -7(CX), K3, X16                         // 62e27d0b4e81f9ffffff
-       //TODO: VRSQRT14PS 15(DX)(BX*4), K3, X16                   // 62e27d0b4e849a0f000000
-       //TODO: VRSQRT14PS Y3, K4, Y31                             // 62627d2c4efb
-       //TODO: VRSQRT14PS 15(DX)(BX*1), K4, Y31                   // 62627d2c4ebc1a0f000000
-       //TODO: VRSQRT14PS -7(CX)(DX*2), K4, Y31                   // 62627d2c4ebc51f9ffffff
-       //TODO: VRSQRT14PS Z8, K2, Z3                              // 62d27d4a4ed8
-       //TODO: VRSQRT14PS Z2, K2, Z3                              // 62f27d4a4eda
-       //TODO: VRSQRT14PS 7(AX)(CX*4), K2, Z3                     // 62f27d4a4e9c8807000000
-       //TODO: VRSQRT14PS 7(AX)(CX*1), K2, Z3                     // 62f27d4a4e9c0807000000
-       //TODO: VRSQRT14PS Z8, K2, Z21                             // 62c27d4a4ee8
-       //TODO: VRSQRT14PS Z2, K2, Z21                             // 62e27d4a4eea
-       //TODO: VRSQRT14PS 7(AX)(CX*4), K2, Z21                    // 62e27d4a4eac8807000000
-       //TODO: VRSQRT14PS 7(AX)(CX*1), K2, Z21                    // 62e27d4a4eac0807000000
-       //TODO: VRSQRT14SD X11, X15, K2, X8                        // 6252850a4fc3 or 6252852a4fc3 or 6252854a4fc3
-       //TODO: VRSQRT14SD 7(AX), X15, K2, X8                      // 6272850a4f8007000000 or 6272852a4f8007000000 or 6272854a4f8007000000
-       //TODO: VRSQRT14SD (DI), X15, K2, X8                       // 6272850a4f07 or 6272852a4f07 or 6272854a4f07
-       //TODO: VRSQRT14SS X13, X19, K3, X1                        // 62d265034fcd or 62d265234fcd or 62d265434fcd
-       //TODO: VRSQRT14SS (BX), X19, K3, X1                       // 62f265034f0b or 62f265234f0b or 62f265434f0b
-       //TODO: VRSQRT14SS -17(BP)(SI*1), X19, K3, X1              // 62f265034f8c35efffffff or 62f265234f8c35efffffff or 62f265434f8c35efffffff
-       //TODO: VSCALEFPD X27, X2, K1, X2                          // 6292ed092cd3
-       //TODO: VSCALEFPD 99(R15)(R15*8), X2, K1, X2               // 6292ed092c94ff63000000
-       //TODO: VSCALEFPD 7(AX)(CX*8), X2, K1, X2                  // 62f2ed092c94c807000000
-       //TODO: VSCALEFPD Y13, Y2, K1, Y14                         // 6252ed292cf5
-       //TODO: VSCALEFPD -17(BP), Y2, K1, Y14                     // 6272ed292cb5efffffff
-       //TODO: VSCALEFPD -15(R14)(R15*8), Y2, K1, Y14             // 6212ed292cb4fef1ffffff
-       //TODO: VSCALEFPD Z7, Z2, K7, Z18                          // 62e2ed4f2cd7
-       //TODO: VSCALEFPD Z13, Z2, K7, Z18                         // 62c2ed4f2cd5
-       //TODO: VSCALEFPD Z7, Z21, K7, Z18                         // 62e2d5472cd7
-       //TODO: VSCALEFPD Z13, Z21, K7, Z18                        // 62c2d5472cd5
-       //TODO: VSCALEFPD Z7, Z2, K7, Z24                          // 6262ed4f2cc7
-       //TODO: VSCALEFPD Z13, Z2, K7, Z24                         // 6242ed4f2cc5
-       //TODO: VSCALEFPD Z7, Z21, K7, Z24                         // 6262d5472cc7
-       //TODO: VSCALEFPD Z13, Z21, K7, Z24                        // 6242d5472cc5
-       //TODO: VSCALEFPD Z1, Z6, K2, Z6                           // 62f2cd4a2cf1
-       //TODO: VSCALEFPD Z15, Z6, K2, Z6                          // 62d2cd4a2cf7
-       //TODO: VSCALEFPD 7(SI)(DI*4), Z6, K2, Z6                  // 62f2cd4a2cb4be07000000
-       //TODO: VSCALEFPD -7(DI)(R8*2), Z6, K2, Z6                 // 62b2cd4a2cb447f9ffffff
-       //TODO: VSCALEFPD Z1, Z22, K2, Z6                          // 62f2cd422cf1
-       //TODO: VSCALEFPD Z15, Z22, K2, Z6                         // 62d2cd422cf7
-       //TODO: VSCALEFPD 7(SI)(DI*4), Z22, K2, Z6                 // 62f2cd422cb4be07000000
-       //TODO: VSCALEFPD -7(DI)(R8*2), Z22, K2, Z6                // 62b2cd422cb447f9ffffff
-       //TODO: VSCALEFPD Z1, Z6, K2, Z16                          // 62e2cd4a2cc1
-       //TODO: VSCALEFPD Z15, Z6, K2, Z16                         // 62c2cd4a2cc7
-       //TODO: VSCALEFPD 7(SI)(DI*4), Z6, K2, Z16                 // 62e2cd4a2c84be07000000
-       //TODO: VSCALEFPD -7(DI)(R8*2), Z6, K2, Z16                // 62a2cd4a2c8447f9ffffff
-       //TODO: VSCALEFPD Z1, Z22, K2, Z16                         // 62e2cd422cc1
-       //TODO: VSCALEFPD Z15, Z22, K2, Z16                        // 62c2cd422cc7
-       //TODO: VSCALEFPD 7(SI)(DI*4), Z22, K2, Z16                // 62e2cd422c84be07000000
-       //TODO: VSCALEFPD -7(DI)(R8*2), Z22, K2, Z16               // 62a2cd422c8447f9ffffff
-       //TODO: VSCALEFPS X30, X22, K4, X26                        // 62024d042cd6
-       //TODO: VSCALEFPS (AX), X22, K4, X26                       // 62624d042c10
-       //TODO: VSCALEFPS 7(SI), X22, K4, X26                      // 62624d042c9607000000
-       //TODO: VSCALEFPS Y22, Y15, K1, Y27                        // 622205292cde
-       //TODO: VSCALEFPS 17(SP)(BP*2), Y15, K1, Y27               // 626205292c9c6c11000000
-       //TODO: VSCALEFPS -7(DI)(R8*4), Y15, K1, Y27               // 622205292c9c87f9ffffff
-       //TODO: VSCALEFPS Z22, Z18, K3, Z13                        // 62326d432cee
-       //TODO: VSCALEFPS Z7, Z18, K3, Z13                         // 62726d432cef
-       //TODO: VSCALEFPS Z22, Z8, K3, Z13                         // 62323d4b2cee
-       //TODO: VSCALEFPS Z7, Z8, K3, Z13                          // 62723d4b2cef
-       //TODO: VSCALEFPS Z1, Z20, K4, Z2                          // 62f25d442cd1
-       //TODO: VSCALEFPS Z3, Z20, K4, Z2                          // 62f25d442cd3
-       //TODO: VSCALEFPS 17(SP), Z20, K4, Z2                      // 62f25d442c942411000000
-       //TODO: VSCALEFPS -17(BP)(SI*4), Z20, K4, Z2               // 62f25d442c94b5efffffff
-       //TODO: VSCALEFPS Z1, Z9, K4, Z2                           // 62f2354c2cd1
-       //TODO: VSCALEFPS Z3, Z9, K4, Z2                           // 62f2354c2cd3
-       //TODO: VSCALEFPS 17(SP), Z9, K4, Z2                       // 62f2354c2c942411000000
-       //TODO: VSCALEFPS -17(BP)(SI*4), Z9, K4, Z2                // 62f2354c2c94b5efffffff
-       //TODO: VSCALEFPS Z1, Z20, K4, Z31                         // 62625d442cf9
-       //TODO: VSCALEFPS Z3, Z20, K4, Z31                         // 62625d442cfb
-       //TODO: VSCALEFPS 17(SP), Z20, K4, Z31                     // 62625d442cbc2411000000
-       //TODO: VSCALEFPS -17(BP)(SI*4), Z20, K4, Z31              // 62625d442cbcb5efffffff
-       //TODO: VSCALEFPS Z1, Z9, K4, Z31                          // 6262354c2cf9
-       //TODO: VSCALEFPS Z3, Z9, K4, Z31                          // 6262354c2cfb
-       //TODO: VSCALEFPS 17(SP), Z9, K4, Z31                      // 6262354c2cbc2411000000
-       //TODO: VSCALEFPS -17(BP)(SI*4), Z9, K4, Z31               // 6262354c2cbcb5efffffff
-       //TODO: VSCALEFSD X15, X11, K5, X3                         // 62d2a50d2ddf
-       //TODO: VSCALEFSD X6, X13, K7, X30                         // 6262950f2df6 or 6262952f2df6 or 6262954f2df6
-       //TODO: VSCALEFSD -17(BP)(SI*8), X13, K7, X30              // 6262950f2db4f5efffffff or 6262952f2db4f5efffffff or 6262954f2db4f5efffffff
-       //TODO: VSCALEFSD (R15), X13, K7, X30                      // 6242950f2d37 or 6242952f2d37 or 6242954f2d37
-       //TODO: VSCALEFSS X30, X23, K7, X12                        // 621245072de6
-       //TODO: VSCALEFSS X2, X20, K6, X8                          // 62725d062dc2 or 62725d262dc2 or 62725d462dc2
-       //TODO: VSCALEFSS (R8), X20, K6, X8                        // 62525d062d00 or 62525d262d00 or 62525d462d00
-       //TODO: VSCALEFSS 15(DX)(BX*2), X20, K6, X8                // 62725d062d845a0f000000 or 62725d262d845a0f000000 or 62725d462d845a0f000000
-       //TODO: VSCATTERDPD X9, K3, (DX)(X10*4)                    // 6232fd0ba20c92
-       //TODO: VSCATTERDPD X9, K3, (SP)(X4*2)                     // 6272fd0ba20c64
-       //TODO: VSCATTERDPD X9, K3, (R14)(X29*8)                   // 6212fd03a20cee
-       //TODO: VSCATTERDPD Y20, K7, (AX)(X4*1)                    // 62e2fd2fa22420
-       //TODO: VSCATTERDPD Y20, K7, (BP)(X10*2)                   // 62a2fd2fa2645500
-       //TODO: VSCATTERDPD Y20, K7, (R10)(X29*8)                  // 6282fd27a224ea
-       //TODO: VSCATTERDPD Z12, K4, (R10)(Y29*8)                  // 6212fd44a224ea
-       //TODO: VSCATTERDPD Z16, K4, (R10)(Y29*8)                  // 6282fd44a204ea
-       //TODO: VSCATTERDPD Z12, K4, (SP)(Y4*2)                    // 6272fd4ca22464
-       //TODO: VSCATTERDPD Z16, K4, (SP)(Y4*2)                    // 62e2fd4ca20464
-       //TODO: VSCATTERDPD Z12, K4, (DX)(Y10*4)                   // 6232fd4ca22492
-       //TODO: VSCATTERDPD Z16, K4, (DX)(Y10*4)                   // 62a2fd4ca20492
-       //TODO: VSCATTERDPS X26, K4, (DX)(X10*4)                   // 62227d0ca21492
-       //TODO: VSCATTERDPS X26, K4, (SP)(X4*2)                    // 62627d0ca21464
-       //TODO: VSCATTERDPS X26, K4, (R14)(X29*8)                  // 62027d04a214ee
-       //TODO: VSCATTERDPS Y18, K7, (R14)(Y29*8)                  // 62827d27a214ee
-       //TODO: VSCATTERDPS Y18, K7, (AX)(Y4*1)                    // 62e27d2fa21420
-       //TODO: VSCATTERDPS Y18, K7, (BP)(Y10*2)                   // 62a27d2fa2545500
-       //TODO: VSCATTERDPS Z28, K2, (BP)(Z10*2)                   // 62227d4aa2645500
-       //TODO: VSCATTERDPS Z13, K2, (BP)(Z10*2)                   // 62327d4aa26c5500
-       //TODO: VSCATTERDPS Z28, K2, (R10)(Z29*8)                  // 62027d42a224ea
-       //TODO: VSCATTERDPS Z13, K2, (R10)(Z29*8)                  // 62127d42a22cea
-       //TODO: VSCATTERDPS Z28, K2, (R14)(Z29*8)                  // 62027d42a224ee
-       //TODO: VSCATTERDPS Z13, K2, (R14)(Z29*8)                  // 62127d42a22cee
-       //TODO: VSCATTERQPD X19, K2, (AX)(X4*1)                    // 62e2fd0aa31c20
-       //TODO: VSCATTERQPD X19, K2, (BP)(X10*2)                   // 62a2fd0aa35c5500
-       //TODO: VSCATTERQPD X19, K2, (R10)(X29*8)                  // 6282fd02a31cea
-       //TODO: VSCATTERQPD Y24, K1, (R10)(Y29*8)                  // 6202fd21a304ea
-       //TODO: VSCATTERQPD Y24, K1, (SP)(Y4*2)                    // 6262fd29a30464
-       //TODO: VSCATTERQPD Y24, K1, (DX)(Y10*4)                   // 6222fd29a30492
-       //TODO: VSCATTERQPD Z14, K2, (DX)(Z10*4)                   // 6232fd4aa33492
-       //TODO: VSCATTERQPD Z28, K2, (DX)(Z10*4)                   // 6222fd4aa32492
-       //TODO: VSCATTERQPD Z14, K2, (AX)(Z4*1)                    // 6272fd4aa33420
-       //TODO: VSCATTERQPD Z28, K2, (AX)(Z4*1)                    // 6262fd4aa32420
-       //TODO: VSCATTERQPD Z14, K2, (SP)(Z4*2)                    // 6272fd4aa33464
-       //TODO: VSCATTERQPD Z28, K2, (SP)(Z4*2)                    // 6262fd4aa32464
-       //TODO: VSCATTERQPS X0, K1, (DX)(X10*4)                    // 62b27d09a30492
-       //TODO: VSCATTERQPS X0, K1, (SP)(X4*2)                     // 62f27d09a30464
-       //TODO: VSCATTERQPS X0, K1, (R14)(X29*8)                   // 62927d01a304ee
-       //TODO: VSCATTERQPS X31, K7, (R14)(Y29*8)                  // 62027d27a33cee
-       //TODO: VSCATTERQPS X31, K7, (AX)(Y4*1)                    // 62627d2fa33c20
-       //TODO: VSCATTERQPS X31, K7, (BP)(Y10*2)                   // 62227d2fa37c5500
-       //TODO: VSCATTERQPS Y9, K1, (BP)(Z10*2)                    // 62327d49a34c5500
-       //TODO: VSCATTERQPS Y9, K1, (R10)(Z29*8)                   // 62127d41a30cea
-       //TODO: VSCATTERQPS Y9, K1, (R14)(Z29*8)                   // 62127d41a30cee
-       //TODO: VSHUFF32X4 $97, Y23, Y19, K1, Y3                   // 62b3652123df61
-       //TODO: VSHUFF32X4 $97, 15(R8), Y19, K1, Y3                // 62d3652123980f00000061
-       //TODO: VSHUFF32X4 $97, (BP), Y19, K1, Y3                  // 62f36521235d0061
-       //TODO: VSHUFF32X4 $81, Z19, Z15, K1, Z3                   // 62b3054923db51
-       //TODO: VSHUFF32X4 $81, Z15, Z15, K1, Z3                   // 62d3054923df51
-       //TODO: VSHUFF32X4 $81, 7(AX), Z15, K1, Z3                 // 62f3054923980700000051
-       //TODO: VSHUFF32X4 $81, (DI), Z15, K1, Z3                  // 62f30549231f51
-       //TODO: VSHUFF32X4 $81, Z19, Z30, K1, Z3                   // 62b30d4123db51
-       //TODO: VSHUFF32X4 $81, Z15, Z30, K1, Z3                   // 62d30d4123df51
-       //TODO: VSHUFF32X4 $81, 7(AX), Z30, K1, Z3                 // 62f30d4123980700000051
-       //TODO: VSHUFF32X4 $81, (DI), Z30, K1, Z3                  // 62f30d41231f51
-       //TODO: VSHUFF32X4 $81, Z19, Z15, K1, Z12                  // 6233054923e351
-       //TODO: VSHUFF32X4 $81, Z15, Z15, K1, Z12                  // 6253054923e751
-       //TODO: VSHUFF32X4 $81, 7(AX), Z15, K1, Z12                // 6273054923a00700000051
-       //TODO: VSHUFF32X4 $81, (DI), Z15, K1, Z12                 // 62730549232751
-       //TODO: VSHUFF32X4 $81, Z19, Z30, K1, Z12                  // 62330d4123e351
-       //TODO: VSHUFF32X4 $81, Z15, Z30, K1, Z12                  // 62530d4123e751
-       //TODO: VSHUFF32X4 $81, 7(AX), Z30, K1, Z12                // 62730d4123a00700000051
-       //TODO: VSHUFF32X4 $81, (DI), Z30, K1, Z12                 // 62730d41232751
-       //TODO: VSHUFF64X2 $42, Y21, Y14, K7, Y19                  // 62a38d2f23dd2a
-       //TODO: VSHUFF64X2 $42, 15(R8)(R14*8), Y14, K7, Y19        // 62838d2f239cf00f0000002a
-       //TODO: VSHUFF64X2 $42, -15(R14)(R15*2), Y14, K7, Y19      // 62838d2f239c7ef1ffffff2a
-       //TODO: VSHUFF64X2 $79, Z14, Z3, K2, Z5                    // 62d3e54a23ee4f
-       //TODO: VSHUFF64X2 $79, Z15, Z3, K2, Z5                    // 62d3e54a23ef4f
-       //TODO: VSHUFF64X2 $79, 99(R15)(R15*1), Z3, K2, Z5         // 6293e54a23ac3f630000004f
-       //TODO: VSHUFF64X2 $79, (DX), Z3, K2, Z5                   // 62f3e54a232a4f
-       //TODO: VSHUFF64X2 $79, Z14, Z5, K2, Z5                    // 62d3d54a23ee4f
-       //TODO: VSHUFF64X2 $79, Z15, Z5, K2, Z5                    // 62d3d54a23ef4f
-       //TODO: VSHUFF64X2 $79, 99(R15)(R15*1), Z5, K2, Z5         // 6293d54a23ac3f630000004f
-       //TODO: VSHUFF64X2 $79, (DX), Z5, K2, Z5                   // 62f3d54a232a4f
-       //TODO: VSHUFF64X2 $79, Z14, Z3, K2, Z1                    // 62d3e54a23ce4f
-       //TODO: VSHUFF64X2 $79, Z15, Z3, K2, Z1                    // 62d3e54a23cf4f
-       //TODO: VSHUFF64X2 $79, 99(R15)(R15*1), Z3, K2, Z1         // 6293e54a238c3f630000004f
-       //TODO: VSHUFF64X2 $79, (DX), Z3, K2, Z1                   // 62f3e54a230a4f
-       //TODO: VSHUFF64X2 $79, Z14, Z5, K2, Z1                    // 62d3d54a23ce4f
-       //TODO: VSHUFF64X2 $79, Z15, Z5, K2, Z1                    // 62d3d54a23cf4f
-       //TODO: VSHUFF64X2 $79, 99(R15)(R15*1), Z5, K2, Z1         // 6293d54a238c3f630000004f
-       //TODO: VSHUFF64X2 $79, (DX), Z5, K2, Z1                   // 62f3d54a230a4f
-       //TODO: VSHUFI32X4 $64, Y2, Y16, K4, Y5                    // 62f37d2443ea40
-       //TODO: VSHUFI32X4 $64, -15(R14)(R15*1), Y16, K4, Y5       // 62937d2443ac3ef1ffffff40
-       //TODO: VSHUFI32X4 $64, -15(BX), Y16, K4, Y5               // 62f37d2443abf1ffffff40
-       //TODO: VSHUFI32X4 $27, Z20, Z16, K1, Z21                  // 62a37d4143ec1b
-       //TODO: VSHUFI32X4 $27, Z0, Z16, K1, Z21                   // 62e37d4143e81b
-       //TODO: VSHUFI32X4 $27, -17(BP)(SI*8), Z16, K1, Z21        // 62e37d4143acf5efffffff1b
-       //TODO: VSHUFI32X4 $27, (R15), Z16, K1, Z21                // 62c37d41432f1b
-       //TODO: VSHUFI32X4 $27, Z20, Z9, K1, Z21                   // 62a3354943ec1b
-       //TODO: VSHUFI32X4 $27, Z0, Z9, K1, Z21                    // 62e3354943e81b
-       //TODO: VSHUFI32X4 $27, -17(BP)(SI*8), Z9, K1, Z21         // 62e3354943acf5efffffff1b
-       //TODO: VSHUFI32X4 $27, (R15), Z9, K1, Z21                 // 62c33549432f1b
-       //TODO: VSHUFI32X4 $27, Z20, Z16, K1, Z8                   // 62337d4143c41b
-       //TODO: VSHUFI32X4 $27, Z0, Z16, K1, Z8                    // 62737d4143c01b
-       //TODO: VSHUFI32X4 $27, -17(BP)(SI*8), Z16, K1, Z8         // 62737d414384f5efffffff1b
-       //TODO: VSHUFI32X4 $27, (R15), Z16, K1, Z8                 // 62537d4143071b
-       //TODO: VSHUFI32X4 $27, Z20, Z9, K1, Z8                    // 6233354943c41b
-       //TODO: VSHUFI32X4 $27, Z0, Z9, K1, Z8                     // 6273354943c01b
-       //TODO: VSHUFI32X4 $27, -17(BP)(SI*8), Z9, K1, Z8          // 627335494384f5efffffff1b
-       //TODO: VSHUFI32X4 $27, (R15), Z9, K1, Z8                  // 6253354943071b
-       //TODO: VSHUFI64X2 $47, Y6, Y20, K3, Y21                   // 62e3dd2343ee2f
-       //TODO: VSHUFI64X2 $47, 7(AX)(CX*4), Y20, K3, Y21          // 62e3dd2343ac88070000002f
-       //TODO: VSHUFI64X2 $47, 7(AX)(CX*1), Y20, K3, Y21          // 62e3dd2343ac08070000002f
-       //TODO: VSHUFI64X2 $82, Z0, Z0, K4, Z23                    // 62e3fd4c43f852
-       //TODO: VSHUFI64X2 $82, Z25, Z0, K4, Z23                   // 6283fd4c43f952
-       //TODO: VSHUFI64X2 $82, 7(SI)(DI*8), Z0, K4, Z23           // 62e3fd4c43bcfe0700000052
-       //TODO: VSHUFI64X2 $82, -15(R14), Z0, K4, Z23              // 62c3fd4c43bef1ffffff52
-       //TODO: VSHUFI64X2 $82, Z0, Z11, K4, Z23                   // 62e3a54c43f852
-       //TODO: VSHUFI64X2 $82, Z25, Z11, K4, Z23                  // 6283a54c43f952
-       //TODO: VSHUFI64X2 $82, 7(SI)(DI*8), Z11, K4, Z23          // 62e3a54c43bcfe0700000052
-       //TODO: VSHUFI64X2 $82, -15(R14), Z11, K4, Z23             // 62c3a54c43bef1ffffff52
-       //TODO: VSHUFI64X2 $82, Z0, Z0, K4, Z19                    // 62e3fd4c43d852
-       //TODO: VSHUFI64X2 $82, Z25, Z0, K4, Z19                   // 6283fd4c43d952
-       //TODO: VSHUFI64X2 $82, 7(SI)(DI*8), Z0, K4, Z19           // 62e3fd4c439cfe0700000052
-       //TODO: VSHUFI64X2 $82, -15(R14), Z0, K4, Z19              // 62c3fd4c439ef1ffffff52
-       //TODO: VSHUFI64X2 $82, Z0, Z11, K4, Z19                   // 62e3a54c43d852
-       //TODO: VSHUFI64X2 $82, Z25, Z11, K4, Z19                  // 6283a54c43d952
-       //TODO: VSHUFI64X2 $82, 7(SI)(DI*8), Z11, K4, Z19          // 62e3a54c439cfe0700000052
-       //TODO: VSHUFI64X2 $82, -15(R14), Z11, K4, Z19             // 62c3a54c439ef1ffffff52
-       //TODO: VSHUFPD $126, X8, X7, K5, X16                      // 62c1c50dc6c07e
-       //TODO: VSHUFPD $126, (BX), X7, K5, X16                    // 62e1c50dc6037e
-       //TODO: VSHUFPD $126, -17(BP)(SI*1), X7, K5, X16           // 62e1c50dc68435efffffff7e
-       //TODO: VSHUFPD $94, Y11, Y6, K7, Y31                      // 6241cd2fc6fb5e
-       //TODO: VSHUFPD $94, (SI), Y6, K7, Y31                     // 6261cd2fc63e5e
-       //TODO: VSHUFPD $94, 7(SI)(DI*2), Y6, K7, Y31              // 6261cd2fc6bc7e070000005e
-       //TODO: VSHUFPD $121, Z9, Z0, K7, Z24                      // 6241fd4fc6c179
-       //TODO: VSHUFPD $121, Z3, Z0, K7, Z24                      // 6261fd4fc6c379
-       //TODO: VSHUFPD $121, 7(SI)(DI*1), Z0, K7, Z24             // 6261fd4fc6843e0700000079
-       //TODO: VSHUFPD $121, 15(DX)(BX*8), Z0, K7, Z24            // 6261fd4fc684da0f00000079
-       //TODO: VSHUFPD $121, Z9, Z26, K7, Z24                     // 6241ad47c6c179
-       //TODO: VSHUFPD $121, Z3, Z26, K7, Z24                     // 6261ad47c6c379
-       //TODO: VSHUFPD $121, 7(SI)(DI*1), Z26, K7, Z24            // 6261ad47c6843e0700000079
-       //TODO: VSHUFPD $121, 15(DX)(BX*8), Z26, K7, Z24           // 6261ad47c684da0f00000079
-       //TODO: VSHUFPD $121, Z9, Z0, K7, Z12                      // 6251fd4fc6e179
-       //TODO: VSHUFPD $121, Z3, Z0, K7, Z12                      // 6271fd4fc6e379
-       //TODO: VSHUFPD $121, 7(SI)(DI*1), Z0, K7, Z12             // 6271fd4fc6a43e0700000079
-       //TODO: VSHUFPD $121, 15(DX)(BX*8), Z0, K7, Z12            // 6271fd4fc6a4da0f00000079
-       //TODO: VSHUFPD $121, Z9, Z26, K7, Z12                     // 6251ad47c6e179
-       //TODO: VSHUFPD $121, Z3, Z26, K7, Z12                     // 6271ad47c6e379
-       //TODO: VSHUFPD $121, 7(SI)(DI*1), Z26, K7, Z12            // 6271ad47c6a43e0700000079
-       //TODO: VSHUFPD $121, 15(DX)(BX*8), Z26, K7, Z12           // 6271ad47c6a4da0f00000079
-       //TODO: VSHUFPS $13, X15, X0, K6, X1                       // 62d17c0ec6cf0d
-       //TODO: VSHUFPS $13, 15(R8)(R14*4), X0, K6, X1             // 62917c0ec68cb00f0000000d
-       //TODO: VSHUFPS $13, -7(CX)(DX*4), X0, K6, X1              // 62f17c0ec68c91f9ffffff0d
-       //TODO: VSHUFPS $65, Y6, Y7, K3, Y19                       // 62e1442bc6de41
-       //TODO: VSHUFPS $65, 17(SP)(BP*8), Y7, K3, Y19             // 62e1442bc69cec1100000041
-       //TODO: VSHUFPS $65, 17(SP)(BP*4), Y7, K3, Y19             // 62e1442bc69cac1100000041
-       //TODO: VSHUFPS $67, Z20, Z9, K7, Z9                       // 6231344fc6cc43
-       //TODO: VSHUFPS $67, Z0, Z9, K7, Z9                        // 6271344fc6c843
-       //TODO: VSHUFPS $67, -7(DI)(R8*1), Z9, K7, Z9              // 6231344fc68c07f9ffffff43
-       //TODO: VSHUFPS $67, (SP), Z9, K7, Z9                      // 6271344fc60c2443
-       //TODO: VSHUFPS $67, Z20, Z28, K7, Z9                      // 62311c47c6cc43
-       //TODO: VSHUFPS $67, Z0, Z28, K7, Z9                       // 62711c47c6c843
-       //TODO: VSHUFPS $67, -7(DI)(R8*1), Z28, K7, Z9             // 62311c47c68c07f9ffffff43
-       //TODO: VSHUFPS $67, (SP), Z28, K7, Z9                     // 62711c47c60c2443
-       //TODO: VSHUFPS $67, Z20, Z9, K7, Z25                      // 6221344fc6cc43
-       //TODO: VSHUFPS $67, Z0, Z9, K7, Z25                       // 6261344fc6c843
-       //TODO: VSHUFPS $67, -7(DI)(R8*1), Z9, K7, Z25             // 6221344fc68c07f9ffffff43
-       //TODO: VSHUFPS $67, (SP), Z9, K7, Z25                     // 6261344fc60c2443
-       //TODO: VSHUFPS $67, Z20, Z28, K7, Z25                     // 62211c47c6cc43
-       //TODO: VSHUFPS $67, Z0, Z28, K7, Z25                      // 62611c47c6c843
-       //TODO: VSHUFPS $67, -7(DI)(R8*1), Z28, K7, Z25            // 62211c47c68c07f9ffffff43
-       //TODO: VSHUFPS $67, (SP), Z28, K7, Z25                    // 62611c47c60c2443
-       //TODO: VSQRTPD X16, K4, X0                                // 62b1fd0c51c0
-       //TODO: VSQRTPD (R8), K4, X0                               // 62d1fd0c5100
-       //TODO: VSQRTPD 15(DX)(BX*2), K4, X0                       // 62f1fd0c51845a0f000000
-       //TODO: VSQRTPD Y3, K4, Y0                                 // 62f1fd2c51c3
-       //TODO: VSQRTPD 7(SI)(DI*4), K4, Y0                        // 62f1fd2c5184be07000000
-       //TODO: VSQRTPD -7(DI)(R8*2), K4, Y0                       // 62b1fd2c518447f9ffffff
-       //TODO: VSQRTPD Z17, K7, Z17                               // 62a1fd4f51c9
-       //TODO: VSQRTPD Z23, K7, Z17                               // 62a1fd4f51cf
-       //TODO: VSQRTPD Z17, K7, Z0                                // 62b1fd4f51c1
-       //TODO: VSQRTPD Z23, K7, Z0                                // 62b1fd4f51c7
-       //TODO: VSQRTPD Z21, K2, Z31                               // 6221fd4a51fd
-       //TODO: VSQRTPD Z9, K2, Z31                                // 6241fd4a51f9
-       //TODO: VSQRTPD -7(CX), K2, Z31                            // 6261fd4a51b9f9ffffff
-       //TODO: VSQRTPD 15(DX)(BX*4), K2, Z31                      // 6261fd4a51bc9a0f000000
-       //TODO: VSQRTPD Z21, K2, Z0                                // 62b1fd4a51c5
-       //TODO: VSQRTPD Z9, K2, Z0                                 // 62d1fd4a51c1
-       //TODO: VSQRTPD -7(CX), K2, Z0                             // 62f1fd4a5181f9ffffff
-       //TODO: VSQRTPD 15(DX)(BX*4), K2, Z0                       // 62f1fd4a51849a0f000000
-       //TODO: VSQRTPS X0, K5, X21                                // 62e17c0d51e8
-       //TODO: VSQRTPS 17(SP)(BP*1), K5, X21                      // 62e17c0d51ac2c11000000
-       //TODO: VSQRTPS -7(CX)(DX*8), K5, X21                      // 62e17c0d51acd1f9ffffff
-       //TODO: VSQRTPS Y20, K3, Y5                                // 62b17c2b51ec
-       //TODO: VSQRTPS 17(SP), K3, Y5                             // 62f17c2b51ac2411000000
-       //TODO: VSQRTPS -17(BP)(SI*4), K3, Y5                      // 62f17c2b51acb5efffffff
-       //TODO: VSQRTPS Z1, K4, Z6                                 // 62f17c4c51f1
-       //TODO: VSQRTPS Z9, K4, Z6                                 // 62d17c4c51f1
-       //TODO: VSQRTPS Z1, K4, Z9                                 // 62717c4c51c9
-       //TODO: VSQRTPS Z9, K4, Z9                                 // 62517c4c51c9
-       //TODO: VSQRTPS Z30, K2, Z20                               // 62817c4a51e6
-       //TODO: VSQRTPS Z5, K2, Z20                                // 62e17c4a51e5
-       //TODO: VSQRTPS 99(R15)(R15*8), K2, Z20                    // 62817c4a51a4ff63000000
-       //TODO: VSQRTPS 7(AX)(CX*8), K2, Z20                       // 62e17c4a51a4c807000000
-       //TODO: VSQRTPS Z30, K2, Z9                                // 62117c4a51ce
-       //TODO: VSQRTPS Z5, K2, Z9                                 // 62717c4a51cd
-       //TODO: VSQRTPS 99(R15)(R15*8), K2, Z9                     // 62117c4a518cff63000000
-       //TODO: VSQRTPS 7(AX)(CX*8), K2, Z9                        // 62717c4a518cc807000000
-       //TODO: VSQRTSD X7, X22, K2, X28                           // 6261cf0251e7
-       //TODO: VSQRTSD X16, X7, K3, X19                           // 62a1c70b51d8 or 62a1c72b51d8 or 62a1c74b51d8
-       //TODO: VSQRTSD 7(SI)(DI*8), X7, K3, X19                   // 62e1c70b519cfe07000000 or 62e1c72b519cfe07000000 or 62e1c74b519cfe07000000
-       //TODO: VSQRTSD -15(R14), X7, K3, X19                      // 62c1c70b519ef1ffffff or 62c1c72b519ef1ffffff or 62c1c74b519ef1ffffff
-       //TODO: VSQRTSS X7, X1, K3, X31                            // 6261760b51ff
-       //TODO: VSQRTSS X12, X15, K3, X9                           // 6251060b51cc or 6251062b51cc or 6251064b51cc
-       //TODO: VSQRTSS 17(SP)(BP*1), X15, K3, X9                  // 6271060b518c2c11000000 or 6271062b518c2c11000000 or 6271064b518c2c11000000
-       //TODO: VSQRTSS -7(CX)(DX*8), X15, K3, X9                  // 6271060b518cd1f9ffffff or 6271062b518cd1f9ffffff or 6271064b518cd1f9ffffff
-       //TODO: VSUBPD X14, X12, K2, X0                            // 62d19d0a5cc6
-       //TODO: VSUBPD -17(BP)(SI*2), X12, K2, X0                  // 62f19d0a5c8475efffffff
-       //TODO: VSUBPD 7(AX)(CX*2), X12, K2, X0                    // 62f19d0a5c844807000000
-       //TODO: VSUBPD Y5, Y3, K1, Y12                             // 6271e5295ce5
-       //TODO: VSUBPD 7(AX), Y3, K1, Y12                          // 6271e5295ca007000000
-       //TODO: VSUBPD (DI), Y3, K1, Y12                           // 6271e5295c27
-       //TODO: VSUBPD Z16, Z7, K2, Z26                            // 6221c54a5cd0
-       //TODO: VSUBPD Z25, Z7, K2, Z26                            // 6201c54a5cd1
-       //TODO: VSUBPD Z16, Z21, K2, Z26                           // 6221d5425cd0
-       //TODO: VSUBPD Z25, Z21, K2, Z26                           // 6201d5425cd1
-       //TODO: VSUBPD Z16, Z7, K2, Z22                            // 62a1c54a5cf0
-       //TODO: VSUBPD Z25, Z7, K2, Z22                            // 6281c54a5cf1
-       //TODO: VSUBPD Z16, Z21, K2, Z22                           // 62a1d5425cf0
-       //TODO: VSUBPD Z25, Z21, K2, Z22                           // 6281d5425cf1
-       //TODO: VSUBPD Z21, Z12, K1, Z14                           // 62319d495cf5
-       //TODO: VSUBPD Z9, Z12, K1, Z14                            // 62519d495cf1
-       //TODO: VSUBPD (AX), Z12, K1, Z14                          // 62719d495c30
-       //TODO: VSUBPD 7(SI), Z12, K1, Z14                         // 62719d495cb607000000
-       //TODO: VSUBPD Z21, Z13, K1, Z14                           // 623195495cf5
-       //TODO: VSUBPD Z9, Z13, K1, Z14                            // 625195495cf1
-       //TODO: VSUBPD (AX), Z13, K1, Z14                          // 627195495c30
-       //TODO: VSUBPD 7(SI), Z13, K1, Z14                         // 627195495cb607000000
-       //TODO: VSUBPD Z21, Z12, K1, Z13                           // 62319d495ced
-       //TODO: VSUBPD Z9, Z12, K1, Z13                            // 62519d495ce9
-       //TODO: VSUBPD (AX), Z12, K1, Z13                          // 62719d495c28
-       //TODO: VSUBPD 7(SI), Z12, K1, Z13                         // 62719d495cae07000000
-       //TODO: VSUBPD Z21, Z13, K1, Z13                           // 623195495ced
-       //TODO: VSUBPD Z9, Z13, K1, Z13                            // 625195495ce9
-       //TODO: VSUBPD (AX), Z13, K1, Z13                          // 627195495c28
-       //TODO: VSUBPD 7(SI), Z13, K1, Z13                         // 627195495cae07000000
-       //TODO: VSUBPS X15, X17, K7, X5                            // 62d174075cef
-       //TODO: VSUBPS 15(R8)(R14*1), X17, K7, X5                  // 629174075cac300f000000
-       //TODO: VSUBPS 15(R8)(R14*2), X17, K7, X5                  // 629174075cac700f000000
-       //TODO: VSUBPS Y0, Y7, K1, Y28                             // 626144295ce0
-       //TODO: VSUBPS 99(R15)(R15*1), Y7, K1, Y28                 // 620144295ca43f63000000
-       //TODO: VSUBPS (DX), Y7, K1, Y28                           // 626144295c22
-       //TODO: VSUBPS Z23, Z27, K1, Z2                            // 62b124415cd7
-       //TODO: VSUBPS Z9, Z27, K1, Z2                             // 62d124415cd1
-       //TODO: VSUBPS Z23, Z25, K1, Z2                            // 62b134415cd7
-       //TODO: VSUBPS Z9, Z25, K1, Z2                             // 62d134415cd1
-       //TODO: VSUBPS Z23, Z27, K1, Z7                            // 62b124415cff
-       //TODO: VSUBPS Z9, Z27, K1, Z7                             // 62d124415cf9
-       //TODO: VSUBPS Z23, Z25, K1, Z7                            // 62b134415cff
-       //TODO: VSUBPS Z9, Z25, K1, Z7                             // 62d134415cf9
-       //TODO: VSUBPS Z14, Z3, K1, Z27                            // 624164495cde
-       //TODO: VSUBPS Z7, Z3, K1, Z27                             // 626164495cdf
-       //TODO: VSUBPS (BX), Z3, K1, Z27                           // 626164495c1b
-       //TODO: VSUBPS -17(BP)(SI*1), Z3, K1, Z27                  // 626164495c9c35efffffff
-       //TODO: VSUBPS Z14, Z0, K1, Z27                            // 62417c495cde
-       //TODO: VSUBPS Z7, Z0, K1, Z27                             // 62617c495cdf
-       //TODO: VSUBPS (BX), Z0, K1, Z27                           // 62617c495c1b
-       //TODO: VSUBPS -17(BP)(SI*1), Z0, K1, Z27                  // 62617c495c9c35efffffff
-       //TODO: VSUBPS Z14, Z3, K1, Z14                            // 625164495cf6
-       //TODO: VSUBPS Z7, Z3, K1, Z14                             // 627164495cf7
-       //TODO: VSUBPS (BX), Z3, K1, Z14                           // 627164495c33
-       //TODO: VSUBPS -17(BP)(SI*1), Z3, K1, Z14                  // 627164495cb435efffffff
-       //TODO: VSUBPS Z14, Z0, K1, Z14                            // 62517c495cf6
-       //TODO: VSUBPS Z7, Z0, K1, Z14                             // 62717c495cf7
-       //TODO: VSUBPS (BX), Z0, K1, Z14                           // 62717c495c33
-       //TODO: VSUBPS -17(BP)(SI*1), Z0, K1, Z14                  // 62717c495cb435efffffff
-       //TODO: VSUBSD X26, X3, K7, X8                             // 6211e70f5cc2
-       //TODO: VSUBSD X28, X13, K2, X23                           // 6281970a5cfc or 6281972a5cfc or 6281974a5cfc
-       //TODO: VSUBSD 7(SI)(DI*1), X13, K2, X23                   // 62e1970a5cbc3e07000000 or 62e1972a5cbc3e07000000 or 62e1974a5cbc3e07000000
-       //TODO: VSUBSD 15(DX)(BX*8), X13, K2, X23                  // 62e1970a5cbcda0f000000 or 62e1972a5cbcda0f000000 or 62e1974a5cbcda0f000000
-       //TODO: VSUBSS X15, X9, K4, X24                            // 6241360c5cc7
-       //TODO: VSUBSS X21, X18, K1, X26                           // 62216e015cd5 or 62216e215cd5 or 62216e415cd5
-       //TODO: VSUBSS -17(BP)(SI*2), X18, K1, X26                 // 62616e015c9475efffffff or 62616e215c9475efffffff or 62616e415c9475efffffff
-       //TODO: VSUBSS 7(AX)(CX*2), X18, K1, X26                   // 62616e015c944807000000 or 62616e215c944807000000 or 62616e415c944807000000
-       //TODO: VUCOMISD X3, X31                                   // 6261fd082efb or 6261fd282efb or 6261fd482efb
-       //TODO: VUCOMISD -7(DI)(R8*1), X31                         // 6221fd082ebc07f9ffffff or 6221fd282ebc07f9ffffff or 6221fd482ebc07f9ffffff
-       //TODO: VUCOMISD (SP), X31                                 // 6261fd082e3c24 or 6261fd282e3c24 or 6261fd482e3c24
-       //TODO: VUCOMISS X24, X0                                   // 62917c082ec0 or 62917c282ec0 or 62917c482ec0
-       //TODO: VUNPCKHPD X9, X7, K3, X20                          // 62c1c50b15e1
-       //TODO: VUNPCKHPD (R14), X7, K3, X20                       // 62c1c50b1526
-       //TODO: VUNPCKHPD -7(DI)(R8*8), X7, K3, X20                // 62a1c50b15a4c7f9ffffff
-       //TODO: VUNPCKHPD Y12, Y13, K4, Y22                        // 62c1952c15f4
-       //TODO: VUNPCKHPD -17(BP)(SI*8), Y13, K4, Y22              // 62e1952c15b4f5efffffff
-       //TODO: VUNPCKHPD (R15), Y13, K4, Y22                      // 62c1952c1537
-       //TODO: VUNPCKHPD Z1, Z22, K5, Z8                          // 6271cd4515c1
-       //TODO: VUNPCKHPD Z16, Z22, K5, Z8                         // 6231cd4515c0
-       //TODO: VUNPCKHPD 15(R8)(R14*4), Z22, K5, Z8               // 6211cd451584b00f000000
-       //TODO: VUNPCKHPD -7(CX)(DX*4), Z22, K5, Z8                // 6271cd45158491f9ffffff
-       //TODO: VUNPCKHPD Z1, Z25, K5, Z8                          // 6271b54515c1
-       //TODO: VUNPCKHPD Z16, Z25, K5, Z8                         // 6231b54515c0
-       //TODO: VUNPCKHPD 15(R8)(R14*4), Z25, K5, Z8               // 6211b5451584b00f000000
-       //TODO: VUNPCKHPD -7(CX)(DX*4), Z25, K5, Z8                // 6271b545158491f9ffffff
-       //TODO: VUNPCKHPD Z1, Z22, K5, Z24                         // 6261cd4515c1
-       //TODO: VUNPCKHPD Z16, Z22, K5, Z24                        // 6221cd4515c0
-       //TODO: VUNPCKHPD 15(R8)(R14*4), Z22, K5, Z24              // 6201cd451584b00f000000
-       //TODO: VUNPCKHPD -7(CX)(DX*4), Z22, K5, Z24               // 6261cd45158491f9ffffff
-       //TODO: VUNPCKHPD Z1, Z25, K5, Z24                         // 6261b54515c1
-       //TODO: VUNPCKHPD Z16, Z25, K5, Z24                        // 6221b54515c0
-       //TODO: VUNPCKHPD 15(R8)(R14*4), Z25, K5, Z24              // 6201b5451584b00f000000
-       //TODO: VUNPCKHPD -7(CX)(DX*4), Z25, K5, Z24               // 6261b545158491f9ffffff
-       //TODO: VUNPCKHPS X5, X14, K7, X7                          // 62f10c0f15fd
-       //TODO: VUNPCKHPS 99(R15)(R15*4), X14, K7, X7              // 62910c0f15bcbf63000000
-       //TODO: VUNPCKHPS 15(DX), X14, K7, X7                      // 62f10c0f15ba0f000000
-       //TODO: VUNPCKHPS Y17, Y14, K7, Y1                         // 62b10c2f15c9
-       //TODO: VUNPCKHPS 7(SI)(DI*8), Y14, K7, Y1                 // 62f10c2f158cfe07000000
-       //TODO: VUNPCKHPS -15(R14), Y14, K7, Y1                    // 62d10c2f158ef1ffffff
-       //TODO: VUNPCKHPS Z15, Z0, K6, Z6                          // 62d17c4e15f7
-       //TODO: VUNPCKHPS Z12, Z0, K6, Z6                          // 62d17c4e15f4
-       //TODO: VUNPCKHPS (R8), Z0, K6, Z6                         // 62d17c4e1530
-       //TODO: VUNPCKHPS 15(DX)(BX*2), Z0, K6, Z6                 // 62f17c4e15b45a0f000000
-       //TODO: VUNPCKHPS Z15, Z8, K6, Z6                          // 62d13c4e15f7
-       //TODO: VUNPCKHPS Z12, Z8, K6, Z6                          // 62d13c4e15f4
-       //TODO: VUNPCKHPS (R8), Z8, K6, Z6                         // 62d13c4e1530
-       //TODO: VUNPCKHPS 15(DX)(BX*2), Z8, K6, Z6                 // 62f13c4e15b45a0f000000
-       //TODO: VUNPCKHPS Z15, Z0, K6, Z2                          // 62d17c4e15d7
-       //TODO: VUNPCKHPS Z12, Z0, K6, Z2                          // 62d17c4e15d4
-       //TODO: VUNPCKHPS (R8), Z0, K6, Z2                         // 62d17c4e1510
-       //TODO: VUNPCKHPS 15(DX)(BX*2), Z0, K6, Z2                 // 62f17c4e15945a0f000000
-       //TODO: VUNPCKHPS Z15, Z8, K6, Z2                          // 62d13c4e15d7
-       //TODO: VUNPCKHPS Z12, Z8, K6, Z2                          // 62d13c4e15d4
-       //TODO: VUNPCKHPS (R8), Z8, K6, Z2                         // 62d13c4e1510
-       //TODO: VUNPCKHPS 15(DX)(BX*2), Z8, K6, Z2                 // 62f13c4e15945a0f000000
-       //TODO: VUNPCKLPD X21, X3, K3, X31                         // 6221e50b14fd
-       //TODO: VUNPCKLPD (CX), X3, K3, X31                        // 6261e50b1439
-       //TODO: VUNPCKLPD 99(R15), X3, K3, X31                     // 6241e50b14bf63000000
-       //TODO: VUNPCKLPD Y31, Y9, K7, Y7                          // 6291b52f14ff
-       //TODO: VUNPCKLPD 7(SI)(DI*1), Y9, K7, Y7                  // 62f1b52f14bc3e07000000
-       //TODO: VUNPCKLPD 15(DX)(BX*8), Y9, K7, Y7                 // 62f1b52f14bcda0f000000
-       //TODO: VUNPCKLPD Z13, Z11, K4, Z14                        // 6251a54c14f5
-       //TODO: VUNPCKLPD Z14, Z11, K4, Z14                        // 6251a54c14f6
-       //TODO: VUNPCKLPD 17(SP)(BP*1), Z11, K4, Z14               // 6271a54c14b42c11000000
-       //TODO: VUNPCKLPD -7(CX)(DX*8), Z11, K4, Z14               // 6271a54c14b4d1f9ffffff
-       //TODO: VUNPCKLPD Z13, Z5, K4, Z14                         // 6251d54c14f5
-       //TODO: VUNPCKLPD Z14, Z5, K4, Z14                         // 6251d54c14f6
-       //TODO: VUNPCKLPD 17(SP)(BP*1), Z5, K4, Z14                // 6271d54c14b42c11000000
-       //TODO: VUNPCKLPD -7(CX)(DX*8), Z5, K4, Z14                // 6271d54c14b4d1f9ffffff
-       //TODO: VUNPCKLPD Z13, Z11, K4, Z27                        // 6241a54c14dd
-       //TODO: VUNPCKLPD Z14, Z11, K4, Z27                        // 6241a54c14de
-       //TODO: VUNPCKLPD 17(SP)(BP*1), Z11, K4, Z27               // 6261a54c149c2c11000000
-       //TODO: VUNPCKLPD -7(CX)(DX*8), Z11, K4, Z27               // 6261a54c149cd1f9ffffff
-       //TODO: VUNPCKLPD Z13, Z5, K4, Z27                         // 6241d54c14dd
-       //TODO: VUNPCKLPD Z14, Z5, K4, Z27                         // 6241d54c14de
-       //TODO: VUNPCKLPD 17(SP)(BP*1), Z5, K4, Z27                // 6261d54c149c2c11000000
-       //TODO: VUNPCKLPD -7(CX)(DX*8), Z5, K4, Z27                // 6261d54c149cd1f9ffffff
-       //TODO: VUNPCKLPS X13, X11, K4, X1                         // 62d1240c14cd
-       //TODO: VUNPCKLPS 99(R15)(R15*2), X11, K4, X1              // 6291240c148c7f63000000
-       //TODO: VUNPCKLPS -7(DI), X11, K4, X1                      // 62f1240c148ff9ffffff
-       //TODO: VUNPCKLPS Y28, Y1, K7, Y8                          // 6211742f14c4
-       //TODO: VUNPCKLPS -7(DI)(R8*1), Y1, K7, Y8                 // 6231742f148407f9ffffff
-       //TODO: VUNPCKLPS (SP), Y1, K7, Y8                         // 6271742f140424
-       //TODO: VUNPCKLPS Z6, Z2, K2, Z5                           // 62f16c4a14ee
-       //TODO: VUNPCKLPS Z14, Z2, K2, Z5                          // 62d16c4a14ee
-       //TODO: VUNPCKLPS -17(BP)(SI*2), Z2, K2, Z5                // 62f16c4a14ac75efffffff
-       //TODO: VUNPCKLPS 7(AX)(CX*2), Z2, K2, Z5                  // 62f16c4a14ac4807000000
-       //TODO: VUNPCKLPS Z6, Z2, K2, Z23                          // 62e16c4a14fe
-       //TODO: VUNPCKLPS Z14, Z2, K2, Z23                         // 62c16c4a14fe
-       //TODO: VUNPCKLPS -17(BP)(SI*2), Z2, K2, Z23               // 62e16c4a14bc75efffffff
-       //TODO: VUNPCKLPS 7(AX)(CX*2), Z2, K2, Z23                 // 62e16c4a14bc4807000000
+       KANDNW K4, K4, K6                                  // c5dc42f4
+       KANDNW K5, K4, K6                                  // c5dc42f5
+       KANDNW K4, K6, K6                                  // c5cc42f4
+       KANDNW K5, K6, K6                                  // c5cc42f5
+       KANDNW K4, K4, K4                                  // c5dc42e4
+       KANDNW K5, K4, K4                                  // c5dc42e5
+       KANDNW K4, K6, K4                                  // c5cc42e4
+       KANDNW K5, K6, K4                                  // c5cc42e5
+       KANDW K5, K3, K1                                   // c5e441cd
+       KANDW K4, K3, K1                                   // c5e441cc
+       KANDW K5, K1, K1                                   // c5f441cd
+       KANDW K4, K1, K1                                   // c5f441cc
+       KANDW K5, K3, K5                                   // c5e441ed
+       KANDW K4, K3, K5                                   // c5e441ec
+       KANDW K5, K1, K5                                   // c5f441ed
+       KANDW K4, K1, K5                                   // c5f441ec
+       KMOVW K5, 17(SP)                                   // c5f8916c2411
+       KMOVW K4, 17(SP)                                   // c5f891642411
+       KMOVW K5, -17(BP)(SI*4)                            // c5f8916cb5ef
+       KMOVW K4, -17(BP)(SI*4)                            // c5f89164b5ef
+       KMOVW K7, SP                                       // c5f893e7
+       KMOVW K6, SP                                       // c5f893e6
+       KMOVW K7, R14                                      // c57893f7
+       KMOVW K6, R14                                      // c57893f6
+       KMOVW K0, K4                                       // c5f890e0
+       KMOVW K7, K4                                       // c5f890e7
+       KMOVW 7(AX), K4                                    // c5f8906007
+       KMOVW (DI), K4                                     // c5f89027
+       KMOVW K0, K6                                       // c5f890f0
+       KMOVW K7, K6                                       // c5f890f7
+       KMOVW 7(AX), K6                                    // c5f8907007
+       KMOVW (DI), K6                                     // c5f89037
+       KMOVW AX, K5                                       // c5f892e8
+       KMOVW R9, K5                                       // c4c17892e9
+       KMOVW AX, K4                                       // c5f892e0
+       KMOVW R9, K4                                       // c4c17892e1
+       KNOTW K0, K2                                       // c5f844d0
+       KNOTW K5, K2                                       // c5f844d5
+       KNOTW K0, K7                                       // c5f844f8
+       KNOTW K5, K7                                       // c5f844fd
+       KORTESTW K6, K0                                    // c5f898c6
+       KORTESTW K5, K0                                    // c5f898c5
+       KORTESTW K6, K5                                    // c5f898ee
+       KORTESTW K5, K5                                    // c5f898ed
+       KORW K5, K3, K1                                    // c5e445cd
+       KORW K4, K3, K1                                    // c5e445cc
+       KORW K5, K1, K1                                    // c5f445cd
+       KORW K4, K1, K1                                    // c5f445cc
+       KORW K5, K3, K5                                    // c5e445ed
+       KORW K4, K3, K5                                    // c5e445ec
+       KORW K5, K1, K5                                    // c5f445ed
+       KORW K4, K1, K5                                    // c5f445ec
+       KSHIFTLW $81, K6, K6                               // c4e3f932f651
+       KSHIFTLW $81, K4, K6                               // c4e3f932f451
+       KSHIFTLW $81, K6, K7                               // c4e3f932fe51
+       KSHIFTLW $81, K4, K7                               // c4e3f932fc51
+       KSHIFTRW $27, K5, K3                               // c4e3f930dd1b
+       KSHIFTRW $27, K4, K3                               // c4e3f930dc1b
+       KSHIFTRW $27, K5, K1                               // c4e3f930cd1b
+       KSHIFTRW $27, K4, K1                               // c4e3f930cc1b
+       KUNPCKBW K2, K4, K4                                // c5dd4be2
+       KUNPCKBW K7, K4, K4                                // c5dd4be7
+       KUNPCKBW K2, K5, K4                                // c5d54be2
+       KUNPCKBW K7, K5, K4                                // c5d54be7
+       KUNPCKBW K2, K4, K6                                // c5dd4bf2
+       KUNPCKBW K7, K4, K6                                // c5dd4bf7
+       KUNPCKBW K2, K5, K6                                // c5d54bf2
+       KUNPCKBW K7, K5, K6                                // c5d54bf7
+       KXNORW K6, K0, K2                                  // c5fc46d6
+       KXNORW K5, K0, K2                                  // c5fc46d5
+       KXNORW K6, K5, K2                                  // c5d446d6
+       KXNORW K5, K5, K2                                  // c5d446d5
+       KXNORW K6, K0, K7                                  // c5fc46fe
+       KXNORW K5, K0, K7                                  // c5fc46fd
+       KXNORW K6, K5, K7                                  // c5d446fe
+       KXNORW K5, K5, K7                                  // c5d446fd
+       KXORW K4, K6, K6                                   // c5cc47f4
+       KXORW K6, K6, K6                                   // c5cc47f6
+       KXORW K4, K4, K6                                   // c5dc47f4
+       KXORW K6, K4, K6                                   // c5dc47f6
+       KXORW K4, K6, K7                                   // c5cc47fc
+       KXORW K6, K6, K7                                   // c5cc47fe
+       KXORW K4, K4, K7                                   // c5dc47fc
+       KXORW K6, K4, K7                                   // c5dc47fe
+       VADDPD X15, X11, K2, X3                            // 62d1a50a58df
+       VADDPD 7(SI)(DI*8), X11, K2, X3                    // 62f1a50a589cfe07000000
+       VADDPD -15(R14), X11, K2, X3                       // 62d1a50a589ef1ffffff
+       VADDPD Y25, Y31, K2, Y14                           // 6211852258f1
+       VADDPD 17(SP), Y31, K2, Y14                        // 6271852258b42411000000
+       VADDPD -17(BP)(SI*4), Y31, K2, Y14                 // 6271852258b4b5efffffff
+       VADDPD Z13, Z11, K3, Z14                           // 6251a54b58f5
+       VADDPD Z14, Z11, K3, Z14                           // 6251a54b58f6
+       VADDPD Z13, Z5, K3, Z14                            // 6251d54b58f5
+       VADDPD Z14, Z5, K3, Z14                            // 6251d54b58f6
+       VADDPD Z13, Z11, K3, Z27                           // 6241a54b58dd
+       VADDPD Z14, Z11, K3, Z27                           // 6241a54b58de
+       VADDPD Z13, Z5, K3, Z27                            // 6241d54b58dd
+       VADDPD Z14, Z5, K3, Z27                            // 6241d54b58de
+       VADDPD Z6, Z2, K3, Z5                              // 62f1ed4b58ee
+       VADDPD Z14, Z2, K3, Z5                             // 62d1ed4b58ee
+       VADDPD 17(SP), Z2, K3, Z5                          // 62f1ed4b58ac2411000000
+       VADDPD -17(BP)(SI*4), Z2, K3, Z5                   // 62f1ed4b58acb5efffffff
+       VADDPD Z6, Z2, K3, Z23                             // 62e1ed4b58fe
+       VADDPD Z14, Z2, K3, Z23                            // 62c1ed4b58fe
+       VADDPD 17(SP), Z2, K3, Z23                         // 62e1ed4b58bc2411000000
+       VADDPD -17(BP)(SI*4), Z2, K3, Z23                  // 62e1ed4b58bcb5efffffff
+       VADDPS X6, X13, K3, X30                            // 6261140b58f6
+       VADDPS 7(SI)(DI*1), X13, K3, X30                   // 6261140b58b43e07000000
+       VADDPS 15(DX)(BX*8), X13, K3, X30                  // 6261140b58b4da0f000000
+       VADDPS Y27, Y22, K2, Y2                            // 62914c2258d3
+       VADDPS 7(AX), Y22, K2, Y2                          // 62f14c22589007000000
+       VADDPS (DI), Y22, K2, Y2                           // 62f14c225817
+       VADDPS Z13, Z28, K1, Z26                           // 62411c4158d5
+       VADDPS Z21, Z28, K1, Z26                           // 62211c4158d5
+       VADDPS Z13, Z6, K1, Z26                            // 62414c4958d5
+       VADDPS Z21, Z6, K1, Z26                            // 62214c4958d5
+       VADDPS Z13, Z28, K1, Z14                           // 62511c4158f5
+       VADDPS Z21, Z28, K1, Z14                           // 62311c4158f5
+       VADDPS Z13, Z6, K1, Z14                            // 62514c4958f5
+       VADDPS Z21, Z6, K1, Z14                            // 62314c4958f5
+       VADDPS Z21, Z3, K2, Z26                            // 6221644a58d5
+       VADDPS Z13, Z3, K2, Z26                            // 6241644a58d5
+       VADDPS 7(AX), Z3, K2, Z26                          // 6261644a589007000000
+       VADDPS (DI), Z3, K2, Z26                           // 6261644a5817
+       VADDPS Z21, Z0, K2, Z26                            // 62217c4a58d5
+       VADDPS Z13, Z0, K2, Z26                            // 62417c4a58d5
+       VADDPS 7(AX), Z0, K2, Z26                          // 62617c4a589007000000
+       VADDPS (DI), Z0, K2, Z26                           // 62617c4a5817
+       VADDPS Z21, Z3, K2, Z3                             // 62b1644a58dd
+       VADDPS Z13, Z3, K2, Z3                             // 62d1644a58dd
+       VADDPS 7(AX), Z3, K2, Z3                           // 62f1644a589807000000
+       VADDPS (DI), Z3, K2, Z3                            // 62f1644a581f
+       VADDPS Z21, Z0, K2, Z3                             // 62b17c4a58dd
+       VADDPS Z13, Z0, K2, Z3                             // 62d17c4a58dd
+       VADDPS 7(AX), Z0, K2, Z3                           // 62f17c4a589807000000
+       VADDPS (DI), Z0, K2, Z3                            // 62f17c4a581f
+       VADDSD X30, X23, K1, X12                           // 6211c70158e6
+       VADDSD X2, X20, K7, X8                             // 6271df0758c2 or 6271df2758c2 or 6271df4758c2
+       VADDSD 99(R15)(R15*1), X20, K7, X8                 // 6211df0758843f63000000 or 6211df2758843f63000000 or 6211df4758843f63000000
+       VADDSD (DX), X20, K7, X8                           // 6271df075802 or 6271df275802 or 6271df475802
+       VADDSS X19, X26, K1, X9                            // 62312e0158cb
+       VADDSS X16, X31, K1, X0                            // 62b1060158c0 or 62b1062158c0 or 62b1064158c0
+       VADDSS 99(R15)(R15*1), X31, K1, X0                 // 6291060158843f63000000 or 6291062158843f63000000 or 6291064158843f63000000
+       VADDSS (DX), X31, K1, X0                           // 62f106015802 or 62f106215802 or 62f106415802
+       VALIGND $47, X16, X7, K1, X19                      // 62a3450903d82f
+       VALIGND $47, (BX), X7, K1, X19                     // 62e34509031b2f
+       VALIGND $47, -17(BP)(SI*1), X7, K1, X19            // 62e34509039c35efffffff2f
+       VALIGND $82, Y23, Y9, K7, Y22                      // 62a3352f03f752
+       VALIGND $82, -7(DI)(R8*1), Y9, K7, Y22             // 62a3352f03b407f9ffffff52
+       VALIGND $82, (SP), Y9, K7, Y22                     // 62e3352f03342452
+       VALIGND $126, Z6, Z9, K2, Z12                      // 6273354a03e67e
+       VALIGND $126, Z25, Z9, K2, Z12                     // 6213354a03e17e
+       VALIGND $126, -7(DI)(R8*1), Z9, K2, Z12            // 6233354a03a407f9ffffff7e
+       VALIGND $126, (SP), Z9, K2, Z12                    // 6273354a0324247e
+       VALIGND $126, Z6, Z12, K2, Z12                     // 62731d4a03e67e
+       VALIGND $126, Z25, Z12, K2, Z12                    // 62131d4a03e17e
+       VALIGND $126, -7(DI)(R8*1), Z12, K2, Z12           // 62331d4a03a407f9ffffff7e
+       VALIGND $126, (SP), Z12, K2, Z12                   // 62731d4a0324247e
+       VALIGND $126, Z6, Z9, K2, Z17                      // 62e3354a03ce7e
+       VALIGND $126, Z25, Z9, K2, Z17                     // 6283354a03c97e
+       VALIGND $126, -7(DI)(R8*1), Z9, K2, Z17            // 62a3354a038c07f9ffffff7e
+       VALIGND $126, (SP), Z9, K2, Z17                    // 62e3354a030c247e
+       VALIGND $126, Z6, Z12, K2, Z17                     // 62e31d4a03ce7e
+       VALIGND $126, Z25, Z12, K2, Z17                    // 62831d4a03c97e
+       VALIGND $126, -7(DI)(R8*1), Z12, K2, Z17           // 62a31d4a038c07f9ffffff7e
+       VALIGND $126, (SP), Z12, K2, Z17                   // 62e31d4a030c247e
+       VALIGNQ $94, X7, X1, K4, X31                       // 6263f50c03ff5e
+       VALIGNQ $94, 15(R8)(R14*4), X1, K4, X31            // 6203f50c03bcb00f0000005e
+       VALIGNQ $94, -7(CX)(DX*4), X1, K4, X31             // 6263f50c03bc91f9ffffff5e
+       VALIGNQ $121, Y0, Y5, K1, Y31                      // 6263d52903f879
+       VALIGNQ $121, -7(CX), Y5, K1, Y31                  // 6263d52903b9f9ffffff79
+       VALIGNQ $121, 15(DX)(BX*4), Y5, K1, Y31            // 6263d52903bc9a0f00000079
+       VALIGNQ $13, Z3, Z8, K3, Z3                        // 62f3bd4b03db0d
+       VALIGNQ $13, Z27, Z8, K3, Z3                       // 6293bd4b03db0d
+       VALIGNQ $13, -7(CX), Z8, K3, Z3                    // 62f3bd4b0399f9ffffff0d
+       VALIGNQ $13, 15(DX)(BX*4), Z8, K3, Z3              // 62f3bd4b039c9a0f0000000d
+       VALIGNQ $13, Z3, Z2, K3, Z3                        // 62f3ed4b03db0d
+       VALIGNQ $13, Z27, Z2, K3, Z3                       // 6293ed4b03db0d
+       VALIGNQ $13, -7(CX), Z2, K3, Z3                    // 62f3ed4b0399f9ffffff0d
+       VALIGNQ $13, 15(DX)(BX*4), Z2, K3, Z3              // 62f3ed4b039c9a0f0000000d
+       VALIGNQ $13, Z3, Z8, K3, Z21                       // 62e3bd4b03eb0d
+       VALIGNQ $13, Z27, Z8, K3, Z21                      // 6283bd4b03eb0d
+       VALIGNQ $13, -7(CX), Z8, K3, Z21                   // 62e3bd4b03a9f9ffffff0d
+       VALIGNQ $13, 15(DX)(BX*4), Z8, K3, Z21             // 62e3bd4b03ac9a0f0000000d
+       VALIGNQ $13, Z3, Z2, K3, Z21                       // 62e3ed4b03eb0d
+       VALIGNQ $13, Z27, Z2, K3, Z21                      // 6283ed4b03eb0d
+       VALIGNQ $13, -7(CX), Z2, K3, Z21                   // 62e3ed4b03a9f9ffffff0d
+       VALIGNQ $13, 15(DX)(BX*4), Z2, K3, Z21             // 62e3ed4b03ac9a0f0000000d
+       VBLENDMPD X28, X13, K3, X23                        // 6282950b65fc
+       VBLENDMPD (R14), X13, K3, X23                      // 62c2950b653e
+       VBLENDMPD -7(DI)(R8*8), X13, K3, X23               // 62a2950b65bcc7f9ffffff
+       VBLENDMPD Y27, Y13, K4, Y2                         // 6292952c65d3
+       VBLENDMPD (R8), Y13, K4, Y2                        // 62d2952c6510
+       VBLENDMPD 15(DX)(BX*2), Y13, K4, Y2                // 62f2952c65945a0f000000
+       VBLENDMPD Z18, Z13, K2, Z1                         // 62b2954a65ca
+       VBLENDMPD Z8, Z13, K2, Z1                          // 62d2954a65c8
+       VBLENDMPD (R8), Z13, K2, Z1                        // 62d2954a6508
+       VBLENDMPD 15(DX)(BX*2), Z13, K2, Z1                // 62f2954a658c5a0f000000
+       VBLENDMPD Z18, Z13, K2, Z15                        // 6232954a65fa
+       VBLENDMPD Z8, Z13, K2, Z15                         // 6252954a65f8
+       VBLENDMPD (R8), Z13, K2, Z15                       // 6252954a6538
+       VBLENDMPD 15(DX)(BX*2), Z13, K2, Z15               // 6272954a65bc5a0f000000
+       VBLENDMPS X15, X9, K2, X24                         // 6242350a65c7
+       VBLENDMPS 99(R15)(R15*4), X9, K2, X24              // 6202350a6584bf63000000
+       VBLENDMPS 15(DX), X9, K2, X24                      // 6262350a65820f000000
+       VBLENDMPS Y20, Y22, K3, Y15                        // 62324d2365fc
+       VBLENDMPS 17(SP)(BP*1), Y22, K3, Y15               // 62724d2365bc2c11000000
+       VBLENDMPS -7(CX)(DX*8), Y22, K3, Y15               // 62724d2365bcd1f9ffffff
+       VBLENDMPS Z20, Z2, K3, Z22                         // 62a26d4b65f4
+       VBLENDMPS Z9, Z2, K3, Z22                          // 62c26d4b65f1
+       VBLENDMPS 17(SP)(BP*1), Z2, K3, Z22                // 62e26d4b65b42c11000000
+       VBLENDMPS -7(CX)(DX*8), Z2, K3, Z22                // 62e26d4b65b4d1f9ffffff
+       VBLENDMPS Z20, Z31, K3, Z22                        // 62a2054365f4
+       VBLENDMPS Z9, Z31, K3, Z22                         // 62c2054365f1
+       VBLENDMPS 17(SP)(BP*1), Z31, K3, Z22               // 62e2054365b42c11000000
+       VBLENDMPS -7(CX)(DX*8), Z31, K3, Z22               // 62e2054365b4d1f9ffffff
+       VBLENDMPS Z20, Z2, K3, Z7                          // 62b26d4b65fc
+       VBLENDMPS Z9, Z2, K3, Z7                           // 62d26d4b65f9
+       VBLENDMPS 17(SP)(BP*1), Z2, K3, Z7                 // 62f26d4b65bc2c11000000
+       VBLENDMPS -7(CX)(DX*8), Z2, K3, Z7                 // 62f26d4b65bcd1f9ffffff
+       VBLENDMPS Z20, Z31, K3, Z7                         // 62b2054365fc
+       VBLENDMPS Z9, Z31, K3, Z7                          // 62d2054365f9
+       VBLENDMPS 17(SP)(BP*1), Z31, K3, Z7                // 62f2054365bc2c11000000
+       VBLENDMPS -7(CX)(DX*8), Z31, K3, Z7                // 62f2054365bcd1f9ffffff
+       VBROADCASTF32X4 (CX), K1, Y24                      // 62627d291a01
+       VBROADCASTF32X4 99(R15), K1, Y24                   // 62427d291a8763000000
+       VBROADCASTF32X4 99(R15)(R15*2), K2, Z12            // 62127d4a1aa47f63000000
+       VBROADCASTF32X4 -7(DI), K2, Z12                    // 62727d4a1aa7f9ffffff
+       VBROADCASTF32X4 99(R15)(R15*2), K2, Z16            // 62827d4a1a847f63000000
+       VBROADCASTF32X4 -7(DI), K2, Z16                    // 62e27d4a1a87f9ffffff
+       VBROADCASTF64X4 15(R8)(R14*1), K1, Z3              // 6292fd491b9c300f000000
+       VBROADCASTF64X4 15(R8)(R14*2), K1, Z3              // 6292fd491b9c700f000000
+       VBROADCASTF64X4 15(R8)(R14*1), K1, Z12             // 6212fd491ba4300f000000
+       VBROADCASTF64X4 15(R8)(R14*2), K1, Z12             // 6212fd491ba4700f000000
+       VBROADCASTI32X4 -17(BP), K4, Y19                   // 62e27d2c5a9defffffff
+       VBROADCASTI32X4 -15(R14)(R15*8), K4, Y19           // 62827d2c5a9cfef1ffffff
+       VBROADCASTI32X4 17(SP)(BP*2), K1, Z19              // 62e27d495a9c6c11000000
+       VBROADCASTI32X4 -7(DI)(R8*4), K1, Z19              // 62a27d495a9c87f9ffffff
+       VBROADCASTI32X4 17(SP)(BP*2), K1, Z15              // 62727d495abc6c11000000
+       VBROADCASTI32X4 -7(DI)(R8*4), K1, Z15              // 62327d495abc87f9ffffff
+       VBROADCASTI64X4 99(R15)(R15*4), K7, Z14            // 6212fd4f5bb4bf63000000
+       VBROADCASTI64X4 15(DX), K7, Z14                    // 6272fd4f5bb20f000000
+       VBROADCASTI64X4 99(R15)(R15*4), K7, Z15            // 6212fd4f5bbcbf63000000
+       VBROADCASTI64X4 15(DX), K7, Z15                    // 6272fd4f5bba0f000000
+       VBROADCASTSD X3, K7, Y19                           // 62e2fd2f19db
+       VBROADCASTSD 99(R15)(R15*8), K7, Y19               // 6282fd2f199cff63000000
+       VBROADCASTSD 7(AX)(CX*8), K7, Y19                  // 62e2fd2f199cc807000000
+       VBROADCASTSD X7, K6, Z21                           // 62e2fd4e19ef
+       VBROADCASTSD (AX), K6, Z21                         // 62e2fd4e1928
+       VBROADCASTSD 7(SI), K6, Z21                        // 62e2fd4e19ae07000000
+       VBROADCASTSD X7, K6, Z8                            // 6272fd4e19c7
+       VBROADCASTSD (AX), K6, Z8                          // 6272fd4e1900
+       VBROADCASTSD 7(SI), K6, Z8                         // 6272fd4e198607000000
+       VBROADCASTSS X0, K3, X0                            // 62f27d0b18c0
+       VBROADCASTSS -17(BP)(SI*8), K3, X0                 // 62f27d0b1884f5efffffff
+       VBROADCASTSS (R15), K3, X0                         // 62d27d0b1807
+       VBROADCASTSS X24, K7, Y14                          // 62127d2f18f0
+       VBROADCASTSS 7(SI)(DI*8), K7, Y14                  // 62727d2f18b4fe07000000
+       VBROADCASTSS -15(R14), K7, Y14                     // 62527d2f18b6f1ffffff
+       VBROADCASTSS X20, K4, Z16                          // 62a27d4c18c4
+       VBROADCASTSS 7(SI)(DI*1), K4, Z16                  // 62e27d4c18843e07000000
+       VBROADCASTSS 15(DX)(BX*8), K4, Z16                 // 62e27d4c1884da0f000000
+       VBROADCASTSS X20, K4, Z9                           // 62327d4c18cc
+       VBROADCASTSS 7(SI)(DI*1), K4, Z9                   // 62727d4c188c3e07000000
+       VBROADCASTSS 15(DX)(BX*8), K4, Z9                  // 62727d4c188cda0f000000
+       VCMPPD $65, X9, X7, K4, K4                         // 62d1c50cc2e141
+       VCMPPD $65, -15(R14)(R15*1), X7, K4, K4            // 6291c50cc2a43ef1ffffff41
+       VCMPPD $65, -15(BX), X7, K4, K4                    // 62f1c50cc2a3f1ffffff41
+       VCMPPD $65, X9, X7, K4, K5                         // 62d1c50cc2e941
+       VCMPPD $65, -15(R14)(R15*1), X7, K4, K5            // 6291c50cc2ac3ef1ffffff41
+       VCMPPD $65, -15(BX), X7, K4, K5                    // 62f1c50cc2abf1ffffff41
+       VCMPPD $67, Y5, Y21, K7, K2                        // 62f1d527c2d543
+       VCMPPD $67, (CX), Y21, K7, K2                      // 62f1d527c21143
+       VCMPPD $67, 99(R15), Y21, K7, K2                   // 62d1d527c2976300000043
+       VCMPPD $67, Y5, Y21, K7, K7                        // 62f1d527c2fd43
+       VCMPPD $67, (CX), Y21, K7, K7                      // 62f1d527c23943
+       VCMPPD $67, 99(R15), Y21, K7, K7                   // 62d1d527c2bf6300000043
+       VCMPPD $127, Z23, Z20, K2, K0                      // 62b1dd42c2c77f
+       VCMPPD $127, Z19, Z20, K2, K0                      // 62b1dd42c2c37f
+       VCMPPD $127, Z23, Z0, K2, K0                       // 62b1fd4ac2c77f
+       VCMPPD $127, Z19, Z0, K2, K0                       // 62b1fd4ac2c37f
+       VCMPPD $127, Z23, Z20, K2, K5                      // 62b1dd42c2ef7f
+       VCMPPD $127, Z19, Z20, K2, K5                      // 62b1dd42c2eb7f
+       VCMPPD $127, Z23, Z0, K2, K5                       // 62b1fd4ac2ef7f
+       VCMPPD $127, Z19, Z0, K2, K5                       // 62b1fd4ac2eb7f
+       VCMPPD $0, Z0, Z0, K5, K6                          // 62f1fd4dc2f000
+       VCMPPD $0, Z25, Z0, K5, K6                         // 6291fd4dc2f100
+       VCMPPD $0, -17(BP)(SI*2), Z0, K5, K6               // 62f1fd4dc2b475efffffff00
+       VCMPPD $0, 7(AX)(CX*2), Z0, K5, K6                 // 62f1fd4dc2b4480700000000
+       VCMPPD $0, Z0, Z11, K5, K6                         // 62f1a54dc2f000
+       VCMPPD $0, Z25, Z11, K5, K6                        // 6291a54dc2f100
+       VCMPPD $0, -17(BP)(SI*2), Z11, K5, K6              // 62f1a54dc2b475efffffff00
+       VCMPPD $0, 7(AX)(CX*2), Z11, K5, K6                // 62f1a54dc2b4480700000000
+       VCMPPD $0, Z0, Z0, K5, K5                          // 62f1fd4dc2e800
+       VCMPPD $0, Z25, Z0, K5, K5                         // 6291fd4dc2e900
+       VCMPPD $0, -17(BP)(SI*2), Z0, K5, K5               // 62f1fd4dc2ac75efffffff00
+       VCMPPD $0, 7(AX)(CX*2), Z0, K5, K5                 // 62f1fd4dc2ac480700000000
+       VCMPPD $0, Z0, Z11, K5, K5                         // 62f1a54dc2e800
+       VCMPPD $0, Z25, Z11, K5, K5                        // 6291a54dc2e900
+       VCMPPD $0, -17(BP)(SI*2), Z11, K5, K5              // 62f1a54dc2ac75efffffff00
+       VCMPPD $0, 7(AX)(CX*2), Z11, K5, K5                // 62f1a54dc2ac480700000000
+       VCMPPS $97, X14, X7, K3, K1                        // 62d1440bc2ce61
+       VCMPPS $97, 7(AX)(CX*4), X7, K3, K1                // 62f1440bc28c880700000061
+       VCMPPS $97, 7(AX)(CX*1), X7, K3, K1                // 62f1440bc28c080700000061
+       VCMPPS $97, X14, X7, K3, K5                        // 62d1440bc2ee61
+       VCMPPS $97, 7(AX)(CX*4), X7, K3, K5                // 62f1440bc2ac880700000061
+       VCMPPS $97, 7(AX)(CX*1), X7, K3, K5                // 62f1440bc2ac080700000061
+       VCMPPS $81, Y2, Y16, K4, K3                        // 62f17c24c2da51
+       VCMPPS $81, 99(R15)(R15*2), Y16, K4, K3            // 62917c24c29c7f6300000051
+       VCMPPS $81, -7(DI), Y16, K4, K3                    // 62f17c24c29ff9ffffff51
+       VCMPPS $81, Y2, Y16, K4, K1                        // 62f17c24c2ca51
+       VCMPPS $81, 99(R15)(R15*2), Y16, K4, K1            // 62917c24c28c7f6300000051
+       VCMPPS $81, -7(DI), Y16, K4, K1                    // 62f17c24c28ff9ffffff51
+       VCMPPS $42, Z0, Z24, K2, K5                        // 62f13c42c2e82a
+       VCMPPS $42, Z26, Z24, K2, K5                       // 62913c42c2ea2a
+       VCMPPS $42, Z0, Z12, K2, K5                        // 62f11c4ac2e82a
+       VCMPPS $42, Z26, Z12, K2, K5                       // 62911c4ac2ea2a
+       VCMPPS $42, Z0, Z24, K2, K4                        // 62f13c42c2e02a
+       VCMPPS $42, Z26, Z24, K2, K4                       // 62913c42c2e22a
+       VCMPPS $42, Z0, Z12, K2, K4                        // 62f11c4ac2e02a
+       VCMPPS $42, Z26, Z12, K2, K4                       // 62911c4ac2e22a
+       VCMPPS $79, Z9, Z9, K2, K7                         // 62d1344ac2f94f
+       VCMPPS $79, Z25, Z9, K2, K7                        // 6291344ac2f94f
+       VCMPPS $79, 15(R8)(R14*1), Z9, K2, K7              // 6291344ac2bc300f0000004f
+       VCMPPS $79, 15(R8)(R14*2), Z9, K2, K7              // 6291344ac2bc700f0000004f
+       VCMPPS $79, Z9, Z3, K2, K7                         // 62d1644ac2f94f
+       VCMPPS $79, Z25, Z3, K2, K7                        // 6291644ac2f94f
+       VCMPPS $79, 15(R8)(R14*1), Z3, K2, K7              // 6291644ac2bc300f0000004f
+       VCMPPS $79, 15(R8)(R14*2), Z3, K2, K7              // 6291644ac2bc700f0000004f
+       VCMPPS $79, Z9, Z9, K2, K6                         // 62d1344ac2f14f
+       VCMPPS $79, Z25, Z9, K2, K6                        // 6291344ac2f14f
+       VCMPPS $79, 15(R8)(R14*1), Z9, K2, K6              // 6291344ac2b4300f0000004f
+       VCMPPS $79, 15(R8)(R14*2), Z9, K2, K6              // 6291344ac2b4700f0000004f
+       VCMPPS $79, Z9, Z3, K2, K6                         // 62d1644ac2f14f
+       VCMPPS $79, Z25, Z3, K2, K6                        // 6291644ac2f14f
+       VCMPPS $79, 15(R8)(R14*1), Z3, K2, K6              // 6291644ac2b4300f0000004f
+       VCMPPS $79, 15(R8)(R14*2), Z3, K2, K6              // 6291644ac2b4700f0000004f
+       VCMPSD $64, X31, X5, K3, K4                        // 6291d70bc2e740
+       VCMPSD $64, X31, X5, K3, K6                        // 6291d70bc2f740
+       VCMPSD $27, X21, X3, K3, K0                        // 62b1e70bc2c51b or 62b1e72bc2c51b or 62b1e74bc2c51b
+       VCMPSD $27, (BX), X3, K3, K0                       // 62f1e70bc2031b or 62f1e72bc2031b or 62f1e74bc2031b
+       VCMPSD $27, -17(BP)(SI*1), X3, K3, K0              // 62f1e70bc28435efffffff1b or 62f1e72bc28435efffffff1b or 62f1e74bc28435efffffff1b
+       VCMPSD $27, X21, X3, K3, K7                        // 62b1e70bc2fd1b or 62b1e72bc2fd1b or 62b1e74bc2fd1b
+       VCMPSD $27, (BX), X3, K3, K7                       // 62f1e70bc23b1b or 62f1e72bc23b1b or 62f1e74bc23b1b
+       VCMPSD $27, -17(BP)(SI*1), X3, K3, K7              // 62f1e70bc2bc35efffffff1b or 62f1e72bc2bc35efffffff1b or 62f1e74bc2bc35efffffff1b
+       VCMPSS $47, X11, X1, K3, K5                        // 62d1760bc2eb2f
+       VCMPSS $47, X11, X1, K3, K4                        // 62d1760bc2e32f
+       VCMPSS $82, X0, X13, K2, K4                        // 62f1160ac2e052 or 62f1162ac2e052 or 62f1164ac2e052
+       VCMPSS $82, -7(DI)(R8*1), X13, K2, K4              // 62b1160ac2a407f9ffffff52 or 62b1162ac2a407f9ffffff52 or 62b1164ac2a407f9ffffff52
+       VCMPSS $82, (SP), X13, K2, K4                      // 62f1160ac2242452 or 62f1162ac2242452 or 62f1164ac2242452
+       VCMPSS $82, X0, X13, K2, K6                        // 62f1160ac2f052 or 62f1162ac2f052 or 62f1164ac2f052
+       VCMPSS $82, -7(DI)(R8*1), X13, K2, K6              // 62b1160ac2b407f9ffffff52 or 62b1162ac2b407f9ffffff52 or 62b1164ac2b407f9ffffff52
+       VCMPSS $82, (SP), X13, K2, K6                      // 62f1160ac2342452 or 62f1162ac2342452 or 62f1164ac2342452
+       VCOMISD X16, X30                                   // 6221fd082ff0
+       VCOMISS X19, X14                                   // 62317c082ff3
+       VCOMPRESSPD X23, K1, X26                           // 6282fd098afa
+       VCOMPRESSPD X23, K1, (SI)                          // 62e2fd098a3e
+       VCOMPRESSPD X23, K1, 7(SI)(DI*2)                   // 62e2fd098abc7e07000000
+       VCOMPRESSPD Y20, K2, Y21                           // 62a2fd2a8ae5
+       VCOMPRESSPD Y20, K2, -7(CX)(DX*1)                  // 62e2fd2a8aa411f9ffffff
+       VCOMPRESSPD Y20, K2, -15(R14)(R15*4)               // 6282fd2a8aa4bef1ffffff
+       VCOMPRESSPD Z20, K1, Z9                            // 62c2fd498ae1
+       VCOMPRESSPD Z0, K1, Z9                             // 62d2fd498ac1
+       VCOMPRESSPD Z20, K1, Z28                           // 6282fd498ae4
+       VCOMPRESSPD Z0, K1, Z28                            // 6292fd498ac4
+       VCOMPRESSPD Z20, K1, (R14)                         // 62c2fd498a26
+       VCOMPRESSPD Z0, K1, (R14)                          // 62d2fd498a06
+       VCOMPRESSPD Z20, K1, -7(DI)(R8*8)                  // 62a2fd498aa4c7f9ffffff
+       VCOMPRESSPD Z0, K1, -7(DI)(R8*8)                   // 62b2fd498a84c7f9ffffff
+       VCOMPRESSPS X16, K7, X12                           // 62c27d0f8ac4
+       VCOMPRESSPS X16, K7, 17(SP)(BP*8)                  // 62e27d0f8a84ec11000000
+       VCOMPRESSPS X16, K7, 17(SP)(BP*4)                  // 62e27d0f8a84ac11000000
+       VCOMPRESSPS Y31, K1, Y6                            // 62627d298afe
+       VCOMPRESSPS Y31, K1, 15(DX)(BX*1)                  // 62627d298abc1a0f000000
+       VCOMPRESSPS Y31, K1, -7(CX)(DX*2)                  // 62627d298abc51f9ffffff
+       VCOMPRESSPS Z17, K1, Z17                           // 62a27d498ac9
+       VCOMPRESSPS Z23, K1, Z17                           // 62a27d498af9
+       VCOMPRESSPS Z17, K1, Z0                            // 62e27d498ac8
+       VCOMPRESSPS Z23, K1, Z0                            // 62e27d498af8
+       VCOMPRESSPS Z17, K1, 99(R15)(R15*4)                // 62827d498a8cbf63000000
+       VCOMPRESSPS Z23, K1, 99(R15)(R15*4)                // 62827d498abcbf63000000
+       VCOMPRESSPS Z17, K1, 15(DX)                        // 62e27d498a8a0f000000
+       VCOMPRESSPS Z23, K1, 15(DX)                        // 62e27d498aba0f000000
+       VCVTDQ2PD X23, K1, X23                             // 62a17e09e6ff
+       VCVTDQ2PD 7(SI)(DI*4), K1, X23                     // 62e17e09e6bcbe07000000
+       VCVTDQ2PD -7(DI)(R8*2), K1, X23                    // 62a17e09e6bc47f9ffffff
+       VCVTDQ2PD X11, K7, Y6                              // 62d17e2fe6f3
+       VCVTDQ2PD -17(BP), K7, Y6                          // 62f17e2fe6b5efffffff
+       VCVTDQ2PD -15(R14)(R15*8), K7, Y6                  // 62917e2fe6b4fef1ffffff
+       VCVTDQ2PD Y11, K2, Z31                             // 62417e4ae6fb
+       VCVTDQ2PD (CX), K2, Z31                            // 62617e4ae639
+       VCVTDQ2PD 99(R15), K2, Z31                         // 62417e4ae6bf63000000
+       VCVTDQ2PD Y11, K2, Z0                              // 62d17e4ae6c3
+       VCVTDQ2PD (CX), K2, Z0                             // 62f17e4ae601
+       VCVTDQ2PD 99(R15), K2, Z0                          // 62d17e4ae68763000000
+       VCVTDQ2PS X24, K4, X31                             // 62017c0c5bf8
+       VCVTDQ2PS 17(SP), K4, X31                          // 62617c0c5bbc2411000000
+       VCVTDQ2PS -17(BP)(SI*4), K4, X31                   // 62617c0c5bbcb5efffffff
+       VCVTDQ2PS Y7, K1, Y19                              // 62e17c295bdf
+       VCVTDQ2PS 17(SP)(BP*2), K1, Y19                    // 62e17c295b9c6c11000000
+       VCVTDQ2PS -7(DI)(R8*4), K1, Y19                    // 62a17c295b9c87f9ffffff
+       VCVTDQ2PS Z6, K3, Z21                              // 62e17c4b5bee
+       VCVTDQ2PS Z9, K3, Z21                              // 62c17c4b5be9
+       VCVTDQ2PS Z6, K3, Z9                               // 62717c4b5bce
+       VCVTDQ2PS Z9, K3, Z9                               // 62517c4b5bc9
+       VCVTDQ2PS Z20, K4, Z1                              // 62b17c4c5bcc
+       VCVTDQ2PS Z9, K4, Z1                               // 62d17c4c5bc9
+       VCVTDQ2PS 99(R15)(R15*2), K4, Z1                   // 62917c4c5b8c7f63000000
+       VCVTDQ2PS -7(DI), K4, Z1                           // 62f17c4c5b8ff9ffffff
+       VCVTDQ2PS Z20, K4, Z9                              // 62317c4c5bcc
+       VCVTDQ2PS Z9, K4, Z9                               // 62517c4c5bc9
+       VCVTDQ2PS 99(R15)(R15*2), K4, Z9                   // 62117c4c5b8c7f63000000
+       VCVTDQ2PS -7(DI), K4, Z9                           // 62717c4c5b8ff9ffffff
+       VCVTPD2DQ Z30, K5, Y6                              // 6291ff4de6f6
+       VCVTPD2DQ Z5, K5, Y6                               // 62f1ff4de6f5
+       VCVTPD2DQ Z26, K7, Y0                              // 6291ff4fe6c2
+       VCVTPD2DQ Z22, K7, Y0                              // 62b1ff4fe6c6
+       VCVTPD2DQ -7(CX)(DX*1), K7, Y0                     // 62f1ff4fe68411f9ffffff
+       VCVTPD2DQ -15(R14)(R15*4), K7, Y0                  // 6291ff4fe684bef1ffffff
+       VCVTPD2DQX X0, K7, X14                             // 6271ff0fe6f0
+       VCVTPD2DQX 7(AX), K7, X14                          // 6271ff0fe6b007000000
+       VCVTPD2DQX (DI), K7, X14                           // 6271ff0fe637
+       VCVTPD2DQY Y3, K6, X11                             // 6271ff2ee6db
+       VCVTPD2DQY 15(R8), K6, X11                         // 6251ff2ee6980f000000
+       VCVTPD2DQY (BP), K6, X11                           // 6271ff2ee65d00
+       VCVTPD2PS Z7, K3, Y5                               // 62f1fd4b5aef
+       VCVTPD2PS Z21, K3, Y5                              // 62b1fd4b5aed
+       VCVTPD2PS Z16, K7, Y20                             // 62a1fd4f5ae0
+       VCVTPD2PS Z25, K7, Y20                             // 6281fd4f5ae1
+       VCVTPD2PS 15(DX)(BX*1), K7, Y20                    // 62e1fd4f5aa41a0f000000
+       VCVTPD2PS -7(CX)(DX*2), K7, Y20                    // 62e1fd4f5aa451f9ffffff
+       VCVTPD2PSX X2, K4, X23                             // 62e1fd0c5afa
+       VCVTPD2PSX 99(R15)(R15*1), K4, X23                 // 6281fd0c5abc3f63000000
+       VCVTPD2PSX (DX), K4, X23                           // 62e1fd0c5a3a
+       VCVTPD2PSY Y12, K4, X20                            // 62c1fd2c5ae4
+       VCVTPD2PSY 15(R8)(R14*8), K4, X20                  // 6281fd2c5aa4f00f000000
+       VCVTPD2PSY -15(R14)(R15*2), K4, X20                // 6281fd2c5aa47ef1ffffff
+       VCVTPD2UDQ Z27, K4, Y28                            // 6201fc4c79e3
+       VCVTPD2UDQ Z25, K4, Y28                            // 6201fc4c79e1
+       VCVTPD2UDQ Z23, K2, Y7                             // 62b1fc4a79ff
+       VCVTPD2UDQ Z9, K2, Y7                              // 62d1fc4a79f9
+       VCVTPD2UDQ 17(SP)(BP*2), K2, Y7                    // 62f1fc4a79bc6c11000000
+       VCVTPD2UDQ -7(DI)(R8*4), K2, Y7                    // 62b1fc4a79bc87f9ffffff
+       VCVTPD2UDQX X9, K2, X0                             // 62d1fc0a79c1
+       VCVTPD2UDQX 7(SI)(DI*8), K2, X0                    // 62f1fc0a7984fe07000000
+       VCVTPD2UDQX -15(R14), K2, X0                       // 62d1fc0a7986f1ffffff
+       VCVTPD2UDQY Y0, K3, X13                            // 6271fc2b79e8
+       VCVTPD2UDQY 7(AX)(CX*4), K3, X13                   // 6271fc2b79ac8807000000
+       VCVTPD2UDQY 7(AX)(CX*1), K3, X13                   // 6271fc2b79ac0807000000
+       VCVTPH2PS X9, K2, Y12                              // 62527d2a13e1
+       VCVTPH2PS -7(DI)(R8*1), K2, Y12                    // 62327d2a13a407f9ffffff
+       VCVTPH2PS (SP), K2, Y12                            // 62727d2a132424
+       VCVTPH2PS X31, K1, X2                              // 62927d0913d7
+       VCVTPH2PS (R8), K1, X2                             // 62d27d091310
+       VCVTPH2PS 15(DX)(BX*2), K1, X2                     // 62f27d0913945a0f000000
+       VCVTPH2PS Y1, K7, Z22                              // 62e27d4f13f1
+       VCVTPH2PS Y1, K7, Z25                              // 62627d4f13c9
+       VCVTPH2PS Y14, K1, Z1                              // 62d27d4913ce
+       VCVTPH2PS 17(SP)(BP*8), K1, Z1                     // 62f27d49138cec11000000
+       VCVTPH2PS 17(SP)(BP*4), K1, Z1                     // 62f27d49138cac11000000
+       VCVTPH2PS Y14, K1, Z16                             // 62c27d4913c6
+       VCVTPH2PS 17(SP)(BP*8), K1, Z16                    // 62e27d491384ec11000000
+       VCVTPH2PS 17(SP)(BP*4), K1, Z16                    // 62e27d491384ac11000000
+       VCVTPS2DQ X22, K1, X11                             // 62317d095bde
+       VCVTPS2DQ -7(CX), K1, X11                          // 62717d095b99f9ffffff
+       VCVTPS2DQ 15(DX)(BX*4), K1, X11                    // 62717d095b9c9a0f000000
+       VCVTPS2DQ Y7, K1, Y17                              // 62e17d295bcf
+       VCVTPS2DQ 7(SI)(DI*4), K1, Y17                     // 62e17d295b8cbe07000000
+       VCVTPS2DQ -7(DI)(R8*2), K1, Y17                    // 62a17d295b8c47f9ffffff
+       VCVTPS2DQ Z0, K7, Z6                               // 62f17d4f5bf0
+       VCVTPS2DQ Z8, K7, Z6                               // 62d17d4f5bf0
+       VCVTPS2DQ Z0, K7, Z2                               // 62f17d4f5bd0
+       VCVTPS2DQ Z8, K7, Z2                               // 62d17d4f5bd0
+       VCVTPS2DQ Z14, K2, Z15                             // 62517d4a5bfe
+       VCVTPS2DQ Z27, K2, Z15                             // 62117d4a5bfb
+       VCVTPS2DQ 15(R8)(R14*8), K2, Z15                   // 62117d4a5bbcf00f000000
+       VCVTPS2DQ -15(R14)(R15*2), K2, Z15                 // 62117d4a5bbc7ef1ffffff
+       VCVTPS2DQ Z14, K2, Z12                             // 62517d4a5be6
+       VCVTPS2DQ Z27, K2, Z12                             // 62117d4a5be3
+       VCVTPS2DQ 15(R8)(R14*8), K2, Z12                   // 62117d4a5ba4f00f000000
+       VCVTPS2DQ -15(R14)(R15*2), K2, Z12                 // 62117d4a5ba47ef1ffffff
+       VCVTPS2PD X14, K4, X5                              // 62d17c0c5aee
+       VCVTPS2PD 99(R15)(R15*8), K4, X5                   // 62917c0c5aacff63000000
+       VCVTPS2PD 7(AX)(CX*8), K4, X5                      // 62f17c0c5aacc807000000
+       VCVTPS2PD X0, K1, Y9                               // 62717c295ac8
+       VCVTPS2PD 17(SP), K1, Y9                           // 62717c295a8c2411000000
+       VCVTPS2PD -17(BP)(SI*4), K1, Y9                    // 62717c295a8cb5efffffff
+       VCVTPS2PD Y31, K3, Z11                             // 62117c4b5adf
+       VCVTPS2PD Y31, K3, Z5                              // 62917c4b5aef
+       VCVTPS2PD Y8, K4, Z13                              // 62517c4c5ae8
+       VCVTPS2PD -15(R14)(R15*1), K4, Z13                 // 62117c4c5aac3ef1ffffff
+       VCVTPS2PD -15(BX), K4, Z13                         // 62717c4c5aabf1ffffff
+       VCVTPS2PD Y8, K4, Z14                              // 62517c4c5af0
+       VCVTPS2PD -15(R14)(R15*1), K4, Z14                 // 62117c4c5ab43ef1ffffff
+       VCVTPS2PD -15(BX), K4, Z14                         // 62717c4c5ab3f1ffffff
+       VCVTPS2PH $126, X7, K5, X17                        // 62b37d0d1df97e
+       VCVTPS2PH $126, X7, K5, 17(SP)(BP*1)               // 62f37d0d1dbc2c110000007e
+       VCVTPS2PH $126, X7, K5, -7(CX)(DX*8)               // 62f37d0d1dbcd1f9ffffff7e
+       VCVTPS2PH $94, Y1, K7, X15                         // 62d37d2f1dcf5e
+       VCVTPS2PH $94, Y1, K7, (AX)                        // 62f37d2f1d085e
+       VCVTPS2PH $94, Y1, K7, 7(SI)                       // 62f37d2f1d8e070000005e
+       VCVTPS2PH $121, Z5, K7, Y28                        // 62937d4f1dec79
+       VCVTPS2PH $121, Z23, K7, Y28                       // 62837d4f1dfc79
+       VCVTPS2PH $121, Z5, K7, 7(AX)                      // 62f37d4f1da80700000079
+       VCVTPS2PH $121, Z23, K7, 7(AX)                     // 62e37d4f1db80700000079
+       VCVTPS2PH $121, Z5, K7, (DI)                       // 62f37d4f1d2f79
+       VCVTPS2PH $121, Z23, K7, (DI)                      // 62e37d4f1d3f79
+       VCVTPS2PH $13, Z2, K6, Y13                         // 62d37d4e1dd50d
+       VCVTPS2UDQ X27, K7, X8                             // 62117c0f79c3
+       VCVTPS2UDQ 15(R8)(R14*4), K7, X8                   // 62117c0f7984b00f000000
+       VCVTPS2UDQ -7(CX)(DX*4), K7, X8                    // 62717c0f798491f9ffffff
+       VCVTPS2UDQ Y9, K2, Y12                             // 62517c2a79e1
+       VCVTPS2UDQ -17(BP)(SI*8), K2, Y12                  // 62717c2a79a4f5efffffff
+       VCVTPS2UDQ (R15), K2, Y12                          // 62517c2a7927
+       VCVTPS2UDQ Z13, K5, Z28                            // 62417c4d79e5
+       VCVTPS2UDQ Z21, K5, Z28                            // 62217c4d79e5
+       VCVTPS2UDQ Z13, K5, Z6                             // 62d17c4d79f5
+       VCVTPS2UDQ Z21, K5, Z6                             // 62b17c4d79f5
+       VCVTPS2UDQ Z3, K3, Z26                             // 62617c4b79d3
+       VCVTPS2UDQ Z0, K3, Z26                             // 62617c4b79d0
+       VCVTPS2UDQ (SI), K3, Z26                           // 62617c4b7916
+       VCVTPS2UDQ 7(SI)(DI*2), K3, Z26                    // 62617c4b79947e07000000
+       VCVTPS2UDQ Z3, K3, Z3                              // 62f17c4b79db
+       VCVTPS2UDQ Z0, K3, Z3                              // 62f17c4b79d8
+       VCVTPS2UDQ (SI), K3, Z3                            // 62f17c4b791e
+       VCVTPS2UDQ 7(SI)(DI*2), K3, Z3                     // 62f17c4b799c7e07000000
+       VCVTSD2SI X24, R14                                 // 62117f082df0 or 62117f282df0 or 62117f482df0
+       VCVTSD2SI X24, AX                                  // 62917f082dc0 or 62917f282dc0 or 62917f482dc0
+       VCVTSD2SS X11, X1, K1, X22                         // 62c1f7095af3
+       VCVTSD2SS X8, X7, K1, X6                           // 62d1c7095af0 or 62d1c7295af0 or 62d1c7495af0
+       VCVTSD2SS (R14), X7, K1, X6                        // 62d1c7095a36 or 62d1c7295a36 or 62d1c7495a36
+       VCVTSD2SS -7(DI)(R8*8), X7, K1, X6                 // 62b1c7095ab4c7f9ffffff or 62b1c7295ab4c7f9ffffff or 62b1c7495ab4c7f9ffffff
+       VCVTSD2USIL X31, R9                                // 62117f0879cf
+       VCVTSD2USIL X31, CX                                // 62917f0879cf
+       VCVTSD2USIL X3, SP                                 // 62f17f0879e3 or 62f17f2879e3 or 62f17f4879e3
+       VCVTSD2USIL 99(R15)(R15*4), SP                     // 62917f0879a4bf63000000 or 62917f2879a4bf63000000 or 62917f4879a4bf63000000
+       VCVTSD2USIL 15(DX), SP                             // 62f17f0879a20f000000 or 62f17f2879a20f000000 or 62f17f4879a20f000000
+       VCVTSD2USIL X3, R14                                // 62717f0879f3 or 62717f2879f3 or 62717f4879f3
+       VCVTSD2USIL 99(R15)(R15*4), R14                    // 62117f0879b4bf63000000 or 62117f2879b4bf63000000 or 62117f4879b4bf63000000
+       VCVTSD2USIL 15(DX), R14                            // 62717f0879b20f000000 or 62717f2879b20f000000 or 62717f4879b20f000000
+       VCVTSD2USIQ X28, R10                               // 6211ff0879d4
+       VCVTSD2USIQ X28, CX                                // 6291ff0879cc
+       VCVTSD2USIQ X20, R9                                // 6231ff0879cc or 6231ff2879cc or 6231ff4879cc
+       VCVTSD2USIQ (CX), R9                               // 6271ff087909 or 6271ff287909 or 6271ff487909
+       VCVTSD2USIQ 99(R15), R9                            // 6251ff08798f63000000 or 6251ff28798f63000000 or 6251ff48798f63000000
+       VCVTSD2USIQ X20, R13                               // 6231ff0879ec or 6231ff2879ec or 6231ff4879ec
+       VCVTSD2USIQ (CX), R13                              // 6271ff087929 or 6271ff287929 or 6271ff487929
+       VCVTSD2USIQ 99(R15), R13                           // 6251ff0879af63000000 or 6251ff2879af63000000 or 6251ff4879af63000000
+       VCVTSI2SDL AX, X7, X24                             // 626147082ac0 or 626147282ac0 or 626147482ac0
+       VCVTSI2SDL R9, X7, X24                             // 624147082ac1 or 624147282ac1 or 624147482ac1
+       VCVTSI2SDL 99(R15)(R15*8), X7, X24                 // 620147082a84ff63000000 or 620147282a84ff63000000 or 620147482a84ff63000000
+       VCVTSI2SDL 7(AX)(CX*8), X7, X24                    // 626147082a84c807000000 or 626147282a84c807000000 or 626147482a84c807000000
+       VCVTSI2SDQ DX, X16, X20                            // 62e1ff002ae2 or 62e1ff202ae2 or 62e1ff402ae2
+       VCVTSI2SDQ BP, X16, X20                            // 62e1ff002ae5 or 62e1ff202ae5 or 62e1ff402ae5
+       VCVTSI2SDQ 99(R15)(R15*2), X16, X20                // 6281ff002aa47f63000000 or 6281ff202aa47f63000000 or 6281ff402aa47f63000000
+       VCVTSI2SDQ -7(DI), X16, X20                        // 62e1ff002aa7f9ffffff or 62e1ff202aa7f9ffffff or 62e1ff402aa7f9ffffff
+       VCVTSI2SSL CX, X28, X17                            // 62e11e002ac9 or 62e11e202ac9 or 62e11e402ac9
+       VCVTSI2SSL SP, X28, X17                            // 62e11e002acc or 62e11e202acc or 62e11e402acc
+       VCVTSI2SSL (AX), X28, X17                          // 62e11e002a08 or 62e11e202a08 or 62e11e402a08
+       VCVTSI2SSL 7(SI), X28, X17                         // 62e11e002a8e07000000 or 62e11e202a8e07000000 or 62e11e402a8e07000000
+       VCVTSS2SD X6, X16, K7, X11                         // 62717e075ade
+       VCVTSS2SD X12, X22, K2, X6                         // 62d14e025af4 or 62d14e225af4 or 62d14e425af4
+       VCVTSS2SD (BX), X22, K2, X6                        // 62f14e025a33 or 62f14e225a33 or 62f14e425a33
+       VCVTSS2SD -17(BP)(SI*1), X22, K2, X6               // 62f14e025ab435efffffff or 62f14e225ab435efffffff or 62f14e425ab435efffffff
+       VCVTSS2SI X16, R9                                  // 62317e082dc8
+       VCVTSS2SI X16, CX                                  // 62b17e082dc8
+       VCVTSS2SI X28, SP                                  // 62917e082de4 or 62917e282de4 or 62917e482de4
+       VCVTSS2SI X28, R14                                 // 62117e082df4 or 62117e282df4 or 62117e482df4
+       VCVTSS2USIL X11, AX                                // 62d17e0879c3
+       VCVTSS2USIL X11, R9                                // 62517e0879cb
+       VCVTSS2USIL X1, CX                                 // 62f17e0879c9 or 62f17e2879c9 or 62f17e4879c9
+       VCVTSS2USIL 17(SP)(BP*1), CX                       // 62f17e08798c2c11000000 or 62f17e28798c2c11000000 or 62f17e48798c2c11000000
+       VCVTSS2USIL -7(CX)(DX*8), CX                       // 62f17e08798cd1f9ffffff or 62f17e28798cd1f9ffffff or 62f17e48798cd1f9ffffff
+       VCVTSS2USIL X1, SP                                 // 62f17e0879e1 or 62f17e2879e1 or 62f17e4879e1
+       VCVTSS2USIL 17(SP)(BP*1), SP                       // 62f17e0879a42c11000000 or 62f17e2879a42c11000000 or 62f17e4879a42c11000000
+       VCVTSS2USIL -7(CX)(DX*8), SP                       // 62f17e0879a4d1f9ffffff or 62f17e2879a4d1f9ffffff or 62f17e4879a4d1f9ffffff
+       VCVTSS2USIQ X19, DX                                // 62b1fe0879d3
+       VCVTSS2USIQ X19, BP                                // 62b1fe0879eb
+       VCVTSS2USIQ X13, R10                               // 6251fe0879d5 or 6251fe2879d5 or 6251fe4879d5
+       VCVTSS2USIQ -17(BP)(SI*2), R10                     // 6271fe08799475efffffff or 6271fe28799475efffffff or 6271fe48799475efffffff
+       VCVTSS2USIQ 7(AX)(CX*2), R10                       // 6271fe0879944807000000 or 6271fe2879944807000000 or 6271fe4879944807000000
+       VCVTSS2USIQ X13, CX                                // 62d1fe0879cd or 62d1fe2879cd or 62d1fe4879cd
+       VCVTSS2USIQ -17(BP)(SI*2), CX                      // 62f1fe08798c75efffffff or 62f1fe28798c75efffffff or 62f1fe48798c75efffffff
+       VCVTSS2USIQ 7(AX)(CX*2), CX                        // 62f1fe08798c4807000000 or 62f1fe28798c4807000000 or 62f1fe48798c4807000000
+       VCVTTPD2DQ Z16, K4, Y30                            // 6221fd4ce6f0
+       VCVTTPD2DQ Z13, K4, Y30                            // 6241fd4ce6f5
+       VCVTTPD2DQ Z12, K1, Y26                            // 6241fd49e6d4
+       VCVTTPD2DQ Z27, K1, Y26                            // 6201fd49e6d3
+       VCVTTPD2DQ 7(AX), K1, Y26                          // 6261fd49e69007000000
+       VCVTTPD2DQ (DI), K1, Y26                           // 6261fd49e617
+       VCVTTPD2DQX X14, K3, X2                            // 62d1fd0be6d6
+       VCVTTPD2DQX 15(R8)(R14*1), K3, X2                  // 6291fd0be694300f000000
+       VCVTTPD2DQX 15(R8)(R14*2), K3, X2                  // 6291fd0be694700f000000
+       VCVTTPD2DQY Y7, K4, X0                             // 62f1fd2ce6c7
+       VCVTTPD2DQY -7(CX), K4, X0                         // 62f1fd2ce681f9ffffff
+       VCVTTPD2DQY 15(DX)(BX*4), K4, X0                   // 62f1fd2ce6849a0f000000
+       VCVTTPD2UDQ Z9, K3, Y30                            // 6241fc4b78f1
+       VCVTTPD2UDQ Z12, K3, Y30                           // 6241fc4b78f4
+       VCVTTPD2UDQ Z6, K7, Y31                            // 6261fc4f78fe
+       VCVTTPD2UDQ Z25, K7, Y31                           // 6201fc4f78f9
+       VCVTTPD2UDQ -17(BP)(SI*8), K7, Y31                 // 6261fc4f78bcf5efffffff
+       VCVTTPD2UDQ (R15), K7, Y31                         // 6241fc4f783f
+       VCVTTPD2UDQX X17, K4, X11                          // 6231fc0c78d9
+       VCVTTPD2UDQX 99(R15)(R15*4), K4, X11               // 6211fc0c789cbf63000000
+       VCVTTPD2UDQX 15(DX), K4, X11                       // 6271fc0c789a0f000000
+       VCVTTPD2UDQY Y22, K4, X18                          // 62a1fc2c78d6
+       VCVTTPD2UDQY (AX), K4, X18                         // 62e1fc2c7810
+       VCVTTPD2UDQY 7(SI), K4, X18                        // 62e1fc2c789607000000
+       VCVTTPS2DQ X24, K4, X2                             // 62917e0c5bd0
+       VCVTTPS2DQ 99(R15)(R15*2), K4, X2                  // 62917e0c5b947f63000000
+       VCVTTPS2DQ -7(DI), K4, X2                          // 62f17e0c5b97f9ffffff
+       VCVTTPS2DQ Y0, K2, Y7                              // 62f17e2a5bf8
+       VCVTTPS2DQ 15(R8)(R14*4), K2, Y7                   // 62917e2a5bbcb00f000000
+       VCVTTPS2DQ -7(CX)(DX*4), K2, Y7                    // 62f17e2a5bbc91f9ffffff
+       VCVTTPS2DQ Z20, K2, Z0                             // 62b17e4a5bc4
+       VCVTTPS2DQ Z28, K2, Z0                             // 62917e4a5bc4
+       VCVTTPS2DQ Z20, K2, Z6                             // 62b17e4a5bf4
+       VCVTTPS2DQ Z28, K2, Z6                             // 62917e4a5bf4
+       VCVTTPS2DQ Z9, K3, Z3                              // 62d17e4b5bd9
+       VCVTTPS2DQ Z19, K3, Z3                             // 62b17e4b5bdb
+       VCVTTPS2DQ 7(SI)(DI*1), K3, Z3                     // 62f17e4b5b9c3e07000000
+       VCVTTPS2DQ 15(DX)(BX*8), K3, Z3                    // 62f17e4b5b9cda0f000000
+       VCVTTPS2DQ Z9, K3, Z30                             // 62417e4b5bf1
+       VCVTTPS2DQ Z19, K3, Z30                            // 62217e4b5bf3
+       VCVTTPS2DQ 7(SI)(DI*1), K3, Z30                    // 62617e4b5bb43e07000000
+       VCVTTPS2DQ 15(DX)(BX*8), K3, Z30                   // 62617e4b5bb4da0f000000
+       VCVTTPS2UDQ X22, K2, X26                           // 62217c0a78d6
+       VCVTTPS2UDQ 15(DX)(BX*1), K2, X26                  // 62617c0a78941a0f000000
+       VCVTTPS2UDQ -7(CX)(DX*2), K2, X26                  // 62617c0a789451f9ffffff
+       VCVTTPS2UDQ Y13, K1, Y24                           // 62417c2978c5
+       VCVTTPS2UDQ 17(SP)(BP*1), K1, Y24                  // 62617c2978842c11000000
+       VCVTTPS2UDQ -7(CX)(DX*8), K1, Y24                  // 62617c297884d1f9ffffff
+       VCVTTPS2UDQ Z2, K7, Z18                            // 62e17c4f78d2
+       VCVTTPS2UDQ Z21, K7, Z18                           // 62a17c4f78d5
+       VCVTTPS2UDQ Z2, K7, Z24                            // 62617c4f78c2
+       VCVTTPS2UDQ Z21, K7, Z24                           // 62217c4f78c5
+       VCVTTPS2UDQ Z6, K1, Z7                             // 62f17c4978fe
+       VCVTTPS2UDQ Z16, K1, Z7                            // 62b17c4978f8
+       VCVTTPS2UDQ -7(CX), K1, Z7                         // 62f17c4978b9f9ffffff
+       VCVTTPS2UDQ 15(DX)(BX*4), K1, Z7                   // 62f17c4978bc9a0f000000
+       VCVTTPS2UDQ Z6, K1, Z13                            // 62717c4978ee
+       VCVTTPS2UDQ Z16, K1, Z13                           // 62317c4978e8
+       VCVTTPS2UDQ -7(CX), K1, Z13                        // 62717c4978a9f9ffffff
+       VCVTTPS2UDQ 15(DX)(BX*4), K1, Z13                  // 62717c4978ac9a0f000000
+       VCVTTSD2SI X30, R9                                 // 62117f082cce or 62117f282cce or 62117f482cce
+       VCVTTSD2SI X30, CX                                 // 62917f082cce or 62917f282cce or 62917f482cce
+       VCVTTSD2USIL X12, SP                               // 62d17f0878e4
+       VCVTTSD2USIL X12, R14                              // 62517f0878f4
+       VCVTTSD2USIL X23, AX                               // 62b17f0878c7 or 62b17f2878c7 or 62b17f4878c7
+       VCVTTSD2USIL 17(SP)(BP*2), AX                      // 62f17f0878846c11000000 or 62f17f2878846c11000000 or 62f17f4878846c11000000
+       VCVTTSD2USIL -7(DI)(R8*4), AX                      // 62b17f08788487f9ffffff or 62b17f28788487f9ffffff or 62b17f48788487f9ffffff
+       VCVTTSD2USIL X23, R9                               // 62317f0878cf or 62317f2878cf or 62317f4878cf
+       VCVTTSD2USIL 17(SP)(BP*2), R9                      // 62717f08788c6c11000000 or 62717f28788c6c11000000 or 62717f48788c6c11000000
+       VCVTTSD2USIL -7(DI)(R8*4), R9                      // 62317f08788c87f9ffffff or 62317f28788c87f9ffffff or 62317f48788c87f9ffffff
+       VCVTTSD2USIQ X30, R10                              // 6211ff0878d6
+       VCVTTSD2USIQ X30, CX                               // 6291ff0878ce
+       VCVTTSD2USIQ X8, R9                                // 6251ff0878c8 or 6251ff2878c8 or 6251ff4878c8
+       VCVTTSD2USIQ 15(R8), R9                            // 6251ff0878880f000000 or 6251ff2878880f000000 or 6251ff4878880f000000
+       VCVTTSD2USIQ (BP), R9                              // 6271ff08784d00 or 6271ff28784d00 or 6271ff48784d00
+       VCVTTSD2USIQ X8, R13                               // 6251ff0878e8 or 6251ff2878e8 or 6251ff4878e8
+       VCVTTSD2USIQ 15(R8), R13                           // 6251ff0878a80f000000 or 6251ff2878a80f000000 or 6251ff4878a80f000000
+       VCVTTSD2USIQ (BP), R13                             // 6271ff08786d00 or 6271ff28786d00 or 6271ff48786d00
+       VCVTTSS2SI X20, CX                                 // 62b17e082ccc
+       VCVTTSS2SI X20, SP                                 // 62b17e082ce4
+       VCVTTSS2SIQ X26, R10                               // 6211fe082cd2 or 6211fe282cd2 or 6211fe482cd2
+       VCVTTSS2SIQ X26, CX                                // 6291fe082cca or 6291fe282cca or 6291fe482cca
+       VCVTTSS2USIL X19, R9                               // 62317e0878cb
+       VCVTTSS2USIL X19, CX                               // 62b17e0878cb
+       VCVTTSS2USIL X0, SP                                // 62f17e0878e0 or 62f17e2878e0 or 62f17e4878e0
+       VCVTTSS2USIL 99(R15)(R15*4), SP                    // 62917e0878a4bf63000000 or 62917e2878a4bf63000000 or 62917e4878a4bf63000000
+       VCVTTSS2USIL 15(DX), SP                            // 62f17e0878a20f000000 or 62f17e2878a20f000000 or 62f17e4878a20f000000
+       VCVTTSS2USIL X0, R14                               // 62717e0878f0 or 62717e2878f0 or 62717e4878f0
+       VCVTTSS2USIL 99(R15)(R15*4), R14                   // 62117e0878b4bf63000000 or 62117e2878b4bf63000000 or 62117e4878b4bf63000000
+       VCVTTSS2USIL 15(DX), R14                           // 62717e0878b20f000000 or 62717e2878b20f000000 or 62717e4878b20f000000
+       VCVTTSS2USIQ X31, R9                               // 6211fe0878cf
+       VCVTTSS2USIQ X31, R13                              // 6211fe0878ef
+       VCVTTSS2USIQ X16, DX                               // 62b1fe0878d0 or 62b1fe2878d0 or 62b1fe4878d0
+       VCVTTSS2USIQ (CX), DX                              // 62f1fe087811 or 62f1fe287811 or 62f1fe487811
+       VCVTTSS2USIQ 99(R15), DX                           // 62d1fe08789763000000 or 62d1fe28789763000000 or 62d1fe48789763000000
+       VCVTTSS2USIQ X16, BP                               // 62b1fe0878e8 or 62b1fe2878e8 or 62b1fe4878e8
+       VCVTTSS2USIQ (CX), BP                              // 62f1fe087829 or 62f1fe287829 or 62f1fe487829
+       VCVTTSS2USIQ 99(R15), BP                           // 62d1fe0878af63000000 or 62d1fe2878af63000000 or 62d1fe4878af63000000
+       VCVTUDQ2PD X8, K4, X7                              // 62d17e0c7af8
+       VCVTUDQ2PD 17(SP)(BP*2), K4, X7                    // 62f17e0c7abc6c11000000
+       VCVTUDQ2PD -7(DI)(R8*4), K4, X7                    // 62b17e0c7abc87f9ffffff
+       VCVTUDQ2PD X1, K1, Y1                              // 62f17e297ac9
+       VCVTUDQ2PD 15(R8)(R14*1), K1, Y1                   // 62917e297a8c300f000000
+       VCVTUDQ2PD 15(R8)(R14*2), K1, Y1                   // 62917e297a8c700f000000
+       VCVTUDQ2PD Y26, K3, Z13                            // 62117e4b7aea
+       VCVTUDQ2PD (AX), K3, Z13                           // 62717e4b7a28
+       VCVTUDQ2PD 7(SI), K3, Z13                          // 62717e4b7aae07000000
+       VCVTUDQ2PS X15, K4, X0                             // 62d17f0c7ac7
+       VCVTUDQ2PS 15(R8), K4, X0                          // 62d17f0c7a800f000000
+       VCVTUDQ2PS (BP), K4, X0                            // 62f17f0c7a4500
+       VCVTUDQ2PS Y12, K5, Y30                            // 62417f2d7af4
+       VCVTUDQ2PS (R14), K5, Y30                          // 62417f2d7a36
+       VCVTUDQ2PS -7(DI)(R8*8), K5, Y30                   // 62217f2d7ab4c7f9ffffff
+       VCVTUDQ2PS Z22, K7, Z18                            // 62a17f4f7ad6
+       VCVTUDQ2PS Z7, K7, Z18                             // 62e17f4f7ad7
+       VCVTUDQ2PS Z22, K7, Z8                             // 62317f4f7ac6
+       VCVTUDQ2PS Z7, K7, Z8                              // 62717f4f7ac7
+       VCVTUDQ2PS Z20, K7, Z2                             // 62b17f4f7ad4
+       VCVTUDQ2PS Z9, K7, Z2                              // 62d17f4f7ad1
+       VCVTUDQ2PS (BX), K7, Z2                            // 62f17f4f7a13
+       VCVTUDQ2PS -17(BP)(SI*1), K7, Z2                   // 62f17f4f7a9435efffffff
+       VCVTUDQ2PS Z20, K7, Z31                            // 62217f4f7afc
+       VCVTUDQ2PS Z9, K7, Z31                             // 62417f4f7af9
+       VCVTUDQ2PS (BX), K7, Z31                           // 62617f4f7a3b
+       VCVTUDQ2PS -17(BP)(SI*1), K7, Z31                  // 62617f4f7abc35efffffff
+       VCVTUSI2SDL AX, X7, X22                            // 62e147087bf0 or 62e147287bf0 or 62e147487bf0
+       VCVTUSI2SDL R9, X7, X22                            // 62c147087bf1 or 62c147287bf1 or 62c147487bf1
+       VCVTUSI2SDL 99(R15)(R15*2), X7, X22                // 628147087bb47f63000000 or 628147287bb47f63000000 or 628147487bb47f63000000
+       VCVTUSI2SDL -7(DI), X7, X22                        // 62e147087bb7f9ffffff or 62e147287bb7f9ffffff or 62e147487bb7f9ffffff
+       VCVTUSI2SDQ R10, X7, X19                           // 62c1c7087bda or 62c1c7287bda or 62c1c7487bda
+       VCVTUSI2SDQ CX, X7, X19                            // 62e1c7087bd9 or 62e1c7287bd9 or 62e1c7487bd9
+       VCVTUSI2SDQ 15(R8)(R14*8), X7, X19                 // 6281c7087b9cf00f000000 or 6281c7287b9cf00f000000 or 6281c7487b9cf00f000000
+       VCVTUSI2SDQ -15(R14)(R15*2), X7, X19               // 6281c7087b9c7ef1ffffff or 6281c7287b9c7ef1ffffff or 6281c7487b9c7ef1ffffff
+       VCVTUSI2SDQ R9, X31, X16                           // 62c187007bc1
+       VCVTUSI2SDQ R13, X31, X16                          // 62c187007bc5
+       VCVTUSI2SSL CX, X7, X1                             // 62f146087bc9 or 62f146287bc9 or 62f146487bc9
+       VCVTUSI2SSL SP, X7, X1                             // 62f146087bcc or 62f146287bcc or 62f146487bcc
+       VCVTUSI2SSL -7(CX)(DX*1), X7, X1                   // 62f146087b8c11f9ffffff or 62f146287b8c11f9ffffff or 62f146487b8c11f9ffffff
+       VCVTUSI2SSL -15(R14)(R15*4), X7, X1                // 629146087b8cbef1ffffff or 629146287b8cbef1ffffff or 629146487b8cbef1ffffff
+       VCVTUSI2SSL R14, X15, X9                           // 625106087bce
+       VCVTUSI2SSL AX, X15, X9                            // 627106087bc8
+       VCVTUSI2SSQ DX, X0, X12                            // 6271fe087be2 or 6271fe287be2 or 6271fe487be2
+       VCVTUSI2SSQ BP, X0, X12                            // 6271fe087be5 or 6271fe287be5 or 6271fe487be5
+       VCVTUSI2SSQ -15(R14)(R15*1), X0, X12               // 6211fe087ba43ef1ffffff or 6211fe287ba43ef1ffffff or 6211fe487ba43ef1ffffff
+       VCVTUSI2SSQ -15(BX), X0, X12                       // 6271fe087ba3f1ffffff or 6271fe287ba3f1ffffff or 6271fe487ba3f1ffffff
+       VCVTUSI2SSQ R10, X14, X12                          // 62518e087be2
+       VCVTUSI2SSQ CX, X14, X12                           // 62718e087be1
+       VDIVPD X26, X3, K2, X8                             // 6211e50a5ec2
+       VDIVPD (SI), X3, K2, X8                            // 6271e50a5e06
+       VDIVPD 7(SI)(DI*2), X3, K2, X8                     // 6271e50a5e847e07000000
+       VDIVPD Y7, Y21, K3, Y13                            // 6271d5235eef
+       VDIVPD -7(CX)(DX*1), Y21, K3, Y13                  // 6271d5235eac11f9ffffff
+       VDIVPD -15(R14)(R15*4), Y21, K3, Y13               // 6211d5235eacbef1ffffff
+       VDIVPD Z16, Z21, K3, Z14                           // 6231d5435ef0
+       VDIVPD Z9, Z21, K3, Z14                            // 6251d5435ef1
+       VDIVPD Z16, Z8, K3, Z14                            // 6231bd4b5ef0
+       VDIVPD Z9, Z8, K3, Z14                             // 6251bd4b5ef1
+       VDIVPD Z16, Z21, K3, Z15                           // 6231d5435ef8
+       VDIVPD Z9, Z21, K3, Z15                            // 6251d5435ef9
+       VDIVPD Z16, Z8, K3, Z15                            // 6231bd4b5ef8
+       VDIVPD Z9, Z8, K3, Z15                             // 6251bd4b5ef9
+       VDIVPD Z0, Z23, K3, Z20                            // 62e1c5435ee0
+       VDIVPD Z11, Z23, K3, Z20                           // 62c1c5435ee3
+       VDIVPD -17(BP)(SI*2), Z23, K3, Z20                 // 62e1c5435ea475efffffff
+       VDIVPD 7(AX)(CX*2), Z23, K3, Z20                   // 62e1c5435ea44807000000
+       VDIVPD Z0, Z19, K3, Z20                            // 62e1e5435ee0
+       VDIVPD Z11, Z19, K3, Z20                           // 62c1e5435ee3
+       VDIVPD -17(BP)(SI*2), Z19, K3, Z20                 // 62e1e5435ea475efffffff
+       VDIVPD 7(AX)(CX*2), Z19, K3, Z20                   // 62e1e5435ea44807000000
+       VDIVPD Z0, Z23, K3, Z0                             // 62f1c5435ec0
+       VDIVPD Z11, Z23, K3, Z0                            // 62d1c5435ec3
+       VDIVPD -17(BP)(SI*2), Z23, K3, Z0                  // 62f1c5435e8475efffffff
+       VDIVPD 7(AX)(CX*2), Z23, K3, Z0                    // 62f1c5435e844807000000
+       VDIVPD Z0, Z19, K3, Z0                             // 62f1e5435ec0
+       VDIVPD Z11, Z19, K3, Z0                            // 62d1e5435ec3
+       VDIVPD -17(BP)(SI*2), Z19, K3, Z0                  // 62f1e5435e8475efffffff
+       VDIVPD 7(AX)(CX*2), Z19, K3, Z0                    // 62f1e5435e844807000000
+       VDIVPS X28, X13, K2, X23                           // 6281140a5efc
+       VDIVPS 17(SP)(BP*8), X13, K2, X23                  // 62e1140a5ebcec11000000
+       VDIVPS 17(SP)(BP*4), X13, K2, X23                  // 62e1140a5ebcac11000000
+       VDIVPS Y18, Y13, K1, Y30                           // 622114295ef2
+       VDIVPS 15(DX)(BX*1), Y13, K1, Y30                  // 626114295eb41a0f000000
+       VDIVPS -7(CX)(DX*2), Y13, K1, Y30                  // 626114295eb451f9ffffff
+       VDIVPS Z0, Z24, K2, Z0                             // 62f13c425ec0
+       VDIVPS Z26, Z24, K2, Z0                            // 62913c425ec2
+       VDIVPS Z0, Z12, K2, Z0                             // 62f11c4a5ec0
+       VDIVPS Z26, Z12, K2, Z0                            // 62911c4a5ec2
+       VDIVPS Z0, Z24, K2, Z25                            // 62613c425ec8
+       VDIVPS Z26, Z24, K2, Z25                           // 62013c425eca
+       VDIVPS Z0, Z12, K2, Z25                            // 62611c4a5ec8
+       VDIVPS Z26, Z12, K2, Z25                           // 62011c4a5eca
+       VDIVPS Z9, Z9, K1, Z9                              // 625134495ec9
+       VDIVPS Z28, Z9, K1, Z9                             // 621134495ecc
+       VDIVPS 15(R8)(R14*1), Z9, K1, Z9                   // 621134495e8c300f000000
+       VDIVPS 15(R8)(R14*2), Z9, K1, Z9                   // 621134495e8c700f000000
+       VDIVPS Z9, Z25, K1, Z9                             // 625134415ec9
+       VDIVPS Z28, Z25, K1, Z9                            // 621134415ecc
+       VDIVPS 15(R8)(R14*1), Z25, K1, Z9                  // 621134415e8c300f000000
+       VDIVPS 15(R8)(R14*2), Z25, K1, Z9                  // 621134415e8c700f000000
+       VDIVPS Z9, Z9, K1, Z3                              // 62d134495ed9
+       VDIVPS Z28, Z9, K1, Z3                             // 629134495edc
+       VDIVPS 15(R8)(R14*1), Z9, K1, Z3                   // 629134495e9c300f000000
+       VDIVPS 15(R8)(R14*2), Z9, K1, Z3                   // 629134495e9c700f000000
+       VDIVPS Z9, Z25, K1, Z3                             // 62d134415ed9
+       VDIVPS Z28, Z25, K1, Z3                            // 629134415edc
+       VDIVPS 15(R8)(R14*1), Z25, K1, Z3                  // 629134415e9c300f000000
+       VDIVPS 15(R8)(R14*2), Z25, K1, Z3                  // 629134415e9c700f000000
+       VDIVSD X15, X9, K7, X24                            // 6241b70f5ec7
+       VDIVSD X21, X18, K1, X26                           // 6221ef015ed5 or 6221ef215ed5 or 6221ef415ed5
+       VDIVSD 7(AX)(CX*4), X18, K1, X26                   // 6261ef015e948807000000 or 6261ef215e948807000000 or 6261ef415e948807000000
+       VDIVSD 7(AX)(CX*1), X18, K1, X26                   // 6261ef015e940807000000 or 6261ef215e940807000000 or 6261ef415e940807000000
+       VDIVSS X31, X11, K1, X1                            // 629126095ecf
+       VDIVSS X0, X7, K1, X3                              // 62f146095ed8 or 62f146295ed8 or 62f146495ed8
+       VDIVSS 15(DX)(BX*1), X7, K1, X3                    // 62f146095e9c1a0f000000 or 62f146295e9c1a0f000000 or 62f146495e9c1a0f000000
+       VDIVSS -7(CX)(DX*2), X7, K1, X3                    // 62f146095e9c51f9ffffff or 62f146295e9c51f9ffffff or 62f146495e9c51f9ffffff
+       VEXPANDPD X24, K3, X0                              // 6292fd0b88c0
+       VEXPANDPD 7(SI)(DI*4), K3, X0                      // 62f2fd0b8884be07000000
+       VEXPANDPD -7(DI)(R8*2), K3, X0                     // 62b2fd0b888447f9ffffff
+       VEXPANDPD Y8, K4, Y24                              // 6242fd2c88c0
+       VEXPANDPD -17(BP), K4, Y24                         // 6262fd2c8885efffffff
+       VEXPANDPD -15(R14)(R15*8), K4, Y24                 // 6202fd2c8884fef1ffffff
+       VEXPANDPD Z26, K5, Z30                             // 6202fd4d88f2
+       VEXPANDPD Z22, K5, Z30                             // 6222fd4d88f6
+       VEXPANDPD (CX), K5, Z30                            // 6262fd4d8831
+       VEXPANDPD 99(R15), K5, Z30                         // 6242fd4d88b763000000
+       VEXPANDPD Z26, K5, Z5                              // 6292fd4d88ea
+       VEXPANDPD Z22, K5, Z5                              // 62b2fd4d88ee
+       VEXPANDPD (CX), K5, Z5                             // 62f2fd4d8829
+       VEXPANDPD 99(R15), K5, Z5                          // 62d2fd4d88af63000000
+       VEXPANDPS X7, K7, X20                              // 62e27d0f88e7
+       VEXPANDPS 17(SP), K7, X20                          // 62e27d0f88a42411000000
+       VEXPANDPS -17(BP)(SI*4), K7, X20                   // 62e27d0f88a4b5efffffff
+       VEXPANDPS Y24, K7, Y11                             // 62127d2f88d8
+       VEXPANDPS 17(SP)(BP*2), K7, Y11                    // 62727d2f889c6c11000000
+       VEXPANDPS -7(DI)(R8*4), K7, Y11                    // 62327d2f889c87f9ffffff
+       VEXPANDPS Z16, K6, Z7                              // 62b27d4e88f8
+       VEXPANDPS Z25, K6, Z7                              // 62927d4e88f9
+       VEXPANDPS 99(R15)(R15*2), K6, Z7                   // 62927d4e88bc7f63000000
+       VEXPANDPS -7(DI), K6, Z7                           // 62f27d4e88bff9ffffff
+       VEXPANDPS Z16, K6, Z21                             // 62a27d4e88e8
+       VEXPANDPS Z25, K6, Z21                             // 62827d4e88e9
+       VEXPANDPS 99(R15)(R15*2), K6, Z21                  // 62827d4e88ac7f63000000
+       VEXPANDPS -7(DI), K6, Z21                          // 62e27d4e88aff9ffffff
+       VEXTRACTF32X4 $1, Y5, K3, X9                       // 62d37d2b19e901
+       VEXTRACTF32X4 $1, Y5, K3, 7(AX)                    // 62f37d2b19a80700000001
+       VEXTRACTF32X4 $1, Y5, K3, (DI)                     // 62f37d2b192f01
+       VEXTRACTF32X4 $3, Z14, K7, X7                      // 62737d4f19f703
+       VEXTRACTF32X4 $3, Z13, K7, X7                      // 62737d4f19ef03
+       VEXTRACTF32X4 $3, Z14, K7, 99(R15)(R15*1)          // 62137d4f19b43f6300000003
+       VEXTRACTF32X4 $3, Z13, K7, 99(R15)(R15*1)          // 62137d4f19ac3f6300000003
+       VEXTRACTF32X4 $3, Z14, K7, (DX)                    // 62737d4f193203
+       VEXTRACTF32X4 $3, Z13, K7, (DX)                    // 62737d4f192a03
+       VEXTRACTF64X4 $0, Z2, K2, Y16                      // 62b3fd4a1bd000
+       VEXTRACTF64X4 $0, Z7, K2, Y16                      // 62b3fd4a1bf800
+       VEXTRACTF64X4 $0, Z2, K2, 15(R8)(R14*8)            // 6293fd4a1b94f00f00000000
+       VEXTRACTF64X4 $0, Z7, K2, 15(R8)(R14*8)            // 6293fd4a1bbcf00f00000000
+       VEXTRACTF64X4 $0, Z2, K2, -15(R14)(R15*2)          // 6293fd4a1b947ef1ffffff00
+       VEXTRACTF64X4 $0, Z7, K2, -15(R14)(R15*2)          // 6293fd4a1bbc7ef1ffffff00
+       VEXTRACTI32X4 $0, Y9, K5, X31                      // 62137d2d39cf00
+       VEXTRACTI32X4 $0, Y9, K5, 7(SI)(DI*1)              // 62737d2d398c3e0700000000
+       VEXTRACTI32X4 $0, Y9, K5, 15(DX)(BX*8)             // 62737d2d398cda0f00000000
+       VEXTRACTI32X4 $1, Z27, K3, X3                      // 62637d4b39db01
+       VEXTRACTI32X4 $1, Z25, K3, X3                      // 62637d4b39cb01
+       VEXTRACTI32X4 $1, Z27, K3, -7(DI)(R8*1)            // 62237d4b399c07f9ffffff01
+       VEXTRACTI32X4 $1, Z25, K3, -7(DI)(R8*1)            // 62237d4b398c07f9ffffff01
+       VEXTRACTI32X4 $1, Z27, K3, (SP)                    // 62637d4b391c2401
+       VEXTRACTI32X4 $1, Z25, K3, (SP)                    // 62637d4b390c2401
+       VEXTRACTI64X4 $1, Z3, K3, Y6                       // 62f3fd4b3bde01
+       VEXTRACTI64X4 $1, Z0, K3, Y6                       // 62f3fd4b3bc601
+       VEXTRACTI64X4 $1, Z3, K3, 7(AX)(CX*4)              // 62f3fd4b3b9c880700000001
+       VEXTRACTI64X4 $1, Z0, K3, 7(AX)(CX*4)              // 62f3fd4b3b84880700000001
+       VEXTRACTI64X4 $1, Z3, K3, 7(AX)(CX*1)              // 62f3fd4b3b9c080700000001
+       VEXTRACTI64X4 $1, Z0, K3, 7(AX)(CX*1)              // 62f3fd4b3b84080700000001
+       VFIXUPIMMPD $97, X30, X0, K3, X13                  // 6213fd0b54ee61
+       VFIXUPIMMPD $97, (AX), X0, K3, X13                 // 6273fd0b542861
+       VFIXUPIMMPD $97, 7(SI), X0, K3, X13                // 6273fd0b54ae0700000061
+       VFIXUPIMMPD $81, Y6, Y7, K3, Y3                    // 62f3c52b54de51
+       VFIXUPIMMPD $81, (SI), Y7, K3, Y3                  // 62f3c52b541e51
+       VFIXUPIMMPD $81, 7(SI)(DI*2), Y7, K3, Y3           // 62f3c52b549c7e0700000051
+       VFIXUPIMMPD $42, Z22, Z8, K2, Z14                  // 6233bd4a54f62a
+       VFIXUPIMMPD $42, Z25, Z8, K2, Z14                  // 6213bd4a54f12a
+       VFIXUPIMMPD $42, Z22, Z24, K2, Z14                 // 6233bd4254f62a
+       VFIXUPIMMPD $42, Z25, Z24, K2, Z14                 // 6213bd4254f12a
+       VFIXUPIMMPD $42, Z22, Z8, K2, Z7                   // 62b3bd4a54fe2a
+       VFIXUPIMMPD $42, Z25, Z8, K2, Z7                   // 6293bd4a54f92a
+       VFIXUPIMMPD $42, Z22, Z24, K2, Z7                  // 62b3bd4254fe2a
+       VFIXUPIMMPD $42, Z25, Z24, K2, Z7                  // 6293bd4254f92a
+       VFIXUPIMMPD $79, Z0, Z6, K1, Z1                    // 62f3cd4954c84f
+       VFIXUPIMMPD $79, Z8, Z6, K1, Z1                    // 62d3cd4954c84f
+       VFIXUPIMMPD $79, -7(CX)(DX*1), Z6, K1, Z1          // 62f3cd49548c11f9ffffff4f
+       VFIXUPIMMPD $79, -15(R14)(R15*4), Z6, K1, Z1       // 6293cd49548cbef1ffffff4f
+       VFIXUPIMMPD $79, Z0, Z2, K1, Z1                    // 62f3ed4954c84f
+       VFIXUPIMMPD $79, Z8, Z2, K1, Z1                    // 62d3ed4954c84f
+       VFIXUPIMMPD $79, -7(CX)(DX*1), Z2, K1, Z1          // 62f3ed49548c11f9ffffff4f
+       VFIXUPIMMPD $79, -15(R14)(R15*4), Z2, K1, Z1       // 6293ed49548cbef1ffffff4f
+       VFIXUPIMMPD $79, Z0, Z6, K1, Z16                   // 62e3cd4954c04f
+       VFIXUPIMMPD $79, Z8, Z6, K1, Z16                   // 62c3cd4954c04f
+       VFIXUPIMMPD $79, -7(CX)(DX*1), Z6, K1, Z16         // 62e3cd49548411f9ffffff4f
+       VFIXUPIMMPD $79, -15(R14)(R15*4), Z6, K1, Z16      // 6283cd495484bef1ffffff4f
+       VFIXUPIMMPD $79, Z0, Z2, K1, Z16                   // 62e3ed4954c04f
+       VFIXUPIMMPD $79, Z8, Z2, K1, Z16                   // 62c3ed4954c04f
+       VFIXUPIMMPD $79, -7(CX)(DX*1), Z2, K1, Z16         // 62e3ed49548411f9ffffff4f
+       VFIXUPIMMPD $79, -15(R14)(R15*4), Z2, K1, Z16      // 6283ed495484bef1ffffff4f
+       VFIXUPIMMPS $64, X11, X14, K2, X16                 // 62c30d0a54c340
+       VFIXUPIMMPS $64, (BX), X14, K2, X16                // 62e30d0a540340
+       VFIXUPIMMPS $64, -17(BP)(SI*1), X14, K2, X16       // 62e30d0a548435efffffff40
+       VFIXUPIMMPS $27, Y26, Y11, K1, Y26                 // 6203252954d21b
+       VFIXUPIMMPS $27, 17(SP)(BP*8), Y11, K1, Y26        // 626325295494ec110000001b
+       VFIXUPIMMPS $27, 17(SP)(BP*4), Y11, K1, Y26        // 626325295494ac110000001b
+       VFIXUPIMMPS $47, Z11, Z14, K7, Z15                 // 62530d4f54fb2f
+       VFIXUPIMMPS $47, Z5, Z14, K7, Z15                  // 62730d4f54fd2f
+       VFIXUPIMMPS $47, Z11, Z27, K7, Z15                 // 6253254754fb2f
+       VFIXUPIMMPS $47, Z5, Z27, K7, Z15                  // 6273254754fd2f
+       VFIXUPIMMPS $47, Z11, Z14, K7, Z12                 // 62530d4f54e32f
+       VFIXUPIMMPS $47, Z5, Z14, K7, Z12                  // 62730d4f54e52f
+       VFIXUPIMMPS $47, Z11, Z27, K7, Z12                 // 6253254754e32f
+       VFIXUPIMMPS $47, Z5, Z27, K7, Z12                  // 6273254754e52f
+       VFIXUPIMMPS $82, Z2, Z5, K1, Z13                   // 6273554954ea52
+       VFIXUPIMMPS $82, 15(DX)(BX*1), Z5, K1, Z13         // 6273554954ac1a0f00000052
+       VFIXUPIMMPS $82, -7(CX)(DX*2), Z5, K1, Z13         // 6273554954ac51f9ffffff52
+       VFIXUPIMMPS $82, Z2, Z23, K1, Z13                  // 6273454154ea52
+       VFIXUPIMMPS $82, 15(DX)(BX*1), Z23, K1, Z13        // 6273454154ac1a0f00000052
+       VFIXUPIMMPS $82, -7(CX)(DX*2), Z23, K1, Z13        // 6273454154ac51f9ffffff52
+       VFIXUPIMMPS $82, Z2, Z5, K1, Z14                   // 6273554954f252
+       VFIXUPIMMPS $82, 15(DX)(BX*1), Z5, K1, Z14         // 6273554954b41a0f00000052
+       VFIXUPIMMPS $82, -7(CX)(DX*2), Z5, K1, Z14         // 6273554954b451f9ffffff52
+       VFIXUPIMMPS $82, Z2, Z23, K1, Z14                  // 6273454154f252
+       VFIXUPIMMPS $82, 15(DX)(BX*1), Z23, K1, Z14        // 6273454154b41a0f00000052
+       VFIXUPIMMPS $82, -7(CX)(DX*2), Z23, K1, Z14        // 6273454154b451f9ffffff52
+       VFIXUPIMMSD $126, X8, X19, K1, X14                 // 6253e50155f07e
+       VFIXUPIMMSD $94, X23, X26, K1, X8                  // 6233ad0155c75e or 6233ad2155c75e or 6233ad4155c75e
+       VFIXUPIMMSD $94, (SI), X26, K1, X8                 // 6273ad0155065e or 6273ad2155065e or 6273ad4155065e
+       VFIXUPIMMSD $94, 7(SI)(DI*2), X26, K1, X8          // 6273ad0155847e070000005e or 6273ad2155847e070000005e or 6273ad4155847e070000005e
+       VFIXUPIMMSS $121, X23, X16, K7, X12                // 62337d0755e779
+       VFIXUPIMMSS $13, X31, X11, K2, X23                 // 6283250a55ff0d or 6283252a55ff0d or 6283254a55ff0d
+       VFIXUPIMMSS $13, 17(SP)(BP*2), X11, K2, X23        // 62e3250a55bc6c110000000d or 62e3252a55bc6c110000000d or 62e3254a55bc6c110000000d
+       VFIXUPIMMSS $13, -7(DI)(R8*4), X11, K2, X23        // 62a3250a55bc87f9ffffff0d or 62a3252a55bc87f9ffffff0d or 62a3254a55bc87f9ffffff0d
+       VFMADD132PD X0, X14, K4, X24                       // 62628d0c98c0
+       VFMADD132PD 15(R8)(R14*4), X14, K4, X24            // 62028d0c9884b00f000000
+       VFMADD132PD -7(CX)(DX*4), X14, K4, X24             // 62628d0c988491f9ffffff
+       VFMADD132PD Y18, Y14, K1, Y12                      // 62328d2998e2
+       VFMADD132PD 7(SI)(DI*4), Y14, K1, Y12              // 62728d2998a4be07000000
+       VFMADD132PD -7(DI)(R8*2), Y14, K1, Y12             // 62328d2998a447f9ffffff
+       VFMADD132PD Z28, Z26, K3, Z6                       // 6292ad4398f4
+       VFMADD132PD Z6, Z26, K3, Z6                        // 62f2ad4398f6
+       VFMADD132PD Z28, Z14, K3, Z6                       // 62928d4b98f4
+       VFMADD132PD Z6, Z14, K3, Z6                        // 62f28d4b98f6
+       VFMADD132PD Z28, Z26, K3, Z14                      // 6212ad4398f4
+       VFMADD132PD Z6, Z26, K3, Z14                       // 6272ad4398f6
+       VFMADD132PD Z28, Z14, K3, Z14                      // 62128d4b98f4
+       VFMADD132PD Z6, Z14, K3, Z14                       // 62728d4b98f6
+       VFMADD132PD Z3, Z26, K4, Z13                       // 6272ad4498eb
+       VFMADD132PD Z0, Z26, K4, Z13                       // 6272ad4498e8
+       VFMADD132PD -17(BP), Z26, K4, Z13                  // 6272ad4498adefffffff
+       VFMADD132PD -15(R14)(R15*8), Z26, K4, Z13          // 6212ad4498acfef1ffffff
+       VFMADD132PD Z3, Z3, K4, Z13                        // 6272e54c98eb
+       VFMADD132PD Z0, Z3, K4, Z13                        // 6272e54c98e8
+       VFMADD132PD -17(BP), Z3, K4, Z13                   // 6272e54c98adefffffff
+       VFMADD132PD -15(R14)(R15*8), Z3, K4, Z13           // 6212e54c98acfef1ffffff
+       VFMADD132PD Z3, Z26, K4, Z21                       // 62e2ad4498eb
+       VFMADD132PD Z0, Z26, K4, Z21                       // 62e2ad4498e8
+       VFMADD132PD -17(BP), Z26, K4, Z21                  // 62e2ad4498adefffffff
+       VFMADD132PD -15(R14)(R15*8), Z26, K4, Z21          // 6282ad4498acfef1ffffff
+       VFMADD132PD Z3, Z3, K4, Z21                        // 62e2e54c98eb
+       VFMADD132PD Z0, Z3, K4, Z21                        // 62e2e54c98e8
+       VFMADD132PD -17(BP), Z3, K4, Z21                   // 62e2e54c98adefffffff
+       VFMADD132PD -15(R14)(R15*8), Z3, K4, Z21           // 6282e54c98acfef1ffffff
+       VFMADD132PS X2, X23, K5, X11                       // 6272450598da
+       VFMADD132PS (R8), X23, K5, X11                     // 625245059818
+       VFMADD132PS 15(DX)(BX*2), X23, K5, X11             // 62724505989c5a0f000000
+       VFMADD132PS Y3, Y18, K7, Y31                       // 62626d2798fb
+       VFMADD132PS 17(SP), Y18, K7, Y31                   // 62626d2798bc2411000000
+       VFMADD132PS -17(BP)(SI*4), Y18, K7, Y31            // 62626d2798bcb5efffffff
+       VFMADD132PS Z3, Z11, K7, Z21                       // 62e2254f98eb
+       VFMADD132PS Z12, Z11, K7, Z21                      // 62c2254f98ec
+       VFMADD132PS Z3, Z25, K7, Z21                       // 62e2354798eb
+       VFMADD132PS Z12, Z25, K7, Z21                      // 62c2354798ec
+       VFMADD132PS Z3, Z11, K7, Z13                       // 6272254f98eb
+       VFMADD132PS Z12, Z11, K7, Z13                      // 6252254f98ec
+       VFMADD132PS Z3, Z25, K7, Z13                       // 6272354798eb
+       VFMADD132PS Z12, Z25, K7, Z13                      // 6252354798ec
+       VFMADD132PS Z23, Z23, K6, Z27                      // 6222454698df
+       VFMADD132PS Z6, Z23, K6, Z27                       // 6262454698de
+       VFMADD132PS 17(SP)(BP*2), Z23, K6, Z27             // 62624546989c6c11000000
+       VFMADD132PS -7(DI)(R8*4), Z23, K6, Z27             // 62224546989c87f9ffffff
+       VFMADD132PS Z23, Z5, K6, Z27                       // 6222554e98df
+       VFMADD132PS Z6, Z5, K6, Z27                        // 6262554e98de
+       VFMADD132PS 17(SP)(BP*2), Z5, K6, Z27              // 6262554e989c6c11000000
+       VFMADD132PS -7(DI)(R8*4), Z5, K6, Z27              // 6222554e989c87f9ffffff
+       VFMADD132PS Z23, Z23, K6, Z15                      // 6232454698ff
+       VFMADD132PS Z6, Z23, K6, Z15                       // 6272454698fe
+       VFMADD132PS 17(SP)(BP*2), Z23, K6, Z15             // 6272454698bc6c11000000
+       VFMADD132PS -7(DI)(R8*4), Z23, K6, Z15             // 6232454698bc87f9ffffff
+       VFMADD132PS Z23, Z5, K6, Z15                       // 6232554e98ff
+       VFMADD132PS Z6, Z5, K6, Z15                        // 6272554e98fe
+       VFMADD132PS 17(SP)(BP*2), Z5, K6, Z15              // 6272554e98bc6c11000000
+       VFMADD132PS -7(DI)(R8*4), Z5, K6, Z15              // 6232554e98bc87f9ffffff
+       VFMADD132SD X25, X5, K3, X20                       // 6282d50b99e1
+       VFMADD132SD X13, X9, K7, X0                        // 62d2b50f99c5 or 62d2b52f99c5 or 62d2b54f99c5
+       VFMADD132SD 17(SP)(BP*8), X9, K7, X0               // 62f2b50f9984ec11000000 or 62f2b52f9984ec11000000 or 62f2b54f9984ec11000000
+       VFMADD132SD 17(SP)(BP*4), X9, K7, X0               // 62f2b50f9984ac11000000 or 62f2b52f9984ac11000000 or 62f2b54f9984ac11000000
+       VFMADD132SS X9, X8, K4, X2                         // 62d23d0c99d1
+       VFMADD132SS X11, X31, K4, X2                       // 62d2050499d3 or 62d2052499d3 or 62d2054499d3
+       VFMADD132SS 15(R8), X31, K4, X2                    // 62d2050499900f000000 or 62d2052499900f000000 or 62d2054499900f000000
+       VFMADD132SS (BP), X31, K4, X2                      // 62f20504995500 or 62f20524995500 or 62f20544995500
+       VFMADD213PD X14, X5, K7, X22                       // 62c2d50fa8f6
+       VFMADD213PD 17(SP)(BP*1), X5, K7, X22              // 62e2d50fa8b42c11000000
+       VFMADD213PD -7(CX)(DX*8), X5, K7, X22              // 62e2d50fa8b4d1f9ffffff
+       VFMADD213PD Y7, Y2, K2, Y24                        // 6262ed2aa8c7
+       VFMADD213PD 7(AX), Y2, K2, Y24                     // 6262ed2aa88007000000
+       VFMADD213PD (DI), Y2, K2, Y24                      // 6262ed2aa807
+       VFMADD213PD Z16, Z21, K5, Z8                       // 6232d545a8c0
+       VFMADD213PD Z13, Z21, K5, Z8                       // 6252d545a8c5
+       VFMADD213PD Z16, Z5, K5, Z8                        // 6232d54da8c0
+       VFMADD213PD Z13, Z5, K5, Z8                        // 6252d54da8c5
+       VFMADD213PD Z16, Z21, K5, Z28                      // 6222d545a8e0
+       VFMADD213PD Z13, Z21, K5, Z28                      // 6242d545a8e5
+       VFMADD213PD Z16, Z5, K5, Z28                       // 6222d54da8e0
+       VFMADD213PD Z13, Z5, K5, Z28                       // 6242d54da8e5
+       VFMADD213PD Z6, Z22, K3, Z12                       // 6272cd43a8e6
+       VFMADD213PD Z8, Z22, K3, Z12                       // 6252cd43a8e0
+       VFMADD213PD 15(R8), Z22, K3, Z12                   // 6252cd43a8a00f000000
+       VFMADD213PD (BP), Z22, K3, Z12                     // 6272cd43a86500
+       VFMADD213PD Z6, Z11, K3, Z12                       // 6272a54ba8e6
+       VFMADD213PD Z8, Z11, K3, Z12                       // 6252a54ba8e0
+       VFMADD213PD 15(R8), Z11, K3, Z12                   // 6252a54ba8a00f000000
+       VFMADD213PD (BP), Z11, K3, Z12                     // 6272a54ba86500
+       VFMADD213PD Z6, Z22, K3, Z27                       // 6262cd43a8de
+       VFMADD213PD Z8, Z22, K3, Z27                       // 6242cd43a8d8
+       VFMADD213PD 15(R8), Z22, K3, Z27                   // 6242cd43a8980f000000
+       VFMADD213PD (BP), Z22, K3, Z27                     // 6262cd43a85d00
+       VFMADD213PD Z6, Z11, K3, Z27                       // 6262a54ba8de
+       VFMADD213PD Z8, Z11, K3, Z27                       // 6242a54ba8d8
+       VFMADD213PD 15(R8), Z11, K3, Z27                   // 6242a54ba8980f000000
+       VFMADD213PD (BP), Z11, K3, Z27                     // 6262a54ba85d00
+       VFMADD213PS X7, X17, K4, X0                        // 62f27504a8c7
+       VFMADD213PS -17(BP)(SI*2), X17, K4, X0             // 62f27504a88475efffffff
+       VFMADD213PS 7(AX)(CX*2), X17, K4, X0               // 62f27504a8844807000000
+       VFMADD213PS Y8, Y14, K2, Y21                       // 62c20d2aa8e8
+       VFMADD213PS 99(R15)(R15*1), Y14, K2, Y21           // 62820d2aa8ac3f63000000
+       VFMADD213PS (DX), Y14, K2, Y21                     // 62e20d2aa82a
+       VFMADD213PS Z9, Z12, K2, Z25                       // 62421d4aa8c9
+       VFMADD213PS Z12, Z12, K2, Z25                      // 62421d4aa8cc
+       VFMADD213PS Z9, Z17, K2, Z25                       // 62427542a8c9
+       VFMADD213PS Z12, Z17, K2, Z25                      // 62427542a8cc
+       VFMADD213PS Z9, Z12, K2, Z12                       // 62521d4aa8e1
+       VFMADD213PS Z12, Z12, K2, Z12                      // 62521d4aa8e4
+       VFMADD213PS Z9, Z17, K2, Z12                       // 62527542a8e1
+       VFMADD213PS Z12, Z17, K2, Z12                      // 62527542a8e4
+       VFMADD213PS Z8, Z3, K3, Z6                         // 62d2654ba8f0
+       VFMADD213PS Z2, Z3, K3, Z6                         // 62f2654ba8f2
+       VFMADD213PS 15(R8)(R14*8), Z3, K3, Z6              // 6292654ba8b4f00f000000
+       VFMADD213PS -15(R14)(R15*2), Z3, K3, Z6            // 6292654ba8b47ef1ffffff
+       VFMADD213PS Z8, Z21, K3, Z6                        // 62d25543a8f0
+       VFMADD213PS Z2, Z21, K3, Z6                        // 62f25543a8f2
+       VFMADD213PS 15(R8)(R14*8), Z21, K3, Z6             // 62925543a8b4f00f000000
+       VFMADD213PS -15(R14)(R15*2), Z21, K3, Z6           // 62925543a8b47ef1ffffff
+       VFMADD213PS Z8, Z3, K3, Z25                        // 6242654ba8c8
+       VFMADD213PS Z2, Z3, K3, Z25                        // 6262654ba8ca
+       VFMADD213PS 15(R8)(R14*8), Z3, K3, Z25             // 6202654ba88cf00f000000
+       VFMADD213PS -15(R14)(R15*2), Z3, K3, Z25           // 6202654ba88c7ef1ffffff
+       VFMADD213PS Z8, Z21, K3, Z25                       // 62425543a8c8
+       VFMADD213PS Z2, Z21, K3, Z25                       // 62625543a8ca
+       VFMADD213PS 15(R8)(R14*8), Z21, K3, Z25            // 62025543a88cf00f000000
+       VFMADD213PS -15(R14)(R15*2), Z21, K3, Z25          // 62025543a88c7ef1ffffff
+       VFMADD213SD X0, X11, K3, X15                       // 6272a50ba9f8
+       VFMADD213SD X27, X8, K3, X18                       // 6282bd0ba9d3 or 6282bd2ba9d3 or 6282bd4ba9d3
+       VFMADD213SD 7(SI)(DI*4), X8, K3, X18               // 62e2bd0ba994be07000000 or 62e2bd2ba994be07000000 or 62e2bd4ba994be07000000
+       VFMADD213SD -7(DI)(R8*2), X8, K3, X18              // 62a2bd0ba99447f9ffffff or 62a2bd2ba99447f9ffffff or 62a2bd4ba99447f9ffffff
+       VFMADD213SS X18, X3, K2, X25                       // 6222650aa9ca
+       VFMADD213SS X15, X28, K1, X15                      // 62521d01a9ff or 62521d21a9ff or 62521d41a9ff
+       VFMADD213SS 15(R8)(R14*8), X28, K1, X15            // 62121d01a9bcf00f000000 or 62121d21a9bcf00f000000 or 62121d41a9bcf00f000000
+       VFMADD213SS -15(R14)(R15*2), X28, K1, X15          // 62121d01a9bc7ef1ffffff or 62121d21a9bc7ef1ffffff or 62121d41a9bc7ef1ffffff
+       VFMADD231PD X8, X13, K2, X7                        // 62d2950ab8f8
+       VFMADD231PD 15(R8)(R14*1), X13, K2, X7             // 6292950ab8bc300f000000
+       VFMADD231PD 15(R8)(R14*2), X13, K2, X7             // 6292950ab8bc700f000000
+       VFMADD231PD Y24, Y11, K1, Y20                      // 6282a529b8e0
+       VFMADD231PD -17(BP)(SI*8), Y11, K1, Y20            // 62e2a529b8a4f5efffffff
+       VFMADD231PD (R15), Y11, K1, Y20                    // 62c2a529b827
+       VFMADD231PD Z0, Z7, K7, Z3                         // 62f2c54fb8d8
+       VFMADD231PD Z6, Z7, K7, Z3                         // 62f2c54fb8de
+       VFMADD231PD Z0, Z9, K7, Z3                         // 62f2b54fb8d8
+       VFMADD231PD Z6, Z9, K7, Z3                         // 62f2b54fb8de
+       VFMADD231PD Z0, Z7, K7, Z27                        // 6262c54fb8d8
+       VFMADD231PD Z6, Z7, K7, Z27                        // 6262c54fb8de
+       VFMADD231PD Z0, Z9, K7, Z27                        // 6262b54fb8d8
+       VFMADD231PD Z6, Z9, K7, Z27                        // 6262b54fb8de
+       VFMADD231PD Z9, Z3, K1, Z20                        // 62c2e549b8e1
+       VFMADD231PD Z19, Z3, K1, Z20                       // 62a2e549b8e3
+       VFMADD231PD -15(R14)(R15*1), Z3, K1, Z20           // 6282e549b8a43ef1ffffff
+       VFMADD231PD -15(BX), Z3, K1, Z20                   // 62e2e549b8a3f1ffffff
+       VFMADD231PD Z9, Z30, K1, Z20                       // 62c28d41b8e1
+       VFMADD231PD Z19, Z30, K1, Z20                      // 62a28d41b8e3
+       VFMADD231PD -15(R14)(R15*1), Z30, K1, Z20          // 62828d41b8a43ef1ffffff
+       VFMADD231PD -15(BX), Z30, K1, Z20                  // 62e28d41b8a3f1ffffff
+       VFMADD231PD Z9, Z3, K1, Z28                        // 6242e549b8e1
+       VFMADD231PD Z19, Z3, K1, Z28                       // 6222e549b8e3
+       VFMADD231PD -15(R14)(R15*1), Z3, K1, Z28           // 6202e549b8a43ef1ffffff
+       VFMADD231PD -15(BX), Z3, K1, Z28                   // 6262e549b8a3f1ffffff
+       VFMADD231PD Z9, Z30, K1, Z28                       // 62428d41b8e1
+       VFMADD231PD Z19, Z30, K1, Z28                      // 62228d41b8e3
+       VFMADD231PD -15(R14)(R15*1), Z30, K1, Z28          // 62028d41b8a43ef1ffffff
+       VFMADD231PD -15(BX), Z30, K1, Z28                  // 62628d41b8a3f1ffffff
+       VFMADD231PS X0, X7, K1, X24                        // 62624509b8c0
+       VFMADD231PS (R14), X7, K1, X24                     // 62424509b806
+       VFMADD231PS -7(DI)(R8*8), X7, K1, X24              // 62224509b884c7f9ffffff
+       VFMADD231PS Y18, Y5, K1, Y1                        // 62b25529b8ca
+       VFMADD231PS 7(SI)(DI*8), Y5, K1, Y1                // 62f25529b88cfe07000000
+       VFMADD231PS -15(R14), Y5, K1, Y1                   // 62d25529b88ef1ffffff
+       VFMADD231PS Z18, Z11, K7, Z12                      // 6232254fb8e2
+       VFMADD231PS Z24, Z11, K7, Z12                      // 6212254fb8e0
+       VFMADD231PS Z18, Z5, K7, Z12                       // 6232554fb8e2
+       VFMADD231PS Z24, Z5, K7, Z12                       // 6212554fb8e0
+       VFMADD231PS Z18, Z11, K7, Z22                      // 62a2254fb8f2
+       VFMADD231PS Z24, Z11, K7, Z22                      // 6282254fb8f0
+       VFMADD231PS Z18, Z5, K7, Z22                       // 62a2554fb8f2
+       VFMADD231PS Z24, Z5, K7, Z22                       // 6282554fb8f0
+       VFMADD231PS Z6, Z7, K2, Z2                         // 62f2454ab8d6
+       VFMADD231PS Z16, Z7, K2, Z2                        // 62b2454ab8d0
+       VFMADD231PS 7(AX)(CX*4), Z7, K2, Z2                // 62f2454ab8948807000000
+       VFMADD231PS 7(AX)(CX*1), Z7, K2, Z2                // 62f2454ab8940807000000
+       VFMADD231PS Z6, Z13, K2, Z2                        // 62f2154ab8d6
+       VFMADD231PS Z16, Z13, K2, Z2                       // 62b2154ab8d0
+       VFMADD231PS 7(AX)(CX*4), Z13, K2, Z2               // 62f2154ab8948807000000
+       VFMADD231PS 7(AX)(CX*1), Z13, K2, Z2               // 62f2154ab8940807000000
+       VFMADD231PS Z6, Z7, K2, Z21                        // 62e2454ab8ee
+       VFMADD231PS Z16, Z7, K2, Z21                       // 62a2454ab8e8
+       VFMADD231PS 7(AX)(CX*4), Z7, K2, Z21               // 62e2454ab8ac8807000000
+       VFMADD231PS 7(AX)(CX*1), Z7, K2, Z21               // 62e2454ab8ac0807000000
+       VFMADD231PS Z6, Z13, K2, Z21                       // 62e2154ab8ee
+       VFMADD231PS Z16, Z13, K2, Z21                      // 62a2154ab8e8
+       VFMADD231PS 7(AX)(CX*4), Z13, K2, Z21              // 62e2154ab8ac8807000000
+       VFMADD231PS 7(AX)(CX*1), Z13, K2, Z21              // 62e2154ab8ac0807000000
+       VFMADD231SD X11, X1, K4, X22                       // 62c2f50cb9f3
+       VFMADD231SD X8, X7, K1, X6                         // 62d2c509b9f0 or 62d2c529b9f0 or 62d2c549b9f0
+       VFMADD231SD 17(SP), X7, K1, X6                     // 62f2c509b9b42411000000 or 62f2c529b9b42411000000 or 62f2c549b9b42411000000
+       VFMADD231SD -17(BP)(SI*4), X7, K1, X6              // 62f2c509b9b4b5efffffff or 62f2c529b9b4b5efffffff or 62f2c549b9b4b5efffffff
+       VFMADD231SS X28, X3, K3, X31                       // 6202650bb9fc
+       VFMADD231SS X7, X24, K4, X20                       // 62e23d04b9e7 or 62e23d24b9e7 or 62e23d44b9e7
+       VFMADD231SS -15(R14)(R15*1), X24, K4, X20          // 62823d04b9a43ef1ffffff or 62823d24b9a43ef1ffffff or 62823d44b9a43ef1ffffff
+       VFMADD231SS -15(BX), X24, K4, X20                  // 62e23d04b9a3f1ffffff or 62e23d24b9a3f1ffffff or 62e23d44b9a3f1ffffff
+       VFMADDSUB132PD X12, X16, K5, X20                   // 62c2fd0596e4
+       VFMADDSUB132PD 99(R15)(R15*4), X16, K5, X20        // 6282fd0596a4bf63000000
+       VFMADDSUB132PD 15(DX), X16, K5, X20                // 62e2fd0596a20f000000
+       VFMADDSUB132PD Y9, Y20, K7, Y20                    // 62c2dd2796e1
+       VFMADDSUB132PD 7(SI)(DI*1), Y20, K7, Y20           // 62e2dd2796a43e07000000
+       VFMADDSUB132PD 15(DX)(BX*8), Y20, K7, Y20          // 62e2dd2796a4da0f000000
+       VFMADDSUB132PD Z13, Z1, K7, Z6                     // 62d2f54f96f5
+       VFMADDSUB132PD Z13, Z15, K7, Z6                    // 62d2854f96f5
+       VFMADDSUB132PD Z13, Z1, K7, Z22                    // 62c2f54f96f5
+       VFMADDSUB132PD Z13, Z15, K7, Z22                   // 62c2854f96f5
+       VFMADDSUB132PD Z2, Z22, K6, Z18                    // 62e2cd4696d2
+       VFMADDSUB132PD Z31, Z22, K6, Z18                   // 6282cd4696d7
+       VFMADDSUB132PD (SI), Z22, K6, Z18                  // 62e2cd469616
+       VFMADDSUB132PD 7(SI)(DI*2), Z22, K6, Z18           // 62e2cd4696947e07000000
+       VFMADDSUB132PD Z2, Z7, K6, Z18                     // 62e2c54e96d2
+       VFMADDSUB132PD Z31, Z7, K6, Z18                    // 6282c54e96d7
+       VFMADDSUB132PD (SI), Z7, K6, Z18                   // 62e2c54e9616
+       VFMADDSUB132PD 7(SI)(DI*2), Z7, K6, Z18            // 62e2c54e96947e07000000
+       VFMADDSUB132PD Z2, Z22, K6, Z8                     // 6272cd4696c2
+       VFMADDSUB132PD Z31, Z22, K6, Z8                    // 6212cd4696c7
+       VFMADDSUB132PD (SI), Z22, K6, Z8                   // 6272cd469606
+       VFMADDSUB132PD 7(SI)(DI*2), Z22, K6, Z8            // 6272cd4696847e07000000
+       VFMADDSUB132PD Z2, Z7, K6, Z8                      // 6272c54e96c2
+       VFMADDSUB132PD Z31, Z7, K6, Z8                     // 6212c54e96c7
+       VFMADDSUB132PD (SI), Z7, K6, Z8                    // 6272c54e9606
+       VFMADDSUB132PD 7(SI)(DI*2), Z7, K6, Z8             // 6272c54e96847e07000000
+       VFMADDSUB132PS X28, X17, K3, X6                    // 6292750396f4
+       VFMADDSUB132PS (CX), X17, K3, X6                   // 62f275039631
+       VFMADDSUB132PS 99(R15), X17, K3, X6                // 62d2750396b763000000
+       VFMADDSUB132PS Y1, Y28, K7, Y28                    // 62621d2796e1
+       VFMADDSUB132PS -7(DI)(R8*1), Y28, K7, Y28          // 62221d2796a407f9ffffff
+       VFMADDSUB132PS (SP), Y28, K7, Y28                  // 62621d27962424
+       VFMADDSUB132PS Z12, Z1, K4, Z20                    // 62c2754c96e4
+       VFMADDSUB132PS Z16, Z1, K4, Z20                    // 62a2754c96e0
+       VFMADDSUB132PS Z12, Z3, K4, Z20                    // 62c2654c96e4
+       VFMADDSUB132PS Z16, Z3, K4, Z20                    // 62a2654c96e0
+       VFMADDSUB132PS Z12, Z1, K4, Z9                     // 6252754c96cc
+       VFMADDSUB132PS Z16, Z1, K4, Z9                     // 6232754c96c8
+       VFMADDSUB132PS Z12, Z3, K4, Z9                     // 6252654c96cc
+       VFMADDSUB132PS Z16, Z3, K4, Z9                     // 6232654c96c8
+       VFMADDSUB132PS Z3, Z14, K4, Z28                    // 62620d4c96e3
+       VFMADDSUB132PS Z12, Z14, K4, Z28                   // 62420d4c96e4
+       VFMADDSUB132PS 17(SP)(BP*8), Z14, K4, Z28          // 62620d4c96a4ec11000000
+       VFMADDSUB132PS 17(SP)(BP*4), Z14, K4, Z28          // 62620d4c96a4ac11000000
+       VFMADDSUB132PS Z3, Z28, K4, Z28                    // 62621d4496e3
+       VFMADDSUB132PS Z12, Z28, K4, Z28                   // 62421d4496e4
+       VFMADDSUB132PS 17(SP)(BP*8), Z28, K4, Z28          // 62621d4496a4ec11000000
+       VFMADDSUB132PS 17(SP)(BP*4), Z28, K4, Z28          // 62621d4496a4ac11000000
+       VFMADDSUB132PS Z3, Z14, K4, Z13                    // 62720d4c96eb
+       VFMADDSUB132PS Z12, Z14, K4, Z13                   // 62520d4c96ec
+       VFMADDSUB132PS 17(SP)(BP*8), Z14, K4, Z13          // 62720d4c96acec11000000
+       VFMADDSUB132PS 17(SP)(BP*4), Z14, K4, Z13          // 62720d4c96acac11000000
+       VFMADDSUB132PS Z3, Z28, K4, Z13                    // 62721d4496eb
+       VFMADDSUB132PS Z12, Z28, K4, Z13                   // 62521d4496ec
+       VFMADDSUB132PS 17(SP)(BP*8), Z28, K4, Z13          // 62721d4496acec11000000
+       VFMADDSUB132PS 17(SP)(BP*4), Z28, K4, Z13          // 62721d4496acac11000000
+       VFMADDSUB213PD X8, X1, K7, X6                      // 62d2f50fa6f0
+       VFMADDSUB213PD 99(R15)(R15*2), X1, K7, X6          // 6292f50fa6b47f63000000
+       VFMADDSUB213PD -7(DI), X1, K7, X6                  // 62f2f50fa6b7f9ffffff
+       VFMADDSUB213PD Y27, Y11, K2, Y8                    // 6212a52aa6c3
+       VFMADDSUB213PD -7(CX), Y11, K2, Y8                 // 6272a52aa681f9ffffff
+       VFMADDSUB213PD 15(DX)(BX*4), Y11, K2, Y8           // 6272a52aa6849a0f000000
+       VFMADDSUB213PD Z5, Z19, K5, Z15                    // 6272e545a6fd
+       VFMADDSUB213PD Z1, Z19, K5, Z15                    // 6272e545a6f9
+       VFMADDSUB213PD Z5, Z15, K5, Z15                    // 6272854da6fd
+       VFMADDSUB213PD Z1, Z15, K5, Z15                    // 6272854da6f9
+       VFMADDSUB213PD Z5, Z19, K5, Z30                    // 6262e545a6f5
+       VFMADDSUB213PD Z1, Z19, K5, Z30                    // 6262e545a6f1
+       VFMADDSUB213PD Z5, Z15, K5, Z30                    // 6262854da6f5
+       VFMADDSUB213PD Z1, Z15, K5, Z30                    // 6262854da6f1
+       VFMADDSUB213PD Z21, Z14, K3, Z3                    // 62b28d4ba6dd
+       VFMADDSUB213PD Z8, Z14, K3, Z3                     // 62d28d4ba6d8
+       VFMADDSUB213PD 7(SI)(DI*4), Z14, K3, Z3            // 62f28d4ba69cbe07000000
+       VFMADDSUB213PD -7(DI)(R8*2), Z14, K3, Z3           // 62b28d4ba69c47f9ffffff
+       VFMADDSUB213PD Z21, Z15, K3, Z3                    // 62b2854ba6dd
+       VFMADDSUB213PD Z8, Z15, K3, Z3                     // 62d2854ba6d8
+       VFMADDSUB213PD 7(SI)(DI*4), Z15, K3, Z3            // 62f2854ba69cbe07000000
+       VFMADDSUB213PD -7(DI)(R8*2), Z15, K3, Z3           // 62b2854ba69c47f9ffffff
+       VFMADDSUB213PD Z21, Z14, K3, Z5                    // 62b28d4ba6ed
+       VFMADDSUB213PD Z8, Z14, K3, Z5                     // 62d28d4ba6e8
+       VFMADDSUB213PD 7(SI)(DI*4), Z14, K3, Z5            // 62f28d4ba6acbe07000000
+       VFMADDSUB213PD -7(DI)(R8*2), Z14, K3, Z5           // 62b28d4ba6ac47f9ffffff
+       VFMADDSUB213PD Z21, Z15, K3, Z5                    // 62b2854ba6ed
+       VFMADDSUB213PD Z8, Z15, K3, Z5                     // 62d2854ba6e8
+       VFMADDSUB213PD 7(SI)(DI*4), Z15, K3, Z5            // 62f2854ba6acbe07000000
+       VFMADDSUB213PD -7(DI)(R8*2), Z15, K3, Z5           // 62b2854ba6ac47f9ffffff
+       VFMADDSUB213PS X0, X6, K4, X8                      // 62724d0ca6c0
+       VFMADDSUB213PS -7(CX)(DX*1), X6, K4, X8            // 62724d0ca68411f9ffffff
+       VFMADDSUB213PS -15(R14)(R15*4), X6, K4, X8         // 62124d0ca684bef1ffffff
+       VFMADDSUB213PS Y12, Y16, K2, Y17                   // 62c27d22a6cc
+       VFMADDSUB213PS 99(R15)(R15*8), Y16, K2, Y17        // 62827d22a68cff63000000
+       VFMADDSUB213PS 7(AX)(CX*8), Y16, K2, Y17           // 62e27d22a68cc807000000
+       VFMADDSUB213PS Z23, Z20, K2, Z16                   // 62a25d42a6c7
+       VFMADDSUB213PS Z19, Z20, K2, Z16                   // 62a25d42a6c3
+       VFMADDSUB213PS Z23, Z0, K2, Z16                    // 62a27d4aa6c7
+       VFMADDSUB213PS Z19, Z0, K2, Z16                    // 62a27d4aa6c3
+       VFMADDSUB213PS Z23, Z20, K2, Z9                    // 62325d42a6cf
+       VFMADDSUB213PS Z19, Z20, K2, Z9                    // 62325d42a6cb
+       VFMADDSUB213PS Z23, Z0, K2, Z9                     // 62327d4aa6cf
+       VFMADDSUB213PS Z19, Z0, K2, Z9                     // 62327d4aa6cb
+       VFMADDSUB213PS Z24, Z0, K3, Z0                     // 62927d4ba6c0
+       VFMADDSUB213PS Z12, Z0, K3, Z0                     // 62d27d4ba6c4
+       VFMADDSUB213PS 17(SP), Z0, K3, Z0                  // 62f27d4ba6842411000000
+       VFMADDSUB213PS -17(BP)(SI*4), Z0, K3, Z0           // 62f27d4ba684b5efffffff
+       VFMADDSUB213PS Z24, Z25, K3, Z0                    // 62923543a6c0
+       VFMADDSUB213PS Z12, Z25, K3, Z0                    // 62d23543a6c4
+       VFMADDSUB213PS 17(SP), Z25, K3, Z0                 // 62f23543a6842411000000
+       VFMADDSUB213PS -17(BP)(SI*4), Z25, K3, Z0          // 62f23543a684b5efffffff
+       VFMADDSUB213PS Z24, Z0, K3, Z11                    // 62127d4ba6d8
+       VFMADDSUB213PS Z12, Z0, K3, Z11                    // 62527d4ba6dc
+       VFMADDSUB213PS 17(SP), Z0, K3, Z11                 // 62727d4ba69c2411000000
+       VFMADDSUB213PS -17(BP)(SI*4), Z0, K3, Z11          // 62727d4ba69cb5efffffff
+       VFMADDSUB213PS Z24, Z25, K3, Z11                   // 62123543a6d8
+       VFMADDSUB213PS Z12, Z25, K3, Z11                   // 62523543a6dc
+       VFMADDSUB213PS 17(SP), Z25, K3, Z11                // 62723543a69c2411000000
+       VFMADDSUB213PS -17(BP)(SI*4), Z25, K3, Z11         // 62723543a69cb5efffffff
+       VFMADDSUB231PD X6, X16, K3, X11                    // 6272fd03b6de
+       VFMADDSUB231PD 15(DX)(BX*1), X16, K3, X11          // 6272fd03b69c1a0f000000
+       VFMADDSUB231PD -7(CX)(DX*2), X16, K3, X11          // 6272fd03b69c51f9ffffff
+       VFMADDSUB231PD Y3, Y26, K3, Y6                     // 62f2ad23b6f3
+       VFMADDSUB231PD (AX), Y26, K3, Y6                   // 62f2ad23b630
+       VFMADDSUB231PD 7(SI), Y26, K3, Y6                  // 62f2ad23b6b607000000
+       VFMADDSUB231PD Z9, Z9, K2, Z0                      // 62d2b54ab6c1
+       VFMADDSUB231PD Z25, Z9, K2, Z0                     // 6292b54ab6c1
+       VFMADDSUB231PD Z9, Z3, K2, Z0                      // 62d2e54ab6c1
+       VFMADDSUB231PD Z25, Z3, K2, Z0                     // 6292e54ab6c1
+       VFMADDSUB231PD Z9, Z9, K2, Z26                     // 6242b54ab6d1
+       VFMADDSUB231PD Z25, Z9, K2, Z26                    // 6202b54ab6d1
+       VFMADDSUB231PD Z9, Z3, K2, Z26                     // 6242e54ab6d1
+       VFMADDSUB231PD Z25, Z3, K2, Z26                    // 6202e54ab6d1
+       VFMADDSUB231PD Z17, Z20, K1, Z9                    // 6232dd41b6c9
+       VFMADDSUB231PD Z0, Z20, K1, Z9                     // 6272dd41b6c8
+       VFMADDSUB231PD 7(AX), Z20, K1, Z9                  // 6272dd41b68807000000
+       VFMADDSUB231PD (DI), Z20, K1, Z9                   // 6272dd41b60f
+       VFMADDSUB231PD Z17, Z0, K1, Z9                     // 6232fd49b6c9
+       VFMADDSUB231PD Z0, Z0, K1, Z9                      // 6272fd49b6c8
+       VFMADDSUB231PD 7(AX), Z0, K1, Z9                   // 6272fd49b68807000000
+       VFMADDSUB231PD (DI), Z0, K1, Z9                    // 6272fd49b60f
+       VFMADDSUB231PD Z17, Z20, K1, Z28                   // 6222dd41b6e1
+       VFMADDSUB231PD Z0, Z20, K1, Z28                    // 6262dd41b6e0
+       VFMADDSUB231PD 7(AX), Z20, K1, Z28                 // 6262dd41b6a007000000
+       VFMADDSUB231PD (DI), Z20, K1, Z28                  // 6262dd41b627
+       VFMADDSUB231PD Z17, Z0, K1, Z28                    // 6222fd49b6e1
+       VFMADDSUB231PD Z0, Z0, K1, Z28                     // 6262fd49b6e0
+       VFMADDSUB231PD 7(AX), Z0, K1, Z28                  // 6262fd49b6a007000000
+       VFMADDSUB231PD (DI), Z0, K1, Z28                   // 6262fd49b627
+       VFMADDSUB231PS X12, X22, K2, X6                    // 62d24d02b6f4
+       VFMADDSUB231PS -17(BP), X22, K2, X6                // 62f24d02b6b5efffffff
+       VFMADDSUB231PS -15(R14)(R15*8), X22, K2, X6        // 62924d02b6b4fef1ffffff
+       VFMADDSUB231PS Y1, Y28, K1, Y8                     // 62721d21b6c1
+       VFMADDSUB231PS (BX), Y28, K1, Y8                   // 62721d21b603
+       VFMADDSUB231PS -17(BP)(SI*1), Y28, K1, Y8          // 62721d21b68435efffffff
+       VFMADDSUB231PS Z21, Z31, K7, Z17                   // 62a20547b6cd
+       VFMADDSUB231PS Z9, Z31, K7, Z17                    // 62c20547b6c9
+       VFMADDSUB231PS Z21, Z0, K7, Z17                    // 62a27d4fb6cd
+       VFMADDSUB231PS Z9, Z0, K7, Z17                     // 62c27d4fb6c9
+       VFMADDSUB231PS Z21, Z31, K7, Z23                   // 62a20547b6fd
+       VFMADDSUB231PS Z9, Z31, K7, Z23                    // 62c20547b6f9
+       VFMADDSUB231PS Z21, Z0, K7, Z23                    // 62a27d4fb6fd
+       VFMADDSUB231PS Z9, Z0, K7, Z23                     // 62c27d4fb6f9
+       VFMADDSUB231PS Z20, Z1, K1, Z6                     // 62b27549b6f4
+       VFMADDSUB231PS Z9, Z1, K1, Z6                      // 62d27549b6f1
+       VFMADDSUB231PS 99(R15)(R15*1), Z1, K1, Z6          // 62927549b6b43f63000000
+       VFMADDSUB231PS (DX), Z1, K1, Z6                    // 62f27549b632
+       VFMADDSUB231PS Z20, Z9, K1, Z6                     // 62b23549b6f4
+       VFMADDSUB231PS Z9, Z9, K1, Z6                      // 62d23549b6f1
+       VFMADDSUB231PS 99(R15)(R15*1), Z9, K1, Z6          // 62923549b6b43f63000000
+       VFMADDSUB231PS (DX), Z9, K1, Z6                    // 62f23549b632
+       VFMADDSUB231PS Z20, Z1, K1, Z9                     // 62327549b6cc
+       VFMADDSUB231PS Z9, Z1, K1, Z9                      // 62527549b6c9
+       VFMADDSUB231PS 99(R15)(R15*1), Z1, K1, Z9          // 62127549b68c3f63000000
+       VFMADDSUB231PS (DX), Z1, K1, Z9                    // 62727549b60a
+       VFMADDSUB231PS Z20, Z9, K1, Z9                     // 62323549b6cc
+       VFMADDSUB231PS Z9, Z9, K1, Z9                      // 62523549b6c9
+       VFMADDSUB231PS 99(R15)(R15*1), Z9, K1, Z9          // 62123549b68c3f63000000
+       VFMADDSUB231PS (DX), Z9, K1, Z9                    // 62723549b60a
+       VFMSUB132PD X8, X28, K1, X16                       // 62c29d019ac0
+       VFMSUB132PD 17(SP)(BP*2), X28, K1, X16             // 62e29d019a846c11000000
+       VFMSUB132PD -7(DI)(R8*4), X28, K1, X16             // 62a29d019a8487f9ffffff
+       VFMSUB132PD Y31, Y14, K1, Y23                      // 62828d299aff
+       VFMSUB132PD 15(R8)(R14*4), Y14, K1, Y23            // 62828d299abcb00f000000
+       VFMSUB132PD -7(CX)(DX*4), Y14, K1, Y23             // 62e28d299abc91f9ffffff
+       VFMSUB132PD Z7, Z26, K7, Z30                       // 6262ad479af7
+       VFMSUB132PD Z21, Z26, K7, Z30                      // 6222ad479af5
+       VFMSUB132PD Z7, Z22, K7, Z30                       // 6262cd479af7
+       VFMSUB132PD Z21, Z22, K7, Z30                      // 6222cd479af5
+       VFMSUB132PD Z7, Z26, K7, Z5                        // 62f2ad479aef
+       VFMSUB132PD Z21, Z26, K7, Z5                       // 62b2ad479aed
+       VFMSUB132PD Z7, Z22, K7, Z5                        // 62f2cd479aef
+       VFMSUB132PD Z21, Z22, K7, Z5                       // 62b2cd479aed
+       VFMSUB132PD Z12, Z14, K2, Z16                      // 62c28d4a9ac4
+       VFMSUB132PD Z13, Z14, K2, Z16                      // 62c28d4a9ac5
+       VFMSUB132PD -17(BP)(SI*8), Z14, K2, Z16            // 62e28d4a9a84f5efffffff
+       VFMSUB132PD (R15), Z14, K2, Z16                    // 62c28d4a9a07
+       VFMSUB132PD Z12, Z13, K2, Z16                      // 62c2954a9ac4
+       VFMSUB132PD Z13, Z13, K2, Z16                      // 62c2954a9ac5
+       VFMSUB132PD -17(BP)(SI*8), Z13, K2, Z16            // 62e2954a9a84f5efffffff
+       VFMSUB132PD (R15), Z13, K2, Z16                    // 62c2954a9a07
+       VFMSUB132PD Z12, Z14, K2, Z25                      // 62428d4a9acc
+       VFMSUB132PD Z13, Z14, K2, Z25                      // 62428d4a9acd
+       VFMSUB132PD -17(BP)(SI*8), Z14, K2, Z25            // 62628d4a9a8cf5efffffff
+       VFMSUB132PD (R15), Z14, K2, Z25                    // 62428d4a9a0f
+       VFMSUB132PD Z12, Z13, K2, Z25                      // 6242954a9acc
+       VFMSUB132PD Z13, Z13, K2, Z25                      // 6242954a9acd
+       VFMSUB132PD -17(BP)(SI*8), Z13, K2, Z25            // 6262954a9a8cf5efffffff
+       VFMSUB132PD (R15), Z13, K2, Z25                    // 6242954a9a0f
+       VFMSUB132PS X1, X11, K4, X15                       // 6272250c9af9
+       VFMSUB132PS 15(R8), X11, K4, X15                   // 6252250c9ab80f000000
+       VFMSUB132PS (BP), X11, K4, X15                     // 6272250c9a7d00
+       VFMSUB132PS Y22, Y2, K1, Y25                       // 62226d299ace
+       VFMSUB132PS (R8), Y2, K1, Y25                      // 62426d299a08
+       VFMSUB132PS 15(DX)(BX*2), Y2, K1, Y25              // 62626d299a8c5a0f000000
+       VFMSUB132PS Z27, Z2, K3, Z21                       // 62826d4b9aeb
+       VFMSUB132PS Z25, Z2, K3, Z21                       // 62826d4b9ae9
+       VFMSUB132PS Z27, Z7, K3, Z21                       // 6282454b9aeb
+       VFMSUB132PS Z25, Z7, K3, Z21                       // 6282454b9ae9
+       VFMSUB132PS Z27, Z2, K3, Z9                        // 62126d4b9acb
+       VFMSUB132PS Z25, Z2, K3, Z9                        // 62126d4b9ac9
+       VFMSUB132PS Z27, Z7, K3, Z9                        // 6212454b9acb
+       VFMSUB132PS Z25, Z7, K3, Z9                        // 6212454b9ac9
+       VFMSUB132PS Z3, Z27, K4, Z23                       // 62e225449afb
+       VFMSUB132PS Z0, Z27, K4, Z23                       // 62e225449af8
+       VFMSUB132PS 7(SI)(DI*8), Z27, K4, Z23              // 62e225449abcfe07000000
+       VFMSUB132PS -15(R14), Z27, K4, Z23                 // 62c225449abef1ffffff
+       VFMSUB132PS Z3, Z14, K4, Z23                       // 62e20d4c9afb
+       VFMSUB132PS Z0, Z14, K4, Z23                       // 62e20d4c9af8
+       VFMSUB132PS 7(SI)(DI*8), Z14, K4, Z23              // 62e20d4c9abcfe07000000
+       VFMSUB132PS -15(R14), Z14, K4, Z23                 // 62c20d4c9abef1ffffff
+       VFMSUB132PS Z3, Z27, K4, Z9                        // 627225449acb
+       VFMSUB132PS Z0, Z27, K4, Z9                        // 627225449ac8
+       VFMSUB132PS 7(SI)(DI*8), Z27, K4, Z9               // 627225449a8cfe07000000
+       VFMSUB132PS -15(R14), Z27, K4, Z9                  // 625225449a8ef1ffffff
+       VFMSUB132PS Z3, Z14, K4, Z9                        // 62720d4c9acb
+       VFMSUB132PS Z0, Z14, K4, Z9                        // 62720d4c9ac8
+       VFMSUB132PS 7(SI)(DI*8), Z14, K4, Z9               // 62720d4c9a8cfe07000000
+       VFMSUB132PS -15(R14), Z14, K4, Z9                  // 62520d4c9a8ef1ffffff
+       VFMSUB132SD X2, X13, K5, X19                       // 62e2950d9bda
+       VFMSUB132SD X0, X0, K7, X14                        // 6272fd0f9bf0 or 6272fd2f9bf0 or 6272fd4f9bf0
+       VFMSUB132SD 7(AX), X0, K7, X14                     // 6272fd0f9bb007000000 or 6272fd2f9bb007000000 or 6272fd4f9bb007000000
+       VFMSUB132SD (DI), X0, K7, X14                      // 6272fd0f9b37 or 6272fd2f9b37 or 6272fd4f9b37
+       VFMSUB132SS X17, X11, K7, X25                      // 6222250f9bc9
+       VFMSUB132SS X9, X11, K6, X18                       // 62c2250e9bd1 or 62c2252e9bd1 or 62c2254e9bd1
+       VFMSUB132SS 7(AX)(CX*4), X11, K6, X18              // 62e2250e9b948807000000 or 62e2252e9b948807000000 or 62e2254e9b948807000000
+       VFMSUB132SS 7(AX)(CX*1), X11, K6, X18              // 62e2250e9b940807000000 or 62e2252e9b940807000000 or 62e2254e9b940807000000
+       VFMSUB213PD X2, X24, K3, X2                        // 62f2bd03aad2
+       VFMSUB213PD 15(R8)(R14*8), X24, K3, X2             // 6292bd03aa94f00f000000
+       VFMSUB213PD -15(R14)(R15*2), X24, K3, X2           // 6292bd03aa947ef1ffffff
+       VFMSUB213PD Y9, Y8, K7, Y27                        // 6242bd2faad9
+       VFMSUB213PD 17(SP)(BP*1), Y8, K7, Y27              // 6262bd2faa9c2c11000000
+       VFMSUB213PD -7(CX)(DX*8), Y8, K7, Y27              // 6262bd2faa9cd1f9ffffff
+       VFMSUB213PD Z22, Z8, K4, Z14                       // 6232bd4caaf6
+       VFMSUB213PD Z25, Z8, K4, Z14                       // 6212bd4caaf1
+       VFMSUB213PD Z22, Z24, K4, Z14                      // 6232bd44aaf6
+       VFMSUB213PD Z25, Z24, K4, Z14                      // 6212bd44aaf1
+       VFMSUB213PD Z22, Z8, K4, Z7                        // 62b2bd4caafe
+       VFMSUB213PD Z25, Z8, K4, Z7                        // 6292bd4caaf9
+       VFMSUB213PD Z22, Z24, K4, Z7                       // 62b2bd44aafe
+       VFMSUB213PD Z25, Z24, K4, Z7                       // 6292bd44aaf9
+       VFMSUB213PD Z0, Z6, K4, Z1                         // 62f2cd4caac8
+       VFMSUB213PD Z8, Z6, K4, Z1                         // 62d2cd4caac8
+       VFMSUB213PD 7(SI)(DI*1), Z6, K4, Z1                // 62f2cd4caa8c3e07000000
+       VFMSUB213PD 15(DX)(BX*8), Z6, K4, Z1               // 62f2cd4caa8cda0f000000
+       VFMSUB213PD Z0, Z2, K4, Z1                         // 62f2ed4caac8
+       VFMSUB213PD Z8, Z2, K4, Z1                         // 62d2ed4caac8
+       VFMSUB213PD 7(SI)(DI*1), Z2, K4, Z1                // 62f2ed4caa8c3e07000000
+       VFMSUB213PD 15(DX)(BX*8), Z2, K4, Z1               // 62f2ed4caa8cda0f000000
+       VFMSUB213PD Z0, Z6, K4, Z16                        // 62e2cd4caac0
+       VFMSUB213PD Z8, Z6, K4, Z16                        // 62c2cd4caac0
+       VFMSUB213PD 7(SI)(DI*1), Z6, K4, Z16               // 62e2cd4caa843e07000000
+       VFMSUB213PD 15(DX)(BX*8), Z6, K4, Z16              // 62e2cd4caa84da0f000000
+       VFMSUB213PD Z0, Z2, K4, Z16                        // 62e2ed4caac0
+       VFMSUB213PD Z8, Z2, K4, Z16                        // 62c2ed4caac0
+       VFMSUB213PD 7(SI)(DI*1), Z2, K4, Z16               // 62e2ed4caa843e07000000
+       VFMSUB213PD 15(DX)(BX*8), Z2, K4, Z16              // 62e2ed4caa84da0f000000
+       VFMSUB213PS X26, X27, K7, X2                       // 62922507aad2
+       VFMSUB213PS -15(R14)(R15*1), X27, K7, X2           // 62922507aa943ef1ffffff
+       VFMSUB213PS -15(BX), X27, K7, X2                   // 62f22507aa93f1ffffff
+       VFMSUB213PS Y14, Y9, K2, Y22                       // 62c2352aaaf6
+       VFMSUB213PS -17(BP)(SI*2), Y9, K2, Y22             // 62e2352aaab475efffffff
+       VFMSUB213PS 7(AX)(CX*2), Y9, K2, Y22               // 62e2352aaab44807000000
+       VFMSUB213PS Z11, Z14, K5, Z15                      // 62520d4daafb
+       VFMSUB213PS Z5, Z14, K5, Z15                       // 62720d4daafd
+       VFMSUB213PS Z11, Z27, K5, Z15                      // 62522545aafb
+       VFMSUB213PS Z5, Z27, K5, Z15                       // 62722545aafd
+       VFMSUB213PS Z11, Z14, K5, Z12                      // 62520d4daae3
+       VFMSUB213PS Z5, Z14, K5, Z12                       // 62720d4daae5
+       VFMSUB213PS Z11, Z27, K5, Z12                      // 62522545aae3
+       VFMSUB213PS Z5, Z27, K5, Z12                       // 62722545aae5
+       VFMSUB213PS Z2, Z5, K3, Z13                        // 6272554baaea
+       VFMSUB213PS -7(DI)(R8*1), Z5, K3, Z13              // 6232554baaac07f9ffffff
+       VFMSUB213PS (SP), Z5, K3, Z13                      // 6272554baa2c24
+       VFMSUB213PS Z2, Z23, K3, Z13                       // 62724543aaea
+       VFMSUB213PS -7(DI)(R8*1), Z23, K3, Z13             // 62324543aaac07f9ffffff
+       VFMSUB213PS (SP), Z23, K3, Z13                     // 62724543aa2c24
+       VFMSUB213PS Z2, Z5, K3, Z14                        // 6272554baaf2
+       VFMSUB213PS -7(DI)(R8*1), Z5, K3, Z14              // 6232554baab407f9ffffff
+       VFMSUB213PS (SP), Z5, K3, Z14                      // 6272554baa3424
+       VFMSUB213PS Z2, Z23, K3, Z14                       // 62724543aaf2
+       VFMSUB213PS -7(DI)(R8*1), Z23, K3, Z14             // 62324543aab407f9ffffff
+       VFMSUB213PS (SP), Z23, K3, Z14                     // 62724543aa3424
+       VFMSUB213SD X3, X30, K4, X22                       // 62e28d04abf3
+       VFMSUB213SD X30, X15, K2, X11                      // 6212850aabde or 6212852aabde or 6212854aabde
+       VFMSUB213SD 99(R15)(R15*1), X15, K2, X11           // 6212850aab9c3f63000000 or 6212852aab9c3f63000000 or 6212854aab9c3f63000000
+       VFMSUB213SD (DX), X15, K2, X11                     // 6272850aab1a or 6272852aab1a or 6272854aab1a
+       VFMSUB213SS X12, X6, K2, X13                       // 62524d0aabec
+       VFMSUB213SS X8, X30, K3, X23                       // 62c20d03abf8 or 62c20d23abf8 or 62c20d43abf8
+       VFMSUB213SS (SI), X30, K3, X23                     // 62e20d03ab3e or 62e20d23ab3e or 62e20d43ab3e
+       VFMSUB213SS 7(SI)(DI*2), X30, K3, X23              // 62e20d03abbc7e07000000 or 62e20d23abbc7e07000000 or 62e20d43abbc7e07000000
+       VFMSUB231PD X9, X2, K3, X20                        // 62c2ed0bbae1
+       VFMSUB231PD 7(AX)(CX*4), X2, K3, X20               // 62e2ed0bbaa48807000000
+       VFMSUB231PD 7(AX)(CX*1), X2, K3, X20               // 62e2ed0bbaa40807000000
+       VFMSUB231PD Y1, Y6, K3, Y1                         // 62f2cd2bbac9
+       VFMSUB231PD 15(R8)(R14*1), Y6, K3, Y1              // 6292cd2bba8c300f000000
+       VFMSUB231PD 15(R8)(R14*2), Y6, K3, Y1              // 6292cd2bba8c700f000000
+       VFMSUB231PD Z28, Z26, K2, Z6                       // 6292ad42baf4
+       VFMSUB231PD Z6, Z26, K2, Z6                        // 62f2ad42baf6
+       VFMSUB231PD Z28, Z14, K2, Z6                       // 62928d4abaf4
+       VFMSUB231PD Z6, Z14, K2, Z6                        // 62f28d4abaf6
+       VFMSUB231PD Z28, Z26, K2, Z14                      // 6212ad42baf4
+       VFMSUB231PD Z6, Z26, K2, Z14                       // 6272ad42baf6
+       VFMSUB231PD Z28, Z14, K2, Z14                      // 62128d4abaf4
+       VFMSUB231PD Z6, Z14, K2, Z14                       // 62728d4abaf6
+       VFMSUB231PD Z3, Z26, K1, Z13                       // 6272ad41baeb
+       VFMSUB231PD Z0, Z26, K1, Z13                       // 6272ad41bae8
+       VFMSUB231PD -7(CX), Z26, K1, Z13                   // 6272ad41baa9f9ffffff
+       VFMSUB231PD 15(DX)(BX*4), Z26, K1, Z13             // 6272ad41baac9a0f000000
+       VFMSUB231PD Z3, Z3, K1, Z13                        // 6272e549baeb
+       VFMSUB231PD Z0, Z3, K1, Z13                        // 6272e549bae8
+       VFMSUB231PD -7(CX), Z3, K1, Z13                    // 6272e549baa9f9ffffff
+       VFMSUB231PD 15(DX)(BX*4), Z3, K1, Z13              // 6272e549baac9a0f000000
+       VFMSUB231PD Z3, Z26, K1, Z21                       // 62e2ad41baeb
+       VFMSUB231PD Z0, Z26, K1, Z21                       // 62e2ad41bae8
+       VFMSUB231PD -7(CX), Z26, K1, Z21                   // 62e2ad41baa9f9ffffff
+       VFMSUB231PD 15(DX)(BX*4), Z26, K1, Z21             // 62e2ad41baac9a0f000000
+       VFMSUB231PD Z3, Z3, K1, Z21                        // 62e2e549baeb
+       VFMSUB231PD Z0, Z3, K1, Z21                        // 62e2e549bae8
+       VFMSUB231PD -7(CX), Z3, K1, Z21                    // 62e2e549baa9f9ffffff
+       VFMSUB231PD 15(DX)(BX*4), Z3, K1, Z21              // 62e2e549baac9a0f000000
+       VFMSUB231PS X0, X19, K2, X26                       // 62626502bad0
+       VFMSUB231PS (SI), X19, K2, X26                     // 62626502ba16
+       VFMSUB231PS 7(SI)(DI*2), X19, K2, X26              // 62626502ba947e07000000
+       VFMSUB231PS Y19, Y0, K1, Y9                        // 62327d29bacb
+       VFMSUB231PS (R14), Y0, K1, Y9                      // 62527d29ba0e
+       VFMSUB231PS -7(DI)(R8*8), Y0, K1, Y9               // 62327d29ba8cc7f9ffffff
+       VFMSUB231PS Z3, Z11, K7, Z21                       // 62e2254fbaeb
+       VFMSUB231PS Z12, Z11, K7, Z21                      // 62c2254fbaec
+       VFMSUB231PS Z3, Z25, K7, Z21                       // 62e23547baeb
+       VFMSUB231PS Z12, Z25, K7, Z21                      // 62c23547baec
+       VFMSUB231PS Z3, Z11, K7, Z13                       // 6272254fbaeb
+       VFMSUB231PS Z12, Z11, K7, Z13                      // 6252254fbaec
+       VFMSUB231PS Z3, Z25, K7, Z13                       // 62723547baeb
+       VFMSUB231PS Z12, Z25, K7, Z13                      // 62523547baec
+       VFMSUB231PS Z23, Z23, K1, Z27                      // 62224541badf
+       VFMSUB231PS Z6, Z23, K1, Z27                       // 62624541bade
+       VFMSUB231PS 99(R15)(R15*8), Z23, K1, Z27           // 62024541ba9cff63000000
+       VFMSUB231PS 7(AX)(CX*8), Z23, K1, Z27              // 62624541ba9cc807000000
+       VFMSUB231PS Z23, Z5, K1, Z27                       // 62225549badf
+       VFMSUB231PS Z6, Z5, K1, Z27                        // 62625549bade
+       VFMSUB231PS 99(R15)(R15*8), Z5, K1, Z27            // 62025549ba9cff63000000
+       VFMSUB231PS 7(AX)(CX*8), Z5, K1, Z27               // 62625549ba9cc807000000
+       VFMSUB231PS Z23, Z23, K1, Z15                      // 62324541baff
+       VFMSUB231PS Z6, Z23, K1, Z15                       // 62724541bafe
+       VFMSUB231PS 99(R15)(R15*8), Z23, K1, Z15           // 62124541babcff63000000
+       VFMSUB231PS 7(AX)(CX*8), Z23, K1, Z15              // 62724541babcc807000000
+       VFMSUB231PS Z23, Z5, K1, Z15                       // 62325549baff
+       VFMSUB231PS Z6, Z5, K1, Z15                        // 62725549bafe
+       VFMSUB231PS 99(R15)(R15*8), Z5, K1, Z15            // 62125549babcff63000000
+       VFMSUB231PS 7(AX)(CX*8), Z5, K1, Z15               // 62725549babcc807000000
+       VFMSUB231SD X7, X16, K1, X31                       // 6262fd01bbff
+       VFMSUB231SD X0, X1, K1, X8                         // 6272f509bbc0 or 6272f529bbc0 or 6272f549bbc0
+       VFMSUB231SD -17(BP)(SI*8), X1, K1, X8              // 6272f509bb84f5efffffff or 6272f529bb84f5efffffff or 6272f549bb84f5efffffff
+       VFMSUB231SD (R15), X1, K1, X8                      // 6252f509bb07 or 6252f529bb07 or 6252f549bb07
+       VFMSUB231SS X16, X0, K7, X15                       // 62327d0fbbf8
+       VFMSUB231SS X28, X0, K2, X21                       // 62827d0abbec or 62827d2abbec or 62827d4abbec
+       VFMSUB231SS 17(SP)(BP*8), X0, K2, X21              // 62e27d0abbacec11000000 or 62e27d2abbacec11000000 or 62e27d4abbacec11000000
+       VFMSUB231SS 17(SP)(BP*4), X0, K2, X21              // 62e27d0abbacac11000000 or 62e27d2abbacac11000000 or 62e27d4abbacac11000000
+       VFMSUBADD132PD X19, X7, K4, X22                    // 62a2c50c97f3
+       VFMSUBADD132PD 17(SP)(BP*8), X7, K4, X22           // 62e2c50c97b4ec11000000
+       VFMSUBADD132PD 17(SP)(BP*4), X7, K4, X22           // 62e2c50c97b4ac11000000
+       VFMSUBADD132PD Y9, Y22, K1, Y31                    // 6242cd2197f9
+       VFMSUBADD132PD 99(R15)(R15*4), Y22, K1, Y31        // 6202cd2197bcbf63000000
+       VFMSUBADD132PD 15(DX), Y22, K1, Y31                // 6262cd2197ba0f000000
+       VFMSUBADD132PD Z16, Z21, K3, Z8                    // 6232d54397c0
+       VFMSUBADD132PD Z13, Z21, K3, Z8                    // 6252d54397c5
+       VFMSUBADD132PD Z16, Z5, K3, Z8                     // 6232d54b97c0
+       VFMSUBADD132PD Z13, Z5, K3, Z8                     // 6252d54b97c5
+       VFMSUBADD132PD Z16, Z21, K3, Z28                   // 6222d54397e0
+       VFMSUBADD132PD Z13, Z21, K3, Z28                   // 6242d54397e5
+       VFMSUBADD132PD Z16, Z5, K3, Z28                    // 6222d54b97e0
+       VFMSUBADD132PD Z13, Z5, K3, Z28                    // 6242d54b97e5
+       VFMSUBADD132PD Z6, Z22, K4, Z12                    // 6272cd4497e6
+       VFMSUBADD132PD Z8, Z22, K4, Z12                    // 6252cd4497e0
+       VFMSUBADD132PD (AX), Z22, K4, Z12                  // 6272cd449720
+       VFMSUBADD132PD 7(SI), Z22, K4, Z12                 // 6272cd4497a607000000
+       VFMSUBADD132PD Z6, Z11, K4, Z12                    // 6272a54c97e6
+       VFMSUBADD132PD Z8, Z11, K4, Z12                    // 6252a54c97e0
+       VFMSUBADD132PD (AX), Z11, K4, Z12                  // 6272a54c9720
+       VFMSUBADD132PD 7(SI), Z11, K4, Z12                 // 6272a54c97a607000000
+       VFMSUBADD132PD Z6, Z22, K4, Z27                    // 6262cd4497de
+       VFMSUBADD132PD Z8, Z22, K4, Z27                    // 6242cd4497d8
+       VFMSUBADD132PD (AX), Z22, K4, Z27                  // 6262cd449718
+       VFMSUBADD132PD 7(SI), Z22, K4, Z27                 // 6262cd44979e07000000
+       VFMSUBADD132PD Z6, Z11, K4, Z27                    // 6262a54c97de
+       VFMSUBADD132PD Z8, Z11, K4, Z27                    // 6242a54c97d8
+       VFMSUBADD132PD (AX), Z11, K4, Z27                  // 6262a54c9718
+       VFMSUBADD132PD 7(SI), Z11, K4, Z27                 // 6262a54c979e07000000
+       VFMSUBADD132PS X31, X16, K5, X7                    // 62927d0597ff
+       VFMSUBADD132PS 7(SI)(DI*4), X16, K5, X7            // 62f27d0597bcbe07000000
+       VFMSUBADD132PS -7(DI)(R8*2), X16, K5, X7           // 62b27d0597bc47f9ffffff
+       VFMSUBADD132PS Y5, Y31, K7, Y23                    // 62e2052797fd
+       VFMSUBADD132PS (CX), Y31, K7, Y23                  // 62e205279739
+       VFMSUBADD132PS 99(R15), Y31, K7, Y23               // 62c2052797bf63000000
+       VFMSUBADD132PS Z9, Z12, K7, Z25                    // 62421d4f97c9
+       VFMSUBADD132PS Z12, Z12, K7, Z25                   // 62421d4f97cc
+       VFMSUBADD132PS Z9, Z17, K7, Z25                    // 6242754797c9
+       VFMSUBADD132PS Z12, Z17, K7, Z25                   // 6242754797cc
+       VFMSUBADD132PS Z9, Z12, K7, Z12                    // 62521d4f97e1
+       VFMSUBADD132PS Z12, Z12, K7, Z12                   // 62521d4f97e4
+       VFMSUBADD132PS Z9, Z17, K7, Z12                    // 6252754797e1
+       VFMSUBADD132PS Z12, Z17, K7, Z12                   // 6252754797e4
+       VFMSUBADD132PS Z8, Z3, K6, Z6                      // 62d2654e97f0
+       VFMSUBADD132PS Z2, Z3, K6, Z6                      // 62f2654e97f2
+       VFMSUBADD132PS (BX), Z3, K6, Z6                    // 62f2654e9733
+       VFMSUBADD132PS -17(BP)(SI*1), Z3, K6, Z6           // 62f2654e97b435efffffff
+       VFMSUBADD132PS Z8, Z21, K6, Z6                     // 62d2554697f0
+       VFMSUBADD132PS Z2, Z21, K6, Z6                     // 62f2554697f2
+       VFMSUBADD132PS (BX), Z21, K6, Z6                   // 62f255469733
+       VFMSUBADD132PS -17(BP)(SI*1), Z21, K6, Z6          // 62f2554697b435efffffff
+       VFMSUBADD132PS Z8, Z3, K6, Z25                     // 6242654e97c8
+       VFMSUBADD132PS Z2, Z3, K6, Z25                     // 6262654e97ca
+       VFMSUBADD132PS (BX), Z3, K6, Z25                   // 6262654e970b
+       VFMSUBADD132PS -17(BP)(SI*1), Z3, K6, Z25          // 6262654e978c35efffffff
+       VFMSUBADD132PS Z8, Z21, K6, Z25                    // 6242554697c8
+       VFMSUBADD132PS Z2, Z21, K6, Z25                    // 6262554697ca
+       VFMSUBADD132PS (BX), Z21, K6, Z25                  // 62625546970b
+       VFMSUBADD132PS -17(BP)(SI*1), Z21, K6, Z25         // 62625546978c35efffffff
+       VFMSUBADD213PD X9, X7, K3, X1                      // 62d2c50ba7c9
+       VFMSUBADD213PD 17(SP), X7, K3, X1                  // 62f2c50ba78c2411000000
+       VFMSUBADD213PD -17(BP)(SI*4), X7, K3, X1           // 62f2c50ba78cb5efffffff
+       VFMSUBADD213PD Y19, Y5, K7, Y0                     // 62b2d52fa7c3
+       VFMSUBADD213PD 99(R15)(R15*2), Y5, K7, Y0          // 6292d52fa7847f63000000
+       VFMSUBADD213PD -7(DI), Y5, K7, Y0                  // 62f2d52fa787f9ffffff
+       VFMSUBADD213PD Z0, Z7, K4, Z3                      // 62f2c54ca7d8
+       VFMSUBADD213PD Z6, Z7, K4, Z3                      // 62f2c54ca7de
+       VFMSUBADD213PD Z0, Z9, K4, Z3                      // 62f2b54ca7d8
+       VFMSUBADD213PD Z6, Z9, K4, Z3                      // 62f2b54ca7de
+       VFMSUBADD213PD Z0, Z7, K4, Z27                     // 6262c54ca7d8
+       VFMSUBADD213PD Z6, Z7, K4, Z27                     // 6262c54ca7de
+       VFMSUBADD213PD Z0, Z9, K4, Z27                     // 6262b54ca7d8
+       VFMSUBADD213PD Z6, Z9, K4, Z27                     // 6262b54ca7de
+       VFMSUBADD213PD Z9, Z3, K4, Z20                     // 62c2e54ca7e1
+       VFMSUBADD213PD Z19, Z3, K4, Z20                    // 62a2e54ca7e3
+       VFMSUBADD213PD 15(R8)(R14*4), Z3, K4, Z20          // 6282e54ca7a4b00f000000
+       VFMSUBADD213PD -7(CX)(DX*4), Z3, K4, Z20           // 62e2e54ca7a491f9ffffff
+       VFMSUBADD213PD Z9, Z30, K4, Z20                    // 62c28d44a7e1
+       VFMSUBADD213PD Z19, Z30, K4, Z20                   // 62a28d44a7e3
+       VFMSUBADD213PD 15(R8)(R14*4), Z30, K4, Z20         // 62828d44a7a4b00f000000
+       VFMSUBADD213PD -7(CX)(DX*4), Z30, K4, Z20          // 62e28d44a7a491f9ffffff
+       VFMSUBADD213PD Z9, Z3, K4, Z28                     // 6242e54ca7e1
+       VFMSUBADD213PD Z19, Z3, K4, Z28                    // 6222e54ca7e3
+       VFMSUBADD213PD 15(R8)(R14*4), Z3, K4, Z28          // 6202e54ca7a4b00f000000
+       VFMSUBADD213PD -7(CX)(DX*4), Z3, K4, Z28           // 6262e54ca7a491f9ffffff
+       VFMSUBADD213PD Z9, Z30, K4, Z28                    // 62428d44a7e1
+       VFMSUBADD213PD Z19, Z30, K4, Z28                   // 62228d44a7e3
+       VFMSUBADD213PD 15(R8)(R14*4), Z30, K4, Z28         // 62028d44a7a4b00f000000
+       VFMSUBADD213PD -7(CX)(DX*4), Z30, K4, Z28          // 62628d44a7a491f9ffffff
+       VFMSUBADD213PS X0, X12, K7, X15                    // 62721d0fa7f8
+       VFMSUBADD213PS 7(AX), X12, K7, X15                 // 62721d0fa7b807000000
+       VFMSUBADD213PS (DI), X12, K7, X15                  // 62721d0fa73f
+       VFMSUBADD213PS Y2, Y28, K2, Y31                    // 62621d22a7fa
+       VFMSUBADD213PS -7(CX)(DX*1), Y28, K2, Y31          // 62621d22a7bc11f9ffffff
+       VFMSUBADD213PS -15(R14)(R15*4), Y28, K2, Y31       // 62021d22a7bcbef1ffffff
+       VFMSUBADD213PS Z18, Z11, K5, Z12                   // 6232254da7e2
+       VFMSUBADD213PS Z24, Z11, K5, Z12                   // 6212254da7e0
+       VFMSUBADD213PS Z18, Z5, K5, Z12                    // 6232554da7e2
+       VFMSUBADD213PS Z24, Z5, K5, Z12                    // 6212554da7e0
+       VFMSUBADD213PS Z18, Z11, K5, Z22                   // 62a2254da7f2
+       VFMSUBADD213PS Z24, Z11, K5, Z22                   // 6282254da7f0
+       VFMSUBADD213PS Z18, Z5, K5, Z22                    // 62a2554da7f2
+       VFMSUBADD213PS Z24, Z5, K5, Z22                    // 6282554da7f0
+       VFMSUBADD213PS Z6, Z7, K3, Z2                      // 62f2454ba7d6
+       VFMSUBADD213PS Z16, Z7, K3, Z2                     // 62b2454ba7d0
+       VFMSUBADD213PS (R8), Z7, K3, Z2                    // 62d2454ba710
+       VFMSUBADD213PS 15(DX)(BX*2), Z7, K3, Z2            // 62f2454ba7945a0f000000
+       VFMSUBADD213PS Z6, Z13, K3, Z2                     // 62f2154ba7d6
+       VFMSUBADD213PS Z16, Z13, K3, Z2                    // 62b2154ba7d0
+       VFMSUBADD213PS (R8), Z13, K3, Z2                   // 62d2154ba710
+       VFMSUBADD213PS 15(DX)(BX*2), Z13, K3, Z2           // 62f2154ba7945a0f000000
+       VFMSUBADD213PS Z6, Z7, K3, Z21                     // 62e2454ba7ee
+       VFMSUBADD213PS Z16, Z7, K3, Z21                    // 62a2454ba7e8
+       VFMSUBADD213PS (R8), Z7, K3, Z21                   // 62c2454ba728
+       VFMSUBADD213PS 15(DX)(BX*2), Z7, K3, Z21           // 62e2454ba7ac5a0f000000
+       VFMSUBADD213PS Z6, Z13, K3, Z21                    // 62e2154ba7ee
+       VFMSUBADD213PS Z16, Z13, K3, Z21                   // 62a2154ba7e8
+       VFMSUBADD213PS (R8), Z13, K3, Z21                  // 62c2154ba728
+       VFMSUBADD213PS 15(DX)(BX*2), Z13, K3, Z21          // 62e2154ba7ac5a0f000000
+       VFMSUBADD231PD X5, X14, K4, X12                    // 62728d0cb7e5
+       VFMSUBADD231PD 99(R15)(R15*1), X14, K4, X12        // 62128d0cb7a43f63000000
+       VFMSUBADD231PD (DX), X14, K4, X12                  // 62728d0cb722
+       VFMSUBADD231PD Y0, Y27, K2, Y24                    // 6262a522b7c0
+       VFMSUBADD231PD 15(DX)(BX*1), Y27, K2, Y24          // 6262a522b7841a0f000000
+       VFMSUBADD231PD -7(CX)(DX*2), Y27, K2, Y24          // 6262a522b78451f9ffffff
+       VFMSUBADD231PD Z13, Z1, K2, Z6                     // 62d2f54ab7f5
+       VFMSUBADD231PD Z13, Z15, K2, Z6                    // 62d2854ab7f5
+       VFMSUBADD231PD Z13, Z1, K2, Z22                    // 62c2f54ab7f5
+       VFMSUBADD231PD Z13, Z15, K2, Z22                   // 62c2854ab7f5
+       VFMSUBADD231PD Z2, Z22, K3, Z18                    // 62e2cd43b7d2
+       VFMSUBADD231PD Z31, Z22, K3, Z18                   // 6282cd43b7d7
+       VFMSUBADD231PD 17(SP)(BP*1), Z22, K3, Z18          // 62e2cd43b7942c11000000
+       VFMSUBADD231PD -7(CX)(DX*8), Z22, K3, Z18          // 62e2cd43b794d1f9ffffff
+       VFMSUBADD231PD Z2, Z7, K3, Z18                     // 62e2c54bb7d2
+       VFMSUBADD231PD Z31, Z7, K3, Z18                    // 6282c54bb7d7
+       VFMSUBADD231PD 17(SP)(BP*1), Z7, K3, Z18           // 62e2c54bb7942c11000000
+       VFMSUBADD231PD -7(CX)(DX*8), Z7, K3, Z18           // 62e2c54bb794d1f9ffffff
+       VFMSUBADD231PD Z2, Z22, K3, Z8                     // 6272cd43b7c2
+       VFMSUBADD231PD Z31, Z22, K3, Z8                    // 6212cd43b7c7
+       VFMSUBADD231PD 17(SP)(BP*1), Z22, K3, Z8           // 6272cd43b7842c11000000
+       VFMSUBADD231PD -7(CX)(DX*8), Z22, K3, Z8           // 6272cd43b784d1f9ffffff
+       VFMSUBADD231PD Z2, Z7, K3, Z8                      // 6272c54bb7c2
+       VFMSUBADD231PD Z31, Z7, K3, Z8                     // 6212c54bb7c7
+       VFMSUBADD231PD 17(SP)(BP*1), Z7, K3, Z8            // 6272c54bb7842c11000000
+       VFMSUBADD231PD -7(CX)(DX*8), Z7, K3, Z8            // 6272c54bb784d1f9ffffff
+       VFMSUBADD231PS X8, X15, K3, X17                    // 62c2050bb7c8
+       VFMSUBADD231PS -17(BP)(SI*8), X15, K3, X17         // 62e2050bb78cf5efffffff
+       VFMSUBADD231PS (R15), X15, K3, X17                 // 62c2050bb70f
+       VFMSUBADD231PS Y3, Y31, K3, Y11                    // 62720523b7db
+       VFMSUBADD231PS -17(BP), Y31, K3, Y11               // 62720523b79defffffff
+       VFMSUBADD231PS -15(R14)(R15*8), Y31, K3, Y11       // 62120523b79cfef1ffffff
+       VFMSUBADD231PS Z12, Z1, K2, Z20                    // 62c2754ab7e4
+       VFMSUBADD231PS Z16, Z1, K2, Z20                    // 62a2754ab7e0
+       VFMSUBADD231PS Z12, Z3, K2, Z20                    // 62c2654ab7e4
+       VFMSUBADD231PS Z16, Z3, K2, Z20                    // 62a2654ab7e0
+       VFMSUBADD231PS Z12, Z1, K2, Z9                     // 6252754ab7cc
+       VFMSUBADD231PS Z16, Z1, K2, Z9                     // 6232754ab7c8
+       VFMSUBADD231PS Z12, Z3, K2, Z9                     // 6252654ab7cc
+       VFMSUBADD231PS Z16, Z3, K2, Z9                     // 6232654ab7c8
+       VFMSUBADD231PS Z3, Z14, K1, Z28                    // 62620d49b7e3
+       VFMSUBADD231PS Z12, Z14, K1, Z28                   // 62420d49b7e4
+       VFMSUBADD231PS -17(BP)(SI*2), Z14, K1, Z28         // 62620d49b7a475efffffff
+       VFMSUBADD231PS 7(AX)(CX*2), Z14, K1, Z28           // 62620d49b7a44807000000
+       VFMSUBADD231PS Z3, Z28, K1, Z28                    // 62621d41b7e3
+       VFMSUBADD231PS Z12, Z28, K1, Z28                   // 62421d41b7e4
+       VFMSUBADD231PS -17(BP)(SI*2), Z28, K1, Z28         // 62621d41b7a475efffffff
+       VFMSUBADD231PS 7(AX)(CX*2), Z28, K1, Z28           // 62621d41b7a44807000000
+       VFMSUBADD231PS Z3, Z14, K1, Z13                    // 62720d49b7eb
+       VFMSUBADD231PS Z12, Z14, K1, Z13                   // 62520d49b7ec
+       VFMSUBADD231PS -17(BP)(SI*2), Z14, K1, Z13         // 62720d49b7ac75efffffff
+       VFMSUBADD231PS 7(AX)(CX*2), Z14, K1, Z13           // 62720d49b7ac4807000000
+       VFMSUBADD231PS Z3, Z28, K1, Z13                    // 62721d41b7eb
+       VFMSUBADD231PS Z12, Z28, K1, Z13                   // 62521d41b7ec
+       VFMSUBADD231PS -17(BP)(SI*2), Z28, K1, Z13         // 62721d41b7ac75efffffff
+       VFMSUBADD231PS 7(AX)(CX*2), Z28, K1, Z13           // 62721d41b7ac4807000000
+       VFNMADD132PD X23, X26, K2, X3                      // 62b2ad029cdf
+       VFNMADD132PD 7(SI)(DI*8), X26, K2, X3              // 62f2ad029c9cfe07000000
+       VFNMADD132PD -15(R14), X26, K2, X3                 // 62d2ad029c9ef1ffffff
+       VFNMADD132PD Y13, Y2, K1, Y14                      // 6252ed299cf5
+       VFNMADD132PD 17(SP)(BP*2), Y2, K1, Y14             // 6272ed299cb46c11000000
+       VFNMADD132PD -7(DI)(R8*4), Y2, K1, Y14             // 6232ed299cb487f9ffffff
+       VFNMADD132PD Z5, Z19, K7, Z15                      // 6272e5479cfd
+       VFNMADD132PD Z1, Z19, K7, Z15                      // 6272e5479cf9
+       VFNMADD132PD Z5, Z15, K7, Z15                      // 6272854f9cfd
+       VFNMADD132PD Z1, Z15, K7, Z15                      // 6272854f9cf9
+       VFNMADD132PD Z5, Z19, K7, Z30                      // 6262e5479cf5
+       VFNMADD132PD Z1, Z19, K7, Z30                      // 6262e5479cf1
+       VFNMADD132PD Z5, Z15, K7, Z30                      // 6262854f9cf5
+       VFNMADD132PD Z1, Z15, K7, Z30                      // 6262854f9cf1
+       VFNMADD132PD Z21, Z14, K1, Z3                      // 62b28d499cdd
+       VFNMADD132PD Z8, Z14, K1, Z3                       // 62d28d499cd8
+       VFNMADD132PD 15(R8)(R14*1), Z14, K1, Z3            // 62928d499c9c300f000000
+       VFNMADD132PD 15(R8)(R14*2), Z14, K1, Z3            // 62928d499c9c700f000000
+       VFNMADD132PD Z21, Z15, K1, Z3                      // 62b285499cdd
+       VFNMADD132PD Z8, Z15, K1, Z3                       // 62d285499cd8
+       VFNMADD132PD 15(R8)(R14*1), Z15, K1, Z3            // 629285499c9c300f000000
+       VFNMADD132PD 15(R8)(R14*2), Z15, K1, Z3            // 629285499c9c700f000000
+       VFNMADD132PD Z21, Z14, K1, Z5                      // 62b28d499ced
+       VFNMADD132PD Z8, Z14, K1, Z5                       // 62d28d499ce8
+       VFNMADD132PD 15(R8)(R14*1), Z14, K1, Z5            // 62928d499cac300f000000
+       VFNMADD132PD 15(R8)(R14*2), Z14, K1, Z5            // 62928d499cac700f000000
+       VFNMADD132PD Z21, Z15, K1, Z5                      // 62b285499ced
+       VFNMADD132PD Z8, Z15, K1, Z5                       // 62d285499ce8
+       VFNMADD132PD 15(R8)(R14*1), Z15, K1, Z5            // 629285499cac300f000000
+       VFNMADD132PD 15(R8)(R14*2), Z15, K1, Z5            // 629285499cac700f000000
+       VFNMADD132PS X24, X28, K1, X13                     // 62121d019ce8
+       VFNMADD132PS 7(SI)(DI*1), X28, K1, X13             // 62721d019cac3e07000000
+       VFNMADD132PS 15(DX)(BX*8), X28, K1, X13            // 62721d019cacda0f000000
+       VFNMADD132PS Y22, Y15, K1, Y27                     // 622205299cde
+       VFNMADD132PS 15(R8), Y15, K1, Y27                  // 624205299c980f000000
+       VFNMADD132PS (BP), Y15, K1, Y27                    // 626205299c5d00
+       VFNMADD132PS Z23, Z20, K7, Z16                     // 62a25d479cc7
+       VFNMADD132PS Z19, Z20, K7, Z16                     // 62a25d479cc3
+       VFNMADD132PS Z23, Z0, K7, Z16                      // 62a27d4f9cc7
+       VFNMADD132PS Z19, Z0, K7, Z16                      // 62a27d4f9cc3
+       VFNMADD132PS Z23, Z20, K7, Z9                      // 62325d479ccf
+       VFNMADD132PS Z19, Z20, K7, Z9                      // 62325d479ccb
+       VFNMADD132PS Z23, Z0, K7, Z9                       // 62327d4f9ccf
+       VFNMADD132PS Z19, Z0, K7, Z9                       // 62327d4f9ccb
+       VFNMADD132PS Z24, Z0, K2, Z0                       // 62927d4a9cc0
+       VFNMADD132PS Z12, Z0, K2, Z0                       // 62d27d4a9cc4
+       VFNMADD132PS (R14), Z0, K2, Z0                     // 62d27d4a9c06
+       VFNMADD132PS -7(DI)(R8*8), Z0, K2, Z0              // 62b27d4a9c84c7f9ffffff
+       VFNMADD132PS Z24, Z25, K2, Z0                      // 629235429cc0
+       VFNMADD132PS Z12, Z25, K2, Z0                      // 62d235429cc4
+       VFNMADD132PS (R14), Z25, K2, Z0                    // 62d235429c06
+       VFNMADD132PS -7(DI)(R8*8), Z25, K2, Z0             // 62b235429c84c7f9ffffff
+       VFNMADD132PS Z24, Z0, K2, Z11                      // 62127d4a9cd8
+       VFNMADD132PS Z12, Z0, K2, Z11                      // 62527d4a9cdc
+       VFNMADD132PS (R14), Z0, K2, Z11                    // 62527d4a9c1e
+       VFNMADD132PS -7(DI)(R8*8), Z0, K2, Z11             // 62327d4a9c9cc7f9ffffff
+       VFNMADD132PS Z24, Z25, K2, Z11                     // 621235429cd8
+       VFNMADD132PS Z12, Z25, K2, Z11                     // 625235429cdc
+       VFNMADD132PS (R14), Z25, K2, Z11                   // 625235429c1e
+       VFNMADD132PS -7(DI)(R8*8), Z25, K2, Z11            // 623235429c9cc7f9ffffff
+       VFNMADD132SD X26, X15, K4, X9                      // 6212850c9dca
+       VFNMADD132SD X1, X21, K1, X18                      // 62e2d5019dd1 or 62e2d5219dd1 or 62e2d5419dd1
+       VFNMADD132SD 7(SI)(DI*8), X21, K1, X18             // 62e2d5019d94fe07000000 or 62e2d5219d94fe07000000 or 62e2d5419d94fe07000000
+       VFNMADD132SD -15(R14), X21, K1, X18                // 62c2d5019d96f1ffffff or 62c2d5219d96f1ffffff or 62c2d5419d96f1ffffff
+       VFNMADD132SS X3, X31, K3, X11                      // 627205039ddb
+       VFNMADD132SS X0, X0, K4, X7                        // 62f27d0c9df8 or 62f27d2c9df8 or 62f27d4c9df8
+       VFNMADD132SS 7(SI)(DI*4), X0, K4, X7               // 62f27d0c9dbcbe07000000 or 62f27d2c9dbcbe07000000 or 62f27d4c9dbcbe07000000
+       VFNMADD132SS -7(DI)(R8*2), X0, K4, X7              // 62b27d0c9dbc47f9ffffff or 62b27d2c9dbc47f9ffffff or 62b27d4c9dbc47f9ffffff
+       VFNMADD213PD X7, X20, K5, X24                      // 6262dd05acc7
+       VFNMADD213PD -7(DI)(R8*1), X20, K5, X24            // 6222dd05ac8407f9ffffff
+       VFNMADD213PD (SP), X20, K5, X24                    // 6262dd05ac0424
+       VFNMADD213PD Y24, Y18, K7, Y20                     // 6282ed27ace0
+       VFNMADD213PD 15(R8)(R14*8), Y18, K7, Y20           // 6282ed27aca4f00f000000
+       VFNMADD213PD -15(R14)(R15*2), Y18, K7, Y20         // 6282ed27aca47ef1ffffff
+       VFNMADD213PD Z9, Z9, K7, Z0                        // 62d2b54facc1
+       VFNMADD213PD Z25, Z9, K7, Z0                       // 6292b54facc1
+       VFNMADD213PD Z9, Z3, K7, Z0                        // 62d2e54facc1
+       VFNMADD213PD Z25, Z3, K7, Z0                       // 6292e54facc1
+       VFNMADD213PD Z9, Z9, K7, Z26                       // 6242b54facd1
+       VFNMADD213PD Z25, Z9, K7, Z26                      // 6202b54facd1
+       VFNMADD213PD Z9, Z3, K7, Z26                       // 6242e54facd1
+       VFNMADD213PD Z25, Z3, K7, Z26                      // 6202e54facd1
+       VFNMADD213PD Z17, Z20, K6, Z9                      // 6232dd46acc9
+       VFNMADD213PD Z0, Z20, K6, Z9                       // 6272dd46acc8
+       VFNMADD213PD 99(R15)(R15*4), Z20, K6, Z9           // 6212dd46ac8cbf63000000
+       VFNMADD213PD 15(DX), Z20, K6, Z9                   // 6272dd46ac8a0f000000
+       VFNMADD213PD Z17, Z0, K6, Z9                       // 6232fd4eacc9
+       VFNMADD213PD Z0, Z0, K6, Z9                        // 6272fd4eacc8
+       VFNMADD213PD 99(R15)(R15*4), Z0, K6, Z9            // 6212fd4eac8cbf63000000
+       VFNMADD213PD 15(DX), Z0, K6, Z9                    // 6272fd4eac8a0f000000
+       VFNMADD213PD Z17, Z20, K6, Z28                     // 6222dd46ace1
+       VFNMADD213PD Z0, Z20, K6, Z28                      // 6262dd46ace0
+       VFNMADD213PD 99(R15)(R15*4), Z20, K6, Z28          // 6202dd46aca4bf63000000
+       VFNMADD213PD 15(DX), Z20, K6, Z28                  // 6262dd46aca20f000000
+       VFNMADD213PD Z17, Z0, K6, Z28                      // 6222fd4eace1
+       VFNMADD213PD Z0, Z0, K6, Z28                       // 6262fd4eace0
+       VFNMADD213PD 99(R15)(R15*4), Z0, K6, Z28           // 6202fd4eaca4bf63000000
+       VFNMADD213PD 15(DX), Z0, K6, Z28                   // 6262fd4eaca20f000000
+       VFNMADD213PS X14, X7, K3, X9                       // 6252450bacce
+       VFNMADD213PS -7(CX), X7, K3, X9                    // 6272450bac89f9ffffff
+       VFNMADD213PS 15(DX)(BX*4), X7, K3, X9              // 6272450bac8c9a0f000000
+       VFNMADD213PS Y19, Y3, K7, Y9                       // 6232652faccb
+       VFNMADD213PS -15(R14)(R15*1), Y3, K7, Y9           // 6212652fac8c3ef1ffffff
+       VFNMADD213PS -15(BX), Y3, K7, Y9                   // 6272652fac8bf1ffffff
+       VFNMADD213PS Z21, Z31, K4, Z17                     // 62a20544accd
+       VFNMADD213PS Z9, Z31, K4, Z17                      // 62c20544acc9
+       VFNMADD213PS Z21, Z0, K4, Z17                      // 62a27d4caccd
+       VFNMADD213PS Z9, Z0, K4, Z17                       // 62c27d4cacc9
+       VFNMADD213PS Z21, Z31, K4, Z23                     // 62a20544acfd
+       VFNMADD213PS Z9, Z31, K4, Z23                      // 62c20544acf9
+       VFNMADD213PS Z21, Z0, K4, Z23                      // 62a27d4cacfd
+       VFNMADD213PS Z9, Z0, K4, Z23                       // 62c27d4cacf9
+       VFNMADD213PS Z20, Z1, K4, Z6                       // 62b2754cacf4
+       VFNMADD213PS Z9, Z1, K4, Z6                        // 62d2754cacf1
+       VFNMADD213PS (CX), Z1, K4, Z6                      // 62f2754cac31
+       VFNMADD213PS 99(R15), Z1, K4, Z6                   // 62d2754cacb763000000
+       VFNMADD213PS Z20, Z9, K4, Z6                       // 62b2354cacf4
+       VFNMADD213PS Z9, Z9, K4, Z6                        // 62d2354cacf1
+       VFNMADD213PS (CX), Z9, K4, Z6                      // 62f2354cac31
+       VFNMADD213PS 99(R15), Z9, K4, Z6                   // 62d2354cacb763000000
+       VFNMADD213PS Z20, Z1, K4, Z9                       // 6232754caccc
+       VFNMADD213PS Z9, Z1, K4, Z9                        // 6252754cacc9
+       VFNMADD213PS (CX), Z1, K4, Z9                      // 6272754cac09
+       VFNMADD213PS 99(R15), Z1, K4, Z9                   // 6252754cac8f63000000
+       VFNMADD213PS Z20, Z9, K4, Z9                       // 6232354caccc
+       VFNMADD213PS Z9, Z9, K4, Z9                        // 6252354cacc9
+       VFNMADD213PS (CX), Z9, K4, Z9                      // 6272354cac09
+       VFNMADD213PS 99(R15), Z9, K4, Z9                   // 6252354cac8f63000000
+       VFNMADD213SD X3, X31, K7, X5                       // 62f28507adeb
+       VFNMADD213SD X11, X1, K2, X21                      // 62c2f50aadeb or 62c2f52aadeb or 62c2f54aadeb
+       VFNMADD213SD 7(SI)(DI*1), X1, K2, X21              // 62e2f50aadac3e07000000 or 62e2f52aadac3e07000000 or 62e2f54aadac3e07000000
+       VFNMADD213SD 15(DX)(BX*8), X1, K2, X21             // 62e2f50aadacda0f000000 or 62e2f52aadacda0f000000 or 62e2f54aadacda0f000000
+       VFNMADD213SS X30, X0, K5, X13                      // 62127d0dadee
+       VFNMADD213SS X11, X14, K3, X16                     // 62c20d0badc3 or 62c20d2badc3 or 62c20d4badc3
+       VFNMADD213SS 17(SP), X14, K3, X16                  // 62e20d0bad842411000000 or 62e20d2bad842411000000 or 62e20d4bad842411000000
+       VFNMADD213SS -17(BP)(SI*4), X14, K3, X16           // 62e20d0bad84b5efffffff or 62e20d2bad84b5efffffff or 62e20d4bad84b5efffffff
+       VFNMADD231PD X8, X19, K4, X14                      // 6252e504bcf0
+       VFNMADD231PD 99(R15)(R15*8), X19, K4, X14          // 6212e504bcb4ff63000000
+       VFNMADD231PD 7(AX)(CX*8), X19, K4, X14             // 6272e504bcb4c807000000
+       VFNMADD231PD Y14, Y19, K2, Y23                     // 62c2e522bcfe
+       VFNMADD231PD 7(AX)(CX*4), Y19, K2, Y23             // 62e2e522bcbc8807000000
+       VFNMADD231PD 7(AX)(CX*1), Y19, K2, Y23             // 62e2e522bcbc0807000000
+       VFNMADD231PD Z7, Z26, K2, Z30                      // 6262ad42bcf7
+       VFNMADD231PD Z21, Z26, K2, Z30                     // 6222ad42bcf5
+       VFNMADD231PD Z7, Z22, K2, Z30                      // 6262cd42bcf7
+       VFNMADD231PD Z21, Z22, K2, Z30                     // 6222cd42bcf5
+       VFNMADD231PD Z7, Z26, K2, Z5                       // 62f2ad42bcef
+       VFNMADD231PD Z21, Z26, K2, Z5                      // 62b2ad42bced
+       VFNMADD231PD Z7, Z22, K2, Z5                       // 62f2cd42bcef
+       VFNMADD231PD Z21, Z22, K2, Z5                      // 62b2cd42bced
+       VFNMADD231PD Z12, Z14, K3, Z16                     // 62c28d4bbcc4
+       VFNMADD231PD Z13, Z14, K3, Z16                     // 62c28d4bbcc5
+       VFNMADD231PD 99(R15)(R15*2), Z14, K3, Z16          // 62828d4bbc847f63000000
+       VFNMADD231PD -7(DI), Z14, K3, Z16                  // 62e28d4bbc87f9ffffff
+       VFNMADD231PD Z12, Z13, K3, Z16                     // 62c2954bbcc4
+       VFNMADD231PD Z13, Z13, K3, Z16                     // 62c2954bbcc5
+       VFNMADD231PD 99(R15)(R15*2), Z13, K3, Z16          // 6282954bbc847f63000000
+       VFNMADD231PD -7(DI), Z13, K3, Z16                  // 62e2954bbc87f9ffffff
+       VFNMADD231PD Z12, Z14, K3, Z25                     // 62428d4bbccc
+       VFNMADD231PD Z13, Z14, K3, Z25                     // 62428d4bbccd
+       VFNMADD231PD 99(R15)(R15*2), Z14, K3, Z25          // 62028d4bbc8c7f63000000
+       VFNMADD231PD -7(DI), Z14, K3, Z25                  // 62628d4bbc8ff9ffffff
+       VFNMADD231PD Z12, Z13, K3, Z25                     // 6242954bbccc
+       VFNMADD231PD Z13, Z13, K3, Z25                     // 6242954bbccd
+       VFNMADD231PD 99(R15)(R15*2), Z13, K3, Z25          // 6202954bbc8c7f63000000
+       VFNMADD231PD -7(DI), Z13, K3, Z25                  // 6262954bbc8ff9ffffff
+       VFNMADD231PS X23, X26, K3, X8                      // 62322d03bcc7
+       VFNMADD231PS (AX), X26, K3, X8                     // 62722d03bc00
+       VFNMADD231PS 7(SI), X26, K3, X8                    // 62722d03bc8607000000
+       VFNMADD231PS Y16, Y5, K3, Y21                      // 62a2552bbce8
+       VFNMADD231PS (SI), Y5, K3, Y21                     // 62e2552bbc2e
+       VFNMADD231PS 7(SI)(DI*2), Y5, K3, Y21              // 62e2552bbcac7e07000000
+       VFNMADD231PS Z27, Z2, K2, Z21                      // 62826d4abceb
+       VFNMADD231PS Z25, Z2, K2, Z21                      // 62826d4abce9
+       VFNMADD231PS Z27, Z7, K2, Z21                      // 6282454abceb
+       VFNMADD231PS Z25, Z7, K2, Z21                      // 6282454abce9
+       VFNMADD231PS Z27, Z2, K2, Z9                       // 62126d4abccb
+       VFNMADD231PS Z25, Z2, K2, Z9                       // 62126d4abcc9
+       VFNMADD231PS Z27, Z7, K2, Z9                       // 6212454abccb
+       VFNMADD231PS Z25, Z7, K2, Z9                       // 6212454abcc9
+       VFNMADD231PS Z3, Z27, K1, Z23                      // 62e22541bcfb
+       VFNMADD231PS Z0, Z27, K1, Z23                      // 62e22541bcf8
+       VFNMADD231PS -7(CX)(DX*1), Z27, K1, Z23            // 62e22541bcbc11f9ffffff
+       VFNMADD231PS -15(R14)(R15*4), Z27, K1, Z23         // 62822541bcbcbef1ffffff
+       VFNMADD231PS Z3, Z14, K1, Z23                      // 62e20d49bcfb
+       VFNMADD231PS Z0, Z14, K1, Z23                      // 62e20d49bcf8
+       VFNMADD231PS -7(CX)(DX*1), Z14, K1, Z23            // 62e20d49bcbc11f9ffffff
+       VFNMADD231PS -15(R14)(R15*4), Z14, K1, Z23         // 62820d49bcbcbef1ffffff
+       VFNMADD231PS Z3, Z27, K1, Z9                       // 62722541bccb
+       VFNMADD231PS Z0, Z27, K1, Z9                       // 62722541bcc8
+       VFNMADD231PS -7(CX)(DX*1), Z27, K1, Z9             // 62722541bc8c11f9ffffff
+       VFNMADD231PS -15(R14)(R15*4), Z27, K1, Z9          // 62122541bc8cbef1ffffff
+       VFNMADD231PS Z3, Z14, K1, Z9                       // 62720d49bccb
+       VFNMADD231PS Z0, Z14, K1, Z9                       // 62720d49bcc8
+       VFNMADD231PS -7(CX)(DX*1), Z14, K1, Z9             // 62720d49bc8c11f9ffffff
+       VFNMADD231PS -15(R14)(R15*4), Z14, K1, Z9          // 62120d49bc8cbef1ffffff
+       VFNMADD231SD X23, X16, K2, X12                     // 6232fd02bde7
+       VFNMADD231SD X31, X11, K1, X23                     // 6282a509bdff or 6282a529bdff or 6282a549bdff
+       VFNMADD231SD -7(DI)(R8*1), X11, K1, X23            // 62a2a509bdbc07f9ffffff or 62a2a529bdbc07f9ffffff or 62a2a549bdbc07f9ffffff
+       VFNMADD231SD (SP), X11, K1, X23                    // 62e2a509bd3c24 or 62e2a529bd3c24 or 62e2a549bd3c24
+       VFNMADD231SS X0, X14, K7, X24                      // 62620d0fbdc0
+       VFNMADD231SS X2, X23, K1, X11                      // 62724501bdda or 62724521bdda or 62724541bdda
+       VFNMADD231SS 7(AX), X23, K1, X11                   // 62724501bd9807000000 or 62724521bd9807000000 or 62724541bd9807000000
+       VFNMADD231SS (DI), X23, K1, X11                    // 62724501bd1f or 62724521bd1f or 62724541bd1f
+       VFNMSUB132PD X25, X5, K1, X20                      // 6282d5099ee1
+       VFNMSUB132PD (BX), X5, K1, X20                     // 62e2d5099e23
+       VFNMSUB132PD -17(BP)(SI*1), X5, K1, X20            // 62e2d5099ea435efffffff
+       VFNMSUB132PD Y20, Y21, K1, Y2                      // 62b2d5219ed4
+       VFNMSUB132PD 17(SP)(BP*8), Y21, K1, Y2             // 62f2d5219e94ec11000000
+       VFNMSUB132PD 17(SP)(BP*4), Y21, K1, Y2             // 62f2d5219e94ac11000000
+       VFNMSUB132PD Z22, Z8, K7, Z14                      // 6232bd4f9ef6
+       VFNMSUB132PD Z25, Z8, K7, Z14                      // 6212bd4f9ef1
+       VFNMSUB132PD Z22, Z24, K7, Z14                     // 6232bd479ef6
+       VFNMSUB132PD Z25, Z24, K7, Z14                     // 6212bd479ef1
+       VFNMSUB132PD Z22, Z8, K7, Z7                       // 62b2bd4f9efe
+       VFNMSUB132PD Z25, Z8, K7, Z7                       // 6292bd4f9ef9
+       VFNMSUB132PD Z22, Z24, K7, Z7                      // 62b2bd479efe
+       VFNMSUB132PD Z25, Z24, K7, Z7                      // 6292bd479ef9
+       VFNMSUB132PD Z0, Z6, K2, Z1                        // 62f2cd4a9ec8
+       VFNMSUB132PD Z8, Z6, K2, Z1                        // 62d2cd4a9ec8
+       VFNMSUB132PD 15(DX)(BX*1), Z6, K2, Z1              // 62f2cd4a9e8c1a0f000000
+       VFNMSUB132PD -7(CX)(DX*2), Z6, K2, Z1              // 62f2cd4a9e8c51f9ffffff
+       VFNMSUB132PD Z0, Z2, K2, Z1                        // 62f2ed4a9ec8
+       VFNMSUB132PD Z8, Z2, K2, Z1                        // 62d2ed4a9ec8
+       VFNMSUB132PD 15(DX)(BX*1), Z2, K2, Z1              // 62f2ed4a9e8c1a0f000000
+       VFNMSUB132PD -7(CX)(DX*2), Z2, K2, Z1              // 62f2ed4a9e8c51f9ffffff
+       VFNMSUB132PD Z0, Z6, K2, Z16                       // 62e2cd4a9ec0
+       VFNMSUB132PD Z8, Z6, K2, Z16                       // 62c2cd4a9ec0
+       VFNMSUB132PD 15(DX)(BX*1), Z6, K2, Z16             // 62e2cd4a9e841a0f000000
+       VFNMSUB132PD -7(CX)(DX*2), Z6, K2, Z16             // 62e2cd4a9e8451f9ffffff
+       VFNMSUB132PD Z0, Z2, K2, Z16                       // 62e2ed4a9ec0
+       VFNMSUB132PD Z8, Z2, K2, Z16                       // 62c2ed4a9ec0
+       VFNMSUB132PD 15(DX)(BX*1), Z2, K2, Z16             // 62e2ed4a9e841a0f000000
+       VFNMSUB132PD -7(CX)(DX*2), Z2, K2, Z16             // 62e2ed4a9e8451f9ffffff
+       VFNMSUB132PS X13, X9, K4, X0                       // 62d2350c9ec5
+       VFNMSUB132PS 15(R8)(R14*4), X9, K4, X0             // 6292350c9e84b00f000000
+       VFNMSUB132PS -7(CX)(DX*4), X9, K4, X0              // 62f2350c9e8491f9ffffff
+       VFNMSUB132PS Y6, Y31, K1, Y6                       // 62f205219ef6
+       VFNMSUB132PS 7(SI)(DI*4), Y31, K1, Y6              // 62f205219eb4be07000000
+       VFNMSUB132PS -7(DI)(R8*2), Y31, K1, Y6             // 62b205219eb447f9ffffff
+       VFNMSUB132PS Z11, Z14, K3, Z15                     // 62520d4b9efb
+       VFNMSUB132PS Z5, Z14, K3, Z15                      // 62720d4b9efd
+       VFNMSUB132PS Z11, Z27, K3, Z15                     // 625225439efb
+       VFNMSUB132PS Z5, Z27, K3, Z15                      // 627225439efd
+       VFNMSUB132PS Z11, Z14, K3, Z12                     // 62520d4b9ee3
+       VFNMSUB132PS Z5, Z14, K3, Z12                      // 62720d4b9ee5
+       VFNMSUB132PS Z11, Z27, K3, Z12                     // 625225439ee3
+       VFNMSUB132PS Z5, Z27, K3, Z12                      // 627225439ee5
+       VFNMSUB132PS Z2, Z5, K4, Z13                       // 6272554c9eea
+       VFNMSUB132PS -17(BP), Z5, K4, Z13                  // 6272554c9eadefffffff
+       VFNMSUB132PS -15(R14)(R15*8), Z5, K4, Z13          // 6212554c9eacfef1ffffff
+       VFNMSUB132PS Z2, Z23, K4, Z13                      // 627245449eea
+       VFNMSUB132PS -17(BP), Z23, K4, Z13                 // 627245449eadefffffff
+       VFNMSUB132PS -15(R14)(R15*8), Z23, K4, Z13         // 621245449eacfef1ffffff
+       VFNMSUB132PS Z2, Z5, K4, Z14                       // 6272554c9ef2
+       VFNMSUB132PS -17(BP), Z5, K4, Z14                  // 6272554c9eb5efffffff
+       VFNMSUB132PS -15(R14)(R15*8), Z5, K4, Z14          // 6212554c9eb4fef1ffffff
+       VFNMSUB132PS Z2, Z23, K4, Z14                      // 627245449ef2
+       VFNMSUB132PS -17(BP), Z23, K4, Z14                 // 627245449eb5efffffff
+       VFNMSUB132PS -15(R14)(R15*8), Z23, K4, Z14         // 621245449eb4fef1ffffff
+       VFNMSUB132SD X9, X8, K5, X2                        // 62d2bd0d9fd1
+       VFNMSUB132SD X11, X31, K7, X2                      // 62d285079fd3 or 62d285279fd3 or 62d285479fd3
+       VFNMSUB132SD -7(CX), X31, K7, X2                   // 62f285079f91f9ffffff or 62f285279f91f9ffffff or 62f285479f91f9ffffff
+       VFNMSUB132SD 15(DX)(BX*4), X31, K7, X2             // 62f285079f949a0f000000 or 62f285279f949a0f000000 or 62f285479f949a0f000000
+       VFNMSUB132SS X14, X5, K7, X22                      // 62c2550f9ff6
+       VFNMSUB132SS X7, X17, K6, X0                       // 62f275069fc7 or 62f275269fc7 or 62f275469fc7
+       VFNMSUB132SS 99(R15)(R15*1), X17, K6, X0           // 629275069f843f63000000 or 629275269f843f63000000 or 629275469f843f63000000
+       VFNMSUB132SS (DX), X17, K6, X0                     // 62f275069f02 or 62f275269f02 or 62f275469f02
+       VFNMSUB213PD X0, X11, K3, X15                      // 6272a50baef8
+       VFNMSUB213PD (R8), X11, K3, X15                    // 6252a50bae38
+       VFNMSUB213PD 15(DX)(BX*2), X11, K3, X15            // 6272a50baebc5a0f000000
+       VFNMSUB213PD Y7, Y19, K7, Y11                      // 6272e527aedf
+       VFNMSUB213PD 17(SP), Y19, K7, Y11                  // 6272e527ae9c2411000000
+       VFNMSUB213PD -17(BP)(SI*4), Y19, K7, Y11           // 6272e527ae9cb5efffffff
+       VFNMSUB213PD Z28, Z26, K4, Z6                      // 6292ad44aef4
+       VFNMSUB213PD Z6, Z26, K4, Z6                       // 62f2ad44aef6
+       VFNMSUB213PD Z28, Z14, K4, Z6                      // 62928d4caef4
+       VFNMSUB213PD Z6, Z14, K4, Z6                       // 62f28d4caef6
+       VFNMSUB213PD Z28, Z26, K4, Z14                     // 6212ad44aef4
+       VFNMSUB213PD Z6, Z26, K4, Z14                      // 6272ad44aef6
+       VFNMSUB213PD Z28, Z14, K4, Z14                     // 62128d4caef4
+       VFNMSUB213PD Z6, Z14, K4, Z14                      // 62728d4caef6
+       VFNMSUB213PD Z3, Z26, K4, Z13                      // 6272ad44aeeb
+       VFNMSUB213PD Z0, Z26, K4, Z13                      // 6272ad44aee8
+       VFNMSUB213PD 17(SP)(BP*2), Z26, K4, Z13            // 6272ad44aeac6c11000000
+       VFNMSUB213PD -7(DI)(R8*4), Z26, K4, Z13            // 6232ad44aeac87f9ffffff
+       VFNMSUB213PD Z3, Z3, K4, Z13                       // 6272e54caeeb
+       VFNMSUB213PD Z0, Z3, K4, Z13                       // 6272e54caee8
+       VFNMSUB213PD 17(SP)(BP*2), Z3, K4, Z13             // 6272e54caeac6c11000000
+       VFNMSUB213PD -7(DI)(R8*4), Z3, K4, Z13             // 6232e54caeac87f9ffffff
+       VFNMSUB213PD Z3, Z26, K4, Z21                      // 62e2ad44aeeb
+       VFNMSUB213PD Z0, Z26, K4, Z21                      // 62e2ad44aee8
+       VFNMSUB213PD 17(SP)(BP*2), Z26, K4, Z21            // 62e2ad44aeac6c11000000
+       VFNMSUB213PD -7(DI)(R8*4), Z26, K4, Z21            // 62a2ad44aeac87f9ffffff
+       VFNMSUB213PD Z3, Z3, K4, Z21                       // 62e2e54caeeb
+       VFNMSUB213PD Z0, Z3, K4, Z21                       // 62e2e54caee8
+       VFNMSUB213PD 17(SP)(BP*2), Z3, K4, Z21             // 62e2e54caeac6c11000000
+       VFNMSUB213PD -7(DI)(R8*4), Z3, K4, Z21             // 62a2e54caeac87f9ffffff
+       VFNMSUB213PS X27, X8, K7, X18                      // 62823d0faed3
+       VFNMSUB213PS 17(SP)(BP*1), X8, K7, X18             // 62e23d0fae942c11000000
+       VFNMSUB213PS -7(CX)(DX*8), X8, K7, X18             // 62e23d0fae94d1f9ffffff
+       VFNMSUB213PS Y3, Y0, K2, Y6                        // 62f27d2aaef3
+       VFNMSUB213PS 7(AX), Y0, K2, Y6                     // 62f27d2aaeb007000000
+       VFNMSUB213PS (DI), Y0, K2, Y6                      // 62f27d2aae37
+       VFNMSUB213PS Z3, Z11, K5, Z21                      // 62e2254daeeb
+       VFNMSUB213PS Z12, Z11, K5, Z21                     // 62c2254daeec
+       VFNMSUB213PS Z3, Z25, K5, Z21                      // 62e23545aeeb
+       VFNMSUB213PS Z12, Z25, K5, Z21                     // 62c23545aeec
+       VFNMSUB213PS Z3, Z11, K5, Z13                      // 6272254daeeb
+       VFNMSUB213PS Z12, Z11, K5, Z13                     // 6252254daeec
+       VFNMSUB213PS Z3, Z25, K5, Z13                      // 62723545aeeb
+       VFNMSUB213PS Z12, Z25, K5, Z13                     // 62523545aeec
+       VFNMSUB213PS Z23, Z23, K3, Z27                     // 62224543aedf
+       VFNMSUB213PS Z6, Z23, K3, Z27                      // 62624543aede
+       VFNMSUB213PS 15(R8), Z23, K3, Z27                  // 62424543ae980f000000
+       VFNMSUB213PS (BP), Z23, K3, Z27                    // 62624543ae5d00
+       VFNMSUB213PS Z23, Z5, K3, Z27                      // 6222554baedf
+       VFNMSUB213PS Z6, Z5, K3, Z27                       // 6262554baede
+       VFNMSUB213PS 15(R8), Z5, K3, Z27                   // 6242554bae980f000000
+       VFNMSUB213PS (BP), Z5, K3, Z27                     // 6262554bae5d00
+       VFNMSUB213PS Z23, Z23, K3, Z15                     // 62324543aeff
+       VFNMSUB213PS Z6, Z23, K3, Z15                      // 62724543aefe
+       VFNMSUB213PS 15(R8), Z23, K3, Z15                  // 62524543aeb80f000000
+       VFNMSUB213PS (BP), Z23, K3, Z15                    // 62724543ae7d00
+       VFNMSUB213PS Z23, Z5, K3, Z15                      // 6232554baeff
+       VFNMSUB213PS Z6, Z5, K3, Z15                       // 6272554baefe
+       VFNMSUB213PS 15(R8), Z5, K3, Z15                   // 6252554baeb80f000000
+       VFNMSUB213PS (BP), Z5, K3, Z15                     // 6272554bae7d00
+       VFNMSUB213SD X18, X3, K4, X25                      // 6222e50cafca
+       VFNMSUB213SD X15, X28, K2, X15                     // 62529d02afff or 62529d22afff or 62529d42afff
+       VFNMSUB213SD 99(R15)(R15*8), X28, K2, X15          // 62129d02afbcff63000000 or 62129d22afbcff63000000 or 62129d42afbcff63000000
+       VFNMSUB213SD 7(AX)(CX*8), X28, K2, X15             // 62729d02afbcc807000000 or 62729d22afbcc807000000 or 62729d42afbcc807000000
+       VFNMSUB213SS X8, X13, K2, X7                       // 62d2150aaff8
+       VFNMSUB213SS X0, X7, K3, X24                       // 6262450bafc0 or 6262452bafc0 or 6262454bafc0
+       VFNMSUB213SS -17(BP)(SI*8), X7, K3, X24            // 6262450baf84f5efffffff or 6262452baf84f5efffffff or 6262454baf84f5efffffff
+       VFNMSUB213SS (R15), X7, K3, X24                    // 6242450baf07 or 6242452baf07 or 6242454baf07
+       VFNMSUB231PD X11, X1, K3, X22                      // 62c2f50bbef3
+       VFNMSUB231PD -17(BP)(SI*2), X1, K3, X22            // 62e2f50bbeb475efffffff
+       VFNMSUB231PD 7(AX)(CX*2), X1, K3, X22              // 62e2f50bbeb44807000000
+       VFNMSUB231PD Y12, Y20, K3, Y5                      // 62d2dd23beec
+       VFNMSUB231PD 99(R15)(R15*1), Y20, K3, Y5           // 6292dd23beac3f63000000
+       VFNMSUB231PD (DX), Y20, K3, Y5                     // 62f2dd23be2a
+       VFNMSUB231PD Z16, Z21, K2, Z8                      // 6232d542bec0
+       VFNMSUB231PD Z13, Z21, K2, Z8                      // 6252d542bec5
+       VFNMSUB231PD Z16, Z5, K2, Z8                       // 6232d54abec0
+       VFNMSUB231PD Z13, Z5, K2, Z8                       // 6252d54abec5
+       VFNMSUB231PD Z16, Z21, K2, Z28                     // 6222d542bee0
+       VFNMSUB231PD Z13, Z21, K2, Z28                     // 6242d542bee5
+       VFNMSUB231PD Z16, Z5, K2, Z28                      // 6222d54abee0
+       VFNMSUB231PD Z13, Z5, K2, Z28                      // 6242d54abee5
+       VFNMSUB231PD Z6, Z22, K1, Z12                      // 6272cd41bee6
+       VFNMSUB231PD Z8, Z22, K1, Z12                      // 6252cd41bee0
+       VFNMSUB231PD 15(R8)(R14*8), Z22, K1, Z12           // 6212cd41bea4f00f000000
+       VFNMSUB231PD -15(R14)(R15*2), Z22, K1, Z12         // 6212cd41bea47ef1ffffff
+       VFNMSUB231PD Z6, Z11, K1, Z12                      // 6272a549bee6
+       VFNMSUB231PD Z8, Z11, K1, Z12                      // 6252a549bee0
+       VFNMSUB231PD 15(R8)(R14*8), Z11, K1, Z12           // 6212a549bea4f00f000000
+       VFNMSUB231PD -15(R14)(R15*2), Z11, K1, Z12         // 6212a549bea47ef1ffffff
+       VFNMSUB231PD Z6, Z22, K1, Z27                      // 6262cd41bede
+       VFNMSUB231PD Z8, Z22, K1, Z27                      // 6242cd41bed8
+       VFNMSUB231PD 15(R8)(R14*8), Z22, K1, Z27           // 6202cd41be9cf00f000000
+       VFNMSUB231PD -15(R14)(R15*2), Z22, K1, Z27         // 6202cd41be9c7ef1ffffff
+       VFNMSUB231PD Z6, Z11, K1, Z27                      // 6262a549bede
+       VFNMSUB231PD Z8, Z11, K1, Z27                      // 6242a549bed8
+       VFNMSUB231PD 15(R8)(R14*8), Z11, K1, Z27           // 6202a549be9cf00f000000
+       VFNMSUB231PD -15(R14)(R15*2), Z11, K1, Z27         // 6202a549be9c7ef1ffffff
+       VFNMSUB231PS X8, X7, K2, X6                        // 62d2450abef0
+       VFNMSUB231PS 15(R8)(R14*1), X7, K2, X6             // 6292450abeb4300f000000
+       VFNMSUB231PS 15(R8)(R14*2), X7, K2, X6             // 6292450abeb4700f000000
+       VFNMSUB231PS Y28, Y5, K1, Y3                       // 62925529bedc
+       VFNMSUB231PS -17(BP)(SI*8), Y5, K1, Y3             // 62f25529be9cf5efffffff
+       VFNMSUB231PS (R15), Y5, K1, Y3                     // 62d25529be1f
+       VFNMSUB231PS Z9, Z12, K7, Z25                      // 62421d4fbec9
+       VFNMSUB231PS Z12, Z12, K7, Z25                     // 62421d4fbecc
+       VFNMSUB231PS Z9, Z17, K7, Z25                      // 62427547bec9
+       VFNMSUB231PS Z12, Z17, K7, Z25                     // 62427547becc
+       VFNMSUB231PS Z9, Z12, K7, Z12                      // 62521d4fbee1
+       VFNMSUB231PS Z12, Z12, K7, Z12                     // 62521d4fbee4
+       VFNMSUB231PS Z9, Z17, K7, Z12                      // 62527547bee1
+       VFNMSUB231PS Z12, Z17, K7, Z12                     // 62527547bee4
+       VFNMSUB231PS Z8, Z3, K1, Z6                        // 62d26549bef0
+       VFNMSUB231PS Z2, Z3, K1, Z6                        // 62f26549bef2
+       VFNMSUB231PS -15(R14)(R15*1), Z3, K1, Z6           // 62926549beb43ef1ffffff
+       VFNMSUB231PS -15(BX), Z3, K1, Z6                   // 62f26549beb3f1ffffff
+       VFNMSUB231PS Z8, Z21, K1, Z6                       // 62d25541bef0
+       VFNMSUB231PS Z2, Z21, K1, Z6                       // 62f25541bef2
+       VFNMSUB231PS -15(R14)(R15*1), Z21, K1, Z6          // 62925541beb43ef1ffffff
+       VFNMSUB231PS -15(BX), Z21, K1, Z6                  // 62f25541beb3f1ffffff
+       VFNMSUB231PS Z8, Z3, K1, Z25                       // 62426549bec8
+       VFNMSUB231PS Z2, Z3, K1, Z25                       // 62626549beca
+       VFNMSUB231PS -15(R14)(R15*1), Z3, K1, Z25          // 62026549be8c3ef1ffffff
+       VFNMSUB231PS -15(BX), Z3, K1, Z25                  // 62626549be8bf1ffffff
+       VFNMSUB231PS Z8, Z21, K1, Z25                      // 62425541bec8
+       VFNMSUB231PS Z2, Z21, K1, Z25                      // 62625541beca
+       VFNMSUB231PS -15(R14)(R15*1), Z21, K1, Z25         // 62025541be8c3ef1ffffff
+       VFNMSUB231PS -15(BX), Z21, K1, Z25                 // 62625541be8bf1ffffff
+       VFNMSUB231SD X28, X3, K1, X31                      // 6202e509bffc
+       VFNMSUB231SD X7, X24, K1, X20                      // 62e2bd01bfe7 or 62e2bd21bfe7 or 62e2bd41bfe7
+       VFNMSUB231SD (AX), X24, K1, X20                    // 62e2bd01bf20 or 62e2bd21bf20 or 62e2bd41bf20
+       VFNMSUB231SD 7(SI), X24, K1, X20                   // 62e2bd01bfa607000000 or 62e2bd21bfa607000000 or 62e2bd41bfa607000000
+       VFNMSUB231SS X12, X16, K7, X20                     // 62c27d07bfe4
+       VFNMSUB231SS X28, X17, K2, X6                      // 62927502bff4 or 62927522bff4 or 62927542bff4
+       VFNMSUB231SS 7(SI)(DI*8), X17, K2, X6              // 62f27502bfb4fe07000000 or 62f27522bfb4fe07000000 or 62f27542bfb4fe07000000
+       VFNMSUB231SS -15(R14), X17, K2, X6                 // 62d27502bfb6f1ffffff or 62d27522bfb6f1ffffff or 62d27542bfb6f1ffffff
+       VGATHERDPD (AX)(X4*1), K3, X6                      // 62f2fd0b923420
+       VGATHERDPD (BP)(X10*2), K3, X6                     // 62b2fd0b92745500
+       VGATHERDPD (R10)(X29*8), K3, X6                    // 6292fd039234ea
+       VGATHERDPD (DX)(X10*4), K7, Y22                    // 62a2fd2f923492
+       VGATHERDPD (SP)(X4*2), K7, Y22                     // 62e2fd2f923464
+       VGATHERDPD (R14)(X29*8), K7, Y22                   // 6282fd279234ee
+       VGATHERDPD (R10)(Y29*8), K4, Z0                    // 6292fd449204ea
+       VGATHERDPD (SP)(Y4*2), K4, Z0                      // 62f2fd4c920464
+       VGATHERDPD (DX)(Y10*4), K4, Z0                     // 62b2fd4c920492
+       VGATHERDPD (R10)(Y29*8), K4, Z6                    // 6292fd449234ea
+       VGATHERDPD (SP)(Y4*2), K4, Z6                      // 62f2fd4c923464
+       VGATHERDPD (DX)(Y10*4), K4, Z6                     // 62b2fd4c923492
+       VGATHERDPS (AX)(X4*1), K4, X0                      // 62f27d0c920420
+       VGATHERDPS (BP)(X10*2), K4, X0                     // 62b27d0c92445500
+       VGATHERDPS (R10)(X29*8), K4, X0                    // 62927d049204ea
+       VGATHERDPS (R14)(Y29*8), K7, Y13                   // 62127d27922cee
+       VGATHERDPS (AX)(Y4*1), K7, Y13                     // 62727d2f922c20
+       VGATHERDPS (BP)(Y10*2), K7, Y13                    // 62327d2f926c5500
+       VGATHERDPS (DX)(Z10*4), K2, Z20                    // 62a27d4a922492
+       VGATHERDPS (AX)(Z4*1), K2, Z20                     // 62e27d4a922420
+       VGATHERDPS (SP)(Z4*2), K2, Z20                     // 62e27d4a922464
+       VGATHERDPS (DX)(Z10*4), K2, Z28                    // 62227d4a922492
+       VGATHERDPS (AX)(Z4*1), K2, Z28                     // 62627d4a922420
+       VGATHERDPS (SP)(Z4*2), K2, Z28                     // 62627d4a922464
+       VGATHERQPD (AX)(X4*1), K2, X11                     // 6272fd0a931c20
+       VGATHERQPD (BP)(X10*2), K2, X11                    // 6232fd0a935c5500
+       VGATHERQPD (R10)(X29*8), K2, X11                   // 6212fd02931cea
+       VGATHERQPD (R10)(Y29*8), K1, Y12                   // 6212fd219324ea
+       VGATHERQPD (SP)(Y4*2), K1, Y12                     // 6272fd29932464
+       VGATHERQPD (DX)(Y10*4), K1, Y12                    // 6232fd29932492
+       VGATHERQPD (DX)(Z10*4), K2, Z3                     // 62b2fd4a931c92
+       VGATHERQPD (AX)(Z4*1), K2, Z3                      // 62f2fd4a931c20
+       VGATHERQPD (SP)(Z4*2), K2, Z3                      // 62f2fd4a931c64
+       VGATHERQPD (DX)(Z10*4), K2, Z30                    // 6222fd4a933492
+       VGATHERQPD (AX)(Z4*1), K2, Z30                     // 6262fd4a933420
+       VGATHERQPD (SP)(Z4*2), K2, Z30                     // 6262fd4a933464
+       VGATHERQPS (DX)(X10*4), K1, X16                    // 62a27d09930492
+       VGATHERQPS (SP)(X4*2), K1, X16                     // 62e27d09930464
+       VGATHERQPS (R14)(X29*8), K1, X16                   // 62827d019304ee
+       VGATHERQPS (R14)(Y29*8), K7, X6                    // 62927d279334ee
+       VGATHERQPS (AX)(Y4*1), K7, X6                      // 62f27d2f933420
+       VGATHERQPS (BP)(Y10*2), K7, X6                     // 62b27d2f93745500
+       VGATHERQPS (BP)(Z10*2), K1, Y1                     // 62b27d49934c5500
+       VGATHERQPS (R10)(Z29*8), K1, Y1                    // 62927d41930cea
+       VGATHERQPS (R14)(Z29*8), K1, Y1                    // 62927d41930cee
+       VGETEXPPD X22, K1, X6                              // 62b2fd0942f6
+       VGETEXPPD (CX), K1, X6                             // 62f2fd094231
+       VGETEXPPD 99(R15), K1, X6                          // 62d2fd0942b763000000
+       VGETEXPPD Y17, K1, Y14                             // 6232fd2942f1
+       VGETEXPPD -7(DI)(R8*1), K1, Y14                    // 6232fd2942b407f9ffffff
+       VGETEXPPD (SP), K1, Y14                            // 6272fd29423424
+       VGETEXPPD Z12, K7, Z9                              // 6252fd4f42cc
+       VGETEXPPD Z22, K7, Z9                              // 6232fd4f42ce
+       VGETEXPPD Z12, K7, Z19                             // 62c2fd4f42dc
+       VGETEXPPD Z22, K7, Z19                             // 62a2fd4f42de
+       VGETEXPPD Z18, K2, Z11                             // 6232fd4a42da
+       VGETEXPPD Z24, K2, Z11                             // 6212fd4a42d8
+       VGETEXPPD 17(SP)(BP*8), K2, Z11                    // 6272fd4a429cec11000000
+       VGETEXPPD 17(SP)(BP*4), K2, Z11                    // 6272fd4a429cac11000000
+       VGETEXPPD Z18, K2, Z5                              // 62b2fd4a42ea
+       VGETEXPPD Z24, K2, Z5                              // 6292fd4a42e8
+       VGETEXPPD 17(SP)(BP*8), K2, Z5                     // 62f2fd4a42acec11000000
+       VGETEXPPD 17(SP)(BP*4), K2, Z5                     // 62f2fd4a42acac11000000
+       VGETEXPPS X16, K4, X12                             // 62327d0c42e0
+       VGETEXPPS 99(R15)(R15*2), K4, X12                  // 62127d0c42a47f63000000
+       VGETEXPPS -7(DI), K4, X12                          // 62727d0c42a7f9ffffff
+       VGETEXPPS Y9, K1, Y7                               // 62d27d2942f9
+       VGETEXPPS -7(CX), K1, Y7                           // 62f27d2942b9f9ffffff
+       VGETEXPPS 15(DX)(BX*4), K1, Y7                     // 62f27d2942bc9a0f000000
+       VGETEXPPS Z7, K3, Z2                               // 62f27d4b42d7
+       VGETEXPPS Z13, K3, Z2                              // 62d27d4b42d5
+       VGETEXPPS Z7, K3, Z21                              // 62e27d4b42ef
+       VGETEXPPS Z13, K3, Z21                             // 62c27d4b42ed
+       VGETEXPPS Z6, K4, Z6                               // 62f27d4c42f6
+       VGETEXPPS Z22, K4, Z6                              // 62b27d4c42f6
+       VGETEXPPS 7(SI)(DI*4), K4, Z6                      // 62f27d4c42b4be07000000
+       VGETEXPPS -7(DI)(R8*2), K4, Z6                     // 62b27d4c42b447f9ffffff
+       VGETEXPPS Z6, K4, Z16                              // 62e27d4c42c6
+       VGETEXPPS Z22, K4, Z16                             // 62a27d4c42c6
+       VGETEXPPS 7(SI)(DI*4), K4, Z16                     // 62e27d4c4284be07000000
+       VGETEXPPS -7(DI)(R8*2), K4, Z16                    // 62a27d4c428447f9ffffff
+       VGETEXPSD X15, X8, K5, X28                         // 6242bd0d43e7
+       VGETEXPSD X19, X1, K7, X11                         // 6232f50f43db or 6232f52f43db or 6232f54f43db
+       VGETEXPSD 15(R8)(R14*4), X1, K7, X11               // 6212f50f439cb00f000000 or 6212f52f439cb00f000000 or 6212f54f439cb00f000000
+       VGETEXPSD -7(CX)(DX*4), X1, K7, X11                // 6272f50f439c91f9ffffff or 6272f52f439c91f9ffffff or 6272f54f439c91f9ffffff
+       VGETEXPSS X14, X2, K7, X13                         // 62526d0f43ee
+       VGETEXPSS X25, X0, K6, X0                          // 62927d0e43c1 or 62927d2e43c1 or 62927d4e43c1
+       VGETEXPSS -7(DI)(R8*1), X0, K6, X0                 // 62b27d0e438407f9ffffff or 62b27d2e438407f9ffffff or 62b27d4e438407f9ffffff
+       VGETEXPSS (SP), X0, K6, X0                         // 62f27d0e430424 or 62f27d2e430424 or 62f27d4e430424
+       VGETMANTPD $15, X17, K3, X11                       // 6233fd0b26d90f
+       VGETMANTPD $15, -7(CX)(DX*1), K3, X11              // 6273fd0b269c11f9ffffff0f
+       VGETMANTPD $15, -15(R14)(R15*4), K3, X11           // 6213fd0b269cbef1ffffff0f
+       VGETMANTPD $0, Y8, K7, Y31                         // 6243fd2f26f800
+       VGETMANTPD $0, 99(R15)(R15*8), K7, Y31             // 6203fd2f26bcff6300000000
+       VGETMANTPD $0, 7(AX)(CX*8), K7, Y31                // 6263fd2f26bcc80700000000
+       VGETMANTPD $1, Z13, K4, Z1                         // 62d3fd4c26cd01
+       VGETMANTPD $1, Z13, K4, Z15                        // 6253fd4c26fd01
+       VGETMANTPD $2, Z22, K4, Z18                        // 62a3fd4c26d602
+       VGETMANTPD $2, Z7, K4, Z18                         // 62e3fd4c26d702
+       VGETMANTPD $2, 17(SP), K4, Z18                     // 62e3fd4c2694241100000002
+       VGETMANTPD $2, -17(BP)(SI*4), K4, Z18              // 62e3fd4c2694b5efffffff02
+       VGETMANTPD $2, Z22, K4, Z8                         // 6233fd4c26c602
+       VGETMANTPD $2, Z7, K4, Z8                          // 6273fd4c26c702
+       VGETMANTPD $2, 17(SP), K4, Z8                      // 6273fd4c2684241100000002
+       VGETMANTPD $2, -17(BP)(SI*4), K4, Z8               // 6273fd4c2684b5efffffff02
+       VGETMANTPS $3, X11, K7, X18                        // 62c37d0f26d303
+       VGETMANTPS $3, 15(DX)(BX*1), K7, X18               // 62e37d0f26941a0f00000003
+       VGETMANTPS $3, -7(CX)(DX*2), K7, X18               // 62e37d0f269451f9ffffff03
+       VGETMANTPS $4, Y28, K2, Y1                         // 62937d2a26cc04
+       VGETMANTPS $4, (AX), K2, Y1                        // 62f37d2a260804
+       VGETMANTPS $4, 7(SI), K2, Y1                       // 62f37d2a268e0700000004
+       VGETMANTPS $5, Z20, K5, Z2                         // 62b37d4d26d405
+       VGETMANTPS $5, Z9, K5, Z2                          // 62d37d4d26d105
+       VGETMANTPS $5, Z20, K5, Z31                        // 62237d4d26fc05
+       VGETMANTPS $5, Z9, K5, Z31                         // 62437d4d26f905
+       VGETMANTPS $6, Z12, K3, Z1                         // 62d37d4b26cc06
+       VGETMANTPS $6, Z16, K3, Z1                         // 62b37d4b26c806
+       VGETMANTPS $6, 7(AX), K3, Z1                       // 62f37d4b26880700000006
+       VGETMANTPS $6, (DI), K3, Z1                        // 62f37d4b260f06
+       VGETMANTPS $6, Z12, K3, Z3                         // 62d37d4b26dc06
+       VGETMANTPS $6, Z16, K3, Z3                         // 62b37d4b26d806
+       VGETMANTPS $6, 7(AX), K3, Z3                       // 62f37d4b26980700000006
+       VGETMANTPS $6, (DI), K3, Z3                        // 62f37d4b261f06
+       VGETMANTSD $7, X24, X2, K4, X9                     // 6213ed0c27c807
+       VGETMANTSD $8, X27, X2, K2, X2                     // 6293ed0a27d308 or 6293ed2a27d308 or 6293ed4a27d308
+       VGETMANTSD $8, (R8), X2, K2, X2                    // 62d3ed0a271008 or 62d3ed2a271008 or 62d3ed4a271008
+       VGETMANTSD $8, 15(DX)(BX*2), X2, K2, X2            // 62f3ed0a27945a0f00000008 or 62f3ed2a27945a0f00000008 or 62f3ed4a27945a0f00000008
+       VGETMANTSS $9, X30, X22, K2, X26                   // 62034d0227d609
+       VGETMANTSS $10, X15, X11, K3, X3                   // 62d3250b27df0a or 62d3252b27df0a or 62d3254b27df0a
+       VGETMANTSS $10, -7(CX), X11, K3, X3                // 62f3250b2799f9ffffff0a or 62f3252b2799f9ffffff0a or 62f3254b2799f9ffffff0a
+       VGETMANTSS $10, 15(DX)(BX*4), X11, K3, X3          // 62f3250b279c9a0f0000000a or 62f3252b279c9a0f0000000a or 62f3254b279c9a0f0000000a
+       VINSERTF32X4 $0, X9, Y9, K1, Y2                    // 62d3352918d100
+       VINSERTF32X4 $0, 15(R8)(R14*8), Y9, K1, Y2         // 629335291894f00f00000000
+       VINSERTF32X4 $0, -15(R14)(R15*2), Y9, K1, Y2       // 6293352918947ef1ffffff00
+       VINSERTF32X4 $0, X26, Z20, K7, Z16                 // 62835d4718c200
+       VINSERTF32X4 $0, -15(R14)(R15*1), Z20, K7, Z16     // 62835d4718843ef1ffffff00
+       VINSERTF32X4 $0, -15(BX), Z20, K7, Z16             // 62e35d471883f1ffffff00
+       VINSERTF32X4 $0, X26, Z0, K7, Z16                  // 62837d4f18c200
+       VINSERTF32X4 $0, -15(R14)(R15*1), Z0, K7, Z16      // 62837d4f18843ef1ffffff00
+       VINSERTF32X4 $0, -15(BX), Z0, K7, Z16              // 62e37d4f1883f1ffffff00
+       VINSERTF32X4 $0, X26, Z20, K7, Z9                  // 62135d4718ca00
+       VINSERTF32X4 $0, -15(R14)(R15*1), Z20, K7, Z9      // 62135d47188c3ef1ffffff00
+       VINSERTF32X4 $0, -15(BX), Z20, K7, Z9              // 62735d47188bf1ffffff00
+       VINSERTF32X4 $0, X26, Z0, K7, Z9                   // 62137d4f18ca00
+       VINSERTF32X4 $0, -15(R14)(R15*1), Z0, K7, Z9       // 62137d4f188c3ef1ffffff00
+       VINSERTF32X4 $0, -15(BX), Z0, K7, Z9               // 62737d4f188bf1ffffff00
+       VINSERTF64X4 $1, Y30, Z9, K3, Z0                   // 6293b54b1ac601
+       VINSERTF64X4 $1, -17(BP)(SI*2), Z9, K3, Z0         // 62f3b54b1a8475efffffff01
+       VINSERTF64X4 $1, 7(AX)(CX*2), Z9, K3, Z0           // 62f3b54b1a84480700000001
+       VINSERTF64X4 $1, Y30, Z3, K3, Z0                   // 6293e54b1ac601
+       VINSERTF64X4 $1, -17(BP)(SI*2), Z3, K3, Z0         // 62f3e54b1a8475efffffff01
+       VINSERTF64X4 $1, 7(AX)(CX*2), Z3, K3, Z0           // 62f3e54b1a84480700000001
+       VINSERTF64X4 $1, Y30, Z9, K3, Z26                  // 6203b54b1ad601
+       VINSERTF64X4 $1, -17(BP)(SI*2), Z9, K3, Z26        // 6263b54b1a9475efffffff01
+       VINSERTF64X4 $1, 7(AX)(CX*2), Z9, K3, Z26          // 6263b54b1a94480700000001
+       VINSERTF64X4 $1, Y30, Z3, K3, Z26                  // 6203e54b1ad601
+       VINSERTF64X4 $1, -17(BP)(SI*2), Z3, K3, Z26        // 6263e54b1a9475efffffff01
+       VINSERTF64X4 $1, 7(AX)(CX*2), Z3, K3, Z26          // 6263e54b1a94480700000001
+       VINSERTI32X4 $0, X31, Y7, K4, Y26                  // 6203452c38d700
+       VINSERTI32X4 $0, 17(SP)(BP*8), Y7, K4, Y26         // 6263452c3894ec1100000000
+       VINSERTI32X4 $0, 17(SP)(BP*4), Y7, K4, Y26         // 6263452c3894ac1100000000
+       VINSERTI32X4 $2, X16, Z9, K5, Z9                   // 6233354d38c802
+       VINSERTI32X4 $2, 7(SI)(DI*4), Z9, K5, Z9           // 6273354d388cbe0700000002
+       VINSERTI32X4 $2, -7(DI)(R8*2), Z9, K5, Z9          // 6233354d388c47f9ffffff02
+       VINSERTI32X4 $2, X16, Z28, K5, Z9                  // 62331d4538c802
+       VINSERTI32X4 $2, 7(SI)(DI*4), Z28, K5, Z9          // 62731d45388cbe0700000002
+       VINSERTI32X4 $2, -7(DI)(R8*2), Z28, K5, Z9         // 62331d45388c47f9ffffff02
+       VINSERTI32X4 $2, X16, Z9, K5, Z25                  // 6223354d38c802
+       VINSERTI32X4 $2, 7(SI)(DI*4), Z9, K5, Z25          // 6263354d388cbe0700000002
+       VINSERTI32X4 $2, -7(DI)(R8*2), Z9, K5, Z25         // 6223354d388c47f9ffffff02
+       VINSERTI32X4 $2, X16, Z28, K5, Z25                 // 62231d4538c802
+       VINSERTI32X4 $2, 7(SI)(DI*4), Z28, K5, Z25         // 62631d45388cbe0700000002
+       VINSERTI32X4 $2, -7(DI)(R8*2), Z28, K5, Z25        // 62231d45388c47f9ffffff02
+       VINSERTI64X4 $1, Y31, Z6, K3, Z21                  // 6283cd4b3aef01
+       VINSERTI64X4 $1, (R14), Z6, K3, Z21                // 62c3cd4b3a2e01
+       VINSERTI64X4 $1, -7(DI)(R8*8), Z6, K3, Z21         // 62a3cd4b3aacc7f9ffffff01
+       VINSERTI64X4 $1, Y31, Z9, K3, Z21                  // 6283b54b3aef01
+       VINSERTI64X4 $1, (R14), Z9, K3, Z21                // 62c3b54b3a2e01
+       VINSERTI64X4 $1, -7(DI)(R8*8), Z9, K3, Z21         // 62a3b54b3aacc7f9ffffff01
+       VINSERTI64X4 $1, Y31, Z6, K3, Z9                   // 6213cd4b3acf01
+       VINSERTI64X4 $1, (R14), Z6, K3, Z9                 // 6253cd4b3a0e01
+       VINSERTI64X4 $1, -7(DI)(R8*8), Z6, K3, Z9          // 6233cd4b3a8cc7f9ffffff01
+       VINSERTI64X4 $1, Y31, Z9, K3, Z9                   // 6213b54b3acf01
+       VINSERTI64X4 $1, (R14), Z9, K3, Z9                 // 6253b54b3a0e01
+       VINSERTI64X4 $1, -7(DI)(R8*8), Z9, K3, Z9          // 6233b54b3a8cc7f9ffffff01
+       VMAXPD X21, X16, K7, X0                            // 62b1fd075fc5
+       VMAXPD 99(R15)(R15*1), X16, K7, X0                 // 6291fd075f843f63000000
+       VMAXPD (DX), X16, K7, X0                           // 62f1fd075f02
+       VMAXPD Y21, Y6, K4, Y22                            // 62a1cd2c5ff5
+       VMAXPD 99(R15)(R15*4), Y6, K4, Y22                 // 6281cd2c5fb4bf63000000
+       VMAXPD 15(DX), Y6, K4, Y22                         // 62e1cd2c5fb20f000000
+       VMAXPD Z30, Z20, K4, Z1                            // 6291dd445fce
+       VMAXPD Z5, Z20, K4, Z1                             // 62f1dd445fcd
+       VMAXPD Z30, Z9, K4, Z1                             // 6291b54c5fce
+       VMAXPD Z5, Z9, K4, Z1                              // 62f1b54c5fcd
+       VMAXPD Z30, Z20, K4, Z9                            // 6211dd445fce
+       VMAXPD Z5, Z20, K4, Z9                             // 6271dd445fcd
+       VMAXPD Z30, Z9, K4, Z9                             // 6211b54c5fce
+       VMAXPD Z5, Z9, K4, Z9                              // 6271b54c5fcd
+       VMAXPD Z16, Z7, K7, Z26                            // 6221c54f5fd0
+       VMAXPD Z25, Z7, K7, Z26                            // 6201c54f5fd1
+       VMAXPD 7(SI)(DI*1), Z7, K7, Z26                    // 6261c54f5f943e07000000
+       VMAXPD 15(DX)(BX*8), Z7, K7, Z26                   // 6261c54f5f94da0f000000
+       VMAXPD Z16, Z21, K7, Z26                           // 6221d5475fd0
+       VMAXPD Z25, Z21, K7, Z26                           // 6201d5475fd1
+       VMAXPD 7(SI)(DI*1), Z21, K7, Z26                   // 6261d5475f943e07000000
+       VMAXPD 15(DX)(BX*8), Z21, K7, Z26                  // 6261d5475f94da0f000000
+       VMAXPD Z16, Z7, K7, Z22                            // 62a1c54f5ff0
+       VMAXPD Z25, Z7, K7, Z22                            // 6281c54f5ff1
+       VMAXPD 7(SI)(DI*1), Z7, K7, Z22                    // 62e1c54f5fb43e07000000
+       VMAXPD 15(DX)(BX*8), Z7, K7, Z22                   // 62e1c54f5fb4da0f000000
+       VMAXPD Z16, Z21, K7, Z22                           // 62a1d5475ff0
+       VMAXPD Z25, Z21, K7, Z22                           // 6281d5475ff1
+       VMAXPD 7(SI)(DI*1), Z21, K7, Z22                   // 62e1d5475fb43e07000000
+       VMAXPD 15(DX)(BX*8), Z21, K7, Z22                  // 62e1d5475fb4da0f000000
+       VMAXPS X22, X28, K2, X0                            // 62b11c025fc6
+       VMAXPS -17(BP)(SI*8), X28, K2, X0                  // 62f11c025f84f5efffffff
+       VMAXPS (R15), X28, K2, X0                          // 62d11c025f07
+       VMAXPS Y28, Y0, K5, Y7                             // 62917c2d5ffc
+       VMAXPS (CX), Y0, K5, Y7                            // 62f17c2d5f39
+       VMAXPS 99(R15), Y0, K5, Y7                         // 62d17c2d5fbf63000000
+       VMAXPS Z21, Z12, K3, Z14                           // 62311c4b5ff5
+       VMAXPS Z9, Z12, K3, Z14                            // 62511c4b5ff1
+       VMAXPS Z21, Z13, K3, Z14                           // 6231144b5ff5
+       VMAXPS Z9, Z13, K3, Z14                            // 6251144b5ff1
+       VMAXPS Z21, Z12, K3, Z13                           // 62311c4b5fed
+       VMAXPS Z9, Z12, K3, Z13                            // 62511c4b5fe9
+       VMAXPS Z21, Z13, K3, Z13                           // 6231144b5fed
+       VMAXPS Z9, Z13, K3, Z13                            // 6251144b5fe9
+       VMAXPS Z23, Z27, K4, Z2                            // 62b124445fd7
+       VMAXPS Z9, Z27, K4, Z2                             // 62d124445fd1
+       VMAXPS -7(DI)(R8*1), Z27, K4, Z2                   // 62b124445f9407f9ffffff
+       VMAXPS (SP), Z27, K4, Z2                           // 62f124445f1424
+       VMAXPS Z23, Z25, K4, Z2                            // 62b134445fd7
+       VMAXPS Z9, Z25, K4, Z2                             // 62d134445fd1
+       VMAXPS -7(DI)(R8*1), Z25, K4, Z2                   // 62b134445f9407f9ffffff
+       VMAXPS (SP), Z25, K4, Z2                           // 62f134445f1424
+       VMAXPS Z23, Z27, K4, Z7                            // 62b124445fff
+       VMAXPS Z9, Z27, K4, Z7                             // 62d124445ff9
+       VMAXPS -7(DI)(R8*1), Z27, K4, Z7                   // 62b124445fbc07f9ffffff
+       VMAXPS (SP), Z27, K4, Z7                           // 62f124445f3c24
+       VMAXPS Z23, Z25, K4, Z7                            // 62b134445fff
+       VMAXPS Z9, Z25, K4, Z7                             // 62d134445ff9
+       VMAXPS -7(DI)(R8*1), Z25, K4, Z7                   // 62b134445fbc07f9ffffff
+       VMAXPS (SP), Z25, K4, Z7                           // 62f134445f3c24
+       VMAXSD X7, X19, K2, X7                             // 62f1e7025fff
+       VMAXSD X1, X31, K2, X16                            // 62e187025fc1 or 62e187225fc1 or 62e187425fc1
+       VMAXSD 17(SP)(BP*1), X31, K2, X16                  // 62e187025f842c11000000 or 62e187225f842c11000000 or 62e187425f842c11000000
+       VMAXSD -7(CX)(DX*8), X31, K2, X16                  // 62e187025f84d1f9ffffff or 62e187225f84d1f9ffffff or 62e187425f84d1f9ffffff
+       VMAXSS X15, X9, K3, X7                             // 62d1360b5fff
+       VMAXSS X12, X0, K3, X12                            // 62517e0b5fe4 or 62517e2b5fe4 or 62517e4b5fe4
+       VMAXSS (AX), X0, K3, X12                           // 62717e0b5f20 or 62717e2b5f20 or 62717e4b5f20
+       VMAXSS 7(SI), X0, K3, X12                          // 62717e0b5fa607000000 or 62717e2b5fa607000000 or 62717e4b5fa607000000
+       VMINPD X17, X5, K3, X14                            // 6231d50b5df1
+       VMINPD 7(SI)(DI*8), X5, K3, X14                    // 6271d50b5db4fe07000000
+       VMINPD -15(R14), X5, K3, X14                       // 6251d50b5db6f1ffffff
+       VMINPD Y24, Y14, K2, Y20                           // 62818d2a5de0
+       VMINPD 99(R15)(R15*2), Y14, K2, Y20                // 62818d2a5da47f63000000
+       VMINPD -7(DI), Y14, K2, Y20                        // 62e18d2a5da7f9ffffff
+       VMINPD Z14, Z3, K1, Z27                            // 6241e5495dde
+       VMINPD Z7, Z3, K1, Z27                             // 6261e5495ddf
+       VMINPD Z14, Z0, K1, Z27                            // 6241fd495dde
+       VMINPD Z7, Z0, K1, Z27                             // 6261fd495ddf
+       VMINPD Z14, Z3, K1, Z14                            // 6251e5495df6
+       VMINPD Z7, Z3, K1, Z14                             // 6271e5495df7
+       VMINPD Z14, Z0, K1, Z14                            // 6251fd495df6
+       VMINPD Z7, Z0, K1, Z14                             // 6271fd495df7
+       VMINPD Z1, Z22, K2, Z8                             // 6271cd425dc1
+       VMINPD Z16, Z22, K2, Z8                            // 6231cd425dc0
+       VMINPD -7(CX), Z22, K2, Z8                         // 6271cd425d81f9ffffff
+       VMINPD 15(DX)(BX*4), Z22, K2, Z8                   // 6271cd425d849a0f000000
+       VMINPD Z1, Z25, K2, Z8                             // 6271b5425dc1
+       VMINPD Z16, Z25, K2, Z8                            // 6231b5425dc0
+       VMINPD -7(CX), Z25, K2, Z8                         // 6271b5425d81f9ffffff
+       VMINPD 15(DX)(BX*4), Z25, K2, Z8                   // 6271b5425d849a0f000000
+       VMINPD Z1, Z22, K2, Z24                            // 6261cd425dc1
+       VMINPD Z16, Z22, K2, Z24                           // 6221cd425dc0
+       VMINPD -7(CX), Z22, K2, Z24                        // 6261cd425d81f9ffffff
+       VMINPD 15(DX)(BX*4), Z22, K2, Z24                  // 6261cd425d849a0f000000
+       VMINPD Z1, Z25, K2, Z24                            // 6261b5425dc1
+       VMINPD Z16, Z25, K2, Z24                           // 6221b5425dc0
+       VMINPD -7(CX), Z25, K2, Z24                        // 6261b5425d81f9ffffff
+       VMINPD 15(DX)(BX*4), Z25, K2, Z24                  // 6261b5425d849a0f000000
+       VMINPS X3, X8, K1, X15                             // 62713c095dfb
+       VMINPS 7(SI)(DI*1), X8, K1, X15                    // 62713c095dbc3e07000000
+       VMINPS 15(DX)(BX*8), X8, K1, X15                   // 62713c095dbcda0f000000
+       VMINPS Y14, Y20, K7, Y13                           // 62515c275dee
+       VMINPS -7(CX)(DX*1), Y20, K7, Y13                  // 62715c275dac11f9ffffff
+       VMINPS -15(R14)(R15*4), Y20, K7, Y13               // 62115c275dacbef1ffffff
+       VMINPS Z15, Z0, K1, Z6                             // 62d17c495df7
+       VMINPS Z12, Z0, K1, Z6                             // 62d17c495df4
+       VMINPS Z15, Z8, K1, Z6                             // 62d13c495df7
+       VMINPS Z12, Z8, K1, Z6                             // 62d13c495df4
+       VMINPS Z15, Z0, K1, Z2                             // 62d17c495dd7
+       VMINPS Z12, Z0, K1, Z2                             // 62d17c495dd4
+       VMINPS Z15, Z8, K1, Z2                             // 62d13c495dd7
+       VMINPS Z12, Z8, K1, Z2                             // 62d13c495dd4
+       VMINPS Z13, Z11, K1, Z14                           // 625124495df5
+       VMINPS Z14, Z11, K1, Z14                           // 625124495df6
+       VMINPS 99(R15)(R15*8), Z11, K1, Z14                // 621124495db4ff63000000
+       VMINPS 7(AX)(CX*8), Z11, K1, Z14                   // 627124495db4c807000000
+       VMINPS Z13, Z5, K1, Z14                            // 625154495df5
+       VMINPS Z14, Z5, K1, Z14                            // 625154495df6
+       VMINPS 99(R15)(R15*8), Z5, K1, Z14                 // 621154495db4ff63000000
+       VMINPS 7(AX)(CX*8), Z5, K1, Z14                    // 627154495db4c807000000
+       VMINPS Z13, Z11, K1, Z27                           // 624124495ddd
+       VMINPS Z14, Z11, K1, Z27                           // 624124495dde
+       VMINPS 99(R15)(R15*8), Z11, K1, Z27                // 620124495d9cff63000000
+       VMINPS 7(AX)(CX*8), Z11, K1, Z27                   // 626124495d9cc807000000
+       VMINPS Z13, Z5, K1, Z27                            // 624154495ddd
+       VMINPS Z14, Z5, K1, Z27                            // 624154495dde
+       VMINPS 99(R15)(R15*8), Z5, K1, Z27                 // 620154495d9cff63000000
+       VMINPS 7(AX)(CX*8), Z5, K1, Z27                    // 626154495d9cc807000000
+       VMINSD X13, X23, K1, X26                           // 6241c7015dd5
+       VMINSD X9, X24, K7, X28                            // 6241bf075de1 or 6241bf275de1 or 6241bf475de1
+       VMINSD -17(BP)(SI*2), X24, K7, X28                 // 6261bf075da475efffffff or 6261bf275da475efffffff or 6261bf475da475efffffff
+       VMINSD 7(AX)(CX*2), X24, K7, X28                   // 6261bf075da44807000000 or 6261bf275da44807000000 or 6261bf475da44807000000
+       VMINSS X18, X26, K2, X15                           // 62312e025dfa
+       VMINSS X11, X1, K4, X21                            // 62c1760c5deb or 62c1762c5deb or 62c1764c5deb
+       VMINSS (BX), X1, K4, X21                           // 62e1760c5d2b or 62e1762c5d2b or 62e1764c5d2b
+       VMINSS -17(BP)(SI*1), X1, K4, X21                  // 62e1760c5dac35efffffff or 62e1762c5dac35efffffff or 62e1764c5dac35efffffff
+       VMOVAPD X3, K1, X31                                // 6291fd0929df
+       VMOVAPD X3, K1, -7(DI)(R8*1)                       // 62b1fd09299c07f9ffffff
+       VMOVAPD X3, K1, (SP)                               // 62f1fd09291c24
+       VMOVAPD X0, K3, X7                                 // 62f1fd0b29c7
+       VMOVAPD -7(CX), K3, X7                             // 62f1fd0b28b9f9ffffff
+       VMOVAPD 15(DX)(BX*4), K3, X7                       // 62f1fd0b28bc9a0f000000
+       VMOVAPD Y1, K4, Y21                                // 62b1fd2c29cd
+       VMOVAPD Y1, K4, 15(DX)(BX*1)                       // 62f1fd2c298c1a0f000000
+       VMOVAPD Y1, K4, -7(CX)(DX*2)                       // 62f1fd2c298c51f9ffffff
+       VMOVAPD Y30, K5, Y26                               // 6201fd2d29f2
+       VMOVAPD -17(BP), K5, Y26                           // 6261fd2d2895efffffff
+       VMOVAPD -15(R14)(R15*8), K5, Y26                   // 6201fd2d2894fef1ffffff
+       VMOVAPD Z2, K7, Z5                                 // 62f1fd4f29d5
+       VMOVAPD Z2, K7, Z23                                // 62b1fd4f29d7
+       VMOVAPD Z2, K7, (AX)                               // 62f1fd4f2910
+       VMOVAPD Z2, K7, 7(SI)                              // 62f1fd4f299607000000
+       VMOVAPD Z26, K7, Z6                                // 6261fd4f29d6
+       VMOVAPD Z14, K7, Z6                                // 6271fd4f29f6
+       VMOVAPD (BX), K7, Z6                               // 62f1fd4f2833
+       VMOVAPD -17(BP)(SI*1), K7, Z6                      // 62f1fd4f28b435efffffff
+       VMOVAPD Z26, K7, Z14                               // 6241fd4f29d6
+       VMOVAPD Z14, K7, Z14                               // 6251fd4f29f6
+       VMOVAPD (BX), K7, Z14                              // 6271fd4f2833
+       VMOVAPD -17(BP)(SI*1), K7, Z14                     // 6271fd4f28b435efffffff
+       VMOVAPS X24, K6, X0                                // 62617c0e29c0
+       VMOVAPS X24, K6, 99(R15)(R15*8)                    // 62017c0e2984ff63000000
+       VMOVAPS X24, K6, 7(AX)(CX*8)                       // 62617c0e2984c807000000
+       VMOVAPS X7, K3, X20                                // 62b17c0b29fc
+       VMOVAPS (AX), K3, X20                              // 62e17c0b2820
+       VMOVAPS 7(SI), K3, X20                             // 62e17c0b28a607000000
+       VMOVAPS Y22, K7, Y12                               // 62c17c2f29f4
+       VMOVAPS Y22, K7, 17(SP)(BP*2)                      // 62e17c2f29b46c11000000
+       VMOVAPS Y22, K7, -7(DI)(R8*4)                      // 62a17c2f29b487f9ffffff
+       VMOVAPS Y15, K4, Y3                                // 62717c2c29fb
+       VMOVAPS 15(R8), K4, Y3                             // 62d17c2c28980f000000
+       VMOVAPS (BP), K4, Y3                               // 62f17c2c285d00
+       VMOVAPS Z13, K4, Z28                               // 62117c4c29ec
+       VMOVAPS Z21, K4, Z28                               // 62817c4c29ec
+       VMOVAPS Z13, K4, Z6                                // 62717c4c29ee
+       VMOVAPS Z21, K4, Z6                                // 62e17c4c29ee
+       VMOVAPS Z13, K4, 15(R8)(R14*4)                     // 62117c4c29acb00f000000
+       VMOVAPS Z21, K4, 15(R8)(R14*4)                     // 62817c4c29acb00f000000
+       VMOVAPS Z13, K4, -7(CX)(DX*4)                      // 62717c4c29ac91f9ffffff
+       VMOVAPS Z21, K4, -7(CX)(DX*4)                      // 62e17c4c29ac91f9ffffff
+       VMOVAPS Z3, K7, Z26                                // 62917c4f29da
+       VMOVAPS Z0, K7, Z26                                // 62917c4f29c2
+       VMOVAPS (R8), K7, Z26                              // 62417c4f2810
+       VMOVAPS 15(DX)(BX*2), K7, Z26                      // 62617c4f28945a0f000000
+       VMOVAPS Z3, K7, Z3                                 // 62f17c4f29db
+       VMOVAPS Z0, K7, Z3                                 // 62f17c4f29c3
+       VMOVAPS (R8), K7, Z3                               // 62d17c4f2818
+       VMOVAPS 15(DX)(BX*2), K7, Z3                       // 62f17c4f289c5a0f000000
+       VMOVDDUP X5, K2, X14                               // 6271ff0a12f5
+       VMOVDDUP 15(R8)(R14*1), K2, X14                    // 6211ff0a12b4300f000000
+       VMOVDDUP 15(R8)(R14*2), K2, X14                    // 6211ff0a12b4700f000000
+       VMOVDDUP Y27, K5, Y1                               // 6291ff2d12cb
+       VMOVDDUP 15(R8)(R14*8), K5, Y1                     // 6291ff2d128cf00f000000
+       VMOVDDUP -15(R14)(R15*2), K5, Y1                   // 6291ff2d128c7ef1ffffff
+       VMOVDDUP Z11, K3, Z21                              // 62c1ff4b12eb
+       VMOVDDUP Z25, K3, Z21                              // 6281ff4b12e9
+       VMOVDDUP 17(SP)(BP*1), K3, Z21                     // 62e1ff4b12ac2c11000000
+       VMOVDDUP -7(CX)(DX*8), K3, Z21                     // 62e1ff4b12acd1f9ffffff
+       VMOVDDUP Z11, K3, Z13                              // 6251ff4b12eb
+       VMOVDDUP Z25, K3, Z13                              // 6211ff4b12e9
+       VMOVDDUP 17(SP)(BP*1), K3, Z13                     // 6271ff4b12ac2c11000000
+       VMOVDDUP -7(CX)(DX*8), K3, Z13                     // 6271ff4b12acd1f9ffffff
+       VMOVDQA32 X3, K4, X31                              // 62917d0c7fdf
+       VMOVDQA32 X3, K4, (BX)                             // 62f17d0c7f1b
+       VMOVDQA32 X3, K4, -17(BP)(SI*1)                    // 62f17d0c7f9c35efffffff
+       VMOVDQA32 X1, K2, X21                              // 62b17d0a7fcd
+       VMOVDQA32 15(R8)(R14*4), K2, X21                   // 62817d0a6facb00f000000
+       VMOVDQA32 -7(CX)(DX*4), K2, X21                    // 62e17d0a6fac91f9ffffff
+       VMOVDQA32 Y5, K2, Y19                              // 62b17d2a7feb
+       VMOVDQA32 Y5, K2, -15(R14)(R15*1)                  // 62917d2a7fac3ef1ffffff
+       VMOVDQA32 Y5, K2, -15(BX)                          // 62f17d2a7fabf1ffffff
+       VMOVDQA32 Y13, K3, Y17                             // 62317d2b7fe9
+       VMOVDQA32 7(AX)(CX*4), K3, Y17                     // 62e17d2b6f8c8807000000
+       VMOVDQA32 7(AX)(CX*1), K3, Y17                     // 62e17d2b6f8c0807000000
+       VMOVDQA32 Z27, K3, Z3                              // 62617d4b7fdb
+       VMOVDQA32 Z15, K3, Z3                              // 62717d4b7ffb
+       VMOVDQA32 Z27, K3, Z12                             // 62417d4b7fdc
+       VMOVDQA32 Z15, K3, Z12                             // 62517d4b7ffc
+       VMOVDQA32 Z27, K3, -17(BP)(SI*2)                   // 62617d4b7f9c75efffffff
+       VMOVDQA32 Z15, K3, -17(BP)(SI*2)                   // 62717d4b7fbc75efffffff
+       VMOVDQA32 Z27, K3, 7(AX)(CX*2)                     // 62617d4b7f9c4807000000
+       VMOVDQA32 Z15, K3, 7(AX)(CX*2)                     // 62717d4b7fbc4807000000
+       VMOVDQA32 Z23, K3, Z23                             // 62a17d4b7fff
+       VMOVDQA32 Z6, K3, Z23                              // 62b17d4b7ff7
+       VMOVDQA32 15(R8)(R14*1), K3, Z23                   // 62817d4b6fbc300f000000
+       VMOVDQA32 15(R8)(R14*2), K3, Z23                   // 62817d4b6fbc700f000000
+       VMOVDQA32 Z23, K3, Z5                              // 62e17d4b7ffd
+       VMOVDQA32 Z6, K3, Z5                               // 62f17d4b7ff5
+       VMOVDQA32 15(R8)(R14*1), K3, Z5                    // 62917d4b6fac300f000000
+       VMOVDQA32 15(R8)(R14*2), K3, Z5                    // 62917d4b6fac700f000000
+       VMOVDQA64 X13, K2, X11                             // 6251fd0a7feb
+       VMOVDQA64 X13, K2, (R8)                            // 6251fd0a7f28
+       VMOVDQA64 X13, K2, 15(DX)(BX*2)                    // 6271fd0a7fac5a0f000000
+       VMOVDQA64 X30, K1, X0                              // 6261fd097ff0
+       VMOVDQA64 17(SP)(BP*1), K1, X0                     // 62f1fd096f842c11000000
+       VMOVDQA64 -7(CX)(DX*8), K1, X0                     // 62f1fd096f84d1f9ffffff
+       VMOVDQA64 Y7, K2, Y21                              // 62b1fd2a7ffd
+       VMOVDQA64 Y7, K2, (SI)                             // 62f1fd2a7f3e
+       VMOVDQA64 Y7, K2, 7(SI)(DI*2)                      // 62f1fd2a7fbc7e07000000
+       VMOVDQA64 Y13, K1, Y30                             // 6211fd297fee
+       VMOVDQA64 17(SP)(BP*8), K1, Y30                    // 6261fd296fb4ec11000000
+       VMOVDQA64 17(SP)(BP*4), K1, Y30                    // 6261fd296fb4ac11000000
+       VMOVDQA64 Z21, K7, Z8                              // 62c1fd4f7fe8
+       VMOVDQA64 Z5, K7, Z8                               // 62d1fd4f7fe8
+       VMOVDQA64 Z21, K7, Z28                             // 6281fd4f7fec
+       VMOVDQA64 Z5, K7, Z28                              // 6291fd4f7fec
+       VMOVDQA64 Z21, K7, (R14)                           // 62c1fd4f7f2e
+       VMOVDQA64 Z5, K7, (R14)                            // 62d1fd4f7f2e
+       VMOVDQA64 Z21, K7, -7(DI)(R8*8)                    // 62a1fd4f7facc7f9ffffff
+       VMOVDQA64 Z5, K7, -7(DI)(R8*8)                     // 62b1fd4f7facc7f9ffffff
+       VMOVDQA64 Z12, K1, Z16                             // 6231fd497fe0
+       VMOVDQA64 Z27, K1, Z16                             // 6221fd497fd8
+       VMOVDQA64 99(R15)(R15*4), K1, Z16                  // 6281fd496f84bf63000000
+       VMOVDQA64 15(DX), K1, Z16                          // 62e1fd496f820f000000
+       VMOVDQA64 Z12, K1, Z13                             // 6251fd497fe5
+       VMOVDQA64 Z27, K1, Z13                             // 6241fd497fdd
+       VMOVDQA64 99(R15)(R15*4), K1, Z13                  // 6211fd496facbf63000000
+       VMOVDQA64 15(DX), K1, Z13                          // 6271fd496faa0f000000
+       VMOVDQU32 X8, K3, X19                              // 62317e0b7fc3
+       VMOVDQU32 X8, K3, (R14)                            // 62517e0b7f06
+       VMOVDQU32 X8, K3, -7(DI)(R8*8)                     // 62317e0b7f84c7f9ffffff
+       VMOVDQU32 X26, K4, X8                              // 62417e0c7fd0
+       VMOVDQU32 99(R15)(R15*4), K4, X8                   // 62117e0c6f84bf63000000
+       VMOVDQU32 15(DX), K4, X8                           // 62717e0c6f820f000000
+       VMOVDQU32 Y5, K5, Y24                              // 62917e2d7fe8
+       VMOVDQU32 Y5, K5, 7(AX)                            // 62f17e2d7fa807000000
+       VMOVDQU32 Y5, K5, (DI)                             // 62f17e2d7f2f
+       VMOVDQU32 Y21, K7, Y24                             // 62817e2f7fe8
+       VMOVDQU32 99(R15)(R15*1), K7, Y24                  // 62017e2f6f843f63000000
+       VMOVDQU32 (DX), K7, Y24                            // 62617e2f6f02
+       VMOVDQU32 Z6, K7, Z9                               // 62d17e4f7ff1
+       VMOVDQU32 Z25, K7, Z9                              // 62417e4f7fc9
+       VMOVDQU32 Z6, K7, Z12                              // 62d17e4f7ff4
+       VMOVDQU32 Z25, K7, Z12                             // 62417e4f7fcc
+       VMOVDQU32 Z6, K7, -7(CX)(DX*1)                     // 62f17e4f7fb411f9ffffff
+       VMOVDQU32 Z25, K7, -7(CX)(DX*1)                    // 62617e4f7f8c11f9ffffff
+       VMOVDQU32 Z6, K7, -15(R14)(R15*4)                  // 62917e4f7fb4bef1ffffff
+       VMOVDQU32 Z25, K7, -15(R14)(R15*4)                 // 62017e4f7f8cbef1ffffff
+       VMOVDQU32 Z8, K6, Z3                               // 62717e4e7fc3
+       VMOVDQU32 Z2, K6, Z3                               // 62f17e4e7fd3
+       VMOVDQU32 15(DX)(BX*1), K6, Z3                     // 62f17e4e6f9c1a0f000000
+       VMOVDQU32 -7(CX)(DX*2), K6, Z3                     // 62f17e4e6f9c51f9ffffff
+       VMOVDQU32 Z8, K6, Z21                              // 62317e4e7fc5
+       VMOVDQU32 Z2, K6, Z21                              // 62b17e4e7fd5
+       VMOVDQU32 15(DX)(BX*1), K6, Z21                    // 62e17e4e6fac1a0f000000
+       VMOVDQU32 -7(CX)(DX*2), K6, Z21                    // 62e17e4e6fac51f9ffffff
+       VMOVDQU64 X12, K3, X23                             // 6231fe0b7fe7
+       VMOVDQU64 X12, K3, (CX)                            // 6271fe0b7f21
+       VMOVDQU64 X12, K3, 99(R15)                         // 6251fe0b7fa763000000
+       VMOVDQU64 X23, K7, X16                             // 62a1fe0f7ff8
+       VMOVDQU64 99(R15)(R15*2), K7, X16                  // 6281fe0f6f847f63000000
+       VMOVDQU64 -7(DI), K7, X16                          // 62e1fe0f6f87f9ffffff
+       VMOVDQU64 Y9, K4, Y16                              // 6231fe2c7fc8
+       VMOVDQU64 Y9, K4, -17(BP)(SI*8)                    // 6271fe2c7f8cf5efffffff
+       VMOVDQU64 Y9, K4, (R15)                            // 6251fe2c7f0f
+       VMOVDQU64 Y9, K4, Y13                              // 6251fe2c7fcd
+       VMOVDQU64 7(SI)(DI*8), K4, Y13                     // 6271fe2c6facfe07000000
+       VMOVDQU64 -15(R14), K4, Y13                        // 6251fe2c6faef1ffffff
+       VMOVDQU64 Z7, K7, Z3                               // 62f1fe4f7ffb
+       VMOVDQU64 Z9, K7, Z3                               // 6271fe4f7fcb
+       VMOVDQU64 Z7, K7, Z27                              // 6291fe4f7ffb
+       VMOVDQU64 Z9, K7, Z27                              // 6211fe4f7fcb
+       VMOVDQU64 Z7, K7, -17(BP)                          // 62f1fe4f7fbdefffffff
+       VMOVDQU64 Z9, K7, -17(BP)                          // 6271fe4f7f8defffffff
+       VMOVDQU64 Z7, K7, -15(R14)(R15*8)                  // 6291fe4f7fbcfef1ffffff
+       VMOVDQU64 Z9, K7, -15(R14)(R15*8)                  // 6211fe4f7f8cfef1ffffff
+       VMOVDQU64 Z20, K2, Z0                              // 62e1fe4a7fe0
+       VMOVDQU64 Z28, K2, Z0                              // 6261fe4a7fe0
+       VMOVDQU64 17(SP)(BP*2), K2, Z0                     // 62f1fe4a6f846c11000000
+       VMOVDQU64 -7(DI)(R8*4), K2, Z0                     // 62b1fe4a6f8487f9ffffff
+       VMOVDQU64 Z20, K2, Z6                              // 62e1fe4a7fe6
+       VMOVDQU64 Z28, K2, Z6                              // 6261fe4a7fe6
+       VMOVDQU64 17(SP)(BP*2), K2, Z6                     // 62f1fe4a6fb46c11000000
+       VMOVDQU64 -7(DI)(R8*4), K2, Z6                     // 62b1fe4a6fb487f9ffffff
+       VMOVHPS (R14), X2, X23                             // 62c16c08163e
+       VMOVHPS -7(DI)(R8*8), X2, X23                      // 62a16c0816bcc7f9ffffff
+       VMOVHPS X20, 99(R15)(R15*4)                        // 62817c0817a4bf63000000
+       VMOVHPS X20, 15(DX)                                // 62e17c0817a20f000000
+       VMOVLHPS X0, X25, X5                               // 62f1340016e8
+       VMOVNTDQ Y26, -7(CX)                               // 62617d28e791f9ffffff
+       VMOVNTDQ Y26, 15(DX)(BX*4)                         // 62617d28e7949a0f000000
+       VMOVNTDQ Z18, -15(R14)(R15*1)                      // 62817d48e7943ef1ffffff
+       VMOVNTDQ Z24, -15(R14)(R15*1)                      // 62017d48e7843ef1ffffff
+       VMOVNTDQ Z18, -15(BX)                              // 62e17d48e793f1ffffff
+       VMOVNTDQ Z24, -15(BX)                              // 62617d48e783f1ffffff
+       VMOVNTDQA 7(AX)(CX*4), Z2                          // 62f27d482a948807000000
+       VMOVNTDQA 7(AX)(CX*1), Z2                          // 62f27d482a940807000000
+       VMOVNTDQA 7(AX)(CX*4), Z21                         // 62e27d482aac8807000000
+       VMOVNTDQA 7(AX)(CX*1), Z21                         // 62e27d482aac0807000000
+       VMOVNTPD Y26, (AX)                                 // 6261fd282b10
+       VMOVNTPD Y26, 7(SI)                                // 6261fd282b9607000000
+       VMOVNTPD Z7, (SI)                                  // 62f1fd482b3e
+       VMOVNTPD Z13, (SI)                                 // 6271fd482b2e
+       VMOVNTPD Z7, 7(SI)(DI*2)                           // 62f1fd482bbc7e07000000
+       VMOVNTPD Z13, 7(SI)(DI*2)                          // 6271fd482bac7e07000000
+       VMOVNTPS X31, 15(R8)(R14*8)                        // 62017c082bbcf00f000000
+       VMOVNTPS X31, -15(R14)(R15*2)                      // 62017c082bbc7ef1ffffff
+       VMOVNTPS Z6, 17(SP)(BP*8)                          // 62f17c482bb4ec11000000
+       VMOVNTPS Z16, 17(SP)(BP*8)                         // 62e17c482b84ec11000000
+       VMOVNTPS Z6, 17(SP)(BP*4)                          // 62f17c482bb4ac11000000
+       VMOVNTPS Z16, 17(SP)(BP*4)                         // 62e17c482b84ac11000000
+       VMOVSD -7(CX)(DX*1), K3, X11                       // 6271ff0b109c11f9ffffff or 6271ff2b109c11f9ffffff or 6271ff4b109c11f9ffffff
+       VMOVSD -15(R14)(R15*4), K3, X11                    // 6211ff0b109cbef1ffffff or 6211ff2b109cbef1ffffff or 6211ff4b109cbef1ffffff
+       VMOVSD X14, X5, K3, X22                            // 6231d70b11f6 or 6231d72b11f6 or 6231d74b11f6
+       VMOVSD X0, K2, 15(DX)(BX*1)                        // 62f1ff0a11841a0f000000 or 62f1ff2a11841a0f000000 or 62f1ff4a11841a0f000000
+       VMOVSD X0, K2, -7(CX)(DX*2)                        // 62f1ff0a118451f9ffffff or 62f1ff2a118451f9ffffff or 62f1ff4a118451f9ffffff
+       VMOVSD X15, X7, K1, X17                            // 6231c70911f9 or 6231c72911f9 or 6231c74911f9
+       VMOVSHDUP X0, K2, X11                              // 62717e0a16d8
+       VMOVSHDUP -15(R14)(R15*1), K2, X11                 // 62117e0a169c3ef1ffffff
+       VMOVSHDUP -15(BX), K2, X11                         // 62717e0a169bf1ffffff
+       VMOVSHDUP Y18, K1, Y14                             // 62317e2916f2
+       VMOVSHDUP 15(R8)(R14*4), K1, Y14                   // 62117e2916b4b00f000000
+       VMOVSHDUP -7(CX)(DX*4), K1, Y14                    // 62717e2916b491f9ffffff
+       VMOVSHDUP Z1, K7, Z6                               // 62f17e4f16f1
+       VMOVSHDUP Z15, K7, Z6                              // 62d17e4f16f7
+       VMOVSHDUP 7(SI)(DI*4), K7, Z6                      // 62f17e4f16b4be07000000
+       VMOVSHDUP -7(DI)(R8*2), K7, Z6                     // 62b17e4f16b447f9ffffff
+       VMOVSHDUP Z1, K7, Z22                              // 62e17e4f16f1
+       VMOVSHDUP Z15, K7, Z22                             // 62c17e4f16f7
+       VMOVSHDUP 7(SI)(DI*4), K7, Z22                     // 62e17e4f16b4be07000000
+       VMOVSHDUP -7(DI)(R8*2), K7, Z22                    // 62a17e4f16b447f9ffffff
+       VMOVSLDUP X8, K1, X18                              // 62c17e0912d0
+       VMOVSLDUP 7(AX)(CX*4), K1, X18                     // 62e17e0912948807000000
+       VMOVSLDUP 7(AX)(CX*1), K1, X18                     // 62e17e0912940807000000
+       VMOVSLDUP Y18, K1, Y31                             // 62217e2912fa
+       VMOVSLDUP (R8), K1, Y31                            // 62417e291238
+       VMOVSLDUP 15(DX)(BX*2), K1, Y31                    // 62617e2912bc5a0f000000
+       VMOVSLDUP Z18, K1, Z13                             // 62317e4912ea
+       VMOVSLDUP Z8, K1, Z13                              // 62517e4912e8
+       VMOVSLDUP 17(SP), K1, Z13                          // 62717e4912ac2411000000
+       VMOVSLDUP -17(BP)(SI*4), K1, Z13                   // 62717e4912acb5efffffff
+       VMOVSS 17(SP)(BP*1), K7, X27                       // 62617e0f109c2c11000000 or 62617e2f109c2c11000000 or 62617e4f109c2c11000000
+       VMOVSS -7(CX)(DX*8), K7, X27                       // 62617e0f109cd1f9ffffff or 62617e2f109cd1f9ffffff or 62617e4f109cd1f9ffffff
+       VMOVSS X18, X3, K2, X25                            // 6281660a11d1 or 6281662a11d1 or 6281664a11d1
+       VMOVSS X15, K4, -17(BP)(SI*2)                      // 62717e0c11bc75efffffff or 62717e2c11bc75efffffff or 62717e4c11bc75efffffff
+       VMOVSS X15, K4, 7(AX)(CX*2)                        // 62717e0c11bc4807000000 or 62717e2c11bc4807000000 or 62717e4c11bc4807000000
+       VMOVSS X7, X15, K1, X28                            // 6291060911fc or 6291062911fc or 6291064911fc
+       VMOVUPD X8, K3, X13                                // 6251fd0b11c5
+       VMOVUPD X8, K3, (SI)                               // 6271fd0b1106
+       VMOVUPD X8, K3, 7(SI)(DI*2)                        // 6271fd0b11847e07000000
+       VMOVUPD X7, K4, X24                                // 6291fd0c11f8
+       VMOVUPD 17(SP)(BP*8), K4, X24                      // 6261fd0c1084ec11000000
+       VMOVUPD 17(SP)(BP*4), K4, X24                      // 6261fd0c1084ac11000000
+       VMOVUPD Y24, K5, Y3                                // 6261fd2d11c3
+       VMOVUPD Y24, K5, 17(SP)(BP*1)                      // 6261fd2d11842c11000000
+       VMOVUPD Y24, K5, -7(CX)(DX*8)                      // 6261fd2d1184d1f9ffffff
+       VMOVUPD Y7, K7, Y2                                 // 62f1fd2f11fa
+       VMOVUPD -17(BP)(SI*2), K7, Y2                      // 62f1fd2f109475efffffff
+       VMOVUPD 7(AX)(CX*2), K7, Y2                        // 62f1fd2f10944807000000
+       VMOVUPD Z2, K7, Z22                                // 62b1fd4f11d6
+       VMOVUPD Z31, K7, Z22                               // 6221fd4f11fe
+       VMOVUPD Z2, K7, Z7                                 // 62f1fd4f11d7
+       VMOVUPD Z31, K7, Z7                                // 6261fd4f11ff
+       VMOVUPD Z2, K7, 7(AX)                              // 62f1fd4f119007000000
+       VMOVUPD Z31, K7, 7(AX)                             // 6261fd4f11b807000000
+       VMOVUPD Z2, K7, (DI)                               // 62f1fd4f1117
+       VMOVUPD Z31, K7, (DI)                              // 6261fd4f113f
+       VMOVUPD Z1, K6, Z20                                // 62b1fd4e11cc
+       VMOVUPD Z3, K6, Z20                                // 62b1fd4e11dc
+       VMOVUPD 99(R15)(R15*1), K6, Z20                    // 6281fd4e10a43f63000000
+       VMOVUPD (DX), K6, Z20                              // 62e1fd4e1022
+       VMOVUPD Z1, K6, Z9                                 // 62d1fd4e11c9
+       VMOVUPD Z3, K6, Z9                                 // 62d1fd4e11d9
+       VMOVUPD 99(R15)(R15*1), K6, Z9                     // 6211fd4e108c3f63000000
+       VMOVUPD (DX), K6, Z9                               // 6271fd4e100a
+       VMOVUPS X22, K3, X0                                // 62e17c0b11f0
+       VMOVUPS X22, K3, 7(SI)(DI*4)                       // 62e17c0b11b4be07000000
+       VMOVUPS X22, K3, -7(DI)(R8*2)                      // 62a17c0b11b447f9ffffff
+       VMOVUPS X11, K7, X1                                // 62717c0f11d9
+       VMOVUPS 17(SP), K7, X1                             // 62f17c0f108c2411000000
+       VMOVUPS -17(BP)(SI*4), K7, X1                      // 62f17c0f108cb5efffffff
+       VMOVUPS Y14, K4, Y21                               // 62317c2c11f5
+       VMOVUPS Y14, K4, 15(R8)(R14*1)                     // 62117c2c11b4300f000000
+       VMOVUPS Y14, K4, 15(R8)(R14*2)                     // 62117c2c11b4700f000000
+       VMOVUPS Y20, K4, Y8                                // 62c17c2c11e0
+       VMOVUPS (R14), K4, Y8                              // 62517c2c1006
+       VMOVUPS -7(DI)(R8*8), K4, Y8                       // 62317c2c1084c7f9ffffff
+       VMOVUPS Z28, K7, Z12                               // 62417c4f11e4
+       VMOVUPS Z13, K7, Z12                               // 62517c4f11ec
+       VMOVUPS Z28, K7, Z16                               // 62217c4f11e0
+       VMOVUPS Z13, K7, Z16                               // 62317c4f11e8
+       VMOVUPS Z28, K7, -17(BP)(SI*8)                     // 62617c4f11a4f5efffffff
+       VMOVUPS Z13, K7, -17(BP)(SI*8)                     // 62717c4f11acf5efffffff
+       VMOVUPS Z28, K7, (R15)                             // 62417c4f1127
+       VMOVUPS Z13, K7, (R15)                             // 62517c4f112f
+       VMOVUPS Z3, K2, Z14                                // 62d17c4a11de
+       VMOVUPS Z12, K2, Z14                               // 62517c4a11e6
+       VMOVUPS 7(SI)(DI*8), K2, Z14                       // 62717c4a10b4fe07000000
+       VMOVUPS -15(R14), K2, Z14                          // 62517c4a10b6f1ffffff
+       VMOVUPS Z3, K2, Z28                                // 62917c4a11dc
+       VMOVUPS Z12, K2, Z28                               // 62117c4a11e4
+       VMOVUPS 7(SI)(DI*8), K2, Z28                       // 62617c4a10a4fe07000000
+       VMOVUPS -15(R14), K2, Z28                          // 62417c4a10a6f1ffffff
+       VMULPD X8, X7, K5, X6                              // 62d1c50d59f0
+       VMULPD 7(AX), X7, K5, X6                           // 62f1c50d59b007000000
+       VMULPD (DI), X7, K5, X6                            // 62f1c50d5937
+       VMULPD Y1, Y24, K3, Y11                            // 6271bd2359d9
+       VMULPD 99(R15)(R15*4), Y24, K3, Y11                // 6211bd23599cbf63000000
+       VMULPD 15(DX), Y24, K3, Y11                        // 6271bd23599a0f000000
+       VMULPD Z5, Z19, K4, Z15                            // 6271e54459fd
+       VMULPD Z1, Z19, K4, Z15                            // 6271e54459f9
+       VMULPD Z5, Z15, K4, Z15                            // 6271854c59fd
+       VMULPD Z1, Z15, K4, Z15                            // 6271854c59f9
+       VMULPD Z5, Z19, K4, Z30                            // 6261e54459f5
+       VMULPD Z1, Z19, K4, Z30                            // 6261e54459f1
+       VMULPD Z5, Z15, K4, Z30                            // 6261854c59f5
+       VMULPD Z1, Z15, K4, Z30                            // 6261854c59f1
+       VMULPD Z21, Z14, K2, Z3                            // 62b18d4a59dd
+       VMULPD Z8, Z14, K2, Z3                             // 62d18d4a59d8
+       VMULPD 7(SI)(DI*1), Z14, K2, Z3                    // 62f18d4a599c3e07000000
+       VMULPD 15(DX)(BX*8), Z14, K2, Z3                   // 62f18d4a599cda0f000000
+       VMULPD Z21, Z15, K2, Z3                            // 62b1854a59dd
+       VMULPD Z8, Z15, K2, Z3                             // 62d1854a59d8
+       VMULPD 7(SI)(DI*1), Z15, K2, Z3                    // 62f1854a599c3e07000000
+       VMULPD 15(DX)(BX*8), Z15, K2, Z3                   // 62f1854a599cda0f000000
+       VMULPD Z21, Z14, K2, Z5                            // 62b18d4a59ed
+       VMULPD Z8, Z14, K2, Z5                             // 62d18d4a59e8
+       VMULPD 7(SI)(DI*1), Z14, K2, Z5                    // 62f18d4a59ac3e07000000
+       VMULPD 15(DX)(BX*8), Z14, K2, Z5                   // 62f18d4a59acda0f000000
+       VMULPD Z21, Z15, K2, Z5                            // 62b1854a59ed
+       VMULPD Z8, Z15, K2, Z5                             // 62d1854a59e8
+       VMULPD 7(SI)(DI*1), Z15, K2, Z5                    // 62f1854a59ac3e07000000
+       VMULPD 15(DX)(BX*8), Z15, K2, Z5                   // 62f1854a59acda0f000000
+       VMULPS X28, X3, K2, X31                            // 6201640a59fc
+       VMULPS 99(R15)(R15*1), X3, K2, X31                 // 6201640a59bc3f63000000
+       VMULPS (DX), X3, K2, X31                           // 6261640a593a
+       VMULPS Y20, Y18, K3, Y5                            // 62b16c2359ec
+       VMULPS (CX), Y18, K3, Y5                           // 62f16c235929
+       VMULPS 99(R15), Y18, K3, Y5                        // 62d16c2359af63000000
+       VMULPS Z23, Z20, K3, Z16                           // 62a15c4359c7
+       VMULPS Z19, Z20, K3, Z16                           // 62a15c4359c3
+       VMULPS Z23, Z0, K3, Z16                            // 62a17c4b59c7
+       VMULPS Z19, Z0, K3, Z16                            // 62a17c4b59c3
+       VMULPS Z23, Z20, K3, Z9                            // 62315c4359cf
+       VMULPS Z19, Z20, K3, Z9                            // 62315c4359cb
+       VMULPS Z23, Z0, K3, Z9                             // 62317c4b59cf
+       VMULPS Z19, Z0, K3, Z9                             // 62317c4b59cb
+       VMULPS Z24, Z0, K3, Z0                             // 62917c4b59c0
+       VMULPS Z12, Z0, K3, Z0                             // 62d17c4b59c4
+       VMULPS -7(DI)(R8*1), Z0, K3, Z0                    // 62b17c4b598407f9ffffff
+       VMULPS (SP), Z0, K3, Z0                            // 62f17c4b590424
+       VMULPS Z24, Z25, K3, Z0                            // 6291344359c0
+       VMULPS Z12, Z25, K3, Z0                            // 62d1344359c4
+       VMULPS -7(DI)(R8*1), Z25, K3, Z0                   // 62b13443598407f9ffffff
+       VMULPS (SP), Z25, K3, Z0                           // 62f13443590424
+       VMULPS Z24, Z0, K3, Z11                            // 62117c4b59d8
+       VMULPS Z12, Z0, K3, Z11                            // 62517c4b59dc
+       VMULPS -7(DI)(R8*1), Z0, K3, Z11                   // 62317c4b599c07f9ffffff
+       VMULPS (SP), Z0, K3, Z11                           // 62717c4b591c24
+       VMULPS Z24, Z25, K3, Z11                           // 6211344359d8
+       VMULPS Z12, Z25, K3, Z11                           // 6251344359dc
+       VMULPS -7(DI)(R8*1), Z25, K3, Z11                  // 62313443599c07f9ffffff
+       VMULPS (SP), Z25, K3, Z11                          // 62713443591c24
+       VMULSD X7, X24, K2, X20                            // 62e1bf0259e7
+       VMULSD X12, X16, K1, X20                           // 62c1ff0159e4 or 62c1ff2159e4 or 62c1ff4159e4
+       VMULSD -17(BP), X16, K1, X20                       // 62e1ff0159a5efffffff or 62e1ff2159a5efffffff or 62e1ff4159a5efffffff
+       VMULSD -15(R14)(R15*8), X16, K1, X20               // 6281ff0159a4fef1ffffff or 6281ff2159a4fef1ffffff or 6281ff4159a4fef1ffffff
+       VMULSS X28, X17, K2, X6                            // 6291760259f4
+       VMULSS X8, X1, K1, X6                              // 62d1760959f0 or 62d1762959f0 or 62d1764959f0
+       VMULSS 15(R8)(R14*1), X1, K1, X6                   // 6291760959b4300f000000 or 6291762959b4300f000000 or 6291764959b4300f000000
+       VMULSS 15(R8)(R14*2), X1, K1, X6                   // 6291760959b4700f000000 or 6291762959b4700f000000 or 6291764959b4700f000000
+       VPABSD X16, K7, X12                                // 62327d0f1ee0
+       VPABSD 99(R15)(R15*8), K7, X12                     // 62127d0f1ea4ff63000000
+       VPABSD 7(AX)(CX*8), K7, X12                        // 62727d0f1ea4c807000000
+       VPABSD Y16, K7, Y17                                // 62a27d2f1ec8
+       VPABSD -17(BP), K7, Y17                            // 62e27d2f1e8defffffff
+       VPABSD -15(R14)(R15*8), K7, Y17                    // 62827d2f1e8cfef1ffffff
+       VPABSD Z20, K6, Z1                                 // 62b27d4e1ecc
+       VPABSD Z9, K6, Z1                                  // 62d27d4e1ec9
+       VPABSD (BX), K6, Z1                                // 62f27d4e1e0b
+       VPABSD -17(BP)(SI*1), K6, Z1                       // 62f27d4e1e8c35efffffff
+       VPABSD Z20, K6, Z9                                 // 62327d4e1ecc
+       VPABSD Z9, K6, Z9                                  // 62527d4e1ec9
+       VPABSD (BX), K6, Z9                                // 62727d4e1e0b
+       VPABSD -17(BP)(SI*1), K6, Z9                       // 62727d4e1e8c35efffffff
+       VPABSQ X8, K3, X28                                 // 6242fd0b1fe0
+       VPABSQ (AX), K3, X28                               // 6262fd0b1f20
+       VPABSQ 7(SI), K3, X28                              // 6262fd0b1fa607000000
+       VPABSQ Y6, K7, Y12                                 // 6272fd2f1fe6
+       VPABSQ 17(SP)(BP*2), K7, Y12                       // 6272fd2f1fa46c11000000
+       VPABSQ -7(DI)(R8*4), K7, Y12                       // 6232fd2f1fa487f9ffffff
+       VPABSQ Z26, K4, Z30                                // 6202fd4c1ff2
+       VPABSQ Z22, K4, Z30                                // 6222fd4c1ff6
+       VPABSQ 15(R8)(R14*4), K4, Z30                      // 6202fd4c1fb4b00f000000
+       VPABSQ -7(CX)(DX*4), K4, Z30                       // 6262fd4c1fb491f9ffffff
+       VPABSQ Z26, K4, Z5                                 // 6292fd4c1fea
+       VPABSQ Z22, K4, Z5                                 // 62b2fd4c1fee
+       VPABSQ 15(R8)(R14*4), K4, Z5                       // 6292fd4c1facb00f000000
+       VPABSQ -7(CX)(DX*4), K4, Z5                        // 62f2fd4c1fac91f9ffffff
+       VPADDD X27, X2, K1, X2                             // 62916d09fed3
+       VPADDD (R14), X2, K1, X2                           // 62d16d09fe16
+       VPADDD -7(DI)(R8*8), X2, K1, X2                    // 62b16d09fe94c7f9ffffff
+       VPADDD Y1, Y6, K7, Y1                              // 62f14d2ffec9
+       VPADDD 7(SI)(DI*4), Y6, K7, Y1                     // 62f14d2ffe8cbe07000000
+       VPADDD -7(DI)(R8*2), Y6, K7, Y1                    // 62b14d2ffe8c47f9ffffff
+       VPADDD Z13, Z11, K2, Z14                           // 6251254afef5
+       VPADDD Z14, Z11, K2, Z14                           // 6251254afef6
+       VPADDD (CX), Z11, K2, Z14                          // 6271254afe31
+       VPADDD 99(R15), Z11, K2, Z14                       // 6251254afeb763000000
+       VPADDD Z13, Z5, K2, Z14                            // 6251554afef5
+       VPADDD Z14, Z5, K2, Z14                            // 6251554afef6
+       VPADDD (CX), Z5, K2, Z14                           // 6271554afe31
+       VPADDD 99(R15), Z5, K2, Z14                        // 6251554afeb763000000
+       VPADDD Z13, Z11, K2, Z27                           // 6241254afedd
+       VPADDD Z14, Z11, K2, Z27                           // 6241254afede
+       VPADDD (CX), Z11, K2, Z27                          // 6261254afe19
+       VPADDD 99(R15), Z11, K2, Z27                       // 6241254afe9f63000000
+       VPADDD Z13, Z5, K2, Z27                            // 6241554afedd
+       VPADDD Z14, Z5, K2, Z27                            // 6241554afede
+       VPADDD (CX), Z5, K2, Z27                           // 6261554afe19
+       VPADDD 99(R15), Z5, K2, Z27                        // 6241554afe9f63000000
+       VPADDQ X30, X22, K4, X26                           // 6201cd04d4d6
+       VPADDQ 99(R15)(R15*4), X22, K4, X26                // 6201cd04d494bf63000000
+       VPADDQ 15(DX), X22, K4, X26                        // 6261cd04d4920f000000
+       VPADDQ Y19, Y0, K1, Y9                             // 6231fd29d4cb
+       VPADDQ 17(SP), Y0, K1, Y9                          // 6271fd29d48c2411000000
+       VPADDQ -17(BP)(SI*4), Y0, K1, Y9                   // 6271fd29d48cb5efffffff
+       VPADDQ Z6, Z2, K3, Z5                              // 62f1ed4bd4ee
+       VPADDQ Z14, Z2, K3, Z5                             // 62d1ed4bd4ee
+       VPADDQ 99(R15)(R15*2), Z2, K3, Z5                  // 6291ed4bd4ac7f63000000
+       VPADDQ -7(DI), Z2, K3, Z5                          // 62f1ed4bd4aff9ffffff
+       VPADDQ Z6, Z2, K3, Z23                             // 62e1ed4bd4fe
+       VPADDQ Z14, Z2, K3, Z23                            // 62c1ed4bd4fe
+       VPADDQ 99(R15)(R15*2), Z2, K3, Z23                 // 6281ed4bd4bc7f63000000
+       VPADDQ -7(DI), Z2, K3, Z23                         // 62e1ed4bd4bff9ffffff
+       VPANDD X1, X8, K3, X7                              // 62f13d0bdbf9
+       VPANDD 15(R8), X8, K3, X7                          // 62d13d0bdbb80f000000
+       VPANDD (BP), X8, K3, X7                            // 62f13d0bdb7d00
+       VPANDD Y13, Y2, K2, Y14                            // 62516d2adbf5
+       VPANDD -7(CX), Y2, K2, Y14                         // 62716d2adbb1f9ffffff
+       VPANDD 15(DX)(BX*4), Y2, K2, Y14                   // 62716d2adbb49a0f000000
+       VPANDD Z6, Z9, K1, Z12                             // 62713549dbe6
+       VPANDD Z25, Z9, K1, Z12                            // 62113549dbe1
+       VPANDD -15(R14)(R15*1), Z9, K1, Z12                // 62113549dba43ef1ffffff
+       VPANDD -15(BX), Z9, K1, Z12                        // 62713549dba3f1ffffff
+       VPANDD Z6, Z12, K1, Z12                            // 62711d49dbe6
+       VPANDD Z25, Z12, K1, Z12                           // 62111d49dbe1
+       VPANDD -15(R14)(R15*1), Z12, K1, Z12               // 62111d49dba43ef1ffffff
+       VPANDD -15(BX), Z12, K1, Z12                       // 62711d49dba3f1ffffff
+       VPANDD Z6, Z9, K1, Z17                             // 62e13549dbce
+       VPANDD Z25, Z9, K1, Z17                            // 62813549dbc9
+       VPANDD -15(R14)(R15*1), Z9, K1, Z17                // 62813549db8c3ef1ffffff
+       VPANDD -15(BX), Z9, K1, Z17                        // 62e13549db8bf1ffffff
+       VPANDD Z6, Z12, K1, Z17                            // 62e11d49dbce
+       VPANDD Z25, Z12, K1, Z17                           // 62811d49dbc9
+       VPANDD -15(R14)(R15*1), Z12, K1, Z17               // 62811d49db8c3ef1ffffff
+       VPANDD -15(BX), Z12, K1, Z17                       // 62e11d49db8bf1ffffff
+       VPANDND X0, X15, K2, X0                            // 62f1050adfc0
+       VPANDND 15(R8)(R14*8), X15, K2, X0                 // 6291050adf84f00f000000
+       VPANDND -15(R14)(R15*2), X15, K2, X0               // 6291050adf847ef1ffffff
+       VPANDND Y22, Y15, K1, Y27                          // 62210529dfde
+       VPANDND 99(R15)(R15*8), Y15, K1, Y27               // 62010529df9cff63000000
+       VPANDND 7(AX)(CX*8), Y15, K1, Y27                  // 62610529df9cc807000000
+       VPANDND Z3, Z8, K7, Z3                             // 62f13d4fdfdb
+       VPANDND Z27, Z8, K7, Z3                            // 62913d4fdfdb
+       VPANDND 7(AX)(CX*4), Z8, K7, Z3                    // 62f13d4fdf9c8807000000
+       VPANDND 7(AX)(CX*1), Z8, K7, Z3                    // 62f13d4fdf9c0807000000
+       VPANDND Z3, Z2, K7, Z3                             // 62f16d4fdfdb
+       VPANDND Z27, Z2, K7, Z3                            // 62916d4fdfdb
+       VPANDND 7(AX)(CX*4), Z2, K7, Z3                    // 62f16d4fdf9c8807000000
+       VPANDND 7(AX)(CX*1), Z2, K7, Z3                    // 62f16d4fdf9c0807000000
+       VPANDND Z3, Z8, K7, Z21                            // 62e13d4fdfeb
+       VPANDND Z27, Z8, K7, Z21                           // 62813d4fdfeb
+       VPANDND 7(AX)(CX*4), Z8, K7, Z21                   // 62e13d4fdfac8807000000
+       VPANDND 7(AX)(CX*1), Z8, K7, Z21                   // 62e13d4fdfac0807000000
+       VPANDND Z3, Z2, K7, Z21                            // 62e16d4fdfeb
+       VPANDND Z27, Z2, K7, Z21                           // 62816d4fdfeb
+       VPANDND 7(AX)(CX*4), Z2, K7, Z21                   // 62e16d4fdfac8807000000
+       VPANDND 7(AX)(CX*1), Z2, K7, Z21                   // 62e16d4fdfac0807000000
+       VPANDNQ X0, X21, K1, X16                           // 62e1d501dfc0
+       VPANDNQ -15(R14)(R15*1), X21, K1, X16              // 6281d501df843ef1ffffff
+       VPANDNQ -15(BX), X21, K1, X16                      // 62e1d501df83f1ffffff
+       VPANDNQ Y24, Y18, K1, Y20                          // 6281ed21dfe0
+       VPANDNQ (AX), Y18, K1, Y20                         // 62e1ed21df20
+       VPANDNQ 7(SI), Y18, K1, Y20                        // 62e1ed21dfa607000000
+       VPANDNQ Z20, Z0, K1, Z7                            // 62b1fd49dffc
+       VPANDNQ Z28, Z0, K1, Z7                            // 6291fd49dffc
+       VPANDNQ (SI), Z0, K1, Z7                           // 62f1fd49df3e
+       VPANDNQ 7(SI)(DI*2), Z0, K1, Z7                    // 62f1fd49dfbc7e07000000
+       VPANDNQ Z20, Z6, K1, Z7                            // 62b1cd49dffc
+       VPANDNQ Z28, Z6, K1, Z7                            // 6291cd49dffc
+       VPANDNQ (SI), Z6, K1, Z7                           // 62f1cd49df3e
+       VPANDNQ 7(SI)(DI*2), Z6, K1, Z7                    // 62f1cd49dfbc7e07000000
+       VPANDNQ Z20, Z0, K1, Z9                            // 6231fd49dfcc
+       VPANDNQ Z28, Z0, K1, Z9                            // 6211fd49dfcc
+       VPANDNQ (SI), Z0, K1, Z9                           // 6271fd49df0e
+       VPANDNQ 7(SI)(DI*2), Z0, K1, Z9                    // 6271fd49df8c7e07000000
+       VPANDNQ Z20, Z6, K1, Z9                            // 6231cd49dfcc
+       VPANDNQ Z28, Z6, K1, Z9                            // 6211cd49dfcc
+       VPANDNQ (SI), Z6, K1, Z9                           // 6271cd49df0e
+       VPANDNQ 7(SI)(DI*2), Z6, K1, Z9                    // 6271cd49df8c7e07000000
+       VPANDQ X7, X22, K7, X28                            // 6261cd07dbe7
+       VPANDQ 7(AX)(CX*4), X22, K7, X28                   // 6261cd07dba48807000000
+       VPANDQ 7(AX)(CX*1), X22, K7, X28                   // 6261cd07dba40807000000
+       VPANDQ Y19, Y3, K2, Y9                             // 6231e52adbcb
+       VPANDQ (BX), Y3, K2, Y9                            // 6271e52adb0b
+       VPANDQ -17(BP)(SI*1), Y3, K2, Y9                   // 6271e52adb8c35efffffff
+       VPANDQ Z12, Z9, K4, Z3                             // 62d1b54cdbdc
+       VPANDQ Z22, Z9, K4, Z3                             // 62b1b54cdbde
+       VPANDQ 17(SP)(BP*8), Z9, K4, Z3                    // 62f1b54cdb9cec11000000
+       VPANDQ 17(SP)(BP*4), Z9, K4, Z3                    // 62f1b54cdb9cac11000000
+       VPANDQ Z12, Z19, K4, Z3                            // 62d1e544dbdc
+       VPANDQ Z22, Z19, K4, Z3                            // 62b1e544dbde
+       VPANDQ 17(SP)(BP*8), Z19, K4, Z3                   // 62f1e544db9cec11000000
+       VPANDQ 17(SP)(BP*4), Z19, K4, Z3                   // 62f1e544db9cac11000000
+       VPANDQ Z12, Z9, K4, Z30                            // 6241b54cdbf4
+       VPANDQ Z22, Z9, K4, Z30                            // 6221b54cdbf6
+       VPANDQ 17(SP)(BP*8), Z9, K4, Z30                   // 6261b54cdbb4ec11000000
+       VPANDQ 17(SP)(BP*4), Z9, K4, Z30                   // 6261b54cdbb4ac11000000
+       VPANDQ Z12, Z19, K4, Z30                           // 6241e544dbf4
+       VPANDQ Z22, Z19, K4, Z30                           // 6221e544dbf6
+       VPANDQ 17(SP)(BP*8), Z19, K4, Z30                  // 6261e544dbb4ec11000000
+       VPANDQ 17(SP)(BP*4), Z19, K4, Z30                  // 6261e544dbb4ac11000000
+       VPBLENDMD X14, X12, K4, X0                         // 62d21d0c64c6
+       VPBLENDMD 17(SP), X12, K4, X0                      // 62f21d0c64842411000000
+       VPBLENDMD -17(BP)(SI*4), X12, K4, X0               // 62f21d0c6484b5efffffff
+       VPBLENDMD Y6, Y31, K4, Y6                          // 62f2052464f6
+       VPBLENDMD -17(BP)(SI*2), Y31, K4, Y6               // 62f2052464b475efffffff
+       VPBLENDMD 7(AX)(CX*2), Y31, K4, Y6                 // 62f2052464b44807000000
+       VPBLENDMD Z20, Z2, K7, Z22                         // 62a26d4f64f4
+       VPBLENDMD Z9, Z2, K7, Z22                          // 62c26d4f64f1
+       VPBLENDMD 99(R15)(R15*1), Z2, K7, Z22              // 62826d4f64b43f63000000
+       VPBLENDMD (DX), Z2, K7, Z22                        // 62e26d4f6432
+       VPBLENDMD Z20, Z31, K7, Z22                        // 62a2054764f4
+       VPBLENDMD Z9, Z31, K7, Z22                         // 62c2054764f1
+       VPBLENDMD 99(R15)(R15*1), Z31, K7, Z22             // 6282054764b43f63000000
+       VPBLENDMD (DX), Z31, K7, Z22                       // 62e205476432
+       VPBLENDMD Z20, Z2, K7, Z7                          // 62b26d4f64fc
+       VPBLENDMD Z9, Z2, K7, Z7                           // 62d26d4f64f9
+       VPBLENDMD 99(R15)(R15*1), Z2, K7, Z7               // 62926d4f64bc3f63000000
+       VPBLENDMD (DX), Z2, K7, Z7                         // 62f26d4f643a
+       VPBLENDMD Z20, Z31, K7, Z7                         // 62b2054764fc
+       VPBLENDMD Z9, Z31, K7, Z7                          // 62d2054764f9
+       VPBLENDMD 99(R15)(R15*1), Z31, K7, Z7              // 6292054764bc3f63000000
+       VPBLENDMD (DX), Z31, K7, Z7                        // 62f20547643a
+       VPBLENDMQ X15, X17, K2, X5                         // 62d2f50264ef
+       VPBLENDMQ 7(AX), X17, K2, X5                       // 62f2f50264a807000000
+       VPBLENDMQ (DI), X17, K2, X5                        // 62f2f502642f
+       VPBLENDMQ Y7, Y19, K5, Y11                         // 6272e52564df
+       VPBLENDMQ 15(R8)(R14*1), Y19, K5, Y11              // 6212e525649c300f000000
+       VPBLENDMQ 15(R8)(R14*2), Y19, K5, Y11              // 6212e525649c700f000000
+       VPBLENDMQ Z28, Z12, K3, Z1                         // 62929d4b64cc
+       VPBLENDMQ Z13, Z12, K3, Z1                         // 62d29d4b64cd
+       VPBLENDMQ -17(BP)(SI*8), Z12, K3, Z1               // 62f29d4b648cf5efffffff
+       VPBLENDMQ (R15), Z12, K3, Z1                       // 62d29d4b640f
+       VPBLENDMQ Z28, Z16, K3, Z1                         // 6292fd4364cc
+       VPBLENDMQ Z13, Z16, K3, Z1                         // 62d2fd4364cd
+       VPBLENDMQ -17(BP)(SI*8), Z16, K3, Z1               // 62f2fd43648cf5efffffff
+       VPBLENDMQ (R15), Z16, K3, Z1                       // 62d2fd43640f
+       VPBLENDMQ Z28, Z12, K3, Z3                         // 62929d4b64dc
+       VPBLENDMQ Z13, Z12, K3, Z3                         // 62d29d4b64dd
+       VPBLENDMQ -17(BP)(SI*8), Z12, K3, Z3               // 62f29d4b649cf5efffffff
+       VPBLENDMQ (R15), Z12, K3, Z3                       // 62d29d4b641f
+       VPBLENDMQ Z28, Z16, K3, Z3                         // 6292fd4364dc
+       VPBLENDMQ Z13, Z16, K3, Z3                         // 62d2fd4364dd
+       VPBLENDMQ -17(BP)(SI*8), Z16, K3, Z3               // 62f2fd43649cf5efffffff
+       VPBLENDMQ (R15), Z16, K3, Z3                       // 62d2fd43641f
+       VPBROADCASTD SP, K1, X15                           // 62727d097cfc
+       VPBROADCASTD R14, K1, X15                          // 62527d097cfe
+       VPBROADCASTD AX, K7, Y12                           // 62727d2f7ce0
+       VPBROADCASTD R9, K7, Y12                           // 62527d2f7ce1
+       VPBROADCASTD CX, K1, Z3                            // 62f27d497cd9
+       VPBROADCASTD SP, K1, Z3                            // 62f27d497cdc
+       VPBROADCASTD CX, K1, Z5                            // 62f27d497ce9
+       VPBROADCASTD SP, K1, Z5                            // 62f27d497cec
+       VPBROADCASTD X18, K1, X26                          // 62227d0958d2
+       VPBROADCASTD (R14), K1, X26                        // 62427d095816
+       VPBROADCASTD -7(DI)(R8*8), K1, X26                 // 62227d095894c7f9ffffff
+       VPBROADCASTD X21, K1, Y3                           // 62b27d2958dd
+       VPBROADCASTD 99(R15)(R15*4), K1, Y3                // 62927d29589cbf63000000
+       VPBROADCASTD 15(DX), K1, Y3                        // 62f27d29589a0f000000
+       VPBROADCASTD X1, K7, Z14                           // 62727d4f58f1
+       VPBROADCASTD (CX), K7, Z14                         // 62727d4f5831
+       VPBROADCASTD 99(R15), K7, Z14                      // 62527d4f58b763000000
+       VPBROADCASTD X1, K7, Z15                           // 62727d4f58f9
+       VPBROADCASTD (CX), K7, Z15                         // 62727d4f5839
+       VPBROADCASTD 99(R15), K7, Z15                      // 62527d4f58bf63000000
+       VPBROADCASTQ R9, K2, X3                            // 62d2fd0a7cd9
+       VPBROADCASTQ R13, K2, X3                           // 62d2fd0a7cdd
+       VPBROADCASTQ DX, K4, Y7                            // 62f2fd2c7cfa
+       VPBROADCASTQ BP, K4, Y7                            // 62f2fd2c7cfd
+       VPBROADCASTQ R10, K1, Z20                          // 62c2fd497ce2
+       VPBROADCASTQ CX, K1, Z20                           // 62e2fd497ce1
+       VPBROADCASTQ R10, K1, Z0                           // 62d2fd497cc2
+       VPBROADCASTQ CX, K1, Z0                            // 62f2fd497cc1
+       VPBROADCASTQ X0, K3, X7                            // 62f2fd0b59f8
+       VPBROADCASTQ 17(SP)(BP*2), K3, X7                  // 62f2fd0b59bc6c11000000
+       VPBROADCASTQ -7(DI)(R8*4), K3, X7                  // 62b2fd0b59bc87f9ffffff
+       VPBROADCASTQ X0, K4, Y0                            // 62f2fd2c59c0
+       VPBROADCASTQ 15(R8), K4, Y0                        // 62d2fd2c59800f000000
+       VPBROADCASTQ (BP), K4, Y0                          // 62f2fd2c594500
+       VPBROADCASTQ X24, K5, Z23                          // 6282fd4d59f8
+       VPBROADCASTQ 15(R8)(R14*8), K5, Z23                // 6282fd4d59bcf00f000000
+       VPBROADCASTQ -15(R14)(R15*2), K5, Z23              // 6282fd4d59bc7ef1ffffff
+       VPBROADCASTQ X24, K5, Z19                          // 6282fd4d59d8
+       VPBROADCASTQ 15(R8)(R14*8), K5, Z19                // 6282fd4d599cf00f000000
+       VPBROADCASTQ -15(R14)(R15*2), K5, Z19              // 6282fd4d599c7ef1ffffff
+       VPCMPD $64, X13, X11, K5, K6                       // 62d3250d1ff540
+       VPCMPD $64, 7(SI)(DI*1), X11, K5, K6               // 62f3250d1fb43e0700000040
+       VPCMPD $64, 15(DX)(BX*8), X11, K5, K6              // 62f3250d1fb4da0f00000040
+       VPCMPD $64, X13, X11, K5, K7                       // 62d3250d1ffd40
+       VPCMPD $64, 7(SI)(DI*1), X11, K5, K7               // 62f3250d1fbc3e0700000040
+       VPCMPD $64, 15(DX)(BX*8), X11, K5, K7              // 62f3250d1fbcda0f00000040
+       VPCMPD $27, Y31, Y9, K3, K6                        // 6293352b1ff71b
+       VPCMPD $27, 99(R15)(R15*2), Y9, K3, K6             // 6293352b1fb47f630000001b
+       VPCMPD $27, -7(DI), Y9, K3, K6                     // 62f3352b1fb7f9ffffff1b
+       VPCMPD $27, Y31, Y9, K3, K4                        // 6293352b1fe71b
+       VPCMPD $27, 99(R15)(R15*2), Y9, K3, K4             // 6293352b1fa47f630000001b
+       VPCMPD $27, -7(DI), Y9, K3, K4                     // 62f3352b1fa7f9ffffff1b
+       VPCMPD $47, Z17, Z20, K4, K4                       // 62b35d441fe12f
+       VPCMPD $47, Z0, Z20, K4, K4                        // 62f35d441fe02f
+       VPCMPD $47, -7(CX), Z20, K4, K4                    // 62f35d441fa1f9ffffff2f
+       VPCMPD $47, 15(DX)(BX*4), Z20, K4, K4              // 62f35d441fa49a0f0000002f
+       VPCMPD $47, Z17, Z0, K4, K4                        // 62b37d4c1fe12f
+       VPCMPD $47, Z0, Z0, K4, K4                         // 62f37d4c1fe02f
+       VPCMPD $47, -7(CX), Z0, K4, K4                     // 62f37d4c1fa1f9ffffff2f
+       VPCMPD $47, 15(DX)(BX*4), Z0, K4, K4               // 62f37d4c1fa49a0f0000002f
+       VPCMPD $47, Z17, Z20, K4, K6                       // 62b35d441ff12f
+       VPCMPD $47, Z0, Z20, K4, K6                        // 62f35d441ff02f
+       VPCMPD $47, -7(CX), Z20, K4, K6                    // 62f35d441fb1f9ffffff2f
+       VPCMPD $47, 15(DX)(BX*4), Z20, K4, K6              // 62f35d441fb49a0f0000002f
+       VPCMPD $47, Z17, Z0, K4, K6                        // 62b37d4c1ff12f
+       VPCMPD $47, Z0, Z0, K4, K6                         // 62f37d4c1ff02f
+       VPCMPD $47, -7(CX), Z0, K4, K6                     // 62f37d4c1fb1f9ffffff2f
+       VPCMPD $47, 15(DX)(BX*4), Z0, K4, K6               // 62f37d4c1fb49a0f0000002f
+       VPCMPEQD X14, X16, K3, K6                          // 62d17d0376f6
+       VPCMPEQD -7(CX), X16, K3, K6                       // 62f17d0376b1f9ffffff
+       VPCMPEQD 15(DX)(BX*4), X16, K3, K6                 // 62f17d0376b49a0f000000
+       VPCMPEQD X14, X16, K3, K5                          // 62d17d0376ee
+       VPCMPEQD -7(CX), X16, K3, K5                       // 62f17d0376a9f9ffffff
+       VPCMPEQD 15(DX)(BX*4), X16, K3, K5                 // 62f17d0376ac9a0f000000
+       VPCMPEQD Y13, Y28, K3, K1                          // 62d11d2376cd
+       VPCMPEQD 15(DX)(BX*1), Y28, K3, K1                 // 62f11d23768c1a0f000000
+       VPCMPEQD -7(CX)(DX*2), Y28, K3, K1                 // 62f11d23768c51f9ffffff
+       VPCMPEQD Y13, Y28, K3, K5                          // 62d11d2376ed
+       VPCMPEQD 15(DX)(BX*1), Y28, K3, K5                 // 62f11d2376ac1a0f000000
+       VPCMPEQD -7(CX)(DX*2), Y28, K3, K5                 // 62f11d2376ac51f9ffffff
+       VPCMPEQD Z6, Z21, K2, K3                           // 62f1554276de
+       VPCMPEQD Z9, Z21, K2, K3                           // 62d1554276d9
+       VPCMPEQD (AX), Z21, K2, K3                         // 62f155427618
+       VPCMPEQD 7(SI), Z21, K2, K3                        // 62f15542769e07000000
+       VPCMPEQD Z6, Z9, K2, K3                            // 62f1354a76de
+       VPCMPEQD Z9, Z9, K2, K3                            // 62d1354a76d9
+       VPCMPEQD (AX), Z9, K2, K3                          // 62f1354a7618
+       VPCMPEQD 7(SI), Z9, K2, K3                         // 62f1354a769e07000000
+       VPCMPEQD Z6, Z21, K2, K1                           // 62f1554276ce
+       VPCMPEQD Z9, Z21, K2, K1                           // 62d1554276c9
+       VPCMPEQD (AX), Z21, K2, K1                         // 62f155427608
+       VPCMPEQD 7(SI), Z21, K2, K1                        // 62f15542768e07000000
+       VPCMPEQD Z6, Z9, K2, K1                            // 62f1354a76ce
+       VPCMPEQD Z9, Z9, K2, K1                            // 62d1354a76c9
+       VPCMPEQD (AX), Z9, K2, K1                          // 62f1354a7608
+       VPCMPEQD 7(SI), Z9, K2, K1                         // 62f1354a768e07000000
+       VPCMPEQQ X14, X11, K1, K5                          // 62d2a50929ee
+       VPCMPEQQ 99(R15)(R15*8), X11, K1, K5               // 6292a50929acff63000000
+       VPCMPEQQ 7(AX)(CX*8), X11, K1, K5                  // 62f2a50929acc807000000
+       VPCMPEQQ X14, X11, K1, K4                          // 62d2a50929e6
+       VPCMPEQQ 99(R15)(R15*8), X11, K1, K4               // 6292a50929a4ff63000000
+       VPCMPEQQ 7(AX)(CX*8), X11, K1, K4                  // 62f2a50929a4c807000000
+       VPCMPEQQ Y2, Y7, K2, K7                            // 62f2c52a29fa
+       VPCMPEQQ -17(BP), Y7, K2, K7                       // 62f2c52a29bdefffffff
+       VPCMPEQQ -15(R14)(R15*8), Y7, K2, K7               // 6292c52a29bcfef1ffffff
+       VPCMPEQQ Y2, Y7, K2, K6                            // 62f2c52a29f2
+       VPCMPEQQ -17(BP), Y7, K2, K6                       // 62f2c52a29b5efffffff
+       VPCMPEQQ -15(R14)(R15*8), Y7, K2, K6               // 6292c52a29b4fef1ffffff
+       VPCMPEQQ Z20, Z1, K1, K4                           // 62b2f54929e4
+       VPCMPEQQ Z9, Z1, K1, K4                            // 62d2f54929e1
+       VPCMPEQQ (BX), Z1, K1, K4                          // 62f2f5492923
+       VPCMPEQQ -17(BP)(SI*1), Z1, K1, K4                 // 62f2f54929a435efffffff
+       VPCMPEQQ Z20, Z9, K1, K4                           // 62b2b54929e4
+       VPCMPEQQ Z9, Z9, K1, K4                            // 62d2b54929e1
+       VPCMPEQQ (BX), Z9, K1, K4                          // 62f2b5492923
+       VPCMPEQQ -17(BP)(SI*1), Z9, K1, K4                 // 62f2b54929a435efffffff
+       VPCMPEQQ Z20, Z1, K1, K6                           // 62b2f54929f4
+       VPCMPEQQ Z9, Z1, K1, K6                            // 62d2f54929f1
+       VPCMPEQQ (BX), Z1, K1, K6                          // 62f2f5492933
+       VPCMPEQQ -17(BP)(SI*1), Z1, K1, K6                 // 62f2f54929b435efffffff
+       VPCMPEQQ Z20, Z9, K1, K6                           // 62b2b54929f4
+       VPCMPEQQ Z9, Z9, K1, K6                            // 62d2b54929f1
+       VPCMPEQQ (BX), Z9, K1, K6                          // 62f2b5492933
+       VPCMPEQQ -17(BP)(SI*1), Z9, K1, K6                 // 62f2b54929b435efffffff
+       VPCMPGTD X12, X23, K4, K4                          // 62d1450466e4
+       VPCMPGTD 15(R8)(R14*4), X23, K4, K4                // 6291450466a4b00f000000
+       VPCMPGTD -7(CX)(DX*4), X23, K4, K4                 // 62f1450466a491f9ffffff
+       VPCMPGTD X12, X23, K4, K6                          // 62d1450466f4
+       VPCMPGTD 15(R8)(R14*4), X23, K4, K6                // 6291450466b4b00f000000
+       VPCMPGTD -7(CX)(DX*4), X23, K4, K6                 // 62f1450466b491f9ffffff
+       VPCMPGTD Y3, Y9, K1, K4                            // 62f1352966e3
+       VPCMPGTD 15(R8)(R14*8), Y9, K1, K4                 // 6291352966a4f00f000000
+       VPCMPGTD -15(R14)(R15*2), Y9, K1, K4               // 6291352966a47ef1ffffff
+       VPCMPGTD Y3, Y9, K1, K5                            // 62f1352966eb
+       VPCMPGTD 15(R8)(R14*8), Y9, K1, K5                 // 6291352966acf00f000000
+       VPCMPGTD -15(R14)(R15*2), Y9, K1, K5               // 6291352966ac7ef1ffffff
+       VPCMPGTD Z12, Z14, K3, K2                          // 62d10d4b66d4
+       VPCMPGTD Z13, Z14, K3, K2                          // 62d10d4b66d5
+       VPCMPGTD 17(SP)(BP*1), Z14, K3, K2                 // 62f10d4b66942c11000000
+       VPCMPGTD -7(CX)(DX*8), Z14, K3, K2                 // 62f10d4b6694d1f9ffffff
+       VPCMPGTD Z12, Z13, K3, K2                          // 62d1154b66d4
+       VPCMPGTD Z13, Z13, K3, K2                          // 62d1154b66d5
+       VPCMPGTD 17(SP)(BP*1), Z13, K3, K2                 // 62f1154b66942c11000000
+       VPCMPGTD -7(CX)(DX*8), Z13, K3, K2                 // 62f1154b6694d1f9ffffff
+       VPCMPGTD Z12, Z14, K3, K7                          // 62d10d4b66fc
+       VPCMPGTD Z13, Z14, K3, K7                          // 62d10d4b66fd
+       VPCMPGTD 17(SP)(BP*1), Z14, K3, K7                 // 62f10d4b66bc2c11000000
+       VPCMPGTD -7(CX)(DX*8), Z14, K3, K7                 // 62f10d4b66bcd1f9ffffff
+       VPCMPGTD Z12, Z13, K3, K7                          // 62d1154b66fc
+       VPCMPGTD Z13, Z13, K3, K7                          // 62d1154b66fd
+       VPCMPGTD 17(SP)(BP*1), Z13, K3, K7                 // 62f1154b66bc2c11000000
+       VPCMPGTD -7(CX)(DX*8), Z13, K3, K7                 // 62f1154b66bcd1f9ffffff
+       VPCMPGTQ X23, X16, K4, K0                          // 62b2fd0437c7
+       VPCMPGTQ (R8), X16, K4, K0                         // 62d2fd043700
+       VPCMPGTQ 15(DX)(BX*2), X16, K4, K0                 // 62f2fd0437845a0f000000
+       VPCMPGTQ X23, X16, K4, K5                          // 62b2fd0437ef
+       VPCMPGTQ (R8), X16, K4, K5                         // 62d2fd043728
+       VPCMPGTQ 15(DX)(BX*2), X16, K4, K5                 // 62f2fd0437ac5a0f000000
+       VPCMPGTQ Y9, Y2, K5, K6                            // 62d2ed2d37f1
+       VPCMPGTQ -15(R14)(R15*1), Y2, K5, K6               // 6292ed2d37b43ef1ffffff
+       VPCMPGTQ -15(BX), Y2, K5, K6                       // 62f2ed2d37b3f1ffffff
+       VPCMPGTQ Y9, Y2, K5, K5                            // 62d2ed2d37e9
+       VPCMPGTQ -15(R14)(R15*1), Y2, K5, K5               // 6292ed2d37ac3ef1ffffff
+       VPCMPGTQ -15(BX), Y2, K5, K5                       // 62f2ed2d37abf1ffffff
+       VPCMPGTQ Z2, Z21, K7, K1                           // 62f2d54737ca
+       VPCMPGTQ Z7, Z21, K7, K1                           // 62f2d54737cf
+       VPCMPGTQ -17(BP)(SI*2), Z21, K7, K1                // 62f2d547378c75efffffff
+       VPCMPGTQ 7(AX)(CX*2), Z21, K7, K1                  // 62f2d547378c4807000000
+       VPCMPGTQ Z2, Z9, K7, K1                            // 62f2b54f37ca
+       VPCMPGTQ Z7, Z9, K7, K1                            // 62f2b54f37cf
+       VPCMPGTQ -17(BP)(SI*2), Z9, K7, K1                 // 62f2b54f378c75efffffff
+       VPCMPGTQ 7(AX)(CX*2), Z9, K7, K1                   // 62f2b54f378c4807000000
+       VPCMPGTQ Z2, Z21, K7, K5                           // 62f2d54737ea
+       VPCMPGTQ Z7, Z21, K7, K5                           // 62f2d54737ef
+       VPCMPGTQ -17(BP)(SI*2), Z21, K7, K5                // 62f2d54737ac75efffffff
+       VPCMPGTQ 7(AX)(CX*2), Z21, K7, K5                  // 62f2d54737ac4807000000
+       VPCMPGTQ Z2, Z9, K7, K5                            // 62f2b54f37ea
+       VPCMPGTQ Z7, Z9, K7, K5                            // 62f2b54f37ef
+       VPCMPGTQ -17(BP)(SI*2), Z9, K7, K5                 // 62f2b54f37ac75efffffff
+       VPCMPGTQ 7(AX)(CX*2), Z9, K7, K5                   // 62f2b54f37ac4807000000
+       VPCMPQ $82, X24, X31, K7, K4                       // 629385071fe052
+       VPCMPQ $82, -17(BP)(SI*2), X31, K7, K4             // 62f385071fa475efffffff52
+       VPCMPQ $82, 7(AX)(CX*2), X31, K7, K4               // 62f385071fa4480700000052
+       VPCMPQ $82, X24, X31, K7, K6                       // 629385071ff052
+       VPCMPQ $82, -17(BP)(SI*2), X31, K7, K6             // 62f385071fb475efffffff52
+       VPCMPQ $82, 7(AX)(CX*2), X31, K7, K6               // 62f385071fb4480700000052
+       VPCMPQ $126, Y30, Y14, K4, K0                      // 62938d2c1fc67e
+       VPCMPQ $126, (SI), Y14, K4, K0                     // 62f38d2c1f067e
+       VPCMPQ $126, 7(SI)(DI*2), Y14, K4, K0              // 62f38d2c1f847e070000007e
+       VPCMPQ $126, Y30, Y14, K4, K7                      // 62938d2c1ffe7e
+       VPCMPQ $126, (SI), Y14, K4, K7                     // 62f38d2c1f3e7e
+       VPCMPQ $126, 7(SI)(DI*2), Y14, K4, K7              // 62f38d2c1fbc7e070000007e
+       VPCMPQ $94, Z3, Z27, K4, K5                        // 62f3a5441feb5e
+       VPCMPQ $94, Z0, Z27, K4, K5                        // 62f3a5441fe85e
+       VPCMPQ $94, (R14), Z27, K4, K5                     // 62d3a5441f2e5e
+       VPCMPQ $94, -7(DI)(R8*8), Z27, K4, K5              // 62b3a5441facc7f9ffffff5e
+       VPCMPQ $94, Z3, Z14, K4, K5                        // 62f38d4c1feb5e
+       VPCMPQ $94, Z0, Z14, K4, K5                        // 62f38d4c1fe85e
+       VPCMPQ $94, (R14), Z14, K4, K5                     // 62d38d4c1f2e5e
+       VPCMPQ $94, -7(DI)(R8*8), Z14, K4, K5              // 62b38d4c1facc7f9ffffff5e
+       VPCMPQ $94, Z3, Z27, K4, K4                        // 62f3a5441fe35e
+       VPCMPQ $94, Z0, Z27, K4, K4                        // 62f3a5441fe05e
+       VPCMPQ $94, (R14), Z27, K4, K4                     // 62d3a5441f265e
+       VPCMPQ $94, -7(DI)(R8*8), Z27, K4, K4              // 62b3a5441fa4c7f9ffffff5e
+       VPCMPQ $94, Z3, Z14, K4, K4                        // 62f38d4c1fe35e
+       VPCMPQ $94, Z0, Z14, K4, K4                        // 62f38d4c1fe05e
+       VPCMPQ $94, (R14), Z14, K4, K4                     // 62d38d4c1f265e
+       VPCMPQ $94, -7(DI)(R8*8), Z14, K4, K4              // 62b38d4c1fa4c7f9ffffff5e
+       VPCMPUD $67, X23, X11, K3, K6                      // 62b3250b1ef743
+       VPCMPUD $67, (R14), X11, K3, K6                    // 62d3250b1e3643
+       VPCMPUD $67, -7(DI)(R8*8), X11, K3, K6             // 62b3250b1eb4c7f9ffffff43
+       VPCMPUD $67, X23, X11, K3, K4                      // 62b3250b1ee743
+       VPCMPUD $67, (R14), X11, K3, K4                    // 62d3250b1e2643
+       VPCMPUD $67, -7(DI)(R8*8), X11, K3, K4             // 62b3250b1ea4c7f9ffffff43
+       VPCMPUD $127, Y1, Y16, K4, K4                      // 62f37d241ee17f
+       VPCMPUD $127, 7(SI)(DI*4), Y16, K4, K4             // 62f37d241ea4be070000007f
+       VPCMPUD $127, -7(DI)(R8*2), Y16, K4, K4            // 62b37d241ea447f9ffffff7f
+       VPCMPUD $127, Y1, Y16, K4, K6                      // 62f37d241ef17f
+       VPCMPUD $127, 7(SI)(DI*4), Y16, K4, K6             // 62f37d241eb4be070000007f
+       VPCMPUD $127, -7(DI)(R8*2), Y16, K4, K6            // 62b37d241eb447f9ffffff7f
+       VPCMPUD $0, Z1, Z22, K2, K4                        // 62f34d421ee100
+       VPCMPUD $0, Z16, Z22, K2, K4                       // 62b34d421ee000
+       VPCMPUD $0, (CX), Z22, K2, K4                      // 62f34d421e2100
+       VPCMPUD $0, 99(R15), Z22, K2, K4                   // 62d34d421ea76300000000
+       VPCMPUD $0, Z1, Z25, K2, K4                        // 62f335421ee100
+       VPCMPUD $0, Z16, Z25, K2, K4                       // 62b335421ee000
+       VPCMPUD $0, (CX), Z25, K2, K4                      // 62f335421e2100
+       VPCMPUD $0, 99(R15), Z25, K2, K4                   // 62d335421ea76300000000
+       VPCMPUD $0, Z1, Z22, K2, K5                        // 62f34d421ee900
+       VPCMPUD $0, Z16, Z22, K2, K5                       // 62b34d421ee800
+       VPCMPUD $0, (CX), Z22, K2, K5                      // 62f34d421e2900
+       VPCMPUD $0, 99(R15), Z22, K2, K5                   // 62d34d421eaf6300000000
+       VPCMPUD $0, Z1, Z25, K2, K5                        // 62f335421ee900
+       VPCMPUD $0, Z16, Z25, K2, K5                       // 62b335421ee800
+       VPCMPUD $0, (CX), Z25, K2, K5                      // 62f335421e2900
+       VPCMPUD $0, 99(R15), Z25, K2, K5                   // 62d335421eaf6300000000
+       VPCMPUQ $97, X20, X2, K2, K2                       // 62b3ed0a1ed461
+       VPCMPUQ $97, 99(R15)(R15*4), X2, K2, K2            // 6293ed0a1e94bf6300000061
+       VPCMPUQ $97, 15(DX), X2, K2, K2                    // 62f3ed0a1e920f00000061
+       VPCMPUQ $97, X20, X2, K2, K7                       // 62b3ed0a1efc61
+       VPCMPUQ $97, 99(R15)(R15*4), X2, K2, K7            // 6293ed0a1ebcbf6300000061
+       VPCMPUQ $97, 15(DX), X2, K2, K7                    // 62f3ed0a1eba0f00000061
+       VPCMPUQ $81, Y31, Y30, K3, K0                      // 62938d231ec751
+       VPCMPUQ $81, 17(SP), Y30, K3, K0                   // 62f38d231e84241100000051
+       VPCMPUQ $81, -17(BP)(SI*4), Y30, K3, K0            // 62f38d231e84b5efffffff51
+       VPCMPUQ $81, Y31, Y30, K3, K5                      // 62938d231eef51
+       VPCMPUQ $81, 17(SP), Y30, K3, K5                   // 62f38d231eac241100000051
+       VPCMPUQ $81, -17(BP)(SI*4), Y30, K3, K5            // 62f38d231eacb5efffffff51
+       VPCMPUQ $42, Z0, Z6, K3, K6                        // 62f3cd4b1ef02a
+       VPCMPUQ $42, Z8, Z6, K3, K6                        // 62d3cd4b1ef02a
+       VPCMPUQ $42, 99(R15)(R15*2), Z6, K3, K6            // 6293cd4b1eb47f630000002a
+       VPCMPUQ $42, -7(DI), Z6, K3, K6                    // 62f3cd4b1eb7f9ffffff2a
+       VPCMPUQ $42, Z0, Z2, K3, K6                        // 62f3ed4b1ef02a
+       VPCMPUQ $42, Z8, Z2, K3, K6                        // 62d3ed4b1ef02a
+       VPCMPUQ $42, 99(R15)(R15*2), Z2, K3, K6            // 6293ed4b1eb47f630000002a
+       VPCMPUQ $42, -7(DI), Z2, K3, K6                    // 62f3ed4b1eb7f9ffffff2a
+       VPCMPUQ $42, Z0, Z6, K3, K5                        // 62f3cd4b1ee82a
+       VPCMPUQ $42, Z8, Z6, K3, K5                        // 62d3cd4b1ee82a
+       VPCMPUQ $42, 99(R15)(R15*2), Z6, K3, K5            // 6293cd4b1eac7f630000002a
+       VPCMPUQ $42, -7(DI), Z6, K3, K5                    // 62f3cd4b1eaff9ffffff2a
+       VPCMPUQ $42, Z0, Z2, K3, K5                        // 62f3ed4b1ee82a
+       VPCMPUQ $42, Z8, Z2, K3, K5                        // 62d3ed4b1ee82a
+       VPCMPUQ $42, 99(R15)(R15*2), Z2, K3, K5            // 6293ed4b1eac7f630000002a
+       VPCMPUQ $42, -7(DI), Z2, K3, K5                    // 62f3ed4b1eaff9ffffff2a
+       VPCOMPRESSD X9, K7, X8                             // 62527d0f8bc8
+       VPCOMPRESSD X9, K7, 15(DX)(BX*1)                   // 62727d0f8b8c1a0f000000
+       VPCOMPRESSD X9, K7, -7(CX)(DX*2)                   // 62727d0f8b8c51f9ffffff
+       VPCOMPRESSD Y14, K2, Y20                           // 62327d2a8bf4
+       VPCOMPRESSD Y14, K2, 7(SI)(DI*8)                   // 62727d2a8bb4fe07000000
+       VPCOMPRESSD Y14, K2, -15(R14)                      // 62527d2a8bb6f1ffffff
+       VPCOMPRESSD Z26, K4, Z6                            // 62627d4c8bd6
+       VPCOMPRESSD Z14, K4, Z6                            // 62727d4c8bf6
+       VPCOMPRESSD Z26, K4, Z14                           // 62427d4c8bd6
+       VPCOMPRESSD Z14, K4, Z14                           // 62527d4c8bf6
+       VPCOMPRESSD Z26, K4, 17(SP)(BP*2)                  // 62627d4c8b946c11000000
+       VPCOMPRESSD Z14, K4, 17(SP)(BP*2)                  // 62727d4c8bb46c11000000
+       VPCOMPRESSD Z26, K4, -7(DI)(R8*4)                  // 62227d4c8b9487f9ffffff
+       VPCOMPRESSD Z14, K4, -7(DI)(R8*4)                  // 62327d4c8bb487f9ffffff
+       VPCOMPRESSQ X31, K1, X2                            // 6262fd098bfa
+       VPCOMPRESSQ X31, K1, -17(BP)                       // 6262fd098bbdefffffff
+       VPCOMPRESSQ X31, K1, -15(R14)(R15*8)               // 6202fd098bbcfef1ffffff
+       VPCOMPRESSQ Y13, K3, Y24                           // 6212fd2b8be8
+       VPCOMPRESSQ Y13, K3, 7(SI)(DI*1)                   // 6272fd2b8bac3e07000000
+       VPCOMPRESSQ Y13, K3, 15(DX)(BX*8)                  // 6272fd2b8bacda0f000000
+       VPCOMPRESSQ Z13, K4, Z28                           // 6212fd4c8bec
+       VPCOMPRESSQ Z21, K4, Z28                           // 6282fd4c8bec
+       VPCOMPRESSQ Z13, K4, Z6                            // 6272fd4c8bee
+       VPCOMPRESSQ Z21, K4, Z6                            // 62e2fd4c8bee
+       VPCOMPRESSQ Z13, K4, 15(R8)                        // 6252fd4c8ba80f000000
+       VPCOMPRESSQ Z21, K4, 15(R8)                        // 62c2fd4c8ba80f000000
+       VPCOMPRESSQ Z13, K4, (BP)                          // 6272fd4c8b6d00
+       VPCOMPRESSQ Z21, K4, (BP)                          // 62e2fd4c8b6d00
+       VPERMD Y11, Y8, K1, Y24                            // 62423d2936c3
+       VPERMD -17(BP)(SI*2), Y8, K1, Y24                  // 62623d29368475efffffff
+       VPERMD 7(AX)(CX*2), Y8, K1, Y24                    // 62623d2936844807000000
+       VPERMD Z20, Z0, K1, Z7                             // 62b27d4936fc
+       VPERMD Z28, Z0, K1, Z7                             // 62927d4936fc
+       VPERMD 99(R15)(R15*1), Z0, K1, Z7                  // 62927d4936bc3f63000000
+       VPERMD (DX), Z0, K1, Z7                            // 62f27d49363a
+       VPERMD Z20, Z6, K1, Z7                             // 62b24d4936fc
+       VPERMD Z28, Z6, K1, Z7                             // 62924d4936fc
+       VPERMD 99(R15)(R15*1), Z6, K1, Z7                  // 62924d4936bc3f63000000
+       VPERMD (DX), Z6, K1, Z7                            // 62f24d49363a
+       VPERMD Z20, Z0, K1, Z9                             // 62327d4936cc
+       VPERMD Z28, Z0, K1, Z9                             // 62127d4936cc
+       VPERMD 99(R15)(R15*1), Z0, K1, Z9                  // 62127d49368c3f63000000
+       VPERMD (DX), Z0, K1, Z9                            // 62727d49360a
+       VPERMD Z20, Z6, K1, Z9                             // 62324d4936cc
+       VPERMD Z28, Z6, K1, Z9                             // 62124d4936cc
+       VPERMD 99(R15)(R15*1), Z6, K1, Z9                  // 62124d49368c3f63000000
+       VPERMD (DX), Z6, K1, Z9                            // 62724d49360a
+       VPERMI2D X1, X22, K1, X0                           // 62f24d0176c1
+       VPERMI2D 7(AX), X22, K1, X0                        // 62f24d01768007000000
+       VPERMI2D (DI), X22, K1, X0                         // 62f24d017607
+       VPERMI2D Y9, Y16, K3, Y21                          // 62c27d2376e9
+       VPERMI2D (R14), Y16, K3, Y21                       // 62c27d23762e
+       VPERMI2D -7(DI)(R8*8), Y16, K3, Y21                // 62a27d2376acc7f9ffffff
+       VPERMI2D Z2, Z18, K4, Z11                          // 62726d4476da
+       VPERMI2D Z21, Z18, K4, Z11                         // 62326d4476dd
+       VPERMI2D 7(SI)(DI*8), Z18, K4, Z11                 // 62726d44769cfe07000000
+       VPERMI2D -15(R14), Z18, K4, Z11                    // 62526d44769ef1ffffff
+       VPERMI2D Z2, Z24, K4, Z11                          // 62723d4476da
+       VPERMI2D Z21, Z24, K4, Z11                         // 62323d4476dd
+       VPERMI2D 7(SI)(DI*8), Z24, K4, Z11                 // 62723d44769cfe07000000
+       VPERMI2D -15(R14), Z24, K4, Z11                    // 62523d44769ef1ffffff
+       VPERMI2D Z2, Z18, K4, Z5                           // 62f26d4476ea
+       VPERMI2D Z21, Z18, K4, Z5                          // 62b26d4476ed
+       VPERMI2D 7(SI)(DI*8), Z18, K4, Z5                  // 62f26d4476acfe07000000
+       VPERMI2D -15(R14), Z18, K4, Z5                     // 62d26d4476aef1ffffff
+       VPERMI2D Z2, Z24, K4, Z5                           // 62f23d4476ea
+       VPERMI2D Z21, Z24, K4, Z5                          // 62b23d4476ed
+       VPERMI2D 7(SI)(DI*8), Z24, K4, Z5                  // 62f23d4476acfe07000000
+       VPERMI2D -15(R14), Z24, K4, Z5                     // 62d23d4476aef1ffffff
+       VPERMI2PD X7, X6, K5, X11                          // 6272cd0d77df
+       VPERMI2PD 99(R15)(R15*1), X6, K5, X11              // 6212cd0d779c3f63000000
+       VPERMI2PD (DX), X6, K5, X11                        // 6272cd0d771a
+       VPERMI2PD Y6, Y9, K7, Y13                          // 6272b52f77ee
+       VPERMI2PD 99(R15)(R15*4), Y9, K7, Y13              // 6212b52f77acbf63000000
+       VPERMI2PD 15(DX), Y9, K7, Y13                      // 6272b52f77aa0f000000
+       VPERMI2PD Z6, Z6, K7, Z7                           // 62f2cd4f77fe
+       VPERMI2PD Z22, Z6, K7, Z7                          // 62b2cd4f77fe
+       VPERMI2PD 7(SI)(DI*1), Z6, K7, Z7                  // 62f2cd4f77bc3e07000000
+       VPERMI2PD 15(DX)(BX*8), Z6, K7, Z7                 // 62f2cd4f77bcda0f000000
+       VPERMI2PD Z6, Z16, K7, Z7                          // 62f2fd4777fe
+       VPERMI2PD Z22, Z16, K7, Z7                         // 62b2fd4777fe
+       VPERMI2PD 7(SI)(DI*1), Z16, K7, Z7                 // 62f2fd4777bc3e07000000
+       VPERMI2PD 15(DX)(BX*8), Z16, K7, Z7                // 62f2fd4777bcda0f000000
+       VPERMI2PD Z6, Z6, K7, Z13                          // 6272cd4f77ee
+       VPERMI2PD Z22, Z6, K7, Z13                         // 6232cd4f77ee
+       VPERMI2PD 7(SI)(DI*1), Z6, K7, Z13                 // 6272cd4f77ac3e07000000
+       VPERMI2PD 15(DX)(BX*8), Z6, K7, Z13                // 6272cd4f77acda0f000000
+       VPERMI2PD Z6, Z16, K7, Z13                         // 6272fd4777ee
+       VPERMI2PD Z22, Z16, K7, Z13                        // 6232fd4777ee
+       VPERMI2PD 7(SI)(DI*1), Z16, K7, Z13                // 6272fd4777ac3e07000000
+       VPERMI2PD 15(DX)(BX*8), Z16, K7, Z13               // 6272fd4777acda0f000000
+       VPERMI2PS X3, X31, K6, X8                          // 6272050677c3
+       VPERMI2PS -17(BP)(SI*8), X31, K6, X8               // 627205067784f5efffffff
+       VPERMI2PS (R15), X31, K6, X8                       // 625205067707
+       VPERMI2PS Y6, Y7, K3, Y3                           // 62f2452b77de
+       VPERMI2PS (CX), Y7, K3, Y3                         // 62f2452b7719
+       VPERMI2PS 99(R15), Y7, K3, Y3                      // 62d2452b779f63000000
+       VPERMI2PS Z18, Z13, K7, Z1                         // 62b2154f77ca
+       VPERMI2PS Z8, Z13, K7, Z1                          // 62d2154f77c8
+       VPERMI2PS -7(DI)(R8*1), Z13, K7, Z1                // 62b2154f778c07f9ffffff
+       VPERMI2PS (SP), Z13, K7, Z1                        // 62f2154f770c24
+       VPERMI2PS Z18, Z13, K7, Z15                        // 6232154f77fa
+       VPERMI2PS Z8, Z13, K7, Z15                         // 6252154f77f8
+       VPERMI2PS -7(DI)(R8*1), Z13, K7, Z15               // 6232154f77bc07f9ffffff
+       VPERMI2PS (SP), Z13, K7, Z15                       // 6272154f773c24
+       VPERMI2Q X24, X20, K4, X28                         // 6202dd0476e0
+       VPERMI2Q 7(SI)(DI*8), X20, K4, X28                 // 6262dd0476a4fe07000000
+       VPERMI2Q -15(R14), X20, K4, X28                    // 6242dd0476a6f1ffffff
+       VPERMI2Q Y26, Y11, K4, Y26                         // 6202a52c76d2
+       VPERMI2Q 99(R15)(R15*2), Y11, K4, Y26              // 6202a52c76947f63000000
+       VPERMI2Q -7(DI), Y11, K4, Y26                      // 6262a52c7697f9ffffff
+       VPERMI2Q Z20, Z2, K7, Z22                          // 62a2ed4f76f4
+       VPERMI2Q Z9, Z2, K7, Z22                           // 62c2ed4f76f1
+       VPERMI2Q -7(CX), Z2, K7, Z22                       // 62e2ed4f76b1f9ffffff
+       VPERMI2Q 15(DX)(BX*4), Z2, K7, Z22                 // 62e2ed4f76b49a0f000000
+       VPERMI2Q Z20, Z31, K7, Z22                         // 62a2854776f4
+       VPERMI2Q Z9, Z31, K7, Z22                          // 62c2854776f1
+       VPERMI2Q -7(CX), Z31, K7, Z22                      // 62e2854776b1f9ffffff
+       VPERMI2Q 15(DX)(BX*4), Z31, K7, Z22                // 62e2854776b49a0f000000
+       VPERMI2Q Z20, Z2, K7, Z7                           // 62b2ed4f76fc
+       VPERMI2Q Z9, Z2, K7, Z7                            // 62d2ed4f76f9
+       VPERMI2Q -7(CX), Z2, K7, Z7                        // 62f2ed4f76b9f9ffffff
+       VPERMI2Q 15(DX)(BX*4), Z2, K7, Z7                  // 62f2ed4f76bc9a0f000000
+       VPERMI2Q Z20, Z31, K7, Z7                          // 62b2854776fc
+       VPERMI2Q Z9, Z31, K7, Z7                           // 62d2854776f9
+       VPERMI2Q -7(CX), Z31, K7, Z7                       // 62f2854776b9f9ffffff
+       VPERMI2Q 15(DX)(BX*4), Z31, K7, Z7                 // 62f2854776bc9a0f000000
+       VPERMILPD $94, X6, K4, X12                         // 6273fd0c05e65e
+       VPERMILPD $94, -7(DI)(R8*1), K4, X12               // 6233fd0c05a407f9ffffff5e
+       VPERMILPD $94, (SP), K4, X12                       // 6273fd0c0524245e
+       VPERMILPD $121, Y18, K2, Y31                       // 6223fd2a05fa79
+       VPERMILPD $121, 15(DX)(BX*1), K2, Y31              // 6263fd2a05bc1a0f00000079
+       VPERMILPD $121, -7(CX)(DX*2), K2, Y31              // 6263fd2a05bc51f9ffffff79
+       VPERMILPD $13, Z3, K2, Z14                         // 6273fd4a05f30d
+       VPERMILPD $13, Z12, K2, Z14                        // 6253fd4a05f40d
+       VPERMILPD $13, (AX), K2, Z14                       // 6273fd4a05300d
+       VPERMILPD $13, 7(SI), K2, Z14                      // 6273fd4a05b6070000000d
+       VPERMILPD $13, Z3, K2, Z28                         // 6263fd4a05e30d
+       VPERMILPD $13, Z12, K2, Z28                        // 6243fd4a05e40d
+       VPERMILPD $13, (AX), K2, Z28                       // 6263fd4a05200d
+       VPERMILPD $13, 7(SI), K2, Z28                      // 6263fd4a05a6070000000d
+       VPERMILPD X6, X28, K3, X17                         // 62e29d030dce
+       VPERMILPD -7(CX), X28, K3, X17                     // 62e29d030d89f9ffffff
+       VPERMILPD 15(DX)(BX*4), X28, K3, X17               // 62e29d030d8c9a0f000000
+       VPERMILPD Y2, Y24, K3, Y3                          // 62f2bd230dda
+       VPERMILPD -17(BP), Y24, K3, Y3                     // 62f2bd230d9defffffff
+       VPERMILPD -15(R14)(R15*8), Y24, K3, Y3             // 6292bd230d9cfef1ffffff
+       VPERMILPD Z5, Z19, K3, Z15                         // 6272e5430dfd
+       VPERMILPD Z1, Z19, K3, Z15                         // 6272e5430df9
+       VPERMILPD (BX), Z19, K3, Z15                       // 6272e5430d3b
+       VPERMILPD -17(BP)(SI*1), Z19, K3, Z15              // 6272e5430dbc35efffffff
+       VPERMILPD Z5, Z15, K3, Z15                         // 6272854b0dfd
+       VPERMILPD Z1, Z15, K3, Z15                         // 6272854b0df9
+       VPERMILPD (BX), Z15, K3, Z15                       // 6272854b0d3b
+       VPERMILPD -17(BP)(SI*1), Z15, K3, Z15              // 6272854b0dbc35efffffff
+       VPERMILPD Z5, Z19, K3, Z30                         // 6262e5430df5
+       VPERMILPD Z1, Z19, K3, Z30                         // 6262e5430df1
+       VPERMILPD (BX), Z19, K3, Z30                       // 6262e5430d33
+       VPERMILPD -17(BP)(SI*1), Z19, K3, Z30              // 6262e5430db435efffffff
+       VPERMILPD Z5, Z15, K3, Z30                         // 6262854b0df5
+       VPERMILPD Z1, Z15, K3, Z30                         // 6262854b0df1
+       VPERMILPD (BX), Z15, K3, Z30                       // 6262854b0d33
+       VPERMILPD -17(BP)(SI*1), Z15, K3, Z30              // 6262854b0db435efffffff
+       VPERMILPS $65, X8, K2, X1                          // 62d37d0a04c841
+       VPERMILPS $65, 99(R15)(R15*8), K2, X1              // 62937d0a048cff6300000041
+       VPERMILPS $65, 7(AX)(CX*8), K2, X1                 // 62f37d0a048cc80700000041
+       VPERMILPS $67, Y21, K1, Y7                         // 62b37d2904fd43
+       VPERMILPS $67, 17(SP)(BP*2), K1, Y7                // 62f37d2904bc6c1100000043
+       VPERMILPS $67, -7(DI)(R8*4), K1, Y7                // 62b37d2904bc87f9ffffff43
+       VPERMILPS $127, Z14, K2, Z3                        // 62d37d4a04de7f
+       VPERMILPS $127, Z15, K2, Z3                        // 62d37d4a04df7f
+       VPERMILPS $127, 15(R8)(R14*4), K2, Z3              // 62937d4a049cb00f0000007f
+       VPERMILPS $127, -7(CX)(DX*4), K2, Z3               // 62f37d4a049c91f9ffffff7f
+       VPERMILPS $127, Z14, K2, Z5                        // 62d37d4a04ee7f
+       VPERMILPS $127, Z15, K2, Z5                        // 62d37d4a04ef7f
+       VPERMILPS $127, 15(R8)(R14*4), K2, Z5              // 62937d4a04acb00f0000007f
+       VPERMILPS $127, -7(CX)(DX*4), K2, Z5               // 62f37d4a04ac91f9ffffff7f
+       VPERMILPS X0, X6, K1, X8                           // 62724d090cc0
+       VPERMILPS (AX), X6, K1, X8                         // 62724d090c00
+       VPERMILPS 7(SI), X6, K1, X8                        // 62724d090c8607000000
+       VPERMILPS Y20, Y8, K7, Y14                         // 62323d2f0cf4
+       VPERMILPS 15(R8), Y8, K7, Y14                      // 62523d2f0cb00f000000
+       VPERMILPS (BP), Y8, K7, Y14                        // 62723d2f0c7500
+       VPERMILPS Z20, Z16, K1, Z21                        // 62a27d410cec
+       VPERMILPS Z0, Z16, K1, Z21                         // 62e27d410ce8
+       VPERMILPS (R8), Z16, K1, Z21                       // 62c27d410c28
+       VPERMILPS 15(DX)(BX*2), Z16, K1, Z21               // 62e27d410cac5a0f000000
+       VPERMILPS Z20, Z9, K1, Z21                         // 62a235490cec
+       VPERMILPS Z0, Z9, K1, Z21                          // 62e235490ce8
+       VPERMILPS (R8), Z9, K1, Z21                        // 62c235490c28
+       VPERMILPS 15(DX)(BX*2), Z9, K1, Z21                // 62e235490cac5a0f000000
+       VPERMILPS Z20, Z16, K1, Z8                         // 62327d410cc4
+       VPERMILPS Z0, Z16, K1, Z8                          // 62727d410cc0
+       VPERMILPS (R8), Z16, K1, Z8                        // 62527d410c00
+       VPERMILPS 15(DX)(BX*2), Z16, K1, Z8                // 62727d410c845a0f000000
+       VPERMILPS Z20, Z9, K1, Z8                          // 623235490cc4
+       VPERMILPS Z0, Z9, K1, Z8                           // 627235490cc0
+       VPERMILPS (R8), Z9, K1, Z8                         // 625235490c00
+       VPERMILPS 15(DX)(BX*2), Z9, K1, Z8                 // 627235490c845a0f000000
+       VPERMPD $0, Y24, K1, Y11                           // 6213fd2901d800
+       VPERMPD $0, 15(R8)(R14*8), K1, Y11                 // 6213fd29019cf00f00000000
+       VPERMPD $0, -15(R14)(R15*2), K1, Y11               // 6213fd29019c7ef1ffffff00
+       VPERMPD $97, Z0, K1, Z23                           // 62e3fd4901f861
+       VPERMPD $97, Z11, K1, Z23                          // 62c3fd4901fb61
+       VPERMPD $97, 17(SP)(BP*1), K1, Z23                 // 62e3fd4901bc2c1100000061
+       VPERMPD $97, -7(CX)(DX*8), K1, Z23                 // 62e3fd4901bcd1f9ffffff61
+       VPERMPD $97, Z0, K1, Z19                           // 62e3fd4901d861
+       VPERMPD $97, Z11, K1, Z19                          // 62c3fd4901db61
+       VPERMPD $97, 17(SP)(BP*1), K1, Z19                 // 62e3fd49019c2c1100000061
+       VPERMPD $97, -7(CX)(DX*8), K1, Z19                 // 62e3fd49019cd1f9ffffff61
+       VPERMPD Y18, Y5, K7, Y1                            // 62b2d52f16ca
+       VPERMPD -15(R14)(R15*1), Y5, K7, Y1                // 6292d52f168c3ef1ffffff
+       VPERMPD -15(BX), Y5, K7, Y1                        // 62f2d52f168bf1ffffff
+       VPERMPD Z0, Z24, K2, Z0                            // 62f2bd4216c0
+       VPERMPD Z26, Z24, K2, Z0                           // 6292bd4216c2
+       VPERMPD -17(BP)(SI*2), Z24, K2, Z0                 // 62f2bd42168475efffffff
+       VPERMPD 7(AX)(CX*2), Z24, K2, Z0                   // 62f2bd4216844807000000
+       VPERMPD Z0, Z12, K2, Z0                            // 62f29d4a16c0
+       VPERMPD Z26, Z12, K2, Z0                           // 62929d4a16c2
+       VPERMPD -17(BP)(SI*2), Z12, K2, Z0                 // 62f29d4a168475efffffff
+       VPERMPD 7(AX)(CX*2), Z12, K2, Z0                   // 62f29d4a16844807000000
+       VPERMPD Z0, Z24, K2, Z25                           // 6262bd4216c8
+       VPERMPD Z26, Z24, K2, Z25                          // 6202bd4216ca
+       VPERMPD -17(BP)(SI*2), Z24, K2, Z25                // 6262bd42168c75efffffff
+       VPERMPD 7(AX)(CX*2), Z24, K2, Z25                  // 6262bd42168c4807000000
+       VPERMPD Z0, Z12, K2, Z25                           // 62629d4a16c8
+       VPERMPD Z26, Z12, K2, Z25                          // 62029d4a16ca
+       VPERMPD -17(BP)(SI*2), Z12, K2, Z25                // 62629d4a168c75efffffff
+       VPERMPD 7(AX)(CX*2), Z12, K2, Z25                  // 62629d4a168c4807000000
+       VPERMPS Y9, Y20, K4, Y20                           // 62c25d2416e1
+       VPERMPS 7(AX)(CX*4), Y20, K4, Y20                  // 62e25d2416a48807000000
+       VPERMPS 7(AX)(CX*1), Y20, K4, Y20                  // 62e25d2416a40807000000
+       VPERMPS Z9, Z9, K1, Z9                             // 6252354916c9
+       VPERMPS Z28, Z9, K1, Z9                            // 6212354916cc
+       VPERMPS 15(R8)(R14*1), Z9, K1, Z9                  // 62123549168c300f000000
+       VPERMPS 15(R8)(R14*2), Z9, K1, Z9                  // 62123549168c700f000000
+       VPERMPS Z9, Z25, K1, Z9                            // 6252354116c9
+       VPERMPS Z28, Z25, K1, Z9                           // 6212354116cc
+       VPERMPS 15(R8)(R14*1), Z25, K1, Z9                 // 62123541168c300f000000
+       VPERMPS 15(R8)(R14*2), Z25, K1, Z9                 // 62123541168c700f000000
+       VPERMPS Z9, Z9, K1, Z3                             // 62d2354916d9
+       VPERMPS Z28, Z9, K1, Z3                            // 6292354916dc
+       VPERMPS 15(R8)(R14*1), Z9, K1, Z3                  // 62923549169c300f000000
+       VPERMPS 15(R8)(R14*2), Z9, K1, Z3                  // 62923549169c700f000000
+       VPERMPS Z9, Z25, K1, Z3                            // 62d2354116d9
+       VPERMPS Z28, Z25, K1, Z3                           // 6292354116dc
+       VPERMPS 15(R8)(R14*1), Z25, K1, Z3                 // 62923541169c300f000000
+       VPERMPS 15(R8)(R14*2), Z25, K1, Z3                 // 62923541169c700f000000
+       VPERMQ $81, Y28, K3, Y28                           // 6203fd2b00e451
+       VPERMQ $81, (SI), K3, Y28                          // 6263fd2b002651
+       VPERMQ $81, 7(SI)(DI*2), K3, Y28                   // 6263fd2b00a47e0700000051
+       VPERMQ $42, Z17, K4, Z20                           // 62a3fd4c00e12a
+       VPERMQ $42, Z0, K4, Z20                            // 62e3fd4c00e02a
+       VPERMQ $42, (R14), K4, Z20                         // 62c3fd4c00262a
+       VPERMQ $42, -7(DI)(R8*8), K4, Z20                  // 62a3fd4c00a4c7f9ffffff2a
+       VPERMQ $42, Z17, K4, Z0                            // 62b3fd4c00c12a
+       VPERMQ $42, Z0, K4, Z0                             // 62f3fd4c00c02a
+       VPERMQ $42, (R14), K4, Z0                          // 62d3fd4c00062a
+       VPERMQ $42, -7(DI)(R8*8), K4, Z0                   // 62b3fd4c0084c7f9ffffff2a
+       VPERMQ Y11, Y8, K5, Y1                             // 62d2bd2d36cb
+       VPERMQ 17(SP)(BP*8), Y8, K5, Y1                    // 62f2bd2d368cec11000000
+       VPERMQ 17(SP)(BP*4), Y8, K5, Y1                    // 62f2bd2d368cac11000000
+       VPERMQ Z21, Z31, K7, Z17                           // 62a2854736cd
+       VPERMQ Z9, Z31, K7, Z17                            // 62c2854736c9
+       VPERMQ 99(R15)(R15*4), Z31, K7, Z17                // 62828547368cbf63000000
+       VPERMQ 15(DX), Z31, K7, Z17                        // 62e28547368a0f000000
+       VPERMQ Z21, Z0, K7, Z17                            // 62a2fd4f36cd
+       VPERMQ Z9, Z0, K7, Z17                             // 62c2fd4f36c9
+       VPERMQ 99(R15)(R15*4), Z0, K7, Z17                 // 6282fd4f368cbf63000000
+       VPERMQ 15(DX), Z0, K7, Z17                         // 62e2fd4f368a0f000000
+       VPERMQ Z21, Z31, K7, Z23                           // 62a2854736fd
+       VPERMQ Z9, Z31, K7, Z23                            // 62c2854736f9
+       VPERMQ 99(R15)(R15*4), Z31, K7, Z23                // 6282854736bcbf63000000
+       VPERMQ 15(DX), Z31, K7, Z23                        // 62e2854736ba0f000000
+       VPERMQ Z21, Z0, K7, Z23                            // 62a2fd4f36fd
+       VPERMQ Z9, Z0, K7, Z23                             // 62c2fd4f36f9
+       VPERMQ 99(R15)(R15*4), Z0, K7, Z23                 // 6282fd4f36bcbf63000000
+       VPERMQ 15(DX), Z0, K7, Z23                         // 62e2fd4f36ba0f000000
+       VPERMT2D X12, X22, K7, X6                          // 62d24d077ef4
+       VPERMT2D 15(R8)(R14*4), X22, K7, X6                // 62924d077eb4b00f000000
+       VPERMT2D -7(CX)(DX*4), X22, K7, X6                 // 62f24d077eb491f9ffffff
+       VPERMT2D Y26, Y6, K4, Y12                          // 62124d2c7ee2
+       VPERMT2D 17(SP), Y6, K4, Y12                       // 62724d2c7ea42411000000
+       VPERMT2D -17(BP)(SI*4), Y6, K4, Y12                // 62724d2c7ea4b5efffffff
+       VPERMT2D Z7, Z26, K4, Z30                          // 62622d447ef7
+       VPERMT2D Z21, Z26, K4, Z30                         // 62222d447ef5
+       VPERMT2D 99(R15)(R15*2), Z26, K4, Z30              // 62022d447eb47f63000000
+       VPERMT2D -7(DI), Z26, K4, Z30                      // 62622d447eb7f9ffffff
+       VPERMT2D Z7, Z22, K4, Z30                          // 62624d447ef7
+       VPERMT2D Z21, Z22, K4, Z30                         // 62224d447ef5
+       VPERMT2D 99(R15)(R15*2), Z22, K4, Z30              // 62024d447eb47f63000000
+       VPERMT2D -7(DI), Z22, K4, Z30                      // 62624d447eb7f9ffffff
+       VPERMT2D Z7, Z26, K4, Z5                           // 62f22d447eef
+       VPERMT2D Z21, Z26, K4, Z5                          // 62b22d447eed
+       VPERMT2D 99(R15)(R15*2), Z26, K4, Z5               // 62922d447eac7f63000000
+       VPERMT2D -7(DI), Z26, K4, Z5                       // 62f22d447eaff9ffffff
+       VPERMT2D Z7, Z22, K4, Z5                           // 62f24d447eef
+       VPERMT2D Z21, Z22, K4, Z5                          // 62b24d447eed
+       VPERMT2D 99(R15)(R15*2), Z22, K4, Z5               // 62924d447eac7f63000000
+       VPERMT2D -7(DI), Z22, K4, Z5                       // 62f24d447eaff9ffffff
+       VPERMT2PD X8, X28, K7, X16                         // 62c29d077fc0
+       VPERMT2PD (R8), X28, K7, X16                       // 62c29d077f00
+       VPERMT2PD 15(DX)(BX*2), X28, K7, X16               // 62e29d077f845a0f000000
+       VPERMT2PD Y28, Y8, K2, Y3                          // 6292bd2a7fdc
+       VPERMT2PD 7(AX), Y8, K2, Y3                        // 62f2bd2a7f9807000000
+       VPERMT2PD (DI), Y8, K2, Y3                         // 62f2bd2a7f1f
+       VPERMT2PD Z12, Z14, K5, Z16                        // 62c28d4d7fc4
+       VPERMT2PD Z13, Z14, K5, Z16                        // 62c28d4d7fc5
+       VPERMT2PD -7(CX)(DX*1), Z14, K5, Z16               // 62e28d4d7f8411f9ffffff
+       VPERMT2PD -15(R14)(R15*4), Z14, K5, Z16            // 62828d4d7f84bef1ffffff
+       VPERMT2PD Z12, Z13, K5, Z16                        // 62c2954d7fc4
+       VPERMT2PD Z13, Z13, K5, Z16                        // 62c2954d7fc5
+       VPERMT2PD -7(CX)(DX*1), Z13, K5, Z16               // 62e2954d7f8411f9ffffff
+       VPERMT2PD -15(R14)(R15*4), Z13, K5, Z16            // 6282954d7f84bef1ffffff
+       VPERMT2PD Z12, Z14, K5, Z25                        // 62428d4d7fcc
+       VPERMT2PD Z13, Z14, K5, Z25                        // 62428d4d7fcd
+       VPERMT2PD -7(CX)(DX*1), Z14, K5, Z25               // 62628d4d7f8c11f9ffffff
+       VPERMT2PD -15(R14)(R15*4), Z14, K5, Z25            // 62028d4d7f8cbef1ffffff
+       VPERMT2PD Z12, Z13, K5, Z25                        // 6242954d7fcc
+       VPERMT2PD Z13, Z13, K5, Z25                        // 6242954d7fcd
+       VPERMT2PD -7(CX)(DX*1), Z13, K5, Z25               // 6262954d7f8c11f9ffffff
+       VPERMT2PD -15(R14)(R15*4), Z13, K5, Z25            // 6202954d7f8cbef1ffffff
+       VPERMT2PS X1, X11, K3, X15                         // 6272250b7ff9
+       VPERMT2PS 17(SP)(BP*1), X11, K3, X15               // 6272250b7fbc2c11000000
+       VPERMT2PS -7(CX)(DX*8), X11, K3, X15               // 6272250b7fbcd1f9ffffff
+       VPERMT2PS Y14, Y23, K4, Y1                         // 62d245247fce
+       VPERMT2PS 99(R15)(R15*1), Y23, K4, Y1              // 629245247f8c3f63000000
+       VPERMT2PS (DX), Y23, K4, Y1                        // 62f245247f0a
+       VPERMT2PS Z27, Z2, K2, Z21                         // 62826d4a7feb
+       VPERMT2PS Z25, Z2, K2, Z21                         // 62826d4a7fe9
+       VPERMT2PS 15(DX)(BX*1), Z2, K2, Z21                // 62e26d4a7fac1a0f000000
+       VPERMT2PS -7(CX)(DX*2), Z2, K2, Z21                // 62e26d4a7fac51f9ffffff
+       VPERMT2PS Z27, Z7, K2, Z21                         // 6282454a7feb
+       VPERMT2PS Z25, Z7, K2, Z21                         // 6282454a7fe9
+       VPERMT2PS 15(DX)(BX*1), Z7, K2, Z21                // 62e2454a7fac1a0f000000
+       VPERMT2PS -7(CX)(DX*2), Z7, K2, Z21                // 62e2454a7fac51f9ffffff
+       VPERMT2PS Z27, Z2, K2, Z9                          // 62126d4a7fcb
+       VPERMT2PS Z25, Z2, K2, Z9                          // 62126d4a7fc9
+       VPERMT2PS 15(DX)(BX*1), Z2, K2, Z9                 // 62726d4a7f8c1a0f000000
+       VPERMT2PS -7(CX)(DX*2), Z2, K2, Z9                 // 62726d4a7f8c51f9ffffff
+       VPERMT2PS Z27, Z7, K2, Z9                          // 6212454a7fcb
+       VPERMT2PS Z25, Z7, K2, Z9                          // 6212454a7fc9
+       VPERMT2PS 15(DX)(BX*1), Z7, K2, Z9                 // 6272454a7f8c1a0f000000
+       VPERMT2PS -7(CX)(DX*2), Z7, K2, Z9                 // 6272454a7f8c51f9ffffff
+       VPERMT2Q X2, X13, K2, X19                          // 62e2950a7eda
+       VPERMT2Q -17(BP)(SI*2), X13, K2, X19               // 62e2950a7e9c75efffffff
+       VPERMT2Q 7(AX)(CX*2), X13, K2, X19                 // 62e2950a7e9c4807000000
+       VPERMT2Q Y2, Y25, K3, Y31                          // 6262b5237efa
+       VPERMT2Q -17(BP)(SI*8), Y25, K3, Y31               // 6262b5237ebcf5efffffff
+       VPERMT2Q (R15), Y25, K3, Y31                       // 6242b5237e3f
+       VPERMT2Q Z3, Z27, K3, Z23                          // 62e2a5437efb
+       VPERMT2Q Z0, Z27, K3, Z23                          // 62e2a5437ef8
+       VPERMT2Q -17(BP), Z27, K3, Z23                     // 62e2a5437ebdefffffff
+       VPERMT2Q -15(R14)(R15*8), Z27, K3, Z23             // 6282a5437ebcfef1ffffff
+       VPERMT2Q Z3, Z14, K3, Z23                          // 62e28d4b7efb
+       VPERMT2Q Z0, Z14, K3, Z23                          // 62e28d4b7ef8
+       VPERMT2Q -17(BP), Z14, K3, Z23                     // 62e28d4b7ebdefffffff
+       VPERMT2Q -15(R14)(R15*8), Z14, K3, Z23             // 62828d4b7ebcfef1ffffff
+       VPERMT2Q Z3, Z27, K3, Z9                           // 6272a5437ecb
+       VPERMT2Q Z0, Z27, K3, Z9                           // 6272a5437ec8
+       VPERMT2Q -17(BP), Z27, K3, Z9                      // 6272a5437e8defffffff
+       VPERMT2Q -15(R14)(R15*8), Z27, K3, Z9              // 6212a5437e8cfef1ffffff
+       VPERMT2Q Z3, Z14, K3, Z9                           // 62728d4b7ecb
+       VPERMT2Q Z0, Z14, K3, Z9                           // 62728d4b7ec8
+       VPERMT2Q -17(BP), Z14, K3, Z9                      // 62728d4b7e8defffffff
+       VPERMT2Q -15(R14)(R15*8), Z14, K3, Z9              // 62128d4b7e8cfef1ffffff
+       VPEXPANDD X2, K7, X9                               // 62727d0f89ca
+       VPEXPANDD (CX), K7, X9                             // 62727d0f8909
+       VPEXPANDD 99(R15), K7, X9                          // 62527d0f898f63000000
+       VPEXPANDD Y1, K2, Y6                               // 62f27d2a89f1
+       VPEXPANDD -7(CX), K2, Y6                           // 62f27d2a89b1f9ffffff
+       VPEXPANDD 15(DX)(BX*4), K2, Y6                     // 62f27d2a89b49a0f000000
+       VPEXPANDD Z13, K4, Z11                             // 62527d4c89dd
+       VPEXPANDD Z14, K4, Z11                             // 62527d4c89de
+       VPEXPANDD -15(R14)(R15*1), K4, Z11                 // 62127d4c899c3ef1ffffff
+       VPEXPANDD -15(BX), K4, Z11                         // 62727d4c899bf1ffffff
+       VPEXPANDD Z13, K4, Z5                              // 62d27d4c89ed
+       VPEXPANDD Z14, K4, Z5                              // 62d27d4c89ee
+       VPEXPANDD -15(R14)(R15*1), K4, Z5                  // 62927d4c89ac3ef1ffffff
+       VPEXPANDD -15(BX), K4, Z5                          // 62f27d4c89abf1ffffff
+       VPEXPANDQ X2, K1, X24                              // 6262fd0989c2
+       VPEXPANDQ 99(R15)(R15*2), K1, X24                  // 6202fd0989847f63000000
+       VPEXPANDQ -7(DI), K1, X24                          // 6262fd098987f9ffffff
+       VPEXPANDQ Y0, K3, Y9                               // 6272fd2b89c8
+       VPEXPANDQ 99(R15)(R15*8), K3, Y9                   // 6212fd2b898cff63000000
+       VPEXPANDQ 7(AX)(CX*8), K3, Y9                      // 6272fd2b898cc807000000
+       VPEXPANDQ Z2, K4, Z5                               // 62f2fd4c89ea
+       VPEXPANDQ 7(AX)(CX*4), K4, Z5                      // 62f2fd4c89ac8807000000
+       VPEXPANDQ 7(AX)(CX*1), K4, Z5                      // 62f2fd4c89ac0807000000
+       VPEXPANDQ Z2, K4, Z23                              // 62e2fd4c89fa
+       VPEXPANDQ 7(AX)(CX*4), K4, Z23                     // 62e2fd4c89bc8807000000
+       VPEXPANDQ 7(AX)(CX*1), K4, Z23                     // 62e2fd4c89bc0807000000
+       VPGATHERDD (DX)(X10*4), K6, X3                     // 62b27d0e901c92
+       VPGATHERDD (SP)(X4*2), K6, X3                      // 62f27d0e901c64
+       VPGATHERDD (R14)(X29*8), K6, X3                    // 62927d06901cee
+       VPGATHERDD (R10)(Y29*8), K3, Y22                   // 62827d239034ea
+       VPGATHERDD (SP)(Y4*2), K3, Y22                     // 62e27d2b903464
+       VPGATHERDD (DX)(Y10*4), K3, Y22                    // 62a27d2b903492
+       VPGATHERDD (BP)(Z10*2), K7, Z28                    // 62227d4f90645500
+       VPGATHERDD (R10)(Z29*8), K7, Z28                   // 62027d479024ea
+       VPGATHERDD (R14)(Z29*8), K7, Z28                   // 62027d479024ee
+       VPGATHERDD (BP)(Z10*2), K7, Z6                     // 62b27d4f90745500
+       VPGATHERDD (R10)(Z29*8), K7, Z6                    // 62927d479034ea
+       VPGATHERDD (R14)(Z29*8), K7, Z6                    // 62927d479034ee
+       VPGATHERDQ (AX)(X4*1), K4, X11                     // 6272fd0c901c20
+       VPGATHERDQ (BP)(X10*2), K4, X11                    // 6232fd0c905c5500
+       VPGATHERDQ (R10)(X29*8), K4, X11                   // 6212fd04901cea
+       VPGATHERDQ (DX)(X10*4), K4, Y9                     // 6232fd2c900c92
+       VPGATHERDQ (SP)(X4*2), K4, Y9                      // 6272fd2c900c64
+       VPGATHERDQ (R14)(X29*8), K4, Y9                    // 6212fd24900cee
+       VPGATHERDQ (R14)(Y29*8), K7, Z13                   // 6212fd47902cee
+       VPGATHERDQ (AX)(Y4*1), K7, Z13                     // 6272fd4f902c20
+       VPGATHERDQ (BP)(Y10*2), K7, Z13                    // 6232fd4f906c5500
+       VPGATHERDQ (R14)(Y29*8), K7, Z21                   // 6282fd47902cee
+       VPGATHERDQ (AX)(Y4*1), K7, Z21                     // 62e2fd4f902c20
+       VPGATHERDQ (BP)(Y10*2), K7, Z21                    // 62a2fd4f906c5500
+       VPGATHERQD (AX)(X4*1), K2, X15                     // 62727d0a913c20
+       VPGATHERQD (BP)(X10*2), K2, X15                    // 62327d0a917c5500
+       VPGATHERQD (R10)(X29*8), K2, X15                   // 62127d02913cea
+       VPGATHERQD (R10)(Y29*8), K5, X30                   // 62027d259134ea
+       VPGATHERQD (SP)(Y4*2), K5, X30                     // 62627d2d913464
+       VPGATHERQD (DX)(Y10*4), K5, X30                    // 62227d2d913492
+       VPGATHERQD (DX)(Z10*4), K3, Y23                    // 62a27d4b913c92
+       VPGATHERQD (AX)(Z4*1), K3, Y23                     // 62e27d4b913c20
+       VPGATHERQD (SP)(Z4*2), K3, Y23                     // 62e27d4b913c64
+       VPGATHERQQ (DX)(X10*4), K4, X13                    // 6232fd0c912c92
+       VPGATHERQQ (SP)(X4*2), K4, X13                     // 6272fd0c912c64
+       VPGATHERQQ (R14)(X29*8), K4, X13                   // 6212fd04912cee
+       VPGATHERQQ (R14)(Y29*8), K2, Y31                   // 6202fd22913cee
+       VPGATHERQQ (AX)(Y4*1), K2, Y31                     // 6262fd2a913c20
+       VPGATHERQQ (BP)(Y10*2), K2, Y31                    // 6222fd2a917c5500
+       VPGATHERQQ (BP)(Z10*2), K2, Z26                    // 6222fd4a91545500
+       VPGATHERQQ (R10)(Z29*8), K2, Z26                   // 6202fd429114ea
+       VPGATHERQQ (R14)(Z29*8), K2, Z26                   // 6202fd429114ee
+       VPGATHERQQ (BP)(Z10*2), K2, Z3                     // 62b2fd4a915c5500
+       VPGATHERQQ (R10)(Z29*8), K2, Z3                    // 6292fd42911cea
+       VPGATHERQQ (R14)(Z29*8), K2, Z3                    // 6292fd42911cee
+       VPMAXSD X1, X31, K3, X16                           // 62e205033dc1
+       VPMAXSD (SI), X31, K3, X16                         // 62e205033d06
+       VPMAXSD 7(SI)(DI*2), X31, K3, X16                  // 62e205033d847e07000000
+       VPMAXSD Y24, Y18, K7, Y20                          // 62826d273de0
+       VPMAXSD 99(R15)(R15*4), Y18, K7, Y20               // 62826d273da4bf63000000
+       VPMAXSD 15(DX), Y18, K7, Y20                       // 62e26d273da20f000000
+       VPMAXSD Z0, Z7, K4, Z3                             // 62f2454c3dd8
+       VPMAXSD Z6, Z7, K4, Z3                             // 62f2454c3dde
+       VPMAXSD 7(SI)(DI*1), Z7, K4, Z3                    // 62f2454c3d9c3e07000000
+       VPMAXSD 15(DX)(BX*8), Z7, K4, Z3                   // 62f2454c3d9cda0f000000
+       VPMAXSD Z0, Z9, K4, Z3                             // 62f2354c3dd8
+       VPMAXSD Z6, Z9, K4, Z3                             // 62f2354c3dde
+       VPMAXSD 7(SI)(DI*1), Z9, K4, Z3                    // 62f2354c3d9c3e07000000
+       VPMAXSD 15(DX)(BX*8), Z9, K4, Z3                   // 62f2354c3d9cda0f000000
+       VPMAXSD Z0, Z7, K4, Z27                            // 6262454c3dd8
+       VPMAXSD Z6, Z7, K4, Z27                            // 6262454c3dde
+       VPMAXSD 7(SI)(DI*1), Z7, K4, Z27                   // 6262454c3d9c3e07000000
+       VPMAXSD 15(DX)(BX*8), Z7, K4, Z27                  // 6262454c3d9cda0f000000
+       VPMAXSD Z0, Z9, K4, Z27                            // 6262354c3dd8
+       VPMAXSD Z6, Z9, K4, Z27                            // 6262354c3dde
+       VPMAXSD 7(SI)(DI*1), Z9, K4, Z27                   // 6262354c3d9c3e07000000
+       VPMAXSD 15(DX)(BX*8), Z9, K4, Z27                  // 6262354c3d9cda0f000000
+       VPMAXSQ X15, X9, K4, X7                            // 62d2b50c3dff
+       VPMAXSQ 17(SP)(BP*8), X9, K4, X7                   // 62f2b50c3dbcec11000000
+       VPMAXSQ 17(SP)(BP*4), X9, K4, X7                   // 62f2b50c3dbcac11000000
+       VPMAXSQ Y19, Y3, K7, Y9                            // 6232e52f3dcb
+       VPMAXSQ (CX), Y3, K7, Y9                           // 6272e52f3d09
+       VPMAXSQ 99(R15), Y3, K7, Y9                        // 6252e52f3d8f63000000
+       VPMAXSQ Z9, Z3, K2, Z20                            // 62c2e54a3de1
+       VPMAXSQ Z19, Z3, K2, Z20                           // 62a2e54a3de3
+       VPMAXSQ -7(DI)(R8*1), Z3, K2, Z20                  // 62a2e54a3da407f9ffffff
+       VPMAXSQ (SP), Z3, K2, Z20                          // 62e2e54a3d2424
+       VPMAXSQ Z9, Z30, K2, Z20                           // 62c28d423de1
+       VPMAXSQ Z19, Z30, K2, Z20                          // 62a28d423de3
+       VPMAXSQ -7(DI)(R8*1), Z30, K2, Z20                 // 62a28d423da407f9ffffff
+       VPMAXSQ (SP), Z30, K2, Z20                         // 62e28d423d2424
+       VPMAXSQ Z9, Z3, K2, Z28                            // 6242e54a3de1
+       VPMAXSQ Z19, Z3, K2, Z28                           // 6222e54a3de3
+       VPMAXSQ -7(DI)(R8*1), Z3, K2, Z28                  // 6222e54a3da407f9ffffff
+       VPMAXSQ (SP), Z3, K2, Z28                          // 6262e54a3d2424
+       VPMAXSQ Z9, Z30, K2, Z28                           // 62428d423de1
+       VPMAXSQ Z19, Z30, K2, Z28                          // 62228d423de3
+       VPMAXSQ -7(DI)(R8*1), Z30, K2, Z28                 // 62228d423da407f9ffffff
+       VPMAXSQ (SP), Z30, K2, Z28                         // 62628d423d2424
+       VPMAXUD X3, X8, K3, X15                            // 62723d0b3ffb
+       VPMAXUD 7(AX), X8, K3, X15                         // 62723d0b3fb807000000
+       VPMAXUD (DI), X8, K3, X15                          // 62723d0b3f3f
+       VPMAXUD Y20, Y21, K3, Y2                           // 62b255233fd4
+       VPMAXUD 15(DX)(BX*1), Y21, K3, Y2                  // 62f255233f941a0f000000
+       VPMAXUD -7(CX)(DX*2), Y21, K3, Y2                  // 62f255233f9451f9ffffff
+       VPMAXUD Z13, Z1, K2, Z6                            // 62d2754a3ff5
+       VPMAXUD (AX), Z1, K2, Z6                           // 62f2754a3f30
+       VPMAXUD 7(SI), Z1, K2, Z6                          // 62f2754a3fb607000000
+       VPMAXUD Z13, Z15, K2, Z6                           // 62d2054a3ff5
+       VPMAXUD (AX), Z15, K2, Z6                          // 62f2054a3f30
+       VPMAXUD 7(SI), Z15, K2, Z6                         // 62f2054a3fb607000000
+       VPMAXUD Z13, Z1, K2, Z22                           // 62c2754a3ff5
+       VPMAXUD (AX), Z1, K2, Z22                          // 62e2754a3f30
+       VPMAXUD 7(SI), Z1, K2, Z22                         // 62e2754a3fb607000000
+       VPMAXUD Z13, Z15, K2, Z22                          // 62c2054a3ff5
+       VPMAXUD (AX), Z15, K2, Z22                         // 62e2054a3f30
+       VPMAXUD 7(SI), Z15, K2, Z22                        // 62e2054a3fb607000000
+       VPMAXUQ X13, X23, K1, X26                          // 6242c5013fd5
+       VPMAXUQ 99(R15)(R15*1), X23, K1, X26               // 6202c5013f943f63000000
+       VPMAXUQ (DX), X23, K1, X26                         // 6262c5013f12
+       VPMAXUQ Y6, Y31, K2, Y6                            // 62f285223ff6
+       VPMAXUQ -17(BP), Y31, K2, Y6                       // 62f285223fb5efffffff
+       VPMAXUQ -15(R14)(R15*8), Y31, K2, Y6               // 629285223fb4fef1ffffff
+       VPMAXUQ Z2, Z22, K1, Z18                           // 62e2cd413fd2
+       VPMAXUQ Z31, Z22, K1, Z18                          // 6282cd413fd7
+       VPMAXUQ (BX), Z22, K1, Z18                         // 62e2cd413f13
+       VPMAXUQ -17(BP)(SI*1), Z22, K1, Z18                // 62e2cd413f9435efffffff
+       VPMAXUQ Z2, Z7, K1, Z18                            // 62e2c5493fd2
+       VPMAXUQ Z31, Z7, K1, Z18                           // 6282c5493fd7
+       VPMAXUQ (BX), Z7, K1, Z18                          // 62e2c5493f13
+       VPMAXUQ -17(BP)(SI*1), Z7, K1, Z18                 // 62e2c5493f9435efffffff
+       VPMAXUQ Z2, Z22, K1, Z8                            // 6272cd413fc2
+       VPMAXUQ Z31, Z22, K1, Z8                           // 6212cd413fc7
+       VPMAXUQ (BX), Z22, K1, Z8                          // 6272cd413f03
+       VPMAXUQ -17(BP)(SI*1), Z22, K1, Z8                 // 6272cd413f8435efffffff
+       VPMAXUQ Z2, Z7, K1, Z8                             // 6272c5493fc2
+       VPMAXUQ Z31, Z7, K1, Z8                            // 6212c5493fc7
+       VPMAXUQ (BX), Z7, K1, Z8                           // 6272c5493f03
+       VPMAXUQ -17(BP)(SI*1), Z7, K1, Z8                  // 6272c5493f8435efffffff
+       VPMINSD X11, X1, K4, X21                           // 62c2750c39eb
+       VPMINSD 7(SI)(DI*1), X1, K4, X21                   // 62e2750c39ac3e07000000
+       VPMINSD 15(DX)(BX*8), X1, K4, X21                  // 62e2750c39acda0f000000
+       VPMINSD Y12, Y20, K1, Y5                           // 62d25d2139ec
+       VPMINSD 15(R8)(R14*8), Y20, K1, Y5                 // 62925d2139acf00f000000
+       VPMINSD -15(R14)(R15*2), Y20, K1, Y5               // 62925d2139ac7ef1ffffff
+       VPMINSD Z5, Z19, K3, Z15                           // 6272654339fd
+       VPMINSD Z1, Z19, K3, Z15                           // 6272654339f9
+       VPMINSD 17(SP)(BP*1), Z19, K3, Z15                 // 6272654339bc2c11000000
+       VPMINSD -7(CX)(DX*8), Z19, K3, Z15                 // 6272654339bcd1f9ffffff
+       VPMINSD Z5, Z15, K3, Z15                           // 6272054b39fd
+       VPMINSD Z1, Z15, K3, Z15                           // 6272054b39f9
+       VPMINSD 17(SP)(BP*1), Z15, K3, Z15                 // 6272054b39bc2c11000000
+       VPMINSD -7(CX)(DX*8), Z15, K3, Z15                 // 6272054b39bcd1f9ffffff
+       VPMINSD Z5, Z19, K3, Z30                           // 6262654339f5
+       VPMINSD Z1, Z19, K3, Z30                           // 6262654339f1
+       VPMINSD 17(SP)(BP*1), Z19, K3, Z30                 // 6262654339b42c11000000
+       VPMINSD -7(CX)(DX*8), Z19, K3, Z30                 // 6262654339b4d1f9ffffff
+       VPMINSD Z5, Z15, K3, Z30                           // 6262054b39f5
+       VPMINSD Z1, Z15, K3, Z30                           // 6262054b39f1
+       VPMINSD 17(SP)(BP*1), Z15, K3, Z30                 // 6262054b39b42c11000000
+       VPMINSD -7(CX)(DX*8), Z15, K3, Z30                 // 6262054b39b4d1f9ffffff
+       VPMINSQ X7, X3, K4, X31                            // 6262e50c39ff
+       VPMINSQ -7(DI)(R8*1), X3, K4, X31                  // 6222e50c39bc07f9ffffff
+       VPMINSQ (SP), X3, K4, X31                          // 6262e50c393c24
+       VPMINSQ Y28, Y5, K5, Y3                            // 6292d52d39dc
+       VPMINSQ -15(R14)(R15*1), Y5, K5, Y3                // 6292d52d399c3ef1ffffff
+       VPMINSQ -15(BX), Y5, K5, Y3                        // 62f2d52d399bf1ffffff
+       VPMINSQ Z21, Z14, K7, Z3                           // 62b28d4f39dd
+       VPMINSQ Z8, Z14, K7, Z3                            // 62d28d4f39d8
+       VPMINSQ -17(BP)(SI*2), Z14, K7, Z3                 // 62f28d4f399c75efffffff
+       VPMINSQ 7(AX)(CX*2), Z14, K7, Z3                   // 62f28d4f399c4807000000
+       VPMINSQ Z21, Z15, K7, Z3                           // 62b2854f39dd
+       VPMINSQ Z8, Z15, K7, Z3                            // 62d2854f39d8
+       VPMINSQ -17(BP)(SI*2), Z15, K7, Z3                 // 62f2854f399c75efffffff
+       VPMINSQ 7(AX)(CX*2), Z15, K7, Z3                   // 62f2854f399c4807000000
+       VPMINSQ Z21, Z14, K7, Z5                           // 62b28d4f39ed
+       VPMINSQ Z8, Z14, K7, Z5                            // 62d28d4f39e8
+       VPMINSQ -17(BP)(SI*2), Z14, K7, Z5                 // 62f28d4f39ac75efffffff
+       VPMINSQ 7(AX)(CX*2), Z14, K7, Z5                   // 62f28d4f39ac4807000000
+       VPMINSQ Z21, Z15, K7, Z5                           // 62b2854f39ed
+       VPMINSQ Z8, Z15, K7, Z5                            // 62d2854f39e8
+       VPMINSQ -17(BP)(SI*2), Z15, K7, Z5                 // 62f2854f39ac75efffffff
+       VPMINSQ 7(AX)(CX*2), Z15, K7, Z5                   // 62f2854f39ac4807000000
+       VPMINUD X5, X14, K7, X7                            // 62f20d0f3bfd
+       VPMINUD (AX), X14, K7, X7                          // 62f20d0f3b38
+       VPMINUD 7(SI), X14, K7, X7                         // 62f20d0f3bbe07000000
+       VPMINUD Y7, Y17, K2, Y14                           // 627275223bf7
+       VPMINUD 17(SP)(BP*8), Y17, K2, Y14                 // 627275223bb4ec11000000
+       VPMINUD 17(SP)(BP*4), Y17, K2, Y14                 // 627275223bb4ac11000000
+       VPMINUD Z9, Z9, K5, Z0                             // 62d2354d3bc1
+       VPMINUD Z25, Z9, K5, Z0                            // 6292354d3bc1
+       VPMINUD 99(R15)(R15*4), Z9, K5, Z0                 // 6292354d3b84bf63000000
+       VPMINUD 15(DX), Z9, K5, Z0                         // 62f2354d3b820f000000
+       VPMINUD Z9, Z3, K5, Z0                             // 62d2654d3bc1
+       VPMINUD Z25, Z3, K5, Z0                            // 6292654d3bc1
+       VPMINUD 99(R15)(R15*4), Z3, K5, Z0                 // 6292654d3b84bf63000000
+       VPMINUD 15(DX), Z3, K5, Z0                         // 62f2654d3b820f000000
+       VPMINUD Z9, Z9, K5, Z26                            // 6242354d3bd1
+       VPMINUD Z25, Z9, K5, Z26                           // 6202354d3bd1
+       VPMINUD 99(R15)(R15*4), Z9, K5, Z26                // 6202354d3b94bf63000000
+       VPMINUD 15(DX), Z9, K5, Z26                        // 6262354d3b920f000000
+       VPMINUD Z9, Z3, K5, Z26                            // 6242654d3bd1
+       VPMINUD Z25, Z3, K5, Z26                           // 6202654d3bd1
+       VPMINUD 99(R15)(R15*4), Z3, K5, Z26                // 6202654d3b94bf63000000
+       VPMINUD 15(DX), Z3, K5, Z26                        // 6262654d3b920f000000
+       VPMINUQ X21, X3, K3, X31                           // 6222e50b3bfd
+       VPMINUQ (BX), X3, K3, X31                          // 6262e50b3b3b
+       VPMINUQ -17(BP)(SI*1), X3, K3, X31                 // 6262e50b3bbc35efffffff
+       VPMINUQ Y8, Y31, K4, Y9                            // 625285243bc8
+       VPMINUQ 7(SI)(DI*4), Y31, K4, Y9                   // 627285243b8cbe07000000
+       VPMINUQ -7(DI)(R8*2), Y31, K4, Y9                  // 623285243b8c47f9ffffff
+       VPMINUQ Z17, Z20, K2, Z9                           // 6232dd423bc9
+       VPMINUQ Z0, Z20, K2, Z9                            // 6272dd423bc8
+       VPMINUQ (CX), Z20, K2, Z9                          // 6272dd423b09
+       VPMINUQ 99(R15), Z20, K2, Z9                       // 6252dd423b8f63000000
+       VPMINUQ Z17, Z0, K2, Z9                            // 6232fd4a3bc9
+       VPMINUQ Z0, Z0, K2, Z9                             // 6272fd4a3bc8
+       VPMINUQ (CX), Z0, K2, Z9                           // 6272fd4a3b09
+       VPMINUQ 99(R15), Z0, K2, Z9                        // 6252fd4a3b8f63000000
+       VPMINUQ Z17, Z20, K2, Z28                          // 6222dd423be1
+       VPMINUQ Z0, Z20, K2, Z28                           // 6262dd423be0
+       VPMINUQ (CX), Z20, K2, Z28                         // 6262dd423b21
+       VPMINUQ 99(R15), Z20, K2, Z28                      // 6242dd423ba763000000
+       VPMINUQ Z17, Z0, K2, Z28                           // 6222fd4a3be1
+       VPMINUQ Z0, Z0, K2, Z28                            // 6262fd4a3be0
+       VPMINUQ (CX), Z0, K2, Z28                          // 6262fd4a3b21
+       VPMINUQ 99(R15), Z0, K2, Z28                       // 6242fd4a3ba763000000
+       VPMOVDB X14, K3, X16                               // 62327e0b31f0
+       VPMOVDB X14, K3, 15(DX)(BX*1)                      // 62727e0b31b41a0f000000
+       VPMOVDB X14, K3, -7(CX)(DX*2)                      // 62727e0b31b451f9ffffff
+       VPMOVDB Y21, K2, X11                               // 62c27e2a31eb
+       VPMOVDB Y21, K2, (SI)                              // 62e27e2a312e
+       VPMOVDB Y21, K2, 7(SI)(DI*2)                       // 62e27e2a31ac7e07000000
+       VPMOVDB Z20, K1, X14                               // 62c27e4931e6
+       VPMOVDB Z9, K1, X14                                // 62527e4931ce
+       VPMOVDB Z20, K1, (R8)                              // 62c27e493120
+       VPMOVDB Z9, K1, (R8)                               // 62527e493108
+       VPMOVDB Z20, K1, 15(DX)(BX*2)                      // 62e27e4931a45a0f000000
+       VPMOVDB Z9, K1, 15(DX)(BX*2)                       // 62727e49318c5a0f000000
+       VPMOVDW X8, K2, X19                                // 62327e0a33c3
+       VPMOVDW X8, K2, 17(SP)(BP*8)                       // 62727e0a3384ec11000000
+       VPMOVDW X8, K2, 17(SP)(BP*4)                       // 62727e0a3384ac11000000
+       VPMOVDW Y12, K1, X8                                // 62527e2933e0
+       VPMOVDW Y12, K1, 17(SP)(BP*1)                      // 62727e2933a42c11000000
+       VPMOVDW Y12, K1, -7(CX)(DX*8)                      // 62727e2933a4d1f9ffffff
+       VPMOVDW Z30, K7, Y9                                // 62427e4f33f1
+       VPMOVDW Z5, K7, Y9                                 // 62d27e4f33e9
+       VPMOVDW Z30, K7, 7(AX)                             // 62627e4f33b007000000
+       VPMOVDW Z5, K7, 7(AX)                              // 62f27e4f33a807000000
+       VPMOVDW Z30, K7, (DI)                              // 62627e4f3337
+       VPMOVDW Z5, K7, (DI)                               // 62f27e4f332f
+       VPMOVQB X11, K1, X23                               // 62327e0932df
+       VPMOVQB X11, K1, -7(DI)(R8*1)                      // 62327e09329c07f9ffffff
+       VPMOVQB X11, K1, (SP)                              // 62727e09321c24
+       VPMOVQB Y12, K1, X31                               // 62127e2932e7
+       VPMOVQB Y12, K1, -17(BP)                           // 62727e2932a5efffffff
+       VPMOVQB Y12, K1, -15(R14)(R15*8)                   // 62127e2932a4fef1ffffff
+       VPMOVQB Z21, K1, X24                               // 62827e4932e8
+       VPMOVQB Z9, K1, X24                                // 62127e4932c8
+       VPMOVQB Z21, K1, 7(SI)(DI*4)                       // 62e27e4932acbe07000000
+       VPMOVQB Z9, K1, 7(SI)(DI*4)                        // 62727e49328cbe07000000
+       VPMOVQB Z21, K1, -7(DI)(R8*2)                      // 62a27e4932ac47f9ffffff
+       VPMOVQB Z9, K1, -7(DI)(R8*2)                       // 62327e49328c47f9ffffff
+       VPMOVQD X0, K7, X14                                // 62d27e0f35c6
+       VPMOVQD X0, K7, 17(SP)                             // 62f27e0f35842411000000
+       VPMOVQD X0, K7, -17(BP)(SI*4)                      // 62f27e0f3584b5efffffff
+       VPMOVQD Y21, K2, X11                               // 62c27e2a35eb
+       VPMOVQD Y21, K2, -17(BP)(SI*2)                     // 62e27e2a35ac75efffffff
+       VPMOVQD Y21, K2, 7(AX)(CX*2)                       // 62e27e2a35ac4807000000
+       VPMOVQD Z2, K4, Y14                                // 62d27e4c35d6
+       VPMOVQD Z7, K4, Y14                                // 62d27e4c35fe
+       VPMOVQD Z2, K4, 99(R15)(R15*1)                     // 62927e4c35943f63000000
+       VPMOVQD Z7, K4, 99(R15)(R15*1)                     // 62927e4c35bc3f63000000
+       VPMOVQD Z2, K4, (DX)                               // 62f27e4c3512
+       VPMOVQD Z7, K4, (DX)                               // 62f27e4c353a
+       VPMOVQW X2, K1, X23                                // 62b27e0934d7
+       VPMOVQW X2, K1, 17(SP)(BP*2)                       // 62f27e0934946c11000000
+       VPMOVQW X2, K1, -7(DI)(R8*4)                       // 62b27e09349487f9ffffff
+       VPMOVQW Y30, K3, X20                               // 62227e2b34f4
+       VPMOVQW Y30, K3, 7(AX)                             // 62627e2b34b007000000
+       VPMOVQW Y30, K3, (DI)                              // 62627e2b3437
+       VPMOVQW Z27, K4, X5                                // 62627e4c34dd
+       VPMOVQW Z25, K4, X5                                // 62627e4c34cd
+       VPMOVQW Z27, K4, 15(R8)(R14*1)                     // 62027e4c349c300f000000
+       VPMOVQW Z25, K4, 15(R8)(R14*1)                     // 62027e4c348c300f000000
+       VPMOVQW Z27, K4, 15(R8)(R14*2)                     // 62027e4c349c700f000000
+       VPMOVQW Z25, K4, 15(R8)(R14*2)                     // 62027e4c348c700f000000
+       VPMOVSDB X0, K5, X25                               // 62927e0d21c1
+       VPMOVSDB X0, K5, 15(R8)                            // 62d27e0d21800f000000
+       VPMOVSDB X0, K5, (BP)                              // 62f27e0d214500
+       VPMOVSDB Y26, K7, X9                               // 62427e2f21d1
+       VPMOVSDB Y26, K7, 99(R15)(R15*1)                   // 62027e2f21943f63000000
+       VPMOVSDB Y26, K7, (DX)                             // 62627e2f2112
+       VPMOVSDB Z23, K7, X13                              // 62c27e4f21fd
+       VPMOVSDB Z9, K7, X13                               // 62527e4f21cd
+       VPMOVSDB Z23, K7, (R14)                            // 62c27e4f213e
+       VPMOVSDB Z9, K7, (R14)                             // 62527e4f210e
+       VPMOVSDB Z23, K7, -7(DI)(R8*8)                     // 62a27e4f21bcc7f9ffffff
+       VPMOVSDB Z9, K7, -7(DI)(R8*8)                      // 62327e4f218cc7f9ffffff
+       VPMOVSDW X8, K6, X2                                // 62727e0e23c2
+       VPMOVSDW X8, K6, -17(BP)(SI*8)                     // 62727e0e2384f5efffffff
+       VPMOVSDW X8, K6, (R15)                             // 62527e0e2307
+       VPMOVSDW Y7, K3, X9                                // 62d27e2b23f9
+       VPMOVSDW Y7, K3, 99(R15)(R15*4)                    // 62927e2b23bcbf63000000
+       VPMOVSDW Y7, K3, 15(DX)                            // 62f27e2b23ba0f000000
+       VPMOVSDW Z27, K7, Y16                              // 62227e4f23d8
+       VPMOVSDW Z14, K7, Y16                              // 62327e4f23f0
+       VPMOVSDW Z27, K7, -17(BP)(SI*8)                    // 62627e4f239cf5efffffff
+       VPMOVSDW Z14, K7, -17(BP)(SI*8)                    // 62727e4f23b4f5efffffff
+       VPMOVSDW Z27, K7, (R15)                            // 62427e4f231f
+       VPMOVSDW Z14, K7, (R15)                            // 62527e4f2337
+       VPMOVSQB X31, K4, X2                               // 62627e0c22fa
+       VPMOVSQB X31, K4, -7(CX)                           // 62627e0c22b9f9ffffff
+       VPMOVSQB X31, K4, 15(DX)(BX*4)                     // 62627e0c22bc9a0f000000
+       VPMOVSQB Y1, K4, X11                               // 62d27e2c22cb
+       VPMOVSQB Y1, K4, 15(R8)(R14*8)                     // 62927e2c228cf00f000000
+       VPMOVSQB Y1, K4, -15(R14)(R15*2)                   // 62927e2c228c7ef1ffffff
+       VPMOVSQB Z3, K7, X22                               // 62b27e4f22de
+       VPMOVSQB Z0, K7, X22                               // 62b27e4f22c6
+       VPMOVSQB Z3, K7, 7(SI)(DI*8)                       // 62f27e4f229cfe07000000
+       VPMOVSQB Z0, K7, 7(SI)(DI*8)                       // 62f27e4f2284fe07000000
+       VPMOVSQB Z3, K7, -15(R14)                          // 62d27e4f229ef1ffffff
+       VPMOVSQB Z0, K7, -15(R14)                          // 62d27e4f2286f1ffffff
+       VPMOVSQD X14, K2, X5                               // 62727e0a25f5
+       VPMOVSQD X14, K2, 7(SI)(DI*1)                      // 62727e0a25b43e07000000
+       VPMOVSQD X14, K2, 15(DX)(BX*8)                     // 62727e0a25b4da0f000000
+       VPMOVSQD Y30, K5, X0                               // 62627e2d25f0
+       VPMOVSQD Y30, K5, (CX)                             // 62627e2d2531
+       VPMOVSQD Y30, K5, 99(R15)                          // 62427e2d25b763000000
+       VPMOVSQD Z14, K3, Y31                              // 62127e4b25f7
+       VPMOVSQD Z7, K3, Y31                               // 62927e4b25ff
+       VPMOVSQD Z14, K3, 7(SI)(DI*8)                      // 62727e4b25b4fe07000000
+       VPMOVSQD Z7, K3, 7(SI)(DI*8)                       // 62f27e4b25bcfe07000000
+       VPMOVSQD Z14, K3, -15(R14)                         // 62527e4b25b6f1ffffff
+       VPMOVSQD Z7, K3, -15(R14)                          // 62d27e4b25bef1ffffff
+       VPMOVSQW X7, K4, X17                               // 62b27e0c24f9
+       VPMOVSQW X7, K4, -15(R14)(R15*1)                   // 62927e0c24bc3ef1ffffff
+       VPMOVSQW X7, K4, -15(BX)                           // 62f27e0c24bbf1ffffff
+       VPMOVSQW Y22, K2, X15                              // 62c27e2a24f7
+       VPMOVSQW Y22, K2, -7(DI)(R8*1)                     // 62a27e2a24b407f9ffffff
+       VPMOVSQW Y22, K2, (SP)                             // 62e27e2a243424
+       VPMOVSQW Z8, K2, X11                               // 62527e4a24c3
+       VPMOVSQW Z24, K2, X11                              // 62427e4a24c3
+       VPMOVSQW Z8, K2, 99(R15)(R15*2)                    // 62127e4a24847f63000000
+       VPMOVSQW Z24, K2, 99(R15)(R15*2)                   // 62027e4a24847f63000000
+       VPMOVSQW Z8, K2, -7(DI)                            // 62727e4a2487f9ffffff
+       VPMOVSQW Z24, K2, -7(DI)                           // 62627e4a2487f9ffffff
+       VPMOVSXBD X27, K2, Z1                              // 62927d4a21cb or 6292fd4a21cb
+       VPMOVSXBD 15(DX)(BX*1), K2, Z1                     // 62f27d4a218c1a0f000000 or 62f2fd4a218c1a0f000000
+       VPMOVSXBD -7(CX)(DX*2), K2, Z1                     // 62f27d4a218c51f9ffffff or 62f2fd4a218c51f9ffffff
+       VPMOVSXBD X27, K2, Z16                             // 62827d4a21c3 or 6282fd4a21c3
+       VPMOVSXBD 15(DX)(BX*1), K2, Z16                    // 62e27d4a21841a0f000000 or 62e2fd4a21841a0f000000
+       VPMOVSXBD -7(CX)(DX*2), K2, Z16                    // 62e27d4a218451f9ffffff or 62e2fd4a218451f9ffffff
+       VPMOVSXBD X3, K1, X25                              // 62627d0921cb or 6262fd0921cb
+       VPMOVSXBD 7(AX)(CX*4), K1, X25                     // 62627d09218c8807000000 or 6262fd09218c8807000000
+       VPMOVSXBD 7(AX)(CX*1), K1, X25                     // 62627d09218c0807000000 or 6262fd09218c0807000000
+       VPMOVSXBD X18, K2, Y7                              // 62b27d2a21fa or 62b2fd2a21fa
+       VPMOVSXBD 99(R15)(R15*8), K2, Y7                   // 62927d2a21bcff63000000 or 6292fd2a21bcff63000000
+       VPMOVSXBD 7(AX)(CX*8), K2, Y7                      // 62f27d2a21bcc807000000 or 62f2fd2a21bcc807000000
+       VPMOVSXBQ X28, K1, X15                             // 62127d0922fc or 6212fd0922fc
+       VPMOVSXBQ 99(R15)(R15*8), K1, X15                  // 62127d0922bcff63000000 or 6212fd0922bcff63000000
+       VPMOVSXBQ 7(AX)(CX*8), K1, X15                     // 62727d0922bcc807000000 or 6272fd0922bcc807000000
+       VPMOVSXBQ X15, K7, Y0                              // 62d27d2f22c7 or 62d2fd2f22c7
+       VPMOVSXBQ (SI), K7, Y0                             // 62f27d2f2206 or 62f2fd2f2206
+       VPMOVSXBQ 7(SI)(DI*2), K7, Y0                      // 62f27d2f22847e07000000 or 62f2fd2f22847e07000000
+       VPMOVSXBQ X7, K1, Z6                               // 62f27d4922f7 or 62f2fd4922f7
+       VPMOVSXBQ (AX), K1, Z6                             // 62f27d492230 or 62f2fd492230
+       VPMOVSXBQ 7(SI), K1, Z6                            // 62f27d4922b607000000 or 62f2fd4922b607000000
+       VPMOVSXBQ X7, K1, Z2                               // 62f27d4922d7 or 62f2fd4922d7
+       VPMOVSXBQ (AX), K1, Z2                             // 62f27d492210 or 62f2fd492210
+       VPMOVSXBQ 7(SI), K1, Z2                            // 62f27d49229607000000 or 62f2fd49229607000000
+       VPMOVSXDQ X7, K2, Y14                              // 62727d2a25f7
+       VPMOVSXDQ 17(SP)(BP*2), K2, Y14                    // 62727d2a25b46c11000000
+       VPMOVSXDQ -7(DI)(R8*4), K2, Y14                    // 62327d2a25b487f9ffffff
+       VPMOVSXDQ X22, K4, X0                              // 62b27d0c25c6
+       VPMOVSXDQ 15(R8)(R14*4), K4, X0                    // 62927d0c2584b00f000000
+       VPMOVSXDQ -7(CX)(DX*4), K4, X0                     // 62f27d0c258491f9ffffff
+       VPMOVSXDQ Y24, K1, Z15                             // 62127d4925f8
+       VPMOVSXDQ -7(CX), K1, Z15                          // 62727d4925b9f9ffffff
+       VPMOVSXDQ 15(DX)(BX*4), K1, Z15                    // 62727d4925bc9a0f000000
+       VPMOVSXDQ Y24, K1, Z12                             // 62127d4925e0
+       VPMOVSXDQ -7(CX), K1, Z12                          // 62727d4925a1f9ffffff
+       VPMOVSXDQ 15(DX)(BX*4), K1, Z12                    // 62727d4925a49a0f000000
+       VPMOVSXWD X1, K3, Y13                              // 62727d2b23e9 or 6272fd2b23e9
+       VPMOVSXWD 15(R8), K3, Y13                          // 62527d2b23a80f000000 or 6252fd2b23a80f000000
+       VPMOVSXWD (BP), K3, Y13                            // 62727d2b236d00 or 6272fd2b236d00
+       VPMOVSXWD X6, K4, X11                              // 62727d0c23de or 6272fd0c23de
+       VPMOVSXWD (R8), K4, X11                            // 62527d0c2318 or 6252fd0c2318
+       VPMOVSXWD 15(DX)(BX*2), K4, X11                    // 62727d0c239c5a0f000000 or 6272fd0c239c5a0f000000
+       VPMOVSXWD Y20, K5, Z14                             // 62327d4d23f4 or 6232fd4d23f4
+       VPMOVSXWD 99(R15)(R15*8), K5, Z14                  // 62127d4d23b4ff63000000 or 6212fd4d23b4ff63000000
+       VPMOVSXWD 7(AX)(CX*8), K5, Z14                     // 62727d4d23b4c807000000 or 6272fd4d23b4c807000000
+       VPMOVSXWD Y20, K5, Z27                             // 62227d4d23dc or 6222fd4d23dc
+       VPMOVSXWD 99(R15)(R15*8), K5, Z27                  // 62027d4d239cff63000000 or 6202fd4d239cff63000000
+       VPMOVSXWD 7(AX)(CX*8), K5, Z27                     // 62627d4d239cc807000000 or 6262fd4d239cc807000000
+       VPMOVSXWQ X7, K7, Z11                              // 62727d4f24df or 6272fd4f24df
+       VPMOVSXWQ 15(R8)(R14*8), K7, Z11                   // 62127d4f249cf00f000000 or 6212fd4f249cf00f000000
+       VPMOVSXWQ -15(R14)(R15*2), K7, Z11                 // 62127d4f249c7ef1ffffff or 6212fd4f249c7ef1ffffff
+       VPMOVSXWQ X7, K7, Z5                               // 62f27d4f24ef or 62f2fd4f24ef
+       VPMOVSXWQ 15(R8)(R14*8), K7, Z5                    // 62927d4f24acf00f000000 or 6292fd4f24acf00f000000
+       VPMOVSXWQ -15(R14)(R15*2), K7, Z5                  // 62927d4f24ac7ef1ffffff or 6292fd4f24ac7ef1ffffff
+       VPMOVSXWQ X31, K7, X8                              // 62127d0f24c7 or 6212fd0f24c7
+       VPMOVSXWQ 17(SP)(BP*8), K7, X8                     // 62727d0f2484ec11000000 or 6272fd0f2484ec11000000
+       VPMOVSXWQ 17(SP)(BP*4), K7, X8                     // 62727d0f2484ac11000000 or 6272fd0f2484ac11000000
+       VPMOVSXWQ X3, K6, Y14                              // 62727d2e24f3 or 6272fd2e24f3
+       VPMOVSXWQ 17(SP)(BP*1), K6, Y14                    // 62727d2e24b42c11000000 or 6272fd2e24b42c11000000
+       VPMOVSXWQ -7(CX)(DX*8), K6, Y14                    // 62727d2e24b4d1f9ffffff or 6272fd2e24b4d1f9ffffff
+       VPMOVUSDB X20, K3, X28                             // 62827e0b11e4
+       VPMOVUSDB X20, K3, 7(SI)(DI*4)                     // 62e27e0b11a4be07000000
+       VPMOVUSDB X20, K3, -7(DI)(R8*2)                    // 62a27e0b11a447f9ffffff
+       VPMOVUSDB Y21, K7, X24                             // 62827e2f11e8
+       VPMOVUSDB Y21, K7, -17(BP)(SI*2)                   // 62e27e2f11ac75efffffff
+       VPMOVUSDB Y21, K7, 7(AX)(CX*2)                     // 62e27e2f11ac4807000000
+       VPMOVUSDB Z13, K4, X7                              // 62727e4c11ef
+       VPMOVUSDB Z14, K4, X7                              // 62727e4c11f7
+       VPMOVUSDB Z13, K4, -15(R14)(R15*1)                 // 62127e4c11ac3ef1ffffff
+       VPMOVUSDB Z14, K4, -15(R14)(R15*1)                 // 62127e4c11b43ef1ffffff
+       VPMOVUSDB Z13, K4, -15(BX)                         // 62727e4c11abf1ffffff
+       VPMOVUSDB Z14, K4, -15(BX)                         // 62727e4c11b3f1ffffff
+       VPMOVUSDW X16, K4, X20                             // 62a27e0c13c4
+       VPMOVUSDW X16, K4, 15(R8)(R14*1)                   // 62827e0c1384300f000000
+       VPMOVUSDW X16, K4, 15(R8)(R14*2)                   // 62827e0c1384700f000000
+       VPMOVUSDW Y1, K7, X12                              // 62d27e2f13cc
+       VPMOVUSDW Y1, K7, 7(AX)(CX*4)                      // 62f27e2f138c8807000000
+       VPMOVUSDW Y1, K7, 7(AX)(CX*1)                      // 62f27e2f138c0807000000
+       VPMOVUSDW Z5, K2, Y26                              // 62927e4a13ea
+       VPMOVUSDW Z23, K2, Y26                             // 62827e4a13fa
+       VPMOVUSDW Z5, K2, (AX)                             // 62f27e4a1328
+       VPMOVUSDW Z23, K2, (AX)                            // 62e27e4a1338
+       VPMOVUSDW Z5, K2, 7(SI)                            // 62f27e4a13ae07000000
+       VPMOVUSDW Z23, K2, 7(SI)                           // 62e27e4a13be07000000
+       VPMOVUSQB X17, K5, X6                              // 62e27e0d12ce
+       VPMOVUSQB X17, K5, (AX)                            // 62e27e0d1208
+       VPMOVUSQB X17, K5, 7(SI)                           // 62e27e0d128e07000000
+       VPMOVUSQB Y30, K3, X28                             // 62027e2b12f4
+       VPMOVUSQB Y30, K3, 17(SP)                          // 62627e2b12b42411000000
+       VPMOVUSQB Y30, K3, -17(BP)(SI*4)                   // 62627e2b12b4b5efffffff
+       VPMOVUSQB Z2, K4, X6                               // 62f27e4c12d6
+       VPMOVUSQB Z2, K4, (R14)                            // 62d27e4c1216
+       VPMOVUSQB Z2, K4, -7(DI)(R8*8)                     // 62b27e4c1294c7f9ffffff
+       VPMOVUSQD X8, K2, X1                               // 62727e0a15c1
+       VPMOVUSQD X8, K2, 99(R15)(R15*4)                   // 62127e0a1584bf63000000
+       VPMOVUSQD X8, K2, 15(DX)                           // 62727e0a15820f000000
+       VPMOVUSQD Y12, K2, X8                              // 62527e2a15e0
+       VPMOVUSQD Y12, K2, (SI)                            // 62727e2a1526
+       VPMOVUSQD Y12, K2, 7(SI)(DI*2)                     // 62727e2a15a47e07000000
+       VPMOVUSQD Z6, K3, Y22                              // 62b27e4b15f6
+       VPMOVUSQD Z14, K3, Y22                             // 62327e4b15f6
+       VPMOVUSQD Z6, K3, (BX)                             // 62f27e4b1533
+       VPMOVUSQD Z14, K3, (BX)                            // 62727e4b1533
+       VPMOVUSQD Z6, K3, -17(BP)(SI*1)                    // 62f27e4b15b435efffffff
+       VPMOVUSQD Z14, K3, -17(BP)(SI*1)                   // 62727e4b15b435efffffff
+       VPMOVUSQW X0, K3, X6                               // 62f27e0b14c6
+       VPMOVUSQW X0, K3, 7(AX)                            // 62f27e0b148007000000
+       VPMOVUSQW X0, K3, (DI)                             // 62f27e0b1407
+       VPMOVUSQW Y3, K3, X11                              // 62d27e2b14db
+       VPMOVUSQW Y3, K3, (CX)                             // 62f27e2b1419
+       VPMOVUSQW Y3, K3, 99(R15)                          // 62d27e2b149f63000000
+       VPMOVUSQW Z26, K2, X16                             // 62227e4a14d0
+       VPMOVUSQW Z14, K2, X16                             // 62327e4a14f0
+       VPMOVUSQW Z26, K2, 17(SP)(BP*8)                    // 62627e4a1494ec11000000
+       VPMOVUSQW Z14, K2, 17(SP)(BP*8)                    // 62727e4a14b4ec11000000
+       VPMOVUSQW Z26, K2, 17(SP)(BP*4)                    // 62627e4a1494ac11000000
+       VPMOVUSQW Z14, K2, 17(SP)(BP*4)                    // 62727e4a14b4ac11000000
+       VPMOVZXBD X15, K1, Z3                              // 62d27d4931df or 62d2fd4931df
+       VPMOVZXBD 7(AX), K1, Z3                            // 62f27d49319807000000 or 62f2fd49319807000000
+       VPMOVZXBD (DI), K1, Z3                             // 62f27d49311f or 62f2fd49311f
+       VPMOVZXBD X15, K1, Z0                              // 62d27d4931c7 or 62d2fd4931c7
+       VPMOVZXBD 7(AX), K1, Z0                            // 62f27d49318007000000 or 62f2fd49318007000000
+       VPMOVZXBD (DI), K1, Z0                             // 62f27d493107 or 62f2fd493107
+       VPMOVZXBD X1, K7, X11                              // 62727d0f31d9 or 6272fd0f31d9
+       VPMOVZXBD 99(R15)(R15*1), K7, X11                  // 62127d0f319c3f63000000 or 6212fd0f319c3f63000000
+       VPMOVZXBD (DX), K7, X11                            // 62727d0f311a or 6272fd0f311a
+       VPMOVZXBD X19, K2, Y17                             // 62a27d2a31cb or 62a2fd2a31cb
+       VPMOVZXBD 15(DX)(BX*1), K2, Y17                    // 62e27d2a318c1a0f000000 or 62e2fd2a318c1a0f000000
+       VPMOVZXBD -7(CX)(DX*2), K2, Y17                    // 62e27d2a318c51f9ffffff or 62e2fd2a318c51f9ffffff
+       VPMOVZXBQ X2, K4, X13                              // 62727d0c32ea or 6272fd0c32ea
+       VPMOVZXBQ (BX), K4, X13                            // 62727d0c322b or 6272fd0c322b
+       VPMOVZXBQ -17(BP)(SI*1), K4, X13                   // 62727d0c32ac35efffffff or 6272fd0c32ac35efffffff
+       VPMOVZXBQ X14, K1, Y13                             // 62527d2932ee or 6252fd2932ee
+       VPMOVZXBQ -17(BP)(SI*8), K1, Y13                   // 62727d2932acf5efffffff or 6272fd2932acf5efffffff
+       VPMOVZXBQ (R15), K1, Y13                           // 62527d29322f or 6252fd29322f
+       VPMOVZXBQ X0, K3, Z21                              // 62e27d4b32e8 or 62e2fd4b32e8
+       VPMOVZXBQ -17(BP), K3, Z21                         // 62e27d4b32adefffffff or 62e2fd4b32adefffffff
+       VPMOVZXBQ -15(R14)(R15*8), K3, Z21                 // 62827d4b32acfef1ffffff or 6282fd4b32acfef1ffffff
+       VPMOVZXBQ X0, K3, Z13                              // 62727d4b32e8 or 6272fd4b32e8
+       VPMOVZXBQ -17(BP), K3, Z13                         // 62727d4b32adefffffff or 6272fd4b32adefffffff
+       VPMOVZXBQ -15(R14)(R15*8), K3, Z13                 // 62127d4b32acfef1ffffff or 6212fd4b32acfef1ffffff
+       VPMOVZXDQ X17, K7, Y30                             // 62227d2f35f1
+       VPMOVZXDQ -17(BP)(SI*8), K7, Y30                   // 62627d2f35b4f5efffffff
+       VPMOVZXDQ (R15), K7, Y30                           // 62427d2f3537
+       VPMOVZXDQ X11, K6, X18                             // 62c27d0e35d3
+       VPMOVZXDQ 15(R8), K6, X18                          // 62c27d0e35900f000000
+       VPMOVZXDQ (BP), K6, X18                            // 62e27d0e355500
+       VPMOVZXDQ Y13, K3, Z3                              // 62d27d4b35dd
+       VPMOVZXDQ -17(BP)(SI*2), K3, Z3                    // 62f27d4b359c75efffffff
+       VPMOVZXDQ 7(AX)(CX*2), K3, Z3                      // 62f27d4b359c4807000000
+       VPMOVZXDQ Y13, K3, Z12                             // 62527d4b35e5
+       VPMOVZXDQ -17(BP)(SI*2), K3, Z12                   // 62727d4b35a475efffffff
+       VPMOVZXDQ 7(AX)(CX*2), K3, Z12                     // 62727d4b35a44807000000
+       VPMOVZXWD X9, K7, Y18                              // 62c27d2f33d1 or 62c2fd2f33d1
+       VPMOVZXWD 7(SI)(DI*8), K7, Y18                     // 62e27d2f3394fe07000000 or 62e2fd2f3394fe07000000
+       VPMOVZXWD -15(R14), K7, Y18                        // 62c27d2f3396f1ffffff or 62c2fd2f3396f1ffffff
+       VPMOVZXWD X24, K4, X2                              // 62927d0c33d0 or 6292fd0c33d0
+       VPMOVZXWD 15(R8)(R14*8), K4, X2                    // 62927d0c3394f00f000000 or 6292fd0c3394f00f000000
+       VPMOVZXWD -15(R14)(R15*2), K4, X2                  // 62927d0c33947ef1ffffff or 6292fd0c33947ef1ffffff
+       VPMOVZXWD Y24, K4, Z27                             // 62027d4c33d8 or 6202fd4c33d8
+       VPMOVZXWD 15(R8)(R14*1), K4, Z27                   // 62027d4c339c300f000000 or 6202fd4c339c300f000000
+       VPMOVZXWD 15(R8)(R14*2), K4, Z27                   // 62027d4c339c700f000000 or 6202fd4c339c700f000000
+       VPMOVZXWD Y24, K4, Z15                             // 62127d4c33f8 or 6212fd4c33f8
+       VPMOVZXWD 15(R8)(R14*1), K4, Z15                   // 62127d4c33bc300f000000 or 6212fd4c33bc300f000000
+       VPMOVZXWD 15(R8)(R14*2), K4, Z15                   // 62127d4c33bc700f000000 or 6212fd4c33bc700f000000
+       VPMOVZXWQ X2, K7, Z23                              // 62e27d4f34fa or 62e2fd4f34fa
+       VPMOVZXWQ 7(SI)(DI*1), K7, Z23                     // 62e27d4f34bc3e07000000 or 62e2fd4f34bc3e07000000
+       VPMOVZXWQ 15(DX)(BX*8), K7, Z23                    // 62e27d4f34bcda0f000000 or 62e2fd4f34bcda0f000000
+       VPMOVZXWQ X2, K7, Z5                               // 62f27d4f34ea or 62f2fd4f34ea
+       VPMOVZXWQ 7(SI)(DI*1), K7, Z5                      // 62f27d4f34ac3e07000000 or 62f2fd4f34ac3e07000000
+       VPMOVZXWQ 15(DX)(BX*8), K7, Z5                     // 62f27d4f34acda0f000000 or 62f2fd4f34acda0f000000
+       VPMOVZXWQ X27, K2, X2                              // 62927d0a34d3 or 6292fd0a34d3
+       VPMOVZXWQ 7(SI)(DI*8), K2, X2                      // 62f27d0a3494fe07000000 or 62f2fd0a3494fe07000000
+       VPMOVZXWQ -15(R14), K2, X2                         // 62d27d0a3496f1ffffff or 62d2fd0a3496f1ffffff
+       VPMOVZXWQ X26, K5, Y8                              // 62127d2d34c2 or 6212fd2d34c2
+       VPMOVZXWQ -15(R14)(R15*1), K5, Y8                  // 62127d2d34843ef1ffffff or 6212fd2d34843ef1ffffff
+       VPMOVZXWQ -15(BX), K5, Y8                          // 62727d2d3483f1ffffff or 6272fd2d3483f1ffffff
+       VPMULDQ X3, X30, K3, X22                           // 62e28d0328f3
+       VPMULDQ -7(DI)(R8*1), X30, K3, X22                 // 62a28d0328b407f9ffffff
+       VPMULDQ (SP), X30, K3, X22                         // 62e28d03283424
+       VPMULDQ Y5, Y24, K4, Y11                           // 6272bd2428dd
+       VPMULDQ (R14), Y24, K4, Y11                        // 6252bd24281e
+       VPMULDQ -7(DI)(R8*8), Y24, K4, Y11                 // 6232bd24289cc7f9ffffff
+       VPMULDQ Z21, Z8, K2, Z23                           // 62a2bd4a28fd
+       VPMULDQ Z5, Z8, K2, Z23                            // 62e2bd4a28fd
+       VPMULDQ -7(CX)(DX*1), Z8, K2, Z23                  // 62e2bd4a28bc11f9ffffff
+       VPMULDQ -15(R14)(R15*4), Z8, K2, Z23               // 6282bd4a28bcbef1ffffff
+       VPMULDQ Z21, Z28, K2, Z23                          // 62a29d4228fd
+       VPMULDQ Z5, Z28, K2, Z23                           // 62e29d4228fd
+       VPMULDQ -7(CX)(DX*1), Z28, K2, Z23                 // 62e29d4228bc11f9ffffff
+       VPMULDQ -15(R14)(R15*4), Z28, K2, Z23              // 62829d4228bcbef1ffffff
+       VPMULDQ Z21, Z8, K2, Z6                            // 62b2bd4a28f5
+       VPMULDQ Z5, Z8, K2, Z6                             // 62f2bd4a28f5
+       VPMULDQ -7(CX)(DX*1), Z8, K2, Z6                   // 62f2bd4a28b411f9ffffff
+       VPMULDQ -15(R14)(R15*4), Z8, K2, Z6                // 6292bd4a28b4bef1ffffff
+       VPMULDQ Z21, Z28, K2, Z6                           // 62b29d4228f5
+       VPMULDQ Z5, Z28, K2, Z6                            // 62f29d4228f5
+       VPMULDQ -7(CX)(DX*1), Z28, K2, Z6                  // 62f29d4228b411f9ffffff
+       VPMULDQ -15(R14)(R15*4), Z28, K2, Z6               // 62929d4228b4bef1ffffff
+       VPMULLD X9, X2, K1, X20                            // 62c26d0940e1
+       VPMULLD (BX), X2, K1, X20                          // 62e26d094023
+       VPMULLD -17(BP)(SI*1), X2, K1, X20                 // 62e26d0940a435efffffff
+       VPMULLD Y11, Y26, K1, Y6                           // 62d22d2140f3
+       VPMULLD -7(CX)(DX*1), Y26, K1, Y6                  // 62f22d2140b411f9ffffff
+       VPMULLD -15(R14)(R15*4), Y26, K1, Y6               // 62922d2140b4bef1ffffff
+       VPMULLD Z7, Z3, K1, Z8                             // 6272654940c7
+       VPMULLD Z9, Z3, K1, Z8                             // 6252654940c1
+       VPMULLD 15(R8), Z3, K1, Z8                         // 6252654940800f000000
+       VPMULLD (BP), Z3, K1, Z8                           // 62726549404500
+       VPMULLD Z7, Z27, K1, Z8                            // 6272254140c7
+       VPMULLD Z9, Z27, K1, Z8                            // 6252254140c1
+       VPMULLD 15(R8), Z27, K1, Z8                        // 6252254140800f000000
+       VPMULLD (BP), Z27, K1, Z8                          // 62722541404500
+       VPMULLD Z7, Z3, K1, Z2                             // 62f2654940d7
+       VPMULLD Z9, Z3, K1, Z2                             // 62d2654940d1
+       VPMULLD 15(R8), Z3, K1, Z2                         // 62d2654940900f000000
+       VPMULLD (BP), Z3, K1, Z2                           // 62f26549405500
+       VPMULLD Z7, Z27, K1, Z2                            // 62f2254140d7
+       VPMULLD Z9, Z27, K1, Z2                            // 62d2254140d1
+       VPMULLD 15(R8), Z27, K1, Z2                        // 62d2254140900f000000
+       VPMULLD (BP), Z27, K1, Z2                          // 62f22541405500
+       VPMULUDQ X16, X0, K6, X15                          // 6231fd0ef4f8
+       VPMULUDQ -17(BP)(SI*2), X0, K6, X15                // 6271fd0ef4bc75efffffff
+       VPMULUDQ 7(AX)(CX*2), X0, K6, X15                  // 6271fd0ef4bc4807000000
+       VPMULUDQ Y14, Y21, K3, Y7                          // 62d1d523f4fe
+       VPMULUDQ 15(R8), Y21, K3, Y7                       // 62d1d523f4b80f000000
+       VPMULUDQ (BP), Y21, K3, Y7                         // 62f1d523f47d00
+       VPMULUDQ Z1, Z6, K7, Z6                            // 62f1cd4ff4f1
+       VPMULUDQ Z15, Z6, K7, Z6                           // 62d1cd4ff4f7
+       VPMULUDQ (SI), Z6, K7, Z6                          // 62f1cd4ff436
+       VPMULUDQ 7(SI)(DI*2), Z6, K7, Z6                   // 62f1cd4ff4b47e07000000
+       VPMULUDQ Z1, Z22, K7, Z6                           // 62f1cd47f4f1
+       VPMULUDQ Z15, Z22, K7, Z6                          // 62d1cd47f4f7
+       VPMULUDQ (SI), Z22, K7, Z6                         // 62f1cd47f436
+       VPMULUDQ 7(SI)(DI*2), Z22, K7, Z6                  // 62f1cd47f4b47e07000000
+       VPMULUDQ Z1, Z6, K7, Z16                           // 62e1cd4ff4c1
+       VPMULUDQ Z15, Z6, K7, Z16                          // 62c1cd4ff4c7
+       VPMULUDQ (SI), Z6, K7, Z16                         // 62e1cd4ff406
+       VPMULUDQ 7(SI)(DI*2), Z6, K7, Z16                  // 62e1cd4ff4847e07000000
+       VPMULUDQ Z1, Z22, K7, Z16                          // 62e1cd47f4c1
+       VPMULUDQ Z15, Z22, K7, Z16                         // 62c1cd47f4c7
+       VPMULUDQ (SI), Z22, K7, Z16                        // 62e1cd47f406
+       VPMULUDQ 7(SI)(DI*2), Z22, K7, Z16                 // 62e1cd47f4847e07000000
+       VPORD X7, X1, K2, X31                              // 6261750aebff
+       VPORD 99(R15)(R15*2), X1, K2, X31                  // 6201750aebbc7f63000000
+       VPORD -7(DI), X1, K2, X31                          // 6261750aebbff9ffffff
+       VPORD Y28, Y9, K1, Y20                             // 62813529ebe4
+       VPORD 17(SP)(BP*8), Y9, K1, Y20                    // 62e13529eba4ec11000000
+       VPORD 17(SP)(BP*4), Y9, K1, Y20                    // 62e13529eba4ac11000000
+       VPORD Z15, Z3, K2, Z14                             // 6251654aebf7
+       VPORD Z30, Z3, K2, Z14                             // 6211654aebf6
+       VPORD 99(R15)(R15*1), Z3, K2, Z14                  // 6211654aebb43f63000000
+       VPORD (DX), Z3, K2, Z14                            // 6271654aeb32
+       VPORD Z15, Z12, K2, Z14                            // 62511d4aebf7
+       VPORD Z30, Z12, K2, Z14                            // 62111d4aebf6
+       VPORD 99(R15)(R15*1), Z12, K2, Z14                 // 62111d4aebb43f63000000
+       VPORD (DX), Z12, K2, Z14                           // 62711d4aeb32
+       VPORD Z15, Z3, K2, Z28                             // 6241654aebe7
+       VPORD Z30, Z3, K2, Z28                             // 6201654aebe6
+       VPORD 99(R15)(R15*1), Z3, K2, Z28                  // 6201654aeba43f63000000
+       VPORD (DX), Z3, K2, Z28                            // 6261654aeb22
+       VPORD Z15, Z12, K2, Z28                            // 62411d4aebe7
+       VPORD Z30, Z12, K2, Z28                            // 62011d4aebe6
+       VPORD 99(R15)(R15*1), Z12, K2, Z28                 // 62011d4aeba43f63000000
+       VPORD (DX), Z12, K2, Z28                           // 62611d4aeb22
+       VPORQ X12, X15, K1, X9                             // 62518509ebcc
+       VPORQ -7(CX)(DX*1), X15, K1, X9                    // 62718509eb8c11f9ffffff
+       VPORQ -15(R14)(R15*4), X15, K1, X9                 // 62118509eb8cbef1ffffff
+       VPORQ Y8, Y1, K7, Y28                              // 6241f52febe0
+       VPORQ 7(SI)(DI*4), Y1, K7, Y28                     // 6261f52feba4be07000000
+       VPORQ -7(DI)(R8*2), Y1, K7, Y28                    // 6221f52feba447f9ffffff
+       VPORQ Z3, Z5, K1, Z19                              // 62e1d549ebdb
+       VPORQ Z5, Z5, K1, Z19                              // 62e1d549ebdd
+       VPORQ -17(BP)(SI*8), Z5, K1, Z19                   // 62e1d549eb9cf5efffffff
+       VPORQ (R15), Z5, K1, Z19                           // 62c1d549eb1f
+       VPORQ Z3, Z1, K1, Z19                              // 62e1f549ebdb
+       VPORQ Z5, Z1, K1, Z19                              // 62e1f549ebdd
+       VPORQ -17(BP)(SI*8), Z1, K1, Z19                   // 62e1f549eb9cf5efffffff
+       VPORQ (R15), Z1, K1, Z19                           // 62c1f549eb1f
+       VPORQ Z3, Z5, K1, Z15                              // 6271d549ebfb
+       VPORQ Z5, Z5, K1, Z15                              // 6271d549ebfd
+       VPORQ -17(BP)(SI*8), Z5, K1, Z15                   // 6271d549ebbcf5efffffff
+       VPORQ (R15), Z5, K1, Z15                           // 6251d549eb3f
+       VPORQ Z3, Z1, K1, Z15                              // 6271f549ebfb
+       VPORQ Z5, Z1, K1, Z15                              // 6271f549ebfd
+       VPORQ -17(BP)(SI*8), Z1, K1, Z15                   // 6271f549ebbcf5efffffff
+       VPORQ (R15), Z1, K1, Z15                           // 6251f549eb3f
+       VPROLD $121, X12, K1, X0                           // 62d17d0972cc79
+       VPROLD $121, 15(DX)(BX*1), K1, X0                  // 62f17d09728c1a0f00000079
+       VPROLD $121, -7(CX)(DX*2), K1, X0                  // 62f17d09728c51f9ffffff79
+       VPROLD $13, Y27, K1, Y11                           // 6291252972cb0d
+       VPROLD $13, 17(SP), K1, Y11                        // 62f12529728c24110000000d
+       VPROLD $13, -17(BP)(SI*4), K1, Y11                 // 62f12529728cb5efffffff0d
+       VPROLD $65, Z21, K7, Z14                           // 62b10d4f72cd41
+       VPROLD $65, Z8, K7, Z14                            // 62d10d4f72c841
+       VPROLD $65, 7(SI)(DI*8), K7, Z14                   // 62f10d4f728cfe0700000041
+       VPROLD $65, -15(R14), K7, Z14                      // 62d10d4f728ef1ffffff41
+       VPROLD $65, Z21, K7, Z15                           // 62b1054f72cd41
+       VPROLD $65, Z8, K7, Z15                            // 62d1054f72c841
+       VPROLD $65, 7(SI)(DI*8), K7, Z15                   // 62f1054f728cfe0700000041
+       VPROLD $65, -15(R14), K7, Z15                      // 62d1054f728ef1ffffff41
+       VPROLQ $67, X5, K2, X14                            // 62f18d0a72cd43
+       VPROLQ $67, -17(BP), K2, X14                       // 62f18d0a728defffffff43
+       VPROLQ $67, -15(R14)(R15*8), K2, X14               // 62918d0a728cfef1ffffff43
+       VPROLQ $127, Y16, K4, Y17                          // 62b1f52472c87f
+       VPROLQ $127, 7(AX), K4, Y17                        // 62f1f5247288070000007f
+       VPROLQ $127, (DI), K4, Y17                         // 62f1f524720f7f
+       VPROLQ $0, Z20, K1, Z16                            // 62b1fd4172cc00
+       VPROLQ $0, Z0, K1, Z16                             // 62f1fd4172c800
+       VPROLQ $0, 7(SI)(DI*1), K1, Z16                    // 62f1fd41728c3e0700000000
+       VPROLQ $0, 15(DX)(BX*8), K1, Z16                   // 62f1fd41728cda0f00000000
+       VPROLQ $0, Z20, K1, Z9                             // 62b1b54972cc00
+       VPROLQ $0, Z0, K1, Z9                              // 62f1b54972c800
+       VPROLQ $0, 7(SI)(DI*1), K1, Z9                     // 62f1b549728c3e0700000000
+       VPROLQ $0, 15(DX)(BX*8), K1, Z9                    // 62f1b549728cda0f00000000
+       VPROLVD X8, X15, K3, X17                           // 62c2050b15c8
+       VPROLVD 17(SP)(BP*2), X15, K3, X17                 // 62e2050b158c6c11000000
+       VPROLVD -7(DI)(R8*4), X15, K3, X17                 // 62a2050b158c87f9ffffff
+       VPROLVD Y26, Y6, K4, Y12                           // 62124d2c15e2
+       VPROLVD 99(R15)(R15*1), Y6, K4, Y12                // 62124d2c15a43f63000000
+       VPROLVD (DX), Y6, K4, Y12                          // 62724d2c1522
+       VPROLVD Z0, Z0, K5, Z23                            // 62e27d4d15f8
+       VPROLVD Z25, Z0, K5, Z23                           // 62827d4d15f9
+       VPROLVD -7(DI)(R8*1), Z0, K5, Z23                  // 62a27d4d15bc07f9ffffff
+       VPROLVD (SP), Z0, K5, Z23                          // 62e27d4d153c24
+       VPROLVD Z0, Z11, K5, Z23                           // 62e2254d15f8
+       VPROLVD Z25, Z11, K5, Z23                          // 6282254d15f9
+       VPROLVD -7(DI)(R8*1), Z11, K5, Z23                 // 62a2254d15bc07f9ffffff
+       VPROLVD (SP), Z11, K5, Z23                         // 62e2254d153c24
+       VPROLVD Z0, Z0, K5, Z19                            // 62e27d4d15d8
+       VPROLVD Z25, Z0, K5, Z19                           // 62827d4d15d9
+       VPROLVD -7(DI)(R8*1), Z0, K5, Z19                  // 62a27d4d159c07f9ffffff
+       VPROLVD (SP), Z0, K5, Z19                          // 62e27d4d151c24
+       VPROLVD Z0, Z11, K5, Z19                           // 62e2254d15d8
+       VPROLVD Z25, Z11, K5, Z19                          // 6282254d15d9
+       VPROLVD -7(DI)(R8*1), Z11, K5, Z19                 // 62a2254d159c07f9ffffff
+       VPROLVD (SP), Z11, K5, Z19                         // 62e2254d151c24
+       VPROLVQ X23, X26, K7, X3                           // 62b2ad0715df
+       VPROLVQ 15(R8), X26, K7, X3                        // 62d2ad0715980f000000
+       VPROLVQ (BP), X26, K7, X3                          // 62f2ad07155d00
+       VPROLVQ Y28, Y8, K7, Y3                            // 6292bd2f15dc
+       VPROLVQ -17(BP)(SI*8), Y8, K7, Y3                  // 62f2bd2f159cf5efffffff
+       VPROLVQ (R15), Y8, K7, Y3                          // 62d2bd2f151f
+       VPROLVQ Z9, Z0, K6, Z24                            // 6242fd4e15c1
+       VPROLVQ Z3, Z0, K6, Z24                            // 6262fd4e15c3
+       VPROLVQ -7(CX), Z0, K6, Z24                        // 6262fd4e1581f9ffffff
+       VPROLVQ 15(DX)(BX*4), Z0, K6, Z24                  // 6262fd4e15849a0f000000
+       VPROLVQ Z9, Z26, K6, Z24                           // 6242ad4615c1
+       VPROLVQ Z3, Z26, K6, Z24                           // 6262ad4615c3
+       VPROLVQ -7(CX), Z26, K6, Z24                       // 6262ad461581f9ffffff
+       VPROLVQ 15(DX)(BX*4), Z26, K6, Z24                 // 6262ad4615849a0f000000
+       VPROLVQ Z9, Z0, K6, Z12                            // 6252fd4e15e1
+       VPROLVQ Z3, Z0, K6, Z12                            // 6272fd4e15e3
+       VPROLVQ -7(CX), Z0, K6, Z12                        // 6272fd4e15a1f9ffffff
+       VPROLVQ 15(DX)(BX*4), Z0, K6, Z12                  // 6272fd4e15a49a0f000000
+       VPROLVQ Z9, Z26, K6, Z12                           // 6252ad4615e1
+       VPROLVQ Z3, Z26, K6, Z12                           // 6272ad4615e3
+       VPROLVQ -7(CX), Z26, K6, Z12                       // 6272ad4615a1f9ffffff
+       VPROLVQ 15(DX)(BX*4), Z26, K6, Z12                 // 6272ad4615a49a0f000000
+       VPRORD $97, X28, K3, X13                           // 6291150b72c461
+       VPRORD $97, 15(R8)(R14*8), K3, X13                 // 6291150b7284f00f00000061
+       VPRORD $97, -15(R14)(R15*2), K3, X13               // 6291150b72847ef1ffffff61
+       VPRORD $81, Y23, K7, Y1                            // 62b1752f72c751
+       VPRORD $81, 7(SI)(DI*8), K7, Y1                    // 62f1752f7284fe0700000051
+       VPRORD $81, -15(R14), K7, Y1                       // 62d1752f7286f1ffffff51
+       VPRORD $42, Z9, K4, Z9                             // 62d1354c72c12a
+       VPRORD $42, Z28, K4, Z9                            // 6291354c72c42a
+       VPRORD $42, 99(R15)(R15*8), K4, Z9                 // 6291354c7284ff630000002a
+       VPRORD $42, 7(AX)(CX*8), K4, Z9                    // 62f1354c7284c8070000002a
+       VPRORD $42, Z9, K4, Z25                            // 62d1354472c12a
+       VPRORD $42, Z28, K4, Z25                           // 6291354472c42a
+       VPRORD $42, 99(R15)(R15*8), K4, Z25                // 629135447284ff630000002a
+       VPRORD $42, 7(AX)(CX*8), K4, Z25                   // 62f135447284c8070000002a
+       VPRORQ $79, X9, K4, X24                            // 62d1bd0472c14f
+       VPRORQ $79, -15(R14)(R15*1), K4, X24               // 6291bd0472843ef1ffffff4f
+       VPRORQ $79, -15(BX), K4, X24                       // 62f1bd047283f1ffffff4f
+       VPRORQ $64, Y31, K7, Y14                           // 62918d2f72c740
+       VPRORQ $64, 7(SI)(DI*1), K7, Y14                   // 62f18d2f72843e0700000040
+       VPRORQ $64, 15(DX)(BX*8), K7, Y14                  // 62f18d2f7284da0f00000040
+       VPRORQ $27, Z17, K2, Z20                           // 62b1dd4272c11b
+       VPRORQ $27, Z0, K2, Z20                            // 62f1dd4272c01b
+       VPRORQ $27, (AX), K2, Z20                          // 62f1dd4272001b
+       VPRORQ $27, 7(SI), K2, Z20                         // 62f1dd427286070000001b
+       VPRORQ $27, Z17, K2, Z0                            // 62b1fd4a72c11b
+       VPRORQ $27, Z0, K2, Z0                             // 62f1fd4a72c01b
+       VPRORQ $27, (AX), K2, Z0                           // 62f1fd4a72001b
+       VPRORQ $27, 7(SI), K2, Z0                          // 62f1fd4a7286070000001b
+       VPRORVD X18, X26, K5, X15                          // 62322d0514fa
+       VPRORVD 7(AX)(CX*4), X26, K5, X15                  // 62722d0514bc8807000000
+       VPRORVD 7(AX)(CX*1), X26, K5, X15                  // 62722d0514bc0807000000
+       VPRORVD Y22, Y2, K3, Y25                           // 62226d2b14ce
+       VPRORVD -7(DI)(R8*1), Y2, K3, Y25                  // 62226d2b148c07f9ffffff
+       VPRORVD (SP), Y2, K3, Y25                          // 62626d2b140c24
+       VPRORVD Z21, Z31, K4, Z17                          // 62a2054414cd
+       VPRORVD Z9, Z31, K4, Z17                           // 62c2054414c9
+       VPRORVD (BX), Z31, K4, Z17                         // 62e20544140b
+       VPRORVD -17(BP)(SI*1), Z31, K4, Z17                // 62e20544148c35efffffff
+       VPRORVD Z21, Z0, K4, Z17                           // 62a27d4c14cd
+       VPRORVD Z9, Z0, K4, Z17                            // 62c27d4c14c9
+       VPRORVD (BX), Z0, K4, Z17                          // 62e27d4c140b
+       VPRORVD -17(BP)(SI*1), Z0, K4, Z17                 // 62e27d4c148c35efffffff
+       VPRORVD Z21, Z31, K4, Z23                          // 62a2054414fd
+       VPRORVD Z9, Z31, K4, Z23                           // 62c2054414f9
+       VPRORVD (BX), Z31, K4, Z23                         // 62e20544143b
+       VPRORVD -17(BP)(SI*1), Z31, K4, Z23                // 62e2054414bc35efffffff
+       VPRORVD Z21, Z0, K4, Z23                           // 62a27d4c14fd
+       VPRORVD Z9, Z0, K4, Z23                            // 62c27d4c14f9
+       VPRORVD (BX), Z0, K4, Z23                          // 62e27d4c143b
+       VPRORVD -17(BP)(SI*1), Z0, K4, Z23                 // 62e27d4c14bc35efffffff
+       VPRORVQ X11, X1, K2, X21                           // 62c2f50a14eb
+       VPRORVQ (SI), X1, K2, X21                          // 62e2f50a142e
+       VPRORVQ 7(SI)(DI*2), X1, K2, X21                   // 62e2f50a14ac7e07000000
+       VPRORVQ Y9, Y8, K2, Y27                            // 6242bd2a14d9
+       VPRORVQ -7(CX), Y8, K2, Y27                        // 6262bd2a1499f9ffffff
+       VPRORVQ 15(DX)(BX*4), Y8, K2, Y27                  // 6262bd2a149c9a0f000000
+       VPRORVQ Z20, Z1, K3, Z6                            // 62b2f54b14f4
+       VPRORVQ Z9, Z1, K3, Z6                             // 62d2f54b14f1
+       VPRORVQ 15(R8)(R14*4), Z1, K3, Z6                  // 6292f54b14b4b00f000000
+       VPRORVQ -7(CX)(DX*4), Z1, K3, Z6                   // 62f2f54b14b491f9ffffff
+       VPRORVQ Z20, Z9, K3, Z6                            // 62b2b54b14f4
+       VPRORVQ Z9, Z9, K3, Z6                             // 62d2b54b14f1
+       VPRORVQ 15(R8)(R14*4), Z9, K3, Z6                  // 6292b54b14b4b00f000000
+       VPRORVQ -7(CX)(DX*4), Z9, K3, Z6                   // 62f2b54b14b491f9ffffff
+       VPRORVQ Z20, Z1, K3, Z9                            // 6232f54b14cc
+       VPRORVQ Z9, Z1, K3, Z9                             // 6252f54b14c9
+       VPRORVQ 15(R8)(R14*4), Z1, K3, Z9                  // 6212f54b148cb00f000000
+       VPRORVQ -7(CX)(DX*4), Z1, K3, Z9                   // 6272f54b148c91f9ffffff
+       VPRORVQ Z20, Z9, K3, Z9                            // 6232b54b14cc
+       VPRORVQ Z9, Z9, K3, Z9                             // 6252b54b14c9
+       VPRORVQ 15(R8)(R14*4), Z9, K3, Z9                  // 6212b54b148cb00f000000
+       VPRORVQ -7(CX)(DX*4), Z9, K3, Z9                   // 6272b54b148c91f9ffffff
+       VPSCATTERDD X0, K3, (AX)(X4*1)                     // 62f27d0ba00420
+       VPSCATTERDD X0, K3, (BP)(X10*2)                    // 62b27d0ba0445500
+       VPSCATTERDD X0, K3, (R10)(X29*8)                   // 62927d03a004ea
+       VPSCATTERDD Y1, K3, (R10)(Y29*8)                   // 62927d23a00cea
+       VPSCATTERDD Y1, K3, (SP)(Y4*2)                     // 62f27d2ba00c64
+       VPSCATTERDD Y1, K3, (DX)(Y10*4)                    // 62b27d2ba00c92
+       VPSCATTERDD Z16, K2, (DX)(Z10*4)                   // 62a27d4aa00492
+       VPSCATTERDD Z25, K2, (DX)(Z10*4)                   // 62227d4aa00c92
+       VPSCATTERDD Z16, K2, (AX)(Z4*1)                    // 62e27d4aa00420
+       VPSCATTERDD Z25, K2, (AX)(Z4*1)                    // 62627d4aa00c20
+       VPSCATTERDD Z16, K2, (SP)(Z4*2)                    // 62e27d4aa00464
+       VPSCATTERDD Z25, K2, (SP)(Z4*2)                    // 62627d4aa00c64
+       VPSCATTERDQ X0, K1, (DX)(X10*4)                    // 62b2fd09a00492
+       VPSCATTERDQ X0, K1, (SP)(X4*2)                     // 62f2fd09a00464
+       VPSCATTERDQ X0, K1, (R14)(X29*8)                   // 6292fd01a004ee
+       VPSCATTERDQ Y6, K2, (AX)(X4*1)                     // 62f2fd2aa03420
+       VPSCATTERDQ Y6, K2, (BP)(X10*2)                    // 62b2fd2aa0745500
+       VPSCATTERDQ Y6, K2, (R10)(X29*8)                   // 6292fd22a034ea
+       VPSCATTERDQ Z14, K1, (R14)(Y29*8)                  // 6212fd41a034ee
+       VPSCATTERDQ Z13, K1, (R14)(Y29*8)                  // 6212fd41a02cee
+       VPSCATTERDQ Z14, K1, (AX)(Y4*1)                    // 6272fd49a03420
+       VPSCATTERDQ Z13, K1, (AX)(Y4*1)                    // 6272fd49a02c20
+       VPSCATTERDQ Z14, K1, (BP)(Y10*2)                   // 6232fd49a0745500
+       VPSCATTERDQ Z13, K1, (BP)(Y10*2)                   // 6232fd49a06c5500
+       VPSCATTERQD X24, K7, (AX)(X4*1)                    // 62627d0fa10420
+       VPSCATTERQD X24, K7, (BP)(X10*2)                   // 62227d0fa1445500
+       VPSCATTERQD X24, K7, (R10)(X29*8)                  // 62027d07a104ea
+       VPSCATTERQD X20, K1, (R10)(Y29*8)                  // 62827d21a124ea
+       VPSCATTERQD X20, K1, (SP)(Y4*2)                    // 62e27d29a12464
+       VPSCATTERQD X20, K1, (DX)(Y10*4)                   // 62a27d29a12492
+       VPSCATTERQD Y1, K1, (DX)(Z10*4)                    // 62b27d49a10c92
+       VPSCATTERQD Y1, K1, (AX)(Z4*1)                     // 62f27d49a10c20
+       VPSCATTERQD Y1, K1, (SP)(Z4*2)                     // 62f27d49a10c64
+       VPSCATTERQQ X7, K1, (DX)(X10*4)                    // 62b2fd09a13c92
+       VPSCATTERQQ X7, K1, (SP)(X4*2)                     // 62f2fd09a13c64
+       VPSCATTERQQ X7, K1, (R14)(X29*8)                   // 6292fd01a13cee
+       VPSCATTERQQ Y9, K7, (R14)(Y29*8)                   // 6212fd27a10cee
+       VPSCATTERQQ Y9, K7, (AX)(Y4*1)                     // 6272fd2fa10c20
+       VPSCATTERQQ Y9, K7, (BP)(Y10*2)                    // 6232fd2fa14c5500
+       VPSCATTERQQ Z12, K2, (BP)(Z10*2)                   // 6232fd4aa1645500
+       VPSCATTERQQ Z13, K2, (BP)(Z10*2)                   // 6232fd4aa16c5500
+       VPSCATTERQQ Z12, K2, (R10)(Z29*8)                  // 6212fd42a124ea
+       VPSCATTERQQ Z13, K2, (R10)(Z29*8)                  // 6212fd42a12cea
+       VPSCATTERQQ Z12, K2, (R14)(Z29*8)                  // 6212fd42a124ee
+       VPSCATTERQQ Z13, K2, (R14)(Z29*8)                  // 6212fd42a12cee
+       VPSHUFD $126, X2, K4, X9                           // 62717d0c70ca7e
+       VPSHUFD $126, 17(SP)(BP*1), K4, X9                 // 62717d0c708c2c110000007e
+       VPSHUFD $126, -7(CX)(DX*8), K4, X9                 // 62717d0c708cd1f9ffffff7e
+       VPSHUFD $94, Y31, K4, Y6                           // 62917d2c70f75e
+       VPSHUFD $94, 17(SP)(BP*2), K4, Y6                  // 62f17d2c70b46c110000005e
+       VPSHUFD $94, -7(DI)(R8*4), K4, Y6                  // 62b17d2c70b487f9ffffff5e
+       VPSHUFD $121, Z3, K7, Z8                           // 62717d4f70c379
+       VPSHUFD $121, Z27, K7, Z8                          // 62117d4f70c379
+       VPSHUFD $121, 7(AX)(CX*4), K7, Z8                  // 62717d4f7084880700000079
+       VPSHUFD $121, 7(AX)(CX*1), K7, Z8                  // 62717d4f7084080700000079
+       VPSHUFD $121, Z3, K7, Z2                           // 62f17d4f70d379
+       VPSHUFD $121, Z27, K7, Z2                          // 62917d4f70d379
+       VPSHUFD $121, 7(AX)(CX*4), K7, Z2                  // 62f17d4f7094880700000079
+       VPSHUFD $121, 7(AX)(CX*1), K7, Z2                  // 62f17d4f7094080700000079
+       VPSLLD $81, X0, K3, X14                            // 62f10d0b72f051
+       VPSLLD $81, (R14), K3, X14                         // 62d10d0b723651
+       VPSLLD $81, -7(DI)(R8*8), K3, X14                  // 62b10d0b72b4c7f9ffffff51
+       VPSLLD $42, Y0, K3, Y6                             // 62f14d2b72f02a
+       VPSLLD $42, -15(R14)(R15*1), K3, Y6                // 62914d2b72b43ef1ffffff2a
+       VPSLLD $42, -15(BX), K3, Y6                        // 62f14d2b72b3f1ffffff2a
+       VPSLLD $79, Z12, K3, Z9                            // 62d1354b72f44f
+       VPSLLD $79, Z22, K3, Z9                            // 62b1354b72f64f
+       VPSLLD $79, 7(SI)(DI*4), K3, Z9                    // 62f1354b72b4be070000004f
+       VPSLLD $79, -7(DI)(R8*2), K3, Z9                   // 62b1354b72b447f9ffffff4f
+       VPSLLD $79, Z12, K3, Z19                           // 62d1654372f44f
+       VPSLLD $79, Z22, K3, Z19                           // 62b1654372f64f
+       VPSLLD $79, 7(SI)(DI*4), K3, Z19                   // 62f1654372b4be070000004f
+       VPSLLD $79, -7(DI)(R8*2), K3, Z19                  // 62b1654372b447f9ffffff4f
+       VPSLLD X15, X7, K2, X17                            // 62c1450af2cf
+       VPSLLD 99(R15)(R15*4), X7, K2, X17                 // 6281450af28cbf63000000
+       VPSLLD 15(DX), X7, K2, X17                         // 62e1450af28a0f000000
+       VPSLLD X11, Y5, K1, Y3                             // 62d15529f2db
+       VPSLLD (CX), Y5, K1, Y3                            // 62f15529f219
+       VPSLLD 99(R15), Y5, K1, Y3                         // 62d15529f29f63000000
+       VPSLLD X0, Z18, K2, Z11                            // 62716d42f2d8
+       VPSLLD 99(R15)(R15*2), Z18, K2, Z11                // 62116d42f29c7f63000000
+       VPSLLD -7(DI), Z18, K2, Z11                        // 62716d42f29ff9ffffff
+       VPSLLD X0, Z24, K2, Z11                            // 62713d42f2d8
+       VPSLLD 99(R15)(R15*2), Z24, K2, Z11                // 62113d42f29c7f63000000
+       VPSLLD -7(DI), Z24, K2, Z11                        // 62713d42f29ff9ffffff
+       VPSLLD X0, Z18, K2, Z5                             // 62f16d42f2e8
+       VPSLLD 99(R15)(R15*2), Z18, K2, Z5                 // 62916d42f2ac7f63000000
+       VPSLLD -7(DI), Z18, K2, Z5                         // 62f16d42f2aff9ffffff
+       VPSLLD X0, Z24, K2, Z5                             // 62f13d42f2e8
+       VPSLLD 99(R15)(R15*2), Z24, K2, Z5                 // 62913d42f2ac7f63000000
+       VPSLLD -7(DI), Z24, K2, Z5                         // 62f13d42f2aff9ffffff
+       VPSLLQ $82, X25, K1, X27                           // 6291a50173f152
+       VPSLLQ $82, 15(DX)(BX*1), K1, X27                  // 62f1a50173b41a0f00000052
+       VPSLLQ $82, -7(CX)(DX*2), K1, X27                  // 62f1a50173b451f9ffffff52
+       VPSLLQ $126, Y5, K7, Y3                            // 62f1e52f73f57e
+       VPSLLQ $126, (SI), K7, Y3                          // 62f1e52f73367e
+       VPSLLQ $126, 7(SI)(DI*2), K7, Y3                   // 62f1e52f73b47e070000007e
+       VPSLLQ $94, Z6, K1, Z6                             // 62f1cd4973f65e
+       VPSLLQ $94, Z22, K1, Z6                            // 62b1cd4973f65e
+       VPSLLQ $94, 7(AX), K1, Z6                          // 62f1cd4973b0070000005e
+       VPSLLQ $94, (DI), K1, Z6                           // 62f1cd4973375e
+       VPSLLQ $94, Z6, K1, Z16                            // 62f1fd4173f65e
+       VPSLLQ $94, Z22, K1, Z16                           // 62b1fd4173f65e
+       VPSLLQ $94, 7(AX), K1, Z16                         // 62f1fd4173b0070000005e
+       VPSLLQ $94, (DI), K1, Z16                          // 62f1fd4173375e
+       VPSLLQ X15, X18, K1, X3                            // 62d1ed01f3df
+       VPSLLQ -17(BP), X18, K1, X3                        // 62f1ed01f39defffffff
+       VPSLLQ -15(R14)(R15*8), X18, K1, X3                // 6291ed01f39cfef1ffffff
+       VPSLLQ X28, Y7, K1, Y28                            // 6201c529f3e4
+       VPSLLQ 17(SP)(BP*2), Y7, K1, Y28                   // 6261c529f3a46c11000000
+       VPSLLQ -7(DI)(R8*4), Y7, K1, Y28                   // 6221c529f3a487f9ffffff
+       VPSLLQ X15, Z13, K7, Z1                            // 62d1954ff3cf
+       VPSLLQ 15(R8), Z13, K7, Z1                         // 62d1954ff3880f000000
+       VPSLLQ (BP), Z13, K7, Z1                           // 62f1954ff34d00
+       VPSLLQ X15, Z13, K7, Z15                           // 6251954ff3ff
+       VPSLLQ 15(R8), Z13, K7, Z15                        // 6251954ff3b80f000000
+       VPSLLQ (BP), Z13, K7, Z15                          // 6271954ff37d00
+       VPSLLVD X8, X13, K2, X7                            // 62d2150a47f8
+       VPSLLVD 15(R8)(R14*8), X13, K2, X7                 // 6292150a47bcf00f000000
+       VPSLLVD -15(R14)(R15*2), X13, K2, X7               // 6292150a47bc7ef1ffffff
+       VPSLLVD Y13, Y22, K4, Y0                           // 62d24d2447c5
+       VPSLLVD 17(SP)(BP*8), Y22, K4, Y0                  // 62f24d244784ec11000000
+       VPSLLVD 17(SP)(BP*4), Y22, K4, Y0                  // 62f24d244784ac11000000
+       VPSLLVD Z2, Z22, K1, Z18                           // 62e24d4147d2
+       VPSLLVD Z31, Z22, K1, Z18                          // 62824d4147d7
+       VPSLLVD 99(R15)(R15*1), Z22, K1, Z18               // 62824d4147943f63000000
+       VPSLLVD (DX), Z22, K1, Z18                         // 62e24d414712
+       VPSLLVD Z2, Z7, K1, Z18                            // 62e2454947d2
+       VPSLLVD Z31, Z7, K1, Z18                           // 6282454947d7
+       VPSLLVD 99(R15)(R15*1), Z7, K1, Z18                // 6282454947943f63000000
+       VPSLLVD (DX), Z7, K1, Z18                          // 62e245494712
+       VPSLLVD Z2, Z22, K1, Z8                            // 62724d4147c2
+       VPSLLVD Z31, Z22, K1, Z8                           // 62124d4147c7
+       VPSLLVD 99(R15)(R15*1), Z22, K1, Z8                // 62124d4147843f63000000
+       VPSLLVD (DX), Z22, K1, Z8                          // 62724d414702
+       VPSLLVD Z2, Z7, K1, Z8                             // 6272454947c2
+       VPSLLVD Z31, Z7, K1, Z8                            // 6212454947c7
+       VPSLLVD 99(R15)(R15*1), Z7, K1, Z8                 // 6212454947843f63000000
+       VPSLLVD (DX), Z7, K1, Z8                           // 627245494702
+       VPSLLVQ X0, X7, K3, X24                            // 6262c50b47c0
+       VPSLLVQ -15(R14)(R15*1), X7, K3, X24               // 6202c50b47843ef1ffffff
+       VPSLLVQ -15(BX), X7, K3, X24                       // 6262c50b4783f1ffffff
+       VPSLLVQ Y14, Y1, K4, Y12                           // 6252f52c47e6
+       VPSLLVQ 7(SI)(DI*4), Y1, K4, Y12                   // 6272f52c47a4be07000000
+       VPSLLVQ -7(DI)(R8*2), Y1, K4, Y12                  // 6232f52c47a447f9ffffff
+       VPSLLVQ Z12, Z1, K5, Z20                           // 62c2f54d47e4
+       VPSLLVQ Z16, Z1, K5, Z20                           // 62a2f54d47e0
+       VPSLLVQ -17(BP)(SI*8), Z1, K5, Z20                 // 62e2f54d47a4f5efffffff
+       VPSLLVQ (R15), Z1, K5, Z20                         // 62c2f54d4727
+       VPSLLVQ Z12, Z3, K5, Z20                           // 62c2e54d47e4
+       VPSLLVQ Z16, Z3, K5, Z20                           // 62a2e54d47e0
+       VPSLLVQ -17(BP)(SI*8), Z3, K5, Z20                 // 62e2e54d47a4f5efffffff
+       VPSLLVQ (R15), Z3, K5, Z20                         // 62c2e54d4727
+       VPSLLVQ Z12, Z1, K5, Z9                            // 6252f54d47cc
+       VPSLLVQ Z16, Z1, K5, Z9                            // 6232f54d47c8
+       VPSLLVQ -17(BP)(SI*8), Z1, K5, Z9                  // 6272f54d478cf5efffffff
+       VPSLLVQ (R15), Z1, K5, Z9                          // 6252f54d470f
+       VPSLLVQ Z12, Z3, K5, Z9                            // 6252e54d47cc
+       VPSLLVQ Z16, Z3, K5, Z9                            // 6232e54d47c8
+       VPSLLVQ -17(BP)(SI*8), Z3, K5, Z9                  // 6272e54d478cf5efffffff
+       VPSLLVQ (R15), Z3, K5, Z9                          // 6252e54d470f
+       VPSRAD $67, X7, K5, X24                            // 62f13d0572e743
+       VPSRAD $67, 7(AX), K5, X24                         // 62f13d0572a00700000043
+       VPSRAD $67, (DI), K5, X24                          // 62f13d05722743
+       VPSRAD $127, Y7, K3, Y13                           // 62f1152b72e77f
+       VPSRAD $127, 99(R15)(R15*1), K3, Y13               // 6291152b72a43f630000007f
+       VPSRAD $127, (DX), K3, Y13                         // 62f1152b72227f
+       VPSRAD $0, Z21, K4, Z14                            // 62b10d4c72e500
+       VPSRAD $0, Z8, K4, Z14                             // 62d10d4c72e000
+       VPSRAD $0, -7(DI)(R8*1), K4, Z14                   // 62b10d4c72a407f9ffffff00
+       VPSRAD $0, (SP), K4, Z14                           // 62f10d4c72242400
+       VPSRAD $0, Z21, K4, Z15                            // 62b1054c72e500
+       VPSRAD $0, Z8, K4, Z15                             // 62d1054c72e000
+       VPSRAD $0, -7(DI)(R8*1), K4, Z15                   // 62b1054c72a407f9ffffff00
+       VPSRAD $0, (SP), K4, Z15                           // 62f1054c72242400
+       VPSRAD X12, X16, K2, X20                           // 62c17d02e2e4
+       VPSRAD 99(R15)(R15*1), X16, K2, X20                // 62817d02e2a43f63000000
+       VPSRAD (DX), X16, K2, X20                          // 62e17d02e222
+       VPSRAD X6, Y21, K2, Y2                             // 62f15522e2d6
+       VPSRAD -17(BP)(SI*8), Y21, K2, Y2                  // 62f15522e294f5efffffff
+       VPSRAD (R15), Y21, K2, Y2                          // 62d15522e217
+       VPSRAD X17, Z20, K3, Z16                           // 62a15d43e2c1
+       VPSRAD 7(SI)(DI*8), Z20, K3, Z16                   // 62e15d43e284fe07000000
+       VPSRAD -15(R14), Z20, K3, Z16                      // 62c15d43e286f1ffffff
+       VPSRAD X17, Z0, K3, Z16                            // 62a17d4be2c1
+       VPSRAD 7(SI)(DI*8), Z0, K3, Z16                    // 62e17d4be284fe07000000
+       VPSRAD -15(R14), Z0, K3, Z16                       // 62c17d4be286f1ffffff
+       VPSRAD X17, Z20, K3, Z9                            // 62315d43e2c9
+       VPSRAD 7(SI)(DI*8), Z20, K3, Z9                    // 62715d43e28cfe07000000
+       VPSRAD -15(R14), Z20, K3, Z9                       // 62515d43e28ef1ffffff
+       VPSRAD X17, Z0, K3, Z9                             // 62317d4be2c9
+       VPSRAD 7(SI)(DI*8), Z0, K3, Z9                     // 62717d4be28cfe07000000
+       VPSRAD -15(R14), Z0, K3, Z9                        // 62517d4be28ef1ffffff
+       VPSRAQ $97, X6, K3, X28                            // 62f19d0372e661
+       VPSRAQ $97, 7(SI)(DI*1), K3, X28                   // 62f19d0372a43e0700000061
+       VPSRAQ $97, 15(DX)(BX*8), K3, X28                  // 62f19d0372a4da0f00000061
+       VPSRAQ $81, Y9, K3, Y12                            // 62d19d2b72e151
+       VPSRAQ $81, -17(BP)(SI*8), K3, Y12                 // 62f19d2b72a4f5efffffff51
+       VPSRAQ $81, (R15), K3, Y12                         // 62d19d2b722751
+       VPSRAQ $42, Z0, K2, Z23                            // 62f1c54272e02a
+       VPSRAQ $42, Z11, K2, Z23                           // 62d1c54272e32a
+       VPSRAQ $42, -7(CX), K2, Z23                        // 62f1c54272a1f9ffffff2a
+       VPSRAQ $42, 15(DX)(BX*4), K2, Z23                  // 62f1c54272a49a0f0000002a
+       VPSRAQ $42, Z0, K2, Z19                            // 62f1e54272e02a
+       VPSRAQ $42, Z11, K2, Z19                           // 62d1e54272e32a
+       VPSRAQ $42, -7(CX), K2, Z19                        // 62f1e54272a1f9ffffff2a
+       VPSRAQ $42, 15(DX)(BX*4), K2, Z19                  // 62f1e54272a49a0f0000002a
+       VPSRAQ X8, X8, K1, X1                              // 62d1bd09e2c8
+       VPSRAQ -7(DI)(R8*1), X8, K1, X1                    // 62b1bd09e28c07f9ffffff
+       VPSRAQ (SP), X8, K1, X1                            // 62f1bd09e20c24
+       VPSRAQ X6, Y9, K2, Y1                              // 62f1b52ae2ce
+       VPSRAQ -7(CX), Y9, K2, Y1                          // 62f1b52ae289f9ffffff
+       VPSRAQ 15(DX)(BX*4), Y9, K2, Y1                    // 62f1b52ae28c9a0f000000
+       VPSRAQ X0, Z24, K1, Z0                             // 62f1bd41e2c0
+       VPSRAQ 99(R15)(R15*8), Z24, K1, Z0                 // 6291bd41e284ff63000000
+       VPSRAQ 7(AX)(CX*8), Z24, K1, Z0                    // 62f1bd41e284c807000000
+       VPSRAQ X0, Z12, K1, Z0                             // 62f19d49e2c0
+       VPSRAQ 99(R15)(R15*8), Z12, K1, Z0                 // 62919d49e284ff63000000
+       VPSRAQ 7(AX)(CX*8), Z12, K1, Z0                    // 62f19d49e284c807000000
+       VPSRAQ X0, Z24, K1, Z25                            // 6261bd41e2c8
+       VPSRAQ 99(R15)(R15*8), Z24, K1, Z25                // 6201bd41e28cff63000000
+       VPSRAQ 7(AX)(CX*8), Z24, K1, Z25                   // 6261bd41e28cc807000000
+       VPSRAQ X0, Z12, K1, Z25                            // 62619d49e2c8
+       VPSRAQ 99(R15)(R15*8), Z12, K1, Z25                // 62019d49e28cff63000000
+       VPSRAQ 7(AX)(CX*8), Z12, K1, Z25                   // 62619d49e28cc807000000
+       VPSRAVD X6, X16, K7, X11                           // 62727d0746de
+       VPSRAVD (AX), X16, K7, X11                         // 62727d074618
+       VPSRAVD 7(SI), X16, K7, X11                        // 62727d07469e07000000
+       VPSRAVD Y9, Y2, K1, Y3                             // 62d26d2946d9
+       VPSRAVD 7(SI)(DI*8), Y2, K1, Y3                    // 62f26d29469cfe07000000
+       VPSRAVD -15(R14), Y2, K1, Y3                       // 62d26d29469ef1ffffff
+       VPSRAVD Z9, Z9, K1, Z0                             // 62d2354946c1
+       VPSRAVD Z25, Z9, K1, Z0                            // 6292354946c1
+       VPSRAVD 99(R15)(R15*8), Z9, K1, Z0                 // 629235494684ff63000000
+       VPSRAVD 7(AX)(CX*8), Z9, K1, Z0                    // 62f235494684c807000000
+       VPSRAVD Z9, Z3, K1, Z0                             // 62d2654946c1
+       VPSRAVD Z25, Z3, K1, Z0                            // 6292654946c1
+       VPSRAVD 99(R15)(R15*8), Z3, K1, Z0                 // 629265494684ff63000000
+       VPSRAVD 7(AX)(CX*8), Z3, K1, Z0                    // 62f265494684c807000000
+       VPSRAVD Z9, Z9, K1, Z26                            // 6242354946d1
+       VPSRAVD Z25, Z9, K1, Z26                           // 6202354946d1
+       VPSRAVD 99(R15)(R15*8), Z9, K1, Z26                // 620235494694ff63000000
+       VPSRAVD 7(AX)(CX*8), Z9, K1, Z26                   // 626235494694c807000000
+       VPSRAVD Z9, Z3, K1, Z26                            // 6242654946d1
+       VPSRAVD Z25, Z3, K1, Z26                           // 6202654946d1
+       VPSRAVD 99(R15)(R15*8), Z3, K1, Z26                // 620265494694ff63000000
+       VPSRAVD 7(AX)(CX*8), Z3, K1, Z26                   // 626265494694c807000000
+       VPSRAVQ X12, X22, K1, X6                           // 62d2cd0146f4
+       VPSRAVQ (BX), X22, K1, X6                          // 62f2cd014633
+       VPSRAVQ -17(BP)(SI*1), X22, K1, X6                 // 62f2cd0146b435efffffff
+       VPSRAVQ Y14, Y21, K7, Y12                          // 6252d52746e6
+       VPSRAVQ 7(SI)(DI*1), Y21, K7, Y12                  // 6272d52746a43e07000000
+       VPSRAVQ 15(DX)(BX*8), Y21, K7, Y12                 // 6272d52746a4da0f000000
+       VPSRAVQ Z17, Z20, K2, Z9                           // 6232dd4246c9
+       VPSRAVQ Z0, Z20, K2, Z9                            // 6272dd4246c8
+       VPSRAVQ (AX), Z20, K2, Z9                          // 6272dd424608
+       VPSRAVQ 7(SI), Z20, K2, Z9                         // 6272dd42468e07000000
+       VPSRAVQ Z17, Z0, K2, Z9                            // 6232fd4a46c9
+       VPSRAVQ Z0, Z0, K2, Z9                             // 6272fd4a46c8
+       VPSRAVQ (AX), Z0, K2, Z9                           // 6272fd4a4608
+       VPSRAVQ 7(SI), Z0, K2, Z9                          // 6272fd4a468e07000000
+       VPSRAVQ Z17, Z20, K2, Z28                          // 6222dd4246e1
+       VPSRAVQ Z0, Z20, K2, Z28                           // 6262dd4246e0
+       VPSRAVQ (AX), Z20, K2, Z28                         // 6262dd424620
+       VPSRAVQ 7(SI), Z20, K2, Z28                        // 6262dd4246a607000000
+       VPSRAVQ Z17, Z0, K2, Z28                           // 6222fd4a46e1
+       VPSRAVQ Z0, Z0, K2, Z28                            // 6262fd4a46e0
+       VPSRAVQ (AX), Z0, K2, Z28                          // 6262fd4a4620
+       VPSRAVQ 7(SI), Z0, K2, Z28                         // 6262fd4a46a607000000
+       VPSRLD $47, X0, K7, X0                             // 62f17d0f72d02f
+       VPSRLD $47, (R14), K7, X0                          // 62d17d0f72162f
+       VPSRLD $47, -7(DI)(R8*8), K7, X0                   // 62b17d0f7294c7f9ffffff2f
+       VPSRLD $82, Y6, K4, Y22                            // 62f14d2472d652
+       VPSRLD $82, 99(R15)(R15*8), K4, Y22                // 62914d247294ff6300000052
+       VPSRLD $82, 7(AX)(CX*8), K4, Y22                   // 62f14d247294c80700000052
+       VPSRLD $126, Z7, K4, Z26                           // 62f12d4472d77e
+       VPSRLD $126, Z21, K4, Z26                          // 62b12d4472d57e
+       VPSRLD $126, (R8), K4, Z26                         // 62d12d4472107e
+       VPSRLD $126, 15(DX)(BX*2), K4, Z26                 // 62f12d4472945a0f0000007e
+       VPSRLD $126, Z7, K4, Z22                           // 62f14d4472d77e
+       VPSRLD $126, Z21, K4, Z22                          // 62b14d4472d57e
+       VPSRLD $126, (R8), K4, Z22                         // 62d14d4472107e
+       VPSRLD $126, 15(DX)(BX*2), K4, Z22                 // 62f14d4472945a0f0000007e
+       VPSRLD X17, X11, K7, X25                           // 6221250fd2c9
+       VPSRLD 99(R15)(R15*4), X11, K7, X25                // 6201250fd28cbf63000000
+       VPSRLD 15(DX), X11, K7, X25                        // 6261250fd28a0f000000
+       VPSRLD X18, Y7, K2, Y21                            // 62a1452ad2ea
+       VPSRLD (CX), Y7, K2, Y21                           // 62e1452ad229
+       VPSRLD 99(R15), Y7, K2, Y21                        // 62c1452ad2af63000000
+       VPSRLD X11, Z14, K5, Z16                           // 62c10d4dd2c3
+       VPSRLD 99(R15)(R15*2), Z14, K5, Z16                // 62810d4dd2847f63000000
+       VPSRLD -7(DI), Z14, K5, Z16                        // 62e10d4dd287f9ffffff
+       VPSRLD X11, Z13, K5, Z16                           // 62c1154dd2c3
+       VPSRLD 99(R15)(R15*2), Z13, K5, Z16                // 6281154dd2847f63000000
+       VPSRLD -7(DI), Z13, K5, Z16                        // 62e1154dd287f9ffffff
+       VPSRLD X11, Z14, K5, Z25                           // 62410d4dd2cb
+       VPSRLD 99(R15)(R15*2), Z14, K5, Z25                // 62010d4dd28c7f63000000
+       VPSRLD -7(DI), Z14, K5, Z25                        // 62610d4dd28ff9ffffff
+       VPSRLD X11, Z13, K5, Z25                           // 6241154dd2cb
+       VPSRLD 99(R15)(R15*2), Z13, K5, Z25                // 6201154dd28c7f63000000
+       VPSRLD -7(DI), Z13, K5, Z25                        // 6261154dd28ff9ffffff
+       VPSRLQ $65, X2, K3, X24                            // 62f1bd0373d241
+       VPSRLQ $65, 15(DX)(BX*1), K3, X24                  // 62f1bd0373941a0f00000041
+       VPSRLQ $65, -7(CX)(DX*2), K3, X24                  // 62f1bd03739451f9ffffff41
+       VPSRLQ $67, Y14, K4, Y20                           // 62d1dd2473d643
+       VPSRLQ $67, (BX), K4, Y20                          // 62f1dd24731343
+       VPSRLQ $67, -17(BP)(SI*1), K4, Y20                 // 62f1dd24739435efffffff43
+       VPSRLQ $127, Z27, K2, Z2                           // 6291ed4a73d37f
+       VPSRLQ $127, Z25, K2, Z2                           // 6291ed4a73d17f
+       VPSRLQ $127, -17(BP)(SI*2), K2, Z2                 // 62f1ed4a739475efffffff7f
+       VPSRLQ $127, 7(AX)(CX*2), K2, Z2                   // 62f1ed4a739448070000007f
+       VPSRLQ $127, Z27, K2, Z7                           // 6291c54a73d37f
+       VPSRLQ $127, Z25, K2, Z7                           // 6291c54a73d17f
+       VPSRLQ $127, -17(BP)(SI*2), K2, Z7                 // 62f1c54a739475efffffff7f
+       VPSRLQ $127, 7(AX)(CX*2), K2, Z7                   // 62f1c54a739448070000007f
+       VPSRLQ X26, X27, K2, X2                            // 6291a502d3d2
+       VPSRLQ -17(BP), X27, K2, X2                        // 62f1a502d395efffffff
+       VPSRLQ -15(R14)(R15*8), X27, K2, X2                // 6291a502d394fef1ffffff
+       VPSRLQ X22, Y13, K3, Y24                           // 6221952bd3c6
+       VPSRLQ 17(SP)(BP*2), Y13, K3, Y24                  // 6261952bd3846c11000000
+       VPSRLQ -7(DI)(R8*4), Y13, K3, Y24                  // 6221952bd38487f9ffffff
+       VPSRLQ X30, Z27, K3, Z23                           // 6281a543d3fe
+       VPSRLQ 15(R8), Z27, K3, Z23                        // 62c1a543d3b80f000000
+       VPSRLQ (BP), Z27, K3, Z23                          // 62e1a543d37d00
+       VPSRLQ X30, Z14, K3, Z23                           // 62818d4bd3fe
+       VPSRLQ 15(R8), Z14, K3, Z23                        // 62c18d4bd3b80f000000
+       VPSRLQ (BP), Z14, K3, Z23                          // 62e18d4bd37d00
+       VPSRLQ X30, Z27, K3, Z9                            // 6211a543d3ce
+       VPSRLQ 15(R8), Z27, K3, Z9                         // 6251a543d3880f000000
+       VPSRLQ (BP), Z27, K3, Z9                           // 6271a543d34d00
+       VPSRLQ X30, Z14, K3, Z9                            // 62118d4bd3ce
+       VPSRLQ 15(R8), Z14, K3, Z9                         // 62518d4bd3880f000000
+       VPSRLQ (BP), Z14, K3, Z9                           // 62718d4bd34d00
+       VPSRLVD X15, X11, K3, X3                           // 62d2250b45df
+       VPSRLVD 15(R8)(R14*8), X11, K3, X3                 // 6292250b459cf00f000000
+       VPSRLVD -15(R14)(R15*2), X11, K3, X3               // 6292250b459c7ef1ffffff
+       VPSRLVD Y21, Y14, K2, Y20                          // 62a20d2a45e5
+       VPSRLVD 15(R8)(R14*4), Y14, K2, Y20                // 62820d2a45a4b00f000000
+       VPSRLVD -7(CX)(DX*4), Y14, K2, Y20                 // 62e20d2a45a491f9ffffff
+       VPSRLVD Z8, Z14, K1, Z3                            // 62d20d4945d8
+       VPSRLVD Z24, Z14, K1, Z3                           // 62920d4945d8
+       VPSRLVD 15(R8)(R14*1), Z14, K1, Z3                 // 62920d49459c300f000000
+       VPSRLVD 15(R8)(R14*2), Z14, K1, Z3                 // 62920d49459c700f000000
+       VPSRLVD Z8, Z7, K1, Z3                             // 62d2454945d8
+       VPSRLVD Z24, Z7, K1, Z3                            // 6292454945d8
+       VPSRLVD 15(R8)(R14*1), Z7, K1, Z3                  // 62924549459c300f000000
+       VPSRLVD 15(R8)(R14*2), Z7, K1, Z3                  // 62924549459c700f000000
+       VPSRLVD Z8, Z14, K1, Z0                            // 62d20d4945c0
+       VPSRLVD Z24, Z14, K1, Z0                           // 62920d4945c0
+       VPSRLVD 15(R8)(R14*1), Z14, K1, Z0                 // 62920d494584300f000000
+       VPSRLVD 15(R8)(R14*2), Z14, K1, Z0                 // 62920d494584700f000000
+       VPSRLVD Z8, Z7, K1, Z0                             // 62d2454945c0
+       VPSRLVD Z24, Z7, K1, Z0                            // 6292454945c0
+       VPSRLVD 15(R8)(R14*1), Z7, K1, Z0                  // 629245494584300f000000
+       VPSRLVD 15(R8)(R14*2), Z7, K1, Z0                  // 629245494584700f000000
+       VPSRLVQ X6, X13, K2, X30                           // 6262950a45f6
+       VPSRLVQ -15(R14)(R15*1), X13, K2, X30              // 6202950a45b43ef1ffffff
+       VPSRLVQ -15(BX), X13, K2, X30                      // 6262950a45b3f1ffffff
+       VPSRLVQ Y30, Y26, K1, Y1                           // 6292ad2145ce
+       VPSRLVQ (R8), Y26, K1, Y1                          // 62d2ad214508
+       VPSRLVQ 15(DX)(BX*2), Y26, K1, Y1                  // 62f2ad21458c5a0f000000
+       VPSRLVQ Z6, Z1, K7, Z22                            // 62e2f54f45f6
+       VPSRLVQ Z2, Z1, K7, Z22                            // 62e2f54f45f2
+       VPSRLVQ (R14), Z1, K7, Z22                         // 62c2f54f4536
+       VPSRLVQ -7(DI)(R8*8), Z1, K7, Z22                  // 62a2f54f45b4c7f9ffffff
+       VPSRLVQ Z6, Z16, K7, Z22                           // 62e2fd4745f6
+       VPSRLVQ Z2, Z16, K7, Z22                           // 62e2fd4745f2
+       VPSRLVQ (R14), Z16, K7, Z22                        // 62c2fd474536
+       VPSRLVQ -7(DI)(R8*8), Z16, K7, Z22                 // 62a2fd4745b4c7f9ffffff
+       VPSRLVQ Z6, Z1, K7, Z25                            // 6262f54f45ce
+       VPSRLVQ Z2, Z1, K7, Z25                            // 6262f54f45ca
+       VPSRLVQ (R14), Z1, K7, Z25                         // 6242f54f450e
+       VPSRLVQ -7(DI)(R8*8), Z1, K7, Z25                  // 6222f54f458cc7f9ffffff
+       VPSRLVQ Z6, Z16, K7, Z25                           // 6262fd4745ce
+       VPSRLVQ Z2, Z16, K7, Z25                           // 6262fd4745ca
+       VPSRLVQ (R14), Z16, K7, Z25                        // 6242fd47450e
+       VPSRLVQ -7(DI)(R8*8), Z16, K7, Z25                 // 6222fd47458cc7f9ffffff
+       VPSUBD X0, X1, K6, X8                              // 6271750efac0
+       VPSUBD 99(R15)(R15*1), X1, K6, X8                  // 6211750efa843f63000000
+       VPSUBD (DX), X1, K6, X8                            // 6271750efa02
+       VPSUBD Y30, Y7, K3, Y21                            // 6281452bfaee
+       VPSUBD (R14), Y7, K3, Y21                          // 62c1452bfa2e
+       VPSUBD -7(DI)(R8*8), Y7, K3, Y21                   // 62a1452bfaacc7f9ffffff
+       VPSUBD Z3, Z26, K7, Z13                            // 62712d47faeb
+       VPSUBD Z0, Z26, K7, Z13                            // 62712d47fae8
+       VPSUBD -7(CX)(DX*1), Z26, K7, Z13                  // 62712d47faac11f9ffffff
+       VPSUBD -15(R14)(R15*4), Z26, K7, Z13               // 62112d47faacbef1ffffff
+       VPSUBD Z3, Z3, K7, Z13                             // 6271654ffaeb
+       VPSUBD Z0, Z3, K7, Z13                             // 6271654ffae8
+       VPSUBD -7(CX)(DX*1), Z3, K7, Z13                   // 6271654ffaac11f9ffffff
+       VPSUBD -15(R14)(R15*4), Z3, K7, Z13                // 6211654ffaacbef1ffffff
+       VPSUBD Z3, Z26, K7, Z21                            // 62e12d47faeb
+       VPSUBD Z0, Z26, K7, Z21                            // 62e12d47fae8
+       VPSUBD -7(CX)(DX*1), Z26, K7, Z21                  // 62e12d47faac11f9ffffff
+       VPSUBD -15(R14)(R15*4), Z26, K7, Z21               // 62812d47faacbef1ffffff
+       VPSUBD Z3, Z3, K7, Z21                             // 62e1654ffaeb
+       VPSUBD Z0, Z3, K7, Z21                             // 62e1654ffae8
+       VPSUBD -7(CX)(DX*1), Z3, K7, Z21                   // 62e1654ffaac11f9ffffff
+       VPSUBD -15(R14)(R15*4), Z3, K7, Z21                // 6281654ffaacbef1ffffff
+       VPSUBQ X16, X0, K4, X15                            // 6231fd0cfbf8
+       VPSUBQ -17(BP)(SI*8), X0, K4, X15                  // 6271fd0cfbbcf5efffffff
+       VPSUBQ (R15), X0, K4, X15                          // 6251fd0cfb3f
+       VPSUBQ Y24, Y18, K4, Y13                           // 6211ed24fbe8
+       VPSUBQ 99(R15)(R15*4), Y18, K4, Y13                // 6211ed24fbacbf63000000
+       VPSUBQ 15(DX), Y18, K4, Y13                        // 6271ed24fbaa0f000000
+       VPSUBQ Z3, Z11, K7, Z21                            // 62e1a54ffbeb
+       VPSUBQ Z12, Z11, K7, Z21                           // 62c1a54ffbec
+       VPSUBQ 15(DX)(BX*1), Z11, K7, Z21                  // 62e1a54ffbac1a0f000000
+       VPSUBQ -7(CX)(DX*2), Z11, K7, Z21                  // 62e1a54ffbac51f9ffffff
+       VPSUBQ Z3, Z25, K7, Z21                            // 62e1b547fbeb
+       VPSUBQ Z12, Z25, K7, Z21                           // 62c1b547fbec
+       VPSUBQ 15(DX)(BX*1), Z25, K7, Z21                  // 62e1b547fbac1a0f000000
+       VPSUBQ -7(CX)(DX*2), Z25, K7, Z21                  // 62e1b547fbac51f9ffffff
+       VPSUBQ Z3, Z11, K7, Z13                            // 6271a54ffbeb
+       VPSUBQ Z12, Z11, K7, Z13                           // 6251a54ffbec
+       VPSUBQ 15(DX)(BX*1), Z11, K7, Z13                  // 6271a54ffbac1a0f000000
+       VPSUBQ -7(CX)(DX*2), Z11, K7, Z13                  // 6271a54ffbac51f9ffffff
+       VPSUBQ Z3, Z25, K7, Z13                            // 6271b547fbeb
+       VPSUBQ Z12, Z25, K7, Z13                           // 6251b547fbec
+       VPSUBQ 15(DX)(BX*1), Z25, K7, Z13                  // 6271b547fbac1a0f000000
+       VPSUBQ -7(CX)(DX*2), Z25, K7, Z13                  // 6271b547fbac51f9ffffff
+       VPTERNLOGD $42, X5, X14, K1, X12                   // 62730d0925e52a
+       VPTERNLOGD $42, (AX), X14, K1, X12                 // 62730d0925202a
+       VPTERNLOGD $42, 7(SI), X14, K1, X12                // 62730d0925a6070000002a
+       VPTERNLOGD $79, Y12, Y26, K1, Y11                  // 62532d2125dc4f
+       VPTERNLOGD $79, 17(SP)(BP*2), Y26, K1, Y11         // 62732d21259c6c110000004f
+       VPTERNLOGD $79, -7(DI)(R8*4), Y26, K1, Y11         // 62332d21259c87f9ffffff4f
+       VPTERNLOGD $64, Z0, Z7, K7, Z3                     // 62f3454f25d840
+       VPTERNLOGD $64, Z6, Z7, K7, Z3                     // 62f3454f25de40
+       VPTERNLOGD $64, 7(AX)(CX*4), Z7, K7, Z3            // 62f3454f259c880700000040
+       VPTERNLOGD $64, 7(AX)(CX*1), Z7, K7, Z3            // 62f3454f259c080700000040
+       VPTERNLOGD $64, Z0, Z9, K7, Z3                     // 62f3354f25d840
+       VPTERNLOGD $64, Z6, Z9, K7, Z3                     // 62f3354f25de40
+       VPTERNLOGD $64, 7(AX)(CX*4), Z9, K7, Z3            // 62f3354f259c880700000040
+       VPTERNLOGD $64, 7(AX)(CX*1), Z9, K7, Z3            // 62f3354f259c080700000040
+       VPTERNLOGD $64, Z0, Z7, K7, Z27                    // 6263454f25d840
+       VPTERNLOGD $64, Z6, Z7, K7, Z27                    // 6263454f25de40
+       VPTERNLOGD $64, 7(AX)(CX*4), Z7, K7, Z27           // 6263454f259c880700000040
+       VPTERNLOGD $64, 7(AX)(CX*1), Z7, K7, Z27           // 6263454f259c080700000040
+       VPTERNLOGD $64, Z0, Z9, K7, Z27                    // 6263354f25d840
+       VPTERNLOGD $64, Z6, Z9, K7, Z27                    // 6263354f25de40
+       VPTERNLOGD $64, 7(AX)(CX*4), Z9, K7, Z27           // 6263354f259c880700000040
+       VPTERNLOGD $64, 7(AX)(CX*1), Z9, K7, Z27           // 6263354f259c080700000040
+       VPTERNLOGQ $27, X8, X15, K2, X17                   // 62c3850a25c81b
+       VPTERNLOGQ $27, (BX), X15, K2, X17                 // 62e3850a250b1b
+       VPTERNLOGQ $27, -17(BP)(SI*1), X15, K2, X17        // 62e3850a258c35efffffff1b
+       VPTERNLOGQ $47, Y31, Y18, K4, Y14                  // 6213ed2425f72f
+       VPTERNLOGQ $47, 15(R8), Y18, K4, Y14               // 6253ed2425b00f0000002f
+       VPTERNLOGQ $47, (BP), Y18, K4, Y14                 // 6273ed242575002f
+       VPTERNLOGQ $82, Z9, Z3, K1, Z20                    // 62c3e54925e152
+       VPTERNLOGQ $82, Z19, Z3, K1, Z20                   // 62a3e54925e352
+       VPTERNLOGQ $82, (SI), Z3, K1, Z20                  // 62e3e549252652
+       VPTERNLOGQ $82, 7(SI)(DI*2), Z3, K1, Z20           // 62e3e54925a47e0700000052
+       VPTERNLOGQ $82, Z9, Z30, K1, Z20                   // 62c38d4125e152
+       VPTERNLOGQ $82, Z19, Z30, K1, Z20                  // 62a38d4125e352
+       VPTERNLOGQ $82, (SI), Z30, K1, Z20                 // 62e38d41252652
+       VPTERNLOGQ $82, 7(SI)(DI*2), Z30, K1, Z20          // 62e38d4125a47e0700000052
+       VPTERNLOGQ $82, Z9, Z3, K1, Z28                    // 6243e54925e152
+       VPTERNLOGQ $82, Z19, Z3, K1, Z28                   // 6223e54925e352
+       VPTERNLOGQ $82, (SI), Z3, K1, Z28                  // 6263e549252652
+       VPTERNLOGQ $82, 7(SI)(DI*2), Z3, K1, Z28           // 6263e54925a47e0700000052
+       VPTERNLOGQ $82, Z9, Z30, K1, Z28                   // 62438d4125e152
+       VPTERNLOGQ $82, Z19, Z30, K1, Z28                  // 62238d4125e352
+       VPTERNLOGQ $82, (SI), Z30, K1, Z28                 // 62638d41252652
+       VPTERNLOGQ $82, 7(SI)(DI*2), Z30, K1, Z28          // 62638d4125a47e0700000052
+       VPTESTMD X13, X23, K7, K4                          // 62d2450727e5
+       VPTESTMD (R8), X23, K7, K4                         // 62d245072720
+       VPTESTMD 15(DX)(BX*2), X23, K7, K4                 // 62f2450727a45a0f000000
+       VPTESTMD X13, X23, K7, K6                          // 62d2450727f5
+       VPTESTMD (R8), X23, K7, K6                         // 62d245072730
+       VPTESTMD 15(DX)(BX*2), X23, K7, K6                 // 62f2450727b45a0f000000
+       VPTESTMD Y2, Y24, K7, K0                           // 62f23d2727c2
+       VPTESTMD -15(R14)(R15*1), Y24, K7, K0              // 62923d2727843ef1ffffff
+       VPTESTMD -15(BX), Y24, K7, K0                      // 62f23d272783f1ffffff
+       VPTESTMD Y2, Y24, K7, K7                           // 62f23d2727fa
+       VPTESTMD -15(R14)(R15*1), Y24, K7, K7              // 62923d2727bc3ef1ffffff
+       VPTESTMD -15(BX), Y24, K7, K7                      // 62f23d2727bbf1ffffff
+       VPTESTMD Z2, Z18, K6, K5                           // 62f26d4627ea
+       VPTESTMD Z21, Z18, K6, K5                          // 62b26d4627ed
+       VPTESTMD 7(SI)(DI*4), Z18, K6, K5                  // 62f26d4627acbe07000000
+       VPTESTMD -7(DI)(R8*2), Z18, K6, K5                 // 62b26d4627ac47f9ffffff
+       VPTESTMD Z2, Z24, K6, K5                           // 62f23d4627ea
+       VPTESTMD Z21, Z24, K6, K5                          // 62b23d4627ed
+       VPTESTMD 7(SI)(DI*4), Z24, K6, K5                  // 62f23d4627acbe07000000
+       VPTESTMD -7(DI)(R8*2), Z24, K6, K5                 // 62b23d4627ac47f9ffffff
+       VPTESTMD Z2, Z18, K6, K4                           // 62f26d4627e2
+       VPTESTMD Z21, Z18, K6, K4                          // 62b26d4627e5
+       VPTESTMD 7(SI)(DI*4), Z18, K6, K4                  // 62f26d4627a4be07000000
+       VPTESTMD -7(DI)(R8*2), Z18, K6, K4                 // 62b26d4627a447f9ffffff
+       VPTESTMD Z2, Z24, K6, K4                           // 62f23d4627e2
+       VPTESTMD Z21, Z24, K6, K4                          // 62b23d4627e5
+       VPTESTMD 7(SI)(DI*4), Z24, K6, K4                  // 62f23d4627a4be07000000
+       VPTESTMD -7(DI)(R8*2), Z24, K6, K4                 // 62b23d4627a447f9ffffff
+       VPTESTMQ X24, X28, K3, K4                          // 62929d0327e0
+       VPTESTMQ 17(SP)(BP*1), X28, K3, K4                 // 62f29d0327a42c11000000
+       VPTESTMQ -7(CX)(DX*8), X28, K3, K4                 // 62f29d0327a4d1f9ffffff
+       VPTESTMQ X24, X28, K3, K6                          // 62929d0327f0
+       VPTESTMQ 17(SP)(BP*1), X28, K3, K6                 // 62f29d0327b42c11000000
+       VPTESTMQ -7(CX)(DX*8), X28, K3, K6                 // 62f29d0327b4d1f9ffffff
+       VPTESTMQ Y21, Y7, K7, K1                           // 62b2c52f27cd
+       VPTESTMQ 7(AX)(CX*4), Y7, K7, K1                   // 62f2c52f278c8807000000
+       VPTESTMQ 7(AX)(CX*1), Y7, K7, K1                   // 62f2c52f278c0807000000
+       VPTESTMQ Y21, Y7, K7, K3                           // 62b2c52f27dd
+       VPTESTMQ 7(AX)(CX*4), Y7, K7, K3                   // 62f2c52f279c8807000000
+       VPTESTMQ 7(AX)(CX*1), Y7, K7, K3                   // 62f2c52f279c0807000000
+       VPTESTMQ Z6, Z7, K4, K6                            // 62f2c54c27f6
+       VPTESTMQ Z16, Z7, K4, K6                           // 62b2c54c27f0
+       VPTESTMQ 17(SP), Z7, K4, K6                        // 62f2c54c27b42411000000
+       VPTESTMQ -17(BP)(SI*4), Z7, K4, K6                 // 62f2c54c27b4b5efffffff
+       VPTESTMQ Z6, Z13, K4, K6                           // 62f2954c27f6
+       VPTESTMQ Z16, Z13, K4, K6                          // 62b2954c27f0
+       VPTESTMQ 17(SP), Z13, K4, K6                       // 62f2954c27b42411000000
+       VPTESTMQ -17(BP)(SI*4), Z13, K4, K6                // 62f2954c27b4b5efffffff
+       VPTESTMQ Z6, Z7, K4, K7                            // 62f2c54c27fe
+       VPTESTMQ Z16, Z7, K4, K7                           // 62b2c54c27f8
+       VPTESTMQ 17(SP), Z7, K4, K7                        // 62f2c54c27bc2411000000
+       VPTESTMQ -17(BP)(SI*4), Z7, K4, K7                 // 62f2c54c27bcb5efffffff
+       VPTESTMQ Z6, Z13, K4, K7                           // 62f2954c27fe
+       VPTESTMQ Z16, Z13, K4, K7                          // 62b2954c27f8
+       VPTESTMQ 17(SP), Z13, K4, K7                       // 62f2954c27bc2411000000
+       VPTESTMQ -17(BP)(SI*4), Z13, K4, K7                // 62f2954c27bcb5efffffff
+       VPTESTNMD X1, X21, K2, K1                          // 62f2560227c9
+       VPTESTNMD (R14), X21, K2, K1                       // 62d25602270e
+       VPTESTNMD -7(DI)(R8*8), X21, K2, K1                // 62b25602278cc7f9ffffff
+       VPTESTNMD X1, X21, K2, K5                          // 62f2560227e9
+       VPTESTNMD (R14), X21, K2, K5                       // 62d25602272e
+       VPTESTNMD -7(DI)(R8*8), X21, K2, K5                // 62b2560227acc7f9ffffff
+       VPTESTNMD Y1, Y24, K2, K3                          // 62f23e2227d9
+       VPTESTNMD 7(SI)(DI*4), Y24, K2, K3                 // 62f23e22279cbe07000000
+       VPTESTNMD -7(DI)(R8*2), Y24, K2, K3                // 62b23e22279c47f9ffffff
+       VPTESTNMD Y1, Y24, K2, K1                          // 62f23e2227c9
+       VPTESTNMD 7(SI)(DI*4), Y24, K2, K1                 // 62f23e22278cbe07000000
+       VPTESTNMD -7(DI)(R8*2), Y24, K2, K1                // 62b23e22278c47f9ffffff
+       VPTESTNMD Z2, Z22, K3, K5                          // 62f24e4327ea
+       VPTESTNMD Z31, Z22, K3, K5                         // 62924e4327ef
+       VPTESTNMD -17(BP)(SI*8), Z22, K3, K5               // 62f24e4327acf5efffffff
+       VPTESTNMD (R15), Z22, K3, K5                       // 62d24e43272f
+       VPTESTNMD Z2, Z7, K3, K5                           // 62f2464b27ea
+       VPTESTNMD Z31, Z7, K3, K5                          // 6292464b27ef
+       VPTESTNMD -17(BP)(SI*8), Z7, K3, K5                // 62f2464b27acf5efffffff
+       VPTESTNMD (R15), Z7, K3, K5                        // 62d2464b272f
+       VPTESTNMD Z2, Z22, K3, K4                          // 62f24e4327e2
+       VPTESTNMD Z31, Z22, K3, K4                         // 62924e4327e7
+       VPTESTNMD -17(BP)(SI*8), Z22, K3, K4               // 62f24e4327a4f5efffffff
+       VPTESTNMD (R15), Z22, K3, K4                       // 62d24e432727
+       VPTESTNMD Z2, Z7, K3, K4                           // 62f2464b27e2
+       VPTESTNMD Z31, Z7, K3, K4                          // 6292464b27e7
+       VPTESTNMD -17(BP)(SI*8), Z7, K3, K4                // 62f2464b27a4f5efffffff
+       VPTESTNMD (R15), Z7, K3, K4                        // 62d2464b2727
+       VPTESTNMQ X31, X11, K3, K7                         // 6292a60b27ff
+       VPTESTNMQ 99(R15)(R15*4), X11, K3, K7              // 6292a60b27bcbf63000000
+       VPTESTNMQ 15(DX), X11, K3, K7                      // 62f2a60b27ba0f000000
+       VPTESTNMQ X31, X11, K3, K6                         // 6292a60b27f7
+       VPTESTNMQ 99(R15)(R15*4), X11, K3, K6              // 6292a60b27b4bf63000000
+       VPTESTNMQ 15(DX), X11, K3, K6                      // 62f2a60b27b20f000000
+       VPTESTNMQ Y18, Y5, K3, K4                          // 62b2d62b27e2
+       VPTESTNMQ 17(SP), Y5, K3, K4                       // 62f2d62b27a42411000000
+       VPTESTNMQ -17(BP)(SI*4), Y5, K3, K4                // 62f2d62b27a4b5efffffff
+       VPTESTNMQ Y18, Y5, K3, K6                          // 62b2d62b27f2
+       VPTESTNMQ 17(SP), Y5, K3, K6                       // 62f2d62b27b42411000000
+       VPTESTNMQ -17(BP)(SI*4), Y5, K3, K6                // 62f2d62b27b4b5efffffff
+       VPTESTNMQ Z1, Z20, K2, K0                          // 62f2de4227c1
+       VPTESTNMQ Z3, Z20, K2, K0                          // 62f2de4227c3
+       VPTESTNMQ 7(SI)(DI*8), Z20, K2, K0                 // 62f2de422784fe07000000
+       VPTESTNMQ -15(R14), Z20, K2, K0                    // 62d2de422786f1ffffff
+       VPTESTNMQ Z1, Z9, K2, K0                           // 62f2b64a27c1
+       VPTESTNMQ Z3, Z9, K2, K0                           // 62f2b64a27c3
+       VPTESTNMQ 7(SI)(DI*8), Z9, K2, K0                  // 62f2b64a2784fe07000000
+       VPTESTNMQ -15(R14), Z9, K2, K0                     // 62d2b64a2786f1ffffff
+       VPTESTNMQ Z1, Z20, K2, K7                          // 62f2de4227f9
+       VPTESTNMQ Z3, Z20, K2, K7                          // 62f2de4227fb
+       VPTESTNMQ 7(SI)(DI*8), Z20, K2, K7                 // 62f2de4227bcfe07000000
+       VPTESTNMQ -15(R14), Z20, K2, K7                    // 62d2de4227bef1ffffff
+       VPTESTNMQ Z1, Z9, K2, K7                           // 62f2b64a27f9
+       VPTESTNMQ Z3, Z9, K2, K7                           // 62f2b64a27fb
+       VPTESTNMQ 7(SI)(DI*8), Z9, K2, K7                  // 62f2b64a27bcfe07000000
+       VPTESTNMQ -15(R14), Z9, K2, K7                     // 62d2b64a27bef1ffffff
+       VPUNPCKHDQ X9, X7, K1, X20                         // 62c145096ae1
+       VPUNPCKHDQ -7(CX)(DX*1), X7, K1, X20               // 62e145096aa411f9ffffff
+       VPUNPCKHDQ -15(R14)(R15*4), X7, K1, X20            // 628145096aa4bef1ffffff
+       VPUNPCKHDQ Y11, Y8, K7, Y1                         // 62d13d2f6acb
+       VPUNPCKHDQ -17(BP)(SI*8), Y8, K7, Y1               // 62f13d2f6a8cf5efffffff
+       VPUNPCKHDQ (R15), Y8, K7, Y1                       // 62d13d2f6a0f
+       VPUNPCKHDQ Z3, Z5, K2, Z19                         // 62e1554a6adb
+       VPUNPCKHDQ Z5, Z5, K2, Z19                         // 62e1554a6add
+       VPUNPCKHDQ -7(CX), Z5, K2, Z19                     // 62e1554a6a99f9ffffff
+       VPUNPCKHDQ 15(DX)(BX*4), Z5, K2, Z19               // 62e1554a6a9c9a0f000000
+       VPUNPCKHDQ Z3, Z1, K2, Z19                         // 62e1754a6adb
+       VPUNPCKHDQ Z5, Z1, K2, Z19                         // 62e1754a6add
+       VPUNPCKHDQ -7(CX), Z1, K2, Z19                     // 62e1754a6a99f9ffffff
+       VPUNPCKHDQ 15(DX)(BX*4), Z1, K2, Z19               // 62e1754a6a9c9a0f000000
+       VPUNPCKHDQ Z3, Z5, K2, Z15                         // 6271554a6afb
+       VPUNPCKHDQ Z5, Z5, K2, Z15                         // 6271554a6afd
+       VPUNPCKHDQ -7(CX), Z5, K2, Z15                     // 6271554a6ab9f9ffffff
+       VPUNPCKHDQ 15(DX)(BX*4), Z5, K2, Z15               // 6271554a6abc9a0f000000
+       VPUNPCKHDQ Z3, Z1, K2, Z15                         // 6271754a6afb
+       VPUNPCKHDQ Z5, Z1, K2, Z15                         // 6271754a6afd
+       VPUNPCKHDQ -7(CX), Z1, K2, Z15                     // 6271754a6ab9f9ffffff
+       VPUNPCKHDQ 15(DX)(BX*4), Z1, K2, Z15               // 6271754a6abc9a0f000000
+       VPUNPCKHQDQ X5, X14, K4, X7                        // 62f18d0c6dfd
+       VPUNPCKHQDQ 15(DX)(BX*1), X14, K4, X7              // 62f18d0c6dbc1a0f000000
+       VPUNPCKHQDQ -7(CX)(DX*2), X14, K4, X7              // 62f18d0c6dbc51f9ffffff
+       VPUNPCKHQDQ Y16, Y17, K1, Y27                      // 6221f5216dd8
+       VPUNPCKHQDQ 7(SI)(DI*8), Y17, K1, Y27              // 6261f5216d9cfe07000000
+       VPUNPCKHQDQ -15(R14), Y17, K1, Y27                 // 6241f5216d9ef1ffffff
+       VPUNPCKHQDQ Z16, Z21, K3, Z14                      // 6231d5436df0
+       VPUNPCKHQDQ Z9, Z21, K3, Z14                       // 6251d5436df1
+       VPUNPCKHQDQ 99(R15)(R15*8), Z21, K3, Z14           // 6211d5436db4ff63000000
+       VPUNPCKHQDQ 7(AX)(CX*8), Z21, K3, Z14              // 6271d5436db4c807000000
+       VPUNPCKHQDQ Z16, Z8, K3, Z14                       // 6231bd4b6df0
+       VPUNPCKHQDQ Z9, Z8, K3, Z14                        // 6251bd4b6df1
+       VPUNPCKHQDQ 99(R15)(R15*8), Z8, K3, Z14            // 6211bd4b6db4ff63000000
+       VPUNPCKHQDQ 7(AX)(CX*8), Z8, K3, Z14               // 6271bd4b6db4c807000000
+       VPUNPCKHQDQ Z16, Z21, K3, Z15                      // 6231d5436df8
+       VPUNPCKHQDQ Z9, Z21, K3, Z15                       // 6251d5436df9
+       VPUNPCKHQDQ 99(R15)(R15*8), Z21, K3, Z15           // 6211d5436dbcff63000000
+       VPUNPCKHQDQ 7(AX)(CX*8), Z21, K3, Z15              // 6271d5436dbcc807000000
+       VPUNPCKHQDQ Z16, Z8, K3, Z15                       // 6231bd4b6df8
+       VPUNPCKHQDQ Z9, Z8, K3, Z15                        // 6251bd4b6df9
+       VPUNPCKHQDQ 99(R15)(R15*8), Z8, K3, Z15            // 6211bd4b6dbcff63000000
+       VPUNPCKHQDQ 7(AX)(CX*8), Z8, K3, Z15               // 6271bd4b6dbcc807000000
+       VPUNPCKLDQ X16, X30, K7, X0                        // 62b10d0762c0
+       VPUNPCKLDQ 15(R8), X30, K7, X0                     // 62d10d0762800f000000
+       VPUNPCKLDQ (BP), X30, K7, X0                       // 62f10d07624500
+       VPUNPCKLDQ Y14, Y23, K4, Y1                        // 62d1452462ce
+       VPUNPCKLDQ -7(CX), Y23, K4, Y1                     // 62f145246289f9ffffff
+       VPUNPCKLDQ 15(DX)(BX*4), Y23, K4, Y1               // 62f14524628c9a0f000000
+       VPUNPCKLDQ Z9, Z9, K4, Z9                          // 6251354c62c9
+       VPUNPCKLDQ Z28, Z9, K4, Z9                         // 6211354c62cc
+       VPUNPCKLDQ 15(R8)(R14*4), Z9, K4, Z9               // 6211354c628cb00f000000
+       VPUNPCKLDQ -7(CX)(DX*4), Z9, K4, Z9                // 6271354c628c91f9ffffff
+       VPUNPCKLDQ Z9, Z25, K4, Z9                         // 6251354462c9
+       VPUNPCKLDQ Z28, Z25, K4, Z9                        // 6211354462cc
+       VPUNPCKLDQ 15(R8)(R14*4), Z25, K4, Z9              // 62113544628cb00f000000
+       VPUNPCKLDQ -7(CX)(DX*4), Z25, K4, Z9               // 62713544628c91f9ffffff
+       VPUNPCKLDQ Z9, Z9, K4, Z3                          // 62d1354c62d9
+       VPUNPCKLDQ Z28, Z9, K4, Z3                         // 6291354c62dc
+       VPUNPCKLDQ 15(R8)(R14*4), Z9, K4, Z3               // 6291354c629cb00f000000
+       VPUNPCKLDQ -7(CX)(DX*4), Z9, K4, Z3                // 62f1354c629c91f9ffffff
+       VPUNPCKLDQ Z9, Z25, K4, Z3                         // 62d1354462d9
+       VPUNPCKLDQ Z28, Z25, K4, Z3                        // 6291354462dc
+       VPUNPCKLDQ 15(R8)(R14*4), Z25, K4, Z3              // 62913544629cb00f000000
+       VPUNPCKLDQ -7(CX)(DX*4), Z25, K4, Z3               // 62f13544629c91f9ffffff
+       VPUNPCKLQDQ X14, X11, K7, X14                      // 6251a50f6cf6
+       VPUNPCKLQDQ 15(R8)(R14*8), X11, K7, X14            // 6211a50f6cb4f00f000000
+       VPUNPCKLQDQ -15(R14)(R15*2), X11, K7, X14          // 6211a50f6cb47ef1ffffff
+       VPUNPCKLQDQ Y2, Y25, K2, Y31                       // 6261b5226cfa
+       VPUNPCKLQDQ 99(R15)(R15*8), Y25, K2, Y31           // 6201b5226cbcff63000000
+       VPUNPCKLQDQ 7(AX)(CX*8), Y25, K2, Y31              // 6261b5226cbcc807000000
+       VPUNPCKLQDQ Z17, Z17, K5, Z20                      // 62a1f5456ce1
+       VPUNPCKLQDQ Z23, Z17, K5, Z20                      // 62a1f5456ce7
+       VPUNPCKLQDQ (R8), Z17, K5, Z20                     // 62c1f5456c20
+       VPUNPCKLQDQ 15(DX)(BX*2), Z17, K5, Z20             // 62e1f5456ca45a0f000000
+       VPUNPCKLQDQ Z17, Z0, K5, Z20                       // 62a1fd4d6ce1
+       VPUNPCKLQDQ Z23, Z0, K5, Z20                       // 62a1fd4d6ce7
+       VPUNPCKLQDQ (R8), Z0, K5, Z20                      // 62c1fd4d6c20
+       VPUNPCKLQDQ 15(DX)(BX*2), Z0, K5, Z20              // 62e1fd4d6ca45a0f000000
+       VPUNPCKLQDQ Z17, Z17, K5, Z0                       // 62b1f5456cc1
+       VPUNPCKLQDQ Z23, Z17, K5, Z0                       // 62b1f5456cc7
+       VPUNPCKLQDQ (R8), Z17, K5, Z0                      // 62d1f5456c00
+       VPUNPCKLQDQ 15(DX)(BX*2), Z17, K5, Z0              // 62f1f5456c845a0f000000
+       VPUNPCKLQDQ Z17, Z0, K5, Z0                        // 62b1fd4d6cc1
+       VPUNPCKLQDQ Z23, Z0, K5, Z0                        // 62b1fd4d6cc7
+       VPUNPCKLQDQ (R8), Z0, K5, Z0                       // 62d1fd4d6c00
+       VPUNPCKLQDQ 15(DX)(BX*2), Z0, K5, Z0               // 62f1fd4d6c845a0f000000
+       VPXORD X12, X23, K2, X26                           // 62414502efd4
+       VPXORD 7(AX)(CX*4), X23, K2, X26                   // 62614502ef948807000000
+       VPXORD 7(AX)(CX*1), X23, K2, X26                   // 62614502ef940807000000
+       VPXORD Y9, Y22, K3, Y9                             // 62514d23efc9
+       VPXORD (BX), Y22, K3, Y9                           // 62714d23ef0b
+       VPXORD -17(BP)(SI*1), Y22, K3, Y9                  // 62714d23ef8c35efffffff
+       VPXORD Z30, Z20, K3, Z1                            // 62915d43efce
+       VPXORD Z5, Z20, K3, Z1                             // 62f15d43efcd
+       VPXORD -17(BP)(SI*2), Z20, K3, Z1                  // 62f15d43ef8c75efffffff
+       VPXORD 7(AX)(CX*2), Z20, K3, Z1                    // 62f15d43ef8c4807000000
+       VPXORD Z30, Z9, K3, Z1                             // 6291354befce
+       VPXORD Z5, Z9, K3, Z1                              // 62f1354befcd
+       VPXORD -17(BP)(SI*2), Z9, K3, Z1                   // 62f1354bef8c75efffffff
+       VPXORD 7(AX)(CX*2), Z9, K3, Z1                     // 62f1354bef8c4807000000
+       VPXORD Z30, Z20, K3, Z9                            // 62115d43efce
+       VPXORD Z5, Z20, K3, Z9                             // 62715d43efcd
+       VPXORD -17(BP)(SI*2), Z20, K3, Z9                  // 62715d43ef8c75efffffff
+       VPXORD 7(AX)(CX*2), Z20, K3, Z9                    // 62715d43ef8c4807000000
+       VPXORD Z30, Z9, K3, Z9                             // 6211354befce
+       VPXORD Z5, Z9, K3, Z9                              // 6271354befcd
+       VPXORD -17(BP)(SI*2), Z9, K3, Z9                   // 6271354bef8c75efffffff
+       VPXORD 7(AX)(CX*2), Z9, K3, Z9                     // 6271354bef8c4807000000
+       VPXORQ X23, X23, K3, X16                           // 62a1c503efc7
+       VPXORQ (SI), X23, K3, X16                          // 62e1c503ef06
+       VPXORQ 7(SI)(DI*2), X23, K3, X16                   // 62e1c503ef847e07000000
+       VPXORQ Y6, Y1, K2, Y14                             // 6271f52aeff6
+       VPXORQ 15(R8)(R14*4), Y1, K2, Y14                  // 6211f52aefb4b00f000000
+       VPXORQ -7(CX)(DX*4), Y1, K2, Y14                   // 6271f52aefb491f9ffffff
+       VPXORQ Z16, Z7, K1, Z26                            // 6221c549efd0
+       VPXORQ Z25, Z7, K1, Z26                            // 6201c549efd1
+       VPXORQ 15(R8)(R14*1), Z7, K1, Z26                  // 6201c549ef94300f000000
+       VPXORQ 15(R8)(R14*2), Z7, K1, Z26                  // 6201c549ef94700f000000
+       VPXORQ Z16, Z21, K1, Z26                           // 6221d541efd0
+       VPXORQ Z25, Z21, K1, Z26                           // 6201d541efd1
+       VPXORQ 15(R8)(R14*1), Z21, K1, Z26                 // 6201d541ef94300f000000
+       VPXORQ 15(R8)(R14*2), Z21, K1, Z26                 // 6201d541ef94700f000000
+       VPXORQ Z16, Z7, K1, Z22                            // 62a1c549eff0
+       VPXORQ Z25, Z7, K1, Z22                            // 6281c549eff1
+       VPXORQ 15(R8)(R14*1), Z7, K1, Z22                  // 6281c549efb4300f000000
+       VPXORQ 15(R8)(R14*2), Z7, K1, Z22                  // 6281c549efb4700f000000
+       VPXORQ Z16, Z21, K1, Z22                           // 62a1d541eff0
+       VPXORQ Z25, Z21, K1, Z22                           // 6281d541eff1
+       VPXORQ 15(R8)(R14*1), Z21, K1, Z22                 // 6281d541efb4300f000000
+       VPXORQ 15(R8)(R14*2), Z21, K1, Z22                 // 6281d541efb4700f000000
+       VRCP14PD X11, K5, X31                              // 6242fd0d4cfb
+       VRCP14PD 17(SP), K5, X31                           // 6262fd0d4cbc2411000000
+       VRCP14PD -17(BP)(SI*4), K5, X31                    // 6262fd0d4cbcb5efffffff
+       VRCP14PD Y23, K7, Y9                               // 6232fd2f4ccf
+       VRCP14PD -17(BP)(SI*2), K7, Y9                     // 6272fd2f4c8c75efffffff
+       VRCP14PD 7(AX)(CX*2), K7, Y9                       // 6272fd2f4c8c4807000000
+       VRCP14PD Z0, K7, Z6                                // 62f2fd4f4cf0
+       VRCP14PD Z8, K7, Z6                                // 62d2fd4f4cf0
+       VRCP14PD (CX), K7, Z6                              // 62f2fd4f4c31
+       VRCP14PD 99(R15), K7, Z6                           // 62d2fd4f4cb763000000
+       VRCP14PD Z0, K7, Z2                                // 62f2fd4f4cd0
+       VRCP14PD Z8, K7, Z2                                // 62d2fd4f4cd0
+       VRCP14PD (CX), K7, Z2                              // 62f2fd4f4c11
+       VRCP14PD 99(R15), K7, Z2                           // 62d2fd4f4c9763000000
+       VRCP14PS X5, K6, X22                               // 62e27d0e4cf5
+       VRCP14PS 7(AX), K6, X22                            // 62e27d0e4cb007000000
+       VRCP14PS (DI), K6, X22                             // 62e27d0e4c37
+       VRCP14PS Y5, K3, Y31                               // 62627d2b4cfd
+       VRCP14PS 15(R8)(R14*1), K3, Y31                    // 62027d2b4cbc300f000000
+       VRCP14PS 15(R8)(R14*2), K3, Y31                    // 62027d2b4cbc700f000000
+       VRCP14PS Z14, K7, Z15                              // 62527d4f4cfe
+       VRCP14PS Z27, K7, Z15                              // 62127d4f4cfb
+       VRCP14PS 99(R15)(R15*2), K7, Z15                   // 62127d4f4cbc7f63000000
+       VRCP14PS -7(DI), K7, Z15                           // 62727d4f4cbff9ffffff
+       VRCP14PS Z14, K7, Z12                              // 62527d4f4ce6
+       VRCP14PS Z27, K7, Z12                              // 62127d4f4ce3
+       VRCP14PS 99(R15)(R15*2), K7, Z12                   // 62127d4f4ca47f63000000
+       VRCP14PS -7(DI), K7, Z12                           // 62727d4f4ca7f9ffffff
+       VRCP14SD X17, X0, K4, X14                          // 6232fd0c4df1 or 6232fd2c4df1 or 6232fd4c4df1
+       VRCP14SD (SI), X0, K4, X14                         // 6272fd0c4d36 or 6272fd2c4d36 or 6272fd4c4d36
+       VRCP14SD 7(SI)(DI*2), X0, K4, X14                  // 6272fd0c4db47e07000000 or 6272fd2c4db47e07000000 or 6272fd4c4db47e07000000
+       VRCP14SS X11, X15, K4, X7                          // 62d2050c4dfb or 62d2052c4dfb or 62d2054c4dfb
+       VRCP14SS -7(DI)(R8*1), X15, K4, X7                 // 62b2050c4dbc07f9ffffff or 62b2052c4dbc07f9ffffff or 62b2054c4dbc07f9ffffff
+       VRCP14SS (SP), X15, K4, X7                         // 62f2050c4d3c24 or 62f2052c4d3c24 or 62f2054c4d3c24
+       VRNDSCALEPD $64, X16, K4, X20                      // 62a3fd0c09e040
+       VRNDSCALEPD $64, 7(SI)(DI*8), K4, X20              // 62e3fd0c09a4fe0700000040
+       VRNDSCALEPD $64, -15(R14), K4, X20                 // 62c3fd0c09a6f1ffffff40
+       VRNDSCALEPD $27, Y2, K1, Y28                       // 6263fd2909e21b
+       VRNDSCALEPD $27, (CX), K1, Y28                     // 6263fd2909211b
+       VRNDSCALEPD $27, 99(R15), K1, Y28                  // 6243fd2909a7630000001b
+       VRNDSCALEPD $47, Z21, K3, Z8                       // 6233fd4b09c52f
+       VRNDSCALEPD $47, Z5, K3, Z8                        // 6273fd4b09c52f
+       VRNDSCALEPD $47, Z21, K3, Z28                      // 6223fd4b09e52f
+       VRNDSCALEPD $47, Z5, K3, Z28                       // 6263fd4b09e52f
+       VRNDSCALEPD $82, Z12, K4, Z16                      // 62c3fd4c09c452
+       VRNDSCALEPD $82, Z27, K4, Z16                      // 6283fd4c09c352
+       VRNDSCALEPD $82, 15(R8), K4, Z16                   // 62c3fd4c09800f00000052
+       VRNDSCALEPD $82, (BP), K4, Z16                     // 62e3fd4c09450052
+       VRNDSCALEPD $82, Z12, K4, Z13                      // 6253fd4c09ec52
+       VRNDSCALEPD $82, Z27, K4, Z13                      // 6213fd4c09eb52
+       VRNDSCALEPD $82, 15(R8), K4, Z13                   // 6253fd4c09a80f00000052
+       VRNDSCALEPD $82, (BP), K4, Z13                     // 6273fd4c096d0052
+       VRNDSCALEPS $126, X6, K5, X12                      // 62737d0d08e67e
+       VRNDSCALEPS $126, 7(SI)(DI*1), K5, X12             // 62737d0d08a43e070000007e
+       VRNDSCALEPS $126, 15(DX)(BX*8), K5, X12            // 62737d0d08a4da0f0000007e
+       VRNDSCALEPS $94, Y27, K7, Y24                      // 62037d2f08c35e
+       VRNDSCALEPS $94, 99(R15)(R15*2), K7, Y24           // 62037d2f08847f630000005e
+       VRNDSCALEPS $94, -7(DI), K7, Y24                   // 62637d2f0887f9ffffff5e
+       VRNDSCALEPS $121, Z6, K7, Z22                      // 62e37d4f08f679
+       VRNDSCALEPS $121, Z8, K7, Z22                      // 62c37d4f08f079
+       VRNDSCALEPS $121, Z6, K7, Z11                      // 62737d4f08de79
+       VRNDSCALEPS $121, Z8, K7, Z11                      // 62537d4f08d879
+       VRNDSCALEPS $13, Z12, K6, Z25                      // 62437d4e08cc0d
+       VRNDSCALEPS $13, Z17, K6, Z25                      // 62237d4e08c90d
+       VRNDSCALEPS $13, 15(R8)(R14*8), K6, Z25            // 62037d4e088cf00f0000000d
+       VRNDSCALEPS $13, -15(R14)(R15*2), K6, Z25          // 62037d4e088c7ef1ffffff0d
+       VRNDSCALEPS $13, Z12, K6, Z12                      // 62537d4e08e40d
+       VRNDSCALEPS $13, Z17, K6, Z12                      // 62337d4e08e10d
+       VRNDSCALEPS $13, 15(R8)(R14*8), K6, Z12            // 62137d4e08a4f00f0000000d
+       VRNDSCALEPS $13, -15(R14)(R15*2), K6, Z12          // 62137d4e08a47ef1ffffff0d
+       VRNDSCALESD $65, X6, X28, K3, X17                  // 62e39d030bce41
+       VRNDSCALESD $67, X8, X8, K7, X1                    // 62d3bd0f0bc843 or 62d3bd2f0bc843 or 62d3bd4f0bc843
+       VRNDSCALESD $67, 17(SP), X8, K7, X1                // 62f3bd0f0b8c241100000043 or 62f3bd2f0b8c241100000043 or 62f3bd4f0b8c241100000043
+       VRNDSCALESD $67, -17(BP)(SI*4), X8, K7, X1         // 62f3bd0f0b8cb5efffffff43 or 62f3bd2f0b8cb5efffffff43 or 62f3bd4f0b8cb5efffffff43
+       VRNDSCALESS $127, X11, X0, K4, X6                  // 62d37d0c0af37f
+       VRNDSCALESS $0, X6, X6, K4, X16                    // 62e34d0c0ac600 or 62e34d2c0ac600 or 62e34d4c0ac600
+       VRNDSCALESS $0, (AX), X6, K4, X16                  // 62e34d0c0a0000 or 62e34d2c0a0000 or 62e34d4c0a0000
+       VRNDSCALESS $0, 7(SI), X6, K4, X16                 // 62e34d0c0a860700000000 or 62e34d2c0a860700000000 or 62e34d4c0a860700000000
+       VRSQRT14PD X12, K7, X22                            // 62c2fd0f4ef4
+       VRSQRT14PD -7(DI)(R8*1), K7, X22                   // 62a2fd0f4eb407f9ffffff
+       VRSQRT14PD (SP), K7, X22                           // 62e2fd0f4e3424
+       VRSQRT14PD Y11, K2, Y0                             // 62d2fd2a4ec3
+       VRSQRT14PD -7(CX)(DX*1), K2, Y0                    // 62f2fd2a4e8411f9ffffff
+       VRSQRT14PD -15(R14)(R15*4), K2, Y0                 // 6292fd2a4e84bef1ffffff
+       VRSQRT14PD Z6, K5, Z9                              // 6272fd4d4ece
+       VRSQRT14PD Z25, K5, Z9                             // 6212fd4d4ec9
+       VRSQRT14PD -15(R14)(R15*1), K5, Z9                 // 6212fd4d4e8c3ef1ffffff
+       VRSQRT14PD -15(BX), K5, Z9                         // 6272fd4d4e8bf1ffffff
+       VRSQRT14PD Z6, K5, Z12                             // 6272fd4d4ee6
+       VRSQRT14PD Z25, K5, Z12                            // 6212fd4d4ee1
+       VRSQRT14PD -15(R14)(R15*1), K5, Z12                // 6212fd4d4ea43ef1ffffff
+       VRSQRT14PD -15(BX), K5, Z12                        // 6272fd4d4ea3f1ffffff
+       VRSQRT14PS X28, K3, X16                            // 62827d0b4ec4
+       VRSQRT14PS -7(CX), K3, X16                         // 62e27d0b4e81f9ffffff
+       VRSQRT14PS 15(DX)(BX*4), K3, X16                   // 62e27d0b4e849a0f000000
+       VRSQRT14PS Y3, K4, Y31                             // 62627d2c4efb
+       VRSQRT14PS 15(DX)(BX*1), K4, Y31                   // 62627d2c4ebc1a0f000000
+       VRSQRT14PS -7(CX)(DX*2), K4, Y31                   // 62627d2c4ebc51f9ffffff
+       VRSQRT14PS Z8, K2, Z3                              // 62d27d4a4ed8
+       VRSQRT14PS Z2, K2, Z3                              // 62f27d4a4eda
+       VRSQRT14PS 7(AX)(CX*4), K2, Z3                     // 62f27d4a4e9c8807000000
+       VRSQRT14PS 7(AX)(CX*1), K2, Z3                     // 62f27d4a4e9c0807000000
+       VRSQRT14PS Z8, K2, Z21                             // 62c27d4a4ee8
+       VRSQRT14PS Z2, K2, Z21                             // 62e27d4a4eea
+       VRSQRT14PS 7(AX)(CX*4), K2, Z21                    // 62e27d4a4eac8807000000
+       VRSQRT14PS 7(AX)(CX*1), K2, Z21                    // 62e27d4a4eac0807000000
+       VRSQRT14SD X11, X15, K2, X8                        // 6252850a4fc3 or 6252852a4fc3 or 6252854a4fc3
+       VRSQRT14SD 7(AX), X15, K2, X8                      // 6272850a4f8007000000 or 6272852a4f8007000000 or 6272854a4f8007000000
+       VRSQRT14SD (DI), X15, K2, X8                       // 6272850a4f07 or 6272852a4f07 or 6272854a4f07
+       VRSQRT14SS X13, X19, K3, X1                        // 62d265034fcd or 62d265234fcd or 62d265434fcd
+       VRSQRT14SS (BX), X19, K3, X1                       // 62f265034f0b or 62f265234f0b or 62f265434f0b
+       VRSQRT14SS -17(BP)(SI*1), X19, K3, X1              // 62f265034f8c35efffffff or 62f265234f8c35efffffff or 62f265434f8c35efffffff
+       VSCALEFPD X27, X2, K1, X2                          // 6292ed092cd3
+       VSCALEFPD 99(R15)(R15*8), X2, K1, X2               // 6292ed092c94ff63000000
+       VSCALEFPD 7(AX)(CX*8), X2, K1, X2                  // 62f2ed092c94c807000000
+       VSCALEFPD Y13, Y2, K1, Y14                         // 6252ed292cf5
+       VSCALEFPD -17(BP), Y2, K1, Y14                     // 6272ed292cb5efffffff
+       VSCALEFPD -15(R14)(R15*8), Y2, K1, Y14             // 6212ed292cb4fef1ffffff
+       VSCALEFPD Z7, Z2, K7, Z18                          // 62e2ed4f2cd7
+       VSCALEFPD Z13, Z2, K7, Z18                         // 62c2ed4f2cd5
+       VSCALEFPD Z7, Z21, K7, Z18                         // 62e2d5472cd7
+       VSCALEFPD Z13, Z21, K7, Z18                        // 62c2d5472cd5
+       VSCALEFPD Z7, Z2, K7, Z24                          // 6262ed4f2cc7
+       VSCALEFPD Z13, Z2, K7, Z24                         // 6242ed4f2cc5
+       VSCALEFPD Z7, Z21, K7, Z24                         // 6262d5472cc7
+       VSCALEFPD Z13, Z21, K7, Z24                        // 6242d5472cc5
+       VSCALEFPD Z1, Z6, K2, Z6                           // 62f2cd4a2cf1
+       VSCALEFPD Z15, Z6, K2, Z6                          // 62d2cd4a2cf7
+       VSCALEFPD 7(SI)(DI*4), Z6, K2, Z6                  // 62f2cd4a2cb4be07000000
+       VSCALEFPD -7(DI)(R8*2), Z6, K2, Z6                 // 62b2cd4a2cb447f9ffffff
+       VSCALEFPD Z1, Z22, K2, Z6                          // 62f2cd422cf1
+       VSCALEFPD Z15, Z22, K2, Z6                         // 62d2cd422cf7
+       VSCALEFPD 7(SI)(DI*4), Z22, K2, Z6                 // 62f2cd422cb4be07000000
+       VSCALEFPD -7(DI)(R8*2), Z22, K2, Z6                // 62b2cd422cb447f9ffffff
+       VSCALEFPD Z1, Z6, K2, Z16                          // 62e2cd4a2cc1
+       VSCALEFPD Z15, Z6, K2, Z16                         // 62c2cd4a2cc7
+       VSCALEFPD 7(SI)(DI*4), Z6, K2, Z16                 // 62e2cd4a2c84be07000000
+       VSCALEFPD -7(DI)(R8*2), Z6, K2, Z16                // 62a2cd4a2c8447f9ffffff
+       VSCALEFPD Z1, Z22, K2, Z16                         // 62e2cd422cc1
+       VSCALEFPD Z15, Z22, K2, Z16                        // 62c2cd422cc7
+       VSCALEFPD 7(SI)(DI*4), Z22, K2, Z16                // 62e2cd422c84be07000000
+       VSCALEFPD -7(DI)(R8*2), Z22, K2, Z16               // 62a2cd422c8447f9ffffff
+       VSCALEFPS X30, X22, K4, X26                        // 62024d042cd6
+       VSCALEFPS (AX), X22, K4, X26                       // 62624d042c10
+       VSCALEFPS 7(SI), X22, K4, X26                      // 62624d042c9607000000
+       VSCALEFPS Y22, Y15, K1, Y27                        // 622205292cde
+       VSCALEFPS 17(SP)(BP*2), Y15, K1, Y27               // 626205292c9c6c11000000
+       VSCALEFPS -7(DI)(R8*4), Y15, K1, Y27               // 622205292c9c87f9ffffff
+       VSCALEFPS Z22, Z18, K3, Z13                        // 62326d432cee
+       VSCALEFPS Z7, Z18, K3, Z13                         // 62726d432cef
+       VSCALEFPS Z22, Z8, K3, Z13                         // 62323d4b2cee
+       VSCALEFPS Z7, Z8, K3, Z13                          // 62723d4b2cef
+       VSCALEFPS Z1, Z20, K4, Z2                          // 62f25d442cd1
+       VSCALEFPS Z3, Z20, K4, Z2                          // 62f25d442cd3
+       VSCALEFPS 17(SP), Z20, K4, Z2                      // 62f25d442c942411000000
+       VSCALEFPS -17(BP)(SI*4), Z20, K4, Z2               // 62f25d442c94b5efffffff
+       VSCALEFPS Z1, Z9, K4, Z2                           // 62f2354c2cd1
+       VSCALEFPS Z3, Z9, K4, Z2                           // 62f2354c2cd3
+       VSCALEFPS 17(SP), Z9, K4, Z2                       // 62f2354c2c942411000000
+       VSCALEFPS -17(BP)(SI*4), Z9, K4, Z2                // 62f2354c2c94b5efffffff
+       VSCALEFPS Z1, Z20, K4, Z31                         // 62625d442cf9
+       VSCALEFPS Z3, Z20, K4, Z31                         // 62625d442cfb
+       VSCALEFPS 17(SP), Z20, K4, Z31                     // 62625d442cbc2411000000
+       VSCALEFPS -17(BP)(SI*4), Z20, K4, Z31              // 62625d442cbcb5efffffff
+       VSCALEFPS Z1, Z9, K4, Z31                          // 6262354c2cf9
+       VSCALEFPS Z3, Z9, K4, Z31                          // 6262354c2cfb
+       VSCALEFPS 17(SP), Z9, K4, Z31                      // 6262354c2cbc2411000000
+       VSCALEFPS -17(BP)(SI*4), Z9, K4, Z31               // 6262354c2cbcb5efffffff
+       VSCALEFSD X15, X11, K5, X3                         // 62d2a50d2ddf
+       VSCALEFSD X6, X13, K7, X30                         // 6262950f2df6 or 6262952f2df6 or 6262954f2df6
+       VSCALEFSD -17(BP)(SI*8), X13, K7, X30              // 6262950f2db4f5efffffff or 6262952f2db4f5efffffff or 6262954f2db4f5efffffff
+       VSCALEFSD (R15), X13, K7, X30                      // 6242950f2d37 or 6242952f2d37 or 6242954f2d37
+       VSCALEFSS X30, X23, K7, X12                        // 621245072de6
+       VSCALEFSS X2, X20, K6, X8                          // 62725d062dc2 or 62725d262dc2 or 62725d462dc2
+       VSCALEFSS (R8), X20, K6, X8                        // 62525d062d00 or 62525d262d00 or 62525d462d00
+       VSCALEFSS 15(DX)(BX*2), X20, K6, X8                // 62725d062d845a0f000000 or 62725d262d845a0f000000 or 62725d462d845a0f000000
+       VSCATTERDPD X9, K3, (DX)(X10*4)                    // 6232fd0ba20c92
+       VSCATTERDPD X9, K3, (SP)(X4*2)                     // 6272fd0ba20c64
+       VSCATTERDPD X9, K3, (R14)(X29*8)                   // 6212fd03a20cee
+       VSCATTERDPD Y20, K7, (AX)(X4*1)                    // 62e2fd2fa22420
+       VSCATTERDPD Y20, K7, (BP)(X10*2)                   // 62a2fd2fa2645500
+       VSCATTERDPD Y20, K7, (R10)(X29*8)                  // 6282fd27a224ea
+       VSCATTERDPD Z12, K4, (R10)(Y29*8)                  // 6212fd44a224ea
+       VSCATTERDPD Z16, K4, (R10)(Y29*8)                  // 6282fd44a204ea
+       VSCATTERDPD Z12, K4, (SP)(Y4*2)                    // 6272fd4ca22464
+       VSCATTERDPD Z16, K4, (SP)(Y4*2)                    // 62e2fd4ca20464
+       VSCATTERDPD Z12, K4, (DX)(Y10*4)                   // 6232fd4ca22492
+       VSCATTERDPD Z16, K4, (DX)(Y10*4)                   // 62a2fd4ca20492
+       VSCATTERDPS X26, K4, (DX)(X10*4)                   // 62227d0ca21492
+       VSCATTERDPS X26, K4, (SP)(X4*2)                    // 62627d0ca21464
+       VSCATTERDPS X26, K4, (R14)(X29*8)                  // 62027d04a214ee
+       VSCATTERDPS Y18, K7, (R14)(Y29*8)                  // 62827d27a214ee
+       VSCATTERDPS Y18, K7, (AX)(Y4*1)                    // 62e27d2fa21420
+       VSCATTERDPS Y18, K7, (BP)(Y10*2)                   // 62a27d2fa2545500
+       VSCATTERDPS Z28, K2, (BP)(Z10*2)                   // 62227d4aa2645500
+       VSCATTERDPS Z13, K2, (BP)(Z10*2)                   // 62327d4aa26c5500
+       VSCATTERDPS Z28, K2, (R10)(Z29*8)                  // 62027d42a224ea
+       VSCATTERDPS Z13, K2, (R10)(Z29*8)                  // 62127d42a22cea
+       VSCATTERDPS Z28, K2, (R14)(Z29*8)                  // 62027d42a224ee
+       VSCATTERDPS Z13, K2, (R14)(Z29*8)                  // 62127d42a22cee
+       VSCATTERQPD X19, K2, (AX)(X4*1)                    // 62e2fd0aa31c20
+       VSCATTERQPD X19, K2, (BP)(X10*2)                   // 62a2fd0aa35c5500
+       VSCATTERQPD X19, K2, (R10)(X29*8)                  // 6282fd02a31cea
+       VSCATTERQPD Y24, K1, (R10)(Y29*8)                  // 6202fd21a304ea
+       VSCATTERQPD Y24, K1, (SP)(Y4*2)                    // 6262fd29a30464
+       VSCATTERQPD Y24, K1, (DX)(Y10*4)                   // 6222fd29a30492
+       VSCATTERQPD Z14, K2, (DX)(Z10*4)                   // 6232fd4aa33492
+       VSCATTERQPD Z28, K2, (DX)(Z10*4)                   // 6222fd4aa32492
+       VSCATTERQPD Z14, K2, (AX)(Z4*1)                    // 6272fd4aa33420
+       VSCATTERQPD Z28, K2, (AX)(Z4*1)                    // 6262fd4aa32420
+       VSCATTERQPD Z14, K2, (SP)(Z4*2)                    // 6272fd4aa33464
+       VSCATTERQPD Z28, K2, (SP)(Z4*2)                    // 6262fd4aa32464
+       VSCATTERQPS X0, K1, (DX)(X10*4)                    // 62b27d09a30492
+       VSCATTERQPS X0, K1, (SP)(X4*2)                     // 62f27d09a30464
+       VSCATTERQPS X0, K1, (R14)(X29*8)                   // 62927d01a304ee
+       VSCATTERQPS X31, K7, (R14)(Y29*8)                  // 62027d27a33cee
+       VSCATTERQPS X31, K7, (AX)(Y4*1)                    // 62627d2fa33c20
+       VSCATTERQPS X31, K7, (BP)(Y10*2)                   // 62227d2fa37c5500
+       VSCATTERQPS Y9, K1, (BP)(Z10*2)                    // 62327d49a34c5500
+       VSCATTERQPS Y9, K1, (R10)(Z29*8)                   // 62127d41a30cea
+       VSCATTERQPS Y9, K1, (R14)(Z29*8)                   // 62127d41a30cee
+       VSHUFF32X4 $97, Y23, Y19, K1, Y3                   // 62b3652123df61
+       VSHUFF32X4 $97, 15(R8), Y19, K1, Y3                // 62d3652123980f00000061
+       VSHUFF32X4 $97, (BP), Y19, K1, Y3                  // 62f36521235d0061
+       VSHUFF32X4 $81, Z19, Z15, K1, Z3                   // 62b3054923db51
+       VSHUFF32X4 $81, Z15, Z15, K1, Z3                   // 62d3054923df51
+       VSHUFF32X4 $81, 7(AX), Z15, K1, Z3                 // 62f3054923980700000051
+       VSHUFF32X4 $81, (DI), Z15, K1, Z3                  // 62f30549231f51
+       VSHUFF32X4 $81, Z19, Z30, K1, Z3                   // 62b30d4123db51
+       VSHUFF32X4 $81, Z15, Z30, K1, Z3                   // 62d30d4123df51
+       VSHUFF32X4 $81, 7(AX), Z30, K1, Z3                 // 62f30d4123980700000051
+       VSHUFF32X4 $81, (DI), Z30, K1, Z3                  // 62f30d41231f51
+       VSHUFF32X4 $81, Z19, Z15, K1, Z12                  // 6233054923e351
+       VSHUFF32X4 $81, Z15, Z15, K1, Z12                  // 6253054923e751
+       VSHUFF32X4 $81, 7(AX), Z15, K1, Z12                // 6273054923a00700000051
+       VSHUFF32X4 $81, (DI), Z15, K1, Z12                 // 62730549232751
+       VSHUFF32X4 $81, Z19, Z30, K1, Z12                  // 62330d4123e351
+       VSHUFF32X4 $81, Z15, Z30, K1, Z12                  // 62530d4123e751
+       VSHUFF32X4 $81, 7(AX), Z30, K1, Z12                // 62730d4123a00700000051
+       VSHUFF32X4 $81, (DI), Z30, K1, Z12                 // 62730d41232751
+       VSHUFF64X2 $42, Y21, Y14, K7, Y19                  // 62a38d2f23dd2a
+       VSHUFF64X2 $42, 15(R8)(R14*8), Y14, K7, Y19        // 62838d2f239cf00f0000002a
+       VSHUFF64X2 $42, -15(R14)(R15*2), Y14, K7, Y19      // 62838d2f239c7ef1ffffff2a
+       VSHUFF64X2 $79, Z14, Z3, K2, Z5                    // 62d3e54a23ee4f
+       VSHUFF64X2 $79, Z15, Z3, K2, Z5                    // 62d3e54a23ef4f
+       VSHUFF64X2 $79, 99(R15)(R15*1), Z3, K2, Z5         // 6293e54a23ac3f630000004f
+       VSHUFF64X2 $79, (DX), Z3, K2, Z5                   // 62f3e54a232a4f
+       VSHUFF64X2 $79, Z14, Z5, K2, Z5                    // 62d3d54a23ee4f
+       VSHUFF64X2 $79, Z15, Z5, K2, Z5                    // 62d3d54a23ef4f
+       VSHUFF64X2 $79, 99(R15)(R15*1), Z5, K2, Z5         // 6293d54a23ac3f630000004f
+       VSHUFF64X2 $79, (DX), Z5, K2, Z5                   // 62f3d54a232a4f
+       VSHUFF64X2 $79, Z14, Z3, K2, Z1                    // 62d3e54a23ce4f
+       VSHUFF64X2 $79, Z15, Z3, K2, Z1                    // 62d3e54a23cf4f
+       VSHUFF64X2 $79, 99(R15)(R15*1), Z3, K2, Z1         // 6293e54a238c3f630000004f
+       VSHUFF64X2 $79, (DX), Z3, K2, Z1                   // 62f3e54a230a4f
+       VSHUFF64X2 $79, Z14, Z5, K2, Z1                    // 62d3d54a23ce4f
+       VSHUFF64X2 $79, Z15, Z5, K2, Z1                    // 62d3d54a23cf4f
+       VSHUFF64X2 $79, 99(R15)(R15*1), Z5, K2, Z1         // 6293d54a238c3f630000004f
+       VSHUFF64X2 $79, (DX), Z5, K2, Z1                   // 62f3d54a230a4f
+       VSHUFI32X4 $64, Y2, Y16, K4, Y5                    // 62f37d2443ea40
+       VSHUFI32X4 $64, -15(R14)(R15*1), Y16, K4, Y5       // 62937d2443ac3ef1ffffff40
+       VSHUFI32X4 $64, -15(BX), Y16, K4, Y5               // 62f37d2443abf1ffffff40
+       VSHUFI32X4 $27, Z20, Z16, K1, Z21                  // 62a37d4143ec1b
+       VSHUFI32X4 $27, Z0, Z16, K1, Z21                   // 62e37d4143e81b
+       VSHUFI32X4 $27, -17(BP)(SI*8), Z16, K1, Z21        // 62e37d4143acf5efffffff1b
+       VSHUFI32X4 $27, (R15), Z16, K1, Z21                // 62c37d41432f1b
+       VSHUFI32X4 $27, Z20, Z9, K1, Z21                   // 62a3354943ec1b
+       VSHUFI32X4 $27, Z0, Z9, K1, Z21                    // 62e3354943e81b
+       VSHUFI32X4 $27, -17(BP)(SI*8), Z9, K1, Z21         // 62e3354943acf5efffffff1b
+       VSHUFI32X4 $27, (R15), Z9, K1, Z21                 // 62c33549432f1b
+       VSHUFI32X4 $27, Z20, Z16, K1, Z8                   // 62337d4143c41b
+       VSHUFI32X4 $27, Z0, Z16, K1, Z8                    // 62737d4143c01b
+       VSHUFI32X4 $27, -17(BP)(SI*8), Z16, K1, Z8         // 62737d414384f5efffffff1b
+       VSHUFI32X4 $27, (R15), Z16, K1, Z8                 // 62537d4143071b
+       VSHUFI32X4 $27, Z20, Z9, K1, Z8                    // 6233354943c41b
+       VSHUFI32X4 $27, Z0, Z9, K1, Z8                     // 6273354943c01b
+       VSHUFI32X4 $27, -17(BP)(SI*8), Z9, K1, Z8          // 627335494384f5efffffff1b
+       VSHUFI32X4 $27, (R15), Z9, K1, Z8                  // 6253354943071b
+       VSHUFI64X2 $47, Y6, Y20, K3, Y21                   // 62e3dd2343ee2f
+       VSHUFI64X2 $47, 7(AX)(CX*4), Y20, K3, Y21          // 62e3dd2343ac88070000002f
+       VSHUFI64X2 $47, 7(AX)(CX*1), Y20, K3, Y21          // 62e3dd2343ac08070000002f
+       VSHUFI64X2 $82, Z0, Z0, K4, Z23                    // 62e3fd4c43f852
+       VSHUFI64X2 $82, Z25, Z0, K4, Z23                   // 6283fd4c43f952
+       VSHUFI64X2 $82, 7(SI)(DI*8), Z0, K4, Z23           // 62e3fd4c43bcfe0700000052
+       VSHUFI64X2 $82, -15(R14), Z0, K4, Z23              // 62c3fd4c43bef1ffffff52
+       VSHUFI64X2 $82, Z0, Z11, K4, Z23                   // 62e3a54c43f852
+       VSHUFI64X2 $82, Z25, Z11, K4, Z23                  // 6283a54c43f952
+       VSHUFI64X2 $82, 7(SI)(DI*8), Z11, K4, Z23          // 62e3a54c43bcfe0700000052
+       VSHUFI64X2 $82, -15(R14), Z11, K4, Z23             // 62c3a54c43bef1ffffff52
+       VSHUFI64X2 $82, Z0, Z0, K4, Z19                    // 62e3fd4c43d852
+       VSHUFI64X2 $82, Z25, Z0, K4, Z19                   // 6283fd4c43d952
+       VSHUFI64X2 $82, 7(SI)(DI*8), Z0, K4, Z19           // 62e3fd4c439cfe0700000052
+       VSHUFI64X2 $82, -15(R14), Z0, K4, Z19              // 62c3fd4c439ef1ffffff52
+       VSHUFI64X2 $82, Z0, Z11, K4, Z19                   // 62e3a54c43d852
+       VSHUFI64X2 $82, Z25, Z11, K4, Z19                  // 6283a54c43d952
+       VSHUFI64X2 $82, 7(SI)(DI*8), Z11, K4, Z19          // 62e3a54c439cfe0700000052
+       VSHUFI64X2 $82, -15(R14), Z11, K4, Z19             // 62c3a54c439ef1ffffff52
+       VSHUFPD $126, X8, X7, K5, X16                      // 62c1c50dc6c07e
+       VSHUFPD $126, (BX), X7, K5, X16                    // 62e1c50dc6037e
+       VSHUFPD $126, -17(BP)(SI*1), X7, K5, X16           // 62e1c50dc68435efffffff7e
+       VSHUFPD $94, Y11, Y6, K7, Y31                      // 6241cd2fc6fb5e
+       VSHUFPD $94, (SI), Y6, K7, Y31                     // 6261cd2fc63e5e
+       VSHUFPD $94, 7(SI)(DI*2), Y6, K7, Y31              // 6261cd2fc6bc7e070000005e
+       VSHUFPD $121, Z9, Z0, K7, Z24                      // 6241fd4fc6c179
+       VSHUFPD $121, Z3, Z0, K7, Z24                      // 6261fd4fc6c379
+       VSHUFPD $121, 7(SI)(DI*1), Z0, K7, Z24             // 6261fd4fc6843e0700000079
+       VSHUFPD $121, 15(DX)(BX*8), Z0, K7, Z24            // 6261fd4fc684da0f00000079
+       VSHUFPD $121, Z9, Z26, K7, Z24                     // 6241ad47c6c179
+       VSHUFPD $121, Z3, Z26, K7, Z24                     // 6261ad47c6c379
+       VSHUFPD $121, 7(SI)(DI*1), Z26, K7, Z24            // 6261ad47c6843e0700000079
+       VSHUFPD $121, 15(DX)(BX*8), Z26, K7, Z24           // 6261ad47c684da0f00000079
+       VSHUFPD $121, Z9, Z0, K7, Z12                      // 6251fd4fc6e179
+       VSHUFPD $121, Z3, Z0, K7, Z12                      // 6271fd4fc6e379
+       VSHUFPD $121, 7(SI)(DI*1), Z0, K7, Z12             // 6271fd4fc6a43e0700000079
+       VSHUFPD $121, 15(DX)(BX*8), Z0, K7, Z12            // 6271fd4fc6a4da0f00000079
+       VSHUFPD $121, Z9, Z26, K7, Z12                     // 6251ad47c6e179
+       VSHUFPD $121, Z3, Z26, K7, Z12                     // 6271ad47c6e379
+       VSHUFPD $121, 7(SI)(DI*1), Z26, K7, Z12            // 6271ad47c6a43e0700000079
+       VSHUFPD $121, 15(DX)(BX*8), Z26, K7, Z12           // 6271ad47c6a4da0f00000079
+       VSHUFPS $13, X15, X0, K6, X1                       // 62d17c0ec6cf0d
+       VSHUFPS $13, 15(R8)(R14*4), X0, K6, X1             // 62917c0ec68cb00f0000000d
+       VSHUFPS $13, -7(CX)(DX*4), X0, K6, X1              // 62f17c0ec68c91f9ffffff0d
+       VSHUFPS $65, Y6, Y7, K3, Y19                       // 62e1442bc6de41
+       VSHUFPS $65, 17(SP)(BP*8), Y7, K3, Y19             // 62e1442bc69cec1100000041
+       VSHUFPS $65, 17(SP)(BP*4), Y7, K3, Y19             // 62e1442bc69cac1100000041
+       VSHUFPS $67, Z20, Z9, K7, Z9                       // 6231344fc6cc43
+       VSHUFPS $67, Z0, Z9, K7, Z9                        // 6271344fc6c843
+       VSHUFPS $67, -7(DI)(R8*1), Z9, K7, Z9              // 6231344fc68c07f9ffffff43
+       VSHUFPS $67, (SP), Z9, K7, Z9                      // 6271344fc60c2443
+       VSHUFPS $67, Z20, Z28, K7, Z9                      // 62311c47c6cc43
+       VSHUFPS $67, Z0, Z28, K7, Z9                       // 62711c47c6c843
+       VSHUFPS $67, -7(DI)(R8*1), Z28, K7, Z9             // 62311c47c68c07f9ffffff43
+       VSHUFPS $67, (SP), Z28, K7, Z9                     // 62711c47c60c2443
+       VSHUFPS $67, Z20, Z9, K7, Z25                      // 6221344fc6cc43
+       VSHUFPS $67, Z0, Z9, K7, Z25                       // 6261344fc6c843
+       VSHUFPS $67, -7(DI)(R8*1), Z9, K7, Z25             // 6221344fc68c07f9ffffff43
+       VSHUFPS $67, (SP), Z9, K7, Z25                     // 6261344fc60c2443
+       VSHUFPS $67, Z20, Z28, K7, Z25                     // 62211c47c6cc43
+       VSHUFPS $67, Z0, Z28, K7, Z25                      // 62611c47c6c843
+       VSHUFPS $67, -7(DI)(R8*1), Z28, K7, Z25            // 62211c47c68c07f9ffffff43
+       VSHUFPS $67, (SP), Z28, K7, Z25                    // 62611c47c60c2443
+       VSQRTPD X16, K4, X0                                // 62b1fd0c51c0
+       VSQRTPD (R8), K4, X0                               // 62d1fd0c5100
+       VSQRTPD 15(DX)(BX*2), K4, X0                       // 62f1fd0c51845a0f000000
+       VSQRTPD Y3, K4, Y0                                 // 62f1fd2c51c3
+       VSQRTPD 7(SI)(DI*4), K4, Y0                        // 62f1fd2c5184be07000000
+       VSQRTPD -7(DI)(R8*2), K4, Y0                       // 62b1fd2c518447f9ffffff
+       VSQRTPD Z17, K7, Z17                               // 62a1fd4f51c9
+       VSQRTPD Z23, K7, Z17                               // 62a1fd4f51cf
+       VSQRTPD Z17, K7, Z0                                // 62b1fd4f51c1
+       VSQRTPD Z23, K7, Z0                                // 62b1fd4f51c7
+       VSQRTPD Z21, K2, Z31                               // 6221fd4a51fd
+       VSQRTPD Z9, K2, Z31                                // 6241fd4a51f9
+       VSQRTPD -7(CX), K2, Z31                            // 6261fd4a51b9f9ffffff
+       VSQRTPD 15(DX)(BX*4), K2, Z31                      // 6261fd4a51bc9a0f000000
+       VSQRTPD Z21, K2, Z0                                // 62b1fd4a51c5
+       VSQRTPD Z9, K2, Z0                                 // 62d1fd4a51c1
+       VSQRTPD -7(CX), K2, Z0                             // 62f1fd4a5181f9ffffff
+       VSQRTPD 15(DX)(BX*4), K2, Z0                       // 62f1fd4a51849a0f000000
+       VSQRTPS X0, K5, X21                                // 62e17c0d51e8
+       VSQRTPS 17(SP)(BP*1), K5, X21                      // 62e17c0d51ac2c11000000
+       VSQRTPS -7(CX)(DX*8), K5, X21                      // 62e17c0d51acd1f9ffffff
+       VSQRTPS Y20, K3, Y5                                // 62b17c2b51ec
+       VSQRTPS 17(SP), K3, Y5                             // 62f17c2b51ac2411000000
+       VSQRTPS -17(BP)(SI*4), K3, Y5                      // 62f17c2b51acb5efffffff
+       VSQRTPS Z1, K4, Z6                                 // 62f17c4c51f1
+       VSQRTPS Z9, K4, Z6                                 // 62d17c4c51f1
+       VSQRTPS Z1, K4, Z9                                 // 62717c4c51c9
+       VSQRTPS Z9, K4, Z9                                 // 62517c4c51c9
+       VSQRTPS Z30, K2, Z20                               // 62817c4a51e6
+       VSQRTPS Z5, K2, Z20                                // 62e17c4a51e5
+       VSQRTPS 99(R15)(R15*8), K2, Z20                    // 62817c4a51a4ff63000000
+       VSQRTPS 7(AX)(CX*8), K2, Z20                       // 62e17c4a51a4c807000000
+       VSQRTPS Z30, K2, Z9                                // 62117c4a51ce
+       VSQRTPS Z5, K2, Z9                                 // 62717c4a51cd
+       VSQRTPS 99(R15)(R15*8), K2, Z9                     // 62117c4a518cff63000000
+       VSQRTPS 7(AX)(CX*8), K2, Z9                        // 62717c4a518cc807000000
+       VSQRTSD X7, X22, K2, X28                           // 6261cf0251e7
+       VSQRTSD X16, X7, K3, X19                           // 62a1c70b51d8 or 62a1c72b51d8 or 62a1c74b51d8
+       VSQRTSD 7(SI)(DI*8), X7, K3, X19                   // 62e1c70b519cfe07000000 or 62e1c72b519cfe07000000 or 62e1c74b519cfe07000000
+       VSQRTSD -15(R14), X7, K3, X19                      // 62c1c70b519ef1ffffff or 62c1c72b519ef1ffffff or 62c1c74b519ef1ffffff
+       VSQRTSS X7, X1, K3, X31                            // 6261760b51ff
+       VSQRTSS X12, X15, K3, X9                           // 6251060b51cc or 6251062b51cc or 6251064b51cc
+       VSQRTSS 17(SP)(BP*1), X15, K3, X9                  // 6271060b518c2c11000000 or 6271062b518c2c11000000 or 6271064b518c2c11000000
+       VSQRTSS -7(CX)(DX*8), X15, K3, X9                  // 6271060b518cd1f9ffffff or 6271062b518cd1f9ffffff or 6271064b518cd1f9ffffff
+       VSUBPD X14, X12, K2, X0                            // 62d19d0a5cc6
+       VSUBPD -17(BP)(SI*2), X12, K2, X0                  // 62f19d0a5c8475efffffff
+       VSUBPD 7(AX)(CX*2), X12, K2, X0                    // 62f19d0a5c844807000000
+       VSUBPD Y5, Y3, K1, Y12                             // 6271e5295ce5
+       VSUBPD 7(AX), Y3, K1, Y12                          // 6271e5295ca007000000
+       VSUBPD (DI), Y3, K1, Y12                           // 6271e5295c27
+       VSUBPD Z16, Z7, K2, Z26                            // 6221c54a5cd0
+       VSUBPD Z25, Z7, K2, Z26                            // 6201c54a5cd1
+       VSUBPD Z16, Z21, K2, Z26                           // 6221d5425cd0
+       VSUBPD Z25, Z21, K2, Z26                           // 6201d5425cd1
+       VSUBPD Z16, Z7, K2, Z22                            // 62a1c54a5cf0
+       VSUBPD Z25, Z7, K2, Z22                            // 6281c54a5cf1
+       VSUBPD Z16, Z21, K2, Z22                           // 62a1d5425cf0
+       VSUBPD Z25, Z21, K2, Z22                           // 6281d5425cf1
+       VSUBPD Z21, Z12, K1, Z14                           // 62319d495cf5
+       VSUBPD Z9, Z12, K1, Z14                            // 62519d495cf1
+       VSUBPD (AX), Z12, K1, Z14                          // 62719d495c30
+       VSUBPD 7(SI), Z12, K1, Z14                         // 62719d495cb607000000
+       VSUBPD Z21, Z13, K1, Z14                           // 623195495cf5
+       VSUBPD Z9, Z13, K1, Z14                            // 625195495cf1
+       VSUBPD (AX), Z13, K1, Z14                          // 627195495c30
+       VSUBPD 7(SI), Z13, K1, Z14                         // 627195495cb607000000
+       VSUBPD Z21, Z12, K1, Z13                           // 62319d495ced
+       VSUBPD Z9, Z12, K1, Z13                            // 62519d495ce9
+       VSUBPD (AX), Z12, K1, Z13                          // 62719d495c28
+       VSUBPD 7(SI), Z12, K1, Z13                         // 62719d495cae07000000
+       VSUBPD Z21, Z13, K1, Z13                           // 623195495ced
+       VSUBPD Z9, Z13, K1, Z13                            // 625195495ce9
+       VSUBPD (AX), Z13, K1, Z13                          // 627195495c28
+       VSUBPD 7(SI), Z13, K1, Z13                         // 627195495cae07000000
+       VSUBPS X15, X17, K7, X5                            // 62d174075cef
+       VSUBPS 15(R8)(R14*1), X17, K7, X5                  // 629174075cac300f000000
+       VSUBPS 15(R8)(R14*2), X17, K7, X5                  // 629174075cac700f000000
+       VSUBPS Y0, Y7, K1, Y28                             // 626144295ce0
+       VSUBPS 99(R15)(R15*1), Y7, K1, Y28                 // 620144295ca43f63000000
+       VSUBPS (DX), Y7, K1, Y28                           // 626144295c22
+       VSUBPS Z23, Z27, K1, Z2                            // 62b124415cd7
+       VSUBPS Z9, Z27, K1, Z2                             // 62d124415cd1
+       VSUBPS Z23, Z25, K1, Z2                            // 62b134415cd7
+       VSUBPS Z9, Z25, K1, Z2                             // 62d134415cd1
+       VSUBPS Z23, Z27, K1, Z7                            // 62b124415cff
+       VSUBPS Z9, Z27, K1, Z7                             // 62d124415cf9
+       VSUBPS Z23, Z25, K1, Z7                            // 62b134415cff
+       VSUBPS Z9, Z25, K1, Z7                             // 62d134415cf9
+       VSUBPS Z14, Z3, K1, Z27                            // 624164495cde
+       VSUBPS Z7, Z3, K1, Z27                             // 626164495cdf
+       VSUBPS (BX), Z3, K1, Z27                           // 626164495c1b
+       VSUBPS -17(BP)(SI*1), Z3, K1, Z27                  // 626164495c9c35efffffff
+       VSUBPS Z14, Z0, K1, Z27                            // 62417c495cde
+       VSUBPS Z7, Z0, K1, Z27                             // 62617c495cdf
+       VSUBPS (BX), Z0, K1, Z27                           // 62617c495c1b
+       VSUBPS -17(BP)(SI*1), Z0, K1, Z27                  // 62617c495c9c35efffffff
+       VSUBPS Z14, Z3, K1, Z14                            // 625164495cf6
+       VSUBPS Z7, Z3, K1, Z14                             // 627164495cf7
+       VSUBPS (BX), Z3, K1, Z14                           // 627164495c33
+       VSUBPS -17(BP)(SI*1), Z3, K1, Z14                  // 627164495cb435efffffff
+       VSUBPS Z14, Z0, K1, Z14                            // 62517c495cf6
+       VSUBPS Z7, Z0, K1, Z14                             // 62717c495cf7
+       VSUBPS (BX), Z0, K1, Z14                           // 62717c495c33
+       VSUBPS -17(BP)(SI*1), Z0, K1, Z14                  // 62717c495cb435efffffff
+       VSUBSD X26, X3, K7, X8                             // 6211e70f5cc2
+       VSUBSD X28, X13, K2, X23                           // 6281970a5cfc or 6281972a5cfc or 6281974a5cfc
+       VSUBSD 7(SI)(DI*1), X13, K2, X23                   // 62e1970a5cbc3e07000000 or 62e1972a5cbc3e07000000 or 62e1974a5cbc3e07000000
+       VSUBSD 15(DX)(BX*8), X13, K2, X23                  // 62e1970a5cbcda0f000000 or 62e1972a5cbcda0f000000 or 62e1974a5cbcda0f000000
+       VSUBSS X15, X9, K4, X24                            // 6241360c5cc7
+       VSUBSS X21, X18, K1, X26                           // 62216e015cd5 or 62216e215cd5 or 62216e415cd5
+       VSUBSS -17(BP)(SI*2), X18, K1, X26                 // 62616e015c9475efffffff or 62616e215c9475efffffff or 62616e415c9475efffffff
+       VSUBSS 7(AX)(CX*2), X18, K1, X26                   // 62616e015c944807000000 or 62616e215c944807000000 or 62616e415c944807000000
+       VUCOMISD X3, X31                                   // 6261fd082efb or 6261fd282efb or 6261fd482efb
+       VUCOMISD -7(DI)(R8*1), X31                         // 6221fd082ebc07f9ffffff or 6221fd282ebc07f9ffffff or 6221fd482ebc07f9ffffff
+       VUCOMISD (SP), X31                                 // 6261fd082e3c24 or 6261fd282e3c24 or 6261fd482e3c24
+       VUCOMISS X24, X0                                   // 62917c082ec0 or 62917c282ec0 or 62917c482ec0
+       VUNPCKHPD X9, X7, K3, X20                          // 62c1c50b15e1
+       VUNPCKHPD (R14), X7, K3, X20                       // 62c1c50b1526
+       VUNPCKHPD -7(DI)(R8*8), X7, K3, X20                // 62a1c50b15a4c7f9ffffff
+       VUNPCKHPD Y12, Y13, K4, Y22                        // 62c1952c15f4
+       VUNPCKHPD -17(BP)(SI*8), Y13, K4, Y22              // 62e1952c15b4f5efffffff
+       VUNPCKHPD (R15), Y13, K4, Y22                      // 62c1952c1537
+       VUNPCKHPD Z1, Z22, K5, Z8                          // 6271cd4515c1
+       VUNPCKHPD Z16, Z22, K5, Z8                         // 6231cd4515c0
+       VUNPCKHPD 15(R8)(R14*4), Z22, K5, Z8               // 6211cd451584b00f000000
+       VUNPCKHPD -7(CX)(DX*4), Z22, K5, Z8                // 6271cd45158491f9ffffff
+       VUNPCKHPD Z1, Z25, K5, Z8                          // 6271b54515c1
+       VUNPCKHPD Z16, Z25, K5, Z8                         // 6231b54515c0
+       VUNPCKHPD 15(R8)(R14*4), Z25, K5, Z8               // 6211b5451584b00f000000
+       VUNPCKHPD -7(CX)(DX*4), Z25, K5, Z8                // 6271b545158491f9ffffff
+       VUNPCKHPD Z1, Z22, K5, Z24                         // 6261cd4515c1
+       VUNPCKHPD Z16, Z22, K5, Z24                        // 6221cd4515c0
+       VUNPCKHPD 15(R8)(R14*4), Z22, K5, Z24              // 6201cd451584b00f000000
+       VUNPCKHPD -7(CX)(DX*4), Z22, K5, Z24               // 6261cd45158491f9ffffff
+       VUNPCKHPD Z1, Z25, K5, Z24                         // 6261b54515c1
+       VUNPCKHPD Z16, Z25, K5, Z24                        // 6221b54515c0
+       VUNPCKHPD 15(R8)(R14*4), Z25, K5, Z24              // 6201b5451584b00f000000
+       VUNPCKHPD -7(CX)(DX*4), Z25, K5, Z24               // 6261b545158491f9ffffff
+       VUNPCKHPS X5, X14, K7, X7                          // 62f10c0f15fd
+       VUNPCKHPS 99(R15)(R15*4), X14, K7, X7              // 62910c0f15bcbf63000000
+       VUNPCKHPS 15(DX), X14, K7, X7                      // 62f10c0f15ba0f000000
+       VUNPCKHPS Y17, Y14, K7, Y1                         // 62b10c2f15c9
+       VUNPCKHPS 7(SI)(DI*8), Y14, K7, Y1                 // 62f10c2f158cfe07000000
+       VUNPCKHPS -15(R14), Y14, K7, Y1                    // 62d10c2f158ef1ffffff
+       VUNPCKHPS Z15, Z0, K6, Z6                          // 62d17c4e15f7
+       VUNPCKHPS Z12, Z0, K6, Z6                          // 62d17c4e15f4
+       VUNPCKHPS (R8), Z0, K6, Z6                         // 62d17c4e1530
+       VUNPCKHPS 15(DX)(BX*2), Z0, K6, Z6                 // 62f17c4e15b45a0f000000
+       VUNPCKHPS Z15, Z8, K6, Z6                          // 62d13c4e15f7
+       VUNPCKHPS Z12, Z8, K6, Z6                          // 62d13c4e15f4
+       VUNPCKHPS (R8), Z8, K6, Z6                         // 62d13c4e1530
+       VUNPCKHPS 15(DX)(BX*2), Z8, K6, Z6                 // 62f13c4e15b45a0f000000
+       VUNPCKHPS Z15, Z0, K6, Z2                          // 62d17c4e15d7
+       VUNPCKHPS Z12, Z0, K6, Z2                          // 62d17c4e15d4
+       VUNPCKHPS (R8), Z0, K6, Z2                         // 62d17c4e1510
+       VUNPCKHPS 15(DX)(BX*2), Z0, K6, Z2                 // 62f17c4e15945a0f000000
+       VUNPCKHPS Z15, Z8, K6, Z2                          // 62d13c4e15d7
+       VUNPCKHPS Z12, Z8, K6, Z2                          // 62d13c4e15d4
+       VUNPCKHPS (R8), Z8, K6, Z2                         // 62d13c4e1510
+       VUNPCKHPS 15(DX)(BX*2), Z8, K6, Z2                 // 62f13c4e15945a0f000000
+       VUNPCKLPD X21, X3, K3, X31                         // 6221e50b14fd
+       VUNPCKLPD (CX), X3, K3, X31                        // 6261e50b1439
+       VUNPCKLPD 99(R15), X3, K3, X31                     // 6241e50b14bf63000000
+       VUNPCKLPD Y31, Y9, K7, Y7                          // 6291b52f14ff
+       VUNPCKLPD 7(SI)(DI*1), Y9, K7, Y7                  // 62f1b52f14bc3e07000000
+       VUNPCKLPD 15(DX)(BX*8), Y9, K7, Y7                 // 62f1b52f14bcda0f000000
+       VUNPCKLPD Z13, Z11, K4, Z14                        // 6251a54c14f5
+       VUNPCKLPD Z14, Z11, K4, Z14                        // 6251a54c14f6
+       VUNPCKLPD 17(SP)(BP*1), Z11, K4, Z14               // 6271a54c14b42c11000000
+       VUNPCKLPD -7(CX)(DX*8), Z11, K4, Z14               // 6271a54c14b4d1f9ffffff
+       VUNPCKLPD Z13, Z5, K4, Z14                         // 6251d54c14f5
+       VUNPCKLPD Z14, Z5, K4, Z14                         // 6251d54c14f6
+       VUNPCKLPD 17(SP)(BP*1), Z5, K4, Z14                // 6271d54c14b42c11000000
+       VUNPCKLPD -7(CX)(DX*8), Z5, K4, Z14                // 6271d54c14b4d1f9ffffff
+       VUNPCKLPD Z13, Z11, K4, Z27                        // 6241a54c14dd
+       VUNPCKLPD Z14, Z11, K4, Z27                        // 6241a54c14de
+       VUNPCKLPD 17(SP)(BP*1), Z11, K4, Z27               // 6261a54c149c2c11000000
+       VUNPCKLPD -7(CX)(DX*8), Z11, K4, Z27               // 6261a54c149cd1f9ffffff
+       VUNPCKLPD Z13, Z5, K4, Z27                         // 6241d54c14dd
+       VUNPCKLPD Z14, Z5, K4, Z27                         // 6241d54c14de
+       VUNPCKLPD 17(SP)(BP*1), Z5, K4, Z27                // 6261d54c149c2c11000000
+       VUNPCKLPD -7(CX)(DX*8), Z5, K4, Z27                // 6261d54c149cd1f9ffffff
+       VUNPCKLPS X13, X11, K4, X1                         // 62d1240c14cd
+       VUNPCKLPS 99(R15)(R15*2), X11, K4, X1              // 6291240c148c7f63000000
+       VUNPCKLPS -7(DI), X11, K4, X1                      // 62f1240c148ff9ffffff
+       VUNPCKLPS Y28, Y1, K7, Y8                          // 6211742f14c4
+       VUNPCKLPS -7(DI)(R8*1), Y1, K7, Y8                 // 6231742f148407f9ffffff
+       VUNPCKLPS (SP), Y1, K7, Y8                         // 6271742f140424
+       VUNPCKLPS Z6, Z2, K2, Z5                           // 62f16c4a14ee
+       VUNPCKLPS Z14, Z2, K2, Z5                          // 62d16c4a14ee
+       VUNPCKLPS -17(BP)(SI*2), Z2, K2, Z5                // 62f16c4a14ac75efffffff
+       VUNPCKLPS 7(AX)(CX*2), Z2, K2, Z5                  // 62f16c4a14ac4807000000
+       VUNPCKLPS Z6, Z2, K2, Z23                          // 62e16c4a14fe
+       VUNPCKLPS Z14, Z2, K2, Z23                         // 62c16c4a14fe
+       VUNPCKLPS -17(BP)(SI*2), Z2, K2, Z23               // 62e16c4a14bc75efffffff
+       VUNPCKLPS 7(AX)(CX*2), Z2, K2, Z23                 // 62e16c4a14bc4807000000
        RET
index 869fa66f7d756fe6cd0a00ebd1216e8ae576713d..1b3cce7217bed4495340d96270cf374eb15bba9b 100644 (file)
@@ -3,52 +3,52 @@
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_avx512pf(SB), NOSPLIT, $0
-       //TODO: VGATHERPF0DPD K5, (R10)(Y29*8)                     // 6292fd45c60cea
-       //TODO: VGATHERPF0DPD K5, (SP)(Y4*2)                       // 62f2fd4dc60c64
-       //TODO: VGATHERPF0DPD K5, (DX)(Y10*4)                      // 62b2fd4dc60c92
-       //TODO: VGATHERPF0DPS K3, (BP)(Z10*2)                      // 62b27d4bc64c5500
-       //TODO: VGATHERPF0DPS K3, (R10)(Z29*8)                     // 62927d43c60cea
-       //TODO: VGATHERPF0DPS K3, (R14)(Z29*8)                     // 62927d43c60cee
-       //TODO: VGATHERPF0QPD K4, (DX)(Z10*4)                      // 62b2fd4cc70c92
-       //TODO: VGATHERPF0QPD K4, (AX)(Z4*1)                       // 62f2fd4cc70c20
-       //TODO: VGATHERPF0QPD K4, (SP)(Z4*2)                       // 62f2fd4cc70c64
-       //TODO: VGATHERPF0QPS K2, (BP)(Z10*2)                      // 62b27d4ac74c5500
-       //TODO: VGATHERPF0QPS K2, (R10)(Z29*8)                     // 62927d42c70cea
-       //TODO: VGATHERPF0QPS K2, (R14)(Z29*8)                     // 62927d42c70cee
-       //TODO: VGATHERPF1DPD K2, (R14)(Y29*8)                     // 6292fd42c614ee
-       //TODO: VGATHERPF1DPD K2, (AX)(Y4*1)                       // 62f2fd4ac61420
-       //TODO: VGATHERPF1DPD K2, (BP)(Y10*2)                      // 62b2fd4ac6545500
-       //TODO: VGATHERPF1DPS K3, (DX)(Z10*4)                      // 62b27d4bc61492
-       //TODO: VGATHERPF1DPS K3, (AX)(Z4*1)                       // 62f27d4bc61420
-       //TODO: VGATHERPF1DPS K3, (SP)(Z4*2)                       // 62f27d4bc61464
-       //TODO: VGATHERPF1QPD K3, (DX)(Z10*4)                      // 62b2fd4bc71492
-       //TODO: VGATHERPF1QPD K3, (AX)(Z4*1)                       // 62f2fd4bc71420
-       //TODO: VGATHERPF1QPD K3, (SP)(Z4*2)                       // 62f2fd4bc71464
-       //TODO: VGATHERPF1QPS K3, (BP)(Z10*2)                      // 62b27d4bc7545500
-       //TODO: VGATHERPF1QPS K3, (R10)(Z29*8)                     // 62927d43c714ea
-       //TODO: VGATHERPF1QPS K3, (R14)(Z29*8)                     // 62927d43c714ee
-       //TODO: VSCATTERPF0DPD K5, (R10)(Y29*8)                    // 6292fd45c62cea
-       //TODO: VSCATTERPF0DPD K5, (SP)(Y4*2)                      // 62f2fd4dc62c64
-       //TODO: VSCATTERPF0DPD K5, (DX)(Y10*4)                     // 62b2fd4dc62c92
-       //TODO: VSCATTERPF0DPS K3, (DX)(Z10*4)                     // 62b27d4bc62c92
-       //TODO: VSCATTERPF0DPS K3, (AX)(Z4*1)                      // 62f27d4bc62c20
-       //TODO: VSCATTERPF0DPS K3, (SP)(Z4*2)                      // 62f27d4bc62c64
-       //TODO: VSCATTERPF0QPD K4, (DX)(Z10*4)                     // 62b2fd4cc72c92
-       //TODO: VSCATTERPF0QPD K4, (AX)(Z4*1)                      // 62f2fd4cc72c20
-       //TODO: VSCATTERPF0QPD K4, (SP)(Z4*2)                      // 62f2fd4cc72c64
-       //TODO: VSCATTERPF0QPS K2, (BP)(Z10*2)                     // 62b27d4ac76c5500
-       //TODO: VSCATTERPF0QPS K2, (R10)(Z29*8)                    // 62927d42c72cea
-       //TODO: VSCATTERPF0QPS K2, (R14)(Z29*8)                    // 62927d42c72cee
-       //TODO: VSCATTERPF1DPD K2, (R14)(Y29*8)                    // 6292fd42c634ee
-       //TODO: VSCATTERPF1DPD K2, (AX)(Y4*1)                      // 62f2fd4ac63420
-       //TODO: VSCATTERPF1DPD K2, (BP)(Y10*2)                     // 62b2fd4ac6745500
-       //TODO: VSCATTERPF1DPS K3, (BP)(Z10*2)                     // 62b27d4bc6745500
-       //TODO: VSCATTERPF1DPS K3, (R10)(Z29*8)                    // 62927d43c634ea
-       //TODO: VSCATTERPF1DPS K3, (R14)(Z29*8)                    // 62927d43c634ee
-       //TODO: VSCATTERPF1QPD K3, (DX)(Z10*4)                     // 62b2fd4bc73492
-       //TODO: VSCATTERPF1QPD K3, (AX)(Z4*1)                      // 62f2fd4bc73420
-       //TODO: VSCATTERPF1QPD K3, (SP)(Z4*2)                      // 62f2fd4bc73464
-       //TODO: VSCATTERPF1QPS K3, (BP)(Z10*2)                     // 62b27d4bc7745500
-       //TODO: VSCATTERPF1QPS K3, (R10)(Z29*8)                    // 62927d43c734ea
-       //TODO: VSCATTERPF1QPS K3, (R14)(Z29*8)                    // 62927d43c734ee
+       VGATHERPF0DPD K5, (R10)(Y29*8)                     // 6292fd45c60cea
+       VGATHERPF0DPD K5, (SP)(Y4*2)                       // 62f2fd4dc60c64
+       VGATHERPF0DPD K5, (DX)(Y10*4)                      // 62b2fd4dc60c92
+       VGATHERPF0DPS K3, (BP)(Z10*2)                      // 62b27d4bc64c5500
+       VGATHERPF0DPS K3, (R10)(Z29*8)                     // 62927d43c60cea
+       VGATHERPF0DPS K3, (R14)(Z29*8)                     // 62927d43c60cee
+       VGATHERPF0QPD K4, (DX)(Z10*4)                      // 62b2fd4cc70c92
+       VGATHERPF0QPD K4, (AX)(Z4*1)                       // 62f2fd4cc70c20
+       VGATHERPF0QPD K4, (SP)(Z4*2)                       // 62f2fd4cc70c64
+       VGATHERPF0QPS K2, (BP)(Z10*2)                      // 62b27d4ac74c5500
+       VGATHERPF0QPS K2, (R10)(Z29*8)                     // 62927d42c70cea
+       VGATHERPF0QPS K2, (R14)(Z29*8)                     // 62927d42c70cee
+       VGATHERPF1DPD K2, (R14)(Y29*8)                     // 6292fd42c614ee
+       VGATHERPF1DPD K2, (AX)(Y4*1)                       // 62f2fd4ac61420
+       VGATHERPF1DPD K2, (BP)(Y10*2)                      // 62b2fd4ac6545500
+       VGATHERPF1DPS K3, (DX)(Z10*4)                      // 62b27d4bc61492
+       VGATHERPF1DPS K3, (AX)(Z4*1)                       // 62f27d4bc61420
+       VGATHERPF1DPS K3, (SP)(Z4*2)                       // 62f27d4bc61464
+       VGATHERPF1QPD K3, (DX)(Z10*4)                      // 62b2fd4bc71492
+       VGATHERPF1QPD K3, (AX)(Z4*1)                       // 62f2fd4bc71420
+       VGATHERPF1QPD K3, (SP)(Z4*2)                       // 62f2fd4bc71464
+       VGATHERPF1QPS K3, (BP)(Z10*2)                      // 62b27d4bc7545500
+       VGATHERPF1QPS K3, (R10)(Z29*8)                     // 62927d43c714ea
+       VGATHERPF1QPS K3, (R14)(Z29*8)                     // 62927d43c714ee
+       VSCATTERPF0DPD K5, (R10)(Y29*8)                    // 6292fd45c62cea
+       VSCATTERPF0DPD K5, (SP)(Y4*2)                      // 62f2fd4dc62c64
+       VSCATTERPF0DPD K5, (DX)(Y10*4)                     // 62b2fd4dc62c92
+       VSCATTERPF0DPS K3, (DX)(Z10*4)                     // 62b27d4bc62c92
+       VSCATTERPF0DPS K3, (AX)(Z4*1)                      // 62f27d4bc62c20
+       VSCATTERPF0DPS K3, (SP)(Z4*2)                      // 62f27d4bc62c64
+       VSCATTERPF0QPD K4, (DX)(Z10*4)                     // 62b2fd4cc72c92
+       VSCATTERPF0QPD K4, (AX)(Z4*1)                      // 62f2fd4cc72c20
+       VSCATTERPF0QPD K4, (SP)(Z4*2)                      // 62f2fd4cc72c64
+       VSCATTERPF0QPS K2, (BP)(Z10*2)                     // 62b27d4ac76c5500
+       VSCATTERPF0QPS K2, (R10)(Z29*8)                    // 62927d42c72cea
+       VSCATTERPF0QPS K2, (R14)(Z29*8)                    // 62927d42c72cee
+       VSCATTERPF1DPD K2, (R14)(Y29*8)                    // 6292fd42c634ee
+       VSCATTERPF1DPD K2, (AX)(Y4*1)                      // 62f2fd4ac63420
+       VSCATTERPF1DPD K2, (BP)(Y10*2)                     // 62b2fd4ac6745500
+       VSCATTERPF1DPS K3, (BP)(Z10*2)                     // 62b27d4bc6745500
+       VSCATTERPF1DPS K3, (R10)(Z29*8)                    // 62927d43c634ea
+       VSCATTERPF1DPS K3, (R14)(Z29*8)                    // 62927d43c634ee
+       VSCATTERPF1QPD K3, (DX)(Z10*4)                     // 62b2fd4bc73492
+       VSCATTERPF1QPD K3, (AX)(Z4*1)                      // 62f2fd4bc73420
+       VSCATTERPF1QPD K3, (SP)(Z4*2)                      // 62f2fd4bc73464
+       VSCATTERPF1QPS K3, (BP)(Z10*2)                     // 62b27d4bc7745500
+       VSCATTERPF1QPS K3, (R10)(Z29*8)                    // 62927d43c734ea
+       VSCATTERPF1QPS K3, (R14)(Z29*8)                    // 62927d43c734ee
        RET
index fbb464744cdf183e160dc0c607c17f07af9b7dde..9df5f0ed5249e3e7995f723affcd987139974bfb 100644 (file)
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_gfni_avx512f(SB), NOSPLIT, $0
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X31, K3, X26            // 62438503cfd040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X31, K3, X26            // 62638503cfd140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X31, K3, X26            // 62638503cfd040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X26       // 62638503cf95efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X26 // 62038503cf94fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X16, K3, X26            // 6243fd03cfd040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X16, K3, X26            // 6263fd03cfd140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X16, K3, X26            // 6263fd03cfd040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X26       // 6263fd03cf95efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X26 // 6203fd03cf94fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X7, K3, X26             // 6243c50bcfd040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X7, K3, X26             // 6263c50bcfd140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X7, K3, X26             // 6263c50bcfd040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X26        // 6263c50bcf95efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X26 // 6203c50bcf94fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X31, K3, X19            // 62c38503cfd840
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X31, K3, X19            // 62e38503cfd940
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X31, K3, X19            // 62e38503cfd840
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X19       // 62e38503cf9defffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X19 // 62838503cf9cfef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X16, K3, X19            // 62c3fd03cfd840
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X16, K3, X19            // 62e3fd03cfd940
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X16, K3, X19            // 62e3fd03cfd840
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X19       // 62e3fd03cf9defffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X19 // 6283fd03cf9cfef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X7, K3, X19             // 62c3c50bcfd840
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X7, K3, X19             // 62e3c50bcfd940
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X7, K3, X19             // 62e3c50bcfd840
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X19        // 62e3c50bcf9defffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X19 // 6283c50bcf9cfef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X31, K3, X0             // 62d38503cfc040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X31, K3, X0             // 62f38503cfc140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X31, K3, X0             // 62f38503cfc040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X0        // 62f38503cf85efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X0 // 62938503cf84fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X16, K3, X0             // 62d3fd03cfc040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X16, K3, X0             // 62f3fd03cfc140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X16, K3, X0             // 62f3fd03cfc040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X0        // 62f3fd03cf85efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X0 // 6293fd03cf84fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, X8, X7, K3, X0              // 62d3c50bcfc040
-       //TODO: VGF2P8AFFINEINVQB $64, X1, X7, K3, X0              // 62f3c50bcfc140
-       //TODO: VGF2P8AFFINEINVQB $64, X0, X7, K3, X0              // 62f3c50bcfc040
-       //TODO: VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X0         // 62f3c50bcf85efffffff40
-       //TODO: VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X0 // 6293c50bcf84fef1ffffff40
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y0             // 62f3dd23cfc51b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y0            // 6293dd23cfc41b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y0             // 62f3dd23cfc71b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y0           // 62f3dd23cf031b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y0  // 62f3dd23cf8435efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y0             // 62f39d2bcfc51b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y0            // 62939d2bcfc41b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y0             // 62f39d2bcfc71b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y0           // 62f39d2bcf031b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y0  // 62f39d2bcf8435efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y0              // 62f3e52bcfc51b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y0             // 6293e52bcfc41b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y0              // 62f3e52bcfc71b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y0            // 62f3e52bcf031b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y0   // 62f3e52bcf8435efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y3             // 62f3dd23cfdd1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y3            // 6293dd23cfdc1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y3             // 62f3dd23cfdf1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y3           // 62f3dd23cf1b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y3  // 62f3dd23cf9c35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y3             // 62f39d2bcfdd1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y3            // 62939d2bcfdc1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y3             // 62f39d2bcfdf1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y3           // 62f39d2bcf1b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y3  // 62f39d2bcf9c35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y3              // 62f3e52bcfdd1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y3             // 6293e52bcfdc1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y3              // 62f3e52bcfdf1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y3            // 62f3e52bcf1b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y3   // 62f3e52bcf9c35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y5             // 62f3dd23cfed1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y5            // 6293dd23cfec1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y5             // 62f3dd23cfef1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y5           // 62f3dd23cf2b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y5  // 62f3dd23cfac35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y5             // 62f39d2bcfed1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y5            // 62939d2bcfec1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y5             // 62f39d2bcfef1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y5           // 62f39d2bcf2b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y5  // 62f39d2bcfac35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y5              // 62f3e52bcfed1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y5             // 6293e52bcfec1b
-       //TODO: VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y5              // 62f3e52bcfef1b
-       //TODO: VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y5            // 62f3e52bcf2b1b
-       //TODO: VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y5   // 62f3e52bcfac35efffffff1b
-       //TODO: VGF2P8AFFINEINVQB $47, Z3, Z14, K2, Z28            // 62638d4acfe32f
-       //TODO: VGF2P8AFFINEINVQB $47, Z12, Z14, K2, Z28           // 62438d4acfe42f
-       //TODO: VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z14, K2, Z28 // 62038d4acfa43f630000002f
-       //TODO: VGF2P8AFFINEINVQB $47, (DX), Z14, K2, Z28          // 62638d4acf222f
-       //TODO: VGF2P8AFFINEINVQB $47, Z3, Z28, K2, Z28            // 62639d42cfe32f
-       //TODO: VGF2P8AFFINEINVQB $47, Z12, Z28, K2, Z28           // 62439d42cfe42f
-       //TODO: VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z28, K2, Z28 // 62039d42cfa43f630000002f
-       //TODO: VGF2P8AFFINEINVQB $47, (DX), Z28, K2, Z28          // 62639d42cf222f
-       //TODO: VGF2P8AFFINEINVQB $47, Z3, Z14, K2, Z13            // 62738d4acfeb2f
-       //TODO: VGF2P8AFFINEINVQB $47, Z12, Z14, K2, Z13           // 62538d4acfec2f
-       //TODO: VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z14, K2, Z13 // 62138d4acfac3f630000002f
-       //TODO: VGF2P8AFFINEINVQB $47, (DX), Z14, K2, Z13          // 62738d4acf2a2f
-       //TODO: VGF2P8AFFINEINVQB $47, Z3, Z28, K2, Z13            // 62739d42cfeb2f
-       //TODO: VGF2P8AFFINEINVQB $47, Z12, Z28, K2, Z13           // 62539d42cfec2f
-       //TODO: VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z28, K2, Z13 // 62139d42cfac3f630000002f
-       //TODO: VGF2P8AFFINEINVQB $47, (DX), Z28, K2, Z13          // 62739d42cf2a2f
-       //TODO: VGF2P8AFFINEQB $82, X22, X21, K1, X15              // 6233d501cefe52
-       //TODO: VGF2P8AFFINEQB $82, X7, X21, K1, X15               // 6273d501ceff52
-       //TODO: VGF2P8AFFINEQB $82, X19, X21, K1, X15              // 6233d501cefb52
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X15     // 6273d501cebc6c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X15     // 6233d501cebc87f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X0, K1, X15               // 6233fd09cefe52
-       //TODO: VGF2P8AFFINEQB $82, X7, X0, K1, X15                // 6273fd09ceff52
-       //TODO: VGF2P8AFFINEQB $82, X19, X0, K1, X15               // 6233fd09cefb52
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X15      // 6273fd09cebc6c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X15      // 6233fd09cebc87f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X28, K1, X15              // 62339d01cefe52
-       //TODO: VGF2P8AFFINEQB $82, X7, X28, K1, X15               // 62739d01ceff52
-       //TODO: VGF2P8AFFINEQB $82, X19, X28, K1, X15              // 62339d01cefb52
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X15     // 62739d01cebc6c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X15     // 62339d01cebc87f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X21, K1, X0               // 62b3d501cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X21, K1, X0                // 62f3d501cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X21, K1, X0               // 62b3d501cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X0      // 62f3d501ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X0      // 62b3d501ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X0, K1, X0                // 62b3fd09cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X0, K1, X0                 // 62f3fd09cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X0, K1, X0                // 62b3fd09cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X0       // 62f3fd09ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X0       // 62b3fd09ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X28, K1, X0               // 62b39d01cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X28, K1, X0                // 62f39d01cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X28, K1, X0               // 62b39d01cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X0      // 62f39d01ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X0      // 62b39d01ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X21, K1, X16              // 62a3d501cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X21, K1, X16               // 62e3d501cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X21, K1, X16              // 62a3d501cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X16     // 62e3d501ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X16     // 62a3d501ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X0, K1, X16               // 62a3fd09cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X0, K1, X16                // 62e3fd09cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X0, K1, X16               // 62a3fd09cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X16      // 62e3fd09ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X16      // 62a3fd09ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $82, X22, X28, K1, X16              // 62a39d01cec652
-       //TODO: VGF2P8AFFINEQB $82, X7, X28, K1, X16               // 62e39d01cec752
-       //TODO: VGF2P8AFFINEQB $82, X19, X28, K1, X16              // 62a39d01cec352
-       //TODO: VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X16     // 62e39d01ce846c1100000052
-       //TODO: VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X16     // 62a39d01ce8487f9ffffff52
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y12, K2, Y0              // 62b39d2acec17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y12, K2, Y0               // 62f39d2acec77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y12, K2, Y0               // 62d39d2acec17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y0    // 62939d2ace84b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y0     // 62f39d2ace8491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y1, K2, Y0               // 62b3f52acec17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y1, K2, Y0                // 62f3f52acec77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y1, K2, Y0                // 62d3f52acec17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y0     // 6293f52ace84b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y0      // 62f3f52ace8491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y14, K2, Y0              // 62b38d2acec17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y14, K2, Y0               // 62f38d2acec77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y14, K2, Y0               // 62d38d2acec17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y0    // 62938d2ace84b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y0     // 62f38d2ace8491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y12, K2, Y22             // 62a39d2acef17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y12, K2, Y22              // 62e39d2acef77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y12, K2, Y22              // 62c39d2acef17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y22   // 62839d2aceb4b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y22    // 62e39d2aceb491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y1, K2, Y22              // 62a3f52acef17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y1, K2, Y22               // 62e3f52acef77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y1, K2, Y22               // 62c3f52acef17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y22    // 6283f52aceb4b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y22     // 62e3f52aceb491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y14, K2, Y22             // 62a38d2acef17e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y14, K2, Y22              // 62e38d2acef77e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y14, K2, Y22              // 62c38d2acef17e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y22   // 62838d2aceb4b00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y22    // 62e38d2aceb491f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y12, K2, Y13             // 62339d2acee97e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y12, K2, Y13              // 62739d2aceef7e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y12, K2, Y13              // 62539d2acee97e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y13   // 62139d2aceacb00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y13    // 62739d2aceac91f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y1, K2, Y13              // 6233f52acee97e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y1, K2, Y13               // 6273f52aceef7e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y1, K2, Y13               // 6253f52acee97e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y13    // 6213f52aceacb00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y13     // 6273f52aceac91f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $126, Y17, Y14, K2, Y13             // 62338d2acee97e
-       //TODO: VGF2P8AFFINEQB $126, Y7, Y14, K2, Y13              // 62738d2aceef7e
-       //TODO: VGF2P8AFFINEQB $126, Y9, Y14, K2, Y13              // 62538d2acee97e
-       //TODO: VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y13   // 62138d2aceacb00f0000007e
-       //TODO: VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y13    // 62738d2aceac91f9ffffff7e
-       //TODO: VGF2P8AFFINEQB $94, Z5, Z19, K1, Z15               // 6273e541cefd5e
-       //TODO: VGF2P8AFFINEQB $94, Z1, Z19, K1, Z15               // 6273e541cef95e
-       //TODO: VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z19, K1, Z15    // 6273e541cebcf5efffffff5e
-       //TODO: VGF2P8AFFINEQB $94, (R15), Z19, K1, Z15            // 6253e541ce3f5e
-       //TODO: VGF2P8AFFINEQB $94, Z5, Z15, K1, Z15               // 62738549cefd5e
-       //TODO: VGF2P8AFFINEQB $94, Z1, Z15, K1, Z15               // 62738549cef95e
-       //TODO: VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z15, K1, Z15    // 62738549cebcf5efffffff5e
-       //TODO: VGF2P8AFFINEQB $94, (R15), Z15, K1, Z15            // 62538549ce3f5e
-       //TODO: VGF2P8AFFINEQB $94, Z5, Z19, K1, Z30               // 6263e541cef55e
-       //TODO: VGF2P8AFFINEQB $94, Z1, Z19, K1, Z30               // 6263e541cef15e
-       //TODO: VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z19, K1, Z30    // 6263e541ceb4f5efffffff5e
-       //TODO: VGF2P8AFFINEQB $94, (R15), Z19, K1, Z30            // 6243e541ce375e
-       //TODO: VGF2P8AFFINEQB $94, Z5, Z15, K1, Z30               // 62638549cef55e
-       //TODO: VGF2P8AFFINEQB $94, Z1, Z15, K1, Z30               // 62638549cef15e
-       //TODO: VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z15, K1, Z30    // 62638549ceb4f5efffffff5e
-       //TODO: VGF2P8AFFINEQB $94, (R15), Z15, K1, Z30            // 62438549ce375e
-       //TODO: VGF2P8MULB X15, X1, K7, X7                         // 62d2750fcfff
-       //TODO: VGF2P8MULB X12, X1, K7, X7                         // 62d2750fcffc
-       //TODO: VGF2P8MULB X0, X1, K7, X7                          // 62f2750fcff8
-       //TODO: VGF2P8MULB 15(R8), X1, K7, X7                      // 62d2750fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X1, K7, X7                        // 62f2750fcf7d00
-       //TODO: VGF2P8MULB X15, X7, K7, X7                         // 62d2450fcfff
-       //TODO: VGF2P8MULB X12, X7, K7, X7                         // 62d2450fcffc
-       //TODO: VGF2P8MULB X0, X7, K7, X7                          // 62f2450fcff8
-       //TODO: VGF2P8MULB 15(R8), X7, K7, X7                      // 62d2450fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X7, K7, X7                        // 62f2450fcf7d00
-       //TODO: VGF2P8MULB X15, X9, K7, X7                         // 62d2350fcfff
-       //TODO: VGF2P8MULB X12, X9, K7, X7                         // 62d2350fcffc
-       //TODO: VGF2P8MULB X0, X9, K7, X7                          // 62f2350fcff8
-       //TODO: VGF2P8MULB 15(R8), X9, K7, X7                      // 62d2350fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X9, K7, X7                        // 62f2350fcf7d00
-       //TODO: VGF2P8MULB X15, X1, K7, X16                        // 62c2750fcfc7
-       //TODO: VGF2P8MULB X12, X1, K7, X16                        // 62c2750fcfc4
-       //TODO: VGF2P8MULB X0, X1, K7, X16                         // 62e2750fcfc0
-       //TODO: VGF2P8MULB 15(R8), X1, K7, X16                     // 62c2750fcf800f000000
-       //TODO: VGF2P8MULB (BP), X1, K7, X16                       // 62e2750fcf4500
-       //TODO: VGF2P8MULB X15, X7, K7, X16                        // 62c2450fcfc7
-       //TODO: VGF2P8MULB X12, X7, K7, X16                        // 62c2450fcfc4
-       //TODO: VGF2P8MULB X0, X7, K7, X16                         // 62e2450fcfc0
-       //TODO: VGF2P8MULB 15(R8), X7, K7, X16                     // 62c2450fcf800f000000
-       //TODO: VGF2P8MULB (BP), X7, K7, X16                       // 62e2450fcf4500
-       //TODO: VGF2P8MULB X15, X9, K7, X16                        // 62c2350fcfc7
-       //TODO: VGF2P8MULB X12, X9, K7, X16                        // 62c2350fcfc4
-       //TODO: VGF2P8MULB X0, X9, K7, X16                         // 62e2350fcfc0
-       //TODO: VGF2P8MULB 15(R8), X9, K7, X16                     // 62c2350fcf800f000000
-       //TODO: VGF2P8MULB (BP), X9, K7, X16                       // 62e2350fcf4500
-       //TODO: VGF2P8MULB X15, X1, K7, X31                        // 6242750fcfff
-       //TODO: VGF2P8MULB X12, X1, K7, X31                        // 6242750fcffc
-       //TODO: VGF2P8MULB X0, X1, K7, X31                         // 6262750fcff8
-       //TODO: VGF2P8MULB 15(R8), X1, K7, X31                     // 6242750fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X1, K7, X31                       // 6262750fcf7d00
-       //TODO: VGF2P8MULB X15, X7, K7, X31                        // 6242450fcfff
-       //TODO: VGF2P8MULB X12, X7, K7, X31                        // 6242450fcffc
-       //TODO: VGF2P8MULB X0, X7, K7, X31                         // 6262450fcff8
-       //TODO: VGF2P8MULB 15(R8), X7, K7, X31                     // 6242450fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X7, K7, X31                       // 6262450fcf7d00
-       //TODO: VGF2P8MULB X15, X9, K7, X31                        // 6242350fcfff
-       //TODO: VGF2P8MULB X12, X9, K7, X31                        // 6242350fcffc
-       //TODO: VGF2P8MULB X0, X9, K7, X31                         // 6262350fcff8
-       //TODO: VGF2P8MULB 15(R8), X9, K7, X31                     // 6242350fcfb80f000000
-       //TODO: VGF2P8MULB (BP), X9, K7, X31                       // 6262350fcf7d00
-       //TODO: VGF2P8MULB Y2, Y28, K1, Y31                        // 62621d21cffa
-       //TODO: VGF2P8MULB Y21, Y28, K1, Y31                       // 62221d21cffd
-       //TODO: VGF2P8MULB Y12, Y28, K1, Y31                       // 62421d21cffc
-       //TODO: VGF2P8MULB (R8), Y28, K1, Y31                      // 62421d21cf38
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y31              // 62621d21cfbc5a0f000000
-       //TODO: VGF2P8MULB Y2, Y13, K1, Y31                        // 62621529cffa
-       //TODO: VGF2P8MULB Y21, Y13, K1, Y31                       // 62221529cffd
-       //TODO: VGF2P8MULB Y12, Y13, K1, Y31                       // 62421529cffc
-       //TODO: VGF2P8MULB (R8), Y13, K1, Y31                      // 62421529cf38
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y31              // 62621529cfbc5a0f000000
-       //TODO: VGF2P8MULB Y2, Y7, K1, Y31                         // 62624529cffa
-       //TODO: VGF2P8MULB Y21, Y7, K1, Y31                        // 62224529cffd
-       //TODO: VGF2P8MULB Y12, Y7, K1, Y31                        // 62424529cffc
-       //TODO: VGF2P8MULB (R8), Y7, K1, Y31                       // 62424529cf38
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y31               // 62624529cfbc5a0f000000
-       //TODO: VGF2P8MULB Y2, Y28, K1, Y8                         // 62721d21cfc2
-       //TODO: VGF2P8MULB Y21, Y28, K1, Y8                        // 62321d21cfc5
-       //TODO: VGF2P8MULB Y12, Y28, K1, Y8                        // 62521d21cfc4
-       //TODO: VGF2P8MULB (R8), Y28, K1, Y8                       // 62521d21cf00
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y8               // 62721d21cf845a0f000000
-       //TODO: VGF2P8MULB Y2, Y13, K1, Y8                         // 62721529cfc2
-       //TODO: VGF2P8MULB Y21, Y13, K1, Y8                        // 62321529cfc5
-       //TODO: VGF2P8MULB Y12, Y13, K1, Y8                        // 62521529cfc4
-       //TODO: VGF2P8MULB (R8), Y13, K1, Y8                       // 62521529cf00
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y8               // 62721529cf845a0f000000
-       //TODO: VGF2P8MULB Y2, Y7, K1, Y8                          // 62724529cfc2
-       //TODO: VGF2P8MULB Y21, Y7, K1, Y8                         // 62324529cfc5
-       //TODO: VGF2P8MULB Y12, Y7, K1, Y8                         // 62524529cfc4
-       //TODO: VGF2P8MULB (R8), Y7, K1, Y8                        // 62524529cf00
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y8                // 62724529cf845a0f000000
-       //TODO: VGF2P8MULB Y2, Y28, K1, Y1                         // 62f21d21cfca
-       //TODO: VGF2P8MULB Y21, Y28, K1, Y1                        // 62b21d21cfcd
-       //TODO: VGF2P8MULB Y12, Y28, K1, Y1                        // 62d21d21cfcc
-       //TODO: VGF2P8MULB (R8), Y28, K1, Y1                       // 62d21d21cf08
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y1               // 62f21d21cf8c5a0f000000
-       //TODO: VGF2P8MULB Y2, Y13, K1, Y1                         // 62f21529cfca
-       //TODO: VGF2P8MULB Y21, Y13, K1, Y1                        // 62b21529cfcd
-       //TODO: VGF2P8MULB Y12, Y13, K1, Y1                        // 62d21529cfcc
-       //TODO: VGF2P8MULB (R8), Y13, K1, Y1                       // 62d21529cf08
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y1               // 62f21529cf8c5a0f000000
-       //TODO: VGF2P8MULB Y2, Y7, K1, Y1                          // 62f24529cfca
-       //TODO: VGF2P8MULB Y21, Y7, K1, Y1                         // 62b24529cfcd
-       //TODO: VGF2P8MULB Y12, Y7, K1, Y1                         // 62d24529cfcc
-       //TODO: VGF2P8MULB (R8), Y7, K1, Y1                        // 62d24529cf08
-       //TODO: VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y1                // 62f24529cf8c5a0f000000
-       //TODO: VGF2P8MULB Z21, Z14, K1, Z3                        // 62b20d49cfdd
-       //TODO: VGF2P8MULB Z8, Z14, K1, Z3                         // 62d20d49cfd8
-       //TODO: VGF2P8MULB 7(SI)(DI*8), Z14, K1, Z3                // 62f20d49cf9cfe07000000
-       //TODO: VGF2P8MULB -15(R14), Z14, K1, Z3                   // 62d20d49cf9ef1ffffff
-       //TODO: VGF2P8MULB Z21, Z15, K1, Z3                        // 62b20549cfdd
-       //TODO: VGF2P8MULB Z8, Z15, K1, Z3                         // 62d20549cfd8
-       //TODO: VGF2P8MULB 7(SI)(DI*8), Z15, K1, Z3                // 62f20549cf9cfe07000000
-       //TODO: VGF2P8MULB -15(R14), Z15, K1, Z3                   // 62d20549cf9ef1ffffff
-       //TODO: VGF2P8MULB Z21, Z14, K1, Z5                        // 62b20d49cfed
-       //TODO: VGF2P8MULB Z8, Z14, K1, Z5                         // 62d20d49cfe8
-       //TODO: VGF2P8MULB 7(SI)(DI*8), Z14, K1, Z5                // 62f20d49cfacfe07000000
-       //TODO: VGF2P8MULB -15(R14), Z14, K1, Z5                   // 62d20d49cfaef1ffffff
-       //TODO: VGF2P8MULB Z21, Z15, K1, Z5                        // 62b20549cfed
-       //TODO: VGF2P8MULB Z8, Z15, K1, Z5                         // 62d20549cfe8
-       //TODO: VGF2P8MULB 7(SI)(DI*8), Z15, K1, Z5                // 62f20549cfacfe07000000
-       //TODO: VGF2P8MULB -15(R14), Z15, K1, Z5                   // 62d20549cfaef1ffffff
+       VGF2P8AFFINEINVQB $64, X8, X31, K3, X26            // 62438503cfd040
+       VGF2P8AFFINEINVQB $64, X1, X31, K3, X26            // 62638503cfd140
+       VGF2P8AFFINEINVQB $64, X0, X31, K3, X26            // 62638503cfd040
+       VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X26       // 62638503cf95efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X26 // 62038503cf94fef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X16, K3, X26            // 6243fd03cfd040
+       VGF2P8AFFINEINVQB $64, X1, X16, K3, X26            // 6263fd03cfd140
+       VGF2P8AFFINEINVQB $64, X0, X16, K3, X26            // 6263fd03cfd040
+       VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X26       // 6263fd03cf95efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X26 // 6203fd03cf94fef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X7, K3, X26             // 6243c50bcfd040
+       VGF2P8AFFINEINVQB $64, X1, X7, K3, X26             // 6263c50bcfd140
+       VGF2P8AFFINEINVQB $64, X0, X7, K3, X26             // 6263c50bcfd040
+       VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X26        // 6263c50bcf95efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X26 // 6203c50bcf94fef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X31, K3, X19            // 62c38503cfd840
+       VGF2P8AFFINEINVQB $64, X1, X31, K3, X19            // 62e38503cfd940
+       VGF2P8AFFINEINVQB $64, X0, X31, K3, X19            // 62e38503cfd840
+       VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X19       // 62e38503cf9defffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X19 // 62838503cf9cfef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X16, K3, X19            // 62c3fd03cfd840
+       VGF2P8AFFINEINVQB $64, X1, X16, K3, X19            // 62e3fd03cfd940
+       VGF2P8AFFINEINVQB $64, X0, X16, K3, X19            // 62e3fd03cfd840
+       VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X19       // 62e3fd03cf9defffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X19 // 6283fd03cf9cfef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X7, K3, X19             // 62c3c50bcfd840
+       VGF2P8AFFINEINVQB $64, X1, X7, K3, X19             // 62e3c50bcfd940
+       VGF2P8AFFINEINVQB $64, X0, X7, K3, X19             // 62e3c50bcfd840
+       VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X19        // 62e3c50bcf9defffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X19 // 6283c50bcf9cfef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X31, K3, X0             // 62d38503cfc040
+       VGF2P8AFFINEINVQB $64, X1, X31, K3, X0             // 62f38503cfc140
+       VGF2P8AFFINEINVQB $64, X0, X31, K3, X0             // 62f38503cfc040
+       VGF2P8AFFINEINVQB $64, -17(BP), X31, K3, X0        // 62f38503cf85efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X31, K3, X0 // 62938503cf84fef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X16, K3, X0             // 62d3fd03cfc040
+       VGF2P8AFFINEINVQB $64, X1, X16, K3, X0             // 62f3fd03cfc140
+       VGF2P8AFFINEINVQB $64, X0, X16, K3, X0             // 62f3fd03cfc040
+       VGF2P8AFFINEINVQB $64, -17(BP), X16, K3, X0        // 62f3fd03cf85efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X16, K3, X0 // 6293fd03cf84fef1ffffff40
+       VGF2P8AFFINEINVQB $64, X8, X7, K3, X0              // 62d3c50bcfc040
+       VGF2P8AFFINEINVQB $64, X1, X7, K3, X0              // 62f3c50bcfc140
+       VGF2P8AFFINEINVQB $64, X0, X7, K3, X0              // 62f3c50bcfc040
+       VGF2P8AFFINEINVQB $64, -17(BP), X7, K3, X0         // 62f3c50bcf85efffffff40
+       VGF2P8AFFINEINVQB $64, -15(R14)(R15*8), X7, K3, X0 // 6293c50bcf84fef1ffffff40
+       VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y0             // 62f3dd23cfc51b
+       VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y0            // 6293dd23cfc41b
+       VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y0             // 62f3dd23cfc71b
+       VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y0           // 62f3dd23cf031b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y0  // 62f3dd23cf8435efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y0             // 62f39d2bcfc51b
+       VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y0            // 62939d2bcfc41b
+       VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y0             // 62f39d2bcfc71b
+       VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y0           // 62f39d2bcf031b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y0  // 62f39d2bcf8435efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y0              // 62f3e52bcfc51b
+       VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y0             // 6293e52bcfc41b
+       VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y0              // 62f3e52bcfc71b
+       VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y0            // 62f3e52bcf031b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y0   // 62f3e52bcf8435efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y3             // 62f3dd23cfdd1b
+       VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y3            // 6293dd23cfdc1b
+       VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y3             // 62f3dd23cfdf1b
+       VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y3           // 62f3dd23cf1b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y3  // 62f3dd23cf9c35efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y3             // 62f39d2bcfdd1b
+       VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y3            // 62939d2bcfdc1b
+       VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y3             // 62f39d2bcfdf1b
+       VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y3           // 62f39d2bcf1b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y3  // 62f39d2bcf9c35efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y3              // 62f3e52bcfdd1b
+       VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y3             // 6293e52bcfdc1b
+       VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y3              // 62f3e52bcfdf1b
+       VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y3            // 62f3e52bcf1b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y3   // 62f3e52bcf9c35efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y20, K3, Y5             // 62f3dd23cfed1b
+       VGF2P8AFFINEINVQB $27, Y28, Y20, K3, Y5            // 6293dd23cfec1b
+       VGF2P8AFFINEINVQB $27, Y7, Y20, K3, Y5             // 62f3dd23cfef1b
+       VGF2P8AFFINEINVQB $27, (BX), Y20, K3, Y5           // 62f3dd23cf2b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y20, K3, Y5  // 62f3dd23cfac35efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y12, K3, Y5             // 62f39d2bcfed1b
+       VGF2P8AFFINEINVQB $27, Y28, Y12, K3, Y5            // 62939d2bcfec1b
+       VGF2P8AFFINEINVQB $27, Y7, Y12, K3, Y5             // 62f39d2bcfef1b
+       VGF2P8AFFINEINVQB $27, (BX), Y12, K3, Y5           // 62f39d2bcf2b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y12, K3, Y5  // 62f39d2bcfac35efffffff1b
+       VGF2P8AFFINEINVQB $27, Y5, Y3, K3, Y5              // 62f3e52bcfed1b
+       VGF2P8AFFINEINVQB $27, Y28, Y3, K3, Y5             // 6293e52bcfec1b
+       VGF2P8AFFINEINVQB $27, Y7, Y3, K3, Y5              // 62f3e52bcfef1b
+       VGF2P8AFFINEINVQB $27, (BX), Y3, K3, Y5            // 62f3e52bcf2b1b
+       VGF2P8AFFINEINVQB $27, -17(BP)(SI*1), Y3, K3, Y5   // 62f3e52bcfac35efffffff1b
+       VGF2P8AFFINEINVQB $47, Z3, Z14, K2, Z28            // 62638d4acfe32f
+       VGF2P8AFFINEINVQB $47, Z12, Z14, K2, Z28           // 62438d4acfe42f
+       VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z14, K2, Z28 // 62038d4acfa43f630000002f
+       VGF2P8AFFINEINVQB $47, (DX), Z14, K2, Z28          // 62638d4acf222f
+       VGF2P8AFFINEINVQB $47, Z3, Z28, K2, Z28            // 62639d42cfe32f
+       VGF2P8AFFINEINVQB $47, Z12, Z28, K2, Z28           // 62439d42cfe42f
+       VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z28, K2, Z28 // 62039d42cfa43f630000002f
+       VGF2P8AFFINEINVQB $47, (DX), Z28, K2, Z28          // 62639d42cf222f
+       VGF2P8AFFINEINVQB $47, Z3, Z14, K2, Z13            // 62738d4acfeb2f
+       VGF2P8AFFINEINVQB $47, Z12, Z14, K2, Z13           // 62538d4acfec2f
+       VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z14, K2, Z13 // 62138d4acfac3f630000002f
+       VGF2P8AFFINEINVQB $47, (DX), Z14, K2, Z13          // 62738d4acf2a2f
+       VGF2P8AFFINEINVQB $47, Z3, Z28, K2, Z13            // 62739d42cfeb2f
+       VGF2P8AFFINEINVQB $47, Z12, Z28, K2, Z13           // 62539d42cfec2f
+       VGF2P8AFFINEINVQB $47, 99(R15)(R15*1), Z28, K2, Z13 // 62139d42cfac3f630000002f
+       VGF2P8AFFINEINVQB $47, (DX), Z28, K2, Z13          // 62739d42cf2a2f
+       VGF2P8AFFINEQB $82, X22, X21, K1, X15              // 6233d501cefe52
+       VGF2P8AFFINEQB $82, X7, X21, K1, X15               // 6273d501ceff52
+       VGF2P8AFFINEQB $82, X19, X21, K1, X15              // 6233d501cefb52
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X15     // 6273d501cebc6c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X15     // 6233d501cebc87f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X0, K1, X15               // 6233fd09cefe52
+       VGF2P8AFFINEQB $82, X7, X0, K1, X15                // 6273fd09ceff52
+       VGF2P8AFFINEQB $82, X19, X0, K1, X15               // 6233fd09cefb52
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X15      // 6273fd09cebc6c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X15      // 6233fd09cebc87f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X28, K1, X15              // 62339d01cefe52
+       VGF2P8AFFINEQB $82, X7, X28, K1, X15               // 62739d01ceff52
+       VGF2P8AFFINEQB $82, X19, X28, K1, X15              // 62339d01cefb52
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X15     // 62739d01cebc6c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X15     // 62339d01cebc87f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X21, K1, X0               // 62b3d501cec652
+       VGF2P8AFFINEQB $82, X7, X21, K1, X0                // 62f3d501cec752
+       VGF2P8AFFINEQB $82, X19, X21, K1, X0               // 62b3d501cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X0      // 62f3d501ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X0      // 62b3d501ce8487f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X0, K1, X0                // 62b3fd09cec652
+       VGF2P8AFFINEQB $82, X7, X0, K1, X0                 // 62f3fd09cec752
+       VGF2P8AFFINEQB $82, X19, X0, K1, X0                // 62b3fd09cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X0       // 62f3fd09ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X0       // 62b3fd09ce8487f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X28, K1, X0               // 62b39d01cec652
+       VGF2P8AFFINEQB $82, X7, X28, K1, X0                // 62f39d01cec752
+       VGF2P8AFFINEQB $82, X19, X28, K1, X0               // 62b39d01cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X0      // 62f39d01ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X0      // 62b39d01ce8487f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X21, K1, X16              // 62a3d501cec652
+       VGF2P8AFFINEQB $82, X7, X21, K1, X16               // 62e3d501cec752
+       VGF2P8AFFINEQB $82, X19, X21, K1, X16              // 62a3d501cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X21, K1, X16     // 62e3d501ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X21, K1, X16     // 62a3d501ce8487f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X0, K1, X16               // 62a3fd09cec652
+       VGF2P8AFFINEQB $82, X7, X0, K1, X16                // 62e3fd09cec752
+       VGF2P8AFFINEQB $82, X19, X0, K1, X16               // 62a3fd09cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X0, K1, X16      // 62e3fd09ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X0, K1, X16      // 62a3fd09ce8487f9ffffff52
+       VGF2P8AFFINEQB $82, X22, X28, K1, X16              // 62a39d01cec652
+       VGF2P8AFFINEQB $82, X7, X28, K1, X16               // 62e39d01cec752
+       VGF2P8AFFINEQB $82, X19, X28, K1, X16              // 62a39d01cec352
+       VGF2P8AFFINEQB $82, 17(SP)(BP*2), X28, K1, X16     // 62e39d01ce846c1100000052
+       VGF2P8AFFINEQB $82, -7(DI)(R8*4), X28, K1, X16     // 62a39d01ce8487f9ffffff52
+       VGF2P8AFFINEQB $126, Y17, Y12, K2, Y0              // 62b39d2acec17e
+       VGF2P8AFFINEQB $126, Y7, Y12, K2, Y0               // 62f39d2acec77e
+       VGF2P8AFFINEQB $126, Y9, Y12, K2, Y0               // 62d39d2acec17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y0    // 62939d2ace84b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y0     // 62f39d2ace8491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y1, K2, Y0               // 62b3f52acec17e
+       VGF2P8AFFINEQB $126, Y7, Y1, K2, Y0                // 62f3f52acec77e
+       VGF2P8AFFINEQB $126, Y9, Y1, K2, Y0                // 62d3f52acec17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y0     // 6293f52ace84b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y0      // 62f3f52ace8491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y14, K2, Y0              // 62b38d2acec17e
+       VGF2P8AFFINEQB $126, Y7, Y14, K2, Y0               // 62f38d2acec77e
+       VGF2P8AFFINEQB $126, Y9, Y14, K2, Y0               // 62d38d2acec17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y0    // 62938d2ace84b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y0     // 62f38d2ace8491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y12, K2, Y22             // 62a39d2acef17e
+       VGF2P8AFFINEQB $126, Y7, Y12, K2, Y22              // 62e39d2acef77e
+       VGF2P8AFFINEQB $126, Y9, Y12, K2, Y22              // 62c39d2acef17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y22   // 62839d2aceb4b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y22    // 62e39d2aceb491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y1, K2, Y22              // 62a3f52acef17e
+       VGF2P8AFFINEQB $126, Y7, Y1, K2, Y22               // 62e3f52acef77e
+       VGF2P8AFFINEQB $126, Y9, Y1, K2, Y22               // 62c3f52acef17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y22    // 6283f52aceb4b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y22     // 62e3f52aceb491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y14, K2, Y22             // 62a38d2acef17e
+       VGF2P8AFFINEQB $126, Y7, Y14, K2, Y22              // 62e38d2acef77e
+       VGF2P8AFFINEQB $126, Y9, Y14, K2, Y22              // 62c38d2acef17e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y22   // 62838d2aceb4b00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y22    // 62e38d2aceb491f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y12, K2, Y13             // 62339d2acee97e
+       VGF2P8AFFINEQB $126, Y7, Y12, K2, Y13              // 62739d2aceef7e
+       VGF2P8AFFINEQB $126, Y9, Y12, K2, Y13              // 62539d2acee97e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y12, K2, Y13   // 62139d2aceacb00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y12, K2, Y13    // 62739d2aceac91f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y1, K2, Y13              // 6233f52acee97e
+       VGF2P8AFFINEQB $126, Y7, Y1, K2, Y13               // 6273f52aceef7e
+       VGF2P8AFFINEQB $126, Y9, Y1, K2, Y13               // 6253f52acee97e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y1, K2, Y13    // 6213f52aceacb00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y1, K2, Y13     // 6273f52aceac91f9ffffff7e
+       VGF2P8AFFINEQB $126, Y17, Y14, K2, Y13             // 62338d2acee97e
+       VGF2P8AFFINEQB $126, Y7, Y14, K2, Y13              // 62738d2aceef7e
+       VGF2P8AFFINEQB $126, Y9, Y14, K2, Y13              // 62538d2acee97e
+       VGF2P8AFFINEQB $126, 15(R8)(R14*4), Y14, K2, Y13   // 62138d2aceacb00f0000007e
+       VGF2P8AFFINEQB $126, -7(CX)(DX*4), Y14, K2, Y13    // 62738d2aceac91f9ffffff7e
+       VGF2P8AFFINEQB $94, Z5, Z19, K1, Z15               // 6273e541cefd5e
+       VGF2P8AFFINEQB $94, Z1, Z19, K1, Z15               // 6273e541cef95e
+       VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z19, K1, Z15    // 6273e541cebcf5efffffff5e
+       VGF2P8AFFINEQB $94, (R15), Z19, K1, Z15            // 6253e541ce3f5e
+       VGF2P8AFFINEQB $94, Z5, Z15, K1, Z15               // 62738549cefd5e
+       VGF2P8AFFINEQB $94, Z1, Z15, K1, Z15               // 62738549cef95e
+       VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z15, K1, Z15    // 62738549cebcf5efffffff5e
+       VGF2P8AFFINEQB $94, (R15), Z15, K1, Z15            // 62538549ce3f5e
+       VGF2P8AFFINEQB $94, Z5, Z19, K1, Z30               // 6263e541cef55e
+       VGF2P8AFFINEQB $94, Z1, Z19, K1, Z30               // 6263e541cef15e
+       VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z19, K1, Z30    // 6263e541ceb4f5efffffff5e
+       VGF2P8AFFINEQB $94, (R15), Z19, K1, Z30            // 6243e541ce375e
+       VGF2P8AFFINEQB $94, Z5, Z15, K1, Z30               // 62638549cef55e
+       VGF2P8AFFINEQB $94, Z1, Z15, K1, Z30               // 62638549cef15e
+       VGF2P8AFFINEQB $94, -17(BP)(SI*8), Z15, K1, Z30    // 62638549ceb4f5efffffff5e
+       VGF2P8AFFINEQB $94, (R15), Z15, K1, Z30            // 62438549ce375e
+       VGF2P8MULB X15, X1, K7, X7                         // 62d2750fcfff
+       VGF2P8MULB X12, X1, K7, X7                         // 62d2750fcffc
+       VGF2P8MULB X0, X1, K7, X7                          // 62f2750fcff8
+       VGF2P8MULB 15(R8), X1, K7, X7                      // 62d2750fcfb80f000000
+       VGF2P8MULB (BP), X1, K7, X7                        // 62f2750fcf7d00
+       VGF2P8MULB X15, X7, K7, X7                         // 62d2450fcfff
+       VGF2P8MULB X12, X7, K7, X7                         // 62d2450fcffc
+       VGF2P8MULB X0, X7, K7, X7                          // 62f2450fcff8
+       VGF2P8MULB 15(R8), X7, K7, X7                      // 62d2450fcfb80f000000
+       VGF2P8MULB (BP), X7, K7, X7                        // 62f2450fcf7d00
+       VGF2P8MULB X15, X9, K7, X7                         // 62d2350fcfff
+       VGF2P8MULB X12, X9, K7, X7                         // 62d2350fcffc
+       VGF2P8MULB X0, X9, K7, X7                          // 62f2350fcff8
+       VGF2P8MULB 15(R8), X9, K7, X7                      // 62d2350fcfb80f000000
+       VGF2P8MULB (BP), X9, K7, X7                        // 62f2350fcf7d00
+       VGF2P8MULB X15, X1, K7, X16                        // 62c2750fcfc7
+       VGF2P8MULB X12, X1, K7, X16                        // 62c2750fcfc4
+       VGF2P8MULB X0, X1, K7, X16                         // 62e2750fcfc0
+       VGF2P8MULB 15(R8), X1, K7, X16                     // 62c2750fcf800f000000
+       VGF2P8MULB (BP), X1, K7, X16                       // 62e2750fcf4500
+       VGF2P8MULB X15, X7, K7, X16                        // 62c2450fcfc7
+       VGF2P8MULB X12, X7, K7, X16                        // 62c2450fcfc4
+       VGF2P8MULB X0, X7, K7, X16                         // 62e2450fcfc0
+       VGF2P8MULB 15(R8), X7, K7, X16                     // 62c2450fcf800f000000
+       VGF2P8MULB (BP), X7, K7, X16                       // 62e2450fcf4500
+       VGF2P8MULB X15, X9, K7, X16                        // 62c2350fcfc7
+       VGF2P8MULB X12, X9, K7, X16                        // 62c2350fcfc4
+       VGF2P8MULB X0, X9, K7, X16                         // 62e2350fcfc0
+       VGF2P8MULB 15(R8), X9, K7, X16                     // 62c2350fcf800f000000
+       VGF2P8MULB (BP), X9, K7, X16                       // 62e2350fcf4500
+       VGF2P8MULB X15, X1, K7, X31                        // 6242750fcfff
+       VGF2P8MULB X12, X1, K7, X31                        // 6242750fcffc
+       VGF2P8MULB X0, X1, K7, X31                         // 6262750fcff8
+       VGF2P8MULB 15(R8), X1, K7, X31                     // 6242750fcfb80f000000
+       VGF2P8MULB (BP), X1, K7, X31                       // 6262750fcf7d00
+       VGF2P8MULB X15, X7, K7, X31                        // 6242450fcfff
+       VGF2P8MULB X12, X7, K7, X31                        // 6242450fcffc
+       VGF2P8MULB X0, X7, K7, X31                         // 6262450fcff8
+       VGF2P8MULB 15(R8), X7, K7, X31                     // 6242450fcfb80f000000
+       VGF2P8MULB (BP), X7, K7, X31                       // 6262450fcf7d00
+       VGF2P8MULB X15, X9, K7, X31                        // 6242350fcfff
+       VGF2P8MULB X12, X9, K7, X31                        // 6242350fcffc
+       VGF2P8MULB X0, X9, K7, X31                         // 6262350fcff8
+       VGF2P8MULB 15(R8), X9, K7, X31                     // 6242350fcfb80f000000
+       VGF2P8MULB (BP), X9, K7, X31                       // 6262350fcf7d00
+       VGF2P8MULB Y2, Y28, K1, Y31                        // 62621d21cffa
+       VGF2P8MULB Y21, Y28, K1, Y31                       // 62221d21cffd
+       VGF2P8MULB Y12, Y28, K1, Y31                       // 62421d21cffc
+       VGF2P8MULB (R8), Y28, K1, Y31                      // 62421d21cf38
+       VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y31              // 62621d21cfbc5a0f000000
+       VGF2P8MULB Y2, Y13, K1, Y31                        // 62621529cffa
+       VGF2P8MULB Y21, Y13, K1, Y31                       // 62221529cffd
+       VGF2P8MULB Y12, Y13, K1, Y31                       // 62421529cffc
+       VGF2P8MULB (R8), Y13, K1, Y31                      // 62421529cf38
+       VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y31              // 62621529cfbc5a0f000000
+       VGF2P8MULB Y2, Y7, K1, Y31                         // 62624529cffa
+       VGF2P8MULB Y21, Y7, K1, Y31                        // 62224529cffd
+       VGF2P8MULB Y12, Y7, K1, Y31                        // 62424529cffc
+       VGF2P8MULB (R8), Y7, K1, Y31                       // 62424529cf38
+       VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y31               // 62624529cfbc5a0f000000
+       VGF2P8MULB Y2, Y28, K1, Y8                         // 62721d21cfc2
+       VGF2P8MULB Y21, Y28, K1, Y8                        // 62321d21cfc5
+       VGF2P8MULB Y12, Y28, K1, Y8                        // 62521d21cfc4
+       VGF2P8MULB (R8), Y28, K1, Y8                       // 62521d21cf00
+       VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y8               // 62721d21cf845a0f000000
+       VGF2P8MULB Y2, Y13, K1, Y8                         // 62721529cfc2
+       VGF2P8MULB Y21, Y13, K1, Y8                        // 62321529cfc5
+       VGF2P8MULB Y12, Y13, K1, Y8                        // 62521529cfc4
+       VGF2P8MULB (R8), Y13, K1, Y8                       // 62521529cf00
+       VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y8               // 62721529cf845a0f000000
+       VGF2P8MULB Y2, Y7, K1, Y8                          // 62724529cfc2
+       VGF2P8MULB Y21, Y7, K1, Y8                         // 62324529cfc5
+       VGF2P8MULB Y12, Y7, K1, Y8                         // 62524529cfc4
+       VGF2P8MULB (R8), Y7, K1, Y8                        // 62524529cf00
+       VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y8                // 62724529cf845a0f000000
+       VGF2P8MULB Y2, Y28, K1, Y1                         // 62f21d21cfca
+       VGF2P8MULB Y21, Y28, K1, Y1                        // 62b21d21cfcd
+       VGF2P8MULB Y12, Y28, K1, Y1                        // 62d21d21cfcc
+       VGF2P8MULB (R8), Y28, K1, Y1                       // 62d21d21cf08
+       VGF2P8MULB 15(DX)(BX*2), Y28, K1, Y1               // 62f21d21cf8c5a0f000000
+       VGF2P8MULB Y2, Y13, K1, Y1                         // 62f21529cfca
+       VGF2P8MULB Y21, Y13, K1, Y1                        // 62b21529cfcd
+       VGF2P8MULB Y12, Y13, K1, Y1                        // 62d21529cfcc
+       VGF2P8MULB (R8), Y13, K1, Y1                       // 62d21529cf08
+       VGF2P8MULB 15(DX)(BX*2), Y13, K1, Y1               // 62f21529cf8c5a0f000000
+       VGF2P8MULB Y2, Y7, K1, Y1                          // 62f24529cfca
+       VGF2P8MULB Y21, Y7, K1, Y1                         // 62b24529cfcd
+       VGF2P8MULB Y12, Y7, K1, Y1                         // 62d24529cfcc
+       VGF2P8MULB (R8), Y7, K1, Y1                        // 62d24529cf08
+       VGF2P8MULB 15(DX)(BX*2), Y7, K1, Y1                // 62f24529cf8c5a0f000000
+       VGF2P8MULB Z21, Z14, K1, Z3                        // 62b20d49cfdd
+       VGF2P8MULB Z8, Z14, K1, Z3                         // 62d20d49cfd8
+       VGF2P8MULB 7(SI)(DI*8), Z14, K1, Z3                // 62f20d49cf9cfe07000000
+       VGF2P8MULB -15(R14), Z14, K1, Z3                   // 62d20d49cf9ef1ffffff
+       VGF2P8MULB Z21, Z15, K1, Z3                        // 62b20549cfdd
+       VGF2P8MULB Z8, Z15, K1, Z3                         // 62d20549cfd8
+       VGF2P8MULB 7(SI)(DI*8), Z15, K1, Z3                // 62f20549cf9cfe07000000
+       VGF2P8MULB -15(R14), Z15, K1, Z3                   // 62d20549cf9ef1ffffff
+       VGF2P8MULB Z21, Z14, K1, Z5                        // 62b20d49cfed
+       VGF2P8MULB Z8, Z14, K1, Z5                         // 62d20d49cfe8
+       VGF2P8MULB 7(SI)(DI*8), Z14, K1, Z5                // 62f20d49cfacfe07000000
+       VGF2P8MULB -15(R14), Z14, K1, Z5                   // 62d20d49cfaef1ffffff
+       VGF2P8MULB Z21, Z15, K1, Z5                        // 62b20549cfed
+       VGF2P8MULB Z8, Z15, K1, Z5                         // 62d20549cfe8
+       VGF2P8MULB 7(SI)(DI*8), Z15, K1, Z5                // 62f20549cfacfe07000000
+       VGF2P8MULB -15(R14), Z15, K1, Z5                   // 62d20549cfaef1ffffff
        RET
index 4bbe3faf73fc85c8f2d6eb2fdd8cb0679c6d9afa..86579d682ee62d93a3551daf5e160baab34864c6 100644 (file)
@@ -3,92 +3,92 @@
 #include "../../../../../../runtime/textflag.h"
 
 TEXT asmtest_vpclmulqdq_avx512f(SB), NOSPLIT, $0
-       //TODO: VPCLMULQDQ $127, X22, X21, X15                     // 6233550044fe7f or 6233d50044fe7f
-       //TODO: VPCLMULQDQ $127, X7, X21, X15                      // 6273550044ff7f or 6273d50044ff7f
-       //TODO: VPCLMULQDQ $127, X19, X21, X15                     // 6233550044fb7f or 6233d50044fb7f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X21, X15           // 6273550044bcf5efffffff7f or 6273d50044bcf5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X21, X15                   // 62535500443f7f or 6253d500443f7f
-       //TODO: VPCLMULQDQ $127, X22, X0, X15                      // 62337d0844fe7f or 6233fd0844fe7f
-       //TODO: VPCLMULQDQ $127, X19, X0, X15                      // 62337d0844fb7f or 6233fd0844fb7f
-       //TODO: VPCLMULQDQ $127, X22, X28, X15                     // 62331d0044fe7f or 62339d0044fe7f
-       //TODO: VPCLMULQDQ $127, X7, X28, X15                      // 62731d0044ff7f or 62739d0044ff7f
-       //TODO: VPCLMULQDQ $127, X19, X28, X15                     // 62331d0044fb7f or 62339d0044fb7f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X28, X15           // 62731d0044bcf5efffffff7f or 62739d0044bcf5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X28, X15                   // 62531d00443f7f or 62539d00443f7f
-       //TODO: VPCLMULQDQ $127, X22, X21, X0                      // 62b3550044c67f or 62b3d50044c67f
-       //TODO: VPCLMULQDQ $127, X7, X21, X0                       // 62f3550044c77f or 62f3d50044c77f
-       //TODO: VPCLMULQDQ $127, X19, X21, X0                      // 62b3550044c37f or 62b3d50044c37f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X21, X0            // 62f355004484f5efffffff7f or 62f3d5004484f5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X21, X0                    // 62d3550044077f or 62d3d50044077f
-       //TODO: VPCLMULQDQ $127, X22, X0, X0                       // 62b37d0844c67f or 62b3fd0844c67f
-       //TODO: VPCLMULQDQ $127, X19, X0, X0                       // 62b37d0844c37f or 62b3fd0844c37f
-       //TODO: VPCLMULQDQ $127, X22, X28, X0                      // 62b31d0044c67f or 62b39d0044c67f
-       //TODO: VPCLMULQDQ $127, X7, X28, X0                       // 62f31d0044c77f or 62f39d0044c77f
-       //TODO: VPCLMULQDQ $127, X19, X28, X0                      // 62b31d0044c37f or 62b39d0044c37f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X28, X0            // 62f31d004484f5efffffff7f or 62f39d004484f5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X28, X0                    // 62d31d0044077f or 62d39d0044077f
-       //TODO: VPCLMULQDQ $127, X22, X21, X16                     // 62a3550044c67f or 62a3d50044c67f
-       //TODO: VPCLMULQDQ $127, X7, X21, X16                      // 62e3550044c77f or 62e3d50044c77f
-       //TODO: VPCLMULQDQ $127, X19, X21, X16                     // 62a3550044c37f or 62a3d50044c37f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X21, X16           // 62e355004484f5efffffff7f or 62e3d5004484f5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X21, X16                   // 62c3550044077f or 62c3d50044077f
-       //TODO: VPCLMULQDQ $127, X22, X0, X16                      // 62a37d0844c67f or 62a3fd0844c67f
-       //TODO: VPCLMULQDQ $127, X7, X0, X16                       // 62e37d0844c77f or 62e3fd0844c77f
-       //TODO: VPCLMULQDQ $127, X19, X0, X16                      // 62a37d0844c37f or 62a3fd0844c37f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X0, X16            // 62e37d084484f5efffffff7f or 62e3fd084484f5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X0, X16                    // 62c37d0844077f or 62c3fd0844077f
-       //TODO: VPCLMULQDQ $127, X22, X28, X16                     // 62a31d0044c67f or 62a39d0044c67f
-       //TODO: VPCLMULQDQ $127, X7, X28, X16                      // 62e31d0044c77f or 62e39d0044c77f
-       //TODO: VPCLMULQDQ $127, X19, X28, X16                     // 62a31d0044c37f or 62a39d0044c37f
-       //TODO: VPCLMULQDQ $127, -17(BP)(SI*8), X28, X16           // 62e31d004484f5efffffff7f or 62e39d004484f5efffffff7f
-       //TODO: VPCLMULQDQ $127, (R15), X28, X16                   // 62c31d0044077f or 62c39d0044077f
-       //TODO: VPCLMULQDQ $0, Y15, Y2, Y31                        // 62436d2844ff00 or 6243ed2844ff00
-       //TODO: VPCLMULQDQ $0, Y22, Y2, Y31                        // 62236d2844fe00 or 6223ed2844fe00
-       //TODO: VPCLMULQDQ $0, Y20, Y2, Y31                        // 62236d2844fc00 or 6223ed2844fc00
-       //TODO: VPCLMULQDQ $0, 99(R15)(R15*4), Y2, Y31             // 62036d2844bcbf6300000000 or 6203ed2844bcbf6300000000
-       //TODO: VPCLMULQDQ $0, 15(DX), Y2, Y31                     // 62636d2844ba0f00000000 or 6263ed2844ba0f00000000
-       //TODO: VPCLMULQDQ $0, Y15, Y13, Y31                       // 6243152844ff00 or 6243952844ff00
-       //TODO: VPCLMULQDQ $0, Y22, Y13, Y31                       // 6223152844fe00 or 6223952844fe00
-       //TODO: VPCLMULQDQ $0, Y20, Y13, Y31                       // 6223152844fc00 or 6223952844fc00
-       //TODO: VPCLMULQDQ $0, 99(R15)(R15*4), Y13, Y31            // 6203152844bcbf6300000000 or 6203952844bcbf6300000000
-       //TODO: VPCLMULQDQ $0, 15(DX), Y13, Y31                    // 6263152844ba0f00000000 or 6263952844ba0f00000000
-       //TODO: VPCLMULQDQ $0, Y15, Y27, Y31                       // 6243252044ff00 or 6243a52044ff00
-       //TODO: VPCLMULQDQ $0, Y22, Y27, Y31                       // 6223252044fe00 or 6223a52044fe00
-       //TODO: VPCLMULQDQ $0, Y20, Y27, Y31                       // 6223252044fc00 or 6223a52044fc00
-       //TODO: VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y31            // 6203252044bcbf6300000000 or 6203a52044bcbf6300000000
-       //TODO: VPCLMULQDQ $0, 15(DX), Y27, Y31                    // 6263252044ba0f00000000 or 6263a52044ba0f00000000
-       //TODO: VPCLMULQDQ $0, Y22, Y2, Y3                         // 62b36d2844de00 or 62b3ed2844de00
-       //TODO: VPCLMULQDQ $0, Y20, Y2, Y3                         // 62b36d2844dc00 or 62b3ed2844dc00
-       //TODO: VPCLMULQDQ $0, Y22, Y13, Y3                        // 62b3152844de00 or 62b3952844de00
-       //TODO: VPCLMULQDQ $0, Y20, Y13, Y3                        // 62b3152844dc00 or 62b3952844dc00
-       //TODO: VPCLMULQDQ $0, Y15, Y27, Y3                        // 62d3252044df00 or 62d3a52044df00
-       //TODO: VPCLMULQDQ $0, Y22, Y27, Y3                        // 62b3252044de00 or 62b3a52044de00
-       //TODO: VPCLMULQDQ $0, Y20, Y27, Y3                        // 62b3252044dc00 or 62b3a52044dc00
-       //TODO: VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y3             // 62932520449cbf6300000000 or 6293a520449cbf6300000000
-       //TODO: VPCLMULQDQ $0, 15(DX), Y27, Y3                     // 62f32520449a0f00000000 or 62f3a520449a0f00000000
-       //TODO: VPCLMULQDQ $0, Y22, Y2, Y14                        // 62336d2844f600 or 6233ed2844f600
-       //TODO: VPCLMULQDQ $0, Y20, Y2, Y14                        // 62336d2844f400 or 6233ed2844f400
-       //TODO: VPCLMULQDQ $0, Y22, Y13, Y14                       // 6233152844f600 or 6233952844f600
-       //TODO: VPCLMULQDQ $0, Y20, Y13, Y14                       // 6233152844f400 or 6233952844f400
-       //TODO: VPCLMULQDQ $0, Y15, Y27, Y14                       // 6253252044f700 or 6253a52044f700
-       //TODO: VPCLMULQDQ $0, Y22, Y27, Y14                       // 6233252044f600 or 6233a52044f600
-       //TODO: VPCLMULQDQ $0, Y20, Y27, Y14                       // 6233252044f400 or 6233a52044f400
-       //TODO: VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y14            // 6213252044b4bf6300000000 or 6213a52044b4bf6300000000
-       //TODO: VPCLMULQDQ $0, 15(DX), Y27, Y14                    // 6273252044b20f00000000 or 6273a52044b20f00000000
-       //TODO: VPCLMULQDQ $97, Z9, Z0, Z24                        // 62437d4844c161 or 6243fd4844c161
-       //TODO: VPCLMULQDQ $97, Z3, Z0, Z24                        // 62637d4844c361 or 6263fd4844c361
-       //TODO: VPCLMULQDQ $97, 7(SI)(DI*1), Z0, Z24               // 62637d4844843e0700000061 or 6263fd4844843e0700000061
-       //TODO: VPCLMULQDQ $97, 15(DX)(BX*8), Z0, Z24              // 62637d484484da0f00000061 or 6263fd484484da0f00000061
-       //TODO: VPCLMULQDQ $97, Z9, Z26, Z24                       // 62432d4044c161 or 6243ad4044c161
-       //TODO: VPCLMULQDQ $97, Z3, Z26, Z24                       // 62632d4044c361 or 6263ad4044c361
-       //TODO: VPCLMULQDQ $97, 7(SI)(DI*1), Z26, Z24              // 62632d4044843e0700000061 or 6263ad4044843e0700000061
-       //TODO: VPCLMULQDQ $97, 15(DX)(BX*8), Z26, Z24             // 62632d404484da0f00000061 or 6263ad404484da0f00000061
-       //TODO: VPCLMULQDQ $97, Z9, Z0, Z12                        // 62537d4844e161 or 6253fd4844e161
-       //TODO: VPCLMULQDQ $97, Z3, Z0, Z12                        // 62737d4844e361 or 6273fd4844e361
-       //TODO: VPCLMULQDQ $97, 7(SI)(DI*1), Z0, Z12               // 62737d4844a43e0700000061 or 6273fd4844a43e0700000061
-       //TODO: VPCLMULQDQ $97, 15(DX)(BX*8), Z0, Z12              // 62737d4844a4da0f00000061 or 6273fd4844a4da0f00000061
-       //TODO: VPCLMULQDQ $97, Z9, Z26, Z12                       // 62532d4044e161 or 6253ad4044e161
-       //TODO: VPCLMULQDQ $97, Z3, Z26, Z12                       // 62732d4044e361 or 6273ad4044e361
-       //TODO: VPCLMULQDQ $97, 7(SI)(DI*1), Z26, Z12              // 62732d4044a43e0700000061 or 6273ad4044a43e0700000061
-       //TODO: VPCLMULQDQ $97, 15(DX)(BX*8), Z26, Z12             // 62732d4044a4da0f00000061 or 6273ad4044a4da0f00000061
+       VPCLMULQDQ $127, X22, X21, X15                     // 6233550044fe7f or 6233d50044fe7f
+       VPCLMULQDQ $127, X7, X21, X15                      // 6273550044ff7f or 6273d50044ff7f
+       VPCLMULQDQ $127, X19, X21, X15                     // 6233550044fb7f or 6233d50044fb7f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X21, X15           // 6273550044bcf5efffffff7f or 6273d50044bcf5efffffff7f
+       VPCLMULQDQ $127, (R15), X21, X15                   // 62535500443f7f or 6253d500443f7f
+       VPCLMULQDQ $127, X22, X0, X15                      // 62337d0844fe7f or 6233fd0844fe7f
+       VPCLMULQDQ $127, X19, X0, X15                      // 62337d0844fb7f or 6233fd0844fb7f
+       VPCLMULQDQ $127, X22, X28, X15                     // 62331d0044fe7f or 62339d0044fe7f
+       VPCLMULQDQ $127, X7, X28, X15                      // 62731d0044ff7f or 62739d0044ff7f
+       VPCLMULQDQ $127, X19, X28, X15                     // 62331d0044fb7f or 62339d0044fb7f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X28, X15           // 62731d0044bcf5efffffff7f or 62739d0044bcf5efffffff7f
+       VPCLMULQDQ $127, (R15), X28, X15                   // 62531d00443f7f or 62539d00443f7f
+       VPCLMULQDQ $127, X22, X21, X0                      // 62b3550044c67f or 62b3d50044c67f
+       VPCLMULQDQ $127, X7, X21, X0                       // 62f3550044c77f or 62f3d50044c77f
+       VPCLMULQDQ $127, X19, X21, X0                      // 62b3550044c37f or 62b3d50044c37f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X21, X0            // 62f355004484f5efffffff7f or 62f3d5004484f5efffffff7f
+       VPCLMULQDQ $127, (R15), X21, X0                    // 62d3550044077f or 62d3d50044077f
+       VPCLMULQDQ $127, X22, X0, X0                       // 62b37d0844c67f or 62b3fd0844c67f
+       VPCLMULQDQ $127, X19, X0, X0                       // 62b37d0844c37f or 62b3fd0844c37f
+       VPCLMULQDQ $127, X22, X28, X0                      // 62b31d0044c67f or 62b39d0044c67f
+       VPCLMULQDQ $127, X7, X28, X0                       // 62f31d0044c77f or 62f39d0044c77f
+       VPCLMULQDQ $127, X19, X28, X0                      // 62b31d0044c37f or 62b39d0044c37f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X28, X0            // 62f31d004484f5efffffff7f or 62f39d004484f5efffffff7f
+       VPCLMULQDQ $127, (R15), X28, X0                    // 62d31d0044077f or 62d39d0044077f
+       VPCLMULQDQ $127, X22, X21, X16                     // 62a3550044c67f or 62a3d50044c67f
+       VPCLMULQDQ $127, X7, X21, X16                      // 62e3550044c77f or 62e3d50044c77f
+       VPCLMULQDQ $127, X19, X21, X16                     // 62a3550044c37f or 62a3d50044c37f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X21, X16           // 62e355004484f5efffffff7f or 62e3d5004484f5efffffff7f
+       VPCLMULQDQ $127, (R15), X21, X16                   // 62c3550044077f or 62c3d50044077f
+       VPCLMULQDQ $127, X22, X0, X16                      // 62a37d0844c67f or 62a3fd0844c67f
+       VPCLMULQDQ $127, X7, X0, X16                       // 62e37d0844c77f or 62e3fd0844c77f
+       VPCLMULQDQ $127, X19, X0, X16                      // 62a37d0844c37f or 62a3fd0844c37f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X0, X16            // 62e37d084484f5efffffff7f or 62e3fd084484f5efffffff7f
+       VPCLMULQDQ $127, (R15), X0, X16                    // 62c37d0844077f or 62c3fd0844077f
+       VPCLMULQDQ $127, X22, X28, X16                     // 62a31d0044c67f or 62a39d0044c67f
+       VPCLMULQDQ $127, X7, X28, X16                      // 62e31d0044c77f or 62e39d0044c77f
+       VPCLMULQDQ $127, X19, X28, X16                     // 62a31d0044c37f or 62a39d0044c37f
+       VPCLMULQDQ $127, -17(BP)(SI*8), X28, X16           // 62e31d004484f5efffffff7f or 62e39d004484f5efffffff7f
+       VPCLMULQDQ $127, (R15), X28, X16                   // 62c31d0044077f or 62c39d0044077f
+       VPCLMULQDQ $0, Y15, Y2, Y31                        // 62436d2844ff00 or 6243ed2844ff00
+       VPCLMULQDQ $0, Y22, Y2, Y31                        // 62236d2844fe00 or 6223ed2844fe00
+       VPCLMULQDQ $0, Y20, Y2, Y31                        // 62236d2844fc00 or 6223ed2844fc00
+       VPCLMULQDQ $0, 99(R15)(R15*4), Y2, Y31             // 62036d2844bcbf6300000000 or 6203ed2844bcbf6300000000
+       VPCLMULQDQ $0, 15(DX), Y2, Y31                     // 62636d2844ba0f00000000 or 6263ed2844ba0f00000000
+       VPCLMULQDQ $0, Y15, Y13, Y31                       // 6243152844ff00 or 6243952844ff00
+       VPCLMULQDQ $0, Y22, Y13, Y31                       // 6223152844fe00 or 6223952844fe00
+       VPCLMULQDQ $0, Y20, Y13, Y31                       // 6223152844fc00 or 6223952844fc00
+       VPCLMULQDQ $0, 99(R15)(R15*4), Y13, Y31            // 6203152844bcbf6300000000 or 6203952844bcbf6300000000
+       VPCLMULQDQ $0, 15(DX), Y13, Y31                    // 6263152844ba0f00000000 or 6263952844ba0f00000000
+       VPCLMULQDQ $0, Y15, Y27, Y31                       // 6243252044ff00 or 6243a52044ff00
+       VPCLMULQDQ $0, Y22, Y27, Y31                       // 6223252044fe00 or 6223a52044fe00
+       VPCLMULQDQ $0, Y20, Y27, Y31                       // 6223252044fc00 or 6223a52044fc00
+       VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y31            // 6203252044bcbf6300000000 or 6203a52044bcbf6300000000
+       VPCLMULQDQ $0, 15(DX), Y27, Y31                    // 6263252044ba0f00000000 or 6263a52044ba0f00000000
+       VPCLMULQDQ $0, Y22, Y2, Y3                         // 62b36d2844de00 or 62b3ed2844de00
+       VPCLMULQDQ $0, Y20, Y2, Y3                         // 62b36d2844dc00 or 62b3ed2844dc00
+       VPCLMULQDQ $0, Y22, Y13, Y3                        // 62b3152844de00 or 62b3952844de00
+       VPCLMULQDQ $0, Y20, Y13, Y3                        // 62b3152844dc00 or 62b3952844dc00
+       VPCLMULQDQ $0, Y15, Y27, Y3                        // 62d3252044df00 or 62d3a52044df00
+       VPCLMULQDQ $0, Y22, Y27, Y3                        // 62b3252044de00 or 62b3a52044de00
+       VPCLMULQDQ $0, Y20, Y27, Y3                        // 62b3252044dc00 or 62b3a52044dc00
+       VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y3             // 62932520449cbf6300000000 or 6293a520449cbf6300000000
+       VPCLMULQDQ $0, 15(DX), Y27, Y3                     // 62f32520449a0f00000000 or 62f3a520449a0f00000000
+       VPCLMULQDQ $0, Y22, Y2, Y14                        // 62336d2844f600 or 6233ed2844f600
+       VPCLMULQDQ $0, Y20, Y2, Y14                        // 62336d2844f400 or 6233ed2844f400
+       VPCLMULQDQ $0, Y22, Y13, Y14                       // 6233152844f600 or 6233952844f600
+       VPCLMULQDQ $0, Y20, Y13, Y14                       // 6233152844f400 or 6233952844f400
+       VPCLMULQDQ $0, Y15, Y27, Y14                       // 6253252044f700 or 6253a52044f700
+       VPCLMULQDQ $0, Y22, Y27, Y14                       // 6233252044f600 or 6233a52044f600
+       VPCLMULQDQ $0, Y20, Y27, Y14                       // 6233252044f400 or 6233a52044f400
+       VPCLMULQDQ $0, 99(R15)(R15*4), Y27, Y14            // 6213252044b4bf6300000000 or 6213a52044b4bf6300000000
+       VPCLMULQDQ $0, 15(DX), Y27, Y14                    // 6273252044b20f00000000 or 6273a52044b20f00000000
+       VPCLMULQDQ $97, Z9, Z0, Z24                        // 62437d4844c161 or 6243fd4844c161
+       VPCLMULQDQ $97, Z3, Z0, Z24                        // 62637d4844c361 or 6263fd4844c361
+       VPCLMULQDQ $97, 7(SI)(DI*1), Z0, Z24               // 62637d4844843e0700000061 or 6263fd4844843e0700000061
+       VPCLMULQDQ $97, 15(DX)(BX*8), Z0, Z24              // 62637d484484da0f00000061 or 6263fd484484da0f00000061
+       VPCLMULQDQ $97, Z9, Z26, Z24                       // 62432d4044c161 or 6243ad4044c161
+       VPCLMULQDQ $97, Z3, Z26, Z24                       // 62632d4044c361 or 6263ad4044c361
+       VPCLMULQDQ $97, 7(SI)(DI*1), Z26, Z24              // 62632d4044843e0700000061 or 6263ad4044843e0700000061
+       VPCLMULQDQ $97, 15(DX)(BX*8), Z26, Z24             // 62632d404484da0f00000061 or 6263ad404484da0f00000061
+       VPCLMULQDQ $97, Z9, Z0, Z12                        // 62537d4844e161 or 6253fd4844e161
+       VPCLMULQDQ $97, Z3, Z0, Z12                        // 62737d4844e361 or 6273fd4844e361
+       VPCLMULQDQ $97, 7(SI)(DI*1), Z0, Z12               // 62737d4844a43e0700000061 or 6273fd4844a43e0700000061
+       VPCLMULQDQ $97, 15(DX)(BX*8), Z0, Z12              // 62737d4844a4da0f00000061 or 6273fd4844a4da0f00000061
+       VPCLMULQDQ $97, Z9, Z26, Z12                       // 62532d4044e161 or 6253ad4044e161
+       VPCLMULQDQ $97, Z3, Z26, Z12                       // 62732d4044e361 or 6273ad4044e361
+       VPCLMULQDQ $97, 7(SI)(DI*1), Z26, Z12              // 62732d4044a43e0700000061 or 6273ad4044a43e0700000061
+       VPCLMULQDQ $97, 15(DX)(BX*8), Z26, Z12             // 62732d4044a4da0f00000061 or 6273ad4044a4da0f00000061
        RET
index a44e40a158ff368ab6d0b66135831c664cde1a09..2654312b895f90a2fd186d3e8d196b3e7dc040aa 100644 (file)
@@ -39,6 +39,7 @@ func init() {
        obj.RegisterRegister(obj.RBaseARM, MAXREG, rconv)
        obj.RegisterOpcode(obj.ABaseARM, Anames)
        obj.RegisterRegisterList(obj.RegListARMLo, obj.RegListARMHi, rlconv)
+       obj.RegisterOpSuffix("arm", obj.CConvARM)
 }
 
 func rconv(r int) string {
index 093af6cb065dbd27a413a505dffa64e96ba8c6db..a7df1a788e3be8ee6135fec48f0ff2fce8f580a7 100644 (file)
@@ -58,6 +58,7 @@ func init() {
        obj.RegisterRegister(obj.RBaseARM64, REG_SPECIAL+1024, rconv)
        obj.RegisterOpcode(obj.ABaseARM64, Anames)
        obj.RegisterRegisterList(obj.RegListARM64Lo, obj.RegListARM64Hi, rlconv)
+       obj.RegisterOpSuffix("arm64", obj.CConvARM)
 }
 
 func arrange(a int) string {
index 2fbbf6cb258abd873306a5ce2c19c7393b9e1333..f99f6f8d6aa2e30e07874abc9f1ae1a1f9eaba83 100644 (file)
@@ -138,13 +138,16 @@ import (
 //                     offset = second register
 //
 //     [reg, reg, reg-reg]
-//             Register list for ARM and ARM64.
+//             Register list for ARM, ARM64, 386/AMD64.
 //             Encoding:
 //                     type = TYPE_REGLIST
 //             On ARM:
 //                     offset = bit mask of registers in list; R0 is low bit.
 //             On ARM64:
 //                     offset = register count (Q:size) | arrangement (opcode) | first register
+//             On 386/AMD64:
+//                     reg = range low register
+//                     offset = 2 packed registers + kind tag (see x86.EncodeRegisterRange)
 //
 //     reg, reg
 //             Register pair for ARM.
@@ -282,7 +285,7 @@ type Prog struct {
        RegTo2   int16    // 2nd destination operand
        Mark     uint16   // bitmask of arch-specific items
        Optab    uint16   // arch-specific opcode index
-       Scond    uint8    // condition bits for conditional instruction (e.g., on ARM)
+       Scond    uint8    // bits that describe instruction suffixes (e.g. ARM conditions)
        Back     uint8    // for x86 back end: backwards branch state
        Ft       uint8    // for x86 back end: type index of Prog.From
        Tt       uint8    // for x86 back end: type index of Prog.To
index 98475d00cabd7ea50e7cf76df6b94c4ef9135d78..3453b71b3bc3bc2fadfbbe1ff7caf41eb7f6fa51 100644 (file)
@@ -72,11 +72,26 @@ const (
        C_SCOND_XOR = 14
 )
 
-// CConv formats ARM condition codes.
+// CConv formats opcode suffix bits (Prog.Scond).
 func CConv(s uint8) string {
        if s == 0 {
                return ""
        }
+       for i := range opSuffixSpace {
+               sset := &opSuffixSpace[i]
+               if sset.arch == objabi.GOARCH {
+                       return sset.cconv(s)
+               }
+       }
+       return fmt.Sprintf("SC???%d", s)
+}
+
+// CConvARM formats ARM opcode suffix bits (mostly condition codes).
+func CConvARM(s uint8) string {
+       // TODO: could be great to move suffix-related things into
+       // ARM asm backends some day.
+       // obj/x86 can be used as an example.
+
        sc := armCondCode[(s&C_SCOND)^C_SCOND_XOR]
        if s&C_SBIT != 0 {
                sc += ".S"
@@ -368,6 +383,30 @@ func offConv(off int64) string {
        return fmt.Sprintf("%+d", off)
 }
 
+// opSuffixSet is like regListSet, but for opcode suffixes.
+//
+// Unlike some other similar structures, uint8 space is not
+// divided by it's own values set (because the're only 256 of them).
+// Instead, every arch may interpret/format all 8 bits as they like,
+// as long as they register proper cconv function for it.
+type opSuffixSet struct {
+       arch  string
+       cconv func(suffix uint8) string
+}
+
+var opSuffixSpace []opSuffixSet
+
+// RegisterOpSuffix assigns cconv function for formatting opcode suffixes
+// when compiling for GOARCH=arch.
+//
+// cconv is never called with 0 argument.
+func RegisterOpSuffix(arch string, cconv func(uint8) string) {
+       opSuffixSpace = append(opSuffixSpace, opSuffixSet{
+               arch:  arch,
+               cconv: cconv,
+       })
+}
+
 type regSet struct {
        lo    int
        hi    int
@@ -434,6 +473,10 @@ const (
        // arm64 uses the 60th bit to differentiate from other archs
        RegListARM64Lo = 1 << 60
        RegListARM64Hi = 1<<61 - 1
+
+       // x86 uses the 61th bit to differentiate from other archs
+       RegListX86Lo = 1 << 61
+       RegListX86Hi = 1<<62 - 1
 )
 
 // RegisterRegisterList binds a pretty-printer (RLconv) for register list
index f39882c82f2af53f122bcac74720a9231742988b..517d541c2b6193a380f3987ccc479cf144cab5f7 100644 (file)
@@ -94,6 +94,15 @@ const (
        REG_M6
        REG_M7
 
+       REG_K0
+       REG_K1
+       REG_K2
+       REG_K3
+       REG_K4
+       REG_K5
+       REG_K6
+       REG_K7
+
        REG_X0
        REG_X1
        REG_X2
@@ -110,6 +119,22 @@ const (
        REG_X13
        REG_X14
        REG_X15
+       REG_X16
+       REG_X17
+       REG_X18
+       REG_X19
+       REG_X20
+       REG_X21
+       REG_X22
+       REG_X23
+       REG_X24
+       REG_X25
+       REG_X26
+       REG_X27
+       REG_X28
+       REG_X29
+       REG_X30
+       REG_X31
 
        REG_Y0
        REG_Y1
@@ -127,6 +152,55 @@ const (
        REG_Y13
        REG_Y14
        REG_Y15
+       REG_Y16
+       REG_Y17
+       REG_Y18
+       REG_Y19
+       REG_Y20
+       REG_Y21
+       REG_Y22
+       REG_Y23
+       REG_Y24
+       REG_Y25
+       REG_Y26
+       REG_Y27
+       REG_Y28
+       REG_Y29
+       REG_Y30
+       REG_Y31
+
+       REG_Z0
+       REG_Z1
+       REG_Z2
+       REG_Z3
+       REG_Z4
+       REG_Z5
+       REG_Z6
+       REG_Z7
+       REG_Z8
+       REG_Z9
+       REG_Z10
+       REG_Z11
+       REG_Z12
+       REG_Z13
+       REG_Z14
+       REG_Z15
+       REG_Z16
+       REG_Z17
+       REG_Z18
+       REG_Z19
+       REG_Z20
+       REG_Z21
+       REG_Z22
+       REG_Z23
+       REG_Z24
+       REG_Z25
+       REG_Z26
+       REG_Z27
+       REG_Z28
+       REG_Z29
+       REG_Z30
+       REG_Z31
 
        REG_CS
        REG_SS
@@ -221,15 +295,16 @@ var AMD64DWARFRegisters = map[int16]int16{
        REG_R14: 14,
        REG_R15: 15,
        // 16 is "Return Address RA", whatever that is.
-       // XMM registers. %xmmN => XN.
-       REG_X0:  17,
-       REG_X1:  18,
-       REG_X2:  19,
-       REG_X3:  20,
-       REG_X4:  21,
-       REG_X5:  22,
-       REG_X6:  23,
-       REG_X7:  24,
+       // 17-24 vector registers (X/Y/Z).
+       REG_X0: 17,
+       REG_X1: 18,
+       REG_X2: 19,
+       REG_X3: 20,
+       REG_X4: 21,
+       REG_X5: 22,
+       REG_X6: 23,
+       REG_X7: 24,
+       // 25-32 extended vector registers (X/Y/Z).
        REG_X8:  25,
        REG_X9:  26,
        REG_X10: 27,
@@ -267,6 +342,34 @@ var AMD64DWARFRegisters = map[int16]int16{
        REG_TR:   62,
        REG_LDTR: 63,
        // 64-66 are mxcsr, fcw, fsw, which don't have names.
+
+       // 67-82 upper vector registers (X/Y/Z).
+       REG_X16: 67,
+       REG_X17: 68,
+       REG_X18: 69,
+       REG_X19: 70,
+       REG_X20: 71,
+       REG_X21: 72,
+       REG_X22: 73,
+       REG_X23: 74,
+       REG_X24: 75,
+       REG_X25: 76,
+       REG_X26: 77,
+       REG_X27: 78,
+       REG_X28: 79,
+       REG_X29: 80,
+       REG_X30: 81,
+       REG_X31: 82,
+
+       // 118-125 vector mask registers. %kN => KN.
+       REG_K0: 118,
+       REG_K1: 119,
+       REG_K2: 120,
+       REG_K3: 121,
+       REG_K4: 122,
+       REG_K5: 123,
+       REG_K6: 124,
+       REG_K7: 125,
 }
 
 // https://www.uclibc.org/docs/psABI-i386.pdf, table 2.14
index 566e0cdf3bdb8846cde8f511c5b3e47b6f8cf8c3..67cf5b1b46a22a16620e031b17b09390b9412d2b 100644 (file)
@@ -387,6 +387,57 @@ const (
        AJPC // parity clear
        AJPL // sign bit clear (positive)
        AJPS // parity set
+       AKADDB
+       AKADDD
+       AKADDQ
+       AKADDW
+       AKANDB
+       AKANDD
+       AKANDNB
+       AKANDND
+       AKANDNQ
+       AKANDNW
+       AKANDQ
+       AKANDW
+       AKMOVB
+       AKMOVD
+       AKMOVQ
+       AKMOVW
+       AKNOTB
+       AKNOTD
+       AKNOTQ
+       AKNOTW
+       AKORB
+       AKORD
+       AKORQ
+       AKORTESTB
+       AKORTESTD
+       AKORTESTQ
+       AKORTESTW
+       AKORW
+       AKSHIFTLB
+       AKSHIFTLD
+       AKSHIFTLQ
+       AKSHIFTLW
+       AKSHIFTRB
+       AKSHIFTRD
+       AKSHIFTRQ
+       AKSHIFTRW
+       AKTESTB
+       AKTESTD
+       AKTESTQ
+       AKTESTW
+       AKUNPCKBW
+       AKUNPCKDQ
+       AKUNPCKWD
+       AKXNORB
+       AKXNORD
+       AKXNORQ
+       AKXNORW
+       AKXORB
+       AKXORD
+       AKXORQ
+       AKXORW
        ALAHF
        ALARL
        ALARQ
@@ -838,6 +889,10 @@ const (
        AUNPCKHPS
        AUNPCKLPD
        AUNPCKLPS
+       AV4FMADDPS
+       AV4FMADDSS
+       AV4FNMADDPS
+       AV4FNMADDSS
        AVADDPD
        AVADDPS
        AVADDSD
@@ -850,16 +905,30 @@ const (
        AVAESENCLAST
        AVAESIMC
        AVAESKEYGENASSIST
+       AVALIGND
+       AVALIGNQ
        AVANDNPD
        AVANDNPS
        AVANDPD
        AVANDPS
+       AVBLENDMPD
+       AVBLENDMPS
        AVBLENDPD
        AVBLENDPS
        AVBLENDVPD
        AVBLENDVPS
        AVBROADCASTF128
+       AVBROADCASTF32X2
+       AVBROADCASTF32X4
+       AVBROADCASTF32X8
+       AVBROADCASTF64X2
+       AVBROADCASTF64X4
        AVBROADCASTI128
+       AVBROADCASTI32X2
+       AVBROADCASTI32X4
+       AVBROADCASTI32X8
+       AVBROADCASTI64X2
+       AVBROADCASTI64X4
        AVBROADCASTSD
        AVBROADCASTSS
        AVCMPPD
@@ -868,19 +937,38 @@ const (
        AVCMPSS
        AVCOMISD
        AVCOMISS
+       AVCOMPRESSPD
+       AVCOMPRESSPS
        AVCVTDQ2PD
        AVCVTDQ2PS
+       AVCVTPD2DQ
        AVCVTPD2DQX
        AVCVTPD2DQY
+       AVCVTPD2PS
        AVCVTPD2PSX
        AVCVTPD2PSY
+       AVCVTPD2QQ
+       AVCVTPD2UDQ
+       AVCVTPD2UDQX
+       AVCVTPD2UDQY
+       AVCVTPD2UQQ
        AVCVTPH2PS
        AVCVTPS2DQ
        AVCVTPS2PD
        AVCVTPS2PH
+       AVCVTPS2QQ
+       AVCVTPS2UDQ
+       AVCVTPS2UQQ
+       AVCVTQQ2PD
+       AVCVTQQ2PS
+       AVCVTQQ2PSX
+       AVCVTQQ2PSY
        AVCVTSD2SI
        AVCVTSD2SIQ
        AVCVTSD2SS
+       AVCVTSD2USI
+       AVCVTSD2USIL
+       AVCVTSD2USIQ
        AVCVTSI2SDL
        AVCVTSI2SDQ
        AVCVTSI2SSL
@@ -888,13 +976,44 @@ const (
        AVCVTSS2SD
        AVCVTSS2SI
        AVCVTSS2SIQ
+       AVCVTSS2USI
+       AVCVTSS2USIL
+       AVCVTSS2USIQ
+       AVCVTTPD2DQ
        AVCVTTPD2DQX
        AVCVTTPD2DQY
+       AVCVTTPD2QQ
+       AVCVTTPD2UDQ
+       AVCVTTPD2UDQX
+       AVCVTTPD2UDQY
+       AVCVTTPD2UQQ
        AVCVTTPS2DQ
+       AVCVTTPS2QQ
+       AVCVTTPS2UDQ
+       AVCVTTPS2UQQ
        AVCVTTSD2SI
        AVCVTTSD2SIQ
+       AVCVTTSD2USI
+       AVCVTTSD2USIL
+       AVCVTTSD2USIQ
        AVCVTTSS2SI
        AVCVTTSS2SIQ
+       AVCVTTSS2USI
+       AVCVTTSS2USIL
+       AVCVTTSS2USIQ
+       AVCVTUDQ2PD
+       AVCVTUDQ2PS
+       AVCVTUQQ2PD
+       AVCVTUQQ2PS
+       AVCVTUQQ2PSX
+       AVCVTUQQ2PSY
+       AVCVTUSI2SD
+       AVCVTUSI2SDL
+       AVCVTUSI2SDQ
+       AVCVTUSI2SS
+       AVCVTUSI2SSL
+       AVCVTUSI2SSQ
+       AVDBPSADBW
        AVDIVPD
        AVDIVPS
        AVDIVSD
@@ -903,9 +1022,25 @@ const (
        AVDPPS
        AVERR
        AVERW
+       AVEXP2PD
+       AVEXP2PS
+       AVEXPANDPD
+       AVEXPANDPS
        AVEXTRACTF128
+       AVEXTRACTF32X4
+       AVEXTRACTF32X8
+       AVEXTRACTF64X2
+       AVEXTRACTF64X4
        AVEXTRACTI128
+       AVEXTRACTI32X4
+       AVEXTRACTI32X8
+       AVEXTRACTI64X2
+       AVEXTRACTI64X4
        AVEXTRACTPS
+       AVFIXUPIMMPD
+       AVFIXUPIMMPS
+       AVFIXUPIMMSD
+       AVFIXUPIMMSS
        AVFMADD132PD
        AVFMADD132PS
        AVFMADD132SD
@@ -966,16 +1101,53 @@ const (
        AVFNMSUB231PS
        AVFNMSUB231SD
        AVFNMSUB231SS
+       AVFPCLASSPD
+       AVFPCLASSPDX
+       AVFPCLASSPDY
+       AVFPCLASSPDZ
+       AVFPCLASSPS
+       AVFPCLASSPSX
+       AVFPCLASSPSY
+       AVFPCLASSPSZ
+       AVFPCLASSSD
+       AVFPCLASSSS
        AVGATHERDPD
        AVGATHERDPS
+       AVGATHERPF0DPD
+       AVGATHERPF0DPS
+       AVGATHERPF0QPD
+       AVGATHERPF0QPS
+       AVGATHERPF1DPD
+       AVGATHERPF1DPS
+       AVGATHERPF1QPD
+       AVGATHERPF1QPS
        AVGATHERQPD
        AVGATHERQPS
+       AVGETEXPPD
+       AVGETEXPPS
+       AVGETEXPSD
+       AVGETEXPSS
+       AVGETMANTPD
+       AVGETMANTPS
+       AVGETMANTSD
+       AVGETMANTSS
+       AVGF2P8AFFINEINVQB
+       AVGF2P8AFFINEQB
+       AVGF2P8MULB
        AVHADDPD
        AVHADDPS
        AVHSUBPD
        AVHSUBPS
        AVINSERTF128
+       AVINSERTF32X4
+       AVINSERTF32X8
+       AVINSERTF64X2
+       AVINSERTF64X4
        AVINSERTI128
+       AVINSERTI32X4
+       AVINSERTI32X8
+       AVINSERTI64X2
+       AVINSERTI64X4
        AVINSERTPS
        AVLDDQU
        AVLDMXCSR
@@ -995,7 +1167,13 @@ const (
        AVMOVD
        AVMOVDDUP
        AVMOVDQA
+       AVMOVDQA32
+       AVMOVDQA64
        AVMOVDQU
+       AVMOVDQU16
+       AVMOVDQU32
+       AVMOVDQU64
+       AVMOVDQU8
        AVMOVHLPS
        AVMOVHPD
        AVMOVHPS
@@ -1022,8 +1200,11 @@ const (
        AVMULSS
        AVORPD
        AVORPS
+       AVP4DPWSSD
+       AVP4DPWSSDS
        AVPABSB
        AVPABSD
+       AVPABSQ
        AVPABSW
        AVPACKSSDW
        AVPACKSSWB
@@ -1039,17 +1220,29 @@ const (
        AVPADDW
        AVPALIGNR
        AVPAND
+       AVPANDD
        AVPANDN
+       AVPANDND
+       AVPANDNQ
+       AVPANDQ
        AVPAVGB
        AVPAVGW
        AVPBLENDD
+       AVPBLENDMB
+       AVPBLENDMD
+       AVPBLENDMQ
+       AVPBLENDMW
        AVPBLENDVB
        AVPBLENDW
        AVPBROADCASTB
        AVPBROADCASTD
+       AVPBROADCASTMB2Q
+       AVPBROADCASTMW2D
        AVPBROADCASTQ
        AVPBROADCASTW
        AVPCLMULQDQ
+       AVPCMPB
+       AVPCMPD
        AVPCMPEQB
        AVPCMPEQD
        AVPCMPEQQ
@@ -1062,14 +1255,48 @@ const (
        AVPCMPGTW
        AVPCMPISTRI
        AVPCMPISTRM
+       AVPCMPQ
+       AVPCMPUB
+       AVPCMPUD
+       AVPCMPUQ
+       AVPCMPUW
+       AVPCMPW
+       AVPCOMPRESSB
+       AVPCOMPRESSD
+       AVPCOMPRESSQ
+       AVPCOMPRESSW
+       AVPCONFLICTD
+       AVPCONFLICTQ
+       AVPDPBUSD
+       AVPDPBUSDS
+       AVPDPWSSD
+       AVPDPWSSDS
        AVPERM2F128
        AVPERM2I128
+       AVPERMB
        AVPERMD
+       AVPERMI2B
+       AVPERMI2D
+       AVPERMI2PD
+       AVPERMI2PS
+       AVPERMI2Q
+       AVPERMI2W
        AVPERMILPD
        AVPERMILPS
        AVPERMPD
        AVPERMPS
        AVPERMQ
+       AVPERMT2B
+       AVPERMT2D
+       AVPERMT2PD
+       AVPERMT2PS
+       AVPERMT2Q
+       AVPERMT2W
+       AVPERMW
+       AVPEXPANDB
+       AVPEXPANDD
+       AVPEXPANDQ
+       AVPEXPANDW
        AVPEXTRB
        AVPEXTRD
        AVPEXTRQ
@@ -1089,29 +1316,63 @@ const (
        AVPINSRD
        AVPINSRQ
        AVPINSRW
+       AVPLZCNTD
+       AVPLZCNTQ
+       AVPMADD52HUQ
+       AVPMADD52LUQ
        AVPMADDUBSW
        AVPMADDWD
        AVPMASKMOVD
        AVPMASKMOVQ
        AVPMAXSB
        AVPMAXSD
+       AVPMAXSQ
        AVPMAXSW
        AVPMAXUB
        AVPMAXUD
+       AVPMAXUQ
        AVPMAXUW
        AVPMINSB
        AVPMINSD
+       AVPMINSQ
        AVPMINSW
        AVPMINUB
        AVPMINUD
+       AVPMINUQ
        AVPMINUW
+       AVPMOVB2M
+       AVPMOVD2M
+       AVPMOVDB
+       AVPMOVDW
+       AVPMOVM2B
+       AVPMOVM2D
+       AVPMOVM2Q
+       AVPMOVM2W
        AVPMOVMSKB
+       AVPMOVQ2M
+       AVPMOVQB
+       AVPMOVQD
+       AVPMOVQW
+       AVPMOVSDB
+       AVPMOVSDW
+       AVPMOVSQB
+       AVPMOVSQD
+       AVPMOVSQW
+       AVPMOVSWB
        AVPMOVSXBD
        AVPMOVSXBQ
        AVPMOVSXBW
        AVPMOVSXDQ
        AVPMOVSXWD
        AVPMOVSXWQ
+       AVPMOVUSDB
+       AVPMOVUSDW
+       AVPMOVUSQB
+       AVPMOVUSQD
+       AVPMOVUSQW
+       AVPMOVUSWB
+       AVPMOVW2M
+       AVPMOVWB
        AVPMOVZXBD
        AVPMOVZXBQ
        AVPMOVZXBW
@@ -1123,11 +1384,44 @@ const (
        AVPMULHUW
        AVPMULHW
        AVPMULLD
+       AVPMULLQ
        AVPMULLW
+       AVPMULTISHIFTQB
        AVPMULUDQ
+       AVPOPCNTB
+       AVPOPCNTD
+       AVPOPCNTQ
+       AVPOPCNTW
        AVPOR
+       AVPORD
+       AVPORQ
+       AVPROLD
+       AVPROLQ
+       AVPROLVD
+       AVPROLVQ
+       AVPRORD
+       AVPRORQ
+       AVPRORVD
+       AVPRORVQ
        AVPSADBW
+       AVPSCATTERDD
+       AVPSCATTERDQ
+       AVPSCATTERQD
+       AVPSCATTERQQ
+       AVPSHLDD
+       AVPSHLDQ
+       AVPSHLDVD
+       AVPSHLDVQ
+       AVPSHLDVW
+       AVPSHLDW
+       AVPSHRDD
+       AVPSHRDQ
+       AVPSHRDVD
+       AVPSHRDVQ
+       AVPSHRDVW
+       AVPSHRDW
        AVPSHUFB
+       AVPSHUFBITQMB
        AVPSHUFD
        AVPSHUFHW
        AVPSHUFLW
@@ -1139,15 +1433,20 @@ const (
        AVPSLLQ
        AVPSLLVD
        AVPSLLVQ
+       AVPSLLVW
        AVPSLLW
        AVPSRAD
+       AVPSRAQ
        AVPSRAVD
+       AVPSRAVQ
+       AVPSRAVW
        AVPSRAW
        AVPSRLD
        AVPSRLDQ
        AVPSRLQ
        AVPSRLVD
        AVPSRLVQ
+       AVPSRLVW
        AVPSRLW
        AVPSUBB
        AVPSUBD
@@ -1157,7 +1456,17 @@ const (
        AVPSUBUSB
        AVPSUBUSW
        AVPSUBW
+       AVPTERNLOGD
+       AVPTERNLOGQ
        AVPTEST
+       AVPTESTMB
+       AVPTESTMD
+       AVPTESTMQ
+       AVPTESTMW
+       AVPTESTNMB
+       AVPTESTNMD
+       AVPTESTNMQ
+       AVPTESTNMW
        AVPUNPCKHBW
        AVPUNPCKHDQ
        AVPUNPCKHQDQ
@@ -1167,14 +1476,64 @@ const (
        AVPUNPCKLQDQ
        AVPUNPCKLWD
        AVPXOR
+       AVPXORD
+       AVPXORQ
+       AVRANGEPD
+       AVRANGEPS
+       AVRANGESD
+       AVRANGESS
+       AVRCP14PD
+       AVRCP14PS
+       AVRCP14SD
+       AVRCP14SS
+       AVRCP28PD
+       AVRCP28PS
+       AVRCP28SD
+       AVRCP28SS
        AVRCPPS
        AVRCPSS
+       AVREDUCEPD
+       AVREDUCEPS
+       AVREDUCESD
+       AVREDUCESS
+       AVRNDSCALEPD
+       AVRNDSCALEPS
+       AVRNDSCALESD
+       AVRNDSCALESS
        AVROUNDPD
        AVROUNDPS
        AVROUNDSD
        AVROUNDSS
+       AVRSQRT14PD
+       AVRSQRT14PS
+       AVRSQRT14SD
+       AVRSQRT14SS
+       AVRSQRT28PD
+       AVRSQRT28PS
+       AVRSQRT28SD
+       AVRSQRT28SS
        AVRSQRTPS
        AVRSQRTSS
+       AVSCALEFPD
+       AVSCALEFPS
+       AVSCALEFSD
+       AVSCALEFSS
+       AVSCATTERDPD
+       AVSCATTERDPS
+       AVSCATTERPF0DPD
+       AVSCATTERPF0DPS
+       AVSCATTERPF0QPD
+       AVSCATTERPF0QPS
+       AVSCATTERPF1DPD
+       AVSCATTERPF1DPS
+       AVSCATTERPF1QPD
+       AVSCATTERPF1QPS
+       AVSCATTERQPD
+       AVSCATTERQPS
+       AVSHUFF32X4
+       AVSHUFF64X2
+       AVSHUFI32X4
+       AVSHUFI64X2
        AVSHUFPD
        AVSHUFPS
        AVSQRTPD
index 7dd9790f0efa9c99d94d1756d0faedde7b34eda7..149864be7bbda7cd5572144a1a9df43e0947597e 100644 (file)
@@ -386,6 +386,57 @@ var Anames = []string{
        "JPC",
        "JPL",
        "JPS",
+       "KADDB",
+       "KADDD",
+       "KADDQ",
+       "KADDW",
+       "KANDB",
+       "KANDD",
+       "KANDNB",
+       "KANDND",
+       "KANDNQ",
+       "KANDNW",
+       "KANDQ",
+       "KANDW",
+       "KMOVB",
+       "KMOVD",
+       "KMOVQ",
+       "KMOVW",
+       "KNOTB",
+       "KNOTD",
+       "KNOTQ",
+       "KNOTW",
+       "KORB",
+       "KORD",
+       "KORQ",
+       "KORTESTB",
+       "KORTESTD",
+       "KORTESTQ",
+       "KORTESTW",
+       "KORW",
+       "KSHIFTLB",
+       "KSHIFTLD",
+       "KSHIFTLQ",
+       "KSHIFTLW",
+       "KSHIFTRB",
+       "KSHIFTRD",
+       "KSHIFTRQ",
+       "KSHIFTRW",
+       "KTESTB",
+       "KTESTD",
+       "KTESTQ",
+       "KTESTW",
+       "KUNPCKBW",
+       "KUNPCKDQ",
+       "KUNPCKWD",
+       "KXNORB",
+       "KXNORD",
+       "KXNORQ",
+       "KXNORW",
+       "KXORB",
+       "KXORD",
+       "KXORQ",
+       "KXORW",
        "LAHF",
        "LARL",
        "LARQ",
@@ -837,6 +888,10 @@ var Anames = []string{
        "UNPCKHPS",
        "UNPCKLPD",
        "UNPCKLPS",
+       "V4FMADDPS",
+       "V4FMADDSS",
+       "V4FNMADDPS",
+       "V4FNMADDSS",
        "VADDPD",
        "VADDPS",
        "VADDSD",
@@ -849,16 +904,30 @@ var Anames = []string{
        "VAESENCLAST",
        "VAESIMC",
        "VAESKEYGENASSIST",
+       "VALIGND",
+       "VALIGNQ",
        "VANDNPD",
        "VANDNPS",
        "VANDPD",
        "VANDPS",
+       "VBLENDMPD",
+       "VBLENDMPS",
        "VBLENDPD",
        "VBLENDPS",
        "VBLENDVPD",
        "VBLENDVPS",
        "VBROADCASTF128",
+       "VBROADCASTF32X2",
+       "VBROADCASTF32X4",
+       "VBROADCASTF32X8",
+       "VBROADCASTF64X2",
+       "VBROADCASTF64X4",
        "VBROADCASTI128",
+       "VBROADCASTI32X2",
+       "VBROADCASTI32X4",
+       "VBROADCASTI32X8",
+       "VBROADCASTI64X2",
+       "VBROADCASTI64X4",
        "VBROADCASTSD",
        "VBROADCASTSS",
        "VCMPPD",
@@ -867,19 +936,38 @@ var Anames = []string{
        "VCMPSS",
        "VCOMISD",
        "VCOMISS",
+       "VCOMPRESSPD",
+       "VCOMPRESSPS",
        "VCVTDQ2PD",
        "VCVTDQ2PS",
+       "VCVTPD2DQ",
        "VCVTPD2DQX",
        "VCVTPD2DQY",
+       "VCVTPD2PS",
        "VCVTPD2PSX",
        "VCVTPD2PSY",
+       "VCVTPD2QQ",
+       "VCVTPD2UDQ",
+       "VCVTPD2UDQX",
+       "VCVTPD2UDQY",
+       "VCVTPD2UQQ",
        "VCVTPH2PS",
        "VCVTPS2DQ",
        "VCVTPS2PD",
        "VCVTPS2PH",
+       "VCVTPS2QQ",
+       "VCVTPS2UDQ",
+       "VCVTPS2UQQ",
+       "VCVTQQ2PD",
+       "VCVTQQ2PS",
+       "VCVTQQ2PSX",
+       "VCVTQQ2PSY",
        "VCVTSD2SI",
        "VCVTSD2SIQ",
        "VCVTSD2SS",
+       "VCVTSD2USI",
+       "VCVTSD2USIL",
+       "VCVTSD2USIQ",
        "VCVTSI2SDL",
        "VCVTSI2SDQ",
        "VCVTSI2SSL",
@@ -887,13 +975,44 @@ var Anames = []string{
        "VCVTSS2SD",
        "VCVTSS2SI",
        "VCVTSS2SIQ",
+       "VCVTSS2USI",
+       "VCVTSS2USIL",
+       "VCVTSS2USIQ",
+       "VCVTTPD2DQ",
        "VCVTTPD2DQX",
        "VCVTTPD2DQY",
+       "VCVTTPD2QQ",
+       "VCVTTPD2UDQ",
+       "VCVTTPD2UDQX",
+       "VCVTTPD2UDQY",
+       "VCVTTPD2UQQ",
        "VCVTTPS2DQ",
+       "VCVTTPS2QQ",
+       "VCVTTPS2UDQ",
+       "VCVTTPS2UQQ",
        "VCVTTSD2SI",
        "VCVTTSD2SIQ",
+       "VCVTTSD2USI",
+       "VCVTTSD2USIL",
+       "VCVTTSD2USIQ",
        "VCVTTSS2SI",
        "VCVTTSS2SIQ",
+       "VCVTTSS2USI",
+       "VCVTTSS2USIL",
+       "VCVTTSS2USIQ",
+       "VCVTUDQ2PD",
+       "VCVTUDQ2PS",
+       "VCVTUQQ2PD",
+       "VCVTUQQ2PS",
+       "VCVTUQQ2PSX",
+       "VCVTUQQ2PSY",
+       "VCVTUSI2SD",
+       "VCVTUSI2SDL",
+       "VCVTUSI2SDQ",
+       "VCVTUSI2SS",
+       "VCVTUSI2SSL",
+       "VCVTUSI2SSQ",
+       "VDBPSADBW",
        "VDIVPD",
        "VDIVPS",
        "VDIVSD",
@@ -902,9 +1021,25 @@ var Anames = []string{
        "VDPPS",
        "VERR",
        "VERW",
+       "VEXP2PD",
+       "VEXP2PS",
+       "VEXPANDPD",
+       "VEXPANDPS",
        "VEXTRACTF128",
+       "VEXTRACTF32X4",
+       "VEXTRACTF32X8",
+       "VEXTRACTF64X2",
+       "VEXTRACTF64X4",
        "VEXTRACTI128",
+       "VEXTRACTI32X4",
+       "VEXTRACTI32X8",
+       "VEXTRACTI64X2",
+       "VEXTRACTI64X4",
        "VEXTRACTPS",
+       "VFIXUPIMMPD",
+       "VFIXUPIMMPS",
+       "VFIXUPIMMSD",
+       "VFIXUPIMMSS",
        "VFMADD132PD",
        "VFMADD132PS",
        "VFMADD132SD",
@@ -965,16 +1100,53 @@ var Anames = []string{
        "VFNMSUB231PS",
        "VFNMSUB231SD",
        "VFNMSUB231SS",
+       "VFPCLASSPD",
+       "VFPCLASSPDX",
+       "VFPCLASSPDY",
+       "VFPCLASSPDZ",
+       "VFPCLASSPS",
+       "VFPCLASSPSX",
+       "VFPCLASSPSY",
+       "VFPCLASSPSZ",
+       "VFPCLASSSD",
+       "VFPCLASSSS",
        "VGATHERDPD",
        "VGATHERDPS",
+       "VGATHERPF0DPD",
+       "VGATHERPF0DPS",
+       "VGATHERPF0QPD",
+       "VGATHERPF0QPS",
+       "VGATHERPF1DPD",
+       "VGATHERPF1DPS",
+       "VGATHERPF1QPD",
+       "VGATHERPF1QPS",
        "VGATHERQPD",
        "VGATHERQPS",
+       "VGETEXPPD",
+       "VGETEXPPS",
+       "VGETEXPSD",
+       "VGETEXPSS",
+       "VGETMANTPD",
+       "VGETMANTPS",
+       "VGETMANTSD",
+       "VGETMANTSS",
+       "VGF2P8AFFINEINVQB",
+       "VGF2P8AFFINEQB",
+       "VGF2P8MULB",
        "VHADDPD",
        "VHADDPS",
        "VHSUBPD",
        "VHSUBPS",
        "VINSERTF128",
+       "VINSERTF32X4",
+       "VINSERTF32X8",
+       "VINSERTF64X2",
+       "VINSERTF64X4",
        "VINSERTI128",
+       "VINSERTI32X4",
+       "VINSERTI32X8",
+       "VINSERTI64X2",
+       "VINSERTI64X4",
        "VINSERTPS",
        "VLDDQU",
        "VLDMXCSR",
@@ -994,7 +1166,13 @@ var Anames = []string{
        "VMOVD",
        "VMOVDDUP",
        "VMOVDQA",
+       "VMOVDQA32",
+       "VMOVDQA64",
        "VMOVDQU",
+       "VMOVDQU16",
+       "VMOVDQU32",
+       "VMOVDQU64",
+       "VMOVDQU8",
        "VMOVHLPS",
        "VMOVHPD",
        "VMOVHPS",
@@ -1021,8 +1199,11 @@ var Anames = []string{
        "VMULSS",
        "VORPD",
        "VORPS",
+       "VP4DPWSSD",
+       "VP4DPWSSDS",
        "VPABSB",
        "VPABSD",
+       "VPABSQ",
        "VPABSW",
        "VPACKSSDW",
        "VPACKSSWB",
@@ -1038,17 +1219,29 @@ var Anames = []string{
        "VPADDW",
        "VPALIGNR",
        "VPAND",
+       "VPANDD",
        "VPANDN",
+       "VPANDND",
+       "VPANDNQ",
+       "VPANDQ",
        "VPAVGB",
        "VPAVGW",
        "VPBLENDD",
+       "VPBLENDMB",
+       "VPBLENDMD",
+       "VPBLENDMQ",
+       "VPBLENDMW",
        "VPBLENDVB",
        "VPBLENDW",
        "VPBROADCASTB",
        "VPBROADCASTD",
+       "VPBROADCASTMB2Q",
+       "VPBROADCASTMW2D",
        "VPBROADCASTQ",
        "VPBROADCASTW",
        "VPCLMULQDQ",
+       "VPCMPB",
+       "VPCMPD",
        "VPCMPEQB",
        "VPCMPEQD",
        "VPCMPEQQ",
@@ -1061,14 +1254,48 @@ var Anames = []string{
        "VPCMPGTW",
        "VPCMPISTRI",
        "VPCMPISTRM",
+       "VPCMPQ",
+       "VPCMPUB",
+       "VPCMPUD",
+       "VPCMPUQ",
+       "VPCMPUW",
+       "VPCMPW",
+       "VPCOMPRESSB",
+       "VPCOMPRESSD",
+       "VPCOMPRESSQ",
+       "VPCOMPRESSW",
+       "VPCONFLICTD",
+       "VPCONFLICTQ",
+       "VPDPBUSD",
+       "VPDPBUSDS",
+       "VPDPWSSD",
+       "VPDPWSSDS",
        "VPERM2F128",
        "VPERM2I128",
+       "VPERMB",
        "VPERMD",
+       "VPERMI2B",
+       "VPERMI2D",
+       "VPERMI2PD",
+       "VPERMI2PS",
+       "VPERMI2Q",
+       "VPERMI2W",
        "VPERMILPD",
        "VPERMILPS",
        "VPERMPD",
        "VPERMPS",
        "VPERMQ",
+       "VPERMT2B",
+       "VPERMT2D",
+       "VPERMT2PD",
+       "VPERMT2PS",
+       "VPERMT2Q",
+       "VPERMT2W",
+       "VPERMW",
+       "VPEXPANDB",
+       "VPEXPANDD",
+       "VPEXPANDQ",
+       "VPEXPANDW",
        "VPEXTRB",
        "VPEXTRD",
        "VPEXTRQ",
@@ -1088,29 +1315,63 @@ var Anames = []string{
        "VPINSRD",
        "VPINSRQ",
        "VPINSRW",
+       "VPLZCNTD",
+       "VPLZCNTQ",
+       "VPMADD52HUQ",
+       "VPMADD52LUQ",
        "VPMADDUBSW",
        "VPMADDWD",
        "VPMASKMOVD",
        "VPMASKMOVQ",
        "VPMAXSB",
        "VPMAXSD",
+       "VPMAXSQ",
        "VPMAXSW",
        "VPMAXUB",
        "VPMAXUD",
+       "VPMAXUQ",
        "VPMAXUW",
        "VPMINSB",
        "VPMINSD",
+       "VPMINSQ",
        "VPMINSW",
        "VPMINUB",
        "VPMINUD",
+       "VPMINUQ",
        "VPMINUW",
+       "VPMOVB2M",
+       "VPMOVD2M",
+       "VPMOVDB",
+       "VPMOVDW",
+       "VPMOVM2B",
+       "VPMOVM2D",
+       "VPMOVM2Q",
+       "VPMOVM2W",
        "VPMOVMSKB",
+       "VPMOVQ2M",
+       "VPMOVQB",
+       "VPMOVQD",
+       "VPMOVQW",
+       "VPMOVSDB",
+       "VPMOVSDW",
+       "VPMOVSQB",
+       "VPMOVSQD",
+       "VPMOVSQW",
+       "VPMOVSWB",
        "VPMOVSXBD",
        "VPMOVSXBQ",
        "VPMOVSXBW",
        "VPMOVSXDQ",
        "VPMOVSXWD",
        "VPMOVSXWQ",
+       "VPMOVUSDB",
+       "VPMOVUSDW",
+       "VPMOVUSQB",
+       "VPMOVUSQD",
+       "VPMOVUSQW",
+       "VPMOVUSWB",
+       "VPMOVW2M",
+       "VPMOVWB",
        "VPMOVZXBD",
        "VPMOVZXBQ",
        "VPMOVZXBW",
@@ -1122,11 +1383,44 @@ var Anames = []string{
        "VPMULHUW",
        "VPMULHW",
        "VPMULLD",
+       "VPMULLQ",
        "VPMULLW",
+       "VPMULTISHIFTQB",
        "VPMULUDQ",
+       "VPOPCNTB",
+       "VPOPCNTD",
+       "VPOPCNTQ",
+       "VPOPCNTW",
        "VPOR",
+       "VPORD",
+       "VPORQ",
+       "VPROLD",
+       "VPROLQ",
+       "VPROLVD",
+       "VPROLVQ",
+       "VPRORD",
+       "VPRORQ",
+       "VPRORVD",
+       "VPRORVQ",
        "VPSADBW",
+       "VPSCATTERDD",
+       "VPSCATTERDQ",
+       "VPSCATTERQD",
+       "VPSCATTERQQ",
+       "VPSHLDD",
+       "VPSHLDQ",
+       "VPSHLDVD",
+       "VPSHLDVQ",
+       "VPSHLDVW",
+       "VPSHLDW",
+       "VPSHRDD",
+       "VPSHRDQ",
+       "VPSHRDVD",
+       "VPSHRDVQ",
+       "VPSHRDVW",
+       "VPSHRDW",
        "VPSHUFB",
+       "VPSHUFBITQMB",
        "VPSHUFD",
        "VPSHUFHW",
        "VPSHUFLW",
@@ -1138,15 +1432,20 @@ var Anames = []string{
        "VPSLLQ",
        "VPSLLVD",
        "VPSLLVQ",
+       "VPSLLVW",
        "VPSLLW",
        "VPSRAD",
+       "VPSRAQ",
        "VPSRAVD",
+       "VPSRAVQ",
+       "VPSRAVW",
        "VPSRAW",
        "VPSRLD",
        "VPSRLDQ",
        "VPSRLQ",
        "VPSRLVD",
        "VPSRLVQ",
+       "VPSRLVW",
        "VPSRLW",
        "VPSUBB",
        "VPSUBD",
@@ -1156,7 +1455,17 @@ var Anames = []string{
        "VPSUBUSB",
        "VPSUBUSW",
        "VPSUBW",
+       "VPTERNLOGD",
+       "VPTERNLOGQ",
        "VPTEST",
+       "VPTESTMB",
+       "VPTESTMD",
+       "VPTESTMQ",
+       "VPTESTMW",
+       "VPTESTNMB",
+       "VPTESTNMD",
+       "VPTESTNMQ",
+       "VPTESTNMW",
        "VPUNPCKHBW",
        "VPUNPCKHDQ",
        "VPUNPCKHQDQ",
@@ -1166,14 +1475,64 @@ var Anames = []string{
        "VPUNPCKLQDQ",
        "VPUNPCKLWD",
        "VPXOR",
+       "VPXORD",
+       "VPXORQ",
+       "VRANGEPD",
+       "VRANGEPS",
+       "VRANGESD",
+       "VRANGESS",
+       "VRCP14PD",
+       "VRCP14PS",
+       "VRCP14SD",
+       "VRCP14SS",
+       "VRCP28PD",
+       "VRCP28PS",
+       "VRCP28SD",
+       "VRCP28SS",
        "VRCPPS",
        "VRCPSS",
+       "VREDUCEPD",
+       "VREDUCEPS",
+       "VREDUCESD",
+       "VREDUCESS",
+       "VRNDSCALEPD",
+       "VRNDSCALEPS",
+       "VRNDSCALESD",
+       "VRNDSCALESS",
        "VROUNDPD",
        "VROUNDPS",
        "VROUNDSD",
        "VROUNDSS",
+       "VRSQRT14PD",
+       "VRSQRT14PS",
+       "VRSQRT14SD",
+       "VRSQRT14SS",
+       "VRSQRT28PD",
+       "VRSQRT28PS",
+       "VRSQRT28SD",
+       "VRSQRT28SS",
        "VRSQRTPS",
        "VRSQRTSS",
+       "VSCALEFPD",
+       "VSCALEFPS",
+       "VSCALEFSD",
+       "VSCALEFSS",
+       "VSCATTERDPD",
+       "VSCATTERDPS",
+       "VSCATTERPF0DPD",
+       "VSCATTERPF0DPS",
+       "VSCATTERPF0QPD",
+       "VSCATTERPF0QPS",
+       "VSCATTERPF1DPD",
+       "VSCATTERPF1DPS",
+       "VSCATTERPF1QPD",
+       "VSCATTERPF1QPS",
+       "VSCATTERQPD",
+       "VSCATTERQPS",
+       "VSHUFF32X4",
+       "VSHUFF64X2",
+       "VSHUFI32X4",
+       "VSHUFI64X2",
        "VSHUFPD",
        "VSHUFPS",
        "VSQRTPD",
index 3a7689e28d2822569b2e422c044e73e9721869ff..d3389e4f1545c750b2c3039157c91d7d5f878500 100644 (file)
@@ -78,11 +78,18 @@ const (
        branchLoopHead
 )
 
+// opBytes holds optab encoding bytes.
+// Each ytab reserves fixed amount of bytes in this array.
+//
+// The size should be the minimal number of bytes that
+// are enough to hold biggest optab op lines.
+type opBytes [31]uint8
+
 type Optab struct {
        as     obj.As
        ytab   []ytab
        prefix uint8
-       op     [23]uint8
+       op     opBytes
 }
 
 type Movtab struct {
@@ -159,13 +166,29 @@ const (
        Ytr7
        Ymr
        Ymm
-       Yxr0 // X0 only. "<XMM0>" notation in Intel manual.
-       Yxr
+       Yxr0          // X0 only. "<XMM0>" notation in Intel manual.
+       YxrEvexMulti4 // [ X<n> - X<n+3> ]; multisource YxrEvex
+       Yxr           // X0..X15
+       YxrEvex       // X0..X31
        Yxm
-       Yxvm // VSIB vector array; vm32x/vm64x
-       Yyr
+       YxmEvex       // YxrEvex+Ym
+       Yxvm          // VSIB vector array; vm32x/vm64x
+       YxvmEvex      // Yxvm which permits High-16 X register as index.
+       YyrEvexMulti4 // [ Y<n> - Y<n+3> ]; multisource YyrEvex
+       Yyr           // Y0..Y15
+       YyrEvex       // Y0..Y31
        Yym
-       Yyvm // VSIB vector array; vm32y/vm64y
+       YymEvex   // YyrEvex+Ym
+       Yyvm      // VSIB vector array; vm32y/vm64y
+       YyvmEvex  // Yyvm which permits High-16 Y register as index.
+       YzrMulti4 // [ Z<n> - Z<n+3> ]; multisource YzrEvex
+       Yzr       // Z0..Z31
+       Yzm       // Yzr+Ym
+       Yzvm      // VSIB vector array; vm32z/vm64z
+       Yk0       // K0
+       Yknot0    // K1..K7; write mask
+       Yk        // K0..K7; used for KOP
+       Ykm       // Yk+Ym; used for KOP
        Ytls
        Ytextsize
        Yindir
@@ -222,9 +245,11 @@ const (
        Zib_rr
        Zil_rr
        Zbyte
+
        Zvex_rm_v_r
        Zvex_rm_v_ro
        Zvex_r_v_rm
+       Zvex_i_rm_vo
        Zvex_v_rm_r
        Zvex_i_rm_r
        Zvex_i_r_v
@@ -234,6 +259,24 @@ const (
        Zvex_i_r_rm
        Zvex_hr_rm_v_r
 
+       Zevex_first
+       Zevex_i_r_k_rm
+       Zevex_i_r_rm
+       Zevex_i_rm_k_r
+       Zevex_i_rm_k_vo
+       Zevex_i_rm_r
+       Zevex_i_rm_v_k_r
+       Zevex_i_rm_v_r
+       Zevex_i_rm_vo
+       Zevex_k_rmo
+       Zevex_r_k_rm
+       Zevex_r_v_k_rm
+       Zevex_r_v_rm
+       Zevex_rm_k_r
+       Zevex_rm_v_k_r
+       Zevex_rm_v_r
+       Zevex_last
+
        Zmax
 )
 
@@ -259,12 +302,13 @@ const (
        Py   = 0x80 // defaults to 64-bit mode
        Py1  = 0x81 // symbolic; exact value doesn't matter
        Py3  = 0x83 // symbolic; exact value doesn't matter
-       Pvex = 0x84 // symbolic: exact value doesn't matter
+       Pavx = 0x84 // symbolic: exact value doesn't matter
 
-       Rxw = 1 << 3 // =1, 64-bit operand size
-       Rxr = 1 << 2 // extend modrm reg
-       Rxx = 1 << 1 // extend sib index
-       Rxb = 1 << 0 // extend modrm r/m, sib base, or opcode reg
+       RxrEvex = 1 << 4 // AVX512 extension to REX.R/VEX.R
+       Rxw     = 1 << 3 // =1, 64-bit operand size
+       Rxr     = 1 << 2 // extend modrm reg
+       Rxx     = 1 << 1 // extend sib index
+       Rxb     = 1 << 0 // extend modrm r/m, sib base, or opcode reg
 )
 
 const (
@@ -272,11 +316,14 @@ const (
        // The P, L, and W fields are chosen to match
        // their eventual locations in the VEX prefix bytes.
 
-       // V field - 4 bits; ignored by encoder
-       vexNOVSR = 0 // No VEX-SPECIFIED-REGISTER
-       vexNDS   = 0
-       vexNDD   = 0
-       vexDDS   = 0
+       // Encoding for VEX prefix in tables.
+       // The P, L, and W fields are chosen to match
+       // their eventual locations in the VEX prefix bytes.
+
+       // Using spare bit to make leading [E]VEX encoding byte different from
+       // 0x0f even if all other VEX fields are 0.
+       avxEscape = 1 << 6
+
        // P field - 2 bits
        vex66 = 1 << 0
        vexF3 = 2 << 0
@@ -290,7 +337,7 @@ const (
        vexWIG = 0 << 7
        vexW0  = 0 << 7
        vexW1  = 1 << 7
-       // M field - 5 bits, but mostly reserved; we can store up to 4
+       // M field - 5 bits, but mostly reserved; we can store up to 3
        vex0F   = 1 << 3
        vex0F38 = 2 << 3
        vex0F3A = 3 << 3
@@ -803,267 +850,6 @@ var yblendvpd = []ytab{
        {Z_m_r, 1, argList{Yxr0, Yxm, Yxr}},
 }
 
-// VEX instructions that come in two forms:
-//     VTHING xmm2/m128, xmmV, xmm1
-//     VTHING ymm2/m256, ymmV, ymm1
-// The opcode array in the corresponding Optab entry
-// should contain the (VEX prefixes, opcode byte) pair
-// for each of the two forms.
-// For example, the entries for VPXOR are:
-//
-//     VPXOR xmm2/m128, xmmV, xmm1
-//     VEX.NDS.128.66.0F.WIG EF /r
-//
-//     VPXOR ymm2/m256, ymmV, ymm1
-//     VEX.NDS.256.66.0F.WIG EF /r
-//
-// Produce this Optab entry:
-//
-//     {AVPXOR, yvex_xy3, Pvex, [23]uint8{VEX_NDS_128_66_0F_WIG, 0xEF, VEX_NDS_256_66_0F_WIG, 0xEF}}
-//
-var yvex_xy3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yym, Yyr, Yyr}},
-}
-
-var yvex_x3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr, Yxr}},
-}
-
-var yvex_ri3 = []ytab{
-       {Zvex_i_rm_r, 2, argList{Yi8, Ymb, Yrl}},
-}
-
-var yvex_xyi3 = []ytab{
-       {Zvex_i_rm_r, 2, argList{Yu8, Yxm, Yxr}},
-       {Zvex_i_rm_r, 2, argList{Yu8, Yym, Yyr}},
-       {Zvex_i_rm_r, 2, argList{Yi8, Yxm, Yxr}},
-       {Zvex_i_rm_r, 2, argList{Yi8, Yym, Yyr}},
-}
-
-var yvex_yyi4 = []ytab{
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yym, Yyr, Yyr}},
-}
-
-var yvex_xyi4 = []ytab{
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yxm, Yyr, Yyr}},
-}
-
-var yvex_shift = []ytab{
-       {Zvex_i_r_v, 3, argList{Yi8, Yxr, Yxr}},
-       {Zvex_i_r_v, 3, argList{Yi8, Yyr, Yyr}},
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxm, Yyr, Yyr}},
-}
-
-var yvex_shift_dq = []ytab{
-       {Zvex_i_r_v, 3, argList{Yi8, Yxr, Yxr}},
-       {Zvex_i_r_v, 3, argList{Yi8, Yyr, Yyr}},
-}
-
-var yvex_r3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yml, Yrl, Yrl}},
-}
-
-var yvex_vmr3 = []ytab{
-       {Zvex_v_rm_r, 2, argList{Yrl, Yml, Yrl}},
-}
-
-var yvex_xy2 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yym, Yyr}},
-}
-
-var yvex_xyr2 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxr, Yrl}},
-       {Zvex_rm_v_r, 2, argList{Yyr, Yrl}},
-}
-
-var yvex_vmovdqa = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr}},
-       {Zvex_r_v_rm, 2, argList{Yxr, Yxm}},
-       {Zvex_rm_v_r, 2, argList{Yym, Yyr}},
-       {Zvex_r_v_rm, 2, argList{Yyr, Yym}},
-}
-
-var yvex_vmovntdq = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Ym}},
-       {Zvex_r_v_rm, 2, argList{Yyr, Ym}},
-}
-
-var yvex_vpbroadcast = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxm, Yyr}},
-}
-
-var yvex_vpbroadcast_sd = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yyr}},
-}
-
-var yvex_vpextrw = []ytab{
-       {Zvex_i_rm_r, 2, argList{Yi8, Yxr, Yrl}},
-       {Zvex_i_r_rm, 2, argList{Yi8, Yxr, Yml}},
-}
-
-var yvex_m = []ytab{
-       {Zvex_rm_v_ro, 3, argList{Ym}},
-}
-
-var yvex_xx3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr, Yxr}},
-}
-
-var yvex_yi3 = []ytab{
-       {Zvex_i_r_rm, 2, argList{Yi8, Yyr, Yxm}},
-}
-
-var yvex_mxy = []ytab{
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yyr}},
-}
-
-var yvex_yy3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yym, Yyr, Yyr}},
-}
-
-var yvex_xi3 = []ytab{
-       {Zvex_i_rm_r, 2, argList{Yi8, Yxm, Yxr}},
-}
-
-var yvex_vpermpd = []ytab{
-       {Zvex_i_rm_r, 0, argList{Yu8, Yym, Yyr}},
-       // Allow int8 for backwards compatibility with negative values
-       // like $-1.
-       {Zvex_i_rm_r, 2, argList{Yi8, Yym, Yyr}},
-}
-
-var yvex_vpermilp = []ytab{
-       {Zvex_i_rm_r, 2, argList{Yi8, Yxm, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr, Yxr}},
-       {Zvex_i_rm_r, 2, argList{Yi8, Yym, Yyr}},
-       {Zvex_rm_v_r, 2, argList{Yym, Yyr, Yyr}},
-}
-
-var yvex_vcvtps2ph = []ytab{
-       {Zvex_i_r_rm, 2, argList{Yi8, Yyr, Yxm}},
-       {Zvex_i_r_rm, 2, argList{Yi8, Yxr, Yxm}},
-}
-
-var yvex_vbroadcastf = []ytab{
-       {Zvex_rm_v_r, 2, argList{Ym, Yyr}},
-}
-
-var yvex_vmovd = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Yml}},
-       {Zvex_rm_v_r, 2, argList{Yml, Yxr}},
-}
-
-var yvex_x2 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr}},
-}
-
-var yvex_y2 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yym, Yxr}},
-}
-
-var yvex = []ytab{
-       {Zvex, 2, argList{}},
-}
-
-var yvex_xx2 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr}},
-}
-
-var yvex_vpalignr = []ytab{
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yxm, Yxr, Yxr}},
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yym, Yyr, Yyr}},
-}
-
-var yvex_rxi4 = []ytab{
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yml, Yxr, Yxr}},
-}
-
-var yvex_xxi4 = []ytab{
-       {Zvex_i_rm_v_r, 2, argList{Yu8, Yxm, Yxr, Yxr}},
-}
-
-var yvex_xy4 = []ytab{
-       {Zvex_hr_rm_v_r, 2, argList{Yxr, Yxm, Yxr, Yxr}},
-       {Zvex_hr_rm_v_r, 2, argList{Yyr, Yym, Yyr, Yyr}},
-}
-
-var yvex_vpbroadcast_ss = []ytab{
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yyr}},
-       {Zvex_rm_v_r, 2, argList{Yxr, Yyr}},
-}
-
-var yvex_vblendvpd = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Yxr, Yml}},
-       {Zvex_r_v_rm, 2, argList{Yyr, Yyr, Yml}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yyr, Yyr}},
-}
-
-var yvex_vmov = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Ym}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr, Yxr}},
-}
-
-var yvex_vps = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yxr, Yxr}},
-       {Zvex_i_r_v, 3, argList{Yi8, Yxr, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxm, Yyr, Yyr}},
-       {Zvex_i_r_v, 3, argList{Yi8, Yyr, Yyr}},
-}
-
-var yvex_r2 = []ytab{
-       {Zvex_rm_r_vo, 3, argList{Yml, Yrl}},
-}
-
-var yvex_vpextr = []ytab{
-       {Zvex_i_r_rm, 2, argList{Yi8, Yxr, Yml}},
-}
-
-var yvex_rx3 = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yml, Yxr, Yxr}},
-}
-
-var yvex_vcvtsd2si = []ytab{
-       {Zvex_rm_v_r, 2, argList{Yxm, Yrl}},
-}
-
-var yvex_vmovhpd = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Ym}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr, Yxr}},
-}
-
-var yvex_vmovq = []ytab{
-       {Zvex_r_v_rm, 2, argList{Yxr, Yml}},
-       {Zvex_rm_v_r, 2, argList{Ym, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yml, Yxr}},
-       {Zvex_rm_v_r, 2, argList{Yxr, Yxr}},
-       {Zvex_r_v_rm, 2, argList{Yxr, Yxm}},
-}
-
-var yvpgatherdq = []ytab{
-       {Zvex_v_rm_r, 2, argList{Yxr, Yxvm, Yxr}},
-       {Zvex_v_rm_r, 2, argList{Yyr, Yxvm, Yyr}},
-}
-
-var yvpgatherqq = []ytab{
-       {Zvex_v_rm_r, 2, argList{Yxr, Yxvm, Yxr}},
-       {Zvex_v_rm_r, 2, argList{Yyr, Yyvm, Yyr}},
-}
-
-var yvgatherqps = []ytab{
-       {Zvex_v_rm_r, 2, argList{Yxr, Yxvm, Yxr}},
-       {Zvex_v_rm_r, 2, argList{Yxr, Yyvm, Yxr}},
-}
-
 var ymmxmm0f38 = []ytab{
        {Zlitm_r, 3, argList{Ymm, Ymr}},
        {Zlitm_r, 5, argList{Yxm, Yxr}},
@@ -1103,7 +889,7 @@ var ysha1rnds4 = []ytab{
 // is, the Ztype) and the z bytes.
 //
 // For example, let's look at AADDL.  The optab line says:
-//        {AADDL, yaddl, Px, [23]uint8{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
+//        {AADDL, yaddl, Px, opBytes{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
 //
 // and yaddl says
 //        var yaddl = []ytab{
@@ -1116,7 +902,7 @@ var ysha1rnds4 = []ytab{
 //
 // so there are 5 possible types of ADDL instruction that can be laid down, and
 // possible states used to lay them down (Ztype and z pointer, assuming z
-// points at [23]uint8{0x83, 00, 0x05,0x81, 00, 0x01, 0x03}) are:
+// points at opBytes{0x83, 00, 0x05,0x81, 00, 0x01, 0x03}) are:
 //
 //        Yi8, Yml -> Zibo_m, z (0x83, 00)
 //        Yi32, Yax -> Zil_, z+2 (0x05)
@@ -1134,910 +920,873 @@ var ysha1rnds4 = []ytab{
 var optab =
 //     as, ytab, andproto, opcode
 [...]Optab{
-       {obj.AXXX, nil, 0, [23]uint8{}},
-       {AAAA, ynone, P32, [23]uint8{0x37}},
-       {AAAD, ynone, P32, [23]uint8{0xd5, 0x0a}},
-       {AAAM, ynone, P32, [23]uint8{0xd4, 0x0a}},
-       {AAAS, ynone, P32, [23]uint8{0x3f}},
-       {AADCB, yxorb, Pb, [23]uint8{0x14, 0x80, 02, 0x10, 0x12}},
-       {AADCL, yaddl, Px, [23]uint8{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
-       {AADCQ, yaddl, Pw, [23]uint8{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
-       {AADCW, yaddl, Pe, [23]uint8{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
-       {AADCXL, yml_rl, Pq4, [23]uint8{0xf6}},
-       {AADCXQ, yml_rl, Pq4w, [23]uint8{0xf6}},
-       {AADDB, yxorb, Pb, [23]uint8{0x04, 0x80, 00, 0x00, 0x02}},
-       {AADDL, yaddl, Px, [23]uint8{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
-       {AADDPD, yxm, Pq, [23]uint8{0x58}},
-       {AADDPS, yxm, Pm, [23]uint8{0x58}},
-       {AADDQ, yaddl, Pw, [23]uint8{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
-       {AADDSD, yxm, Pf2, [23]uint8{0x58}},
-       {AADDSS, yxm, Pf3, [23]uint8{0x58}},
-       {AADDSUBPD, yxm, Pq, [23]uint8{0xd0}},
-       {AADDSUBPS, yxm, Pf2, [23]uint8{0xd0}},
-       {AADDW, yaddl, Pe, [23]uint8{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
-       {AADOXL, yml_rl, Pq5, [23]uint8{0xf6}},
-       {AADOXQ, yml_rl, Pq5w, [23]uint8{0xf6}},
-       {AADJSP, nil, 0, [23]uint8{}},
-       {AANDB, yxorb, Pb, [23]uint8{0x24, 0x80, 04, 0x20, 0x22}},
-       {AANDL, yaddl, Px, [23]uint8{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
-       {AANDNPD, yxm, Pq, [23]uint8{0x55}},
-       {AANDNPS, yxm, Pm, [23]uint8{0x55}},
-       {AANDPD, yxm, Pq, [23]uint8{0x54}},
-       {AANDPS, yxm, Pm, [23]uint8{0x54}},
-       {AANDQ, yaddl, Pw, [23]uint8{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
-       {AANDW, yaddl, Pe, [23]uint8{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
-       {AARPL, yrl_ml, P32, [23]uint8{0x63}},
-       {ABOUNDL, yrl_m, P32, [23]uint8{0x62}},
-       {ABOUNDW, yrl_m, Pe, [23]uint8{0x62}},
-       {ABSFL, yml_rl, Pm, [23]uint8{0xbc}},
-       {ABSFQ, yml_rl, Pw, [23]uint8{0x0f, 0xbc}},
-       {ABSFW, yml_rl, Pq, [23]uint8{0xbc}},
-       {ABSRL, yml_rl, Pm, [23]uint8{0xbd}},
-       {ABSRQ, yml_rl, Pw, [23]uint8{0x0f, 0xbd}},
-       {ABSRW, yml_rl, Pq, [23]uint8{0xbd}},
-       {ABSWAPW, ybswap, Pe, [23]uint8{0x0f, 0xc8}},
-       {ABSWAPL, ybswap, Px, [23]uint8{0x0f, 0xc8}},
-       {ABSWAPQ, ybswap, Pw, [23]uint8{0x0f, 0xc8}},
-       {ABTCL, ybtl, Pm, [23]uint8{0xba, 07, 0xbb}},
-       {ABTCQ, ybtl, Pw, [23]uint8{0x0f, 0xba, 07, 0x0f, 0xbb}},
-       {ABTCW, ybtl, Pq, [23]uint8{0xba, 07, 0xbb}},
-       {ABTL, ybtl, Pm, [23]uint8{0xba, 04, 0xa3}},
-       {ABTQ, ybtl, Pw, [23]uint8{0x0f, 0xba, 04, 0x0f, 0xa3}},
-       {ABTRL, ybtl, Pm, [23]uint8{0xba, 06, 0xb3}},
-       {ABTRQ, ybtl, Pw, [23]uint8{0x0f, 0xba, 06, 0x0f, 0xb3}},
-       {ABTRW, ybtl, Pq, [23]uint8{0xba, 06, 0xb3}},
-       {ABTSL, ybtl, Pm, [23]uint8{0xba, 05, 0xab}},
-       {ABTSQ, ybtl, Pw, [23]uint8{0x0f, 0xba, 05, 0x0f, 0xab}},
-       {ABTSW, ybtl, Pq, [23]uint8{0xba, 05, 0xab}},
-       {ABTW, ybtl, Pq, [23]uint8{0xba, 04, 0xa3}},
-       {ABYTE, ybyte, Px, [23]uint8{1}},
-       {obj.ACALL, ycall, Px, [23]uint8{0xff, 02, 0xff, 0x15, 0xe8}},
-       {ACBW, ynone, Pe, [23]uint8{0x98}},
-       {ACDQ, ynone, Px, [23]uint8{0x99}},
-       {ACDQE, ynone, Pw, [23]uint8{0x98}},
-       {ACLAC, ynone, Pm, [23]uint8{01, 0xca}},
-       {ACLC, ynone, Px, [23]uint8{0xf8}},
-       {ACLD, ynone, Px, [23]uint8{0xfc}},
-       {ACLFLUSH, yclflush, Pm, [23]uint8{0xae, 07}},
-       {ACLFLUSHOPT, yclflush, Pq, [23]uint8{0xae, 07}},
-       {ACLI, ynone, Px, [23]uint8{0xfa}},
-       {ACLTS, ynone, Pm, [23]uint8{0x06}},
-       {ACMC, ynone, Px, [23]uint8{0xf5}},
-       {ACMOVLCC, yml_rl, Pm, [23]uint8{0x43}},
-       {ACMOVLCS, yml_rl, Pm, [23]uint8{0x42}},
-       {ACMOVLEQ, yml_rl, Pm, [23]uint8{0x44}},
-       {ACMOVLGE, yml_rl, Pm, [23]uint8{0x4d}},
-       {ACMOVLGT, yml_rl, Pm, [23]uint8{0x4f}},
-       {ACMOVLHI, yml_rl, Pm, [23]uint8{0x47}},
-       {ACMOVLLE, yml_rl, Pm, [23]uint8{0x4e}},
-       {ACMOVLLS, yml_rl, Pm, [23]uint8{0x46}},
-       {ACMOVLLT, yml_rl, Pm, [23]uint8{0x4c}},
-       {ACMOVLMI, yml_rl, Pm, [23]uint8{0x48}},
-       {ACMOVLNE, yml_rl, Pm, [23]uint8{0x45}},
-       {ACMOVLOC, yml_rl, Pm, [23]uint8{0x41}},
-       {ACMOVLOS, yml_rl, Pm, [23]uint8{0x40}},
-       {ACMOVLPC, yml_rl, Pm, [23]uint8{0x4b}},
-       {ACMOVLPL, yml_rl, Pm, [23]uint8{0x49}},
-       {ACMOVLPS, yml_rl, Pm, [23]uint8{0x4a}},
-       {ACMOVQCC, yml_rl, Pw, [23]uint8{0x0f, 0x43}},
-       {ACMOVQCS, yml_rl, Pw, [23]uint8{0x0f, 0x42}},
-       {ACMOVQEQ, yml_rl, Pw, [23]uint8{0x0f, 0x44}},
-       {ACMOVQGE, yml_rl, Pw, [23]uint8{0x0f, 0x4d}},
-       {ACMOVQGT, yml_rl, Pw, [23]uint8{0x0f, 0x4f}},
-       {ACMOVQHI, yml_rl, Pw, [23]uint8{0x0f, 0x47}},
-       {ACMOVQLE, yml_rl, Pw, [23]uint8{0x0f, 0x4e}},
-       {ACMOVQLS, yml_rl, Pw, [23]uint8{0x0f, 0x46}},
-       {ACMOVQLT, yml_rl, Pw, [23]uint8{0x0f, 0x4c}},
-       {ACMOVQMI, yml_rl, Pw, [23]uint8{0x0f, 0x48}},
-       {ACMOVQNE, yml_rl, Pw, [23]uint8{0x0f, 0x45}},
-       {ACMOVQOC, yml_rl, Pw, [23]uint8{0x0f, 0x41}},
-       {ACMOVQOS, yml_rl, Pw, [23]uint8{0x0f, 0x40}},
-       {ACMOVQPC, yml_rl, Pw, [23]uint8{0x0f, 0x4b}},
-       {ACMOVQPL, yml_rl, Pw, [23]uint8{0x0f, 0x49}},
-       {ACMOVQPS, yml_rl, Pw, [23]uint8{0x0f, 0x4a}},
-       {ACMOVWCC, yml_rl, Pq, [23]uint8{0x43}},
-       {ACMOVWCS, yml_rl, Pq, [23]uint8{0x42}},
-       {ACMOVWEQ, yml_rl, Pq, [23]uint8{0x44}},
-       {ACMOVWGE, yml_rl, Pq, [23]uint8{0x4d}},
-       {ACMOVWGT, yml_rl, Pq, [23]uint8{0x4f}},
-       {ACMOVWHI, yml_rl, Pq, [23]uint8{0x47}},
-       {ACMOVWLE, yml_rl, Pq, [23]uint8{0x4e}},
-       {ACMOVWLS, yml_rl, Pq, [23]uint8{0x46}},
-       {ACMOVWLT, yml_rl, Pq, [23]uint8{0x4c}},
-       {ACMOVWMI, yml_rl, Pq, [23]uint8{0x48}},
-       {ACMOVWNE, yml_rl, Pq, [23]uint8{0x45}},
-       {ACMOVWOC, yml_rl, Pq, [23]uint8{0x41}},
-       {ACMOVWOS, yml_rl, Pq, [23]uint8{0x40}},
-       {ACMOVWPC, yml_rl, Pq, [23]uint8{0x4b}},
-       {ACMOVWPL, yml_rl, Pq, [23]uint8{0x49}},
-       {ACMOVWPS, yml_rl, Pq, [23]uint8{0x4a}},
-       {ACMPB, ycmpb, Pb, [23]uint8{0x3c, 0x80, 07, 0x38, 0x3a}},
-       {ACMPL, ycmpl, Px, [23]uint8{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
-       {ACMPPD, yxcmpi, Px, [23]uint8{Pe, 0xc2}},
-       {ACMPPS, yxcmpi, Pm, [23]uint8{0xc2, 0}},
-       {ACMPQ, ycmpl, Pw, [23]uint8{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
-       {ACMPSB, ynone, Pb, [23]uint8{0xa6}},
-       {ACMPSD, yxcmpi, Px, [23]uint8{Pf2, 0xc2}},
-       {ACMPSL, ynone, Px, [23]uint8{0xa7}},
-       {ACMPSQ, ynone, Pw, [23]uint8{0xa7}},
-       {ACMPSS, yxcmpi, Px, [23]uint8{Pf3, 0xc2}},
-       {ACMPSW, ynone, Pe, [23]uint8{0xa7}},
-       {ACMPW, ycmpl, Pe, [23]uint8{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
-       {ACOMISD, yxm, Pe, [23]uint8{0x2f}},
-       {ACOMISS, yxm, Pm, [23]uint8{0x2f}},
-       {ACPUID, ynone, Pm, [23]uint8{0xa2}},
-       {ACVTPL2PD, yxcvm2, Px, [23]uint8{Pf3, 0xe6, Pe, 0x2a}},
-       {ACVTPL2PS, yxcvm2, Pm, [23]uint8{0x5b, 0, 0x2a, 0}},
-       {ACVTPD2PL, yxcvm1, Px, [23]uint8{Pf2, 0xe6, Pe, 0x2d}},
-       {ACVTPD2PS, yxm, Pe, [23]uint8{0x5a}},
-       {ACVTPS2PL, yxcvm1, Px, [23]uint8{Pe, 0x5b, Pm, 0x2d}},
-       {ACVTPS2PD, yxm, Pm, [23]uint8{0x5a}},
-       {ACVTSD2SL, yxcvfl, Pf2, [23]uint8{0x2d}},
-       {ACVTSD2SQ, yxcvfq, Pw, [23]uint8{Pf2, 0x2d}},
-       {ACVTSD2SS, yxm, Pf2, [23]uint8{0x5a}},
-       {ACVTSL2SD, yxcvlf, Pf2, [23]uint8{0x2a}},
-       {ACVTSQ2SD, yxcvqf, Pw, [23]uint8{Pf2, 0x2a}},
-       {ACVTSL2SS, yxcvlf, Pf3, [23]uint8{0x2a}},
-       {ACVTSQ2SS, yxcvqf, Pw, [23]uint8{Pf3, 0x2a}},
-       {ACVTSS2SD, yxm, Pf3, [23]uint8{0x5a}},
-       {ACVTSS2SL, yxcvfl, Pf3, [23]uint8{0x2d}},
-       {ACVTSS2SQ, yxcvfq, Pw, [23]uint8{Pf3, 0x2d}},
-       {ACVTTPD2PL, yxcvm1, Px, [23]uint8{Pe, 0xe6, Pe, 0x2c}},
-       {ACVTTPS2PL, yxcvm1, Px, [23]uint8{Pf3, 0x5b, Pm, 0x2c}},
-       {ACVTTSD2SL, yxcvfl, Pf2, [23]uint8{0x2c}},
-       {ACVTTSD2SQ, yxcvfq, Pw, [23]uint8{Pf2, 0x2c}},
-       {ACVTTSS2SL, yxcvfl, Pf3, [23]uint8{0x2c}},
-       {ACVTTSS2SQ, yxcvfq, Pw, [23]uint8{Pf3, 0x2c}},
-       {ACWD, ynone, Pe, [23]uint8{0x99}},
-       {ACWDE, ynone, Px, [23]uint8{0x98}},
-       {ACQO, ynone, Pw, [23]uint8{0x99}},
-       {ADAA, ynone, P32, [23]uint8{0x27}},
-       {ADAS, ynone, P32, [23]uint8{0x2f}},
-       {ADECB, yscond, Pb, [23]uint8{0xfe, 01}},
-       {ADECL, yincl, Px1, [23]uint8{0x48, 0xff, 01}},
-       {ADECQ, yincq, Pw, [23]uint8{0xff, 01}},
-       {ADECW, yincq, Pe, [23]uint8{0xff, 01}},
-       {ADIVB, ydivb, Pb, [23]uint8{0xf6, 06}},
-       {ADIVL, ydivl, Px, [23]uint8{0xf7, 06}},
-       {ADIVPD, yxm, Pe, [23]uint8{0x5e}},
-       {ADIVPS, yxm, Pm, [23]uint8{0x5e}},
-       {ADIVQ, ydivl, Pw, [23]uint8{0xf7, 06}},
-       {ADIVSD, yxm, Pf2, [23]uint8{0x5e}},
-       {ADIVSS, yxm, Pf3, [23]uint8{0x5e}},
-       {ADIVW, ydivl, Pe, [23]uint8{0xf7, 06}},
-       {ADPPD, yxshuf, Pq, [23]uint8{0x3a, 0x41, 0}},
-       {ADPPS, yxshuf, Pq, [23]uint8{0x3a, 0x40, 0}},
-       {AEMMS, ynone, Pm, [23]uint8{0x77}},
-       {AEXTRACTPS, yextractps, Pq, [23]uint8{0x3a, 0x17, 0}},
-       {AENTER, nil, 0, [23]uint8{}}, // botch
-       {AFXRSTOR, ysvrs_mo, Pm, [23]uint8{0xae, 01, 0xae, 01}},
-       {AFXSAVE, ysvrs_om, Pm, [23]uint8{0xae, 00, 0xae, 00}},
-       {AFXRSTOR64, ysvrs_mo, Pw, [23]uint8{0x0f, 0xae, 01, 0x0f, 0xae, 01}},
-       {AFXSAVE64, ysvrs_om, Pw, [23]uint8{0x0f, 0xae, 00, 0x0f, 0xae, 00}},
-       {AHLT, ynone, Px, [23]uint8{0xf4}},
-       {AIDIVB, ydivb, Pb, [23]uint8{0xf6, 07}},
-       {AIDIVL, ydivl, Px, [23]uint8{0xf7, 07}},
-       {AIDIVQ, ydivl, Pw, [23]uint8{0xf7, 07}},
-       {AIDIVW, ydivl, Pe, [23]uint8{0xf7, 07}},
-       {AIMULB, ydivb, Pb, [23]uint8{0xf6, 05}},
-       {AIMULL, yimul, Px, [23]uint8{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
-       {AIMULQ, yimul, Pw, [23]uint8{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
-       {AIMULW, yimul, Pe, [23]uint8{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
-       {AIMUL3W, yimul3, Pe, [23]uint8{0x6b, 00, 0x69, 00}},
-       {AIMUL3L, yimul3, Px, [23]uint8{0x6b, 00, 0x69, 00}},
-       {AIMUL3Q, yimul3, Pw, [23]uint8{0x6b, 00, 0x69, 00}},
-       {AINB, yin, Pb, [23]uint8{0xe4, 0xec}},
-       {AINW, yin, Pe, [23]uint8{0xe5, 0xed}},
-       {AINL, yin, Px, [23]uint8{0xe5, 0xed}},
-       {AINCB, yscond, Pb, [23]uint8{0xfe, 00}},
-       {AINCL, yincl, Px1, [23]uint8{0x40, 0xff, 00}},
-       {AINCQ, yincq, Pw, [23]uint8{0xff, 00}},
-       {AINCW, yincq, Pe, [23]uint8{0xff, 00}},
-       {AINSB, ynone, Pb, [23]uint8{0x6c}},
-       {AINSL, ynone, Px, [23]uint8{0x6d}},
-       {AINSERTPS, yxshuf, Pq, [23]uint8{0x3a, 0x21, 0}},
-       {AINSW, ynone, Pe, [23]uint8{0x6d}},
-       {AICEBP, ynone, Px, [23]uint8{0xf1}},
-       {AINT, yint, Px, [23]uint8{0xcd}},
-       {AINTO, ynone, P32, [23]uint8{0xce}},
-       {AIRETL, ynone, Px, [23]uint8{0xcf}},
-       {AIRETQ, ynone, Pw, [23]uint8{0xcf}},
-       {AIRETW, ynone, Pe, [23]uint8{0xcf}},
-       {AJCC, yjcond, Px, [23]uint8{0x73, 0x83, 00}},
-       {AJCS, yjcond, Px, [23]uint8{0x72, 0x82}},
-       {AJCXZL, yloop, Px, [23]uint8{0xe3}},
-       {AJCXZW, yloop, Px, [23]uint8{0xe3}},
-       {AJCXZQ, yloop, Px, [23]uint8{0xe3}},
-       {AJEQ, yjcond, Px, [23]uint8{0x74, 0x84}},
-       {AJGE, yjcond, Px, [23]uint8{0x7d, 0x8d}},
-       {AJGT, yjcond, Px, [23]uint8{0x7f, 0x8f}},
-       {AJHI, yjcond, Px, [23]uint8{0x77, 0x87}},
-       {AJLE, yjcond, Px, [23]uint8{0x7e, 0x8e}},
-       {AJLS, yjcond, Px, [23]uint8{0x76, 0x86}},
-       {AJLT, yjcond, Px, [23]uint8{0x7c, 0x8c}},
-       {AJMI, yjcond, Px, [23]uint8{0x78, 0x88}},
-       {obj.AJMP, yjmp, Px, [23]uint8{0xff, 04, 0xeb, 0xe9}},
-       {AJNE, yjcond, Px, [23]uint8{0x75, 0x85}},
-       {AJOC, yjcond, Px, [23]uint8{0x71, 0x81, 00}},
-       {AJOS, yjcond, Px, [23]uint8{0x70, 0x80, 00}},
-       {AJPC, yjcond, Px, [23]uint8{0x7b, 0x8b}},
-       {AJPL, yjcond, Px, [23]uint8{0x79, 0x89}},
-       {AJPS, yjcond, Px, [23]uint8{0x7a, 0x8a}},
-       {AHADDPD, yxm, Pq, [23]uint8{0x7c}},
-       {AHADDPS, yxm, Pf2, [23]uint8{0x7c}},
-       {AHSUBPD, yxm, Pq, [23]uint8{0x7d}},
-       {AHSUBPS, yxm, Pf2, [23]uint8{0x7d}},
-       {ALAHF, ynone, Px, [23]uint8{0x9f}},
-       {ALARL, yml_rl, Pm, [23]uint8{0x02}},
-       {ALARQ, yml_rl, Pw, [23]uint8{0x0f, 0x02}},
-       {ALARW, yml_rl, Pq, [23]uint8{0x02}},
-       {ALDDQU, ylddqu, Pf2, [23]uint8{0xf0}},
-       {ALDMXCSR, ysvrs_mo, Pm, [23]uint8{0xae, 02, 0xae, 02}},
-       {ALEAL, ym_rl, Px, [23]uint8{0x8d}},
-       {ALEAQ, ym_rl, Pw, [23]uint8{0x8d}},
-       {ALEAVEL, ynone, P32, [23]uint8{0xc9}},
-       {ALEAVEQ, ynone, Py, [23]uint8{0xc9}},
-       {ALEAVEW, ynone, Pe, [23]uint8{0xc9}},
-       {ALEAW, ym_rl, Pe, [23]uint8{0x8d}},
-       {ALOCK, ynone, Px, [23]uint8{0xf0}},
-       {ALODSB, ynone, Pb, [23]uint8{0xac}},
-       {ALODSL, ynone, Px, [23]uint8{0xad}},
-       {ALODSQ, ynone, Pw, [23]uint8{0xad}},
-       {ALODSW, ynone, Pe, [23]uint8{0xad}},
-       {ALONG, ybyte, Px, [23]uint8{4}},
-       {ALOOP, yloop, Px, [23]uint8{0xe2}},
-       {ALOOPEQ, yloop, Px, [23]uint8{0xe1}},
-       {ALOOPNE, yloop, Px, [23]uint8{0xe0}},
-       {ALTR, ydivl, Pm, [23]uint8{0x00, 03}},
-       {ALZCNTL, yml_rl, Pf3, [23]uint8{0xbd}},
-       {ALZCNTQ, yml_rl, Pfw, [23]uint8{0xbd}},
-       {ALZCNTW, yml_rl, Pef3, [23]uint8{0xbd}},
-       {ALSLL, yml_rl, Pm, [23]uint8{0x03}},
-       {ALSLW, yml_rl, Pq, [23]uint8{0x03}},
-       {ALSLQ, yml_rl, Pw, [23]uint8{0x0f, 0x03}},
-       {AMASKMOVOU, yxr, Pe, [23]uint8{0xf7}},
-       {AMASKMOVQ, ymr, Pm, [23]uint8{0xf7}},
-       {AMAXPD, yxm, Pe, [23]uint8{0x5f}},
-       {AMAXPS, yxm, Pm, [23]uint8{0x5f}},
-       {AMAXSD, yxm, Pf2, [23]uint8{0x5f}},
-       {AMAXSS, yxm, Pf3, [23]uint8{0x5f}},
-       {AMINPD, yxm, Pe, [23]uint8{0x5d}},
-       {AMINPS, yxm, Pm, [23]uint8{0x5d}},
-       {AMINSD, yxm, Pf2, [23]uint8{0x5d}},
-       {AMINSS, yxm, Pf3, [23]uint8{0x5d}},
-       {AMONITOR, ynone, Px, [23]uint8{0x0f, 0x01, 0xc8, 0}},
-       {AMWAIT, ynone, Px, [23]uint8{0x0f, 0x01, 0xc9, 0}},
-       {AMOVAPD, yxmov, Pe, [23]uint8{0x28, 0x29}},
-       {AMOVAPS, yxmov, Pm, [23]uint8{0x28, 0x29}},
-       {AMOVB, ymovb, Pb, [23]uint8{0x88, 0x8a, 0xb0, 0xc6, 00}},
-       {AMOVBLSX, ymb_rl, Pm, [23]uint8{0xbe}},
-       {AMOVBLZX, ymb_rl, Pm, [23]uint8{0xb6}},
-       {AMOVBQSX, ymb_rl, Pw, [23]uint8{0x0f, 0xbe}},
-       {AMOVBQZX, ymb_rl, Pw, [23]uint8{0x0f, 0xb6}},
-       {AMOVBWSX, ymb_rl, Pq, [23]uint8{0xbe}},
-       {AMOVSWW, ymb_rl, Pe, [23]uint8{0x0f, 0xbf}},
-       {AMOVBWZX, ymb_rl, Pq, [23]uint8{0xb6}},
-       {AMOVZWW, ymb_rl, Pe, [23]uint8{0x0f, 0xb7}},
-       {AMOVO, yxmov, Pe, [23]uint8{0x6f, 0x7f}},
-       {AMOVOU, yxmov, Pf3, [23]uint8{0x6f, 0x7f}},
-       {AMOVHLPS, yxr, Pm, [23]uint8{0x12}},
-       {AMOVHPD, yxmov, Pe, [23]uint8{0x16, 0x17}},
-       {AMOVHPS, yxmov, Pm, [23]uint8{0x16, 0x17}},
-       {AMOVL, ymovl, Px, [23]uint8{0x89, 0x8b, 0xb8, 0xc7, 00, 0x6e, 0x7e, Pe, 0x6e, Pe, 0x7e, 0}},
-       {AMOVLHPS, yxr, Pm, [23]uint8{0x16}},
-       {AMOVLPD, yxmov, Pe, [23]uint8{0x12, 0x13}},
-       {AMOVLPS, yxmov, Pm, [23]uint8{0x12, 0x13}},
-       {AMOVLQSX, yml_rl, Pw, [23]uint8{0x63}},
-       {AMOVLQZX, yml_rl, Px, [23]uint8{0x8b}},
-       {AMOVMSKPD, yxrrl, Pq, [23]uint8{0x50}},
-       {AMOVMSKPS, yxrrl, Pm, [23]uint8{0x50}},
-       {AMOVNTO, yxr_ml, Pe, [23]uint8{0xe7}},
-       {AMOVNTDQA, ylddqu, Pq4, [23]uint8{0x2a}},
-       {AMOVNTPD, yxr_ml, Pe, [23]uint8{0x2b}},
-       {AMOVNTPS, yxr_ml, Pm, [23]uint8{0x2b}},
-       {AMOVNTQ, ymr_ml, Pm, [23]uint8{0xe7}},
-       {AMOVQ, ymovq, Pw8, [23]uint8{0x6f, 0x7f, Pf2, 0xd6, Pf3, 0x7e, Pe, 0xd6, 0x89, 0x8b, 0xc7, 00, 0xb8, 0xc7, 00, 0x6e, 0x7e, Pe, 0x6e, Pe, 0x7e, 0}},
-       {AMOVQOZX, ymrxr, Pf3, [23]uint8{0xd6, 0x7e}},
-       {AMOVSB, ynone, Pb, [23]uint8{0xa4}},
-       {AMOVSD, yxmov, Pf2, [23]uint8{0x10, 0x11}},
-       {AMOVSL, ynone, Px, [23]uint8{0xa5}},
-       {AMOVSQ, ynone, Pw, [23]uint8{0xa5}},
-       {AMOVSS, yxmov, Pf3, [23]uint8{0x10, 0x11}},
-       {AMOVSW, ynone, Pe, [23]uint8{0xa5}},
-       {AMOVUPD, yxmov, Pe, [23]uint8{0x10, 0x11}},
-       {AMOVUPS, yxmov, Pm, [23]uint8{0x10, 0x11}},
-       {AMOVW, ymovw, Pe, [23]uint8{0x89, 0x8b, 0xb8, 0xc7, 00, 0}},
-       {AMOVWLSX, yml_rl, Pm, [23]uint8{0xbf}},
-       {AMOVWLZX, yml_rl, Pm, [23]uint8{0xb7}},
-       {AMOVWQSX, yml_rl, Pw, [23]uint8{0x0f, 0xbf}},
-       {AMOVWQZX, yml_rl, Pw, [23]uint8{0x0f, 0xb7}},
-       {AMPSADBW, yxshuf, Pq, [23]uint8{0x3a, 0x42, 0}},
-       {AMULB, ydivb, Pb, [23]uint8{0xf6, 04}},
-       {AMULL, ydivl, Px, [23]uint8{0xf7, 04}},
-       {AMULPD, yxm, Pe, [23]uint8{0x59}},
-       {AMULPS, yxm, Ym, [23]uint8{0x59}},
-       {AMULQ, ydivl, Pw, [23]uint8{0xf7, 04}},
-       {AMULSD, yxm, Pf2, [23]uint8{0x59}},
-       {AMULSS, yxm, Pf3, [23]uint8{0x59}},
-       {AMULW, ydivl, Pe, [23]uint8{0xf7, 04}},
-       {ANEGB, yscond, Pb, [23]uint8{0xf6, 03}},
-       {ANEGL, yscond, Px, [23]uint8{0xf7, 03}},
-       {ANEGQ, yscond, Pw, [23]uint8{0xf7, 03}},
-       {ANEGW, yscond, Pe, [23]uint8{0xf7, 03}},
-       {obj.ANOP, ynop, Px, [23]uint8{0, 0}},
-       {ANOTB, yscond, Pb, [23]uint8{0xf6, 02}},
-       {ANOTL, yscond, Px, [23]uint8{0xf7, 02}}, // TODO(rsc): yscond is wrong here.
-       {ANOTQ, yscond, Pw, [23]uint8{0xf7, 02}},
-       {ANOTW, yscond, Pe, [23]uint8{0xf7, 02}},
-       {AORB, yxorb, Pb, [23]uint8{0x0c, 0x80, 01, 0x08, 0x0a}},
-       {AORL, yaddl, Px, [23]uint8{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
-       {AORPD, yxm, Pq, [23]uint8{0x56}},
-       {AORPS, yxm, Pm, [23]uint8{0x56}},
-       {AORQ, yaddl, Pw, [23]uint8{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
-       {AORW, yaddl, Pe, [23]uint8{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
-       {AOUTB, yin, Pb, [23]uint8{0xe6, 0xee}},
-       {AOUTL, yin, Px, [23]uint8{0xe7, 0xef}},
-       {AOUTW, yin, Pe, [23]uint8{0xe7, 0xef}},
-       {AOUTSB, ynone, Pb, [23]uint8{0x6e}},
-       {AOUTSL, ynone, Px, [23]uint8{0x6f}},
-       {AOUTSW, ynone, Pe, [23]uint8{0x6f}},
-       {APABSB, yxm_q4, Pq4, [23]uint8{0x1c}},
-       {APABSD, yxm_q4, Pq4, [23]uint8{0x1e}},
-       {APABSW, yxm_q4, Pq4, [23]uint8{0x1d}},
-       {APACKSSLW, ymm, Py1, [23]uint8{0x6b, Pe, 0x6b}},
-       {APACKSSWB, ymm, Py1, [23]uint8{0x63, Pe, 0x63}},
-       {APACKUSDW, yxm_q4, Pq4, [23]uint8{0x2b}},
-       {APACKUSWB, ymm, Py1, [23]uint8{0x67, Pe, 0x67}},
-       {APADDB, ymm, Py1, [23]uint8{0xfc, Pe, 0xfc}},
-       {APADDL, ymm, Py1, [23]uint8{0xfe, Pe, 0xfe}},
-       {APADDQ, yxm, Pe, [23]uint8{0xd4}},
-       {APADDSB, ymm, Py1, [23]uint8{0xec, Pe, 0xec}},
-       {APADDSW, ymm, Py1, [23]uint8{0xed, Pe, 0xed}},
-       {APADDUSB, ymm, Py1, [23]uint8{0xdc, Pe, 0xdc}},
-       {APADDUSW, ymm, Py1, [23]uint8{0xdd, Pe, 0xdd}},
-       {APADDW, ymm, Py1, [23]uint8{0xfd, Pe, 0xfd}},
-       {APALIGNR, ypalignr, Pq, [23]uint8{0x3a, 0x0f}},
-       {APAND, ymm, Py1, [23]uint8{0xdb, Pe, 0xdb}},
-       {APANDN, ymm, Py1, [23]uint8{0xdf, Pe, 0xdf}},
-       {APAUSE, ynone, Px, [23]uint8{0xf3, 0x90}},
-       {APAVGB, ymm, Py1, [23]uint8{0xe0, Pe, 0xe0}},
-       {APAVGW, ymm, Py1, [23]uint8{0xe3, Pe, 0xe3}},
-       {APBLENDW, yxshuf, Pq, [23]uint8{0x3a, 0x0e, 0}},
-       {APCMPEQB, ymm, Py1, [23]uint8{0x74, Pe, 0x74}},
-       {APCMPEQL, ymm, Py1, [23]uint8{0x76, Pe, 0x76}},
-       {APCMPEQQ, yxm_q4, Pq4, [23]uint8{0x29}},
-       {APCMPEQW, ymm, Py1, [23]uint8{0x75, Pe, 0x75}},
-       {APCMPGTB, ymm, Py1, [23]uint8{0x64, Pe, 0x64}},
-       {APCMPGTL, ymm, Py1, [23]uint8{0x66, Pe, 0x66}},
-       {APCMPGTQ, yxm_q4, Pq4, [23]uint8{0x37}},
-       {APCMPGTW, ymm, Py1, [23]uint8{0x65, Pe, 0x65}},
-       {APCMPISTRI, yxshuf, Pq, [23]uint8{0x3a, 0x63, 0}},
-       {APCMPISTRM, yxshuf, Pq, [23]uint8{0x3a, 0x62, 0}},
-       {APEXTRW, yextrw, Pq, [23]uint8{0xc5, 0, 0x3a, 0x15, 0}},
-       {APEXTRB, yextr, Pq, [23]uint8{0x3a, 0x14, 00}},
-       {APEXTRD, yextr, Pq, [23]uint8{0x3a, 0x16, 00}},
-       {APEXTRQ, yextr, Pq3, [23]uint8{0x3a, 0x16, 00}},
-       {APHADDD, ymmxmm0f38, Px, [23]uint8{0x0F, 0x38, 0x02, 0, 0x66, 0x0F, 0x38, 0x02, 0}},
-       {APHADDSW, yxm_q4, Pq4, [23]uint8{0x03}},
-       {APHADDW, yxm_q4, Pq4, [23]uint8{0x01}},
-       {APHMINPOSUW, yxm_q4, Pq4, [23]uint8{0x41}},
-       {APHSUBD, yxm_q4, Pq4, [23]uint8{0x06}},
-       {APHSUBSW, yxm_q4, Pq4, [23]uint8{0x07}},
-       {APHSUBW, yxm_q4, Pq4, [23]uint8{0x05}},
-       {APINSRW, yinsrw, Pq, [23]uint8{0xc4, 00}},
-       {APINSRB, yinsr, Pq, [23]uint8{0x3a, 0x20, 00}},
-       {APINSRD, yinsr, Pq, [23]uint8{0x3a, 0x22, 00}},
-       {APINSRQ, yinsr, Pq3, [23]uint8{0x3a, 0x22, 00}},
-       {APMADDUBSW, yxm_q4, Pq4, [23]uint8{0x04}},
-       {APMADDWL, ymm, Py1, [23]uint8{0xf5, Pe, 0xf5}},
-       {APMAXSB, yxm_q4, Pq4, [23]uint8{0x3c}},
-       {APMAXSD, yxm_q4, Pq4, [23]uint8{0x3d}},
-       {APMAXSW, yxm, Pe, [23]uint8{0xee}},
-       {APMAXUB, yxm, Pe, [23]uint8{0xde}},
-       {APMAXUD, yxm_q4, Pq4, [23]uint8{0x3f}},
-       {APMAXUW, yxm_q4, Pq4, [23]uint8{0x3e}},
-       {APMINSB, yxm_q4, Pq4, [23]uint8{0x38}},
-       {APMINSD, yxm_q4, Pq4, [23]uint8{0x39}},
-       {APMINSW, yxm, Pe, [23]uint8{0xea}},
-       {APMINUB, yxm, Pe, [23]uint8{0xda}},
-       {APMINUD, yxm_q4, Pq4, [23]uint8{0x3b}},
-       {APMINUW, yxm_q4, Pq4, [23]uint8{0x3a}},
-       {APMOVMSKB, ymskb, Px, [23]uint8{Pe, 0xd7, 0xd7}},
-       {APMOVSXBD, yxm_q4, Pq4, [23]uint8{0x21}},
-       {APMOVSXBQ, yxm_q4, Pq4, [23]uint8{0x22}},
-       {APMOVSXBW, yxm_q4, Pq4, [23]uint8{0x20}},
-       {APMOVSXDQ, yxm_q4, Pq4, [23]uint8{0x25}},
-       {APMOVSXWD, yxm_q4, Pq4, [23]uint8{0x23}},
-       {APMOVSXWQ, yxm_q4, Pq4, [23]uint8{0x24}},
-       {APMOVZXBD, yxm_q4, Pq4, [23]uint8{0x31}},
-       {APMOVZXBQ, yxm_q4, Pq4, [23]uint8{0x32}},
-       {APMOVZXBW, yxm_q4, Pq4, [23]uint8{0x30}},
-       {APMOVZXDQ, yxm_q4, Pq4, [23]uint8{0x35}},
-       {APMOVZXWD, yxm_q4, Pq4, [23]uint8{0x33}},
-       {APMOVZXWQ, yxm_q4, Pq4, [23]uint8{0x34}},
-       {APMULDQ, yxm_q4, Pq4, [23]uint8{0x28}},
-       {APMULHRSW, yxm_q4, Pq4, [23]uint8{0x0b}},
-       {APMULHUW, ymm, Py1, [23]uint8{0xe4, Pe, 0xe4}},
-       {APMULHW, ymm, Py1, [23]uint8{0xe5, Pe, 0xe5}},
-       {APMULLD, yxm_q4, Pq4, [23]uint8{0x40}},
-       {APMULLW, ymm, Py1, [23]uint8{0xd5, Pe, 0xd5}},
-       {APMULULQ, ymm, Py1, [23]uint8{0xf4, Pe, 0xf4}},
-       {APOPAL, ynone, P32, [23]uint8{0x61}},
-       {APOPAW, ynone, Pe, [23]uint8{0x61}},
-       {APOPCNTW, yml_rl, Pef3, [23]uint8{0xb8}},
-       {APOPCNTL, yml_rl, Pf3, [23]uint8{0xb8}},
-       {APOPCNTQ, yml_rl, Pfw, [23]uint8{0xb8}},
-       {APOPFL, ynone, P32, [23]uint8{0x9d}},
-       {APOPFQ, ynone, Py, [23]uint8{0x9d}},
-       {APOPFW, ynone, Pe, [23]uint8{0x9d}},
-       {APOPL, ypopl, P32, [23]uint8{0x58, 0x8f, 00}},
-       {APOPQ, ypopl, Py, [23]uint8{0x58, 0x8f, 00}},
-       {APOPW, ypopl, Pe, [23]uint8{0x58, 0x8f, 00}},
-       {APOR, ymm, Py1, [23]uint8{0xeb, Pe, 0xeb}},
-       {APSADBW, yxm, Pq, [23]uint8{0xf6}},
-       {APSHUFHW, yxshuf, Pf3, [23]uint8{0x70, 00}},
-       {APSHUFL, yxshuf, Pq, [23]uint8{0x70, 00}},
-       {APSHUFLW, yxshuf, Pf2, [23]uint8{0x70, 00}},
-       {APSHUFW, ymshuf, Pm, [23]uint8{0x70, 00}},
-       {APSHUFB, ymshufb, Pq, [23]uint8{0x38, 0x00}},
-       {APSIGNB, yxm_q4, Pq4, [23]uint8{0x08}},
-       {APSIGND, yxm_q4, Pq4, [23]uint8{0x0a}},
-       {APSIGNW, yxm_q4, Pq4, [23]uint8{0x09}},
-       {APSLLO, ypsdq, Pq, [23]uint8{0x73, 07}},
-       {APSLLL, yps, Py3, [23]uint8{0xf2, 0x72, 06, Pe, 0xf2, Pe, 0x72, 06}},
-       {APSLLQ, yps, Py3, [23]uint8{0xf3, 0x73, 06, Pe, 0xf3, Pe, 0x73, 06}},
-       {APSLLW, yps, Py3, [23]uint8{0xf1, 0x71, 06, Pe, 0xf1, Pe, 0x71, 06}},
-       {APSRAL, yps, Py3, [23]uint8{0xe2, 0x72, 04, Pe, 0xe2, Pe, 0x72, 04}},
-       {APSRAW, yps, Py3, [23]uint8{0xe1, 0x71, 04, Pe, 0xe1, Pe, 0x71, 04}},
-       {APSRLO, ypsdq, Pq, [23]uint8{0x73, 03}},
-       {APSRLL, yps, Py3, [23]uint8{0xd2, 0x72, 02, Pe, 0xd2, Pe, 0x72, 02}},
-       {APSRLQ, yps, Py3, [23]uint8{0xd3, 0x73, 02, Pe, 0xd3, Pe, 0x73, 02}},
-       {APSRLW, yps, Py3, [23]uint8{0xd1, 0x71, 02, Pe, 0xd1, Pe, 0x71, 02}},
-       {APSUBB, yxm, Pe, [23]uint8{0xf8}},
-       {APSUBL, yxm, Pe, [23]uint8{0xfa}},
-       {APSUBQ, yxm, Pe, [23]uint8{0xfb}},
-       {APSUBSB, yxm, Pe, [23]uint8{0xe8}},
-       {APSUBSW, yxm, Pe, [23]uint8{0xe9}},
-       {APSUBUSB, yxm, Pe, [23]uint8{0xd8}},
-       {APSUBUSW, yxm, Pe, [23]uint8{0xd9}},
-       {APSUBW, yxm, Pe, [23]uint8{0xf9}},
-       {APTEST, yxm_q4, Pq4, [23]uint8{0x17}},
-       {APUNPCKHBW, ymm, Py1, [23]uint8{0x68, Pe, 0x68}},
-       {APUNPCKHLQ, ymm, Py1, [23]uint8{0x6a, Pe, 0x6a}},
-       {APUNPCKHQDQ, yxm, Pe, [23]uint8{0x6d}},
-       {APUNPCKHWL, ymm, Py1, [23]uint8{0x69, Pe, 0x69}},
-       {APUNPCKLBW, ymm, Py1, [23]uint8{0x60, Pe, 0x60}},
-       {APUNPCKLLQ, ymm, Py1, [23]uint8{0x62, Pe, 0x62}},
-       {APUNPCKLQDQ, yxm, Pe, [23]uint8{0x6c}},
-       {APUNPCKLWL, ymm, Py1, [23]uint8{0x61, Pe, 0x61}},
-       {APUSHAL, ynone, P32, [23]uint8{0x60}},
-       {APUSHAW, ynone, Pe, [23]uint8{0x60}},
-       {APUSHFL, ynone, P32, [23]uint8{0x9c}},
-       {APUSHFQ, ynone, Py, [23]uint8{0x9c}},
-       {APUSHFW, ynone, Pe, [23]uint8{0x9c}},
-       {APUSHL, ypushl, P32, [23]uint8{0x50, 0xff, 06, 0x6a, 0x68}},
-       {APUSHQ, ypushl, Py, [23]uint8{0x50, 0xff, 06, 0x6a, 0x68}},
-       {APUSHW, ypushl, Pe, [23]uint8{0x50, 0xff, 06, 0x6a, 0x68}},
-       {APXOR, ymm, Py1, [23]uint8{0xef, Pe, 0xef}},
-       {AQUAD, ybyte, Px, [23]uint8{8}},
-       {ARCLB, yshb, Pb, [23]uint8{0xd0, 02, 0xc0, 02, 0xd2, 02}},
-       {ARCLL, yshl, Px, [23]uint8{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
-       {ARCLQ, yshl, Pw, [23]uint8{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
-       {ARCLW, yshl, Pe, [23]uint8{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
-       {ARCPPS, yxm, Pm, [23]uint8{0x53}},
-       {ARCPSS, yxm, Pf3, [23]uint8{0x53}},
-       {ARCRB, yshb, Pb, [23]uint8{0xd0, 03, 0xc0, 03, 0xd2, 03}},
-       {ARCRL, yshl, Px, [23]uint8{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
-       {ARCRQ, yshl, Pw, [23]uint8{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
-       {ARCRW, yshl, Pe, [23]uint8{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
-       {AREP, ynone, Px, [23]uint8{0xf3}},
-       {AREPN, ynone, Px, [23]uint8{0xf2}},
-       {obj.ARET, ynone, Px, [23]uint8{0xc3}},
-       {ARETFW, yret, Pe, [23]uint8{0xcb, 0xca}},
-       {ARETFL, yret, Px, [23]uint8{0xcb, 0xca}},
-       {ARETFQ, yret, Pw, [23]uint8{0xcb, 0xca}},
-       {AROLB, yshb, Pb, [23]uint8{0xd0, 00, 0xc0, 00, 0xd2, 00}},
-       {AROLL, yshl, Px, [23]uint8{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
-       {AROLQ, yshl, Pw, [23]uint8{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
-       {AROLW, yshl, Pe, [23]uint8{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
-       {ARORB, yshb, Pb, [23]uint8{0xd0, 01, 0xc0, 01, 0xd2, 01}},
-       {ARORL, yshl, Px, [23]uint8{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
-       {ARORQ, yshl, Pw, [23]uint8{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
-       {ARORW, yshl, Pe, [23]uint8{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
-       {ARSQRTPS, yxm, Pm, [23]uint8{0x52}},
-       {ARSQRTSS, yxm, Pf3, [23]uint8{0x52}},
-       {ASAHF, ynone, Px, [23]uint8{0x9e, 00, 0x86, 0xe0, 0x50, 0x9d}}, // XCHGB AH,AL; PUSH AX; POPFL
-       {ASALB, yshb, Pb, [23]uint8{0xd0, 04, 0xc0, 04, 0xd2, 04}},
-       {ASALL, yshl, Px, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASALQ, yshl, Pw, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASALW, yshl, Pe, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASARB, yshb, Pb, [23]uint8{0xd0, 07, 0xc0, 07, 0xd2, 07}},
-       {ASARL, yshl, Px, [23]uint8{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
-       {ASARQ, yshl, Pw, [23]uint8{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
-       {ASARW, yshl, Pe, [23]uint8{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
-       {ASBBB, yxorb, Pb, [23]uint8{0x1c, 0x80, 03, 0x18, 0x1a}},
-       {ASBBL, yaddl, Px, [23]uint8{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
-       {ASBBQ, yaddl, Pw, [23]uint8{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
-       {ASBBW, yaddl, Pe, [23]uint8{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
-       {ASCASB, ynone, Pb, [23]uint8{0xae}},
-       {ASCASL, ynone, Px, [23]uint8{0xaf}},
-       {ASCASQ, ynone, Pw, [23]uint8{0xaf}},
-       {ASCASW, ynone, Pe, [23]uint8{0xaf}},
-       {ASETCC, yscond, Pb, [23]uint8{0x0f, 0x93, 00}},
-       {ASETCS, yscond, Pb, [23]uint8{0x0f, 0x92, 00}},
-       {ASETEQ, yscond, Pb, [23]uint8{0x0f, 0x94, 00}},
-       {ASETGE, yscond, Pb, [23]uint8{0x0f, 0x9d, 00}},
-       {ASETGT, yscond, Pb, [23]uint8{0x0f, 0x9f, 00}},
-       {ASETHI, yscond, Pb, [23]uint8{0x0f, 0x97, 00}},
-       {ASETLE, yscond, Pb, [23]uint8{0x0f, 0x9e, 00}},
-       {ASETLS, yscond, Pb, [23]uint8{0x0f, 0x96, 00}},
-       {ASETLT, yscond, Pb, [23]uint8{0x0f, 0x9c, 00}},
-       {ASETMI, yscond, Pb, [23]uint8{0x0f, 0x98, 00}},
-       {ASETNE, yscond, Pb, [23]uint8{0x0f, 0x95, 00}},
-       {ASETOC, yscond, Pb, [23]uint8{0x0f, 0x91, 00}},
-       {ASETOS, yscond, Pb, [23]uint8{0x0f, 0x90, 00}},
-       {ASETPC, yscond, Pb, [23]uint8{0x0f, 0x9b, 00}},
-       {ASETPL, yscond, Pb, [23]uint8{0x0f, 0x99, 00}},
-       {ASETPS, yscond, Pb, [23]uint8{0x0f, 0x9a, 00}},
-       {ASHLB, yshb, Pb, [23]uint8{0xd0, 04, 0xc0, 04, 0xd2, 04}},
-       {ASHLL, yshl, Px, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASHLQ, yshl, Pw, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASHLW, yshl, Pe, [23]uint8{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
-       {ASHRB, yshb, Pb, [23]uint8{0xd0, 05, 0xc0, 05, 0xd2, 05}},
-       {ASHRL, yshl, Px, [23]uint8{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
-       {ASHRQ, yshl, Pw, [23]uint8{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
-       {ASHRW, yshl, Pe, [23]uint8{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
-       {ASHUFPD, yxshuf, Pq, [23]uint8{0xc6, 00}},
-       {ASHUFPS, yxshuf, Pm, [23]uint8{0xc6, 00}},
-       {ASQRTPD, yxm, Pe, [23]uint8{0x51}},
-       {ASQRTPS, yxm, Pm, [23]uint8{0x51}},
-       {ASQRTSD, yxm, Pf2, [23]uint8{0x51}},
-       {ASQRTSS, yxm, Pf3, [23]uint8{0x51}},
-       {ASTC, ynone, Px, [23]uint8{0xf9}},
-       {ASTD, ynone, Px, [23]uint8{0xfd}},
-       {ASTI, ynone, Px, [23]uint8{0xfb}},
-       {ASTMXCSR, ysvrs_om, Pm, [23]uint8{0xae, 03, 0xae, 03}},
-       {ASTOSB, ynone, Pb, [23]uint8{0xaa}},
-       {ASTOSL, ynone, Px, [23]uint8{0xab}},
-       {ASTOSQ, ynone, Pw, [23]uint8{0xab}},
-       {ASTOSW, ynone, Pe, [23]uint8{0xab}},
-       {ASUBB, yxorb, Pb, [23]uint8{0x2c, 0x80, 05, 0x28, 0x2a}},
-       {ASUBL, yaddl, Px, [23]uint8{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
-       {ASUBPD, yxm, Pe, [23]uint8{0x5c}},
-       {ASUBPS, yxm, Pm, [23]uint8{0x5c}},
-       {ASUBQ, yaddl, Pw, [23]uint8{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
-       {ASUBSD, yxm, Pf2, [23]uint8{0x5c}},
-       {ASUBSS, yxm, Pf3, [23]uint8{0x5c}},
-       {ASUBW, yaddl, Pe, [23]uint8{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
-       {ASWAPGS, ynone, Pm, [23]uint8{0x01, 0xf8}},
-       {ASYSCALL, ynone, Px, [23]uint8{0x0f, 0x05}}, // fast syscall
-       {ATESTB, yxorb, Pb, [23]uint8{0xa8, 0xf6, 00, 0x84, 0x84}},
-       {ATESTL, ytestl, Px, [23]uint8{0xa9, 0xf7, 00, 0x85, 0x85}},
-       {ATESTQ, ytestl, Pw, [23]uint8{0xa9, 0xf7, 00, 0x85, 0x85}},
-       {ATESTW, ytestl, Pe, [23]uint8{0xa9, 0xf7, 00, 0x85, 0x85}},
-       {obj.ATEXT, ytext, Px, [23]uint8{}},
-       {AUCOMISD, yxm, Pe, [23]uint8{0x2e}},
-       {AUCOMISS, yxm, Pm, [23]uint8{0x2e}},
-       {AUNPCKHPD, yxm, Pe, [23]uint8{0x15}},
-       {AUNPCKHPS, yxm, Pm, [23]uint8{0x15}},
-       {AUNPCKLPD, yxm, Pe, [23]uint8{0x14}},
-       {AUNPCKLPS, yxm, Pm, [23]uint8{0x14}},
-       {AVERR, ydivl, Pm, [23]uint8{0x00, 04}},
-       {AVERW, ydivl, Pm, [23]uint8{0x00, 05}},
-       {AWAIT, ynone, Px, [23]uint8{0x9b}},
-       {AWORD, ybyte, Px, [23]uint8{2}},
-       {AXCHGB, yml_mb, Pb, [23]uint8{0x86, 0x86}},
-       {AXCHGL, yxchg, Px, [23]uint8{0x90, 0x90, 0x87, 0x87}},
-       {AXCHGQ, yxchg, Pw, [23]uint8{0x90, 0x90, 0x87, 0x87}},
-       {AXCHGW, yxchg, Pe, [23]uint8{0x90, 0x90, 0x87, 0x87}},
-       {AXLAT, ynone, Px, [23]uint8{0xd7}},
-       {AXORB, yxorb, Pb, [23]uint8{0x34, 0x80, 06, 0x30, 0x32}},
-       {AXORL, yaddl, Px, [23]uint8{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
-       {AXORPD, yxm, Pe, [23]uint8{0x57}},
-       {AXORPS, yxm, Pm, [23]uint8{0x57}},
-       {AXORQ, yaddl, Pw, [23]uint8{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
-       {AXORW, yaddl, Pe, [23]uint8{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
-       {AFMOVB, yfmvx, Px, [23]uint8{0xdf, 04}},
-       {AFMOVBP, yfmvp, Px, [23]uint8{0xdf, 06}},
-       {AFMOVD, yfmvd, Px, [23]uint8{0xdd, 00, 0xdd, 02, 0xd9, 00, 0xdd, 02}},
-       {AFMOVDP, yfmvdp, Px, [23]uint8{0xdd, 03, 0xdd, 03}},
-       {AFMOVF, yfmvf, Px, [23]uint8{0xd9, 00, 0xd9, 02}},
-       {AFMOVFP, yfmvp, Px, [23]uint8{0xd9, 03}},
-       {AFMOVL, yfmvf, Px, [23]uint8{0xdb, 00, 0xdb, 02}},
-       {AFMOVLP, yfmvp, Px, [23]uint8{0xdb, 03}},
-       {AFMOVV, yfmvx, Px, [23]uint8{0xdf, 05}},
-       {AFMOVVP, yfmvp, Px, [23]uint8{0xdf, 07}},
-       {AFMOVW, yfmvf, Px, [23]uint8{0xdf, 00, 0xdf, 02}},
-       {AFMOVWP, yfmvp, Px, [23]uint8{0xdf, 03}},
-       {AFMOVX, yfmvx, Px, [23]uint8{0xdb, 05}},
-       {AFMOVXP, yfmvp, Px, [23]uint8{0xdb, 07}},
-       {AFCMOVCC, yfcmv, Px, [23]uint8{0xdb, 00}},
-       {AFCMOVCS, yfcmv, Px, [23]uint8{0xda, 00}},
-       {AFCMOVEQ, yfcmv, Px, [23]uint8{0xda, 01}},
-       {AFCMOVHI, yfcmv, Px, [23]uint8{0xdb, 02}},
-       {AFCMOVLS, yfcmv, Px, [23]uint8{0xda, 02}},
-       {AFCMOVB, yfcmv, Px, [23]uint8{0xda, 00}},
-       {AFCMOVBE, yfcmv, Px, [23]uint8{0xda, 02}},
-       {AFCMOVNB, yfcmv, Px, [23]uint8{0xdb, 00}},
-       {AFCMOVNBE, yfcmv, Px, [23]uint8{0xdb, 02}},
-       {AFCMOVE, yfcmv, Px, [23]uint8{0xda, 01}},
-       {AFCMOVNE, yfcmv, Px, [23]uint8{0xdb, 01}},
-       {AFCMOVNU, yfcmv, Px, [23]uint8{0xdb, 03}},
-       {AFCMOVU, yfcmv, Px, [23]uint8{0xda, 03}},
-       {AFCMOVUN, yfcmv, Px, [23]uint8{0xda, 03}},
-       {AFCOMD, yfadd, Px, [23]uint8{0xdc, 02, 0xd8, 02, 0xdc, 02}},  // botch
-       {AFCOMDP, yfadd, Px, [23]uint8{0xdc, 03, 0xd8, 03, 0xdc, 03}}, // botch
-       {AFCOMDPP, ycompp, Px, [23]uint8{0xde, 03}},
-       {AFCOMF, yfmvx, Px, [23]uint8{0xd8, 02}},
-       {AFCOMFP, yfmvx, Px, [23]uint8{0xd8, 03}},
-       {AFCOMI, yfcmv, Px, [23]uint8{0xdb, 06}},
-       {AFCOMIP, yfcmv, Px, [23]uint8{0xdf, 06}},
-       {AFCOML, yfmvx, Px, [23]uint8{0xda, 02}},
-       {AFCOMLP, yfmvx, Px, [23]uint8{0xda, 03}},
-       {AFCOMW, yfmvx, Px, [23]uint8{0xde, 02}},
-       {AFCOMWP, yfmvx, Px, [23]uint8{0xde, 03}},
-       {AFUCOM, ycompp, Px, [23]uint8{0xdd, 04}},
-       {AFUCOMI, ycompp, Px, [23]uint8{0xdb, 05}},
-       {AFUCOMIP, ycompp, Px, [23]uint8{0xdf, 05}},
-       {AFUCOMP, ycompp, Px, [23]uint8{0xdd, 05}},
-       {AFUCOMPP, ycompp, Px, [23]uint8{0xda, 13}},
-       {AFADDDP, ycompp, Px, [23]uint8{0xde, 00}},
-       {AFADDW, yfmvx, Px, [23]uint8{0xde, 00}},
-       {AFADDL, yfmvx, Px, [23]uint8{0xda, 00}},
-       {AFADDF, yfmvx, Px, [23]uint8{0xd8, 00}},
-       {AFADDD, yfadd, Px, [23]uint8{0xdc, 00, 0xd8, 00, 0xdc, 00}},
-       {AFMULDP, ycompp, Px, [23]uint8{0xde, 01}},
-       {AFMULW, yfmvx, Px, [23]uint8{0xde, 01}},
-       {AFMULL, yfmvx, Px, [23]uint8{0xda, 01}},
-       {AFMULF, yfmvx, Px, [23]uint8{0xd8, 01}},
-       {AFMULD, yfadd, Px, [23]uint8{0xdc, 01, 0xd8, 01, 0xdc, 01}},
-       {AFSUBDP, ycompp, Px, [23]uint8{0xde, 05}},
-       {AFSUBW, yfmvx, Px, [23]uint8{0xde, 04}},
-       {AFSUBL, yfmvx, Px, [23]uint8{0xda, 04}},
-       {AFSUBF, yfmvx, Px, [23]uint8{0xd8, 04}},
-       {AFSUBD, yfadd, Px, [23]uint8{0xdc, 04, 0xd8, 04, 0xdc, 05}},
-       {AFSUBRDP, ycompp, Px, [23]uint8{0xde, 04}},
-       {AFSUBRW, yfmvx, Px, [23]uint8{0xde, 05}},
-       {AFSUBRL, yfmvx, Px, [23]uint8{0xda, 05}},
-       {AFSUBRF, yfmvx, Px, [23]uint8{0xd8, 05}},
-       {AFSUBRD, yfadd, Px, [23]uint8{0xdc, 05, 0xd8, 05, 0xdc, 04}},
-       {AFDIVDP, ycompp, Px, [23]uint8{0xde, 07}},
-       {AFDIVW, yfmvx, Px, [23]uint8{0xde, 06}},
-       {AFDIVL, yfmvx, Px, [23]uint8{0xda, 06}},
-       {AFDIVF, yfmvx, Px, [23]uint8{0xd8, 06}},
-       {AFDIVD, yfadd, Px, [23]uint8{0xdc, 06, 0xd8, 06, 0xdc, 07}},
-       {AFDIVRDP, ycompp, Px, [23]uint8{0xde, 06}},
-       {AFDIVRW, yfmvx, Px, [23]uint8{0xde, 07}},
-       {AFDIVRL, yfmvx, Px, [23]uint8{0xda, 07}},
-       {AFDIVRF, yfmvx, Px, [23]uint8{0xd8, 07}},
-       {AFDIVRD, yfadd, Px, [23]uint8{0xdc, 07, 0xd8, 07, 0xdc, 06}},
-       {AFXCHD, yfxch, Px, [23]uint8{0xd9, 01, 0xd9, 01}},
-       {AFFREE, nil, 0, [23]uint8{}},
-       {AFLDCW, ysvrs_mo, Px, [23]uint8{0xd9, 05, 0xd9, 05}},
-       {AFLDENV, ysvrs_mo, Px, [23]uint8{0xd9, 04, 0xd9, 04}},
-       {AFRSTOR, ysvrs_mo, Px, [23]uint8{0xdd, 04, 0xdd, 04}},
-       {AFSAVE, ysvrs_om, Px, [23]uint8{0xdd, 06, 0xdd, 06}},
-       {AFSTCW, ysvrs_om, Px, [23]uint8{0xd9, 07, 0xd9, 07}},
-       {AFSTENV, ysvrs_om, Px, [23]uint8{0xd9, 06, 0xd9, 06}},
-       {AFSTSW, ystsw, Px, [23]uint8{0xdd, 07, 0xdf, 0xe0}},
-       {AF2XM1, ynone, Px, [23]uint8{0xd9, 0xf0}},
-       {AFABS, ynone, Px, [23]uint8{0xd9, 0xe1}},
-       {AFBLD, ysvrs_mo, Px, [23]uint8{0xdf, 04}},
-       {AFBSTP, yclflush, Px, [23]uint8{0xdf, 06}},
-       {AFCHS, ynone, Px, [23]uint8{0xd9, 0xe0}},
-       {AFCLEX, ynone, Px, [23]uint8{0xdb, 0xe2}},
-       {AFCOS, ynone, Px, [23]uint8{0xd9, 0xff}},
-       {AFDECSTP, ynone, Px, [23]uint8{0xd9, 0xf6}},
-       {AFINCSTP, ynone, Px, [23]uint8{0xd9, 0xf7}},
-       {AFINIT, ynone, Px, [23]uint8{0xdb, 0xe3}},
-       {AFLD1, ynone, Px, [23]uint8{0xd9, 0xe8}},
-       {AFLDL2E, ynone, Px, [23]uint8{0xd9, 0xea}},
-       {AFLDL2T, ynone, Px, [23]uint8{0xd9, 0xe9}},
-       {AFLDLG2, ynone, Px, [23]uint8{0xd9, 0xec}},
-       {AFLDLN2, ynone, Px, [23]uint8{0xd9, 0xed}},
-       {AFLDPI, ynone, Px, [23]uint8{0xd9, 0xeb}},
-       {AFLDZ, ynone, Px, [23]uint8{0xd9, 0xee}},
-       {AFNOP, ynone, Px, [23]uint8{0xd9, 0xd0}},
-       {AFPATAN, ynone, Px, [23]uint8{0xd9, 0xf3}},
-       {AFPREM, ynone, Px, [23]uint8{0xd9, 0xf8}},
-       {AFPREM1, ynone, Px, [23]uint8{0xd9, 0xf5}},
-       {AFPTAN, ynone, Px, [23]uint8{0xd9, 0xf2}},
-       {AFRNDINT, ynone, Px, [23]uint8{0xd9, 0xfc}},
-       {AFSCALE, ynone, Px, [23]uint8{0xd9, 0xfd}},
-       {AFSIN, ynone, Px, [23]uint8{0xd9, 0xfe}},
-       {AFSINCOS, ynone, Px, [23]uint8{0xd9, 0xfb}},
-       {AFSQRT, ynone, Px, [23]uint8{0xd9, 0xfa}},
-       {AFTST, ynone, Px, [23]uint8{0xd9, 0xe4}},
-       {AFXAM, ynone, Px, [23]uint8{0xd9, 0xe5}},
-       {AFXTRACT, ynone, Px, [23]uint8{0xd9, 0xf4}},
-       {AFYL2X, ynone, Px, [23]uint8{0xd9, 0xf1}},
-       {AFYL2XP1, ynone, Px, [23]uint8{0xd9, 0xf9}},
-       {ACMPXCHGB, yrb_mb, Pb, [23]uint8{0x0f, 0xb0}},
-       {ACMPXCHGL, yrl_ml, Px, [23]uint8{0x0f, 0xb1}},
-       {ACMPXCHGW, yrl_ml, Pe, [23]uint8{0x0f, 0xb1}},
-       {ACMPXCHGQ, yrl_ml, Pw, [23]uint8{0x0f, 0xb1}},
-       {ACMPXCHG8B, yscond, Pm, [23]uint8{0xc7, 01}},
-       {ACMPXCHG16B, yscond, Pw, [23]uint8{0x0f, 0xc7, 01}},
-       {AINVD, ynone, Pm, [23]uint8{0x08}},
-       {AINVLPG, ydivb, Pm, [23]uint8{0x01, 07}},
-       {AINVPCID, ycrc32l, Pe, [23]uint8{0x0f, 0x38, 0x82, 0}},
-       {ALFENCE, ynone, Pm, [23]uint8{0xae, 0xe8}},
-       {AMFENCE, ynone, Pm, [23]uint8{0xae, 0xf0}},
-       {AMOVNTIL, yrl_ml, Pm, [23]uint8{0xc3}},
-       {AMOVNTIQ, yrl_ml, Pw, [23]uint8{0x0f, 0xc3}},
-       {ARDPKRU, ynone, Pm, [23]uint8{0x01, 0xee, 0}},
-       {ARDMSR, ynone, Pm, [23]uint8{0x32}},
-       {ARDPMC, ynone, Pm, [23]uint8{0x33}},
-       {ARDTSC, ynone, Pm, [23]uint8{0x31}},
-       {ARSM, ynone, Pm, [23]uint8{0xaa}},
-       {ASFENCE, ynone, Pm, [23]uint8{0xae, 0xf8}},
-       {ASYSRET, ynone, Pm, [23]uint8{0x07}},
-       {AWBINVD, ynone, Pm, [23]uint8{0x09}},
-       {AWRMSR, ynone, Pm, [23]uint8{0x30}},
-       {AWRPKRU, ynone, Pm, [23]uint8{0x01, 0xef, 0}},
-       {AXADDB, yrb_mb, Pb, [23]uint8{0x0f, 0xc0}},
-       {AXADDL, yrl_ml, Px, [23]uint8{0x0f, 0xc1}},
-       {AXADDQ, yrl_ml, Pw, [23]uint8{0x0f, 0xc1}},
-       {AXADDW, yrl_ml, Pe, [23]uint8{0x0f, 0xc1}},
-       {ACRC32B, ycrc32b, Px, [23]uint8{0xf2, 0x0f, 0x38, 0xf0, 0}},
-       {ACRC32L, ycrc32l, Px, [23]uint8{0xf2, 0x0f, 0x38, 0xf1, 0}},
-       {ACRC32Q, ycrc32l, Pw, [23]uint8{0xf2, 0x0f, 0x38, 0xf1, 0}},
-       {ACRC32W, ycrc32l, Pe, [23]uint8{0xf2, 0x0f, 0x38, 0xf1, 0}},
-       {APREFETCHT0, yprefetch, Pm, [23]uint8{0x18, 01}},
-       {APREFETCHT1, yprefetch, Pm, [23]uint8{0x18, 02}},
-       {APREFETCHT2, yprefetch, Pm, [23]uint8{0x18, 03}},
-       {APREFETCHNTA, yprefetch, Pm, [23]uint8{0x18, 00}},
-       {AMOVQL, yrl_ml, Px, [23]uint8{0x89}},
-       {obj.AUNDEF, ynone, Px, [23]uint8{0x0f, 0x0b}},
-       {AAESENC, yaes, Pq, [23]uint8{0x38, 0xdc, 0}},
-       {AAESENCLAST, yaes, Pq, [23]uint8{0x38, 0xdd, 0}},
-       {AAESDEC, yaes, Pq, [23]uint8{0x38, 0xde, 0}},
-       {AAESDECLAST, yaes, Pq, [23]uint8{0x38, 0xdf, 0}},
-       {AAESIMC, yaes, Pq, [23]uint8{0x38, 0xdb, 0}},
-       {AAESKEYGENASSIST, yxshuf, Pq, [23]uint8{0x3a, 0xdf, 0}},
-       {AROUNDPD, yxshuf, Pq, [23]uint8{0x3a, 0x09, 0}},
-       {AROUNDPS, yxshuf, Pq, [23]uint8{0x3a, 0x08, 0}},
-       {AROUNDSD, yxshuf, Pq, [23]uint8{0x3a, 0x0b, 0}},
-       {AROUNDSS, yxshuf, Pq, [23]uint8{0x3a, 0x0a, 0}},
-       {APSHUFD, yxshuf, Pq, [23]uint8{0x70, 0}},
-       {APCLMULQDQ, yxshuf, Pq, [23]uint8{0x3a, 0x44, 0}},
-       {APCMPESTRI, yxshuf, Pq, [23]uint8{0x3a, 0x61, 0}},
-       {APCMPESTRM, yxshuf, Pq, [23]uint8{0x3a, 0x60, 0}},
-       {AMOVDDUP, yxm, Pf2, [23]uint8{0x12}},
-       {AMOVSHDUP, yxm, Pf3, [23]uint8{0x16}},
-       {AMOVSLDUP, yxm, Pf3, [23]uint8{0x12}},
-
-       {ARDTSCP, ynone, Pm, [23]uint8{0x01, 0xf9, 0}},
-       {ASTAC, ynone, Pm, [23]uint8{0x01, 0xcb, 0}},
-       {AUD1, ynone, Pm, [23]uint8{0xb9, 0}},
-       {AUD2, ynone, Pm, [23]uint8{0x0b, 0}},
-       {ASYSENTER, ynone, Px, [23]uint8{0x0f, 0x34, 0}},
-       {ASYSENTER64, ynone, Pw, [23]uint8{0x0f, 0x34, 0}},
-       {ASYSEXIT, ynone, Px, [23]uint8{0x0f, 0x35, 0}},
-       {ASYSEXIT64, ynone, Pw, [23]uint8{0x0f, 0x35, 0}},
-       {ALMSW, ydivl, Pm, [23]uint8{0x01, 06}},
-       {ALLDT, ydivl, Pm, [23]uint8{0x00, 02}},
-       {ALIDT, ysvrs_mo, Pm, [23]uint8{0x01, 03}},
-       {ALGDT, ysvrs_mo, Pm, [23]uint8{0x01, 02}},
-       {ATZCNTW, ycrc32l, Pe, [23]uint8{0xf3, 0x0f, 0xbc, 0}},
-       {ATZCNTL, ycrc32l, Px, [23]uint8{0xf3, 0x0f, 0xbc, 0}},
-       {ATZCNTQ, ycrc32l, Pw, [23]uint8{0xf3, 0x0f, 0xbc, 0}},
-       {AXRSTOR, ydivl, Px, [23]uint8{0x0f, 0xae, 05}},
-       {AXRSTOR64, ydivl, Pw, [23]uint8{0x0f, 0xae, 05}},
-       {AXRSTORS, ydivl, Px, [23]uint8{0x0f, 0xc7, 03}},
-       {AXRSTORS64, ydivl, Pw, [23]uint8{0x0f, 0xc7, 03}},
-       {AXSAVE, yclflush, Px, [23]uint8{0x0f, 0xae, 04}},
-       {AXSAVE64, yclflush, Pw, [23]uint8{0x0f, 0xae, 04}},
-       {AXSAVEOPT, yclflush, Px, [23]uint8{0x0f, 0xae, 06}},
-       {AXSAVEOPT64, yclflush, Pw, [23]uint8{0x0f, 0xae, 06}},
-       {AXSAVEC, yclflush, Px, [23]uint8{0x0f, 0xc7, 04}},
-       {AXSAVEC64, yclflush, Pw, [23]uint8{0x0f, 0xc7, 04}},
-       {AXSAVES, yclflush, Px, [23]uint8{0x0f, 0xc7, 05}},
-       {AXSAVES64, yclflush, Pw, [23]uint8{0x0f, 0xc7, 05}},
-       {ASGDT, yclflush, Pm, [23]uint8{0x01, 00}},
-       {ASIDT, yclflush, Pm, [23]uint8{0x01, 01}},
-       {ARDRANDW, yrdrand, Pe, [23]uint8{0x0f, 0xc7, 06}},
-       {ARDRANDL, yrdrand, Px, [23]uint8{0x0f, 0xc7, 06}},
-       {ARDRANDQ, yrdrand, Pw, [23]uint8{0x0f, 0xc7, 06}},
-       {ARDSEEDW, yrdrand, Pe, [23]uint8{0x0f, 0xc7, 07}},
-       {ARDSEEDL, yrdrand, Px, [23]uint8{0x0f, 0xc7, 07}},
-       {ARDSEEDQ, yrdrand, Pw, [23]uint8{0x0f, 0xc7, 07}},
-       {ASTRW, yincq, Pe, [23]uint8{0x0f, 0x00, 01}},
-       {ASTRL, yincq, Px, [23]uint8{0x0f, 0x00, 01}},
-       {ASTRQ, yincq, Pw, [23]uint8{0x0f, 0x00, 01}},
-       {AXSETBV, ynone, Pm, [23]uint8{0x01, 0xd1, 0}},
-       {AMOVBEWW, ymovbe, Pq, [23]uint8{0x38, 0xf0, 0, 0x38, 0xf1, 0}},
-       {AMOVBELL, ymovbe, Pm, [23]uint8{0x38, 0xf0, 0, 0x38, 0xf1, 0}},
-       {AMOVBEQQ, ymovbe, Pw, [23]uint8{0x0f, 0x38, 0xf0, 0, 0x0f, 0x38, 0xf1, 0}},
-       {ANOPW, ydivl, Pe, [23]uint8{0x0f, 0x1f, 00}},
-       {ANOPL, ydivl, Px, [23]uint8{0x0f, 0x1f, 00}},
-       {ASLDTW, yincq, Pe, [23]uint8{0x0f, 0x00, 00}},
-       {ASLDTL, yincq, Px, [23]uint8{0x0f, 0x00, 00}},
-       {ASLDTQ, yincq, Pw, [23]uint8{0x0f, 0x00, 00}},
-       {ASMSWW, yincq, Pe, [23]uint8{0x0f, 0x01, 04}},
-       {ASMSWL, yincq, Px, [23]uint8{0x0f, 0x01, 04}},
-       {ASMSWQ, yincq, Pw, [23]uint8{0x0f, 0x01, 04}},
-       {ABLENDVPS, yblendvpd, Pq4, [23]uint8{0x14}},
-       {ABLENDVPD, yblendvpd, Pq4, [23]uint8{0x15}},
-       {APBLENDVB, yblendvpd, Pq4, [23]uint8{0x10}},
-       {ASHA1MSG1, yaes, Px, [23]uint8{0x0f, 0x38, 0xc9, 0}},
-       {ASHA1MSG2, yaes, Px, [23]uint8{0x0f, 0x38, 0xca, 0}},
-       {ASHA1NEXTE, yaes, Px, [23]uint8{0x0f, 0x38, 0xc8, 0}},
-       {ASHA256MSG1, yaes, Px, [23]uint8{0x0f, 0x38, 0xcc, 0}},
-       {ASHA256MSG2, yaes, Px, [23]uint8{0x0f, 0x38, 0xcd, 0}},
-       {ASHA1RNDS4, ysha1rnds4, Pm, [23]uint8{0x3a, 0xcc, 0}},
-       {ASHA256RNDS2, ysha256rnds2, Px, [23]uint8{0x0f, 0x38, 0xcb, 0}},
-       {ARDFSBASEL, yrdrand, Pf3, [23]uint8{0xae, 00}},
-       {ARDFSBASEQ, yrdrand, Pfw, [23]uint8{0xae, 00}},
-       {ARDGSBASEL, yrdrand, Pf3, [23]uint8{0xae, 01}},
-       {ARDGSBASEQ, yrdrand, Pfw, [23]uint8{0xae, 01}},
-       {AWRFSBASEL, ywrfsbase, Pf3, [23]uint8{0xae, 02}},
-       {AWRFSBASEQ, ywrfsbase, Pfw, [23]uint8{0xae, 02}},
-       {AWRGSBASEL, ywrfsbase, Pf3, [23]uint8{0xae, 03}},
-       {AWRGSBASEQ, ywrfsbase, Pfw, [23]uint8{0xae, 03}},
-       {ALFSW, ym_rl, Pe, [23]uint8{0x0f, 0xb4}},
-       {ALFSL, ym_rl, Px, [23]uint8{0x0f, 0xb4}},
-       {ALFSQ, ym_rl, Pw, [23]uint8{0x0f, 0xb4}},
-       {ALGSW, ym_rl, Pe, [23]uint8{0x0f, 0xb5}},
-       {ALGSL, ym_rl, Px, [23]uint8{0x0f, 0xb5}},
-       {ALGSQ, ym_rl, Pw, [23]uint8{0x0f, 0xb5}},
-       {ALSSW, ym_rl, Pe, [23]uint8{0x0f, 0xb2}},
-       {ALSSL, ym_rl, Px, [23]uint8{0x0f, 0xb2}},
-       {ALSSQ, ym_rl, Pw, [23]uint8{0x0f, 0xb2}},
-
-       {ABLENDPD, yxshuf, Pq, [23]uint8{0x3a, 0x0d, 0}},
-       {ABLENDPS, yxshuf, Pq, [23]uint8{0x3a, 0x0c, 0}},
-       {AXACQUIRE, ynone, Px, [23]uint8{0xf2}},
-       {AXRELEASE, ynone, Px, [23]uint8{0xf3}},
-       {AXBEGIN, yxbegin, Px, [23]uint8{0xc7, 0xf8}},
-       {AXABORT, yxabort, Px, [23]uint8{0xc6, 0xf8}},
-       {AXEND, ynone, Px, [23]uint8{0x0f, 01, 0xd5}},
-       {AXTEST, ynone, Px, [23]uint8{0x0f, 01, 0xd6}},
-       {AXGETBV, ynone, Pm, [23]uint8{01, 0xd0}},
-       {obj.AFUNCDATA, yfuncdata, Px, [23]uint8{0, 0}},
-       {obj.APCDATA, ypcdata, Px, [23]uint8{0, 0}},
-       {obj.ADUFFCOPY, yduff, Px, [23]uint8{0xe8}},
-       {obj.ADUFFZERO, yduff, Px, [23]uint8{0xe8}},
-
-       // AVX2 gather instructions.
-       // Added as a part of VSIB support implementation,
-       // when x86avxgen will output these, they will be moved to
-       // vex_optabs.go where they belong.
-       {AVGATHERDPD, yvpgatherdq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x92,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x92,
-       }},
-       {AVGATHERQPD, yvpgatherqq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x93,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x93,
-       }},
-       {AVGATHERDPS, yvpgatherqq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x92,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x92,
-       }},
-       {AVGATHERQPS, yvgatherqps, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x93,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x93,
-       }},
-       {AVPGATHERDD, yvpgatherqq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x90,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x90,
-       }},
-       {AVPGATHERQD, yvgatherqps, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x91,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x91,
-       }},
-       {AVPGATHERDQ, yvpgatherdq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x90,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x90,
-       }},
-       {AVPGATHERQQ, yvpgatherqq, Pvex, [23]uint8{
-               vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x91,
-               vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x91,
-       }},
-
-       {obj.AEND, nil, 0, [23]uint8{}},
-       {0, nil, 0, [23]uint8{}},
+       {obj.AXXX, nil, 0, opBytes{}},
+       {AAAA, ynone, P32, opBytes{0x37}},
+       {AAAD, ynone, P32, opBytes{0xd5, 0x0a}},
+       {AAAM, ynone, P32, opBytes{0xd4, 0x0a}},
+       {AAAS, ynone, P32, opBytes{0x3f}},
+       {AADCB, yxorb, Pb, opBytes{0x14, 0x80, 02, 0x10, 0x12}},
+       {AADCL, yaddl, Px, opBytes{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
+       {AADCQ, yaddl, Pw, opBytes{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
+       {AADCW, yaddl, Pe, opBytes{0x83, 02, 0x15, 0x81, 02, 0x11, 0x13}},
+       {AADCXL, yml_rl, Pq4, opBytes{0xf6}},
+       {AADCXQ, yml_rl, Pq4w, opBytes{0xf6}},
+       {AADDB, yxorb, Pb, opBytes{0x04, 0x80, 00, 0x00, 0x02}},
+       {AADDL, yaddl, Px, opBytes{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
+       {AADDPD, yxm, Pq, opBytes{0x58}},
+       {AADDPS, yxm, Pm, opBytes{0x58}},
+       {AADDQ, yaddl, Pw, opBytes{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
+       {AADDSD, yxm, Pf2, opBytes{0x58}},
+       {AADDSS, yxm, Pf3, opBytes{0x58}},
+       {AADDSUBPD, yxm, Pq, opBytes{0xd0}},
+       {AADDSUBPS, yxm, Pf2, opBytes{0xd0}},
+       {AADDW, yaddl, Pe, opBytes{0x83, 00, 0x05, 0x81, 00, 0x01, 0x03}},
+       {AADOXL, yml_rl, Pq5, opBytes{0xf6}},
+       {AADOXQ, yml_rl, Pq5w, opBytes{0xf6}},
+       {AADJSP, nil, 0, opBytes{}},
+       {AANDB, yxorb, Pb, opBytes{0x24, 0x80, 04, 0x20, 0x22}},
+       {AANDL, yaddl, Px, opBytes{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
+       {AANDNPD, yxm, Pq, opBytes{0x55}},
+       {AANDNPS, yxm, Pm, opBytes{0x55}},
+       {AANDPD, yxm, Pq, opBytes{0x54}},
+       {AANDPS, yxm, Pm, opBytes{0x54}},
+       {AANDQ, yaddl, Pw, opBytes{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
+       {AANDW, yaddl, Pe, opBytes{0x83, 04, 0x25, 0x81, 04, 0x21, 0x23}},
+       {AARPL, yrl_ml, P32, opBytes{0x63}},
+       {ABOUNDL, yrl_m, P32, opBytes{0x62}},
+       {ABOUNDW, yrl_m, Pe, opBytes{0x62}},
+       {ABSFL, yml_rl, Pm, opBytes{0xbc}},
+       {ABSFQ, yml_rl, Pw, opBytes{0x0f, 0xbc}},
+       {ABSFW, yml_rl, Pq, opBytes{0xbc}},
+       {ABSRL, yml_rl, Pm, opBytes{0xbd}},
+       {ABSRQ, yml_rl, Pw, opBytes{0x0f, 0xbd}},
+       {ABSRW, yml_rl, Pq, opBytes{0xbd}},
+       {ABSWAPW, ybswap, Pe, opBytes{0x0f, 0xc8}},
+       {ABSWAPL, ybswap, Px, opBytes{0x0f, 0xc8}},
+       {ABSWAPQ, ybswap, Pw, opBytes{0x0f, 0xc8}},
+       {ABTCL, ybtl, Pm, opBytes{0xba, 07, 0xbb}},
+       {ABTCQ, ybtl, Pw, opBytes{0x0f, 0xba, 07, 0x0f, 0xbb}},
+       {ABTCW, ybtl, Pq, opBytes{0xba, 07, 0xbb}},
+       {ABTL, ybtl, Pm, opBytes{0xba, 04, 0xa3}},
+       {ABTQ, ybtl, Pw, opBytes{0x0f, 0xba, 04, 0x0f, 0xa3}},
+       {ABTRL, ybtl, Pm, opBytes{0xba, 06, 0xb3}},
+       {ABTRQ, ybtl, Pw, opBytes{0x0f, 0xba, 06, 0x0f, 0xb3}},
+       {ABTRW, ybtl, Pq, opBytes{0xba, 06, 0xb3}},
+       {ABTSL, ybtl, Pm, opBytes{0xba, 05, 0xab}},
+       {ABTSQ, ybtl, Pw, opBytes{0x0f, 0xba, 05, 0x0f, 0xab}},
+       {ABTSW, ybtl, Pq, opBytes{0xba, 05, 0xab}},
+       {ABTW, ybtl, Pq, opBytes{0xba, 04, 0xa3}},
+       {ABYTE, ybyte, Px, opBytes{1}},
+       {obj.ACALL, ycall, Px, opBytes{0xff, 02, 0xff, 0x15, 0xe8}},
+       {ACBW, ynone, Pe, opBytes{0x98}},
+       {ACDQ, ynone, Px, opBytes{0x99}},
+       {ACDQE, ynone, Pw, opBytes{0x98}},
+       {ACLAC, ynone, Pm, opBytes{01, 0xca}},
+       {ACLC, ynone, Px, opBytes{0xf8}},
+       {ACLD, ynone, Px, opBytes{0xfc}},
+       {ACLFLUSH, yclflush, Pm, opBytes{0xae, 07}},
+       {ACLFLUSHOPT, yclflush, Pq, opBytes{0xae, 07}},
+       {ACLI, ynone, Px, opBytes{0xfa}},
+       {ACLTS, ynone, Pm, opBytes{0x06}},
+       {ACMC, ynone, Px, opBytes{0xf5}},
+       {ACMOVLCC, yml_rl, Pm, opBytes{0x43}},
+       {ACMOVLCS, yml_rl, Pm, opBytes{0x42}},
+       {ACMOVLEQ, yml_rl, Pm, opBytes{0x44}},
+       {ACMOVLGE, yml_rl, Pm, opBytes{0x4d}},
+       {ACMOVLGT, yml_rl, Pm, opBytes{0x4f}},
+       {ACMOVLHI, yml_rl, Pm, opBytes{0x47}},
+       {ACMOVLLE, yml_rl, Pm, opBytes{0x4e}},
+       {ACMOVLLS, yml_rl, Pm, opBytes{0x46}},
+       {ACMOVLLT, yml_rl, Pm, opBytes{0x4c}},
+       {ACMOVLMI, yml_rl, Pm, opBytes{0x48}},
+       {ACMOVLNE, yml_rl, Pm, opBytes{0x45}},
+       {ACMOVLOC, yml_rl, Pm, opBytes{0x41}},
+       {ACMOVLOS, yml_rl, Pm, opBytes{0x40}},
+       {ACMOVLPC, yml_rl, Pm, opBytes{0x4b}},
+       {ACMOVLPL, yml_rl, Pm, opBytes{0x49}},
+       {ACMOVLPS, yml_rl, Pm, opBytes{0x4a}},
+       {ACMOVQCC, yml_rl, Pw, opBytes{0x0f, 0x43}},
+       {ACMOVQCS, yml_rl, Pw, opBytes{0x0f, 0x42}},
+       {ACMOVQEQ, yml_rl, Pw, opBytes{0x0f, 0x44}},
+       {ACMOVQGE, yml_rl, Pw, opBytes{0x0f, 0x4d}},
+       {ACMOVQGT, yml_rl, Pw, opBytes{0x0f, 0x4f}},
+       {ACMOVQHI, yml_rl, Pw, opBytes{0x0f, 0x47}},
+       {ACMOVQLE, yml_rl, Pw, opBytes{0x0f, 0x4e}},
+       {ACMOVQLS, yml_rl, Pw, opBytes{0x0f, 0x46}},
+       {ACMOVQLT, yml_rl, Pw, opBytes{0x0f, 0x4c}},
+       {ACMOVQMI, yml_rl, Pw, opBytes{0x0f, 0x48}},
+       {ACMOVQNE, yml_rl, Pw, opBytes{0x0f, 0x45}},
+       {ACMOVQOC, yml_rl, Pw, opBytes{0x0f, 0x41}},
+       {ACMOVQOS, yml_rl, Pw, opBytes{0x0f, 0x40}},
+       {ACMOVQPC, yml_rl, Pw, opBytes{0x0f, 0x4b}},
+       {ACMOVQPL, yml_rl, Pw, opBytes{0x0f, 0x49}},
+       {ACMOVQPS, yml_rl, Pw, opBytes{0x0f, 0x4a}},
+       {ACMOVWCC, yml_rl, Pq, opBytes{0x43}},
+       {ACMOVWCS, yml_rl, Pq, opBytes{0x42}},
+       {ACMOVWEQ, yml_rl, Pq, opBytes{0x44}},
+       {ACMOVWGE, yml_rl, Pq, opBytes{0x4d}},
+       {ACMOVWGT, yml_rl, Pq, opBytes{0x4f}},
+       {ACMOVWHI, yml_rl, Pq, opBytes{0x47}},
+       {ACMOVWLE, yml_rl, Pq, opBytes{0x4e}},
+       {ACMOVWLS, yml_rl, Pq, opBytes{0x46}},
+       {ACMOVWLT, yml_rl, Pq, opBytes{0x4c}},
+       {ACMOVWMI, yml_rl, Pq, opBytes{0x48}},
+       {ACMOVWNE, yml_rl, Pq, opBytes{0x45}},
+       {ACMOVWOC, yml_rl, Pq, opBytes{0x41}},
+       {ACMOVWOS, yml_rl, Pq, opBytes{0x40}},
+       {ACMOVWPC, yml_rl, Pq, opBytes{0x4b}},
+       {ACMOVWPL, yml_rl, Pq, opBytes{0x49}},
+       {ACMOVWPS, yml_rl, Pq, opBytes{0x4a}},
+       {ACMPB, ycmpb, Pb, opBytes{0x3c, 0x80, 07, 0x38, 0x3a}},
+       {ACMPL, ycmpl, Px, opBytes{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
+       {ACMPPD, yxcmpi, Px, opBytes{Pe, 0xc2}},
+       {ACMPPS, yxcmpi, Pm, opBytes{0xc2, 0}},
+       {ACMPQ, ycmpl, Pw, opBytes{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
+       {ACMPSB, ynone, Pb, opBytes{0xa6}},
+       {ACMPSD, yxcmpi, Px, opBytes{Pf2, 0xc2}},
+       {ACMPSL, ynone, Px, opBytes{0xa7}},
+       {ACMPSQ, ynone, Pw, opBytes{0xa7}},
+       {ACMPSS, yxcmpi, Px, opBytes{Pf3, 0xc2}},
+       {ACMPSW, ynone, Pe, opBytes{0xa7}},
+       {ACMPW, ycmpl, Pe, opBytes{0x83, 07, 0x3d, 0x81, 07, 0x39, 0x3b}},
+       {ACOMISD, yxm, Pe, opBytes{0x2f}},
+       {ACOMISS, yxm, Pm, opBytes{0x2f}},
+       {ACPUID, ynone, Pm, opBytes{0xa2}},
+       {ACVTPL2PD, yxcvm2, Px, opBytes{Pf3, 0xe6, Pe, 0x2a}},
+       {ACVTPL2PS, yxcvm2, Pm, opBytes{0x5b, 0, 0x2a, 0}},
+       {ACVTPD2PL, yxcvm1, Px, opBytes{Pf2, 0xe6, Pe, 0x2d}},
+       {ACVTPD2PS, yxm, Pe, opBytes{0x5a}},
+       {ACVTPS2PL, yxcvm1, Px, opBytes{Pe, 0x5b, Pm, 0x2d}},
+       {ACVTPS2PD, yxm, Pm, opBytes{0x5a}},
+       {ACVTSD2SL, yxcvfl, Pf2, opBytes{0x2d}},
+       {ACVTSD2SQ, yxcvfq, Pw, opBytes{Pf2, 0x2d}},
+       {ACVTSD2SS, yxm, Pf2, opBytes{0x5a}},
+       {ACVTSL2SD, yxcvlf, Pf2, opBytes{0x2a}},
+       {ACVTSQ2SD, yxcvqf, Pw, opBytes{Pf2, 0x2a}},
+       {ACVTSL2SS, yxcvlf, Pf3, opBytes{0x2a}},
+       {ACVTSQ2SS, yxcvqf, Pw, opBytes{Pf3, 0x2a}},
+       {ACVTSS2SD, yxm, Pf3, opBytes{0x5a}},
+       {ACVTSS2SL, yxcvfl, Pf3, opBytes{0x2d}},
+       {ACVTSS2SQ, yxcvfq, Pw, opBytes{Pf3, 0x2d}},
+       {ACVTTPD2PL, yxcvm1, Px, opBytes{Pe, 0xe6, Pe, 0x2c}},
+       {ACVTTPS2PL, yxcvm1, Px, opBytes{Pf3, 0x5b, Pm, 0x2c}},
+       {ACVTTSD2SL, yxcvfl, Pf2, opBytes{0x2c}},
+       {ACVTTSD2SQ, yxcvfq, Pw, opBytes{Pf2, 0x2c}},
+       {ACVTTSS2SL, yxcvfl, Pf3, opBytes{0x2c}},
+       {ACVTTSS2SQ, yxcvfq, Pw, opBytes{Pf3, 0x2c}},
+       {ACWD, ynone, Pe, opBytes{0x99}},
+       {ACWDE, ynone, Px, opBytes{0x98}},
+       {ACQO, ynone, Pw, opBytes{0x99}},
+       {ADAA, ynone, P32, opBytes{0x27}},
+       {ADAS, ynone, P32, opBytes{0x2f}},
+       {ADECB, yscond, Pb, opBytes{0xfe, 01}},
+       {ADECL, yincl, Px1, opBytes{0x48, 0xff, 01}},
+       {ADECQ, yincq, Pw, opBytes{0xff, 01}},
+       {ADECW, yincq, Pe, opBytes{0xff, 01}},
+       {ADIVB, ydivb, Pb, opBytes{0xf6, 06}},
+       {ADIVL, ydivl, Px, opBytes{0xf7, 06}},
+       {ADIVPD, yxm, Pe, opBytes{0x5e}},
+       {ADIVPS, yxm, Pm, opBytes{0x5e}},
+       {ADIVQ, ydivl, Pw, opBytes{0xf7, 06}},
+       {ADIVSD, yxm, Pf2, opBytes{0x5e}},
+       {ADIVSS, yxm, Pf3, opBytes{0x5e}},
+       {ADIVW, ydivl, Pe, opBytes{0xf7, 06}},
+       {ADPPD, yxshuf, Pq, opBytes{0x3a, 0x41, 0}},
+       {ADPPS, yxshuf, Pq, opBytes{0x3a, 0x40, 0}},
+       {AEMMS, ynone, Pm, opBytes{0x77}},
+       {AEXTRACTPS, yextractps, Pq, opBytes{0x3a, 0x17, 0}},
+       {AENTER, nil, 0, opBytes{}}, // botch
+       {AFXRSTOR, ysvrs_mo, Pm, opBytes{0xae, 01, 0xae, 01}},
+       {AFXSAVE, ysvrs_om, Pm, opBytes{0xae, 00, 0xae, 00}},
+       {AFXRSTOR64, ysvrs_mo, Pw, opBytes{0x0f, 0xae, 01, 0x0f, 0xae, 01}},
+       {AFXSAVE64, ysvrs_om, Pw, opBytes{0x0f, 0xae, 00, 0x0f, 0xae, 00}},
+       {AHLT, ynone, Px, opBytes{0xf4}},
+       {AIDIVB, ydivb, Pb, opBytes{0xf6, 07}},
+       {AIDIVL, ydivl, Px, opBytes{0xf7, 07}},
+       {AIDIVQ, ydivl, Pw, opBytes{0xf7, 07}},
+       {AIDIVW, ydivl, Pe, opBytes{0xf7, 07}},
+       {AIMULB, ydivb, Pb, opBytes{0xf6, 05}},
+       {AIMULL, yimul, Px, opBytes{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
+       {AIMULQ, yimul, Pw, opBytes{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
+       {AIMULW, yimul, Pe, opBytes{0xf7, 05, 0x6b, 0x69, Pm, 0xaf}},
+       {AIMUL3W, yimul3, Pe, opBytes{0x6b, 00, 0x69, 00}},
+       {AIMUL3L, yimul3, Px, opBytes{0x6b, 00, 0x69, 00}},
+       {AIMUL3Q, yimul3, Pw, opBytes{0x6b, 00, 0x69, 00}},
+       {AINB, yin, Pb, opBytes{0xe4, 0xec}},
+       {AINW, yin, Pe, opBytes{0xe5, 0xed}},
+       {AINL, yin, Px, opBytes{0xe5, 0xed}},
+       {AINCB, yscond, Pb, opBytes{0xfe, 00}},
+       {AINCL, yincl, Px1, opBytes{0x40, 0xff, 00}},
+       {AINCQ, yincq, Pw, opBytes{0xff, 00}},
+       {AINCW, yincq, Pe, opBytes{0xff, 00}},
+       {AINSB, ynone, Pb, opBytes{0x6c}},
+       {AINSL, ynone, Px, opBytes{0x6d}},
+       {AINSERTPS, yxshuf, Pq, opBytes{0x3a, 0x21, 0}},
+       {AINSW, ynone, Pe, opBytes{0x6d}},
+       {AICEBP, ynone, Px, opBytes{0xf1}},
+       {AINT, yint, Px, opBytes{0xcd}},
+       {AINTO, ynone, P32, opBytes{0xce}},
+       {AIRETL, ynone, Px, opBytes{0xcf}},
+       {AIRETQ, ynone, Pw, opBytes{0xcf}},
+       {AIRETW, ynone, Pe, opBytes{0xcf}},
+       {AJCC, yjcond, Px, opBytes{0x73, 0x83, 00}},
+       {AJCS, yjcond, Px, opBytes{0x72, 0x82}},
+       {AJCXZL, yloop, Px, opBytes{0xe3}},
+       {AJCXZW, yloop, Px, opBytes{0xe3}},
+       {AJCXZQ, yloop, Px, opBytes{0xe3}},
+       {AJEQ, yjcond, Px, opBytes{0x74, 0x84}},
+       {AJGE, yjcond, Px, opBytes{0x7d, 0x8d}},
+       {AJGT, yjcond, Px, opBytes{0x7f, 0x8f}},
+       {AJHI, yjcond, Px, opBytes{0x77, 0x87}},
+       {AJLE, yjcond, Px, opBytes{0x7e, 0x8e}},
+       {AJLS, yjcond, Px, opBytes{0x76, 0x86}},
+       {AJLT, yjcond, Px, opBytes{0x7c, 0x8c}},
+       {AJMI, yjcond, Px, opBytes{0x78, 0x88}},
+       {obj.AJMP, yjmp, Px, opBytes{0xff, 04, 0xeb, 0xe9}},
+       {AJNE, yjcond, Px, opBytes{0x75, 0x85}},
+       {AJOC, yjcond, Px, opBytes{0x71, 0x81, 00}},
+       {AJOS, yjcond, Px, opBytes{0x70, 0x80, 00}},
+       {AJPC, yjcond, Px, opBytes{0x7b, 0x8b}},
+       {AJPL, yjcond, Px, opBytes{0x79, 0x89}},
+       {AJPS, yjcond, Px, opBytes{0x7a, 0x8a}},
+       {AHADDPD, yxm, Pq, opBytes{0x7c}},
+       {AHADDPS, yxm, Pf2, opBytes{0x7c}},
+       {AHSUBPD, yxm, Pq, opBytes{0x7d}},
+       {AHSUBPS, yxm, Pf2, opBytes{0x7d}},
+       {ALAHF, ynone, Px, opBytes{0x9f}},
+       {ALARL, yml_rl, Pm, opBytes{0x02}},
+       {ALARQ, yml_rl, Pw, opBytes{0x0f, 0x02}},
+       {ALARW, yml_rl, Pq, opBytes{0x02}},
+       {ALDDQU, ylddqu, Pf2, opBytes{0xf0}},
+       {ALDMXCSR, ysvrs_mo, Pm, opBytes{0xae, 02, 0xae, 02}},
+       {ALEAL, ym_rl, Px, opBytes{0x8d}},
+       {ALEAQ, ym_rl, Pw, opBytes{0x8d}},
+       {ALEAVEL, ynone, P32, opBytes{0xc9}},
+       {ALEAVEQ, ynone, Py, opBytes{0xc9}},
+       {ALEAVEW, ynone, Pe, opBytes{0xc9}},
+       {ALEAW, ym_rl, Pe, opBytes{0x8d}},
+       {ALOCK, ynone, Px, opBytes{0xf0}},
+       {ALODSB, ynone, Pb, opBytes{0xac}},
+       {ALODSL, ynone, Px, opBytes{0xad}},
+       {ALODSQ, ynone, Pw, opBytes{0xad}},
+       {ALODSW, ynone, Pe, opBytes{0xad}},
+       {ALONG, ybyte, Px, opBytes{4}},
+       {ALOOP, yloop, Px, opBytes{0xe2}},
+       {ALOOPEQ, yloop, Px, opBytes{0xe1}},
+       {ALOOPNE, yloop, Px, opBytes{0xe0}},
+       {ALTR, ydivl, Pm, opBytes{0x00, 03}},
+       {ALZCNTL, yml_rl, Pf3, opBytes{0xbd}},
+       {ALZCNTQ, yml_rl, Pfw, opBytes{0xbd}},
+       {ALZCNTW, yml_rl, Pef3, opBytes{0xbd}},
+       {ALSLL, yml_rl, Pm, opBytes{0x03}},
+       {ALSLW, yml_rl, Pq, opBytes{0x03}},
+       {ALSLQ, yml_rl, Pw, opBytes{0x0f, 0x03}},
+       {AMASKMOVOU, yxr, Pe, opBytes{0xf7}},
+       {AMASKMOVQ, ymr, Pm, opBytes{0xf7}},
+       {AMAXPD, yxm, Pe, opBytes{0x5f}},
+       {AMAXPS, yxm, Pm, opBytes{0x5f}},
+       {AMAXSD, yxm, Pf2, opBytes{0x5f}},
+       {AMAXSS, yxm, Pf3, opBytes{0x5f}},
+       {AMINPD, yxm, Pe, opBytes{0x5d}},
+       {AMINPS, yxm, Pm, opBytes{0x5d}},
+       {AMINSD, yxm, Pf2, opBytes{0x5d}},
+       {AMINSS, yxm, Pf3, opBytes{0x5d}},
+       {AMONITOR, ynone, Px, opBytes{0x0f, 0x01, 0xc8, 0}},
+       {AMWAIT, ynone, Px, opBytes{0x0f, 0x01, 0xc9, 0}},
+       {AMOVAPD, yxmov, Pe, opBytes{0x28, 0x29}},
+       {AMOVAPS, yxmov, Pm, opBytes{0x28, 0x29}},
+       {AMOVB, ymovb, Pb, opBytes{0x88, 0x8a, 0xb0, 0xc6, 00}},
+       {AMOVBLSX, ymb_rl, Pm, opBytes{0xbe}},
+       {AMOVBLZX, ymb_rl, Pm, opBytes{0xb6}},
+       {AMOVBQSX, ymb_rl, Pw, opBytes{0x0f, 0xbe}},
+       {AMOVBQZX, ymb_rl, Pw, opBytes{0x0f, 0xb6}},
+       {AMOVBWSX, ymb_rl, Pq, opBytes{0xbe}},
+       {AMOVSWW, ymb_rl, Pe, opBytes{0x0f, 0xbf}},
+       {AMOVBWZX, ymb_rl, Pq, opBytes{0xb6}},
+       {AMOVZWW, ymb_rl, Pe, opBytes{0x0f, 0xb7}},
+       {AMOVO, yxmov, Pe, opBytes{0x6f, 0x7f}},
+       {AMOVOU, yxmov, Pf3, opBytes{0x6f, 0x7f}},
+       {AMOVHLPS, yxr, Pm, opBytes{0x12}},
+       {AMOVHPD, yxmov, Pe, opBytes{0x16, 0x17}},
+       {AMOVHPS, yxmov, Pm, opBytes{0x16, 0x17}},
+       {AMOVL, ymovl, Px, opBytes{0x89, 0x8b, 0xb8, 0xc7, 00, 0x6e, 0x7e, Pe, 0x6e, Pe, 0x7e, 0}},
+       {AMOVLHPS, yxr, Pm, opBytes{0x16}},
+       {AMOVLPD, yxmov, Pe, opBytes{0x12, 0x13}},
+       {AMOVLPS, yxmov, Pm, opBytes{0x12, 0x13}},
+       {AMOVLQSX, yml_rl, Pw, opBytes{0x63}},
+       {AMOVLQZX, yml_rl, Px, opBytes{0x8b}},
+       {AMOVMSKPD, yxrrl, Pq, opBytes{0x50}},
+       {AMOVMSKPS, yxrrl, Pm, opBytes{0x50}},
+       {AMOVNTO, yxr_ml, Pe, opBytes{0xe7}},
+       {AMOVNTDQA, ylddqu, Pq4, opBytes{0x2a}},
+       {AMOVNTPD, yxr_ml, Pe, opBytes{0x2b}},
+       {AMOVNTPS, yxr_ml, Pm, opBytes{0x2b}},
+       {AMOVNTQ, ymr_ml, Pm, opBytes{0xe7}},
+       {AMOVQ, ymovq, Pw8, opBytes{0x6f, 0x7f, Pf2, 0xd6, Pf3, 0x7e, Pe, 0xd6, 0x89, 0x8b, 0xc7, 00, 0xb8, 0xc7, 00, 0x6e, 0x7e, Pe, 0x6e, Pe, 0x7e, 0}},
+       {AMOVQOZX, ymrxr, Pf3, opBytes{0xd6, 0x7e}},
+       {AMOVSB, ynone, Pb, opBytes{0xa4}},
+       {AMOVSD, yxmov, Pf2, opBytes{0x10, 0x11}},
+       {AMOVSL, ynone, Px, opBytes{0xa5}},
+       {AMOVSQ, ynone, Pw, opBytes{0xa5}},
+       {AMOVSS, yxmov, Pf3, opBytes{0x10, 0x11}},
+       {AMOVSW, ynone, Pe, opBytes{0xa5}},
+       {AMOVUPD, yxmov, Pe, opBytes{0x10, 0x11}},
+       {AMOVUPS, yxmov, Pm, opBytes{0x10, 0x11}},
+       {AMOVW, ymovw, Pe, opBytes{0x89, 0x8b, 0xb8, 0xc7, 00, 0}},
+       {AMOVWLSX, yml_rl, Pm, opBytes{0xbf}},
+       {AMOVWLZX, yml_rl, Pm, opBytes{0xb7}},
+       {AMOVWQSX, yml_rl, Pw, opBytes{0x0f, 0xbf}},
+       {AMOVWQZX, yml_rl, Pw, opBytes{0x0f, 0xb7}},
+       {AMPSADBW, yxshuf, Pq, opBytes{0x3a, 0x42, 0}},
+       {AMULB, ydivb, Pb, opBytes{0xf6, 04}},
+       {AMULL, ydivl, Px, opBytes{0xf7, 04}},
+       {AMULPD, yxm, Pe, opBytes{0x59}},
+       {AMULPS, yxm, Ym, opBytes{0x59}},
+       {AMULQ, ydivl, Pw, opBytes{0xf7, 04}},
+       {AMULSD, yxm, Pf2, opBytes{0x59}},
+       {AMULSS, yxm, Pf3, opBytes{0x59}},
+       {AMULW, ydivl, Pe, opBytes{0xf7, 04}},
+       {ANEGB, yscond, Pb, opBytes{0xf6, 03}},
+       {ANEGL, yscond, Px, opBytes{0xf7, 03}},
+       {ANEGQ, yscond, Pw, opBytes{0xf7, 03}},
+       {ANEGW, yscond, Pe, opBytes{0xf7, 03}},
+       {obj.ANOP, ynop, Px, opBytes{0, 0}},
+       {ANOTB, yscond, Pb, opBytes{0xf6, 02}},
+       {ANOTL, yscond, Px, opBytes{0xf7, 02}}, // TODO(rsc): yscond is wrong here.
+       {ANOTQ, yscond, Pw, opBytes{0xf7, 02}},
+       {ANOTW, yscond, Pe, opBytes{0xf7, 02}},
+       {AORB, yxorb, Pb, opBytes{0x0c, 0x80, 01, 0x08, 0x0a}},
+       {AORL, yaddl, Px, opBytes{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
+       {AORPD, yxm, Pq, opBytes{0x56}},
+       {AORPS, yxm, Pm, opBytes{0x56}},
+       {AORQ, yaddl, Pw, opBytes{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
+       {AORW, yaddl, Pe, opBytes{0x83, 01, 0x0d, 0x81, 01, 0x09, 0x0b}},
+       {AOUTB, yin, Pb, opBytes{0xe6, 0xee}},
+       {AOUTL, yin, Px, opBytes{0xe7, 0xef}},
+       {AOUTW, yin, Pe, opBytes{0xe7, 0xef}},
+       {AOUTSB, ynone, Pb, opBytes{0x6e}},
+       {AOUTSL, ynone, Px, opBytes{0x6f}},
+       {AOUTSW, ynone, Pe, opBytes{0x6f}},
+       {APABSB, yxm_q4, Pq4, opBytes{0x1c}},
+       {APABSD, yxm_q4, Pq4, opBytes{0x1e}},
+       {APABSW, yxm_q4, Pq4, opBytes{0x1d}},
+       {APACKSSLW, ymm, Py1, opBytes{0x6b, Pe, 0x6b}},
+       {APACKSSWB, ymm, Py1, opBytes{0x63, Pe, 0x63}},
+       {APACKUSDW, yxm_q4, Pq4, opBytes{0x2b}},
+       {APACKUSWB, ymm, Py1, opBytes{0x67, Pe, 0x67}},
+       {APADDB, ymm, Py1, opBytes{0xfc, Pe, 0xfc}},
+       {APADDL, ymm, Py1, opBytes{0xfe, Pe, 0xfe}},
+       {APADDQ, yxm, Pe, opBytes{0xd4}},
+       {APADDSB, ymm, Py1, opBytes{0xec, Pe, 0xec}},
+       {APADDSW, ymm, Py1, opBytes{0xed, Pe, 0xed}},
+       {APADDUSB, ymm, Py1, opBytes{0xdc, Pe, 0xdc}},
+       {APADDUSW, ymm, Py1, opBytes{0xdd, Pe, 0xdd}},
+       {APADDW, ymm, Py1, opBytes{0xfd, Pe, 0xfd}},
+       {APALIGNR, ypalignr, Pq, opBytes{0x3a, 0x0f}},
+       {APAND, ymm, Py1, opBytes{0xdb, Pe, 0xdb}},
+       {APANDN, ymm, Py1, opBytes{0xdf, Pe, 0xdf}},
+       {APAUSE, ynone, Px, opBytes{0xf3, 0x90}},
+       {APAVGB, ymm, Py1, opBytes{0xe0, Pe, 0xe0}},
+       {APAVGW, ymm, Py1, opBytes{0xe3, Pe, 0xe3}},
+       {APBLENDW, yxshuf, Pq, opBytes{0x3a, 0x0e, 0}},
+       {APCMPEQB, ymm, Py1, opBytes{0x74, Pe, 0x74}},
+       {APCMPEQL, ymm, Py1, opBytes{0x76, Pe, 0x76}},
+       {APCMPEQQ, yxm_q4, Pq4, opBytes{0x29}},
+       {APCMPEQW, ymm, Py1, opBytes{0x75, Pe, 0x75}},
+       {APCMPGTB, ymm, Py1, opBytes{0x64, Pe, 0x64}},
+       {APCMPGTL, ymm, Py1, opBytes{0x66, Pe, 0x66}},
+       {APCMPGTQ, yxm_q4, Pq4, opBytes{0x37}},
+       {APCMPGTW, ymm, Py1, opBytes{0x65, Pe, 0x65}},
+       {APCMPISTRI, yxshuf, Pq, opBytes{0x3a, 0x63, 0}},
+       {APCMPISTRM, yxshuf, Pq, opBytes{0x3a, 0x62, 0}},
+       {APEXTRW, yextrw, Pq, opBytes{0xc5, 0, 0x3a, 0x15, 0}},
+       {APEXTRB, yextr, Pq, opBytes{0x3a, 0x14, 00}},
+       {APEXTRD, yextr, Pq, opBytes{0x3a, 0x16, 00}},
+       {APEXTRQ, yextr, Pq3, opBytes{0x3a, 0x16, 00}},
+       {APHADDD, ymmxmm0f38, Px, opBytes{0x0F, 0x38, 0x02, 0, 0x66, 0x0F, 0x38, 0x02, 0}},
+       {APHADDSW, yxm_q4, Pq4, opBytes{0x03}},
+       {APHADDW, yxm_q4, Pq4, opBytes{0x01}},
+       {APHMINPOSUW, yxm_q4, Pq4, opBytes{0x41}},
+       {APHSUBD, yxm_q4, Pq4, opBytes{0x06}},
+       {APHSUBSW, yxm_q4, Pq4, opBytes{0x07}},
+       {APHSUBW, yxm_q4, Pq4, opBytes{0x05}},
+       {APINSRW, yinsrw, Pq, opBytes{0xc4, 00}},
+       {APINSRB, yinsr, Pq, opBytes{0x3a, 0x20, 00}},
+       {APINSRD, yinsr, Pq, opBytes{0x3a, 0x22, 00}},
+       {APINSRQ, yinsr, Pq3, opBytes{0x3a, 0x22, 00}},
+       {APMADDUBSW, yxm_q4, Pq4, opBytes{0x04}},
+       {APMADDWL, ymm, Py1, opBytes{0xf5, Pe, 0xf5}},
+       {APMAXSB, yxm_q4, Pq4, opBytes{0x3c}},
+       {APMAXSD, yxm_q4, Pq4, opBytes{0x3d}},
+       {APMAXSW, yxm, Pe, opBytes{0xee}},
+       {APMAXUB, yxm, Pe, opBytes{0xde}},
+       {APMAXUD, yxm_q4, Pq4, opBytes{0x3f}},
+       {APMAXUW, yxm_q4, Pq4, opBytes{0x3e}},
+       {APMINSB, yxm_q4, Pq4, opBytes{0x38}},
+       {APMINSD, yxm_q4, Pq4, opBytes{0x39}},
+       {APMINSW, yxm, Pe, opBytes{0xea}},
+       {APMINUB, yxm, Pe, opBytes{0xda}},
+       {APMINUD, yxm_q4, Pq4, opBytes{0x3b}},
+       {APMINUW, yxm_q4, Pq4, opBytes{0x3a}},
+       {APMOVMSKB, ymskb, Px, opBytes{Pe, 0xd7, 0xd7}},
+       {APMOVSXBD, yxm_q4, Pq4, opBytes{0x21}},
+       {APMOVSXBQ, yxm_q4, Pq4, opBytes{0x22}},
+       {APMOVSXBW, yxm_q4, Pq4, opBytes{0x20}},
+       {APMOVSXDQ, yxm_q4, Pq4, opBytes{0x25}},
+       {APMOVSXWD, yxm_q4, Pq4, opBytes{0x23}},
+       {APMOVSXWQ, yxm_q4, Pq4, opBytes{0x24}},
+       {APMOVZXBD, yxm_q4, Pq4, opBytes{0x31}},
+       {APMOVZXBQ, yxm_q4, Pq4, opBytes{0x32}},
+       {APMOVZXBW, yxm_q4, Pq4, opBytes{0x30}},
+       {APMOVZXDQ, yxm_q4, Pq4, opBytes{0x35}},
+       {APMOVZXWD, yxm_q4, Pq4, opBytes{0x33}},
+       {APMOVZXWQ, yxm_q4, Pq4, opBytes{0x34}},
+       {APMULDQ, yxm_q4, Pq4, opBytes{0x28}},
+       {APMULHRSW, yxm_q4, Pq4, opBytes{0x0b}},
+       {APMULHUW, ymm, Py1, opBytes{0xe4, Pe, 0xe4}},
+       {APMULHW, ymm, Py1, opBytes{0xe5, Pe, 0xe5}},
+       {APMULLD, yxm_q4, Pq4, opBytes{0x40}},
+       {APMULLW, ymm, Py1, opBytes{0xd5, Pe, 0xd5}},
+       {APMULULQ, ymm, Py1, opBytes{0xf4, Pe, 0xf4}},
+       {APOPAL, ynone, P32, opBytes{0x61}},
+       {APOPAW, ynone, Pe, opBytes{0x61}},
+       {APOPCNTW, yml_rl, Pef3, opBytes{0xb8}},
+       {APOPCNTL, yml_rl, Pf3, opBytes{0xb8}},
+       {APOPCNTQ, yml_rl, Pfw, opBytes{0xb8}},
+       {APOPFL, ynone, P32, opBytes{0x9d}},
+       {APOPFQ, ynone, Py, opBytes{0x9d}},
+       {APOPFW, ynone, Pe, opBytes{0x9d}},
+       {APOPL, ypopl, P32, opBytes{0x58, 0x8f, 00}},
+       {APOPQ, ypopl, Py, opBytes{0x58, 0x8f, 00}},
+       {APOPW, ypopl, Pe, opBytes{0x58, 0x8f, 00}},
+       {APOR, ymm, Py1, opBytes{0xeb, Pe, 0xeb}},
+       {APSADBW, yxm, Pq, opBytes{0xf6}},
+       {APSHUFHW, yxshuf, Pf3, opBytes{0x70, 00}},
+       {APSHUFL, yxshuf, Pq, opBytes{0x70, 00}},
+       {APSHUFLW, yxshuf, Pf2, opBytes{0x70, 00}},
+       {APSHUFW, ymshuf, Pm, opBytes{0x70, 00}},
+       {APSHUFB, ymshufb, Pq, opBytes{0x38, 0x00}},
+       {APSIGNB, yxm_q4, Pq4, opBytes{0x08}},
+       {APSIGND, yxm_q4, Pq4, opBytes{0x0a}},
+       {APSIGNW, yxm_q4, Pq4, opBytes{0x09}},
+       {APSLLO, ypsdq, Pq, opBytes{0x73, 07}},
+       {APSLLL, yps, Py3, opBytes{0xf2, 0x72, 06, Pe, 0xf2, Pe, 0x72, 06}},
+       {APSLLQ, yps, Py3, opBytes{0xf3, 0x73, 06, Pe, 0xf3, Pe, 0x73, 06}},
+       {APSLLW, yps, Py3, opBytes{0xf1, 0x71, 06, Pe, 0xf1, Pe, 0x71, 06}},
+       {APSRAL, yps, Py3, opBytes{0xe2, 0x72, 04, Pe, 0xe2, Pe, 0x72, 04}},
+       {APSRAW, yps, Py3, opBytes{0xe1, 0x71, 04, Pe, 0xe1, Pe, 0x71, 04}},
+       {APSRLO, ypsdq, Pq, opBytes{0x73, 03}},
+       {APSRLL, yps, Py3, opBytes{0xd2, 0x72, 02, Pe, 0xd2, Pe, 0x72, 02}},
+       {APSRLQ, yps, Py3, opBytes{0xd3, 0x73, 02, Pe, 0xd3, Pe, 0x73, 02}},
+       {APSRLW, yps, Py3, opBytes{0xd1, 0x71, 02, Pe, 0xd1, Pe, 0x71, 02}},
+       {APSUBB, yxm, Pe, opBytes{0xf8}},
+       {APSUBL, yxm, Pe, opBytes{0xfa}},
+       {APSUBQ, yxm, Pe, opBytes{0xfb}},
+       {APSUBSB, yxm, Pe, opBytes{0xe8}},
+       {APSUBSW, yxm, Pe, opBytes{0xe9}},
+       {APSUBUSB, yxm, Pe, opBytes{0xd8}},
+       {APSUBUSW, yxm, Pe, opBytes{0xd9}},
+       {APSUBW, yxm, Pe, opBytes{0xf9}},
+       {APTEST, yxm_q4, Pq4, opBytes{0x17}},
+       {APUNPCKHBW, ymm, Py1, opBytes{0x68, Pe, 0x68}},
+       {APUNPCKHLQ, ymm, Py1, opBytes{0x6a, Pe, 0x6a}},
+       {APUNPCKHQDQ, yxm, Pe, opBytes{0x6d}},
+       {APUNPCKHWL, ymm, Py1, opBytes{0x69, Pe, 0x69}},
+       {APUNPCKLBW, ymm, Py1, opBytes{0x60, Pe, 0x60}},
+       {APUNPCKLLQ, ymm, Py1, opBytes{0x62, Pe, 0x62}},
+       {APUNPCKLQDQ, yxm, Pe, opBytes{0x6c}},
+       {APUNPCKLWL, ymm, Py1, opBytes{0x61, Pe, 0x61}},
+       {APUSHAL, ynone, P32, opBytes{0x60}},
+       {APUSHAW, ynone, Pe, opBytes{0x60}},
+       {APUSHFL, ynone, P32, opBytes{0x9c}},
+       {APUSHFQ, ynone, Py, opBytes{0x9c}},
+       {APUSHFW, ynone, Pe, opBytes{0x9c}},
+       {APUSHL, ypushl, P32, opBytes{0x50, 0xff, 06, 0x6a, 0x68}},
+       {APUSHQ, ypushl, Py, opBytes{0x50, 0xff, 06, 0x6a, 0x68}},
+       {APUSHW, ypushl, Pe, opBytes{0x50, 0xff, 06, 0x6a, 0x68}},
+       {APXOR, ymm, Py1, opBytes{0xef, Pe, 0xef}},
+       {AQUAD, ybyte, Px, opBytes{8}},
+       {ARCLB, yshb, Pb, opBytes{0xd0, 02, 0xc0, 02, 0xd2, 02}},
+       {ARCLL, yshl, Px, opBytes{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
+       {ARCLQ, yshl, Pw, opBytes{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
+       {ARCLW, yshl, Pe, opBytes{0xd1, 02, 0xc1, 02, 0xd3, 02, 0xd3, 02}},
+       {ARCPPS, yxm, Pm, opBytes{0x53}},
+       {ARCPSS, yxm, Pf3, opBytes{0x53}},
+       {ARCRB, yshb, Pb, opBytes{0xd0, 03, 0xc0, 03, 0xd2, 03}},
+       {ARCRL, yshl, Px, opBytes{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
+       {ARCRQ, yshl, Pw, opBytes{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
+       {ARCRW, yshl, Pe, opBytes{0xd1, 03, 0xc1, 03, 0xd3, 03, 0xd3, 03}},
+       {AREP, ynone, Px, opBytes{0xf3}},
+       {AREPN, ynone, Px, opBytes{0xf2}},
+       {obj.ARET, ynone, Px, opBytes{0xc3}},
+       {ARETFW, yret, Pe, opBytes{0xcb, 0xca}},
+       {ARETFL, yret, Px, opBytes{0xcb, 0xca}},
+       {ARETFQ, yret, Pw, opBytes{0xcb, 0xca}},
+       {AROLB, yshb, Pb, opBytes{0xd0, 00, 0xc0, 00, 0xd2, 00}},
+       {AROLL, yshl, Px, opBytes{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
+       {AROLQ, yshl, Pw, opBytes{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
+       {AROLW, yshl, Pe, opBytes{0xd1, 00, 0xc1, 00, 0xd3, 00, 0xd3, 00}},
+       {ARORB, yshb, Pb, opBytes{0xd0, 01, 0xc0, 01, 0xd2, 01}},
+       {ARORL, yshl, Px, opBytes{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
+       {ARORQ, yshl, Pw, opBytes{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
+       {ARORW, yshl, Pe, opBytes{0xd1, 01, 0xc1, 01, 0xd3, 01, 0xd3, 01}},
+       {ARSQRTPS, yxm, Pm, opBytes{0x52}},
+       {ARSQRTSS, yxm, Pf3, opBytes{0x52}},
+       {ASAHF, ynone, Px, opBytes{0x9e, 00, 0x86, 0xe0, 0x50, 0x9d}}, // XCHGB AH,AL; PUSH AX; POPFL
+       {ASALB, yshb, Pb, opBytes{0xd0, 04, 0xc0, 04, 0xd2, 04}},
+       {ASALL, yshl, Px, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASALQ, yshl, Pw, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASALW, yshl, Pe, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASARB, yshb, Pb, opBytes{0xd0, 07, 0xc0, 07, 0xd2, 07}},
+       {ASARL, yshl, Px, opBytes{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
+       {ASARQ, yshl, Pw, opBytes{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
+       {ASARW, yshl, Pe, opBytes{0xd1, 07, 0xc1, 07, 0xd3, 07, 0xd3, 07}},
+       {ASBBB, yxorb, Pb, opBytes{0x1c, 0x80, 03, 0x18, 0x1a}},
+       {ASBBL, yaddl, Px, opBytes{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
+       {ASBBQ, yaddl, Pw, opBytes{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
+       {ASBBW, yaddl, Pe, opBytes{0x83, 03, 0x1d, 0x81, 03, 0x19, 0x1b}},
+       {ASCASB, ynone, Pb, opBytes{0xae}},
+       {ASCASL, ynone, Px, opBytes{0xaf}},
+       {ASCASQ, ynone, Pw, opBytes{0xaf}},
+       {ASCASW, ynone, Pe, opBytes{0xaf}},
+       {ASETCC, yscond, Pb, opBytes{0x0f, 0x93, 00}},
+       {ASETCS, yscond, Pb, opBytes{0x0f, 0x92, 00}},
+       {ASETEQ, yscond, Pb, opBytes{0x0f, 0x94, 00}},
+       {ASETGE, yscond, Pb, opBytes{0x0f, 0x9d, 00}},
+       {ASETGT, yscond, Pb, opBytes{0x0f, 0x9f, 00}},
+       {ASETHI, yscond, Pb, opBytes{0x0f, 0x97, 00}},
+       {ASETLE, yscond, Pb, opBytes{0x0f, 0x9e, 00}},
+       {ASETLS, yscond, Pb, opBytes{0x0f, 0x96, 00}},
+       {ASETLT, yscond, Pb, opBytes{0x0f, 0x9c, 00}},
+       {ASETMI, yscond, Pb, opBytes{0x0f, 0x98, 00}},
+       {ASETNE, yscond, Pb, opBytes{0x0f, 0x95, 00}},
+       {ASETOC, yscond, Pb, opBytes{0x0f, 0x91, 00}},
+       {ASETOS, yscond, Pb, opBytes{0x0f, 0x90, 00}},
+       {ASETPC, yscond, Pb, opBytes{0x0f, 0x9b, 00}},
+       {ASETPL, yscond, Pb, opBytes{0x0f, 0x99, 00}},
+       {ASETPS, yscond, Pb, opBytes{0x0f, 0x9a, 00}},
+       {ASHLB, yshb, Pb, opBytes{0xd0, 04, 0xc0, 04, 0xd2, 04}},
+       {ASHLL, yshl, Px, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASHLQ, yshl, Pw, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASHLW, yshl, Pe, opBytes{0xd1, 04, 0xc1, 04, 0xd3, 04, 0xd3, 04}},
+       {ASHRB, yshb, Pb, opBytes{0xd0, 05, 0xc0, 05, 0xd2, 05}},
+       {ASHRL, yshl, Px, opBytes{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
+       {ASHRQ, yshl, Pw, opBytes{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
+       {ASHRW, yshl, Pe, opBytes{0xd1, 05, 0xc1, 05, 0xd3, 05, 0xd3, 05}},
+       {ASHUFPD, yxshuf, Pq, opBytes{0xc6, 00}},
+       {ASHUFPS, yxshuf, Pm, opBytes{0xc6, 00}},
+       {ASQRTPD, yxm, Pe, opBytes{0x51}},
+       {ASQRTPS, yxm, Pm, opBytes{0x51}},
+       {ASQRTSD, yxm, Pf2, opBytes{0x51}},
+       {ASQRTSS, yxm, Pf3, opBytes{0x51}},
+       {ASTC, ynone, Px, opBytes{0xf9}},
+       {ASTD, ynone, Px, opBytes{0xfd}},
+       {ASTI, ynone, Px, opBytes{0xfb}},
+       {ASTMXCSR, ysvrs_om, Pm, opBytes{0xae, 03, 0xae, 03}},
+       {ASTOSB, ynone, Pb, opBytes{0xaa}},
+       {ASTOSL, ynone, Px, opBytes{0xab}},
+       {ASTOSQ, ynone, Pw, opBytes{0xab}},
+       {ASTOSW, ynone, Pe, opBytes{0xab}},
+       {ASUBB, yxorb, Pb, opBytes{0x2c, 0x80, 05, 0x28, 0x2a}},
+       {ASUBL, yaddl, Px, opBytes{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
+       {ASUBPD, yxm, Pe, opBytes{0x5c}},
+       {ASUBPS, yxm, Pm, opBytes{0x5c}},
+       {ASUBQ, yaddl, Pw, opBytes{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
+       {ASUBSD, yxm, Pf2, opBytes{0x5c}},
+       {ASUBSS, yxm, Pf3, opBytes{0x5c}},
+       {ASUBW, yaddl, Pe, opBytes{0x83, 05, 0x2d, 0x81, 05, 0x29, 0x2b}},
+       {ASWAPGS, ynone, Pm, opBytes{0x01, 0xf8}},
+       {ASYSCALL, ynone, Px, opBytes{0x0f, 0x05}}, // fast syscall
+       {ATESTB, yxorb, Pb, opBytes{0xa8, 0xf6, 00, 0x84, 0x84}},
+       {ATESTL, ytestl, Px, opBytes{0xa9, 0xf7, 00, 0x85, 0x85}},
+       {ATESTQ, ytestl, Pw, opBytes{0xa9, 0xf7, 00, 0x85, 0x85}},
+       {ATESTW, ytestl, Pe, opBytes{0xa9, 0xf7, 00, 0x85, 0x85}},
+       {obj.ATEXT, ytext, Px, opBytes{}},
+       {AUCOMISD, yxm, Pe, opBytes{0x2e}},
+       {AUCOMISS, yxm, Pm, opBytes{0x2e}},
+       {AUNPCKHPD, yxm, Pe, opBytes{0x15}},
+       {AUNPCKHPS, yxm, Pm, opBytes{0x15}},
+       {AUNPCKLPD, yxm, Pe, opBytes{0x14}},
+       {AUNPCKLPS, yxm, Pm, opBytes{0x14}},
+       {AVERR, ydivl, Pm, opBytes{0x00, 04}},
+       {AVERW, ydivl, Pm, opBytes{0x00, 05}},
+       {AWAIT, ynone, Px, opBytes{0x9b}},
+       {AWORD, ybyte, Px, opBytes{2}},
+       {AXCHGB, yml_mb, Pb, opBytes{0x86, 0x86}},
+       {AXCHGL, yxchg, Px, opBytes{0x90, 0x90, 0x87, 0x87}},
+       {AXCHGQ, yxchg, Pw, opBytes{0x90, 0x90, 0x87, 0x87}},
+       {AXCHGW, yxchg, Pe, opBytes{0x90, 0x90, 0x87, 0x87}},
+       {AXLAT, ynone, Px, opBytes{0xd7}},
+       {AXORB, yxorb, Pb, opBytes{0x34, 0x80, 06, 0x30, 0x32}},
+       {AXORL, yaddl, Px, opBytes{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
+       {AXORPD, yxm, Pe, opBytes{0x57}},
+       {AXORPS, yxm, Pm, opBytes{0x57}},
+       {AXORQ, yaddl, Pw, opBytes{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
+       {AXORW, yaddl, Pe, opBytes{0x83, 06, 0x35, 0x81, 06, 0x31, 0x33}},
+       {AFMOVB, yfmvx, Px, opBytes{0xdf, 04}},
+       {AFMOVBP, yfmvp, Px, opBytes{0xdf, 06}},
+       {AFMOVD, yfmvd, Px, opBytes{0xdd, 00, 0xdd, 02, 0xd9, 00, 0xdd, 02}},
+       {AFMOVDP, yfmvdp, Px, opBytes{0xdd, 03, 0xdd, 03}},
+       {AFMOVF, yfmvf, Px, opBytes{0xd9, 00, 0xd9, 02}},
+       {AFMOVFP, yfmvp, Px, opBytes{0xd9, 03}},
+       {AFMOVL, yfmvf, Px, opBytes{0xdb, 00, 0xdb, 02}},
+       {AFMOVLP, yfmvp, Px, opBytes{0xdb, 03}},
+       {AFMOVV, yfmvx, Px, opBytes{0xdf, 05}},
+       {AFMOVVP, yfmvp, Px, opBytes{0xdf, 07}},
+       {AFMOVW, yfmvf, Px, opBytes{0xdf, 00, 0xdf, 02}},
+       {AFMOVWP, yfmvp, Px, opBytes{0xdf, 03}},
+       {AFMOVX, yfmvx, Px, opBytes{0xdb, 05}},
+       {AFMOVXP, yfmvp, Px, opBytes{0xdb, 07}},
+       {AFCMOVCC, yfcmv, Px, opBytes{0xdb, 00}},
+       {AFCMOVCS, yfcmv, Px, opBytes{0xda, 00}},
+       {AFCMOVEQ, yfcmv, Px, opBytes{0xda, 01}},
+       {AFCMOVHI, yfcmv, Px, opBytes{0xdb, 02}},
+       {AFCMOVLS, yfcmv, Px, opBytes{0xda, 02}},
+       {AFCMOVB, yfcmv, Px, opBytes{0xda, 00}},
+       {AFCMOVBE, yfcmv, Px, opBytes{0xda, 02}},
+       {AFCMOVNB, yfcmv, Px, opBytes{0xdb, 00}},
+       {AFCMOVNBE, yfcmv, Px, opBytes{0xdb, 02}},
+       {AFCMOVE, yfcmv, Px, opBytes{0xda, 01}},
+       {AFCMOVNE, yfcmv, Px, opBytes{0xdb, 01}},
+       {AFCMOVNU, yfcmv, Px, opBytes{0xdb, 03}},
+       {AFCMOVU, yfcmv, Px, opBytes{0xda, 03}},
+       {AFCMOVUN, yfcmv, Px, opBytes{0xda, 03}},
+       {AFCOMD, yfadd, Px, opBytes{0xdc, 02, 0xd8, 02, 0xdc, 02}},  // botch
+       {AFCOMDP, yfadd, Px, opBytes{0xdc, 03, 0xd8, 03, 0xdc, 03}}, // botch
+       {AFCOMDPP, ycompp, Px, opBytes{0xde, 03}},
+       {AFCOMF, yfmvx, Px, opBytes{0xd8, 02}},
+       {AFCOMFP, yfmvx, Px, opBytes{0xd8, 03}},
+       {AFCOMI, yfcmv, Px, opBytes{0xdb, 06}},
+       {AFCOMIP, yfcmv, Px, opBytes{0xdf, 06}},
+       {AFCOML, yfmvx, Px, opBytes{0xda, 02}},
+       {AFCOMLP, yfmvx, Px, opBytes{0xda, 03}},
+       {AFCOMW, yfmvx, Px, opBytes{0xde, 02}},
+       {AFCOMWP, yfmvx, Px, opBytes{0xde, 03}},
+       {AFUCOM, ycompp, Px, opBytes{0xdd, 04}},
+       {AFUCOMI, ycompp, Px, opBytes{0xdb, 05}},
+       {AFUCOMIP, ycompp, Px, opBytes{0xdf, 05}},
+       {AFUCOMP, ycompp, Px, opBytes{0xdd, 05}},
+       {AFUCOMPP, ycompp, Px, opBytes{0xda, 13}},
+       {AFADDDP, ycompp, Px, opBytes{0xde, 00}},
+       {AFADDW, yfmvx, Px, opBytes{0xde, 00}},
+       {AFADDL, yfmvx, Px, opBytes{0xda, 00}},
+       {AFADDF, yfmvx, Px, opBytes{0xd8, 00}},
+       {AFADDD, yfadd, Px, opBytes{0xdc, 00, 0xd8, 00, 0xdc, 00}},
+       {AFMULDP, ycompp, Px, opBytes{0xde, 01}},
+       {AFMULW, yfmvx, Px, opBytes{0xde, 01}},
+       {AFMULL, yfmvx, Px, opBytes{0xda, 01}},
+       {AFMULF, yfmvx, Px, opBytes{0xd8, 01}},
+       {AFMULD, yfadd, Px, opBytes{0xdc, 01, 0xd8, 01, 0xdc, 01}},
+       {AFSUBDP, ycompp, Px, opBytes{0xde, 05}},
+       {AFSUBW, yfmvx, Px, opBytes{0xde, 04}},
+       {AFSUBL, yfmvx, Px, opBytes{0xda, 04}},
+       {AFSUBF, yfmvx, Px, opBytes{0xd8, 04}},
+       {AFSUBD, yfadd, Px, opBytes{0xdc, 04, 0xd8, 04, 0xdc, 05}},
+       {AFSUBRDP, ycompp, Px, opBytes{0xde, 04}},
+       {AFSUBRW, yfmvx, Px, opBytes{0xde, 05}},
+       {AFSUBRL, yfmvx, Px, opBytes{0xda, 05}},
+       {AFSUBRF, yfmvx, Px, opBytes{0xd8, 05}},
+       {AFSUBRD, yfadd, Px, opBytes{0xdc, 05, 0xd8, 05, 0xdc, 04}},
+       {AFDIVDP, ycompp, Px, opBytes{0xde, 07}},
+       {AFDIVW, yfmvx, Px, opBytes{0xde, 06}},
+       {AFDIVL, yfmvx, Px, opBytes{0xda, 06}},
+       {AFDIVF, yfmvx, Px, opBytes{0xd8, 06}},
+       {AFDIVD, yfadd, Px, opBytes{0xdc, 06, 0xd8, 06, 0xdc, 07}},
+       {AFDIVRDP, ycompp, Px, opBytes{0xde, 06}},
+       {AFDIVRW, yfmvx, Px, opBytes{0xde, 07}},
+       {AFDIVRL, yfmvx, Px, opBytes{0xda, 07}},
+       {AFDIVRF, yfmvx, Px, opBytes{0xd8, 07}},
+       {AFDIVRD, yfadd, Px, opBytes{0xdc, 07, 0xd8, 07, 0xdc, 06}},
+       {AFXCHD, yfxch, Px, opBytes{0xd9, 01, 0xd9, 01}},
+       {AFFREE, nil, 0, opBytes{}},
+       {AFLDCW, ysvrs_mo, Px, opBytes{0xd9, 05, 0xd9, 05}},
+       {AFLDENV, ysvrs_mo, Px, opBytes{0xd9, 04, 0xd9, 04}},
+       {AFRSTOR, ysvrs_mo, Px, opBytes{0xdd, 04, 0xdd, 04}},
+       {AFSAVE, ysvrs_om, Px, opBytes{0xdd, 06, 0xdd, 06}},
+       {AFSTCW, ysvrs_om, Px, opBytes{0xd9, 07, 0xd9, 07}},
+       {AFSTENV, ysvrs_om, Px, opBytes{0xd9, 06, 0xd9, 06}},
+       {AFSTSW, ystsw, Px, opBytes{0xdd, 07, 0xdf, 0xe0}},
+       {AF2XM1, ynone, Px, opBytes{0xd9, 0xf0}},
+       {AFABS, ynone, Px, opBytes{0xd9, 0xe1}},
+       {AFBLD, ysvrs_mo, Px, opBytes{0xdf, 04}},
+       {AFBSTP, yclflush, Px, opBytes{0xdf, 06}},
+       {AFCHS, ynone, Px, opBytes{0xd9, 0xe0}},
+       {AFCLEX, ynone, Px, opBytes{0xdb, 0xe2}},
+       {AFCOS, ynone, Px, opBytes{0xd9, 0xff}},
+       {AFDECSTP, ynone, Px, opBytes{0xd9, 0xf6}},
+       {AFINCSTP, ynone, Px, opBytes{0xd9, 0xf7}},
+       {AFINIT, ynone, Px, opBytes{0xdb, 0xe3}},
+       {AFLD1, ynone, Px, opBytes{0xd9, 0xe8}},
+       {AFLDL2E, ynone, Px, opBytes{0xd9, 0xea}},
+       {AFLDL2T, ynone, Px, opBytes{0xd9, 0xe9}},
+       {AFLDLG2, ynone, Px, opBytes{0xd9, 0xec}},
+       {AFLDLN2, ynone, Px, opBytes{0xd9, 0xed}},
+       {AFLDPI, ynone, Px, opBytes{0xd9, 0xeb}},
+       {AFLDZ, ynone, Px, opBytes{0xd9, 0xee}},
+       {AFNOP, ynone, Px, opBytes{0xd9, 0xd0}},
+       {AFPATAN, ynone, Px, opBytes{0xd9, 0xf3}},
+       {AFPREM, ynone, Px, opBytes{0xd9, 0xf8}},
+       {AFPREM1, ynone, Px, opBytes{0xd9, 0xf5}},
+       {AFPTAN, ynone, Px, opBytes{0xd9, 0xf2}},
+       {AFRNDINT, ynone, Px, opBytes{0xd9, 0xfc}},
+       {AFSCALE, ynone, Px, opBytes{0xd9, 0xfd}},
+       {AFSIN, ynone, Px, opBytes{0xd9, 0xfe}},
+       {AFSINCOS, ynone, Px, opBytes{0xd9, 0xfb}},
+       {AFSQRT, ynone, Px, opBytes{0xd9, 0xfa}},
+       {AFTST, ynone, Px, opBytes{0xd9, 0xe4}},
+       {AFXAM, ynone, Px, opBytes{0xd9, 0xe5}},
+       {AFXTRACT, ynone, Px, opBytes{0xd9, 0xf4}},
+       {AFYL2X, ynone, Px, opBytes{0xd9, 0xf1}},
+       {AFYL2XP1, ynone, Px, opBytes{0xd9, 0xf9}},
+       {ACMPXCHGB, yrb_mb, Pb, opBytes{0x0f, 0xb0}},
+       {ACMPXCHGL, yrl_ml, Px, opBytes{0x0f, 0xb1}},
+       {ACMPXCHGW, yrl_ml, Pe, opBytes{0x0f, 0xb1}},
+       {ACMPXCHGQ, yrl_ml, Pw, opBytes{0x0f, 0xb1}},
+       {ACMPXCHG8B, yscond, Pm, opBytes{0xc7, 01}},
+       {ACMPXCHG16B, yscond, Pw, opBytes{0x0f, 0xc7, 01}},
+       {AINVD, ynone, Pm, opBytes{0x08}},
+       {AINVLPG, ydivb, Pm, opBytes{0x01, 07}},
+       {AINVPCID, ycrc32l, Pe, opBytes{0x0f, 0x38, 0x82, 0}},
+       {ALFENCE, ynone, Pm, opBytes{0xae, 0xe8}},
+       {AMFENCE, ynone, Pm, opBytes{0xae, 0xf0}},
+       {AMOVNTIL, yrl_ml, Pm, opBytes{0xc3}},
+       {AMOVNTIQ, yrl_ml, Pw, opBytes{0x0f, 0xc3}},
+       {ARDPKRU, ynone, Pm, opBytes{0x01, 0xee, 0}},
+       {ARDMSR, ynone, Pm, opBytes{0x32}},
+       {ARDPMC, ynone, Pm, opBytes{0x33}},
+       {ARDTSC, ynone, Pm, opBytes{0x31}},
+       {ARSM, ynone, Pm, opBytes{0xaa}},
+       {ASFENCE, ynone, Pm, opBytes{0xae, 0xf8}},
+       {ASYSRET, ynone, Pm, opBytes{0x07}},
+       {AWBINVD, ynone, Pm, opBytes{0x09}},
+       {AWRMSR, ynone, Pm, opBytes{0x30}},
+       {AWRPKRU, ynone, Pm, opBytes{0x01, 0xef, 0}},
+       {AXADDB, yrb_mb, Pb, opBytes{0x0f, 0xc0}},
+       {AXADDL, yrl_ml, Px, opBytes{0x0f, 0xc1}},
+       {AXADDQ, yrl_ml, Pw, opBytes{0x0f, 0xc1}},
+       {AXADDW, yrl_ml, Pe, opBytes{0x0f, 0xc1}},
+       {ACRC32B, ycrc32b, Px, opBytes{0xf2, 0x0f, 0x38, 0xf0, 0}},
+       {ACRC32L, ycrc32l, Px, opBytes{0xf2, 0x0f, 0x38, 0xf1, 0}},
+       {ACRC32Q, ycrc32l, Pw, opBytes{0xf2, 0x0f, 0x38, 0xf1, 0}},
+       {ACRC32W, ycrc32l, Pe, opBytes{0xf2, 0x0f, 0x38, 0xf1, 0}},
+       {APREFETCHT0, yprefetch, Pm, opBytes{0x18, 01}},
+       {APREFETCHT1, yprefetch, Pm, opBytes{0x18, 02}},
+       {APREFETCHT2, yprefetch, Pm, opBytes{0x18, 03}},
+       {APREFETCHNTA, yprefetch, Pm, opBytes{0x18, 00}},
+       {AMOVQL, yrl_ml, Px, opBytes{0x89}},
+       {obj.AUNDEF, ynone, Px, opBytes{0x0f, 0x0b}},
+       {AAESENC, yaes, Pq, opBytes{0x38, 0xdc, 0}},
+       {AAESENCLAST, yaes, Pq, opBytes{0x38, 0xdd, 0}},
+       {AAESDEC, yaes, Pq, opBytes{0x38, 0xde, 0}},
+       {AAESDECLAST, yaes, Pq, opBytes{0x38, 0xdf, 0}},
+       {AAESIMC, yaes, Pq, opBytes{0x38, 0xdb, 0}},
+       {AAESKEYGENASSIST, yxshuf, Pq, opBytes{0x3a, 0xdf, 0}},
+       {AROUNDPD, yxshuf, Pq, opBytes{0x3a, 0x09, 0}},
+       {AROUNDPS, yxshuf, Pq, opBytes{0x3a, 0x08, 0}},
+       {AROUNDSD, yxshuf, Pq, opBytes{0x3a, 0x0b, 0}},
+       {AROUNDSS, yxshuf, Pq, opBytes{0x3a, 0x0a, 0}},
+       {APSHUFD, yxshuf, Pq, opBytes{0x70, 0}},
+       {APCLMULQDQ, yxshuf, Pq, opBytes{0x3a, 0x44, 0}},
+       {APCMPESTRI, yxshuf, Pq, opBytes{0x3a, 0x61, 0}},
+       {APCMPESTRM, yxshuf, Pq, opBytes{0x3a, 0x60, 0}},
+       {AMOVDDUP, yxm, Pf2, opBytes{0x12}},
+       {AMOVSHDUP, yxm, Pf3, opBytes{0x16}},
+       {AMOVSLDUP, yxm, Pf3, opBytes{0x12}},
+
+       {ARDTSCP, ynone, Pm, opBytes{0x01, 0xf9, 0}},
+       {ASTAC, ynone, Pm, opBytes{0x01, 0xcb, 0}},
+       {AUD1, ynone, Pm, opBytes{0xb9, 0}},
+       {AUD2, ynone, Pm, opBytes{0x0b, 0}},
+       {ASYSENTER, ynone, Px, opBytes{0x0f, 0x34, 0}},
+       {ASYSENTER64, ynone, Pw, opBytes{0x0f, 0x34, 0}},
+       {ASYSEXIT, ynone, Px, opBytes{0x0f, 0x35, 0}},
+       {ASYSEXIT64, ynone, Pw, opBytes{0x0f, 0x35, 0}},
+       {ALMSW, ydivl, Pm, opBytes{0x01, 06}},
+       {ALLDT, ydivl, Pm, opBytes{0x00, 02}},
+       {ALIDT, ysvrs_mo, Pm, opBytes{0x01, 03}},
+       {ALGDT, ysvrs_mo, Pm, opBytes{0x01, 02}},
+       {ATZCNTW, ycrc32l, Pe, opBytes{0xf3, 0x0f, 0xbc, 0}},
+       {ATZCNTL, ycrc32l, Px, opBytes{0xf3, 0x0f, 0xbc, 0}},
+       {ATZCNTQ, ycrc32l, Pw, opBytes{0xf3, 0x0f, 0xbc, 0}},
+       {AXRSTOR, ydivl, Px, opBytes{0x0f, 0xae, 05}},
+       {AXRSTOR64, ydivl, Pw, opBytes{0x0f, 0xae, 05}},
+       {AXRSTORS, ydivl, Px, opBytes{0x0f, 0xc7, 03}},
+       {AXRSTORS64, ydivl, Pw, opBytes{0x0f, 0xc7, 03}},
+       {AXSAVE, yclflush, Px, opBytes{0x0f, 0xae, 04}},
+       {AXSAVE64, yclflush, Pw, opBytes{0x0f, 0xae, 04}},
+       {AXSAVEOPT, yclflush, Px, opBytes{0x0f, 0xae, 06}},
+       {AXSAVEOPT64, yclflush, Pw, opBytes{0x0f, 0xae, 06}},
+       {AXSAVEC, yclflush, Px, opBytes{0x0f, 0xc7, 04}},
+       {AXSAVEC64, yclflush, Pw, opBytes{0x0f, 0xc7, 04}},
+       {AXSAVES, yclflush, Px, opBytes{0x0f, 0xc7, 05}},
+       {AXSAVES64, yclflush, Pw, opBytes{0x0f, 0xc7, 05}},
+       {ASGDT, yclflush, Pm, opBytes{0x01, 00}},
+       {ASIDT, yclflush, Pm, opBytes{0x01, 01}},
+       {ARDRANDW, yrdrand, Pe, opBytes{0x0f, 0xc7, 06}},
+       {ARDRANDL, yrdrand, Px, opBytes{0x0f, 0xc7, 06}},
+       {ARDRANDQ, yrdrand, Pw, opBytes{0x0f, 0xc7, 06}},
+       {ARDSEEDW, yrdrand, Pe, opBytes{0x0f, 0xc7, 07}},
+       {ARDSEEDL, yrdrand, Px, opBytes{0x0f, 0xc7, 07}},
+       {ARDSEEDQ, yrdrand, Pw, opBytes{0x0f, 0xc7, 07}},
+       {ASTRW, yincq, Pe, opBytes{0x0f, 0x00, 01}},
+       {ASTRL, yincq, Px, opBytes{0x0f, 0x00, 01}},
+       {ASTRQ, yincq, Pw, opBytes{0x0f, 0x00, 01}},
+       {AXSETBV, ynone, Pm, opBytes{0x01, 0xd1, 0}},
+       {AMOVBEWW, ymovbe, Pq, opBytes{0x38, 0xf0, 0, 0x38, 0xf1, 0}},
+       {AMOVBELL, ymovbe, Pm, opBytes{0x38, 0xf0, 0, 0x38, 0xf1, 0}},
+       {AMOVBEQQ, ymovbe, Pw, opBytes{0x0f, 0x38, 0xf0, 0, 0x0f, 0x38, 0xf1, 0}},
+       {ANOPW, ydivl, Pe, opBytes{0x0f, 0x1f, 00}},
+       {ANOPL, ydivl, Px, opBytes{0x0f, 0x1f, 00}},
+       {ASLDTW, yincq, Pe, opBytes{0x0f, 0x00, 00}},
+       {ASLDTL, yincq, Px, opBytes{0x0f, 0x00, 00}},
+       {ASLDTQ, yincq, Pw, opBytes{0x0f, 0x00, 00}},
+       {ASMSWW, yincq, Pe, opBytes{0x0f, 0x01, 04}},
+       {ASMSWL, yincq, Px, opBytes{0x0f, 0x01, 04}},
+       {ASMSWQ, yincq, Pw, opBytes{0x0f, 0x01, 04}},
+       {ABLENDVPS, yblendvpd, Pq4, opBytes{0x14}},
+       {ABLENDVPD, yblendvpd, Pq4, opBytes{0x15}},
+       {APBLENDVB, yblendvpd, Pq4, opBytes{0x10}},
+       {ASHA1MSG1, yaes, Px, opBytes{0x0f, 0x38, 0xc9, 0}},
+       {ASHA1MSG2, yaes, Px, opBytes{0x0f, 0x38, 0xca, 0}},
+       {ASHA1NEXTE, yaes, Px, opBytes{0x0f, 0x38, 0xc8, 0}},
+       {ASHA256MSG1, yaes, Px, opBytes{0x0f, 0x38, 0xcc, 0}},
+       {ASHA256MSG2, yaes, Px, opBytes{0x0f, 0x38, 0xcd, 0}},
+       {ASHA1RNDS4, ysha1rnds4, Pm, opBytes{0x3a, 0xcc, 0}},
+       {ASHA256RNDS2, ysha256rnds2, Px, opBytes{0x0f, 0x38, 0xcb, 0}},
+       {ARDFSBASEL, yrdrand, Pf3, opBytes{0xae, 00}},
+       {ARDFSBASEQ, yrdrand, Pfw, opBytes{0xae, 00}},
+       {ARDGSBASEL, yrdrand, Pf3, opBytes{0xae, 01}},
+       {ARDGSBASEQ, yrdrand, Pfw, opBytes{0xae, 01}},
+       {AWRFSBASEL, ywrfsbase, Pf3, opBytes{0xae, 02}},
+       {AWRFSBASEQ, ywrfsbase, Pfw, opBytes{0xae, 02}},
+       {AWRGSBASEL, ywrfsbase, Pf3, opBytes{0xae, 03}},
+       {AWRGSBASEQ, ywrfsbase, Pfw, opBytes{0xae, 03}},
+       {ALFSW, ym_rl, Pe, opBytes{0x0f, 0xb4}},
+       {ALFSL, ym_rl, Px, opBytes{0x0f, 0xb4}},
+       {ALFSQ, ym_rl, Pw, opBytes{0x0f, 0xb4}},
+       {ALGSW, ym_rl, Pe, opBytes{0x0f, 0xb5}},
+       {ALGSL, ym_rl, Px, opBytes{0x0f, 0xb5}},
+       {ALGSQ, ym_rl, Pw, opBytes{0x0f, 0xb5}},
+       {ALSSW, ym_rl, Pe, opBytes{0x0f, 0xb2}},
+       {ALSSL, ym_rl, Px, opBytes{0x0f, 0xb2}},
+       {ALSSQ, ym_rl, Pw, opBytes{0x0f, 0xb2}},
+
+       {ABLENDPD, yxshuf, Pq, opBytes{0x3a, 0x0d, 0}},
+       {ABLENDPS, yxshuf, Pq, opBytes{0x3a, 0x0c, 0}},
+       {AXACQUIRE, ynone, Px, opBytes{0xf2}},
+       {AXRELEASE, ynone, Px, opBytes{0xf3}},
+       {AXBEGIN, yxbegin, Px, opBytes{0xc7, 0xf8}},
+       {AXABORT, yxabort, Px, opBytes{0xc6, 0xf8}},
+       {AXEND, ynone, Px, opBytes{0x0f, 01, 0xd5}},
+       {AXTEST, ynone, Px, opBytes{0x0f, 01, 0xd6}},
+       {AXGETBV, ynone, Pm, opBytes{01, 0xd0}},
+       {obj.AFUNCDATA, yfuncdata, Px, opBytes{0, 0}},
+       {obj.APCDATA, ypcdata, Px, opBytes{0, 0}},
+       {obj.ADUFFCOPY, yduff, Px, opBytes{0xe8}},
+       {obj.ADUFFZERO, yduff, Px, opBytes{0xe8}},
+
+       {obj.AEND, nil, 0, opBytes{}},
+       {0, nil, 0, opBytes{}},
 }
 
 var opindex [(ALAST + 1) & obj.AMask]*Optab
@@ -2318,12 +2067,12 @@ func instinit(ctxt *obj.Link) {
                deferreturn = ctxt.Lookup("runtime.deferreturn")
        }
 
-       for i := range vexOptab {
-               c := vexOptab[i].as
+       for i := range avxOptab {
+               c := avxOptab[i].as
                if opindex[c&obj.AMask] != nil {
-                       ctxt.Diag("phase error in vexOptab: %d (%v)", i, c)
+                       ctxt.Diag("phase error in avxOptab: %d (%v)", i, c)
                }
-               opindex[c&obj.AMask] = &vexOptab[i]
+               opindex[c&obj.AMask] = &avxOptab[i]
        }
        for i := 1; optab[i].as != 0; i++ {
                c := optab[i].as
@@ -2430,6 +2179,35 @@ func instinit(ctxt *obj.Link) {
        ycover[Ym*Ymax+Yym] = 1
        ycover[Yyr*Ymax+Yym] = 1
 
+       ycover[Yxr0*Ymax+YxrEvex] = 1
+       ycover[Yxr*Ymax+YxrEvex] = 1
+
+       ycover[Ym*Ymax+YxmEvex] = 1
+       ycover[Yxr0*Ymax+YxmEvex] = 1
+       ycover[Yxr*Ymax+YxmEvex] = 1
+       ycover[YxrEvex*Ymax+YxmEvex] = 1
+
+       ycover[Yyr*Ymax+YyrEvex] = 1
+
+       ycover[Ym*Ymax+YymEvex] = 1
+       ycover[Yyr*Ymax+YymEvex] = 1
+       ycover[YyrEvex*Ymax+YymEvex] = 1
+
+       ycover[Ym*Ymax+Yzm] = 1
+       ycover[Yzr*Ymax+Yzm] = 1
+
+       ycover[Yk0*Ymax+Yk] = 1
+       ycover[Yknot0*Ymax+Yk] = 1
+
+       ycover[Yk0*Ymax+Ykm] = 1
+       ycover[Yknot0*Ymax+Ykm] = 1
+       ycover[Yk*Ymax+Ykm] = 1
+       ycover[Ym*Ymax+Ykm] = 1
+
+       ycover[Yxvm*Ymax+YxvmEvex] = 1
+
+       ycover[Yyvm*Ymax+YyvmEvex] = 1
+
        for i := 0; i < MAXREG; i++ {
                reg[i] = -1
                if i >= REG_AL && i <= REG_R15B {
@@ -2458,18 +2236,51 @@ func instinit(ctxt *obj.Link) {
                if i >= REG_M0 && i <= REG_M0+7 {
                        reg[i] = (i - REG_M0) & 7
                }
+               if i >= REG_K0 && i <= REG_K0+7 {
+                       reg[i] = (i - REG_K0) & 7
+               }
                if i >= REG_X0 && i <= REG_X0+15 {
                        reg[i] = (i - REG_X0) & 7
                        if i >= REG_X0+8 {
                                regrex[i] = Rxr | Rxx | Rxb
                        }
                }
+               if i >= REG_X16 && i <= REG_X16+15 {
+                       reg[i] = (i - REG_X16) & 7
+                       if i >= REG_X16+8 {
+                               regrex[i] = Rxr | Rxx | Rxb | RxrEvex
+                       } else {
+                               regrex[i] = RxrEvex
+                       }
+               }
                if i >= REG_Y0 && i <= REG_Y0+15 {
                        reg[i] = (i - REG_Y0) & 7
                        if i >= REG_Y0+8 {
                                regrex[i] = Rxr | Rxx | Rxb
                        }
                }
+               if i >= REG_Y16 && i <= REG_Y16+15 {
+                       reg[i] = (i - REG_Y16) & 7
+                       if i >= REG_Y16+8 {
+                               regrex[i] = Rxr | Rxx | Rxb | RxrEvex
+                       } else {
+                               regrex[i] = RxrEvex
+                       }
+               }
+               if i >= REG_Z0 && i <= REG_Z0+15 {
+                       reg[i] = (i - REG_Z0) & 7
+                       if i > REG_Z0+7 {
+                               regrex[i] = Rxr | Rxx | Rxb
+                       }
+               }
+               if i >= REG_Z16 && i <= REG_Z16+15 {
+                       reg[i] = (i - REG_Z16) & 7
+                       if i >= REG_Z16+8 {
+                               regrex[i] = Rxr | Rxx | Rxb | RxrEvex
+                       } else {
+                               regrex[i] = RxrEvex
+                       }
+               }
 
                if i >= REG_CR+8 && i <= REG_CR+15 {
                        regrex[i] = Rxr
@@ -2606,8 +2417,178 @@ func prefixof(ctxt *obj.Link, a *obj.Addr) int {
        return 0
 }
 
+// oclassRegList returns multisource operand class for addr.
+func oclassRegList(ctxt *obj.Link, addr *obj.Addr) int {
+       // TODO(quasilyte): when oclass register case is refactored into
+       // lookup table, use it here to get register kind more easily.
+       // Helper functions like regIsXmm should go away too (they will become redundant).
+
+       regIsXmm := func(r int) bool { return r >= REG_X0 && r <= REG_X31 }
+       regIsYmm := func(r int) bool { return r >= REG_Y0 && r <= REG_Y31 }
+       regIsZmm := func(r int) bool { return r >= REG_Z0 && r <= REG_Z31 }
+
+       reg0, reg1 := decodeRegisterRange(addr.Offset)
+       low := regIndex(int16(reg0))
+       high := regIndex(int16(reg1))
+
+       if ctxt.Arch.Family == sys.I386 {
+               if low >= 8 || high >= 8 {
+                       return Yxxx
+               }
+       }
+
+       switch high - low {
+       case 3:
+               switch {
+               case regIsXmm(reg0) && regIsXmm(reg1):
+                       return YxrEvexMulti4
+               case regIsYmm(reg0) && regIsYmm(reg1):
+                       return YyrEvexMulti4
+               case regIsZmm(reg0) && regIsZmm(reg1):
+                       return YzrMulti4
+               default:
+                       return Yxxx
+               }
+       default:
+               return Yxxx
+       }
+}
+
+// oclassVMem returns V-mem (vector memory with VSIB) operand class.
+// For addr that is not V-mem returns (Yxxx, false).
+func oclassVMem(ctxt *obj.Link, addr *obj.Addr) (int, bool) {
+       switch addr.Index {
+       case REG_X0 + 0,
+               REG_X0 + 1,
+               REG_X0 + 2,
+               REG_X0 + 3,
+               REG_X0 + 4,
+               REG_X0 + 5,
+               REG_X0 + 6,
+               REG_X0 + 7:
+               return Yxvm, true
+       case REG_X8 + 0,
+               REG_X8 + 1,
+               REG_X8 + 2,
+               REG_X8 + 3,
+               REG_X8 + 4,
+               REG_X8 + 5,
+               REG_X8 + 6,
+               REG_X8 + 7:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx, true
+               }
+               return Yxvm, true
+       case REG_X16 + 0,
+               REG_X16 + 1,
+               REG_X16 + 2,
+               REG_X16 + 3,
+               REG_X16 + 4,
+               REG_X16 + 5,
+               REG_X16 + 6,
+               REG_X16 + 7,
+               REG_X16 + 8,
+               REG_X16 + 9,
+               REG_X16 + 10,
+               REG_X16 + 11,
+               REG_X16 + 12,
+               REG_X16 + 13,
+               REG_X16 + 14,
+               REG_X16 + 15:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx, true
+               }
+               return YxvmEvex, true
+
+       case REG_Y0 + 0,
+               REG_Y0 + 1,
+               REG_Y0 + 2,
+               REG_Y0 + 3,
+               REG_Y0 + 4,
+               REG_Y0 + 5,
+               REG_Y0 + 6,
+               REG_Y0 + 7:
+               return Yyvm, true
+       case REG_Y8 + 0,
+               REG_Y8 + 1,
+               REG_Y8 + 2,
+               REG_Y8 + 3,
+               REG_Y8 + 4,
+               REG_Y8 + 5,
+               REG_Y8 + 6,
+               REG_Y8 + 7:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx, true
+               }
+               return Yyvm, true
+       case REG_Y16 + 0,
+               REG_Y16 + 1,
+               REG_Y16 + 2,
+               REG_Y16 + 3,
+               REG_Y16 + 4,
+               REG_Y16 + 5,
+               REG_Y16 + 6,
+               REG_Y16 + 7,
+               REG_Y16 + 8,
+               REG_Y16 + 9,
+               REG_Y16 + 10,
+               REG_Y16 + 11,
+               REG_Y16 + 12,
+               REG_Y16 + 13,
+               REG_Y16 + 14,
+               REG_Y16 + 15:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx, true
+               }
+               return YyvmEvex, true
+
+       case REG_Z0 + 0,
+               REG_Z0 + 1,
+               REG_Z0 + 2,
+               REG_Z0 + 3,
+               REG_Z0 + 4,
+               REG_Z0 + 5,
+               REG_Z0 + 6,
+               REG_Z0 + 7:
+               return Yzvm, true
+       case REG_Z8 + 0,
+               REG_Z8 + 1,
+               REG_Z8 + 2,
+               REG_Z8 + 3,
+               REG_Z8 + 4,
+               REG_Z8 + 5,
+               REG_Z8 + 6,
+               REG_Z8 + 7,
+               REG_Z8 + 8,
+               REG_Z8 + 9,
+               REG_Z8 + 10,
+               REG_Z8 + 11,
+               REG_Z8 + 12,
+               REG_Z8 + 13,
+               REG_Z8 + 14,
+               REG_Z8 + 15,
+               REG_Z8 + 16,
+               REG_Z8 + 17,
+               REG_Z8 + 18,
+               REG_Z8 + 19,
+               REG_Z8 + 20,
+               REG_Z8 + 21,
+               REG_Z8 + 22,
+               REG_Z8 + 23:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx, true
+               }
+               return Yzvm, true
+       }
+
+       return Yxxx, false
+}
+
 func oclass(ctxt *obj.Link, p *obj.Prog, a *obj.Addr) int {
        switch a.Type {
+       case obj.TYPE_REGLIST:
+               return oclassRegList(ctxt, a)
+
        case obj.TYPE_NONE:
                return Ynone
 
@@ -2627,18 +2608,11 @@ func oclass(ctxt *obj.Link, p *obj.Prog, a *obj.Addr) int {
                        // Can't use FP/SB/PC/SP as the index register.
                        return Yxxx
                }
-               if a.Index >= REG_X0 && a.Index <= REG_X15 {
-                       if ctxt.Arch.Family == sys.I386 && a.Index > REG_X7 {
-                               return Yxxx
-                       }
-                       return Yxvm
-               }
-               if a.Index >= REG_Y0 && a.Index <= REG_Y15 {
-                       if ctxt.Arch.Family == sys.I386 && a.Index > REG_Y7 {
-                               return Yxxx
-                       }
-                       return Yyvm
+
+               if vmem, ok := oclassVMem(ctxt, a); ok {
+                       return vmem
                }
+
                if ctxt.Arch.Family == sys.AMD64 {
                        switch a.Name {
                        case obj.NAME_EXTERN, obj.NAME_STATIC, obj.NAME_GOTREF:
@@ -2840,6 +2814,24 @@ func oclass(ctxt *obj.Link, p *obj.Prog, a *obj.Addr) int {
                REG_X0 + 15:
                return Yxr
 
+       case REG_X0 + 16,
+               REG_X0 + 17,
+               REG_X0 + 18,
+               REG_X0 + 19,
+               REG_X0 + 20,
+               REG_X0 + 21,
+               REG_X0 + 22,
+               REG_X0 + 23,
+               REG_X0 + 24,
+               REG_X0 + 25,
+               REG_X0 + 26,
+               REG_X0 + 27,
+               REG_X0 + 28,
+               REG_X0 + 29,
+               REG_X0 + 30,
+               REG_X0 + 31:
+               return YxrEvex
+
        case REG_Y0 + 0,
                REG_Y0 + 1,
                REG_Y0 + 2,
@@ -2858,6 +2850,75 @@ func oclass(ctxt *obj.Link, p *obj.Prog, a *obj.Addr) int {
                REG_Y0 + 15:
                return Yyr
 
+       case REG_Y0 + 16,
+               REG_Y0 + 17,
+               REG_Y0 + 18,
+               REG_Y0 + 19,
+               REG_Y0 + 20,
+               REG_Y0 + 21,
+               REG_Y0 + 22,
+               REG_Y0 + 23,
+               REG_Y0 + 24,
+               REG_Y0 + 25,
+               REG_Y0 + 26,
+               REG_Y0 + 27,
+               REG_Y0 + 28,
+               REG_Y0 + 29,
+               REG_Y0 + 30,
+               REG_Y0 + 31:
+               return YyrEvex
+
+       case REG_Z0 + 0,
+               REG_Z0 + 1,
+               REG_Z0 + 2,
+               REG_Z0 + 3,
+               REG_Z0 + 4,
+               REG_Z0 + 5,
+               REG_Z0 + 6,
+               REG_Z0 + 7:
+               return Yzr
+
+       case REG_Z0 + 8,
+               REG_Z0 + 9,
+               REG_Z0 + 10,
+               REG_Z0 + 11,
+               REG_Z0 + 12,
+               REG_Z0 + 13,
+               REG_Z0 + 14,
+               REG_Z0 + 15,
+               REG_Z0 + 16,
+               REG_Z0 + 17,
+               REG_Z0 + 18,
+               REG_Z0 + 19,
+               REG_Z0 + 20,
+               REG_Z0 + 21,
+               REG_Z0 + 22,
+               REG_Z0 + 23,
+               REG_Z0 + 24,
+               REG_Z0 + 25,
+               REG_Z0 + 26,
+               REG_Z0 + 27,
+               REG_Z0 + 28,
+               REG_Z0 + 29,
+               REG_Z0 + 30,
+               REG_Z0 + 31:
+               if ctxt.Arch.Family == sys.I386 {
+                       return Yxxx
+               }
+               return Yzr
+
+       case REG_K0:
+               return Yk0
+
+       case REG_K0 + 1,
+               REG_K0 + 2,
+               REG_K0 + 3,
+               REG_K0 + 4,
+               REG_K0 + 5,
+               REG_K0 + 6,
+               REG_K0 + 7:
+               return Yknot0
+
        case REG_CS:
                return Ycs
        case REG_SS:
@@ -2944,13 +3005,16 @@ func oclass(ctxt *obj.Link, p *obj.Prog, a *obj.Addr) int {
 // AsmBuf is a simple buffer to assemble variable-length x86 instructions into
 // and hold assembly state.
 type AsmBuf struct {
-       buf     [100]byte
-       off     int
-       rexflag int
-       vexflag bool
-       rep     bool
-       repn    bool
-       lock    bool
+       buf      [100]byte
+       off      int
+       rexflag  int
+       vexflag  bool // Per inst: true for VEX-encoded
+       evexflag bool // Per inst: true for EVEX-encoded
+       rep      bool
+       repn     bool
+       lock     bool
+
+       evex evexBits // Initialized when evexflag is true
 }
 
 // Put1 appends one byte to the end of the buffer.
@@ -3024,7 +3088,7 @@ func (ab *AsmBuf) Put(b []byte) {
 //
 // Intended to be used for literal Z cases.
 // Literal Z cases usually have "Zlit" in their name (Zlit, Zlitr_m, Zlitm_r).
-func (ab *AsmBuf) PutOpBytesLit(offset int, op *[23]uint8) {
+func (ab *AsmBuf) PutOpBytesLit(offset int, op *opBytes) {
        for int(op[offset]) != 0 {
                ab.Put1(byte(op[offset]))
                offset++
@@ -3082,6 +3146,22 @@ func (ab *AsmBuf) asmidx(ctxt *obj.Link, scale int, index int, base int) {
                REG_X13,
                REG_X14,
                REG_X15,
+               REG_X16,
+               REG_X17,
+               REG_X18,
+               REG_X19,
+               REG_X20,
+               REG_X21,
+               REG_X22,
+               REG_X23,
+               REG_X24,
+               REG_X25,
+               REG_X26,
+               REG_X27,
+               REG_X28,
+               REG_X29,
+               REG_X30,
+               REG_X31,
                REG_Y8,
                REG_Y9,
                REG_Y10,
@@ -3089,7 +3169,47 @@ func (ab *AsmBuf) asmidx(ctxt *obj.Link, scale int, index int, base int) {
                REG_Y12,
                REG_Y13,
                REG_Y14,
-               REG_Y15:
+               REG_Y15,
+               REG_Y16,
+               REG_Y17,
+               REG_Y18,
+               REG_Y19,
+               REG_Y20,
+               REG_Y21,
+               REG_Y22,
+               REG_Y23,
+               REG_Y24,
+               REG_Y25,
+               REG_Y26,
+               REG_Y27,
+               REG_Y28,
+               REG_Y29,
+               REG_Y30,
+               REG_Y31,
+               REG_Z8,
+               REG_Z9,
+               REG_Z10,
+               REG_Z11,
+               REG_Z12,
+               REG_Z13,
+               REG_Z14,
+               REG_Z15,
+               REG_Z16,
+               REG_Z17,
+               REG_Z18,
+               REG_Z19,
+               REG_Z20,
+               REG_Z21,
+               REG_Z22,
+               REG_Z23,
+               REG_Z24,
+               REG_Z25,
+               REG_Z26,
+               REG_Z27,
+               REG_Z28,
+               REG_Z29,
+               REG_Z30,
+               REG_Z31:
                if ctxt.Arch.Family == sys.I386 {
                        goto bad
                }
@@ -3117,7 +3237,15 @@ func (ab *AsmBuf) asmidx(ctxt *obj.Link, scale int, index int, base int) {
                REG_Y4,
                REG_Y5,
                REG_Y6,
-               REG_Y7:
+               REG_Y7,
+               REG_Z0,
+               REG_Z1,
+               REG_Z2,
+               REG_Z3,
+               REG_Z4,
+               REG_Z5,
+               REG_Z6,
+               REG_Z7:
                i = reg[index] << 3
        }
 
@@ -3285,7 +3413,9 @@ func (ab *AsmBuf) asmandsz(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog, a *obj
                goto bad
 
        case obj.TYPE_REG:
-               if a.Reg < REG_AL || REG_Y0+15 < a.Reg {
+               const regFirst = REG_AL
+               const regLast = REG_Z31
+               if a.Reg < regFirst || regLast < a.Reg {
                        goto bad
                }
                if v != 0 {
@@ -3336,10 +3466,10 @@ func (ab *AsmBuf) asmandsz(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog, a *obj
                        return
                }
 
-               if v >= -128 && v < 128 && rel.Siz == 0 {
+               if disp8, ok := toDisp8(v, p, ab); ok && rel.Siz == 0 {
                        ab.Put1(byte(1<<6 | 4<<0 | r<<3))
                        ab.asmidx(ctxt, int(a.Scale), int(a.Index), base)
-                       ab.Put1(byte(v))
+                       ab.Put1(disp8)
                        return
                }
 
@@ -3399,10 +3529,10 @@ func (ab *AsmBuf) asmandsz(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog, a *obj
                        return
                }
 
-               if v >= -128 && v < 128 {
+               if disp8, ok := toDisp8(v, p, ab); ok {
                        ab.Put1(byte(1<<6 | reg[base]<<0 | r<<3))
                        ab.asmidx(ctxt, int(a.Scale), REG_NONE, base)
-                       ab.Put1(byte(v))
+                       ab.Put1(disp8)
                        return
                }
 
@@ -3426,8 +3556,8 @@ func (ab *AsmBuf) asmandsz(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog, a *obj
                        return
                }
 
-               if v >= -128 && v < 128 && rel.Siz == 0 {
-                       ab.Put2(byte(1<<6|reg[base]<<0|r<<3), byte(v))
+               if disp8, ok := toDisp8(v, p, ab); ok && rel.Siz == 0 {
+                       ab.Put2(byte(1<<6|reg[base]<<0|r<<3), disp8)
                        return
                }
 
@@ -3708,6 +3838,113 @@ var bpduff2 = []byte{
        0x48, 0x8b, 0x6d, 0x00, // MOVQ 0(BP), BP
 }
 
+// asmevex emits EVEX pregis and opcode byte.
+// In addition to asmvex r/m, vvvv and reg fields also requires optional
+// K-masking register.
+//
+// Expects asmbuf.evex to be properly initialized.
+func (ab *AsmBuf) asmevex(ctxt *obj.Link, p *obj.Prog, rm, v, r, k *obj.Addr) {
+       ab.evexflag = true
+       evex := ab.evex
+
+       rexR := byte(1)
+       evexR := byte(1)
+       rexX := byte(1)
+       rexB := byte(1)
+       if r != nil {
+               if regrex[r.Reg]&Rxr != 0 {
+                       rexR = 0 // "ModR/M.reg" selector 4th bit.
+               }
+               if regrex[r.Reg]&RxrEvex != 0 {
+                       evexR = 0 // "ModR/M.reg" selector 5th bit.
+               }
+       }
+       if rm != nil {
+               if rm.Index == REG_NONE && regrex[rm.Reg]&RxrEvex != 0 {
+                       rexX = 0
+               } else if regrex[rm.Index]&Rxx != 0 {
+                       rexX = 0
+               }
+               if regrex[rm.Reg]&Rxb != 0 {
+                       rexB = 0
+               }
+       }
+       // P0 = [R][X][B][R'][00][mm]
+       p0 := (rexR << 7) |
+               (rexX << 6) |
+               (rexB << 5) |
+               (evexR << 4) |
+               (0 << 2) |
+               (evex.M() << 0)
+
+       vexV := byte(0)
+       if v != nil {
+               // 4bit-wide reg index.
+               vexV = byte(reg[v.Reg]|(regrex[v.Reg]&Rxr)<<1) & 0xF
+       }
+       vexV ^= 0x0F
+       // P1 = [W][vvvv][1][pp]
+       p1 := (evex.W() << 7) |
+               (vexV << 3) |
+               (1 << 2) |
+               (evex.P() << 0)
+
+       suffix := evexSuffixMap[p.Scond]
+       evexZ := byte(0)
+       evexLL := evex.L()
+       evexB := byte(0)
+       evexV := byte(1)
+       evexA := byte(0)
+       if suffix.zeroing {
+               if !evex.ZeroingEnabled() {
+                       ctxt.Diag("unsupported zeroing: %v", p)
+               }
+               evexZ = 1
+       }
+       switch {
+       case suffix.rounding != rcUnset:
+               if rm != nil && rm.Type == obj.TYPE_MEM {
+                       ctxt.Diag("illegal rounding with memory argument: %v", p)
+               } else if !evex.RoundingEnabled() {
+                       ctxt.Diag("unsupported rounding: %v", p)
+               }
+               evexB = 1
+               evexLL = suffix.rounding
+       case suffix.broadcast:
+               if rm == nil || rm.Type != obj.TYPE_MEM {
+                       ctxt.Diag("illegal broadcast without memory argument: %v", p)
+               } else if !evex.BroadcastEnabled() {
+                       ctxt.Diag("unsupported broadcast: %v", p)
+               }
+               evexB = 1
+       case suffix.sae:
+               if rm != nil && rm.Type == obj.TYPE_MEM {
+                       ctxt.Diag("illegal SAE with memory argument: %v", p)
+               } else if !evex.SaeEnabled() {
+                       ctxt.Diag("unsupported SAE: %v", p)
+               }
+               evexB = 1
+       }
+       if rm != nil && regrex[rm.Index]&RxrEvex != 0 {
+               evexV = 0
+       } else if v != nil && regrex[v.Reg]&RxrEvex != 0 {
+               evexV = 0 // VSR selector 5th bit.
+       }
+       if k != nil {
+               evexA = byte(reg[k.Reg])
+       }
+       // P2 = [z][L'L][b][V'][aaa]
+       p2 := (evexZ << 7) |
+               (evexLL << 5) |
+               (evexB << 4) |
+               (evexV << 3) |
+               (evexA << 0)
+
+       const evexEscapeByte = 0x62
+       ab.Put4(evexEscapeByte, p0, p1, p2)
+       ab.Put1(evex.opcode)
+}
+
 // Emit VEX prefix and opcode byte.
 // The three addresses are the r/m, vvvv, and reg fields.
 // The reg and rm arguments appear in the same order as the
@@ -3728,7 +3965,7 @@ func (ab *AsmBuf) asmvex(ctxt *obj.Link, rm, v, r *obj.Addr, vex, opcode uint8)
                rexB = regrex[rm.Reg] & Rxb
                rexX = regrex[rm.Index] & Rxx
        }
-       vexM := (vex >> 3) & 0xF
+       vexM := (vex >> 3) & 0x7
        vexWLP := vex & 0x87
        vexV := byte(0)
        if v != nil {
@@ -3748,20 +3985,26 @@ func (ab *AsmBuf) asmvex(ctxt *obj.Link, rm, v, r *obj.Addr, vex, opcode uint8)
        ab.Put1(opcode)
 }
 
-// regIndex returns register index that fits in 4 bits.
+// regIndex returns register index that fits in 5 bits.
+//
+//     R         : 3 bit | legacy instructions     | N/A
+//     [R/V]EX.R : 1 bit | REX / VEX extension bit | Rxr
+//     EVEX.R    : 1 bit | EVEX extension bit      | RxrEvex
 //
 // Examples:
-//   REG_X15 => 15
-//   REG_R9  => 9
-//   REG_AX  => 0
+//     REG_Z30 => 30
+//     REG_X15 => 15
+//     REG_R9  => 9
+//     REG_AX  => 0
 //
 func regIndex(r int16) int {
        lower3bits := reg[r]
        high4bit := regrex[r] & Rxr << 1
-       return lower3bits | high4bit
+       high5bit := regrex[r] & RxrEvex << 0
+       return lower3bits | high4bit | high5bit
 }
 
-// avx2gatherValid returns true if p satisfies AVX2 gather constraints.
+// avx2gatherValid reports whether p satisfies AVX2 gather constraints.
 // Reports errors via ctxt.
 func avx2gatherValid(ctxt *obj.Link, p *obj.Prog) bool {
        // If any pair of the index, mask, or destination registers
@@ -3777,6 +4020,21 @@ func avx2gatherValid(ctxt *obj.Link, p *obj.Prog) bool {
        return true
 }
 
+// avx512gatherValid reports whether p satisfies AVX512 gather constraints.
+// Reports errors via ctxt.
+func avx512gatherValid(ctxt *obj.Link, p *obj.Prog) bool {
+       // Illegal instruction trap (#UD) is triggered if the destination vector
+       // register is the same as index vector in VSIB.
+       index := regIndex(p.From.Index)
+       dest := regIndex(p.To.Reg)
+       if dest == index {
+               ctxt.Diag("index and destination registers should be distinct: %v", p)
+               return false
+       }
+
+       return true
+}
+
 func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
        o := opindex[p.As&obj.AMask]
 
@@ -3803,8 +4061,15 @@ func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
                AVPGATHERQD,
                AVPGATHERDQ,
                AVPGATHERQQ:
-               if !avx2gatherValid(ctxt, p) {
-                       return
+               // AVX512 gather requires explicit K mask.
+               if p.GetFrom3().Reg >= REG_K0 && p.GetFrom3().Reg <= REG_K7 {
+                       if !avx512gatherValid(ctxt, p) {
+                               return
+                       }
+               } else {
+                       if !avx2gatherValid(ctxt, p) {
+                               return
+                       }
                }
        }
 
@@ -3841,9 +4106,24 @@ func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
        }
 
        for _, yt := range o.ytab {
+               // ytab matching is purely args-based,
+               // but AVX512 suffixes like "Z" or "RU_SAE" will
+               // add EVEX-only filter that will reject non-EVEX matches.
+               //
+               // Consider "VADDPD.BCST 2032(DX), X0, X0".
+               // Without this rule, operands will lead to VEX-encoded form
+               // and produce "c5b15813" encoding.
                if !yt.match(args) {
+                       // "xo" is always zero for VEX/EVEX encoded insts.
                        z += int(yt.zoffset) + xo
                } else {
+                       if p.Scond != 0 && !evexZcase(yt.zcase) {
+                               // Do not signal error and continue to search
+                               // for matching EVEX-encoded form.
+                               z += int(yt.zoffset)
+                               continue
+                       }
+
                        switch o.prefix {
                        case Px1: // first option valid only in 32-bit mode
                                if ctxt.Arch.Family == sys.AMD64 && z == 0 {
@@ -3944,8 +4224,7 @@ func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
                                log.Fatalf("asmins bad table %v", p)
                        }
                        op = int(o.op[z])
-                       // In vex case 0x0f is actually VEX_256_F2_0F_WIG
-                       if op == 0x0f && o.prefix != Pvex {
+                       if op == 0x0f {
                                ab.Put1(byte(op))
                                z++
                                op = int(o.op[z])
@@ -4048,6 +4327,11 @@ func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
                                ab.asmvex(ctxt, &p.From, p.GetFrom3(), &p.To, o.op[z], o.op[z+1])
                                ab.asmando(ctxt, cursym, p, &p.From, int(o.op[z+2]))
 
+                       case Zvex_i_rm_vo:
+                               ab.asmvex(ctxt, p.GetFrom3(), &p.To, nil, o.op[z], o.op[z+1])
+                               ab.asmando(ctxt, cursym, p, p.GetFrom3(), int(o.op[z+2]))
+                               ab.Put1(byte(p.From.Offset))
+
                        case Zvex_i_r_v:
                                ab.asmvex(ctxt, p.GetFrom3(), &p.To, nil, o.op[z], o.op[z+1])
                                regnum := byte(0x7)
@@ -4093,6 +4377,96 @@ func (ab *AsmBuf) doasm(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
                                ab.asmand(ctxt, cursym, p, from, to)
                                ab.Put1(byte(regIndex(hr.Reg) << 4))
 
+                       case Zevex_k_rmo:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.To, nil, nil, &p.From)
+                               ab.asmando(ctxt, cursym, p, &p.To, int(o.op[z+3]))
+
+                       case Zevex_i_rm_vo:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, p.GetFrom3(), &p.To, nil, nil)
+                               ab.asmando(ctxt, cursym, p, p.GetFrom3(), int(o.op[z+3]))
+                               ab.Put1(byte(p.From.Offset))
+
+                       case Zevex_i_rm_k_vo:
+                               imm, from, kmask, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, from, to, nil, kmask)
+                               ab.asmando(ctxt, cursym, p, from, int(o.op[z+3]))
+                               ab.Put1(byte(imm.Offset))
+
+                       case Zevex_i_r_rm:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.To, nil, p.GetFrom3(), nil)
+                               ab.asmand(ctxt, cursym, p, &p.To, p.GetFrom3())
+                               ab.Put1(byte(p.From.Offset))
+
+                       case Zevex_i_r_k_rm:
+                               imm, from, kmask, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, to, nil, from, kmask)
+                               ab.asmand(ctxt, cursym, p, to, from)
+                               ab.Put1(byte(imm.Offset))
+
+                       case Zevex_i_rm_r:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, p.GetFrom3(), nil, &p.To, nil)
+                               ab.asmand(ctxt, cursym, p, p.GetFrom3(), &p.To)
+                               ab.Put1(byte(p.From.Offset))
+
+                       case Zevex_i_rm_k_r:
+                               imm, from, kmask, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, from, nil, to, kmask)
+                               ab.asmand(ctxt, cursym, p, from, to)
+                               ab.Put1(byte(imm.Offset))
+
+                       case Zevex_i_rm_v_r:
+                               imm, from, from3, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, from, from3, to, nil)
+                               ab.asmand(ctxt, cursym, p, from, to)
+                               ab.Put1(byte(imm.Offset))
+
+                       case Zevex_i_rm_v_k_r:
+                               imm, from, from3, kmask, to := unpackOps5(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, from, from3, to, kmask)
+                               ab.asmand(ctxt, cursym, p, from, to)
+                               ab.Put1(byte(imm.Offset))
+
+                       case Zevex_r_v_rm:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.To, p.GetFrom3(), &p.From, nil)
+                               ab.asmand(ctxt, cursym, p, &p.To, &p.From)
+
+                       case Zevex_rm_v_r:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.From, p.GetFrom3(), &p.To, nil)
+                               ab.asmand(ctxt, cursym, p, &p.From, &p.To)
+
+                       case Zevex_rm_k_r:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.From, nil, &p.To, p.GetFrom3())
+                               ab.asmand(ctxt, cursym, p, &p.From, &p.To)
+
+                       case Zevex_r_k_rm:
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, &p.To, nil, &p.From, p.GetFrom3())
+                               ab.asmand(ctxt, cursym, p, &p.To, &p.From)
+
+                       case Zevex_rm_v_k_r:
+                               from, from3, kmask, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, from, from3, to, kmask)
+                               ab.asmand(ctxt, cursym, p, from, to)
+
+                       case Zevex_r_v_k_rm:
+                               from, from3, kmask, to := unpackOps4(p)
+                               ab.evex = newEVEXBits(z, &o.op)
+                               ab.asmevex(ctxt, p, to, from3, from, kmask)
+                               ab.asmand(ctxt, cursym, p, to, from)
+
                        case Zr_m_xm:
                                ab.mediaop(ctxt, o, op, int(yt.zoffset), z)
                                ab.asmand(ctxt, cursym, p, &p.To, &p.From)
@@ -4990,9 +5364,10 @@ func (ab *AsmBuf) asmins(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
 
        ab.rexflag = 0
        ab.vexflag = false
+       ab.evexflag = false
        mark := ab.Len()
        ab.doasm(ctxt, cursym, p)
-       if ab.rexflag != 0 && !ab.vexflag {
+       if ab.rexflag != 0 && !ab.vexflag && !ab.evexflag {
                // as befits the whole approach of the architecture,
                // the rex prefix must appear before the first opcode byte
                // (and thus after any 66/67/f2/f3/26/2e/3e prefix bytes, but
@@ -5060,3 +5435,8 @@ func (ab *AsmBuf) asmins(ctxt *obj.Link, cursym *obj.LSym, p *obj.Prog) {
 func unpackOps4(p *obj.Prog) (arg0, arg1, arg2, dst *obj.Addr) {
        return &p.From, &p.RestArgs[0], &p.RestArgs[1], &p.To
 }
+
+// unpackOps5 extracts 5 operands from p.
+func unpackOps5(p *obj.Prog) (arg0, arg1, arg2, arg3, dst *obj.Addr) {
+       return &p.From, &p.RestArgs[0], &p.RestArgs[1], &p.RestArgs[2], &p.To
+}
diff --git a/src/cmd/internal/obj/x86/asm_test.go b/src/cmd/internal/obj/x86/asm_test.go
new file mode 100644 (file)
index 0000000..d9caa2e
--- /dev/null
@@ -0,0 +1,83 @@
+// Copyright 2018 The Go Authors. All rights reserved.
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+package x86
+
+import (
+       "cmd/internal/obj"
+       "testing"
+)
+
+func init() {
+       // Required for tests that access any of
+       // opindex/ycover/reg/regrex global tables.
+       var ctxt obj.Link
+       instinit(&ctxt)
+}
+
+func TestRegisterListEncDec(t *testing.T) {
+       tests := []struct {
+               printed string
+               reg0    int16
+               reg1    int16
+       }{
+               {"[R10-R13]", REG_R10, REG_R13},
+               {"[X0-AX]", REG_X0, REG_AX},
+
+               {"[X0-X3]", REG_X0, REG_X3},
+               {"[X21-X24]", REG_X21, REG_X24},
+
+               {"[Y0-Y3]", REG_Y0, REG_Y3},
+               {"[Y21-Y24]", REG_Y21, REG_Y24},
+
+               {"[Z0-Z3]", REG_Z0, REG_Z3},
+               {"[Z21-Z24]", REG_Z21, REG_Z24},
+       }
+
+       for _, test := range tests {
+               enc := EncodeRegisterRange(test.reg0, test.reg1)
+               reg0, reg1 := decodeRegisterRange(enc)
+
+               if int16(reg0) != test.reg0 {
+                       t.Errorf("%s reg0 mismatch: have %d, want %d",
+                               test.printed, reg0, test.reg0)
+               }
+               if int16(reg1) != test.reg1 {
+                       t.Errorf("%s reg1 mismatch: have %d, want %d",
+                               test.printed, reg1, test.reg1)
+               }
+               wantPrinted := test.printed
+               if rlconv(enc) != wantPrinted {
+                       t.Errorf("%s string mismatch: have %s, want %s",
+                               test.printed, rlconv(enc), wantPrinted)
+               }
+       }
+}
+
+func TestRegIndex(t *testing.T) {
+       tests := []struct {
+               regFrom int
+               regTo   int
+       }{
+               {REG_AL, REG_R15B},
+               {REG_AX, REG_R15},
+               {REG_M0, REG_M7},
+               {REG_K0, REG_K7},
+               {REG_X0, REG_X31},
+               {REG_Y0, REG_Y31},
+               {REG_Z0, REG_Z31},
+       }
+
+       for _, test := range tests {
+               for index, reg := 0, test.regFrom; reg <= test.regTo; index, reg = index+1, reg+1 {
+                       have := regIndex(int16(reg))
+                       want := index
+                       if have != want {
+                               regName := rconv(int(reg))
+                               t.Errorf("regIndex(%s):\nhave: %d\nwant: %d",
+                                       regName, have, want)
+                       }
+               }
+       }
+}
diff --git a/src/cmd/internal/obj/x86/avx_optabs.go b/src/cmd/internal/obj/x86/avx_optabs.go
new file mode 100644 (file)
index 0000000..1ed28a6
--- /dev/null
@@ -0,0 +1,4610 @@
+// Code generated by x86avxgen. DO NOT EDIT.
+
+package x86
+
+// VEX instructions that come in two forms:
+//     VTHING xmm2/m128, xmmV, xmm1
+//     VTHING ymm2/m256, ymmV, ymm1
+//
+// The opcode array in the corresponding Optab entry
+// should contain the (VEX prefixes, opcode byte) pair
+// for each of the two forms.
+// For example, the entries for VPXOR are:
+//
+//     VPXOR xmm2/m128, xmmV, xmm1
+//     VEX.NDS.128.66.0F.WIG EF /r
+//
+//     VPXOR ymm2/m256, ymmV, ymm1
+//     VEX.NDS.256.66.0F.WIG EF /r
+//
+// Produce this optab entry:
+//
+//     {AVPXOR, yvex_xy3, Pavx, opBytes{vex128|vex66|vex0F|vexWIG, 0xEF, vex256|vex66|vex0F|vexWIG, 0xEF}}
+//
+// VEX requires at least 2 bytes inside opBytes:
+//     - VEX prefixes (vex-prefixed constants)
+//     - Opcode byte
+//
+// EVEX instructions extend VEX form variety:
+//     VTHING zmm2/m512, zmmV, zmm1    -- implicit K0 (merging)
+//     VTHING zmm2/m512, zmmV, K, zmm1 -- explicit K mask (can't use K0)
+//
+// EVEX requires at least 3 bytes inside opBytes:
+//     - EVEX prefixes (evex-prefixed constants); similar to VEX
+//     - Displacement multiplier info (scale / broadcast scale)
+//     - Opcode byte; similar to VEX
+//
+// Both VEX and EVEX instructions may have opdigit (opcode extension) byte
+// which follows the primary opcode byte.
+// Because it can only have value of 0-7, it is written in octal notation.
+//
+// x86.csv can be very useful for figuring out proper [E]VEX parts.
+
+var _yandnl = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yml, Yrl, Yrl}},
+}
+
+var _ybextrl = []ytab{
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yrl, Yml, Yrl}},
+}
+
+var _yblsil = []ytab{
+       {zcase: Zvex_rm_r_vo, zoffset: 3, args: argList{Yml, Yrl}},
+}
+
+var _ykaddb = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yk, Yk, Yk}},
+}
+
+var _ykmovb = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yk, Ym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yk, Yrl}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ykm, Yk}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yrl, Yk}},
+}
+
+var _yknotb = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yk, Yk}},
+}
+
+var _ykshiftlb = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yk, Yk}},
+}
+
+var _yrorxl = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yml, Yrl}},
+}
+
+var _yv4fmaddps = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, YzrMulti4, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Ym, YzrMulti4, Yknot0, Yzr}},
+}
+
+var _yv4fmaddss = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, YxrEvexMulti4, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Ym, YxrEvexMulti4, Yknot0, YxrEvex}},
+}
+
+var _yvaddpd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+}
+
+var _yvaddsd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+}
+
+var _yvaddsubpd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+}
+
+var _yvaesdec = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yzm, Yzr, Yzr}},
+}
+
+var _yvaesimc = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+}
+
+var _yvaeskeygenassist = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr}},
+}
+
+var _yvalignd = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvandnpd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvblendmpd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvblendpd = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yym, Yyr, Yyr}},
+}
+
+var _yvblendvpd = []ytab{
+       {zcase: Zvex_hr_rm_v_r, zoffset: 2, args: argList{Yxr, Yxm, Yxr, Yxr}},
+       {zcase: Zvex_hr_rm_v_r, zoffset: 2, args: argList{Yyr, Yym, Yyr, Yyr}},
+}
+
+var _yvbroadcastf128 = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yyr}},
+}
+
+var _yvbroadcastf32x2 = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, Yzr}},
+}
+
+var _yvbroadcastf32x4 = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Ym, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Ym, Yknot0, Yzr}},
+}
+
+var _yvbroadcastf32x8 = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Ym, Yknot0, Yzr}},
+}
+
+var _yvbroadcasti32x2 = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, Yzr}},
+}
+
+var _yvbroadcastsd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, Yzr}},
+}
+
+var _yvbroadcastss = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, Yzr}},
+}
+
+var _yvcmppd = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yym, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yk}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, Yk}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, Yk}},
+}
+
+var _yvcmpsd = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, Yk}},
+}
+
+var _yvcomisd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxmEvex, YxrEvex}},
+}
+
+var _yvcompresspd = []ytab{
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YyrEvex, YymEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YymEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{Yzr, Yzm}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, Yzm}},
+}
+
+var _yvcvtdq2pd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, Yzr}},
+}
+
+var _yvcvtdq2ps = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+}
+
+var _yvcvtpd2dq = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, YyrEvex}},
+}
+
+var _yvcvtpd2dqx = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+}
+
+var _yvcvtpd2dqy = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YxrEvex}},
+}
+
+var _yvcvtpd2qq = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+}
+
+var _yvcvtpd2udqx = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+}
+
+var _yvcvtpd2udqy = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YxrEvex}},
+}
+
+var _yvcvtph2ps = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+}
+
+var _yvcvtps2ph = []ytab{
+       {zcase: Zvex_i_r_rm, zoffset: 2, args: argList{Yu8, Yxr, Yxm}},
+       {zcase: Zvex_i_r_rm, zoffset: 2, args: argList{Yu8, Yyr, Yxm}},
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, Yzr, YymEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, Yzr, Yknot0, YymEvex}},
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, YxrEvex, YxmEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, YyrEvex, YxmEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, YyrEvex, Yknot0, YxmEvex}},
+}
+
+var _yvcvtps2qq = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+}
+
+var _yvcvtsd2si = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yrl}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxmEvex, Yrl}},
+}
+
+var _yvcvtsd2usil = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxmEvex, Yrl}},
+}
+
+var _yvcvtsi2sdl = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yml, Yxr, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yml, YxrEvex, YxrEvex}},
+}
+
+var _yvcvtudq2pd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, Yzr}},
+}
+
+var _yvcvtusi2sdl = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yml, YxrEvex, YxrEvex}},
+}
+
+var _yvdppd = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+}
+
+var _yvexp2pd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+}
+
+var _yvexpandpd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+}
+
+var _yvextractf128 = []ytab{
+       {zcase: Zvex_i_r_rm, zoffset: 2, args: argList{Yu8, Yyr, Yxm}},
+}
+
+var _yvextractf32x4 = []ytab{
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, YyrEvex, YxmEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, YyrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, Yzr, YxmEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, Yzr, Yknot0, YxmEvex}},
+}
+
+var _yvextractf32x8 = []ytab{
+       {zcase: Zevex_i_r_rm, zoffset: 0, args: argList{Yu8, Yzr, YymEvex}},
+       {zcase: Zevex_i_r_k_rm, zoffset: 3, args: argList{Yu8, Yzr, Yknot0, YymEvex}},
+}
+
+var _yvextractps = []ytab{
+       {zcase: Zvex_i_r_rm, zoffset: 2, args: argList{Yu8, Yxr, Yml}},
+       {zcase: Zevex_i_r_rm, zoffset: 3, args: argList{Yu8, YxrEvex, Yml}},
+}
+
+var _yvfixupimmpd = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yzr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, YyrEvex}},
+}
+
+var _yvfixupimmsd = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+}
+
+var _yvfpclasspdx = []ytab{
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YxmEvex, Yk}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, Yknot0, Yk}},
+}
+
+var _yvfpclasspdy = []ytab{
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, Yk}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, Yk}},
+}
+
+var _yvfpclasspdz = []ytab{
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yk}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yk}},
+}
+
+var _yvgatherdpd = []ytab{
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yxr, Yxvm, Yxr}},
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yyr, Yxvm, Yyr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxvmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxvmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YyvmEvex, Yknot0, Yzr}},
+}
+
+var _yvgatherdps = []ytab{
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yxr, Yxvm, Yxr}},
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yyr, Yyvm, Yyr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxvmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YyvmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzvm, Yknot0, Yzr}},
+}
+
+var _yvgatherpf0dpd = []ytab{
+       {zcase: Zevex_k_rmo, zoffset: 4, args: argList{Yknot0, YyvmEvex}},
+}
+
+var _yvgatherpf0dps = []ytab{
+       {zcase: Zevex_k_rmo, zoffset: 4, args: argList{Yknot0, Yzvm}},
+}
+
+var _yvgatherqps = []ytab{
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yxr, Yxvm, Yxr}},
+       {zcase: Zvex_v_rm_r, zoffset: 2, args: argList{Yxr, Yyvm, Yxr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxvmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YyvmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzvm, Yknot0, YyrEvex}},
+}
+
+var _yvgetexpsd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+}
+
+var _yvgetmantpd = []ytab{
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+}
+
+var _yvgf2p8affineinvqb = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yym, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvinsertf128 = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yyr, Yyr}},
+}
+
+var _yvinsertf32x4 = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, Yzr, Yknot0, Yzr}},
+}
+
+var _yvinsertf32x8 = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yzr, Yknot0, Yzr}},
+}
+
+var _yvinsertps = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+}
+
+var _yvlddqu = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yyr}},
+}
+
+var _yvldmxcsr = []ytab{
+       {zcase: Zvex_rm_v_ro, zoffset: 3, args: argList{Ym}},
+}
+
+var _yvmaskmovdqu = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxr, Yxr}},
+}
+
+var _yvmaskmovpd = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yxr, Ym}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yyr, Yyr, Ym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yyr, Yyr}},
+}
+
+var _yvmovapd = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yxm}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yyr, Yym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YyrEvex, YymEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YymEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{Yzr, Yzm}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, Yzm}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+}
+
+var _yvmovd = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yml}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yml, Yxr}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YxrEvex, Yml}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yml, YxrEvex}},
+}
+
+var _yvmovddup = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+}
+
+var _yvmovdqa = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yxm}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yyr, Yym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr}},
+}
+
+var _yvmovdqa32 = []ytab{
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YyrEvex, YymEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YymEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{Yzr, Yzm}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, Yzm}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yzm, Yknot0, Yzr}},
+}
+
+var _yvmovhlps = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxr, Yxr, Yxr}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxrEvex, YxrEvex, YxrEvex}},
+}
+
+var _yvmovhpd = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Ym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yxr, Yxr}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YxrEvex, Ym}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Ym, YxrEvex, YxrEvex}},
+}
+
+var _yvmovmskpd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxr, Yrl}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yyr, Yrl}},
+}
+
+var _yvmovntdq = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Ym}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yyr, Ym}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YxrEvex, Ym}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YyrEvex, Ym}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{Yzr, Ym}},
+}
+
+var _yvmovntdqa = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Ym, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Ym, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Ym, Yzr}},
+}
+
+var _yvmovq = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yml}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yxm}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yml, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YxrEvex, Yml}},
+       {zcase: Zevex_r_v_rm, zoffset: 3, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yml, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxmEvex, YxrEvex}},
+}
+
+var _yvmovsd = []ytab{
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Yxr, Yxr}},
+       {zcase: Zvex_r_v_rm, zoffset: 2, args: argList{Yxr, Ym}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Ym, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxr, Yxr, Yxr}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_r_v_k_rm, zoffset: 3, args: argList{YxrEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, Ym}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, Ym}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Ym, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Ym, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxrEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxrEvex, YxrEvex, Yknot0, YxrEvex}},
+}
+
+var _yvpbroadcastb = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yrl, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yrl, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yrl, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yrl, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yrl, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{Yrl, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr}},
+       {zcase: Zevex_rm_k_r, zoffset: 3, args: argList{YxmEvex, Yknot0, Yzr}},
+}
+
+var _yvpbroadcastmb2q = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yk, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yk, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yk, Yzr}},
+}
+
+var _yvpclmulqdq = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yym, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yzr}},
+}
+
+var _yvpcmpb = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, YxrEvex, Yknot0, Yk}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, Yk}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yk}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yk}},
+}
+
+var _yvpcmpeqb = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yk}},
+}
+
+var _yvperm2f128 = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yym, Yyr, Yyr}},
+}
+
+var _yvpermd = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvpermilpd = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr}},
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yym, Yyr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvpermpd = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yym, Yyr}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvpermq = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 0, args: argList{Yu8, Yym, Yyr}},
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yi8, Yym, Yyr}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvpextrw = []ytab{
+       {zcase: Zvex_i_r_rm, zoffset: 2, args: argList{Yu8, Yxr, Yml}},
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yxr, Yrl}},
+       {zcase: Zevex_i_r_rm, zoffset: 3, args: argList{Yu8, YxrEvex, Yml}},
+       {zcase: Zevex_i_rm_r, zoffset: 3, args: argList{Yu8, YxrEvex, Yrl}},
+}
+
+var _yvpinsrb = []ytab{
+       {zcase: Zvex_i_rm_v_r, zoffset: 2, args: argList{Yu8, Yml, Yxr, Yxr}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 3, args: argList{Yu8, Yml, YxrEvex, YxrEvex}},
+}
+
+var _yvpmovb2m = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YxrEvex, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{YyrEvex, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 3, args: argList{Yzr, Yk}},
+}
+
+var _yvpmovdb = []ytab{
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YyrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{Yzr, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, YxmEvex}},
+}
+
+var _yvpmovdw = []ytab{
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YxrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{YyrEvex, YxmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YxmEvex}},
+       {zcase: Zevex_r_v_rm, zoffset: 0, args: argList{Yzr, YymEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, YymEvex}},
+}
+
+var _yvprold = []ytab{
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+}
+
+var _yvpscatterdd = []ytab{
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YyvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, Yzvm}},
+}
+
+var _yvpscatterdq = []ytab{
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, YxvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{Yzr, Yknot0, YyvmEvex}},
+}
+
+var _yvpscatterqd = []ytab{
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YxvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YxrEvex, Yknot0, YyvmEvex}},
+       {zcase: Zevex_r_k_rm, zoffset: 3, args: argList{YyrEvex, Yknot0, Yzvm}},
+}
+
+var _yvpshufbitqmb = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, Yk}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yk}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yk}},
+}
+
+var _yvpshufd = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr}},
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yym, Yyr}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+}
+
+var _yvpslld = []ytab{
+       {zcase: Zvex_i_rm_vo, zoffset: 3, args: argList{Yu8, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_vo, zoffset: 3, args: argList{Yu8, Yyr, Yyr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, Yzr, Yknot0, Yzr}},
+}
+
+var _yvpslldq = []ytab{
+       {zcase: Zvex_i_rm_vo, zoffset: 3, args: argList{Yu8, Yxr, Yxr}},
+       {zcase: Zvex_i_rm_vo, zoffset: 3, args: argList{Yu8, Yyr, Yyr}},
+       {zcase: Zevex_i_rm_vo, zoffset: 4, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 4, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 4, args: argList{Yu8, Yzm, Yzr}},
+}
+
+var _yvpsraq = []ytab{
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YxmEvex, YxrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YxmEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, YymEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_vo, zoffset: 0, args: argList{Yu8, Yzm, Yzr}},
+       {zcase: Zevex_i_rm_k_vo, zoffset: 4, args: argList{Yu8, Yzm, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, Yzr, Yknot0, Yzr}},
+}
+
+var _yvptest = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr}},
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yym, Yyr}},
+}
+
+var _yvrcpss = []ytab{
+       {zcase: Zvex_rm_v_r, zoffset: 2, args: argList{Yxm, Yxr, Yxr}},
+}
+
+var _yvroundpd = []ytab{
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yxm, Yxr}},
+       {zcase: Zvex_i_rm_r, zoffset: 2, args: argList{Yu8, Yym, Yyr}},
+}
+
+var _yvscalefpd = []ytab{
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{Yzm, Yzr, Yzr}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{Yzm, Yzr, Yknot0, Yzr}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YxmEvex, YxrEvex, YxrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YxmEvex, YxrEvex, Yknot0, YxrEvex}},
+       {zcase: Zevex_rm_v_r, zoffset: 0, args: argList{YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_rm_v_k_r, zoffset: 3, args: argList{YymEvex, YyrEvex, Yknot0, YyrEvex}},
+}
+
+var _yvshuff32x4 = []ytab{
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, YymEvex, YyrEvex, YyrEvex}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, YymEvex, YyrEvex, Yknot0, YyrEvex}},
+       {zcase: Zevex_i_rm_v_r, zoffset: 0, args: argList{Yu8, Yzm, Yzr, Yzr}},
+       {zcase: Zevex_i_rm_v_k_r, zoffset: 3, args: argList{Yu8, Yzm, Yzr, Yknot0, Yzr}},
+}
+
+var _yvzeroall = []ytab{
+       {zcase: Zvex, zoffset: 2, args: argList{}},
+}
+
+var avxOptab = [...]Optab{
+       {as: AANDNL, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF2,
+       }},
+       {as: AANDNQ, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF2,
+       }},
+       {as: ABEXTRL, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF7,
+       }},
+       {as: ABEXTRQ, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF7,
+       }},
+       {as: ABLSIL, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF3, 03,
+       }},
+       {as: ABLSIQ, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF3, 03,
+       }},
+       {as: ABLSMSKL, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF3, 02,
+       }},
+       {as: ABLSMSKQ, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF3, 02,
+       }},
+       {as: ABLSRL, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF3, 01,
+       }},
+       {as: ABLSRQ, ytab: _yblsil, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF3, 01,
+       }},
+       {as: ABZHIL, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW0, 0xF5,
+       }},
+       {as: ABZHIQ, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F38 | vexW1, 0xF5,
+       }},
+       {as: AKADDB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x4A,
+       }},
+       {as: AKADDD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x4A,
+       }},
+       {as: AKADDQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x4A,
+       }},
+       {as: AKADDW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x4A,
+       }},
+       {as: AKANDB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x41,
+       }},
+       {as: AKANDD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x41,
+       }},
+       {as: AKANDNB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x42,
+       }},
+       {as: AKANDND, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x42,
+       }},
+       {as: AKANDNQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x42,
+       }},
+       {as: AKANDNW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x42,
+       }},
+       {as: AKANDQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x41,
+       }},
+       {as: AKANDW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x41,
+       }},
+       {as: AKMOVB, ytab: _ykmovb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x91,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x93,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x90,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x92,
+       }},
+       {as: AKMOVD, ytab: _ykmovb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x91,
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x93,
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x90,
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x92,
+       }},
+       {as: AKMOVQ, ytab: _ykmovb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW1, 0x91,
+               avxEscape | vex128 | vexF2 | vex0F | vexW1, 0x93,
+               avxEscape | vex128 | vex0F | vexW1, 0x90,
+               avxEscape | vex128 | vexF2 | vex0F | vexW1, 0x92,
+       }},
+       {as: AKMOVW, ytab: _ykmovb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x91,
+               avxEscape | vex128 | vex0F | vexW0, 0x93,
+               avxEscape | vex128 | vex0F | vexW0, 0x90,
+               avxEscape | vex128 | vex0F | vexW0, 0x92,
+       }},
+       {as: AKNOTB, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x44,
+       }},
+       {as: AKNOTD, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x44,
+       }},
+       {as: AKNOTQ, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW1, 0x44,
+       }},
+       {as: AKNOTW, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x44,
+       }},
+       {as: AKORB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x45,
+       }},
+       {as: AKORD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x45,
+       }},
+       {as: AKORQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x45,
+       }},
+       {as: AKORTESTB, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x98,
+       }},
+       {as: AKORTESTD, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x98,
+       }},
+       {as: AKORTESTQ, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW1, 0x98,
+       }},
+       {as: AKORTESTW, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x98,
+       }},
+       {as: AKORW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x45,
+       }},
+       {as: AKSHIFTLB, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x32,
+       }},
+       {as: AKSHIFTLD, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x33,
+       }},
+       {as: AKSHIFTLQ, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x33,
+       }},
+       {as: AKSHIFTLW, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x32,
+       }},
+       {as: AKSHIFTRB, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x30,
+       }},
+       {as: AKSHIFTRD, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x31,
+       }},
+       {as: AKSHIFTRQ, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x31,
+       }},
+       {as: AKSHIFTRW, ytab: _ykshiftlb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x30,
+       }},
+       {as: AKTESTB, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x99,
+       }},
+       {as: AKTESTD, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x99,
+       }},
+       {as: AKTESTQ, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW1, 0x99,
+       }},
+       {as: AKTESTW, ytab: _yknotb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x99,
+       }},
+       {as: AKUNPCKBW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x4B,
+       }},
+       {as: AKUNPCKDQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x4B,
+       }},
+       {as: AKUNPCKWD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x4B,
+       }},
+       {as: AKXNORB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x46,
+       }},
+       {as: AKXNORD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x46,
+       }},
+       {as: AKXNORQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x46,
+       }},
+       {as: AKXNORW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x46,
+       }},
+       {as: AKXORB, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x47,
+       }},
+       {as: AKXORD, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW1, 0x47,
+       }},
+       {as: AKXORQ, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW1, 0x47,
+       }},
+       {as: AKXORW, ytab: _ykaddb, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x47,
+       }},
+       {as: AMULXL, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW0, 0xF6,
+       }},
+       {as: AMULXQ, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW1, 0xF6,
+       }},
+       {as: APDEPL, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW0, 0xF5,
+       }},
+       {as: APDEPQ, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW1, 0xF5,
+       }},
+       {as: APEXTL, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F38 | vexW0, 0xF5,
+       }},
+       {as: APEXTQ, ytab: _yandnl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F38 | vexW1, 0xF5,
+       }},
+       {as: ARORXL, ytab: _yrorxl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F3A | vexW0, 0xF0,
+       }},
+       {as: ARORXQ, ytab: _yrorxl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F3A | vexW1, 0xF0,
+       }},
+       {as: ASARXL, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F38 | vexW0, 0xF7,
+       }},
+       {as: ASARXQ, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F38 | vexW1, 0xF7,
+       }},
+       {as: ASHLXL, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xF7,
+       }},
+       {as: ASHLXQ, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xF7,
+       }},
+       {as: ASHRXL, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW0, 0xF7,
+       }},
+       {as: ASHRXQ, ytab: _ybextrl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F38 | vexW1, 0xF7,
+       }},
+       {as: AV4FMADDPS, ytab: _yv4fmaddps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x9A,
+       }},
+       {as: AV4FMADDSS, ytab: _yv4fmaddss, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x9B,
+       }},
+       {as: AV4FNMADDPS, ytab: _yv4fmaddps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0xAA,
+       }},
+       {as: AV4FNMADDSS, ytab: _yv4fmaddss, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0xAB,
+       }},
+       {as: AVADDPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x58,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x58,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x58,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x58,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x58,
+       }},
+       {as: AVADDPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x58,
+               avxEscape | vex256 | vex0F | vexW0, 0x58,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x58,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x58,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x58,
+       }},
+       {as: AVADDSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x58,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x58,
+       }},
+       {as: AVADDSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x58,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x58,
+       }},
+       {as: AVADDSUBPD, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD0,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD0,
+       }},
+       {as: AVADDSUBPS, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0xD0,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0xD0,
+       }},
+       {as: AVAESDEC, ytab: _yvaesdec, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xDE,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xDE,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0xDE,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0xDE,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0xDE,
+       }},
+       {as: AVAESDECLAST, ytab: _yvaesdec, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xDF,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xDF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0xDF,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0xDF,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0xDF,
+       }},
+       {as: AVAESENC, ytab: _yvaesdec, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xDC,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xDC,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0xDC,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0xDC,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0xDC,
+       }},
+       {as: AVAESENCLAST, ytab: _yvaesdec, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xDD,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xDD,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0xDD,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0xDD,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0xDD,
+       }},
+       {as: AVAESIMC, ytab: _yvaesimc, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xDB,
+       }},
+       {as: AVAESKEYGENASSIST, ytab: _yvaeskeygenassist, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0xDF,
+       }},
+       {as: AVALIGND, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x03,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x03,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x03,
+       }},
+       {as: AVALIGNQ, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x03,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x03,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x03,
+       }},
+       {as: AVANDNPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x55,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x55,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x55,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x55,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVANDNPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x55,
+               avxEscape | vex256 | vex0F | vexW0, 0x55,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x55,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x55,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVANDPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x54,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x54,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x54,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVANDPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x54,
+               avxEscape | vex256 | vex0F | vexW0, 0x54,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x54,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVBLENDMPD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x65,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x65,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x65,
+       }},
+       {as: AVBLENDMPS, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x65,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x65,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x65,
+       }},
+       {as: AVBLENDPD, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0D,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x0D,
+       }},
+       {as: AVBLENDPS, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0C,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x0C,
+       }},
+       {as: AVBLENDVPD, ytab: _yvblendvpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x4B,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x4B,
+       }},
+       {as: AVBLENDVPS, ytab: _yvblendvpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x4A,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x4A,
+       }},
+       {as: AVBROADCASTF128, ytab: _yvbroadcastf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x1A,
+       }},
+       {as: AVBROADCASTF32X2, ytab: _yvbroadcastf32x2, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x19,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x19,
+       }},
+       {as: AVBROADCASTF32X4, ytab: _yvbroadcastf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x1A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x1A,
+       }},
+       {as: AVBROADCASTF32X8, ytab: _yvbroadcastf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x1B,
+       }},
+       {as: AVBROADCASTF64X2, ytab: _yvbroadcastf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x1A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x1A,
+       }},
+       {as: AVBROADCASTF64X4, ytab: _yvbroadcastf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x1B,
+       }},
+       {as: AVBROADCASTI128, ytab: _yvbroadcastf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x5A,
+       }},
+       {as: AVBROADCASTI32X2, ytab: _yvbroadcasti32x2, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x59,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x59,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVBROADCASTI32X4, ytab: _yvbroadcastf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x5A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVBROADCASTI32X8, ytab: _yvbroadcastf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVBROADCASTI64X2, ytab: _yvbroadcastf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x5A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVBROADCASTI64X4, ytab: _yvbroadcastf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVBROADCASTSD, ytab: _yvbroadcastsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x19,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x19,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x19,
+       }},
+       {as: AVBROADCASTSS, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x18,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x18,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x18,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x18,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x18,
+       }},
+       {as: AVCMPPD, ytab: _yvcmppd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xC2,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xC2,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled, 0xC2,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8, 0xC2,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8, 0xC2,
+       }},
+       {as: AVCMPPS, ytab: _yvcmppd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0xC2,
+               avxEscape | vex256 | vex0F | vexW0, 0xC2,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled, 0xC2,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4, 0xC2,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4, 0xC2,
+       }},
+       {as: AVCMPSD, ytab: _yvcmpsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0xC2,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexSaeEnabled, 0xC2,
+       }},
+       {as: AVCMPSS, ytab: _yvcmpsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0xC2,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled, 0xC2,
+       }},
+       {as: AVCOMISD, ytab: _yvcomisd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x2F,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8 | evexSaeEnabled, 0x2F,
+       }},
+       {as: AVCOMISS, ytab: _yvcomisd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x2F,
+               avxEscape | evex128 | evex0F | evexW0, evexN4 | evexSaeEnabled, 0x2F,
+       }},
+       {as: AVCOMPRESSPD, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8A,
+       }},
+       {as: AVCOMPRESSPS, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8A,
+       }},
+       {as: AVCVTDQ2PD, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0xE6,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0xE6,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0xE6,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xE6,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTDQ2PS, ytab: _yvcvtdq2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5B,
+               avxEscape | vex256 | vex0F | vexW0, 0x5B,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5B,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTPD2DQ, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTPD2DQX, ytab: _yvcvtpd2dqx, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0xE6,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTPD2DQY, ytab: _yvcvtpd2dqy, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0xE6,
+               avxEscape | evex256 | evexF2 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTPD2PS, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTPD2PSX, ytab: _yvcvtpd2dqx, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5A,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTPD2PSY, ytab: _yvcvtpd2dqy, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5A,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTPD2QQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x7B,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7B,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7B,
+       }},
+       {as: AVCVTPD2UDQ, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTPD2UDQX, ytab: _yvcvtpd2udqx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTPD2UDQY, ytab: _yvcvtpd2udqy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTPD2UQQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x79,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x79,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTPH2PS, ytab: _yvcvtph2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x13,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x13,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexSaeEnabled | evexZeroingEnabled, 0x13,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x13,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x13,
+       }},
+       {as: AVCVTPS2DQ, ytab: _yvcvtdq2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5B,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5B,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5B,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTPS2PD, ytab: _yvcvtph2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5A,
+               avxEscape | vex256 | vex0F | vexW0, 0x5A,
+               avxEscape | evex512 | evex0F | evexW0, evexN32 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x5A,
+               avxEscape | evex128 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x5A,
+               avxEscape | evex256 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTPS2PH, ytab: _yvcvtps2ph, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x1D,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x1D,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN32 | evexSaeEnabled | evexZeroingEnabled, 0x1D,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN8 | evexZeroingEnabled, 0x1D,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x1D,
+       }},
+       {as: AVCVTPS2QQ, ytab: _yvcvtps2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x7B,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x7B,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7B,
+       }},
+       {as: AVCVTPS2UDQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x79,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x79,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTPS2UQQ, ytab: _yvcvtps2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x79,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x79,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVCVTQQ2PD, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF3 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xE6,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+               avxEscape | evex256 | evexF3 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTQQ2PS, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTQQ2PSX, ytab: _yvcvtpd2udqx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTQQ2PSY, ytab: _yvcvtpd2udqy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTSD2SI, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x2D,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN8 | evexRoundingEnabled, 0x2D,
+       }},
+       {as: AVCVTSD2SIQ, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW1, 0x2D,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x2D,
+       }},
+       {as: AVCVTSD2SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x5A,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTSD2USIL, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN8 | evexRoundingEnabled, 0x79,
+       }},
+       {as: AVCVTSD2USIQ, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x79,
+       }},
+       {as: AVCVTSI2SDL, ytab: _yvcvtsi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x2A,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN4, 0x2A,
+       }},
+       {as: AVCVTSI2SDQ, ytab: _yvcvtsi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW1, 0x2A,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x2A,
+       }},
+       {as: AVCVTSI2SSL, ytab: _yvcvtsi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x2A,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled, 0x2A,
+       }},
+       {as: AVCVTSI2SSQ, ytab: _yvcvtsi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW1, 0x2A,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x2A,
+       }},
+       {as: AVCVTSS2SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5A,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x5A,
+       }},
+       {as: AVCVTSS2SI, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x2D,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled, 0x2D,
+       }},
+       {as: AVCVTSS2SIQ, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW1, 0x2D,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN4 | evexRoundingEnabled, 0x2D,
+       }},
+       {as: AVCVTSS2USIL, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled, 0x79,
+       }},
+       {as: AVCVTSS2USIQ, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN4 | evexRoundingEnabled, 0x79,
+       }},
+       {as: AVCVTTPD2DQ, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTTPD2DQX, ytab: _yvcvtpd2dqx, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE6,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTTPD2DQY, ytab: _yvcvtpd2dqy, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE6,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xE6,
+       }},
+       {as: AVCVTTPD2QQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x7A,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTTPD2UDQ, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTPD2UDQX, ytab: _yvcvtpd2udqx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTPD2UDQY, ytab: _yvcvtpd2udqy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTPD2UQQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x78,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x78,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTPS2DQ, ytab: _yvcvtdq2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5B,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x5B,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x5B,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5B,
+       }},
+       {as: AVCVTTPS2QQ, ytab: _yvcvtps2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x7A,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTTPS2UDQ, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x78,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x78,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTPS2UQQ, ytab: _yvcvtps2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x78,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x78,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVCVTTSD2SI, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x2C,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN8 | evexSaeEnabled, 0x2C,
+       }},
+       {as: AVCVTTSD2SIQ, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW1, 0x2C,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexSaeEnabled, 0x2C,
+       }},
+       {as: AVCVTTSD2USIL, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN8 | evexSaeEnabled, 0x78,
+       }},
+       {as: AVCVTTSD2USIQ, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexSaeEnabled, 0x78,
+       }},
+       {as: AVCVTTSS2SI, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x2C,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled, 0x2C,
+       }},
+       {as: AVCVTTSS2SIQ, ytab: _yvcvtsd2si, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW1, 0x2C,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN4 | evexSaeEnabled, 0x2C,
+       }},
+       {as: AVCVTTSS2USIL, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled, 0x78,
+       }},
+       {as: AVCVTTSS2USIQ, ytab: _yvcvtsd2usil, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN4 | evexSaeEnabled, 0x78,
+       }},
+       {as: AVCVTUDQ2PD, ytab: _yvcvtudq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN8 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUDQ2PS, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x7A,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evexF2 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUQQ2PD, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF3 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x7A,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evexF3 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUQQ2PS, ytab: _yvcvtpd2dq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUQQ2PSX, ytab: _yvcvtpd2udqx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUQQ2PSY, ytab: _yvcvtpd2udqy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evexF2 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7A,
+       }},
+       {as: AVCVTUSI2SDL, ytab: _yvcvtusi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN4, 0x7B,
+       }},
+       {as: AVCVTUSI2SDQ, ytab: _yvcvtusi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x7B,
+       }},
+       {as: AVCVTUSI2SSL, ytab: _yvcvtusi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled, 0x7B,
+       }},
+       {as: AVCVTUSI2SSQ, ytab: _yvcvtusi2sdl, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN8 | evexRoundingEnabled, 0x7B,
+       }},
+       {as: AVDBPSADBW, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x42,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x42,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexZeroingEnabled, 0x42,
+       }},
+       {as: AVDIVPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5E,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5E,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5E,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5E,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5E,
+       }},
+       {as: AVDIVPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5E,
+               avxEscape | vex256 | vex0F | vexW0, 0x5E,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5E,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5E,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5E,
+       }},
+       {as: AVDIVSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x5E,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5E,
+       }},
+       {as: AVDIVSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5E,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5E,
+       }},
+       {as: AVDPPD, ytab: _yvdppd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x41,
+       }},
+       {as: AVDPPS, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x40,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x40,
+       }},
+       {as: AVEXP2PD, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0xC8,
+       }},
+       {as: AVEXP2PS, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0xC8,
+       }},
+       {as: AVEXPANDPD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x88,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x88,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x88,
+       }},
+       {as: AVEXPANDPS, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x88,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x88,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x88,
+       }},
+       {as: AVEXTRACTF128, ytab: _yvextractf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x19,
+       }},
+       {as: AVEXTRACTF32X4, ytab: _yvextractf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x19,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x19,
+       }},
+       {as: AVEXTRACTF32X8, ytab: _yvextractf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x1B,
+       }},
+       {as: AVEXTRACTF64X2, ytab: _yvextractf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x19,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x19,
+       }},
+       {as: AVEXTRACTF64X4, ytab: _yvextractf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x1B,
+       }},
+       {as: AVEXTRACTI128, ytab: _yvextractf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x39,
+       }},
+       {as: AVEXTRACTI32X4, ytab: _yvextractf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x39,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x39,
+       }},
+       {as: AVEXTRACTI32X8, ytab: _yvextractf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x3B,
+       }},
+       {as: AVEXTRACTI64X2, ytab: _yvextractf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x39,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x39,
+       }},
+       {as: AVEXTRACTI64X4, ytab: _yvextractf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x3B,
+       }},
+       {as: AVEXTRACTPS, ytab: _yvextractps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x17,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4, 0x17,
+       }},
+       {as: AVFIXUPIMMPD, ytab: _yvfixupimmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x54,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVFIXUPIMMPS, ytab: _yvfixupimmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x54,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVFIXUPIMMSD, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVFIXUPIMMSS, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVFMADD132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x98,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x98,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x98,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x98,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x98,
+       }},
+       {as: AVFMADD132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x98,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x98,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x98,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x98,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x98,
+       }},
+       {as: AVFMADD132SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x99,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x99,
+       }},
+       {as: AVFMADD132SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x99,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x99,
+       }},
+       {as: AVFMADD213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xA8,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xA8,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xA8,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xA8,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xA8,
+       }},
+       {as: AVFMADD213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xA8,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xA8,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xA8,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xA8,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xA8,
+       }},
+       {as: AVFMADD213SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xA9,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xA9,
+       }},
+       {as: AVFMADD213SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xA9,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xA9,
+       }},
+       {as: AVFMADD231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xB8,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xB8,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xB8,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xB8,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xB8,
+       }},
+       {as: AVFMADD231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xB8,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xB8,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xB8,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xB8,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xB8,
+       }},
+       {as: AVFMADD231SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xB9,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xB9,
+       }},
+       {as: AVFMADD231SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xB9,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xB9,
+       }},
+       {as: AVFMADDSUB132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x96,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x96,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x96,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x96,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x96,
+       }},
+       {as: AVFMADDSUB132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x96,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x96,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x96,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x96,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x96,
+       }},
+       {as: AVFMADDSUB213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xA6,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xA6,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xA6,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xA6,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xA6,
+       }},
+       {as: AVFMADDSUB213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xA6,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xA6,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xA6,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xA6,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xA6,
+       }},
+       {as: AVFMADDSUB231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xB6,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xB6,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xB6,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xB6,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xB6,
+       }},
+       {as: AVFMADDSUB231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xB6,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xB6,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xB6,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xB6,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xB6,
+       }},
+       {as: AVFMSUB132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9A,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x9A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9A,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x9A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x9A,
+       }},
+       {as: AVFMSUB132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9A,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x9A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9A,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x9A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x9A,
+       }},
+       {as: AVFMSUB132SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9B,
+       }},
+       {as: AVFMSUB132SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9B,
+       }},
+       {as: AVFMSUB213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAA,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xAA,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAA,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xAA,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xAA,
+       }},
+       {as: AVFMSUB213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAA,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xAA,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAA,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xAA,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xAA,
+       }},
+       {as: AVFMSUB213SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAB,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAB,
+       }},
+       {as: AVFMSUB213SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAB,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAB,
+       }},
+       {as: AVFMSUB231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBA,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xBA,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBA,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xBA,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xBA,
+       }},
+       {as: AVFMSUB231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBA,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xBA,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBA,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xBA,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xBA,
+       }},
+       {as: AVFMSUB231SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBB,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBB,
+       }},
+       {as: AVFMSUB231SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBB,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBB,
+       }},
+       {as: AVFMSUBADD132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x97,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x97,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x97,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x97,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x97,
+       }},
+       {as: AVFMSUBADD132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x97,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x97,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x97,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x97,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x97,
+       }},
+       {as: AVFMSUBADD213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xA7,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xA7,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xA7,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xA7,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xA7,
+       }},
+       {as: AVFMSUBADD213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xA7,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xA7,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xA7,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xA7,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xA7,
+       }},
+       {as: AVFMSUBADD231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xB7,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xB7,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xB7,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xB7,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xB7,
+       }},
+       {as: AVFMSUBADD231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xB7,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xB7,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xB7,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xB7,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xB7,
+       }},
+       {as: AVFNMADD132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x9C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x9C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x9C,
+       }},
+       {as: AVFNMADD132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x9C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x9C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x9C,
+       }},
+       {as: AVFNMADD132SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9D,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9D,
+       }},
+       {as: AVFNMADD132SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9D,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9D,
+       }},
+       {as: AVFNMADD213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAC,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xAC,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAC,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xAC,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xAC,
+       }},
+       {as: AVFNMADD213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAC,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xAC,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAC,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xAC,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xAC,
+       }},
+       {as: AVFNMADD213SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAD,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAD,
+       }},
+       {as: AVFNMADD213SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAD,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAD,
+       }},
+       {as: AVFNMADD231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBC,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xBC,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBC,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xBC,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xBC,
+       }},
+       {as: AVFNMADD231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBC,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xBC,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBC,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xBC,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xBC,
+       }},
+       {as: AVFNMADD231SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBD,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBD,
+       }},
+       {as: AVFNMADD231SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBD,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBD,
+       }},
+       {as: AVFNMSUB132PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x9E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9E,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x9E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x9E,
+       }},
+       {as: AVFNMSUB132PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x9E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9E,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x9E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x9E,
+       }},
+       {as: AVFNMSUB132SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x9F,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x9F,
+       }},
+       {as: AVFNMSUB132SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x9F,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x9F,
+       }},
+       {as: AVFNMSUB213PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAE,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xAE,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAE,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xAE,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xAE,
+       }},
+       {as: AVFNMSUB213PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAE,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xAE,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAE,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xAE,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xAE,
+       }},
+       {as: AVFNMSUB213SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xAF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xAF,
+       }},
+       {as: AVFNMSUB213SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xAF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xAF,
+       }},
+       {as: AVFNMSUB231PD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBE,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0xBE,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBE,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xBE,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xBE,
+       }},
+       {as: AVFNMSUB231PS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBE,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xBE,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBE,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xBE,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xBE,
+       }},
+       {as: AVFNMSUB231SD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0xBF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0xBF,
+       }},
+       {as: AVFNMSUB231SS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xBF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0xBF,
+       }},
+       {as: AVFPCLASSPDX, ytab: _yvfpclasspdx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8, 0x66,
+       }},
+       {as: AVFPCLASSPDY, ytab: _yvfpclasspdy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8, 0x66,
+       }},
+       {as: AVFPCLASSPDZ, ytab: _yvfpclasspdz, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8, 0x66,
+       }},
+       {as: AVFPCLASSPSX, ytab: _yvfpclasspdx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4, 0x66,
+       }},
+       {as: AVFPCLASSPSY, ytab: _yvfpclasspdy, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4, 0x66,
+       }},
+       {as: AVFPCLASSPSZ, ytab: _yvfpclasspdz, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4, 0x66,
+       }},
+       {as: AVFPCLASSSD, ytab: _yvfpclasspdx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8, 0x67,
+       }},
+       {as: AVFPCLASSSS, ytab: _yvfpclasspdx, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4, 0x67,
+       }},
+       {as: AVGATHERDPD, ytab: _yvgatherdpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x92,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x92,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0x92,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0x92,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0x92,
+       }},
+       {as: AVGATHERDPS, ytab: _yvgatherdps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x92,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x92,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0x92,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0x92,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0x92,
+       }},
+       {as: AVGATHERPF0DPD, ytab: _yvgatherpf0dpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC6, 01,
+       }},
+       {as: AVGATHERPF0DPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC6, 01,
+       }},
+       {as: AVGATHERPF0QPD, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC7, 01,
+       }},
+       {as: AVGATHERPF0QPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC7, 01,
+       }},
+       {as: AVGATHERPF1DPD, ytab: _yvgatherpf0dpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC6, 02,
+       }},
+       {as: AVGATHERPF1DPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC6, 02,
+       }},
+       {as: AVGATHERPF1QPD, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC7, 02,
+       }},
+       {as: AVGATHERPF1QPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC7, 02,
+       }},
+       {as: AVGATHERQPD, ytab: _yvgatherdps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x93,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x93,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0x93,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0x93,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0x93,
+       }},
+       {as: AVGATHERQPS, ytab: _yvgatherqps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x93,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x93,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0x93,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0x93,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0x93,
+       }},
+       {as: AVGETEXPPD, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x42,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x42,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x42,
+       }},
+       {as: AVGETEXPPS, ytab: _yvcvtpd2qq, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x42,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x42,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x42,
+       }},
+       {as: AVGETEXPSD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x43,
+       }},
+       {as: AVGETEXPSS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x43,
+       }},
+       {as: AVGETMANTPD, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x26,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x26,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x26,
+       }},
+       {as: AVGETMANTPS, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x26,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x26,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x26,
+       }},
+       {as: AVGETMANTSD, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x27,
+       }},
+       {as: AVGETMANTSS, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x27,
+       }},
+       {as: AVGF2P8AFFINEINVQB, ytab: _yvgf2p8affineinvqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0xCF,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW1, 0xCF,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xCF,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xCF,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xCF,
+       }},
+       {as: AVGF2P8AFFINEQB, ytab: _yvgf2p8affineinvqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0xCE,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW1, 0xCE,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xCE,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xCE,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xCE,
+       }},
+       {as: AVGF2P8MULB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0xCF,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0xCF,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0xCF,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0xCF,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0xCF,
+       }},
+       {as: AVHADDPD, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x7C,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x7C,
+       }},
+       {as: AVHADDPS, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x7C,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0x7C,
+       }},
+       {as: AVHSUBPD, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x7D,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x7D,
+       }},
+       {as: AVHSUBPS, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x7D,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0x7D,
+       }},
+       {as: AVINSERTF128, ytab: _yvinsertf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x18,
+       }},
+       {as: AVINSERTF32X4, ytab: _yvinsertf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x18,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x18,
+       }},
+       {as: AVINSERTF32X8, ytab: _yvinsertf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x1A,
+       }},
+       {as: AVINSERTF64X2, ytab: _yvinsertf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x18,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x18,
+       }},
+       {as: AVINSERTF64X4, ytab: _yvinsertf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x1A,
+       }},
+       {as: AVINSERTI128, ytab: _yvinsertf128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x38,
+       }},
+       {as: AVINSERTI32X4, ytab: _yvinsertf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x38,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x38,
+       }},
+       {as: AVINSERTI32X8, ytab: _yvinsertf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x3A,
+       }},
+       {as: AVINSERTI64X2, ytab: _yvinsertf32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x38,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x38,
+       }},
+       {as: AVINSERTI64X4, ytab: _yvinsertf32x8, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x3A,
+       }},
+       {as: AVINSERTPS, ytab: _yvinsertps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x21,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4, 0x21,
+       }},
+       {as: AVLDDQU, ytab: _yvlddqu, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0xF0,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0xF0,
+       }},
+       {as: AVLDMXCSR, ytab: _yvldmxcsr, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0xAE, 02,
+       }},
+       {as: AVMASKMOVDQU, ytab: _yvmaskmovdqu, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF7,
+       }},
+       {as: AVMASKMOVPD, ytab: _yvmaskmovpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2F,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2F,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2D,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2D,
+       }},
+       {as: AVMASKMOVPS, ytab: _yvmaskmovpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2E,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2C,
+       }},
+       {as: AVMAXPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5F,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5F,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x5F,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5F,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5F,
+       }},
+       {as: AVMAXPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5F,
+               avxEscape | vex256 | vex0F | vexW0, 0x5F,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x5F,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5F,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5F,
+       }},
+       {as: AVMAXSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x5F,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x5F,
+       }},
+       {as: AVMAXSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5F,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x5F,
+       }},
+       {as: AVMINPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5D,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5D,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x5D,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5D,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5D,
+       }},
+       {as: AVMINPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5D,
+               avxEscape | vex256 | vex0F | vexW0, 0x5D,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x5D,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5D,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5D,
+       }},
+       {as: AVMINSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x5D,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x5D,
+       }},
+       {as: AVMINSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5D,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x5D,
+       }},
+       {as: AVMOVAPD, ytab: _yvmovapd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x29,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x29,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x28,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x28,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x29,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x29,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x29,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x28,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x28,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x28,
+       }},
+       {as: AVMOVAPS, ytab: _yvmovapd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x29,
+               avxEscape | vex256 | vex0F | vexW0, 0x29,
+               avxEscape | vex128 | vex0F | vexW0, 0x28,
+               avxEscape | vex256 | vex0F | vexW0, 0x28,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x29,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x29,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x29,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x28,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x28,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x28,
+       }},
+       {as: AVMOVD, ytab: _yvmovd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x7E,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6E,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN4, 0x7E,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN4, 0x6E,
+       }},
+       {as: AVMOVDDUP, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x12,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0x12,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexZeroingEnabled, 0x12,
+               avxEscape | evex256 | evexF2 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x12,
+               avxEscape | evex512 | evexF2 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x12,
+       }},
+       {as: AVMOVDQA, ytab: _yvmovdqa, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x7F,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x7F,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6F,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x6F,
+       }},
+       {as: AVMOVDQA32, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVDQA64, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVDQU, ytab: _yvmovdqa, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x7F,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x7F,
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x6F,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x6F,
+       }},
+       {as: AVMOVDQU16, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evexF2 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evexF2 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evexF2 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evexF2 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVDQU32, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVDQU64, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evexF3 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evexF3 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evexF3 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evexF3 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVDQU8, ytab: _yvmovdqa32, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evexF2 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evexF2 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex256 | evexF2 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x6F,
+               avxEscape | evex512 | evexF2 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x6F,
+       }},
+       {as: AVMOVHLPS, ytab: _yvmovhlps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x12,
+               avxEscape | evex128 | evex0F | evexW0, 0, 0x12,
+       }},
+       {as: AVMOVHPD, ytab: _yvmovhpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x17,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x16,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x17,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x16,
+       }},
+       {as: AVMOVHPS, ytab: _yvmovhpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x17,
+               avxEscape | vex128 | vex0F | vexW0, 0x16,
+               avxEscape | evex128 | evex0F | evexW0, evexN8, 0x17,
+               avxEscape | evex128 | evex0F | evexW0, evexN8, 0x16,
+       }},
+       {as: AVMOVLHPS, ytab: _yvmovhlps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x16,
+               avxEscape | evex128 | evex0F | evexW0, 0, 0x16,
+       }},
+       {as: AVMOVLPD, ytab: _yvmovhpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x13,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x12,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x13,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x12,
+       }},
+       {as: AVMOVLPS, ytab: _yvmovhpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x13,
+               avxEscape | vex128 | vex0F | vexW0, 0x12,
+               avxEscape | evex128 | evex0F | evexW0, evexN8, 0x13,
+               avxEscape | evex128 | evex0F | evexW0, evexN8, 0x12,
+       }},
+       {as: AVMOVMSKPD, ytab: _yvmovmskpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x50,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x50,
+       }},
+       {as: AVMOVMSKPS, ytab: _yvmovmskpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x50,
+               avxEscape | vex256 | vex0F | vexW0, 0x50,
+       }},
+       {as: AVMOVNTDQ, ytab: _yvmovntdq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE7,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE7,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0xE7,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0xE7,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0xE7,
+       }},
+       {as: AVMOVNTDQA, ytab: _yvmovntdqa, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2A,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2A,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0x2A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0x2A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0x2A,
+       }},
+       {as: AVMOVNTPD, ytab: _yvmovntdq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x2B,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x2B,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16, 0x2B,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32, 0x2B,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64, 0x2B,
+       }},
+       {as: AVMOVNTPS, ytab: _yvmovntdq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x2B,
+               avxEscape | vex256 | vex0F | vexW0, 0x2B,
+               avxEscape | evex128 | evex0F | evexW0, evexN16, 0x2B,
+               avxEscape | evex256 | evex0F | evexW0, evexN32, 0x2B,
+               avxEscape | evex512 | evex0F | evexW0, evexN64, 0x2B,
+       }},
+       {as: AVMOVQ, ytab: _yvmovq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x7E,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD6,
+               avxEscape | vex128 | vex66 | vex0F | vexW1, 0x6E,
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x7E,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x7E,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0xD6,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8, 0x6E,
+               avxEscape | evex128 | evexF3 | evex0F | evexW1, evexN8, 0x7E,
+       }},
+       {as: AVMOVSD, ytab: _yvmovsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x10,
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x10,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexZeroingEnabled, 0x11,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8, 0x11,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexZeroingEnabled, 0x10,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexZeroingEnabled, 0x10,
+       }},
+       {as: AVMOVSHDUP, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x16,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x16,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x16,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x16,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x16,
+       }},
+       {as: AVMOVSLDUP, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x12,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x12,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x12,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x12,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x12,
+       }},
+       {as: AVMOVSS, ytab: _yvmovsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x10,
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x10,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexZeroingEnabled, 0x11,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4, 0x11,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexZeroingEnabled, 0x10,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexZeroingEnabled, 0x10,
+       }},
+       {as: AVMOVUPD, ytab: _yvmovapd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x11,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x10,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x10,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x11,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x11,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x11,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0x10,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexZeroingEnabled, 0x10,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexZeroingEnabled, 0x10,
+       }},
+       {as: AVMOVUPS, ytab: _yvmovapd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x11,
+               avxEscape | vex256 | vex0F | vexW0, 0x11,
+               avxEscape | vex128 | vex0F | vexW0, 0x10,
+               avxEscape | vex256 | vex0F | vexW0, 0x10,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x11,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x11,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x11,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x10,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x10,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x10,
+       }},
+       {as: AVMPSADBW, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x42,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x42,
+       }},
+       {as: AVMULPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x59,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x59,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x59,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x59,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVMULPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x59,
+               avxEscape | vex256 | vex0F | vexW0, 0x59,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x59,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x59,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVMULSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x59,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVMULSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x59,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVORPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x56,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x56,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x56,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x56,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x56,
+       }},
+       {as: AVORPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x56,
+               avxEscape | vex256 | vex0F | vexW0, 0x56,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x56,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x56,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x56,
+       }},
+       {as: AVP4DPWSSD, ytab: _yv4fmaddps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x52,
+       }},
+       {as: AVP4DPWSSDS, ytab: _yv4fmaddps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evexF2 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x53,
+       }},
+       {as: AVPABSB, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x1C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x1C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x1C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x1C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x1C,
+       }},
+       {as: AVPABSD, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x1E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x1E,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x1E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x1E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x1E,
+       }},
+       {as: AVPABSQ, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x1F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x1F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x1F,
+       }},
+       {as: AVPABSW, ytab: _yvmovddup, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x1D,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x1D,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x1D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x1D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x1D,
+       }},
+       {as: AVPACKSSDW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6B,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x6B,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x6B,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x6B,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x6B,
+       }},
+       {as: AVPACKSSWB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x63,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x63,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x63,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x63,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x63,
+       }},
+       {as: AVPACKUSDW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x2B,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x2B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x2B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x2B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x2B,
+       }},
+       {as: AVPACKUSWB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x67,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x67,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x67,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x67,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x67,
+       }},
+       {as: AVPADDB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xFC,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xFC,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xFC,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xFC,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xFC,
+       }},
+       {as: AVPADDD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xFE,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xFE,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xFE,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xFE,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xFE,
+       }},
+       {as: AVPADDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD4,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD4,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xD4,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xD4,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xD4,
+       }},
+       {as: AVPADDSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xEC,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xEC,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xEC,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xEC,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xEC,
+       }},
+       {as: AVPADDSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xED,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xED,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xED,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xED,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xED,
+       }},
+       {as: AVPADDUSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDC,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDC,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xDC,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xDC,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xDC,
+       }},
+       {as: AVPADDUSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDD,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDD,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xDD,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xDD,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xDD,
+       }},
+       {as: AVPADDW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xFD,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xFD,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xFD,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xFD,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xFD,
+       }},
+       {as: AVPALIGNR, ytab: _yvgf2p8affineinvqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0F,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x0F,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexZeroingEnabled, 0x0F,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexZeroingEnabled, 0x0F,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexZeroingEnabled, 0x0F,
+       }},
+       {as: AVPAND, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDB,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDB,
+       }},
+       {as: AVPANDD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xDB,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xDB,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xDB,
+       }},
+       {as: AVPANDN, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDF,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDF,
+       }},
+       {as: AVPANDND, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xDF,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xDF,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xDF,
+       }},
+       {as: AVPANDNQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xDF,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xDF,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xDF,
+       }},
+       {as: AVPANDQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xDB,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xDB,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xDB,
+       }},
+       {as: AVPAVGB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE0,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE0,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE0,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE0,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE0,
+       }},
+       {as: AVPAVGW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE3,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE3,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE3,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE3,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE3,
+       }},
+       {as: AVPBLENDD, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x02,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x02,
+       }},
+       {as: AVPBLENDMB, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x66,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x66,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x66,
+       }},
+       {as: AVPBLENDMD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x64,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x64,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x64,
+       }},
+       {as: AVPBLENDMQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x64,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x64,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x64,
+       }},
+       {as: AVPBLENDMW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x66,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x66,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x66,
+       }},
+       {as: AVPBLENDVB, ytab: _yvblendvpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x4C,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x4C,
+       }},
+       {as: AVPBLENDW, ytab: _yvblendpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0E,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x0E,
+       }},
+       {as: AVPBROADCASTB, ytab: _yvpbroadcastb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x78,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x78,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7A,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x78,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x78,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x78,
+       }},
+       {as: AVPBROADCASTD, ytab: _yvpbroadcastb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x58,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x58,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x58,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x58,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x58,
+       }},
+       {as: AVPBROADCASTMB2Q, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, 0, 0x2A,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, 0, 0x2A,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, 0, 0x2A,
+       }},
+       {as: AVPBROADCASTMW2D, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, 0, 0x3A,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, 0, 0x3A,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, 0, 0x3A,
+       }},
+       {as: AVPBROADCASTQ, ytab: _yvpbroadcastb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x59,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x59,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexZeroingEnabled, 0x7C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexZeroingEnabled, 0x7C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexZeroingEnabled, 0x7C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x59,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x59,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x59,
+       }},
+       {as: AVPBROADCASTW, ytab: _yvpbroadcastb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x79,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x79,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexZeroingEnabled, 0x7B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x79,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x79,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x79,
+       }},
+       {as: AVPCLMULQDQ, ytab: _yvpclmulqdq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x44,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x44,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16, 0x44,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32, 0x44,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64, 0x44,
+       }},
+       {as: AVPCMPB, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16, 0x3F,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32, 0x3F,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64, 0x3F,
+       }},
+       {as: AVPCMPD, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4, 0x1F,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4, 0x1F,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4, 0x1F,
+       }},
+       {as: AVPCMPEQB, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x74,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x74,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x74,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x74,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x74,
+       }},
+       {as: AVPCMPEQD, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x76,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x76,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4, 0x76,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4, 0x76,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4, 0x76,
+       }},
+       {as: AVPCMPEQQ, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x29,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x29,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8, 0x29,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8, 0x29,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8, 0x29,
+       }},
+       {as: AVPCMPEQW, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x75,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x75,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x75,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x75,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x75,
+       }},
+       {as: AVPCMPESTRI, ytab: _yvaeskeygenassist, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexWIG, 0x61,
+       }},
+       {as: AVPCMPESTRM, ytab: _yvaeskeygenassist, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexWIG, 0x60,
+       }},
+       {as: AVPCMPGTB, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x64,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x64,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x64,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x64,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x64,
+       }},
+       {as: AVPCMPGTD, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x66,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x66,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4, 0x66,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4, 0x66,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4, 0x66,
+       }},
+       {as: AVPCMPGTQ, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x37,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x37,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8, 0x37,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8, 0x37,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8, 0x37,
+       }},
+       {as: AVPCMPGTW, ytab: _yvpcmpeqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x65,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x65,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x65,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x65,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x65,
+       }},
+       {as: AVPCMPISTRI, ytab: _yvaeskeygenassist, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexWIG, 0x63,
+       }},
+       {as: AVPCMPISTRM, ytab: _yvaeskeygenassist, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x62,
+       }},
+       {as: AVPCMPQ, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8, 0x1F,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8, 0x1F,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8, 0x1F,
+       }},
+       {as: AVPCMPUB, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16, 0x3E,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32, 0x3E,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64, 0x3E,
+       }},
+       {as: AVPCMPUD, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4, 0x1E,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4, 0x1E,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4, 0x1E,
+       }},
+       {as: AVPCMPUQ, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8, 0x1E,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8, 0x1E,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8, 0x1E,
+       }},
+       {as: AVPCMPUW, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16, 0x3E,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32, 0x3E,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64, 0x3E,
+       }},
+       {as: AVPCMPW, ytab: _yvpcmpb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16, 0x3F,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32, 0x3F,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64, 0x3F,
+       }},
+       {as: AVPCOMPRESSB, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x63,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x63,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x63,
+       }},
+       {as: AVPCOMPRESSD, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x8B,
+       }},
+       {as: AVPCOMPRESSQ, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x8B,
+       }},
+       {as: AVPCOMPRESSW, ytab: _yvcompresspd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x63,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x63,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x63,
+       }},
+       {as: AVPCONFLICTD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xC4,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xC4,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xC4,
+       }},
+       {as: AVPCONFLICTQ, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xC4,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xC4,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xC4,
+       }},
+       {as: AVPDPBUSD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x50,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x50,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x50,
+       }},
+       {as: AVPDPBUSDS, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x51,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x51,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVPDPWSSD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x52,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x52,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x52,
+       }},
+       {as: AVPDPWSSDS, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x53,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x53,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x53,
+       }},
+       {as: AVPERM2F128, ytab: _yvperm2f128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x06,
+       }},
+       {as: AVPERM2I128, ytab: _yvperm2f128, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x46,
+       }},
+       {as: AVPERMB, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x8D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x8D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x8D,
+       }},
+       {as: AVPERMD, ytab: _yvpermd, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x36,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x36,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x36,
+       }},
+       {as: AVPERMI2B, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x75,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x75,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x75,
+       }},
+       {as: AVPERMI2D, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x76,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x76,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x76,
+       }},
+       {as: AVPERMI2PD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x77,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x77,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x77,
+       }},
+       {as: AVPERMI2PS, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x77,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x77,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x77,
+       }},
+       {as: AVPERMI2Q, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x76,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x76,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x76,
+       }},
+       {as: AVPERMI2W, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x75,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x75,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x75,
+       }},
+       {as: AVPERMILPD, ytab: _yvpermilpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x05,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x05,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0D,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0D,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x05,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x05,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x05,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x0D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x0D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x0D,
+       }},
+       {as: AVPERMILPS, ytab: _yvpermilpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x04,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x04,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0C,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x04,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x04,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x04,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x0C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x0C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x0C,
+       }},
+       {as: AVPERMPD, ytab: _yvpermq, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW1, 0x01,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x01,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x01,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x16,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x16,
+       }},
+       {as: AVPERMPS, ytab: _yvpermd, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x16,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x16,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x16,
+       }},
+       {as: AVPERMQ, ytab: _yvpermq, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex66 | vex0F3A | vexW1, 0x00,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x00,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x00,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x36,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x36,
+       }},
+       {as: AVPERMT2B, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x7D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x7D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x7D,
+       }},
+       {as: AVPERMT2D, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x7E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x7E,
+       }},
+       {as: AVPERMT2PD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x7F,
+       }},
+       {as: AVPERMT2PS, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x7F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x7F,
+       }},
+       {as: AVPERMT2Q, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x7E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x7E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x7E,
+       }},
+       {as: AVPERMT2W, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x7D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x7D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x7D,
+       }},
+       {as: AVPERMW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x8D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x8D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x8D,
+       }},
+       {as: AVPEXPANDB, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x62,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x62,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN1 | evexZeroingEnabled, 0x62,
+       }},
+       {as: AVPEXPANDD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x89,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x89,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x89,
+       }},
+       {as: AVPEXPANDQ, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x89,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x89,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x89,
+       }},
+       {as: AVPEXPANDW, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x62,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x62,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN2 | evexZeroingEnabled, 0x62,
+       }},
+       {as: AVPEXTRB, ytab: _yvextractps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x14,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN1, 0x14,
+       }},
+       {as: AVPEXTRD, ytab: _yvextractps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x16,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4, 0x16,
+       }},
+       {as: AVPEXTRQ, ytab: _yvextractps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x16,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8, 0x16,
+       }},
+       {as: AVPEXTRW, ytab: _yvpextrw, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x15,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xC5,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN2, 0x15,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, 0, 0xC5,
+       }},
+       {as: AVPGATHERDD, ytab: _yvgatherdps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x90,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x90,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0x90,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0x90,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0x90,
+       }},
+       {as: AVPGATHERDQ, ytab: _yvgatherdpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x90,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x90,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0x90,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0x90,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0x90,
+       }},
+       {as: AVPGATHERQD, ytab: _yvgatherqps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x91,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x91,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0x91,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0x91,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0x91,
+       }},
+       {as: AVPGATHERQQ, ytab: _yvgatherdps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x91,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x91,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0x91,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0x91,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0x91,
+       }},
+       {as: AVPHADDD, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x02,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x02,
+       }},
+       {as: AVPHADDSW, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x03,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x03,
+       }},
+       {as: AVPHADDW, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x01,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x01,
+       }},
+       {as: AVPHMINPOSUW, ytab: _yvaesimc, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x41,
+       }},
+       {as: AVPHSUBD, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x06,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x06,
+       }},
+       {as: AVPHSUBSW, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x07,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x07,
+       }},
+       {as: AVPHSUBW, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x05,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x05,
+       }},
+       {as: AVPINSRB, ytab: _yvpinsrb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x20,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN1, 0x20,
+       }},
+       {as: AVPINSRD, ytab: _yvpinsrb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x22,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4, 0x22,
+       }},
+       {as: AVPINSRQ, ytab: _yvpinsrb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW1, 0x22,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8, 0x22,
+       }},
+       {as: AVPINSRW, ytab: _yvpinsrb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xC4,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN2, 0xC4,
+       }},
+       {as: AVPLZCNTD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x44,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x44,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x44,
+       }},
+       {as: AVPLZCNTQ, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x44,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x44,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x44,
+       }},
+       {as: AVPMADD52HUQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xB5,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xB5,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xB5,
+       }},
+       {as: AVPMADD52LUQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xB4,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xB4,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xB4,
+       }},
+       {as: AVPMADDUBSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x04,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x04,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x04,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x04,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x04,
+       }},
+       {as: AVPMADDWD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF5,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF5,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF5,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xF5,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xF5,
+       }},
+       {as: AVPMASKMOVD, ytab: _yvmaskmovpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x8E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x8E,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x8C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x8C,
+       }},
+       {as: AVPMASKMOVQ, ytab: _yvmaskmovpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x8E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x8E,
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x8C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x8C,
+       }},
+       {as: AVPMAXSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3C,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x3C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x3C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x3C,
+       }},
+       {as: AVPMAXSD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3D,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3D,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x3D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x3D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x3D,
+       }},
+       {as: AVPMAXSQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x3D,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x3D,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x3D,
+       }},
+       {as: AVPMAXSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xEE,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xEE,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xEE,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xEE,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xEE,
+       }},
+       {as: AVPMAXUB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDE,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDE,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xDE,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xDE,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xDE,
+       }},
+       {as: AVPMAXUD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3F,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3F,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x3F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x3F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x3F,
+       }},
+       {as: AVPMAXUQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x3F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x3F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x3F,
+       }},
+       {as: AVPMAXUW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3E,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x3E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x3E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x3E,
+       }},
+       {as: AVPMINSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x38,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x38,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x38,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x38,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x38,
+       }},
+       {as: AVPMINSD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x39,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x39,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x39,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x39,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x39,
+       }},
+       {as: AVPMINSQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x39,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x39,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x39,
+       }},
+       {as: AVPMINSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xEA,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xEA,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xEA,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xEA,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xEA,
+       }},
+       {as: AVPMINUB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xDA,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xDA,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xDA,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xDA,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xDA,
+       }},
+       {as: AVPMINUD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3B,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x3B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x3B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x3B,
+       }},
+       {as: AVPMINUQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x3B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x3B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x3B,
+       }},
+       {as: AVPMINUW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x3A,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x3A,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x3A,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x3A,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x3A,
+       }},
+       {as: AVPMOVB2M, ytab: _yvpmovb2m, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, 0, 0x29,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, 0, 0x29,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, 0, 0x29,
+       }},
+       {as: AVPMOVD2M, ytab: _yvpmovb2m, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, 0, 0x39,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, 0, 0x39,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, 0, 0x39,
+       }},
+       {as: AVPMOVDB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x31,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x31,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x31,
+       }},
+       {as: AVPMOVDW, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x33,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x33,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x33,
+       }},
+       {as: AVPMOVM2B, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, 0, 0x28,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, 0, 0x28,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, 0, 0x28,
+       }},
+       {as: AVPMOVM2D, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, 0, 0x38,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, 0, 0x38,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, 0, 0x38,
+       }},
+       {as: AVPMOVM2Q, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, 0, 0x38,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, 0, 0x38,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, 0, 0x38,
+       }},
+       {as: AVPMOVM2W, ytab: _yvpbroadcastmb2q, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, 0, 0x28,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, 0, 0x28,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, 0, 0x28,
+       }},
+       {as: AVPMOVMSKB, ytab: _yvmovmskpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD7,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD7,
+       }},
+       {as: AVPMOVQ2M, ytab: _yvpmovb2m, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, 0, 0x39,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, 0, 0x39,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, 0, 0x39,
+       }},
+       {as: AVPMOVQB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x32,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x32,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x32,
+       }},
+       {as: AVPMOVQD, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x35,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x35,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x35,
+       }},
+       {as: AVPMOVQW, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x34,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x34,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x34,
+       }},
+       {as: AVPMOVSDB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x21,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x21,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x21,
+       }},
+       {as: AVPMOVSDW, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x23,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x23,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x23,
+       }},
+       {as: AVPMOVSQB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x22,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x22,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x22,
+       }},
+       {as: AVPMOVSQD, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x25,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x25,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x25,
+       }},
+       {as: AVPMOVSQW, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x24,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x24,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x24,
+       }},
+       {as: AVPMOVSWB, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x20,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x20,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x20,
+       }},
+       {as: AVPMOVSXBD, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x21,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x21,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x21,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x21,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x21,
+       }},
+       {as: AVPMOVSXBQ, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x22,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x22,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x22,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x22,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x22,
+       }},
+       {as: AVPMOVSXBW, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x20,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x20,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x20,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x20,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x20,
+       }},
+       {as: AVPMOVSXDQ, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x25,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x25,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x25,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x25,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x25,
+       }},
+       {as: AVPMOVSXWD, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x23,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x23,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x23,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x23,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x23,
+       }},
+       {as: AVPMOVSXWQ, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x24,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x24,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x24,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x24,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x24,
+       }},
+       {as: AVPMOVUSDB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x11,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x11,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x11,
+       }},
+       {as: AVPMOVUSDW, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x13,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x13,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x13,
+       }},
+       {as: AVPMOVUSQB, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x12,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x12,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x12,
+       }},
+       {as: AVPMOVUSQD, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x15,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x15,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x15,
+       }},
+       {as: AVPMOVUSQW, ytab: _yvpmovdb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x14,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x14,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x14,
+       }},
+       {as: AVPMOVUSWB, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x10,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x10,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x10,
+       }},
+       {as: AVPMOVW2M, ytab: _yvpmovb2m, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, 0, 0x29,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, 0, 0x29,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, 0, 0x29,
+       }},
+       {as: AVPMOVWB, ytab: _yvpmovdw, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x30,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x30,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x30,
+       }},
+       {as: AVPMOVZXBD, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x31,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x31,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x31,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x31,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x31,
+       }},
+       {as: AVPMOVZXBQ, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x32,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x32,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN2 | evexZeroingEnabled, 0x32,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x32,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x32,
+       }},
+       {as: AVPMOVZXBW, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x30,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x30,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x30,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x30,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x30,
+       }},
+       {as: AVPMOVZXDQ, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x35,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x35,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x35,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x35,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x35,
+       }},
+       {as: AVPMOVZXWD, ytab: _yvcvtdq2pd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x33,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x33,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x33,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x33,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x33,
+       }},
+       {as: AVPMOVZXWQ, ytab: _yvbroadcastss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x34,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x34,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x34,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN8 | evexZeroingEnabled, 0x34,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x34,
+       }},
+       {as: AVPMULDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x28,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x28,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x28,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x28,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x28,
+       }},
+       {as: AVPMULHRSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0B,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0B,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x0B,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x0B,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x0B,
+       }},
+       {as: AVPMULHUW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE4,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE4,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE4,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE4,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE4,
+       }},
+       {as: AVPMULHW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE5,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE5,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE5,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE5,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE5,
+       }},
+       {as: AVPMULLD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x40,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x40,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x40,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x40,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x40,
+       }},
+       {as: AVPMULLQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x40,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x40,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x40,
+       }},
+       {as: AVPMULLW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD5,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD5,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD5,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xD5,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xD5,
+       }},
+       {as: AVPMULTISHIFTQB, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x83,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x83,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x83,
+       }},
+       {as: AVPMULUDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF4,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF4,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xF4,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xF4,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xF4,
+       }},
+       {as: AVPOPCNTB, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x54,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVPOPCNTD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x55,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x55,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVPOPCNTQ, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x55,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x55,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x55,
+       }},
+       {as: AVPOPCNTW, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x54,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x54,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x54,
+       }},
+       {as: AVPOR, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xEB,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xEB,
+       }},
+       {as: AVPORD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xEB,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xEB,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xEB,
+       }},
+       {as: AVPORQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xEB,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xEB,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xEB,
+       }},
+       {as: AVPROLD, ytab: _yvprold, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x72, 01,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x72, 01,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x72, 01,
+       }},
+       {as: AVPROLQ, ytab: _yvprold, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x72, 01,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x72, 01,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x72, 01,
+       }},
+       {as: AVPROLVD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x15,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x15,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x15,
+       }},
+       {as: AVPROLVQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x15,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x15,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x15,
+       }},
+       {as: AVPRORD, ytab: _yvprold, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x72, 00,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x72, 00,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x72, 00,
+       }},
+       {as: AVPRORQ, ytab: _yvprold, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x72, 00,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x72, 00,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x72, 00,
+       }},
+       {as: AVPRORVD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x14,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x14,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x14,
+       }},
+       {as: AVPRORVQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x14,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x14,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x14,
+       }},
+       {as: AVPSADBW, ytab: _yvaesdec, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF6,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF6,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0xF6,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0xF6,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0xF6,
+       }},
+       {as: AVPSCATTERDD, ytab: _yvpscatterdd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0xA0,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0xA0,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xA0,
+       }},
+       {as: AVPSCATTERDQ, ytab: _yvpscatterdq, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0xA0,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0xA0,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xA0,
+       }},
+       {as: AVPSCATTERQD, ytab: _yvpscatterqd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0xA1,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0xA1,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xA1,
+       }},
+       {as: AVPSCATTERQQ, ytab: _yvpscatterdd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0xA1,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0xA1,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xA1,
+       }},
+       {as: AVPSHLDD, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x71,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x71,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x71,
+       }},
+       {as: AVPSHLDQ, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x71,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x71,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x71,
+       }},
+       {as: AVPSHLDVD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x71,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x71,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x71,
+       }},
+       {as: AVPSHLDVQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x71,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x71,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x71,
+       }},
+       {as: AVPSHLDVW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x70,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x70,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x70,
+       }},
+       {as: AVPSHLDW, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x70,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x70,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexZeroingEnabled, 0x70,
+       }},
+       {as: AVPSHRDD, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x73,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x73,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x73,
+       }},
+       {as: AVPSHRDQ, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x73,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x73,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x73,
+       }},
+       {as: AVPSHRDVD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x73,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x73,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x73,
+       }},
+       {as: AVPSHRDVQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x73,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x73,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x73,
+       }},
+       {as: AVPSHRDVW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x72,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x72,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x72,
+       }},
+       {as: AVPSHRDW, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexZeroingEnabled, 0x72,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexZeroingEnabled, 0x72,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexZeroingEnabled, 0x72,
+       }},
+       {as: AVPSHUFB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x00,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x00,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexZeroingEnabled, 0x00,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexZeroingEnabled, 0x00,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexZeroingEnabled, 0x00,
+       }},
+       {as: AVPSHUFBITQMB, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0x8F,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0x8F,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0x8F,
+       }},
+       {as: AVPSHUFD, ytab: _yvpshufd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x70,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x70,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x70,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x70,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x70,
+       }},
+       {as: AVPSHUFHW, ytab: _yvpshufd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x70,
+               avxEscape | vex256 | vexF3 | vex0F | vexW0, 0x70,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x70,
+               avxEscape | evex256 | evexF3 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x70,
+               avxEscape | evex512 | evexF3 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x70,
+       }},
+       {as: AVPSHUFLW, ytab: _yvpshufd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x70,
+               avxEscape | vex256 | vexF2 | vex0F | vexW0, 0x70,
+               avxEscape | evex128 | evexF2 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x70,
+               avxEscape | evex256 | evexF2 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x70,
+               avxEscape | evex512 | evexF2 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x70,
+       }},
+       {as: AVPSIGNB, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x08,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x08,
+       }},
+       {as: AVPSIGND, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0A,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0A,
+       }},
+       {as: AVPSIGNW, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x09,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x09,
+       }},
+       {as: AVPSLLD, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x72, 06,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x72, 06,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF2,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF2,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x72, 06,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x72, 06,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x72, 06,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF2,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF2,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF2,
+       }},
+       {as: AVPSLLDQ, ytab: _yvpslldq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x73, 07,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x73, 07,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x73, 07,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x73, 07,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x73, 07,
+       }},
+       {as: AVPSLLQ, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x73, 06,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x73, 06,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF3,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF3,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x73, 06,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x73, 06,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x73, 06,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xF3,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xF3,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xF3,
+       }},
+       {as: AVPSLLVD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x47,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x47,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x47,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x47,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x47,
+       }},
+       {as: AVPSLLVQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x47,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x47,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x47,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x47,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x47,
+       }},
+       {as: AVPSLLVW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x12,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x12,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x12,
+       }},
+       {as: AVPSLLW, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x71, 06,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x71, 06,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF1,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF1,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x71, 06,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x71, 06,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x71, 06,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF1,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF1,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF1,
+       }},
+       {as: AVPSRAD, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x72, 04,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x72, 04,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE2,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE2,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE2,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE2,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE2,
+       }},
+       {as: AVPSRAQ, ytab: _yvpsraq, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x72, 04,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xE2,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xE2,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xE2,
+       }},
+       {as: AVPSRAVD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x46,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x46,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x46,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x46,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x46,
+       }},
+       {as: AVPSRAVQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x46,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x46,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x46,
+       }},
+       {as: AVPSRAVW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x11,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x11,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x11,
+       }},
+       {as: AVPSRAW, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x71, 04,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x71, 04,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE1,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE1,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x71, 04,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x71, 04,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x71, 04,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE1,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE1,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE1,
+       }},
+       {as: AVPSRLD, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x72, 02,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x72, 02,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD2,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD2,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x72, 02,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x72, 02,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x72, 02,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD2,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD2,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD2,
+       }},
+       {as: AVPSRLDQ, ytab: _yvpslldq, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x73, 03,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x73, 03,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16, 0x73, 03,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32, 0x73, 03,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64, 0x73, 03,
+       }},
+       {as: AVPSRLQ, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x73, 02,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x73, 02,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD3,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD3,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x73, 02,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x73, 02,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x73, 02,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xD3,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xD3,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN16 | evexZeroingEnabled, 0xD3,
+       }},
+       {as: AVPSRLVD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x45,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x45,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x45,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x45,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x45,
+       }},
+       {as: AVPSRLVQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW1, 0x45,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW1, 0x45,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x45,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x45,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x45,
+       }},
+       {as: AVPSRLVW, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexZeroingEnabled, 0x10,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexZeroingEnabled, 0x10,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexZeroingEnabled, 0x10,
+       }},
+       {as: AVPSRLW, ytab: _yvpslld, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x71, 02,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x71, 02,
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD1,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD1,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x71, 02,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x71, 02,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x71, 02,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD1,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD1,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD1,
+       }},
+       {as: AVPSUBB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF8,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF8,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF8,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xF8,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xF8,
+       }},
+       {as: AVPSUBD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xFA,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xFA,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xFA,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xFA,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xFA,
+       }},
+       {as: AVPSUBQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xFB,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xFB,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xFB,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xFB,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xFB,
+       }},
+       {as: AVPSUBSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE8,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE8,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE8,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE8,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE8,
+       }},
+       {as: AVPSUBSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xE9,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xE9,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xE9,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xE9,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xE9,
+       }},
+       {as: AVPSUBUSB, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD8,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD8,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD8,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xD8,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xD8,
+       }},
+       {as: AVPSUBUSW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xD9,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xD9,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xD9,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xD9,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xD9,
+       }},
+       {as: AVPSUBW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xF9,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xF9,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0xF9,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0xF9,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0xF9,
+       }},
+       {as: AVPTERNLOGD, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x25,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x25,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x25,
+       }},
+       {as: AVPTERNLOGQ, ytab: _yvalignd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x25,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x25,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x25,
+       }},
+       {as: AVPTEST, ytab: _yvptest, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x17,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x17,
+       }},
+       {as: AVPTESTMB, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16, 0x26,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32, 0x26,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64, 0x26,
+       }},
+       {as: AVPTESTMD, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4, 0x27,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4, 0x27,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4, 0x27,
+       }},
+       {as: AVPTESTMQ, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8, 0x27,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8, 0x27,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8, 0x27,
+       }},
+       {as: AVPTESTMW, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16, 0x26,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32, 0x26,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64, 0x26,
+       }},
+       {as: AVPTESTNMB, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN16, 0x26,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN32, 0x26,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN64, 0x26,
+       }},
+       {as: AVPTESTNMD, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW0, evexN16 | evexBcstN4, 0x27,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW0, evexN32 | evexBcstN4, 0x27,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW0, evexN64 | evexBcstN4, 0x27,
+       }},
+       {as: AVPTESTNMQ, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, evexN16 | evexBcstN8, 0x27,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, evexN32 | evexBcstN8, 0x27,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, evexN64 | evexBcstN8, 0x27,
+       }},
+       {as: AVPTESTNMW, ytab: _yvpshufbitqmb, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evexF3 | evex0F38 | evexW1, evexN16, 0x26,
+               avxEscape | evex256 | evexF3 | evex0F38 | evexW1, evexN32, 0x26,
+               avxEscape | evex512 | evexF3 | evex0F38 | evexW1, evexN64, 0x26,
+       }},
+       {as: AVPUNPCKHBW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x68,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x68,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x68,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x68,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x68,
+       }},
+       {as: AVPUNPCKHDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6A,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x6A,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x6A,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x6A,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x6A,
+       }},
+       {as: AVPUNPCKHQDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6D,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x6D,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x6D,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x6D,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x6D,
+       }},
+       {as: AVPUNPCKHWD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x69,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x69,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x69,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x69,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x69,
+       }},
+       {as: AVPUNPCKLBW, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x60,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x60,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x60,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x60,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x60,
+       }},
+       {as: AVPUNPCKLDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x62,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x62,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x62,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x62,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x62,
+       }},
+       {as: AVPUNPCKLQDQ, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x6C,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x6C,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x6C,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x6C,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x6C,
+       }},
+       {as: AVPUNPCKLWD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x61,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x61,
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexZeroingEnabled, 0x61,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexZeroingEnabled, 0x61,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexZeroingEnabled, 0x61,
+       }},
+       {as: AVPXOR, ytab: _yvaddsubpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xEF,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xEF,
+       }},
+       {as: AVPXORD, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xEF,
+               avxEscape | evex256 | evex66 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xEF,
+               avxEscape | evex512 | evex66 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xEF,
+       }},
+       {as: AVPXORQ, ytab: _yvblendmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xEF,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xEF,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xEF,
+       }},
+       {as: AVRANGEPD, ytab: _yvfixupimmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x50,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x50,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x50,
+       }},
+       {as: AVRANGEPS, ytab: _yvfixupimmpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x50,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x50,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x50,
+       }},
+       {as: AVRANGESD, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVRANGESS, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVRCP14PD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x4C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x4C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x4C,
+       }},
+       {as: AVRCP14PS, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x4C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x4C,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x4C,
+       }},
+       {as: AVRCP14SD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x4D,
+       }},
+       {as: AVRCP14SS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x4D,
+       }},
+       {as: AVRCP28PD, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0xCA,
+       }},
+       {as: AVRCP28PS, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0xCA,
+       }},
+       {as: AVRCP28SD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0xCB,
+       }},
+       {as: AVRCP28SS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0xCB,
+       }},
+       {as: AVRCPPS, ytab: _yvptest, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x53,
+               avxEscape | vex256 | vex0F | vexW0, 0x53,
+       }},
+       {as: AVRCPSS, ytab: _yvrcpss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x53,
+       }},
+       {as: AVREDUCEPD, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x56,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x56,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x56,
+       }},
+       {as: AVREDUCEPS, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x56,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x56,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x56,
+       }},
+       {as: AVREDUCESD, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x57,
+       }},
+       {as: AVREDUCESS, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x57,
+       }},
+       {as: AVRNDSCALEPD, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0x09,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x09,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x09,
+       }},
+       {as: AVRNDSCALEPS, ytab: _yvgetmantpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0x08,
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x08,
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x08,
+       }},
+       {as: AVRNDSCALESD, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0x0B,
+       }},
+       {as: AVRNDSCALESS, ytab: _yvfixupimmsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F3A | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0x0A,
+       }},
+       {as: AVROUNDPD, ytab: _yvroundpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x09,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x09,
+       }},
+       {as: AVROUNDPS, ytab: _yvroundpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x08,
+               avxEscape | vex256 | vex66 | vex0F3A | vexW0, 0x08,
+       }},
+       {as: AVROUNDSD, ytab: _yvdppd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0B,
+       }},
+       {as: AVROUNDSS, ytab: _yvdppd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F3A | vexW0, 0x0A,
+       }},
+       {as: AVRSQRT14PD, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x4E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x4E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x4E,
+       }},
+       {as: AVRSQRT14PS, ytab: _yvexpandpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x4E,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x4E,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x4E,
+       }},
+       {as: AVRSQRT14SD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexZeroingEnabled, 0x4F,
+       }},
+       {as: AVRSQRT14SS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexZeroingEnabled, 0x4F,
+       }},
+       {as: AVRSQRT28PD, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexSaeEnabled | evexZeroingEnabled, 0xCC,
+       }},
+       {as: AVRSQRT28PS, ytab: _yvexp2pd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexSaeEnabled | evexZeroingEnabled, 0xCC,
+       }},
+       {as: AVRSQRT28SD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexSaeEnabled | evexZeroingEnabled, 0xCD,
+       }},
+       {as: AVRSQRT28SS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexSaeEnabled | evexZeroingEnabled, 0xCD,
+       }},
+       {as: AVRSQRTPS, ytab: _yvptest, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x52,
+               avxEscape | vex256 | vex0F | vexW0, 0x52,
+       }},
+       {as: AVRSQRTSS, ytab: _yvrcpss, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x52,
+       }},
+       {as: AVSCALEFPD, ytab: _yvscalefpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x2C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x2C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x2C,
+       }},
+       {as: AVSCALEFPS, ytab: _yvscalefpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x2C,
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x2C,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x2C,
+       }},
+       {as: AVSCALEFSD, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x2D,
+       }},
+       {as: AVSCALEFSS, ytab: _yvgetexpsd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x2D,
+       }},
+       {as: AVSCATTERDPD, ytab: _yvpscatterdq, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0xA2,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0xA2,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xA2,
+       }},
+       {as: AVSCATTERDPS, ytab: _yvpscatterdd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0xA2,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0xA2,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xA2,
+       }},
+       {as: AVSCATTERPF0DPD, ytab: _yvgatherpf0dpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC6, 05,
+       }},
+       {as: AVSCATTERPF0DPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC6, 05,
+       }},
+       {as: AVSCATTERPF0QPD, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC7, 05,
+       }},
+       {as: AVSCATTERPF0QPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC7, 05,
+       }},
+       {as: AVSCATTERPF1DPD, ytab: _yvgatherpf0dpd, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC6, 06,
+       }},
+       {as: AVSCATTERPF1DPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC6, 06,
+       }},
+       {as: AVSCATTERPF1QPD, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xC7, 06,
+       }},
+       {as: AVSCATTERPF1QPS, ytab: _yvgatherpf0dps, prefix: Pavx, op: opBytes{
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xC7, 06,
+       }},
+       {as: AVSCATTERQPD, ytab: _yvpscatterdd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW1, evexN8, 0xA3,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW1, evexN8, 0xA3,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW1, evexN8, 0xA3,
+       }},
+       {as: AVSCATTERQPS, ytab: _yvpscatterqd, prefix: Pavx, op: opBytes{
+               avxEscape | evex128 | evex66 | evex0F38 | evexW0, evexN4, 0xA3,
+               avxEscape | evex256 | evex66 | evex0F38 | evexW0, evexN4, 0xA3,
+               avxEscape | evex512 | evex66 | evex0F38 | evexW0, evexN4, 0xA3,
+       }},
+       {as: AVSHUFF32X4, ytab: _yvshuff32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x23,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x23,
+       }},
+       {as: AVSHUFF64X2, ytab: _yvshuff32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x23,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x23,
+       }},
+       {as: AVSHUFI32X4, ytab: _yvshuff32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x43,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x43,
+       }},
+       {as: AVSHUFI64X2, ytab: _yvshuff32x4, prefix: Pavx, op: opBytes{
+               avxEscape | evex256 | evex66 | evex0F3A | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x43,
+               avxEscape | evex512 | evex66 | evex0F3A | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x43,
+       }},
+       {as: AVSHUFPD, ytab: _yvgf2p8affineinvqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0xC6,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0xC6,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0xC6,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0xC6,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0xC6,
+       }},
+       {as: AVSHUFPS, ytab: _yvgf2p8affineinvqb, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0xC6,
+               avxEscape | vex256 | vex0F | vexW0, 0xC6,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0xC6,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0xC6,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0xC6,
+       }},
+       {as: AVSQRTPD, ytab: _yvcvtdq2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x51,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x51,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x51,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x51,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVSQRTPS, ytab: _yvcvtdq2ps, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x51,
+               avxEscape | vex256 | vex0F | vexW0, 0x51,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x51,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x51,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVSQRTSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x51,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVSQRTSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x51,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x51,
+       }},
+       {as: AVSTMXCSR, ytab: _yvldmxcsr, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0xAE, 03,
+       }},
+       {as: AVSUBPD, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x5C,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x5C,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5C,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x5C,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x5C,
+       }},
+       {as: AVSUBPS, ytab: _yvaddpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x5C,
+               avxEscape | vex256 | vex0F | vexW0, 0x5C,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5C,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x5C,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x5C,
+       }},
+       {as: AVSUBSD, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF2 | vex0F | vexW0, 0x5C,
+               avxEscape | evex128 | evexF2 | evex0F | evexW1, evexN8 | evexRoundingEnabled | evexZeroingEnabled, 0x5C,
+       }},
+       {as: AVSUBSS, ytab: _yvaddsd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vexF3 | vex0F | vexW0, 0x5C,
+               avxEscape | evex128 | evexF3 | evex0F | evexW0, evexN4 | evexRoundingEnabled | evexZeroingEnabled, 0x5C,
+       }},
+       {as: AVTESTPD, ytab: _yvptest, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0F,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0F,
+       }},
+       {as: AVTESTPS, ytab: _yvptest, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F38 | vexW0, 0x0E,
+               avxEscape | vex256 | vex66 | vex0F38 | vexW0, 0x0E,
+       }},
+       {as: AVUCOMISD, ytab: _yvcomisd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x2E,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN8 | evexSaeEnabled, 0x2E,
+       }},
+       {as: AVUCOMISS, ytab: _yvcomisd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x2E,
+               avxEscape | evex128 | evex0F | evexW0, evexN4 | evexSaeEnabled, 0x2E,
+       }},
+       {as: AVUNPCKHPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x15,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x15,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x15,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x15,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x15,
+       }},
+       {as: AVUNPCKHPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x15,
+               avxEscape | vex256 | vex0F | vexW0, 0x15,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x15,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x15,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x15,
+       }},
+       {as: AVUNPCKLPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x14,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x14,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x14,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x14,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x14,
+       }},
+       {as: AVUNPCKLPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x14,
+               avxEscape | vex256 | vex0F | vexW0, 0x14,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x14,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x14,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x14,
+       }},
+       {as: AVXORPD, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex66 | vex0F | vexW0, 0x57,
+               avxEscape | vex256 | vex66 | vex0F | vexW0, 0x57,
+               avxEscape | evex128 | evex66 | evex0F | evexW1, evexN16 | evexBcstN8 | evexZeroingEnabled, 0x57,
+               avxEscape | evex256 | evex66 | evex0F | evexW1, evexN32 | evexBcstN8 | evexZeroingEnabled, 0x57,
+               avxEscape | evex512 | evex66 | evex0F | evexW1, evexN64 | evexBcstN8 | evexZeroingEnabled, 0x57,
+       }},
+       {as: AVXORPS, ytab: _yvandnpd, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x57,
+               avxEscape | vex256 | vex0F | vexW0, 0x57,
+               avxEscape | evex128 | evex0F | evexW0, evexN16 | evexBcstN4 | evexZeroingEnabled, 0x57,
+               avxEscape | evex256 | evex0F | evexW0, evexN32 | evexBcstN4 | evexZeroingEnabled, 0x57,
+               avxEscape | evex512 | evex0F | evexW0, evexN64 | evexBcstN4 | evexZeroingEnabled, 0x57,
+       }},
+       {as: AVZEROALL, ytab: _yvzeroall, prefix: Pavx, op: opBytes{
+               avxEscape | vex256 | vex0F | vexW0, 0x77,
+       }},
+       {as: AVZEROUPPER, ytab: _yvzeroall, prefix: Pavx, op: opBytes{
+               avxEscape | vex128 | vex0F | vexW0, 0x77,
+       }},
+}
diff --git a/src/cmd/internal/obj/x86/evex.go b/src/cmd/internal/obj/x86/evex.go
new file mode 100644 (file)
index 0000000..30c0e62
--- /dev/null
@@ -0,0 +1,382 @@
+// Copyright 2018 The Go Authors. All rights reserved.
+// Use of this source code is governed by a BSD-style
+// license that can be found in the LICENSE file.
+
+package x86
+
+import (
+       "cmd/internal/obj"
+       "errors"
+       "fmt"
+       "strings"
+)
+
+// evexBits stores EVEX prefix info that is used during instruction encoding.
+type evexBits struct {
+       b1 byte // [W1mmLLpp]
+       b2 byte // [NNNbbZRS]
+
+       // Associated instruction opcode.
+       opcode byte
+}
+
+// newEVEXBits creates evexBits object from enc bytes at z position.
+func newEVEXBits(z int, enc *opBytes) evexBits {
+       return evexBits{
+               b1:     enc[z+0],
+               b2:     enc[z+1],
+               opcode: enc[z+2],
+       }
+}
+
+// P returns EVEX.pp value.
+func (evex evexBits) P() byte { return (evex.b1 & evexP) >> 0 }
+
+// L returns EVEX.L'L value.
+func (evex evexBits) L() byte { return (evex.b1 & evexL) >> 2 }
+
+// M returns EVEX.mm value.
+func (evex evexBits) M() byte { return (evex.b1 & evexM) >> 4 }
+
+// W returns EVEX.W value.
+func (evex evexBits) W() byte { return (evex.b1 & evexW) >> 7 }
+
+// BroadcastEnabled reports whether BCST suffix is permitted.
+func (evex evexBits) BroadcastEnabled() bool {
+       return evex.b2&evexBcst != 0
+}
+
+// ZeroingEnabled reports whether Z suffix is permitted.
+func (evex evexBits) ZeroingEnabled() bool {
+       return (evex.b2&evexZeroing)>>2 != 0
+}
+
+// RoundingEnabled reports whether RN_SAE, RZ_SAE, RD_SAE and RU_SAE suffixes
+// are permitted.
+func (evex evexBits) RoundingEnabled() bool {
+       return (evex.b2&evexRounding)>>1 != 0
+}
+
+// SaeEnabled reports whether SAE suffix is permitted.
+func (evex evexBits) SaeEnabled() bool {
+       return (evex.b2&evexSae)>>0 != 0
+}
+
+// DispMultiplier returns displacement multiplier that is calculated
+// based on tuple type, EVEX.W and input size.
+// If embedded broadcast is used, bcst should be true.
+func (evex evexBits) DispMultiplier(bcst bool) int32 {
+       if bcst {
+               switch evex.b2 & evexBcst {
+               case evexBcstN4:
+                       return 4
+               case evexBcstN8:
+                       return 8
+               }
+               return 1
+       }
+
+       switch evex.b2 & evexN {
+       case evexN1:
+               return 1
+       case evexN2:
+               return 2
+       case evexN4:
+               return 4
+       case evexN8:
+               return 8
+       case evexN16:
+               return 16
+       case evexN32:
+               return 32
+       case evexN64:
+               return 64
+       case evexN128:
+               return 128
+       }
+       return 1
+}
+
+// EVEX is described by using 2-byte sequence.
+// See evexBits for more details.
+const (
+       evexW   = 0x80 // b1[W... ....]
+       evexWIG = 0 << 7
+       evexW0  = 0 << 7
+       evexW1  = 1 << 7
+
+       evexM    = 0x30 // b2[..mm ...]
+       evex0F   = 1 << 4
+       evex0F38 = 2 << 4
+       evex0F3A = 3 << 4
+
+       evexL   = 0x0C // b1[.... LL..]
+       evexLIG = 0 << 2
+       evex128 = 0 << 2
+       evex256 = 1 << 2
+       evex512 = 2 << 2
+
+       evexP  = 0x03 // b1[.... ..pp]
+       evex66 = 1 << 0
+       evexF3 = 2 << 0
+       evexF2 = 3 << 0
+
+       // Precalculated Disp8 N value.
+       // N acts like a multiplier for 8bit displacement.
+       // Note that some N are not used, but their bits are reserved.
+       evexN    = 0xE0 // b2[NNN. ....]
+       evexN1   = 0 << 5
+       evexN2   = 1 << 5
+       evexN4   = 2 << 5
+       evexN8   = 3 << 5
+       evexN16  = 4 << 5
+       evexN32  = 5 << 5
+       evexN64  = 6 << 5
+       evexN128 = 7 << 5
+
+       // Disp8 for broadcasts.
+       evexBcst   = 0x18 // b2[...b b...]
+       evexBcstN4 = 1 << 3
+       evexBcstN8 = 2 << 3
+
+       // Flags that permit certain AVX512 features.
+       // It's semantically illegal to combine evexZeroing and evexSae.
+       evexZeroing         = 0x4 // b2[.... .Z..]
+       evexZeroingEnabled  = 1 << 2
+       evexRounding        = 0x2 // b2[.... ..R.]
+       evexRoundingEnabled = 1 << 1
+       evexSae             = 0x1 // b2[.... ...S]
+       evexSaeEnabled      = 1 << 0
+)
+
+// compressedDisp8 calculates EVEX compressed displacement, if applicable.
+func compressedDisp8(disp, elemSize int32) (disp8 byte, ok bool) {
+       if disp%elemSize == 0 {
+               v := disp / elemSize
+               if v >= -128 && v <= 127 {
+                       return byte(v), true
+               }
+       }
+       return 0, false
+}
+
+// evexZcase reports whether given Z-case belongs to EVEX group.
+func evexZcase(zcase uint8) bool {
+       return zcase > Zevex_first && zcase < Zevex_last
+}
+
+// evexSuffixBits carries instruction EVEX suffix set flags.
+//
+// Examples:
+//     "RU_SAE.Z" => {rounding: 3, zeroing: true}
+//     "Z" => {zeroing: true}
+//     "BCST" => {broadcast: true}
+//     "SAE.Z" => {sae: true, zeroing: true}
+type evexSuffix struct {
+       rounding  byte
+       sae       bool
+       zeroing   bool
+       broadcast bool
+}
+
+// Rounding control values.
+// Match exact value for EVEX.L'L field (with exception of rcUnset).
+const (
+       rcRNSAE = 0 // Round towards nearest
+       rcRDSAE = 1 // Round towards -Inf
+       rcRUSAE = 2 // Round towards +Inf
+       rcRZSAE = 3 // Round towards zero
+       rcUnset = 4
+)
+
+// newEVEXSuffix returns proper zero value for evexSuffix.
+func newEVEXSuffix() evexSuffix {
+       return evexSuffix{rounding: rcUnset}
+}
+
+// evexSuffixMap maps obj.X86suffix to it's decoded version.
+// Filled during init().
+var evexSuffixMap [255]evexSuffix
+
+func init() {
+       // Decode all valid suffixes for later use.
+       for i := range opSuffixTable {
+               suffix := newEVEXSuffix()
+               parts := strings.Split(opSuffixTable[i], ".")
+               for j := range parts {
+                       switch parts[j] {
+                       case "Z":
+                               suffix.zeroing = true
+                       case "BCST":
+                               suffix.broadcast = true
+                       case "SAE":
+                               suffix.sae = true
+
+                       case "RN_SAE":
+                               suffix.rounding = rcRNSAE
+                       case "RD_SAE":
+                               suffix.rounding = rcRDSAE
+                       case "RU_SAE":
+                               suffix.rounding = rcRUSAE
+                       case "RZ_SAE":
+                               suffix.rounding = rcRZSAE
+                       }
+               }
+               evexSuffixMap[i] = suffix
+       }
+}
+
+// toDisp8 tries to convert disp to proper 8-bit displacement value.
+func toDisp8(disp int32, p *obj.Prog, asmbuf *AsmBuf) (disp8 byte, ok bool) {
+       if asmbuf.evexflag {
+               bcst := evexSuffixMap[p.Scond].broadcast
+               elemSize := asmbuf.evex.DispMultiplier(bcst)
+               return compressedDisp8(disp, elemSize)
+       }
+       return byte(disp), disp >= -128 && disp < 128
+}
+
+// EncodeRegisterRange packs [reg0-reg1] list into 64-bit value that
+// is intended to be stored inside obj.Addr.Offset with TYPE_REGLIST.
+func EncodeRegisterRange(reg0, reg1 int16) int64 {
+       return (int64(reg0) << 0) |
+               (int64(reg1) << 16) |
+               obj.RegListX86Lo
+}
+
+// decodeRegisterRange unpacks [reg0-reg1] list from 64-bit value created by EncodeRegisterRange.
+func decodeRegisterRange(list int64) (reg0, reg1 int) {
+       return int((list >> 0) & 0xFFFF),
+               int((list >> 16) & 0xFFFF)
+}
+
+// ParseSuffix handles the special suffix for the 386/AMD64.
+// Suffix bits are stored into p.Scond.
+//
+// Leading "." in cond is ignored.
+func ParseSuffix(p *obj.Prog, cond string) error {
+       cond = strings.TrimPrefix(cond, ".")
+
+       suffix := newOpSuffix(cond)
+       if !suffix.IsValid() {
+               return inferSuffixError(cond)
+       }
+
+       p.Scond = uint8(suffix)
+       return nil
+}
+
+// inferSuffixError returns non-nil error that describes what could be
+// the cause of suffix parse failure.
+//
+// At the point this function is executed there is already assembly error,
+// so we can burn some clocks to construct good error message.
+//
+// Reported issues:
+//     - duplicated suffixes
+//     - illegal rounding/SAE+broadcast combinations
+//     - unknown suffixes
+//     - misplaced suffix (e.g. wrong Z suffix position)
+func inferSuffixError(cond string) error {
+       suffixSet := make(map[string]bool)  // Set for duplicates detection.
+       unknownSet := make(map[string]bool) // Set of unknown suffixes.
+       hasBcst := false
+       hasRoundSae := false
+       var msg []string // Error message parts
+
+       suffixes := strings.Split(cond, ".")
+       for i, suffix := range suffixes {
+               switch suffix {
+               case "Z":
+                       if i != len(suffixes)-1 {
+                               msg = append(msg, "Z suffix should be the last")
+                       }
+               case "BCST":
+                       hasBcst = true
+               case "SAE", "RN_SAE", "RZ_SAE", "RD_SAE", "RU_SAE":
+                       hasRoundSae = true
+               default:
+                       if !unknownSet[suffix] {
+                               msg = append(msg, fmt.Sprintf("unknown suffix %q", suffix))
+                       }
+                       unknownSet[suffix] = true
+               }
+
+               if suffixSet[suffix] {
+                       msg = append(msg, fmt.Sprintf("duplicate suffix %q", suffix))
+               }
+               suffixSet[suffix] = true
+       }
+
+       if hasBcst && hasRoundSae {
+               msg = append(msg, "can't combine rounding/SAE and broadcast")
+       }
+
+       if len(msg) == 0 {
+               return errors.New("bad suffix combination")
+       }
+       return errors.New(strings.Join(msg, "; "))
+}
+
+// opSuffixTable is a complete list of possible opcode suffix combinations.
+// It "maps" uint8 suffix bits to their string representation.
+// With the exception of first and last elements, order is not important.
+var opSuffixTable = [...]string{
+       "", // Map empty suffix to empty string.
+
+       "Z",
+
+       "SAE",
+       "SAE.Z",
+
+       "RN_SAE",
+       "RZ_SAE",
+       "RD_SAE",
+       "RU_SAE",
+       "RN_SAE.Z",
+       "RZ_SAE.Z",
+       "RD_SAE.Z",
+       "RU_SAE.Z",
+
+       "BCST",
+       "BCST.Z",
+
+       "<bad suffix>",
+}
+
+// opSuffix represents instruction opcode suffix.
+// Compound (multi-part) suffixes expressed with single opSuffix value.
+//
+// uint8 type is used to fit obj.Prog.Scond.
+type opSuffix uint8
+
+// badOpSuffix is used to represent all invalid suffix combinations.
+const badOpSuffix = opSuffix(len(opSuffixTable) - 1)
+
+// newOpSuffix returns opSuffix object that matches suffixes string.
+//
+// If no matching suffix is found, special "invalid" suffix is returned.
+// Use IsValid method to check against this case.
+func newOpSuffix(suffixes string) opSuffix {
+       for i := range opSuffixTable {
+               if opSuffixTable[i] == suffixes {
+                       return opSuffix(i)
+               }
+       }
+       return badOpSuffix
+}
+
+// IsValid reports whether suffix is valid.
+// Empty suffixes are valid.
+func (suffix opSuffix) IsValid() bool {
+       return suffix != badOpSuffix
+}
+
+// String returns suffix printed representation.
+//
+// It matches the string that was used to create suffix with NewX86Suffix()
+// for valid suffixes.
+// For all invalid suffixes, special marker is returned.
+func (suffix opSuffix) String() string {
+       return opSuffixTable[suffix]
+}
index 8040e2e87a90df41a7f82fd759d08ff02a861cfd..f194b4b0757ff700f7fd780fdb9eaacbc5cf1e1b 100644 (file)
@@ -88,6 +88,14 @@ var Register = []string{
        "M5",
        "M6",
        "M7",
+       "K0",
+       "K1",
+       "K2",
+       "K3",
+       "K4",
+       "K5",
+       "K6",
+       "K7",
        "X0",
        "X1",
        "X2",
@@ -104,6 +112,22 @@ var Register = []string{
        "X13",
        "X14",
        "X15",
+       "X16",
+       "X17",
+       "X18",
+       "X19",
+       "X20",
+       "X21",
+       "X22",
+       "X23",
+       "X24",
+       "X25",
+       "X26",
+       "X27",
+       "X28",
+       "X29",
+       "X30",
+       "X31",
        "Y0",
        "Y1",
        "Y2",
@@ -120,6 +144,54 @@ var Register = []string{
        "Y13",
        "Y14",
        "Y15",
+       "Y16",
+       "Y17",
+       "Y18",
+       "Y19",
+       "Y20",
+       "Y21",
+       "Y22",
+       "Y23",
+       "Y24",
+       "Y25",
+       "Y26",
+       "Y27",
+       "Y28",
+       "Y29",
+       "Y30",
+       "Y31",
+       "Z0",
+       "Z1",
+       "Z2",
+       "Z3",
+       "Z4",
+       "Z5",
+       "Z6",
+       "Z7",
+       "Z8",
+       "Z9",
+       "Z10",
+       "Z11",
+       "Z12",
+       "Z13",
+       "Z14",
+       "Z15",
+       "Z16",
+       "Z17",
+       "Z18",
+       "Z19",
+       "Z20",
+       "Z21",
+       "Z22",
+       "Z23",
+       "Z24",
+       "Z25",
+       "Z26",
+       "Z27",
+       "Z28",
+       "Z29",
+       "Z30",
+       "Z31",
        "CS", // [D_CS]
        "SS",
        "DS",
@@ -170,6 +242,9 @@ var Register = []string{
 func init() {
        obj.RegisterRegister(REG_AL, REG_AL+len(Register), rconv)
        obj.RegisterOpcode(obj.ABaseAMD64, Anames)
+       obj.RegisterRegisterList(obj.RegListX86Lo, obj.RegListX86Hi, rlconv)
+       obj.RegisterOpSuffix("386", opSuffixString)
+       obj.RegisterOpSuffix("amd64", opSuffixString)
 }
 
 func rconv(r int) string {
@@ -178,3 +253,12 @@ func rconv(r int) string {
        }
        return fmt.Sprintf("Rgok(%d)", r-obj.RBaseAMD64)
 }
+
+func rlconv(bits int64) string {
+       reg0, reg1 := decodeRegisterRange(bits)
+       return fmt.Sprintf("[%s-%s]", rconv(reg0), rconv(reg1))
+}
+
+func opSuffixString(s uint8) string {
+       return "." + opSuffix(s).String()
+}
diff --git a/src/cmd/internal/obj/x86/vex_optabs.go b/src/cmd/internal/obj/x86/vex_optabs.go
deleted file mode 100644 (file)
index b6c96cf..0000000
+++ /dev/null
@@ -1,382 +0,0 @@
-// Code generated by x86avxgen. DO NOT EDIT.
-
-package x86
-
-var vexOptab = [...]Optab{
-       {AANDNL, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW0, 0xF2}},
-       {AANDNQ, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW1, 0xF2}},
-       {ABEXTRL, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW0, 0xF7}},
-       {ABEXTRQ, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW1, 0xF7}},
-       {ABLSIL, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW0, 0xF3, 03}},
-       {ABLSIQ, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW1, 0xF3, 03}},
-       {ABLSMSKL, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW0, 0xF3, 02}},
-       {ABLSMSKQ, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW1, 0xF3, 02}},
-       {ABLSRL, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW0, 0xF3, 01}},
-       {ABLSRQ, yvex_r2, Pvex, [23]uint8{vexNDD | vexLZ | vex0F38 | vexW1, 0xF3, 01}},
-       {ABZHIL, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW0, 0xF5}},
-       {ABZHIQ, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex0F38 | vexW1, 0xF5}},
-       {AMULXL, yvex_r3, Pvex, [23]uint8{vexNDD | vexLZ | vexF2 | vex0F38 | vexW0, 0xF6}},
-       {AMULXQ, yvex_r3, Pvex, [23]uint8{vexNDD | vexLZ | vexF2 | vex0F38 | vexW1, 0xF6}},
-       {APDEPL, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vexF2 | vex0F38 | vexW0, 0xF5}},
-       {APDEPQ, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vexF2 | vex0F38 | vexW1, 0xF5}},
-       {APEXTL, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vexF3 | vex0F38 | vexW0, 0xF5}},
-       {APEXTQ, yvex_r3, Pvex, [23]uint8{vexNDS | vexLZ | vexF3 | vex0F38 | vexW1, 0xF5}},
-       {ARORXL, yvex_ri3, Pvex, [23]uint8{vexNOVSR | vexLZ | vexF2 | vex0F3A | vexW0, 0xF0}},
-       {ARORXQ, yvex_ri3, Pvex, [23]uint8{vexNOVSR | vexLZ | vexF2 | vex0F3A | vexW1, 0xF0}},
-       {ASARXL, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vexF3 | vex0F38 | vexW0, 0xF7}},
-       {ASARXQ, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vexF3 | vex0F38 | vexW1, 0xF7}},
-       {ASHLXL, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex66 | vex0F38 | vexW0, 0xF7}},
-       {ASHLXQ, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vex66 | vex0F38 | vexW1, 0xF7}},
-       {ASHRXL, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vexF2 | vex0F38 | vexW0, 0xF7}},
-       {ASHRXQ, yvex_vmr3, Pvex, [23]uint8{vexNDS | vexLZ | vexF2 | vex0F38 | vexW1, 0xF7}},
-       {AVADDPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x58, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x58}},
-       {AVADDPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x58, vexNDS | vex256 | vex0F | vexWIG, 0x58}},
-       {AVADDSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x58}},
-       {AVADDSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x58}},
-       {AVADDSUBPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD0}},
-       {AVADDSUBPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vexF2 | vex0F | vexWIG, 0xD0, vexNDS | vex256 | vexF2 | vex0F | vexWIG, 0xD0}},
-       {AVAESDEC, yvex_x3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0xDE}},
-       {AVAESDECLAST, yvex_x3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0xDF}},
-       {AVAESENC, yvex_x3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0xDC}},
-       {AVAESENCLAST, yvex_x3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0xDD}},
-       {AVAESIMC, yvex_x2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0xDB}},
-       {AVAESKEYGENASSIST, yvex_xi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0xDF}},
-       {AVANDNPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x55, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x55}},
-       {AVANDNPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x55, vexNDS | vex256 | vex0F | vexWIG, 0x55}},
-       {AVANDPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x54, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x54}},
-       {AVANDPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x54, vexNDS | vex256 | vex0F | vexWIG, 0x54}},
-       {AVBLENDPD, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x0D, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x0D}},
-       {AVBLENDPS, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x0C, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x0C}},
-       {AVBLENDVPD, yvex_xy4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x4B, vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x4B}},
-       {AVBLENDVPS, yvex_xy4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x4A, vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x4A}},
-       {AVBROADCASTF128, yvex_vbroadcastf, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x1A}},
-       {AVBROADCASTI128, yvex_vbroadcastf, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x5A}},
-       {AVBROADCASTSD, yvex_vpbroadcast_sd, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x19, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x19}},
-       {AVBROADCASTSS, yvex_vpbroadcast_ss, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x18, vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x18, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x18, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x18}},
-       {AVCMPPD, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xC2, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xC2}},
-       {AVCMPPS, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0xC2, vexNDS | vex256 | vex0F | vexWIG, 0xC2}},
-       {AVCMPSD, yvex_xxi4, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0xC2}},
-       {AVCMPSS, yvex_xxi4, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0xC2}},
-       {AVCOMISD, yvex_x2, Pvex, [23]uint8{vexNOVSR | vexLIG | vex66 | vex0F | vexWIG, 0x2F}},
-       {AVCOMISS, yvex_x2, Pvex, [23]uint8{vexNOVSR | vexLIG | vex0F | vexWIG, 0x2F}},
-       {AVCVTDQ2PD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0xE6, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0xE6}},
-       {AVCVTDQ2PS, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x5B, vexNOVSR | vex256 | vex0F | vexWIG, 0x5B}},
-       {AVCVTPD2DQX, yvex_x2, Pvex, [23]uint8{vexNOVSR | vex128 | vexF2 | vex0F | vexWIG, 0xE6}},
-       {AVCVTPD2DQY, yvex_y2, Pvex, [23]uint8{vexNOVSR | vex256 | vexF2 | vex0F | vexWIG, 0xE6}},
-       {AVCVTPD2PSX, yvex_x2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x5A}},
-       {AVCVTPD2PSY, yvex_y2, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x5A}},
-       {AVCVTPH2PS, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x13, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x13}},
-       {AVCVTPS2DQ, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x5B, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x5B}},
-       {AVCVTPS2PD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x5A, vexNOVSR | vex256 | vex0F | vexWIG, 0x5A}},
-       {AVCVTPS2PH, yvex_vcvtps2ph, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F3A | vexW0, 0x1D, vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x1D}},
-       {AVCVTSD2SI, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF2 | vex0F | vexW0, 0x2D}},
-       {AVCVTSD2SIQ, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF2 | vex0F | vexW1, 0x2D}},
-       {AVCVTSD2SS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x5A}},
-       {AVCVTSI2SDL, yvex_rx3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexW0, 0x2A}},
-       {AVCVTSI2SDQ, yvex_rx3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexW1, 0x2A}},
-       {AVCVTSI2SSL, yvex_rx3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexW0, 0x2A}},
-       {AVCVTSI2SSQ, yvex_rx3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexW1, 0x2A}},
-       {AVCVTSS2SD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x5A}},
-       {AVCVTSS2SI, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF3 | vex0F | vexW0, 0x2D}},
-       {AVCVTSS2SIQ, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF3 | vex0F | vexW1, 0x2D}},
-       {AVCVTTPD2DQX, yvex_x2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0xE6}},
-       {AVCVTTPD2DQY, yvex_y2, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0xE6}},
-       {AVCVTTPS2DQ, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x5B, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x5B}},
-       {AVCVTTSD2SI, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF2 | vex0F | vexW0, 0x2C}},
-       {AVCVTTSD2SIQ, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF2 | vex0F | vexW1, 0x2C}},
-       {AVCVTTSS2SI, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF3 | vex0F | vexW0, 0x2C}},
-       {AVCVTTSS2SIQ, yvex_vcvtsd2si, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF3 | vex0F | vexW1, 0x2C}},
-       {AVDIVPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x5E, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x5E}},
-       {AVDIVPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x5E, vexNDS | vex256 | vex0F | vexWIG, 0x5E}},
-       {AVDIVSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x5E}},
-       {AVDIVSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x5E}},
-       {AVDPPD, yvex_xxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x41}},
-       {AVDPPS, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x40, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x40}},
-       {AVEXTRACTF128, yvex_yi3, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F3A | vexW0, 0x19}},
-       {AVEXTRACTI128, yvex_yi3, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F3A | vexW0, 0x39}},
-       {AVEXTRACTPS, yvex_vpextr, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x17}},
-       {AVFMADD132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x98, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x98}},
-       {AVFMADD132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x98, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x98}},
-       {AVFMADD132SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0x99}},
-       {AVFMADD132SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0x99}},
-       {AVFMADD213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xA8, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xA8}},
-       {AVFMADD213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xA8, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xA8}},
-       {AVFMADD213SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xA9}},
-       {AVFMADD213SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xA9}},
-       {AVFMADD231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xB8, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xB8}},
-       {AVFMADD231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xB8, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xB8}},
-       {AVFMADD231SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xB9}},
-       {AVFMADD231SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xB9}},
-       {AVFMADDSUB132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x96, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x96}},
-       {AVFMADDSUB132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x96, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x96}},
-       {AVFMADDSUB213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xA6, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xA6}},
-       {AVFMADDSUB213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xA6, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xA6}},
-       {AVFMADDSUB231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xB6, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xB6}},
-       {AVFMADDSUB231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xB6, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xB6}},
-       {AVFMSUB132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x9A, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x9A}},
-       {AVFMSUB132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x9A, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x9A}},
-       {AVFMSUB132SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0x9B}},
-       {AVFMSUB132SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0x9B}},
-       {AVFMSUB213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xAA, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xAA}},
-       {AVFMSUB213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xAA, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xAA}},
-       {AVFMSUB213SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xAB}},
-       {AVFMSUB213SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xAB}},
-       {AVFMSUB231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xBA, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xBA}},
-       {AVFMSUB231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xBA, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xBA}},
-       {AVFMSUB231SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xBB}},
-       {AVFMSUB231SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xBB}},
-       {AVFMSUBADD132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x97, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x97}},
-       {AVFMSUBADD132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x97, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x97}},
-       {AVFMSUBADD213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xA7, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xA7}},
-       {AVFMSUBADD213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xA7, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xA7}},
-       {AVFMSUBADD231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xB7, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xB7}},
-       {AVFMSUBADD231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xB7, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xB7}},
-       {AVFNMADD132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x9C, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x9C}},
-       {AVFNMADD132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x9C, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x9C}},
-       {AVFNMADD132SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0x9D}},
-       {AVFNMADD132SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0x9D}},
-       {AVFNMADD213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xAC, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xAC}},
-       {AVFNMADD213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xAC, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xAC}},
-       {AVFNMADD213SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xAD}},
-       {AVFNMADD213SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xAD}},
-       {AVFNMADD231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xBC, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xBC}},
-       {AVFNMADD231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xBC, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xBC}},
-       {AVFNMADD231SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xBD}},
-       {AVFNMADD231SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xBD}},
-       {AVFNMSUB132PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0x9E, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0x9E}},
-       {AVFNMSUB132PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0x9E, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0x9E}},
-       {AVFNMSUB132SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0x9F}},
-       {AVFNMSUB132SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0x9F}},
-       {AVFNMSUB213PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xAE, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xAE}},
-       {AVFNMSUB213PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xAE, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xAE}},
-       {AVFNMSUB213SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xAF}},
-       {AVFNMSUB213SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xAF}},
-       {AVFNMSUB231PD, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW1, 0xBE, vexDDS | vex256 | vex66 | vex0F38 | vexW1, 0xBE}},
-       {AVFNMSUB231PS, yvex_xy3, Pvex, [23]uint8{vexDDS | vex128 | vex66 | vex0F38 | vexW0, 0xBE, vexDDS | vex256 | vex66 | vex0F38 | vexW0, 0xBE}},
-       {AVFNMSUB231SD, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW1, 0xBF}},
-       {AVFNMSUB231SS, yvex_x3, Pvex, [23]uint8{vexDDS | vexLIG | vex66 | vex0F38 | vexW0, 0xBF}},
-       {AVHADDPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x7C, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x7C}},
-       {AVHADDPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vexF2 | vex0F | vexWIG, 0x7C, vexNDS | vex256 | vexF2 | vex0F | vexWIG, 0x7C}},
-       {AVHSUBPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x7D, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x7D}},
-       {AVHSUBPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vexF2 | vex0F | vexWIG, 0x7D, vexNDS | vex256 | vexF2 | vex0F | vexWIG, 0x7D}},
-       {AVINSERTF128, yvex_xyi4, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x18}},
-       {AVINSERTI128, yvex_xyi4, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x38}},
-       {AVINSERTPS, yvex_xxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x21}},
-       {AVLDDQU, yvex_mxy, Pvex, [23]uint8{vexNOVSR | vex128 | vexF2 | vex0F | vexWIG, 0xF0, vexNOVSR | vex256 | vexF2 | vex0F | vexWIG, 0xF0}},
-       {AVLDMXCSR, yvex_m, Pvex, [23]uint8{vexNOVSR | vexLZ | vex0F | vexWIG, 0xAE, 02}},
-       {AVMASKMOVDQU, yvex_xx2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0xF7}},
-       {AVMASKMOVPD, yvex_vblendvpd, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x2F, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x2F, vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x2D, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x2D}},
-       {AVMASKMOVPS, yvex_vblendvpd, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x2E, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x2E, vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x2C, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x2C}},
-       {AVMAXPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x5F, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x5F}},
-       {AVMAXPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x5F, vexNDS | vex256 | vex0F | vexWIG, 0x5F}},
-       {AVMAXSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x5F}},
-       {AVMAXSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x5F}},
-       {AVMINPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x5D, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x5D}},
-       {AVMINPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x5D, vexNDS | vex256 | vex0F | vexWIG, 0x5D}},
-       {AVMINSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x5D}},
-       {AVMINSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x5D}},
-       {AVMOVAPD, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x28, vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x29, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x28, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x29}},
-       {AVMOVAPS, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x28, vexNOVSR | vex128 | vex0F | vexWIG, 0x29, vexNOVSR | vex256 | vex0F | vexWIG, 0x28, vexNOVSR | vex256 | vex0F | vexWIG, 0x29}},
-       {AVMOVD, yvex_vmovd, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexW0, 0x7E, vexNOVSR | vex128 | vex66 | vex0F | vexW0, 0x6E}},
-       {AVMOVDDUP, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vexF2 | vex0F | vexWIG, 0x12, vexNOVSR | vex256 | vexF2 | vex0F | vexWIG, 0x12}},
-       {AVMOVDQA, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x6F, vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x7F, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x6F, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x7F}},
-       {AVMOVDQU, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x6F, vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x7F, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x6F, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x7F}},
-       {AVMOVHLPS, yvex_xx3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x12}},
-       {AVMOVHPD, yvex_vmovhpd, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x17, vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x16}},
-       {AVMOVHPS, yvex_vmovhpd, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x17, vexNDS | vex128 | vex0F | vexWIG, 0x16}},
-       {AVMOVLHPS, yvex_xx3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x16}},
-       {AVMOVLPD, yvex_vmovhpd, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x13, vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x12}},
-       {AVMOVLPS, yvex_vmovhpd, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x13, vexNDS | vex128 | vex0F | vexWIG, 0x12}},
-       {AVMOVMSKPD, yvex_xyr2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x50, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x50}},
-       {AVMOVMSKPS, yvex_xyr2, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x50, vexNOVSR | vex256 | vex0F | vexWIG, 0x50}},
-       {AVMOVNTDQ, yvex_vmovntdq, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0xE7, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0xE7}},
-       {AVMOVNTDQA, yvex_mxy, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x2A, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x2A}},
-       {AVMOVNTPD, yvex_vmovntdq, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x2B, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x2B}},
-       {AVMOVNTPS, yvex_vmovntdq, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x2B, vexNOVSR | vex256 | vex0F | vexWIG, 0x2B}},
-       {AVMOVQ, yvex_vmovq, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexW1, 0x7E, vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x7E, vexNOVSR | vex128 | vex66 | vex0F | vexW1, 0x6E, vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x7E, vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0xD6}},
-       {AVMOVSD, yvex_vmov, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF2 | vex0F | vexWIG, 0x11, vexNOVSR | vexLIG | vexF2 | vex0F | vexWIG, 0x10, vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x10, vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x11}},
-       {AVMOVSHDUP, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x16, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x16}},
-       {AVMOVSLDUP, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x12, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x12}},
-       {AVMOVSS, yvex_vmov, Pvex, [23]uint8{vexNOVSR | vexLIG | vexF3 | vex0F | vexWIG, 0x11, vexNOVSR | vexLIG | vexF3 | vex0F | vexWIG, 0x10, vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x10, vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x11}},
-       {AVMOVUPD, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x10, vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x11, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x10, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x11}},
-       {AVMOVUPS, yvex_vmovdqa, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x10, vexNOVSR | vex128 | vex0F | vexWIG, 0x11, vexNOVSR | vex256 | vex0F | vexWIG, 0x10, vexNOVSR | vex256 | vex0F | vexWIG, 0x11}},
-       {AVMPSADBW, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x42, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x42}},
-       {AVMULPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x59, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x59}},
-       {AVMULPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x59, vexNDS | vex256 | vex0F | vexWIG, 0x59}},
-       {AVMULSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x59}},
-       {AVMULSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x59}},
-       {AVORPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x56, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x56}},
-       {AVORPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x56, vexNDS | vex256 | vex0F | vexWIG, 0x56}},
-       {AVPABSB, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x1C, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x1C}},
-       {AVPABSD, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x1E, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x1E}},
-       {AVPABSW, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x1D, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x1D}},
-       {AVPACKSSDW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x6B, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x6B}},
-       {AVPACKSSWB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x63, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x63}},
-       {AVPACKUSDW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x2B, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x2B}},
-       {AVPACKUSWB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x67, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x67}},
-       {AVPADDB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xFC, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xFC}},
-       {AVPADDD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xFE, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xFE}},
-       {AVPADDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD4, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD4}},
-       {AVPADDSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xEC, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xEC}},
-       {AVPADDSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xED, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xED}},
-       {AVPADDUSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDC, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDC}},
-       {AVPADDUSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDD, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDD}},
-       {AVPADDW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xFD, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xFD}},
-       {AVPALIGNR, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x0F, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x0F}},
-       {AVPAND, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDB, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDB}},
-       {AVPANDN, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDF, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDF}},
-       {AVPAVGB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE0}},
-       {AVPAVGW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE3, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE3}},
-       {AVPBLENDD, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x02, vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x02}},
-       {AVPBLENDVB, yvex_xy4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x4C, vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x4C}},
-       {AVPBLENDW, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x0E, vexNDS | vex256 | vex66 | vex0F3A | vexWIG, 0x0E}},
-       {AVPBROADCASTB, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x78, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x78}},
-       {AVPBROADCASTD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x58, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x58}},
-       {AVPBROADCASTQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x59, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x59}},
-       {AVPBROADCASTW, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x79, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x79}},
-       {AVPCLMULQDQ, yvex_xxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexWIG, 0x44}},
-       {AVPCMPEQB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x74, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x74}},
-       {AVPCMPEQD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x76, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x76}},
-       {AVPCMPEQQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x29, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x29}},
-       {AVPCMPEQW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x75, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x75}},
-       {AVPCMPESTRI, yvex_xi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x61}},
-       {AVPCMPESTRM, yvex_xi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x60}},
-       {AVPCMPGTB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x64, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x64}},
-       {AVPCMPGTD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x66, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x66}},
-       {AVPCMPGTQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x37, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x37}},
-       {AVPCMPGTW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x65, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x65}},
-       {AVPCMPISTRI, yvex_xi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x63}},
-       {AVPCMPISTRM, yvex_xi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x62}},
-       {AVPERM2F128, yvex_yyi4, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x06}},
-       {AVPERM2I128, yvex_yyi4, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F3A | vexW0, 0x46}},
-       {AVPERMD, yvex_yy3, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x36}},
-       {AVPERMILPD, yvex_vpermilp, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x05, vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x0D, vexNOVSR | vex256 | vex66 | vex0F3A | vexW0, 0x05, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x0D}},
-       {AVPERMILPS, yvex_vpermilp, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x04, vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x0C, vexNOVSR | vex256 | vex66 | vex0F3A | vexW0, 0x04, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x0C}},
-       {AVPERMPD, yvex_vpermpd, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F3A | vexW1, 0x01}},
-       {AVPERMPS, yvex_yy3, Pvex, [23]uint8{vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x16}},
-       {AVPERMQ, yvex_vpermpd, Pvex, [23]uint8{vexNOVSR | vex256 | vex66 | vex0F3A | vexW1, 0x00}},
-       {AVPEXTRB, yvex_vpextr, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x14}},
-       {AVPEXTRD, yvex_vpextr, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x16}},
-       {AVPEXTRQ, yvex_vpextr, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexW1, 0x16}},
-       {AVPEXTRW, yvex_vpextrw, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexW0, 0xC5, vexNOVSR | vex128 | vex66 | vex0F3A | vexW0, 0x15}},
-       {AVPHADDD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x02, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x02}},
-       {AVPHADDSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x03, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x03}},
-       {AVPHADDW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x01, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x01}},
-       {AVPHMINPOSUW, yvex_x2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x41}},
-       {AVPHSUBD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x06, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x06}},
-       {AVPHSUBSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x07, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x07}},
-       {AVPHSUBW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x05, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x05}},
-       {AVPINSRB, yvex_rxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x20}},
-       {AVPINSRD, yvex_rxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW0, 0x22}},
-       {AVPINSRQ, yvex_rxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F3A | vexW1, 0x22}},
-       {AVPINSRW, yvex_rxi4, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexW0, 0xC4}},
-       {AVPMADDUBSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x04, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x04}},
-       {AVPMADDWD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF5, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF5}},
-       {AVPMASKMOVD, yvex_vblendvpd, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x8E, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x8E, vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x8C, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x8C}},
-       {AVPMASKMOVQ, yvex_vblendvpd, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW1, 0x8E, vexNDS | vex256 | vex66 | vex0F38 | vexW1, 0x8E, vexNDS | vex128 | vex66 | vex0F38 | vexW1, 0x8C, vexNDS | vex256 | vex66 | vex0F38 | vexW1, 0x8C}},
-       {AVPMAXSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3C, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3C}},
-       {AVPMAXSD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3D, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3D}},
-       {AVPMAXSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xEE, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xEE}},
-       {AVPMAXUB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDE, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDE}},
-       {AVPMAXUD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3F, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3F}},
-       {AVPMAXUW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3E, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3E}},
-       {AVPMINSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x38, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x38}},
-       {AVPMINSD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x39, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x39}},
-       {AVPMINSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xEA, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xEA}},
-       {AVPMINUB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xDA, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xDA}},
-       {AVPMINUD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3B, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3B}},
-       {AVPMINUW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x3A, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x3A}},
-       {AVPMOVMSKB, yvex_xyr2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0xD7, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0xD7}},
-       {AVPMOVSXBD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x21, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x21}},
-       {AVPMOVSXBQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x22, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x22}},
-       {AVPMOVSXBW, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x20, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x20}},
-       {AVPMOVSXDQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x25, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x25}},
-       {AVPMOVSXWD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x23, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x23}},
-       {AVPMOVSXWQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x24, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x24}},
-       {AVPMOVZXBD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x31, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x31}},
-       {AVPMOVZXBQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x32, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x32}},
-       {AVPMOVZXBW, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x30, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x30}},
-       {AVPMOVZXDQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x35, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x35}},
-       {AVPMOVZXWD, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x33, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x33}},
-       {AVPMOVZXWQ, yvex_vpbroadcast, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x34, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x34}},
-       {AVPMULDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x28, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x28}},
-       {AVPMULHRSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x0B, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x0B}},
-       {AVPMULHUW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE4, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE4}},
-       {AVPMULHW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE5, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE5}},
-       {AVPMULLD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x40, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x40}},
-       {AVPMULLW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD5, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD5}},
-       {AVPMULUDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF4, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF4}},
-       {AVPOR, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xEB, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xEB}},
-       {AVPSADBW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF6, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF6}},
-       {AVPSHUFB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x00, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x00}},
-       {AVPSHUFD, yvex_xyi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x70, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x70, vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x70, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x70}},
-       {AVPSHUFHW, yvex_xyi3, Pvex, [23]uint8{vexNOVSR | vex128 | vexF3 | vex0F | vexWIG, 0x70, vexNOVSR | vex256 | vexF3 | vex0F | vexWIG, 0x70}},
-       {AVPSHUFLW, yvex_xyi3, Pvex, [23]uint8{vexNOVSR | vex128 | vexF2 | vex0F | vexWIG, 0x70, vexNOVSR | vex256 | vexF2 | vex0F | vexWIG, 0x70}},
-       {AVPSIGNB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x08, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x08}},
-       {AVPSIGND, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x0A, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x0A}},
-       {AVPSIGNW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexWIG, 0x09, vexNDS | vex256 | vex66 | vex0F38 | vexWIG, 0x09}},
-       {AVPSLLD, yvex_shift, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x72, 0xF0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x72, 0xF0, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0xF2, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0xF2}},
-       {AVPSLLDQ, yvex_shift_dq, Pvex, [23]uint8{vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x73, 0xF8, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x73, 0xF8}},
-       {AVPSLLQ, yvex_shift, Pvex, [23]uint8{vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x73, 0xF0, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x73, 0xF0, vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF3, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF3}},
-       {AVPSLLVD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x47, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x47}},
-       {AVPSLLVQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW1, 0x47, vexNDS | vex256 | vex66 | vex0F38 | vexW1, 0x47}},
-       {AVPSLLW, yvex_vps, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF1, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x71, 0xF0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF1, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x71, 0xF0}},
-       {AVPSRAD, yvex_vps, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE2, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x72, 0xE0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE2, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x72, 0xE0}},
-       {AVPSRAVD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x46, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x46}},
-       {AVPSRAW, yvex_vps, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE1, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x71, 0xE0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE1, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x71, 0xE0}},
-       {AVPSRLD, yvex_shift, Pvex, [23]uint8{vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x72, 0xD0, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x72, 0xD0, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0xD2, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0xD2}},
-       {AVPSRLDQ, yvex_shift_dq, Pvex, [23]uint8{vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x73, 0xD8, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x73, 0xD8}},
-       {AVPSRLQ, yvex_shift, Pvex, [23]uint8{vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x73, 0xD0, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x73, 0xD0, vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD3, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD3}},
-       {AVPSRLVD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW0, 0x45, vexNDS | vex256 | vex66 | vex0F38 | vexW0, 0x45}},
-       {AVPSRLVQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F38 | vexW1, 0x45, vexNDS | vex256 | vex66 | vex0F38 | vexW1, 0x45}},
-       {AVPSRLW, yvex_vps, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD1, vexNDD | vex128 | vex66 | vex0F | vexWIG, 0x71, 0xD0, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD1, vexNDD | vex256 | vex66 | vex0F | vexWIG, 0x71, 0xD0}},
-       {AVPSUBB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF8, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF8}},
-       {AVPSUBD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xFA, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xFA}},
-       {AVPSUBQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xFB, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xFB}},
-       {AVPSUBSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE8, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE8}},
-       {AVPSUBSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xE9, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xE9}},
-       {AVPSUBUSB, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD8, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD8}},
-       {AVPSUBUSW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xD9, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xD9}},
-       {AVPSUBW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xF9, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xF9}},
-       {AVPTEST, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexWIG, 0x17, vexNOVSR | vex256 | vex66 | vex0F38 | vexWIG, 0x17}},
-       {AVPUNPCKHBW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x68, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x68}},
-       {AVPUNPCKHDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x6A, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x6A}},
-       {AVPUNPCKHQDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x6D, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x6D}},
-       {AVPUNPCKHWD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x69, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x69}},
-       {AVPUNPCKLBW, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x60, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x60}},
-       {AVPUNPCKLDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x62, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x62}},
-       {AVPUNPCKLQDQ, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x6C, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x6C}},
-       {AVPUNPCKLWD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x61, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x61}},
-       {AVPXOR, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xEF, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xEF}},
-       {AVRCPPS, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x53, vexNOVSR | vex256 | vex0F | vexWIG, 0x53}},
-       {AVRCPSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x53}},
-       {AVROUNDPD, yvex_xyi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x09, vexNOVSR | vex256 | vex66 | vex0F3A | vexWIG, 0x09}},
-       {AVROUNDPS, yvex_xyi3, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F3A | vexWIG, 0x08, vexNOVSR | vex256 | vex66 | vex0F3A | vexWIG, 0x08}},
-       {AVROUNDSD, yvex_xxi4, Pvex, [23]uint8{vexNDS | vexLIG | vex66 | vex0F3A | vexWIG, 0x0B}},
-       {AVROUNDSS, yvex_xxi4, Pvex, [23]uint8{vexNDS | vexLIG | vex66 | vex0F3A | vexWIG, 0x0A}},
-       {AVRSQRTPS, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x52, vexNOVSR | vex256 | vex0F | vexWIG, 0x52}},
-       {AVRSQRTSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x52}},
-       {AVSHUFPD, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0xC6, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0xC6}},
-       {AVSHUFPS, yvex_vpalignr, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0xC6, vexNDS | vex256 | vex0F | vexWIG, 0xC6}},
-       {AVSQRTPD, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F | vexWIG, 0x51, vexNOVSR | vex256 | vex66 | vex0F | vexWIG, 0x51}},
-       {AVSQRTPS, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x51, vexNOVSR | vex256 | vex0F | vexWIG, 0x51}},
-       {AVSQRTSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x51}},
-       {AVSQRTSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x51}},
-       {AVSTMXCSR, yvex_m, Pvex, [23]uint8{vexNOVSR | vexLZ | vex0F | vexWIG, 0xAE, 03}},
-       {AVSUBPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x5C, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x5C}},
-       {AVSUBPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x5C, vexNDS | vex256 | vex0F | vexWIG, 0x5C}},
-       {AVSUBSD, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF2 | vex0F | vexWIG, 0x5C}},
-       {AVSUBSS, yvex_x3, Pvex, [23]uint8{vexNDS | vexLIG | vexF3 | vex0F | vexWIG, 0x5C}},
-       {AVTESTPD, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x0F, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x0F}},
-       {AVTESTPS, yvex_xy2, Pvex, [23]uint8{vexNOVSR | vex128 | vex66 | vex0F38 | vexW0, 0x0E, vexNOVSR | vex256 | vex66 | vex0F38 | vexW0, 0x0E}},
-       {AVUCOMISD, yvex_x2, Pvex, [23]uint8{vexNOVSR | vexLIG | vex66 | vex0F | vexWIG, 0x2E}},
-       {AVUCOMISS, yvex_x2, Pvex, [23]uint8{vexNOVSR | vexLIG | vex0F | vexWIG, 0x2E}},
-       {AVUNPCKHPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x15, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x15}},
-       {AVUNPCKHPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x15, vexNDS | vex256 | vex0F | vexWIG, 0x15}},
-       {AVUNPCKLPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x14, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x14}},
-       {AVUNPCKLPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x14, vexNDS | vex256 | vex0F | vexWIG, 0x14}},
-       {AVXORPD, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex66 | vex0F | vexWIG, 0x57, vexNDS | vex256 | vex66 | vex0F | vexWIG, 0x57}},
-       {AVXORPS, yvex_xy3, Pvex, [23]uint8{vexNDS | vex128 | vex0F | vexWIG, 0x57, vexNDS | vex256 | vex0F | vexWIG, 0x57}},
-       {AVZEROALL, yvex, Pvex, [23]uint8{vexNOVSR | vex256 | vex0F | vexWIG, 0x77}},
-       {AVZEROUPPER, yvex, Pvex, [23]uint8{vexNOVSR | vex128 | vex0F | vexWIG, 0x77}},
-}