cmd/compile: add math/bits.Mul64 intrinsic on s390x

author Ruixin Bao <ruixin.bao@ibm.com>

Sun, 8 Sep 2019 22:50:24 +0000 (18:50 -0400)

committer Michael Munday <mike.munday@ibm.com>

Fri, 13 Sep 2019 09:04:48 +0000 (09:04 +0000)
author Ruixin Bao <ruixin.bao@ibm.com>
Sun, 8 Sep 2019 22:50:24 +0000 (18:50 -0400)
committer Michael Munday <mike.munday@ibm.com>
Fri, 13 Sep 2019 09:04:48 +0000 (09:04 +0000)
diff --git a/src/cmd/asm/internal/asm/testdata/s390x.s b/src/cmd/asm/internal/asm/testdata/s390x.s

index 9952c5207fe41e4faedb6b0e755dbb0ac26b7cb1..62563d885e4d825ab6cba9b9a09df671a1224a88 100644 (file)
--- a/src/cmd/asm/internal/asm/testdata/s390x.s
+++ b/src/cmd/asm/internal/asm/testdata/s390x.s
@@ -109,6 +109,7 @@ TEXT main·foo(SB),DUPOK|NOSPLIT,$16-0 // TEXT main.foo(SB), DUPOK|NOSPLIT, $16-
         MULHD   R7, R2, R1            // b90400b2b98600a7ebb7003f000ab98000b2b90900abebb2003f000ab98000b7b9e9b01a
         MULHDU  R3, R4                // b90400b4b98600a3b904004a
         MULHDU  R5, R6, R7            // b90400b6b98600a5b904007a
+       MLGR    R1, R2                // b9860021
         DIVD    R1, R2                // b90400b2b90d00a1b904002b
         DIVD    R1, R2, R3            // b90400b2b90d00a1b904003b
         DIVW    R4, R5                // b90400b5b91d00a4b904005b
diff --git a/src/cmd/compile/internal/gc/ssa.go b/src/cmd/compile/internal/gc/ssa.go

index 5e8033ac34b36571826e63f8adccca3fb693bbed..97d9b0f9129253191ce03d4fdf1d8ba1e436355e 100644 (file)
--- a/src/cmd/compile/internal/gc/ssa.go
+++ b/src/cmd/compile/internal/gc/ssa.go
@@ -3600,8 +3600,8 @@ func init() {
                 func(s *state, n *Node, args []*ssa.Value) *ssa.Value {
                         return s.newValue2(ssa.OpMul64uhilo, types.NewTuple(types.Types[TUINT64], types.Types[TUINT64]), args[0], args[1])
                 },
-               sys.AMD64, sys.ARM64, sys.PPC64)
-       alias("math/bits", "Mul", "math/bits", "Mul64", sys.ArchAMD64, sys.ArchARM64, sys.ArchPPC64)
+               sys.AMD64, sys.ARM64, sys.PPC64, sys.S390X)
+       alias("math/bits", "Mul", "math/bits", "Mul64", sys.ArchAMD64, sys.ArchARM64, sys.ArchPPC64, sys.ArchS390X)
         addF("math/bits", "Add64",
                 func(s *state, n *Node, args []*ssa.Value) *ssa.Value {
                         return s.newValue3(ssa.OpAdd64carry, types.NewTuple(types.Types[TUINT64], types.Types[TUINT64]), args[0], args[1], args[2])
diff --git a/src/cmd/compile/internal/s390x/ssa.go b/src/cmd/compile/internal/s390x/ssa.go

index fc828946b9bd909ec1794c8cf59a359380a5c290..5acb391dcde214a9f4799186d3796ec66860bbd1 100644 (file)
--- a/src/cmd/compile/internal/s390x/ssa.go
+++ b/src/cmd/compile/internal/s390x/ssa.go
@@ -225,6 +225,19 @@ func ssaGenValue(s *gc.SSAGenState, v *ssa.Value) {
                         v.Fatalf("input[0] and output not in same register %s", v.LongString())
                 }
                 opregreg(s, v.Op.Asm(), r, v.Args[1].Reg())
+       case ssa.OpS390XMLGR:
+               // MLGR Rx R3 -> R2:R3
+               r0 := v.Args[0].Reg()
+               r1 := v.Args[1].Reg()
+               if r1 != s390x.REG_R3 {
+                       v.Fatalf("We require the multiplcand to be stored in R3 for MLGR %s", v.LongString())
+               }
+               p := s.Prog(s390x.AMLGR)
+               p.From.Type = obj.TYPE_REG
+               p.From.Reg = r0
+               p.To.Reg = s390x.REG_R2
+               p.To.Type = obj.TYPE_REG
+
         case ssa.OpS390XFMADD, ssa.OpS390XFMADDS,
                 ssa.OpS390XFMSUB, ssa.OpS390XFMSUBS:
                 r := v.Reg()
diff --git a/src/cmd/compile/internal/ssa/gen/S390X.rules b/src/cmd/compile/internal/ssa/gen/S390X.rules

index 91f88a1d63cad01aa915b108c64be7dbb149b315..98bf875f800d8413a6f4f13fafd9cdbea0c4e447 100644 (file)
--- a/src/cmd/compile/internal/ssa/gen/S390X.rules
+++ b/src/cmd/compile/internal/ssa/gen/S390X.rules
@@ -17,6 +17,7 @@
  (Mul(32|16|8)  x y) -> (MULLW  x y)
  (Mul32F x y) -> (FMULS x y)
  (Mul64F x y) -> (FMUL x y)
+(Mul64uhilo x y) -> (MLGR x y)
  
  (Div32F x y) -> (FDIVS x y)
  (Div64F x y) -> (FDIV x y)
diff --git a/src/cmd/compile/internal/ssa/gen/S390XOps.go b/src/cmd/compile/internal/ssa/gen/S390XOps.go

index d8d7fd1ef632254edc922d05e564812c3dc50f8d..b064e463778902ec540c973ebb21ef4f80d571bf 100644 (file)
--- a/src/cmd/compile/internal/ssa/gen/S390XOps.go
+++ b/src/cmd/compile/internal/ssa/gen/S390XOps.go
@@ -568,6 +568,19 @@ func init() {
                         clobberFlags: true,
                 },
  
+               // unsigned multiplication (64x64 → 128)
+               //
+               // Multiply the two 64-bit input operands together and place the 128-bit result into
+               // an even-odd register pair. The second register in the target pair also contains
+               // one of the input operands. Since we don't currently have a way to specify an
+               // even-odd register pair we hardcode this register pair as R2:R3.
+               {
+                       name:      "MLGR",
+                       argLength: 2,
+                       reg:       regInfo{inputs: []regMask{gp, r3}, outputs: []regMask{r2, r3}},
+                       asm:       "MLGR",
+               },
+
                 // pseudo operations to sum the output of the POPCNT instruction
                 {name: "SumBytes2", argLength: 1, typ: "UInt8"}, // sum the rightmost 2 bytes in arg0 ignoring overflow
                 {name: "SumBytes4", argLength: 1, typ: "UInt8"}, // sum the rightmost 4 bytes in arg0 ignoring overflow
diff --git a/src/cmd/compile/internal/ssa/opGen.go b/src/cmd/compile/internal/ssa/opGen.go

index 959f1defa8f3f30d98365700adbbeefb5b1a1f17..ab3ffcbe19bc32bde6c24dc951b95468e3169005 100644 (file)
--- a/src/cmd/compile/internal/ssa/opGen.go
+++ b/src/cmd/compile/internal/ssa/opGen.go
@@ -2071,6 +2071,7 @@ const (
         OpS390XLoweredAtomicExchange64
         OpS390XFLOGR
         OpS390XPOPCNT
+       OpS390XMLGR
         OpS390XSumBytes2
         OpS390XSumBytes4
         OpS390XSumBytes8
@@ -27878,6 +27879,21 @@ var opcodeTable = [...]opInfo{
                         },
                 },
         },
+       {
+               name:   "MLGR",
+               argLen: 2,
+               asm:    s390x.AMLGR,
+               reg: regInfo{
+                       inputs: []inputInfo{
+                               {1, 8},     // R3
+                               {0, 23551}, // R0 R1 R2 R3 R4 R5 R6 R7 R8 R9 R11 R12 R14
+                       },
+                       outputs: []outputInfo{
+                               {0, 4}, // R2
+                               {1, 8}, // R3
+                       },
+               },
+       },
         {
                 name:   "SumBytes2",
                 argLen: 1,
diff --git a/src/cmd/compile/internal/ssa/rewriteS390X.go b/src/cmd/compile/internal/ssa/rewriteS390X.go

index 20276ed6477240cb4063c9a67d2ef7190a08fbd5..264bf255ce3c00053787a4396983845d668f4ea3 100644 (file)
--- a/src/cmd/compile/internal/ssa/rewriteS390X.go
+++ b/src/cmd/compile/internal/ssa/rewriteS390X.go
@@ -335,6 +335,8 @@ func rewriteValueS390X(v *Value) bool {
                 return rewriteValueS390X_OpMul64_0(v)
         case OpMul64F:
                 return rewriteValueS390X_OpMul64F_0(v)
+       case OpMul64uhilo:
+               return rewriteValueS390X_OpMul64uhilo_0(v)
         case OpMul8:
                 return rewriteValueS390X_OpMul8_0(v)
         case OpNeg16:
@@ -4609,6 +4611,19 @@ func rewriteValueS390X_OpMul64F_0(v *Value) bool {
                 return true
         }
  }
+func rewriteValueS390X_OpMul64uhilo_0(v *Value) bool {
+       // match: (Mul64uhilo x y)
+       // cond:
+       // result: (MLGR x y)
+       for {
+               y := v.Args[1]
+               x := v.Args[0]
+               v.reset(OpS390XMLGR)
+               v.AddArg(x)
+               v.AddArg(y)
+               return true
+       }
+}
  func rewriteValueS390X_OpMul8_0(v *Value) bool {
         // match: (Mul8 x y)
         // cond:
diff --git a/src/cmd/internal/obj/s390x/a.out.go b/src/cmd/internal/obj/s390x/a.out.go

index 08ead40f538fe09d56b113148449d167e2df2f45..cc0bfab26bb2dff04b40a58c739c85bd28ffa489 100644 (file)
--- a/src/cmd/internal/obj/s390x/a.out.go
+++ b/src/cmd/internal/obj/s390x/a.out.go
@@ -240,6 +240,7 @@ const (
         AMULLD
         AMULHD
         AMULHDU
+       AMLGR
         ASUB
         ASUBC
         ASUBV
diff --git a/src/cmd/internal/obj/s390x/anames.go b/src/cmd/internal/obj/s390x/anames.go

index 2deae18b3cd62bb2156fafc866766b08b76e6837..c9e44e3f7a6c141c46d72207e47063c2204dc5b3 100644 (file)
--- a/src/cmd/internal/obj/s390x/anames.go
+++ b/src/cmd/internal/obj/s390x/anames.go
@@ -21,6 +21,7 @@ var Anames = []string{
         "MULLD",
         "MULHD",
         "MULHDU",
+       "MLGR",
         "SUB",
         "SUBC",
         "SUBV",
diff --git a/src/cmd/internal/obj/s390x/asmz.go b/src/cmd/internal/obj/s390x/asmz.go

index b6024ae481c2dbc7f0a628d693ccd1c49b673473..2ba3d1296994858247c17acc01b6831ea303b312 100644 (file)
--- a/src/cmd/internal/obj/s390x/asmz.go
+++ b/src/cmd/internal/obj/s390x/asmz.go
@@ -174,6 +174,7 @@ var optab = []Optab{
         {i: 12, as: ASUB, a1: C_LAUTO, a6: C_REG},
         {i: 4, as: AMULHD, a1: C_REG, a6: C_REG},
         {i: 4, as: AMULHD, a1: C_REG, a2: C_REG, a6: C_REG},
+       {i: 62, as: AMLGR, a1: C_REG, a6: C_REG},
         {i: 2, as: ADIVW, a1: C_REG, a2: C_REG, a6: C_REG},
         {i: 2, as: ADIVW, a1: C_REG, a6: C_REG},
         {i: 10, as: ASUB, a1: C_REG, a2: C_REG, a6: C_REG},
@@ -3407,6 +3408,9 @@ func (c *ctxtz) asmout(p *obj.Prog, asm *[]byte) {
                 d2 := c.regoff(&p.To)
                 zRXE(opcode, uint32(p.From.Reg), 0, 0, uint32(d2), 0, asm)
  
+       case 62: // equivalent of Mul64 in math/bits
+               zRRE(op_MLGR, uint32(p.To.Reg), uint32(p.From.Reg), asm)
+
         case 66:
                 zRR(op_BCR, 0, 0, asm)
  
diff --git a/test/codegen/mathbits.go b/test/codegen/mathbits.go

index 9cdfe0b06ac861f60f2c6782c58c18ca0470bf88..5adf7f5fcdf95524ee753f6eabf98f9e4535b0d2 100644 (file)
--- a/test/codegen/mathbits.go
+++ b/test/codegen/mathbits.go
@@ -557,6 +557,7 @@ func Mul(x, y uint) (hi, lo uint) {
         // arm64:"UMULH","MUL"
         // ppc64:"MULHDU","MULLD"
         // ppc64le:"MULHDU","MULLD"
+       // s390x:"MLGR"
         return bits.Mul(x, y)
  }
  
@@ -565,6 +566,7 @@ func Mul64(x, y uint64) (hi, lo uint64) {
         // arm64:"UMULH","MUL"
         // ppc64:"MULHDU","MULLD"
         // ppc64le:"MULHDU","MULLD"
+       // s390x:"MLGR"
         return bits.Mul64(x, y)
  }
author	Ruixin Bao <ruixin.bao@ibm.com>
	Sun, 8 Sep 2019 22:50:24 +0000 (18:50 -0400)
committer	Michael Munday <mike.munday@ibm.com>
	Fri, 13 Sep 2019 09:04:48 +0000 (09:04 +0000)
src/cmd/asm/internal/asm/testdata/s390x.s		patch \| blob \| history
src/cmd/compile/internal/gc/ssa.go		patch \| blob \| history
src/cmd/compile/internal/s390x/ssa.go		patch \| blob \| history
src/cmd/compile/internal/ssa/gen/S390X.rules		patch \| blob \| history
src/cmd/compile/internal/ssa/gen/S390XOps.go		patch \| blob \| history
src/cmd/compile/internal/ssa/opGen.go		patch \| blob \| history
src/cmd/compile/internal/ssa/rewriteS390X.go		patch \| blob \| history
src/cmd/internal/obj/s390x/a.out.go		patch \| blob \| history
src/cmd/internal/obj/s390x/anames.go		patch \| blob \| history
src/cmd/internal/obj/s390x/asmz.go		patch \| blob \| history
test/codegen/mathbits.go		patch \| blob \| history