runtime/internal/atomic: add 386/amd64 And/Or operators

author Mauri de Souza Meneguzzo <mauri870@gmail.com>

Wed, 1 Nov 2023 02:36:36 +0000 (02:36 +0000)

committer Keith Randall <khr@golang.org>

Mon, 6 Nov 2023 20:39:38 +0000 (20:39 +0000)
author Mauri de Souza Meneguzzo <mauri870@gmail.com>
Wed, 1 Nov 2023 02:36:36 +0000 (02:36 +0000)
committer Keith Randall <khr@golang.org>
Mon, 6 Nov 2023 20:39:38 +0000 (20:39 +0000)
diff --git a/src/runtime/internal/atomic/atomic_386.go b/src/runtime/internal/atomic/atomic_386.go

index bf2f4b922910ebf8e49efb394cc50261b9659c06..e74dcaa92dd3f06364b72628f65d92bb7e3a2bf7 100644 (file)
--- a/src/runtime/internal/atomic/atomic_386.go
+++ b/src/runtime/internal/atomic/atomic_386.go
@@ -76,6 +76,24 @@ func And(ptr *uint32, val uint32)
  //go:noescape
  func Or(ptr *uint32, val uint32)
  
+//go:noescape
+func And32(ptr *uint32, val uint32) uint32
+
+//go:noescape
+func Or32(ptr *uint32, val uint32) uint32
+
+//go:noescape
+func And64(ptr *uint64, val uint64) uint64
+
+//go:noescape
+func Or64(ptr *uint64, val uint64) uint64
+
+//go:noescape
+func Anduintptr(ptr *uintptr, val uintptr) uintptr
+
+//go:noescape
+func Oruintptr(ptr *uintptr, val uintptr) uintptr
+
  // NOTE: Do not add atomicxor8 (XOR is not idempotent).
  
  //go:noescape
diff --git a/src/runtime/internal/atomic/atomic_386.s b/src/runtime/internal/atomic/atomic_386.s

index 724d5152313bba596cff6423a455b3b79279827f..08812c37ecc61383d8ad2a83caa827a2a45d1f51 100644 (file)
--- a/src/runtime/internal/atomic/atomic_386.s
+++ b/src/runtime/internal/atomic/atomic_386.s
@@ -283,3 +283,84 @@ TEXT ·And(SB), NOSPLIT, $0-8
         LOCK
         ANDL    BX, (AX)
         RET
+
+// func And32(addr *uint32, v uint32) old uint32
+TEXT ·And32(SB), NOSPLIT, $0-12
+       MOVL    ptr+0(FP), BX
+       MOVL    val+4(FP), CX
+casloop:
+       MOVL    CX, DX
+       MOVL    (BX), AX
+       ANDL    AX, DX
+       LOCK
+       CMPXCHGL        DX, (BX)
+       JNZ casloop
+       MOVL    AX, ret+8(FP)
+       RET
+
+// func Or32(addr *uint32, v uint32) old uint32
+TEXT ·Or32(SB), NOSPLIT, $0-12
+       MOVL    ptr+0(FP), BX
+       MOVL    val+4(FP), CX
+casloop:
+       MOVL    CX, DX
+       MOVL    (BX), AX
+       ORL     AX, DX
+       LOCK
+       CMPXCHGL        DX, (BX)
+       JNZ casloop
+       MOVL    AX, ret+8(FP)
+       RET
+
+// func And64(addr *uint64, v uint64) old uint64
+TEXT ·And64(SB), NOSPLIT, $0-20
+       MOVL    ptr+0(FP), BP
+       // DI:SI = v
+       MOVL    val_lo+4(FP), SI
+       MOVL    val_hi+8(FP), DI
+       // DX:AX = *addr
+       MOVL    0(BP), AX
+       MOVL    4(BP), DX
+casloop:
+       // CX:BX = DX:AX (*addr) & DI:SI (mask)
+       MOVL    AX, BX
+       MOVL    DX, CX
+       ANDL    SI, BX
+       ANDL    DI, CX
+       LOCK
+       CMPXCHG8B       0(BP)
+       JNZ casloop
+       MOVL    AX, ret_lo+12(FP)
+       MOVL    DX, ret_hi+16(FP)
+       RET
+
+
+// func Or64(addr *uint64, v uint64) old uint64
+TEXT ·Or64(SB), NOSPLIT, $0-20
+       MOVL    ptr+0(FP), BP
+       // DI:SI = v
+       MOVL    val_lo+4(FP), SI
+       MOVL    val_hi+8(FP), DI
+       // DX:AX = *addr
+       MOVL    0(BP), AX
+       MOVL    4(BP), DX
+casloop:
+       // CX:BX = DX:AX (*addr) | DI:SI (mask)
+       MOVL    AX, BX
+       MOVL    DX, CX
+       ORL     SI, BX
+       ORL     DI, CX
+       LOCK
+       CMPXCHG8B       0(BP)
+       JNZ casloop
+       MOVL    AX, ret_lo+12(FP)
+       MOVL    DX, ret_hi+16(FP)
+       RET
+
+// func Anduintptr(addr *uintptr, v uintptr) old uintptr
+TEXT ·Anduintptr(SB), NOSPLIT, $0-12
+       JMP     ·And32(SB)
+
+// func Oruintptr(addr *uintptr, v uintptr) old uintptr
+TEXT ·Oruintptr(SB), NOSPLIT, $0-12
+       JMP     ·Or32(SB)
diff --git a/src/runtime/internal/atomic/atomic_amd64.go b/src/runtime/internal/atomic/atomic_amd64.go

index 52a83620c8f696ce338687464671eb2ac6eeb790..b439954093cd28b686d493cbba59042e35853b01 100644 (file)
--- a/src/runtime/internal/atomic/atomic_amd64.go
+++ b/src/runtime/internal/atomic/atomic_amd64.go
@@ -84,6 +84,24 @@ func And(ptr *uint32, val uint32)
  //go:noescape
  func Or(ptr *uint32, val uint32)
  
+//go:noescape
+func And32(ptr *uint32, val uint32) uint32
+
+//go:noescape
+func Or32(ptr *uint32, val uint32) uint32
+
+//go:noescape
+func And64(ptr *uint64, val uint64) uint64
+
+//go:noescape
+func Or64(ptr *uint64, val uint64) uint64
+
+//go:noescape
+func Anduintptr(ptr *uintptr, val uintptr) uintptr
+
+//go:noescape
+func Oruintptr(ptr *uintptr, val uintptr) uintptr
+
  // NOTE: Do not add atomicxor8 (XOR is not idempotent).
  
  //go:noescape
diff --git a/src/runtime/internal/atomic/atomic_amd64.s b/src/runtime/internal/atomic/atomic_amd64.s

index d21514b36b908a951a34e94fde9989ba4c401ece..ec75bf9332f79c7a90fd7269125efa482801ac81 100644 (file)
--- a/src/runtime/internal/atomic/atomic_amd64.s
+++ b/src/runtime/internal/atomic/atomic_amd64.s
@@ -223,3 +223,67 @@ TEXT ·And(SB), NOSPLIT, $0-12
         LOCK
         ANDL    BX, (AX)
         RET
+
+// func Or32(addr *uint32, v uint32) old uint32
+TEXT ·Or32(SB), NOSPLIT, $0-20
+       MOVQ    ptr+0(FP), BX
+       MOVL    val+8(FP), CX
+casloop:
+       MOVL    CX, DX
+       MOVL    (BX), AX
+       ORL     AX, DX
+       LOCK
+       CMPXCHGL        DX, (BX)
+       JNZ casloop
+       MOVL    AX, ret+16(FP)
+       RET
+
+// func And32(addr *uint32, v uint32) old uint32
+TEXT ·And32(SB), NOSPLIT, $0-20
+       MOVQ    ptr+0(FP), BX
+       MOVL    val+8(FP), CX
+casloop:
+       MOVL    CX, DX
+       MOVL    (BX), AX
+       ANDL    AX, DX
+       LOCK
+       CMPXCHGL        DX, (BX)
+       JNZ casloop
+       MOVL    AX, ret+16(FP)
+       RET
+
+// func Or64(addr *uint64, v uint64) old uint64
+TEXT ·Or64(SB), NOSPLIT, $0-24
+       MOVQ    ptr+0(FP), BX
+       MOVQ    val+8(FP), CX
+casloop:
+       MOVQ    CX, DX
+       MOVQ    (BX), AX
+       ORQ     AX, DX
+       LOCK
+       CMPXCHGQ        DX, (BX)
+       JNZ casloop
+       MOVQ    AX, ret+16(FP)
+       RET
+
+// func And64(addr *uint64, v uint64) old uint64
+TEXT ·And64(SB), NOSPLIT, $0-24
+       MOVQ    ptr+0(FP), BX
+       MOVQ    val+8(FP), CX
+casloop:
+       MOVQ    CX, DX
+       MOVQ    (BX), AX
+       ANDQ    AX, DX
+       LOCK
+       CMPXCHGQ        DX, (BX)
+       JNZ casloop
+       MOVQ    AX, ret+16(FP)
+       RET
+
+// func Anduintptr(addr *uintptr, v uintptr) old uintptr
+TEXT ·Anduintptr(SB), NOSPLIT, $0-24
+       JMP     ·And64(SB)
+
+// func Oruintptr(addr *uintptr, v uintptr) old uintptr
+TEXT ·Oruintptr(SB), NOSPLIT, $0-24
+       JMP     ·Or64(SB)
diff --git a/src/runtime/internal/atomic/atomic_andor_test.go b/src/runtime/internal/atomic/atomic_andor_test.go

index 73e8a3320d90ed44a4a69658624f570883ae396c..1c198ba5c42ef62340dbc9ba6aa825dfae13d618 100644 (file)
--- a/src/runtime/internal/atomic/atomic_andor_test.go
+++ b/src/runtime/internal/atomic/atomic_andor_test.go
@@ -1,4 +1,4 @@
-//go:build ppc64 || ppc64le || riscv64 || wasm
+//go:build 386 || amd64 || ppc64 || ppc64le || riscv64 || wasm
  
  //
  // Copyright 2023 The Go Authors. All rights reserved.
@@ -167,3 +167,83 @@ func TestOr64(t *testing.T) {
                 }
         }
  }
+
+func BenchmarkAnd32(b *testing.B) {
+       var x [128]uint32 // give x its own cache line
+       sink = &x
+       for i := 0; i < b.N; i++ {
+               atomic.And32(&x[63], uint32(i))
+       }
+}
+
+func BenchmarkAnd32Parallel(b *testing.B) {
+       var x [128]uint32 // give x its own cache line
+       sink = &x
+       b.RunParallel(func(pb *testing.PB) {
+               i := uint32(0)
+               for pb.Next() {
+                       atomic.And32(&x[63], i)
+                       i++
+               }
+       })
+}
+
+func BenchmarkAnd64(b *testing.B) {
+       var x [128]uint64 // give x its own cache line
+       sink = &x
+       for i := 0; i < b.N; i++ {
+               atomic.And64(&x[63], uint64(i))
+       }
+}
+
+func BenchmarkAnd64Parallel(b *testing.B) {
+       var x [128]uint64 // give x its own cache line
+       sink = &x
+       b.RunParallel(func(pb *testing.PB) {
+               i := uint64(0)
+               for pb.Next() {
+                       atomic.And64(&x[63], i)
+                       i++
+               }
+       })
+}
+
+func BenchmarkOr32(b *testing.B) {
+       var x [128]uint32 // give x its own cache line
+       sink = &x
+       for i := 0; i < b.N; i++ {
+               atomic.Or32(&x[63], uint32(i))
+       }
+}
+
+func BenchmarkOr32Parallel(b *testing.B) {
+       var x [128]uint32 // give x its own cache line
+       sink = &x
+       b.RunParallel(func(pb *testing.PB) {
+               i := uint32(0)
+               for pb.Next() {
+                       atomic.Or32(&x[63], i)
+                       i++
+               }
+       })
+}
+
+func BenchmarkOr64(b *testing.B) {
+       var x [128]uint64 // give x its own cache line
+       sink = &x
+       for i := 0; i < b.N; i++ {
+               atomic.Or64(&x[63], uint64(i))
+       }
+}
+
+func BenchmarkOr64Parallel(b *testing.B) {
+       var x [128]uint64 // give x its own cache line
+       sink = &x
+       b.RunParallel(func(pb *testing.PB) {
+               i := uint64(0)
+               for pb.Next() {
+                       atomic.Or64(&x[63], i)
+                       i++
+               }
+       })
+}
author	Mauri de Souza Meneguzzo <mauri870@gmail.com>
	Wed, 1 Nov 2023 02:36:36 +0000 (02:36 +0000)
committer	Keith Randall <khr@golang.org>
	Mon, 6 Nov 2023 20:39:38 +0000 (20:39 +0000)
src/runtime/internal/atomic/atomic_386.go		patch \| blob \| history
src/runtime/internal/atomic/atomic_386.s		patch \| blob \| history
src/runtime/internal/atomic/atomic_amd64.go		patch \| blob \| history
src/runtime/internal/atomic/atomic_amd64.s		patch \| blob \| history
src/runtime/internal/atomic/atomic_andor_test.go		patch \| blob \| history