runtime: improve CALLFN macro for ppc64x

author Lynn Boger <laboger@linux.vnet.ibm.com>

Tue, 11 Sep 2018 15:42:15 +0000 (11:42 -0400)

committer Lynn Boger <laboger@linux.vnet.ibm.com>

Tue, 25 Sep 2018 18:52:22 +0000 (18:52 +0000)
author Lynn Boger <laboger@linux.vnet.ibm.com>
Tue, 11 Sep 2018 15:42:15 +0000 (11:42 -0400)
committer Lynn Boger <laboger@linux.vnet.ibm.com>
Tue, 25 Sep 2018 18:52:22 +0000 (18:52 +0000)
diff --git a/src/runtime/asm_ppc64x.s b/src/runtime/asm_ppc64x.s

index 57877c0194c7dc403b4bac71f2d886bfdbb65c88..b180cb06ab9d0b3a5001f27f92aa098222729f31 100644 (file)
--- a/src/runtime/asm_ppc64x.s
+++ b/src/runtime/asm_ppc64x.s
@@ -390,15 +390,36 @@ TEXT NAME(SB), WRAPPER, $MAXSIZE-24;              \
         /* copy arguments to stack */           \
         MOVD    arg+16(FP), R3;                 \
         MOVWZ   argsize+24(FP), R4;                     \
-       MOVD    R1, R5;                         \
-       ADD     $(FIXED_FRAME-1), R5;                   \
-       SUB     $1, R3;                         \
-       ADD     R5, R4;                         \
-       CMP     R5, R4;                         \
-       BEQ     4(PC);                          \
-       MOVBZU  1(R3), R6;                      \
-       MOVBZU  R6, 1(R5);                      \
-       BR      -4(PC);                         \
+       MOVD    R1, R5;                         \
+       CMP     R4, $8;                         \
+       BLT     tailsetup;                      \
+       /* copy 8 at a time if possible */      \
+       ADD     $(FIXED_FRAME-8), R5;                   \
+       SUB     $8, R3;                         \
+top: \
+       MOVDU   8(R3), R7;                      \
+       MOVDU   R7, 8(R5);                      \
+       SUB     $8, R4;                         \
+       CMP     R4, $8;                         \
+       BGE     top;                            \
+       /* handle remaining bytes */    \
+       CMP     $0, R4;                 \
+       BEQ     callfn;                 \
+       ADD     $7, R3;                 \
+       ADD     $7, R5;                 \
+       BR      tail;                   \
+tailsetup: \
+       CMP     $0, R4;                 \
+       BEQ     callfn;                 \
+       ADD     $(FIXED_FRAME-1), R5;   \
+       SUB     $1, R3;                 \
+tail: \
+       MOVBU   1(R3), R6;              \
+       MOVBU   R6, 1(R5);              \
+       SUB     $1, R4;                 \
+       CMP     $0, R4;                 \
+       BGT     tail;                   \
+callfn: \
         /* call function */                     \
         MOVD    f+8(FP), R11;                   \
         MOVD    (R11), R12;                     \
author	Lynn Boger <laboger@linux.vnet.ibm.com>
	Tue, 11 Sep 2018 15:42:15 +0000 (11:42 -0400)
committer	Lynn Boger <laboger@linux.vnet.ibm.com>
	Tue, 25 Sep 2018 18:52:22 +0000 (18:52 +0000)