aboutsummaryrefslogtreecommitdiff
path: root/ruy/kernel_arm32.cc
diff options
context:
space:
mode:
Diffstat (limited to 'ruy/kernel_arm32.cc')
-rw-r--r--ruy/kernel_arm32.cc8
1 files changed, 4 insertions, 4 deletions
diff --git a/ruy/kernel_arm32.cc b/ruy/kernel_arm32.cc
index b20f668..8782dce 100644
--- a/ruy/kernel_arm32.cc
+++ b/ruy/kernel_arm32.cc
@@ -1102,7 +1102,7 @@ void Kernel8bitNeon(const KernelParams8bit<4, 2>& params) {
"vdup.16 q13, r4\n" // dst_zero_point
// Add the destination zero point
- "vadd.i16 q14, q14, q13\n"
+ "vqadd.s16 q14, q14, q13\n"
// Cast-and-saturate from int16 to uint8
// Now all 8 1-byte values are in d30.
@@ -1226,7 +1226,7 @@ void Kernel8bitNeon(const KernelParams8bit<4, 2>& params) {
"vdup.16 q13, r4\n" // dst_zero_point
// Add the destination zero point
- "vadd.i16 q14, q14, q13\n"
+ "vqadd.s16 q14, q14, q13\n"
// Cast-and-saturate from int16 to int8
// Now all 8 1-byte values are in d30.
@@ -2014,7 +2014,7 @@ void Kernel8bitNeon1Col(const KernelParams8bit<4, 2>& params) {
"vdup.16 q13, r4\n" // dst_zero_point
// Add the destination zero point
- "vadd.i16 q14, q14, q13\n"
+ "vqadd.s16 q14, q14, q13\n"
// Cast-and-saturate from int16 to uint8
"vqmovun.s16 d30, q14\n"
@@ -2126,7 +2126,7 @@ void Kernel8bitNeon1Col(const KernelParams8bit<4, 2>& params) {
"vdup.16 q13, r4\n" // dst_zero_point
// Add the destination zero point
- "vadd.i16 q14, q14, q13\n"
+ "vqadd.s16 q14, q14, q13\n"
// Cast-and-saturate from int16 to int8
"vqmovn.s16 d30, q14\n"