1 files changed, 266 insertions, 0 deletions
diff --git a/tensorflow_lite_support/custom_ops/kernel/ngrams_test.py b/tensorflow_lite_support/custom_ops/kernel/ngrams_test.py
new file mode 100644
index 00000000..e52ca285
--- /dev/null
+++ b/tensorflow_lite_support/custom_ops/kernel/ngrams_test.py
@@ -0,0 +1,266 @@
+# Copyright 2020 The TensorFlow Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ==============================================================================
+# Lint as: python3
+"""Tests for tensorflow_lite_support.custom_ops.ngrams."""
+
+import os
+import sys
+import timeit
+
+from absl import logging
+from absl.testing import parameterized
+import tensorflow as tf
+import tensorflow_text as tf_text
+from tensorflow.lite.python import interpreter as interpreter_wrapper  # pylint: disable=g-direct-tensorflow-import
+from tensorflow_lite_support.custom_ops.python import tflite_text_api
+
+# Force loaded shared object symbols to be globally visible. This is needed so
+# that the interpreter_wrapper, in one .so file, can see the op resolver
+# in a different .so file. Note that this may already be set by default.
+# pylint: disable=g-import-not-at-top,g-bad-import-order,unused-import
+if hasattr(sys, 'setdlopenflags') and hasattr(sys, 'getdlopenflags'):
+  sys.setdlopenflags(sys.getdlopenflags() | os.RTLD_GLOBAL)
+from tensorflow_lite_support.custom_ops.kernel import _pywrap_ngrams_op_resolver
+
+TEST_CASES = [
+    [['this', 'is', 'a', 'test']],
+    [['one']],
+    [['two', 'tokens'], ['a', 'b']],
+    [['has', 'three', 'tokens'], ['a', 'b', 'c'], ['0', '1', '2']],
+    [['a', 'ragged', 'tensor'], ['a'], ['0', '1']],
+    [[['a', 'multidimensional', 'test', 'case'], ['a', 'b', 'c', 'd', 'e']],
+     [['0', '1', '2', '3', '4', '5']]],
+]
+
+INVOKES_FOR_SINGLE_OP_BENCHMARK = 1000
+INVOKES_FOR_FLEX_DELEGATE_BENCHMARK = 100
+
+
+class NgramsTest(parameterized.TestCase):
+
+  _models = {}
+
+  def _make_model(self, rank, width, ragged_tensor=False, flex=False):
+    temp_dir = self.create_tempdir().full_path
+
+    key = (rank, width, ragged_tensor, flex)
+    if key in self._models:
+      return self._models[key]
+
+    ngrams = tf_text.ngrams if flex else tflite_text_api.ngrams
+
+    if ragged_tensor:
+      input_signature = [tf.TensorSpec(shape=[None], dtype=tf.string)]
+      rs = rank - 1
+      input_signature += [tf.TensorSpec(shape=[None], dtype=tf.int64)] * rs
+
+      class Model(tf.Module):
+
+        @tf.function(input_signature=input_signature)
+        def __call__(self, values, *args):
+          row_splits = list(args)
+          row_splits.reverse()
+          input_tensor = tf.RaggedTensor.from_nested_row_splits(
+              flat_values=values, nested_row_splits=tuple(row_splits))
+          output_tensor = ngrams(
+              input_tensor, width, reduction_type=tf_text.Reduction.STRING_JOIN)
+          output = [output_tensor.flat_values]
+          output.extend(list(output_tensor.nested_row_splits))
+          output.reverse()
+          return tuple(output)
+
+      tf.saved_model.save(Model(), temp_dir)
+    else:
+      shape = [None] * rank
+
+      class Model(tf.Module):
+
+        @tf.function(
+            input_signature=[tf.TensorSpec(shape=shape, dtype=tf.string)])
+        def __call__(self, input_tensor):
+          return ngrams(
+              input_tensor, width, reduction_type=tf_text.Reduction.STRING_JOIN)
+
+      tf.saved_model.save(Model(), temp_dir)
+
+    converter = tf.lite.TFLiteConverter.from_saved_model(temp_dir)
+    converter.inference_type = tf.float32
+    converter.inference_input_type = tf.float32
+    converter.allow_custom_ops = not flex
+    if flex:
+      converter.target_spec.supported_ops = [
+          tf.lite.OpsSet.TFLITE_BUILTINS, tf.lite.OpsSet.SELECT_TF_OPS
+      ]
+    model = converter.convert()
+    self._models[key] = model
+    return model
+
+  @parameterized.parameters([t] for t in TEST_CASES)
+  def test_width_2_tensor_equivalence(self, test_case):
+    input_tensor = tf.ragged.constant(test_case).to_tensor()
+    tf_output = tf_text.ngrams(
+        input_tensor, 2, reduction_type=tf_text.Reduction.STRING_JOIN)
+
+    rank = input_tensor.shape.rank
+    model = self._make_model(rank, 2, ragged_tensor=False, flex=False)
+    interpreter = interpreter_wrapper.InterpreterWithCustomOps(
+        model_content=model, custom_op_registerers=['AddNgramsCustomOp'])
+    interpreter.resize_tensor_input(0, input_tensor.shape)
+    interpreter.allocate_tensors()
+    interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                           input_tensor.numpy())
+    interpreter.invoke()
+    tflite_output = interpreter.get_tensor(
+        interpreter.get_output_details()[0]['index'])
+
+    self.assertEqual(tf_output.numpy().tolist(), tflite_output.tolist())
+
+  @parameterized.parameters([t] for t in TEST_CASES)
+  def test_width_3_tensor_equivalence(self, test_case):
+    input_tensor = tf.ragged.constant(test_case).to_tensor()
+    tf_output = tf_text.ngrams(
+        input_tensor, 3, reduction_type=tf_text.Reduction.STRING_JOIN)
+
+    rank = input_tensor.shape.rank
+    model = self._make_model(rank, 3, ragged_tensor=False, flex=False)
+    interpreter = interpreter_wrapper.InterpreterWithCustomOps(
+        model_content=model, custom_op_registerers=['AddNgramsCustomOp'])
+    interpreter.resize_tensor_input(0, input_tensor.shape)
+    interpreter.allocate_tensors()
+    interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                           input_tensor.numpy())
+    interpreter.invoke()
+    tflite_output = interpreter.get_tensor(
+        interpreter.get_output_details()[0]['index'])
+    self.assertEqual(tf_output.numpy().tolist(), tflite_output.tolist())
+
+  @parameterized.parameters([t] for t in TEST_CASES)
+  def test_width_2_ragged_tensor_equivalence(self, test_case):
+    input_tensor = tf.ragged.constant(test_case)
+    tf_output = tf_text.ngrams(
+        input_tensor, 2, reduction_type=tf_text.Reduction.STRING_JOIN)
+
+    rank = input_tensor.shape.rank
+    model = self._make_model(rank, 2, ragged_tensor=True, flex=False)
+    interpreter = interpreter_wrapper.InterpreterWithCustomOps(
+        model_content=model, custom_op_registerers=['AddNgramsCustomOp'])
+    interpreter.resize_tensor_input(0, input_tensor.flat_values.shape)
+    for r in range(rank - 1):
+      interpreter.resize_tensor_input(r + 1,
+                                      input_tensor.nested_row_splits[r].shape)
+    interpreter.allocate_tensors()
+    interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                           input_tensor.flat_values.numpy())
+    for r in range(rank - 1):
+      interpreter.set_tensor(interpreter.get_input_details()[r + 1]['index'],
+                             input_tensor.nested_row_splits[r].numpy())
+    interpreter.invoke()
+    tflite_output_values = interpreter.get_tensor(
+        interpreter.get_output_details()[0]['index'])
+    self.assertEqual(tf_output.flat_values.numpy().tolist(),
+                     tflite_output_values.tolist())
+    for i in range(rank - 1):
+      tflite_output_cur_row_splits = interpreter.get_tensor(
+          interpreter.get_output_details()[i + 1]['index'])
+      self.assertEqual(tf_output.nested_row_splits[i].numpy().tolist(),
+                       tflite_output_cur_row_splits.tolist())
+
+  @parameterized.parameters([t] for t in TEST_CASES)
+  def test_width_3_ragged_tensor_equivalence(self, test_case):
+    input_tensor = tf.ragged.constant(test_case)
+    tf_output = tf_text.ngrams(
+        input_tensor, 3, reduction_type=tf_text.Reduction.STRING_JOIN)
+
+    rank = input_tensor.shape.rank
+    model = self._make_model(rank, 3, ragged_tensor=True, flex=False)
+    interpreter = interpreter_wrapper.InterpreterWithCustomOps(
+        model_content=model, custom_op_registerers=['AddNgramsCustomOp'])
+    interpreter.resize_tensor_input(0, input_tensor.flat_values.shape)
+    for r in range(rank - 1):
+      interpreter.resize_tensor_input(r + 1,
+                                      input_tensor.nested_row_splits[r].shape)
+    interpreter.allocate_tensors()
+    interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                           input_tensor.flat_values.numpy())
+    for r in range(rank - 1):
+      interpreter.set_tensor(interpreter.get_input_details()[r + 1]['index'],
+                             input_tensor.nested_row_splits[r].numpy())
+    interpreter.invoke()
+    tflite_output_values = interpreter.get_tensor(
+        interpreter.get_output_details()[0]['index'])
+    self.assertEqual(tf_output.flat_values.numpy().tolist(),
+                     tflite_output_values.tolist())
+    for i in range(rank - 1):
+      tflite_output_cur_row_splits = interpreter.get_tensor(
+          interpreter.get_output_details()[i + 1]['index'])
+      self.assertEqual(tf_output.nested_row_splits[i].numpy().tolist(),
+                       tflite_output_cur_row_splits.tolist())
+
+  def test_latency(self):
+    latency_op = 0.0
+    for test_case in TEST_CASES:
+      input_tensor = tf.ragged.constant(test_case)
+
+      rank = input_tensor.shape.rank
+      model = self._make_model(rank, 3, ragged_tensor=True, flex=False)
+      interpreter = interpreter_wrapper.InterpreterWithCustomOps(
+          model_content=model, custom_op_registerers=['AddNgramsCustomOp'])
+      interpreter.resize_tensor_input(0, input_tensor.flat_values.shape)
+      for r in range(rank - 1):
+        interpreter.resize_tensor_input(r + 1,
+                                        input_tensor.nested_row_splits[r].shape)
+      interpreter.allocate_tensors()
+      interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                             input_tensor.flat_values.numpy())
+      for r in range(rank - 1):
+        interpreter.set_tensor(interpreter.get_input_details()[r + 1]['index'],
+                               input_tensor.nested_row_splits[r].numpy())
+      start_time = timeit.default_timer()
+      for _ in range(INVOKES_FOR_SINGLE_OP_BENCHMARK):
+        interpreter.invoke()
+      latency_op = latency_op + timeit.default_timer() - start_time
+    latency_op = latency_op / (
+        INVOKES_FOR_SINGLE_OP_BENCHMARK * len(TEST_CASES))
+
+    latency_flex = 0.0
+    for test_case in TEST_CASES:
+      input_tensor = tf.ragged.constant(test_case)
+
+      rank = input_tensor.shape.rank
+      model = self._make_model(rank, 3, ragged_tensor=True, flex=True)
+      interpreter = interpreter_wrapper.Interpreter(model_content=model)
+      interpreter.resize_tensor_input(0, input_tensor.flat_values.shape)
+      for r in range(rank - 1):
+        interpreter.resize_tensor_input(r + 1,
+                                        input_tensor.nested_row_splits[r].shape)
+      interpreter.allocate_tensors()
+      interpreter.set_tensor(interpreter.get_input_details()[0]['index'],
+                             input_tensor.flat_values.numpy())
+      for r in range(rank - 1):
+        interpreter.set_tensor(interpreter.get_input_details()[r + 1]['index'],
+                               input_tensor.nested_row_splits[r].numpy())
+      start_time = timeit.default_timer()
+      for _ in range(INVOKES_FOR_FLEX_DELEGATE_BENCHMARK):
+        interpreter.invoke()
+      latency_flex = latency_flex + timeit.default_timer() - start_time
+    latency_flex = latency_flex / (
+        INVOKES_FOR_FLEX_DELEGATE_BENCHMARK * len(TEST_CASES))
+
+    logging.info('Latency (single op): %fms', latency_op * 1000.0)
+    logging.info('Latency (flex delegate): %fms', latency_flex * 1000.0)
+
+
+if __name__ == '__main__':
+  tf.test.main()