分詞器將原始字串輸入轉換為適合 Keras Embedding 層的整數輸入。它們還可以將預測的整數序列轉換回原始字串輸出。
Embedding
所有分詞器都是 keras_nlp.tokenizers.Tokenizer 的子類別,而後者又是 keras.layers.Layer 的子類別。分詞器通常應該在 tf.data.Dataset.map 中應用於訓練,並且可以包含在 keras.Model 中用於推斷。
keras_nlp.tokenizers.Tokenizer
keras.layers.Layer
keras.Model