Keras 3 API 文件 / KerasNLP / 建模層 / FNet 編碼器層

FNet 編碼器層

[來源]

FNetEncoder 類別

keras_nlp.layers.FNetEncoder(
    intermediate_dim,
    dropout=0,
    activation="relu",
    layer_norm_epsilon=1e-05,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    **kwargs
)

FNet 編碼器。

此類別遵循 FNet 論文 中 FNet 編碼器層的架構。使用者可以實例化此類別的多個實例來堆疊編碼器。

遮罩注意事項:在官方 FNet 程式碼中,會將填充標記添加到輸入中。但是,會刪除填充遮罩,即會混合所有標記。這是因為如果我們在每個編碼器層中都應用填充遮罩,則某些頻率將會歸零。因此,我們在 call() 函數中不將填充遮罩作為輸入。

參數

  • intermediate_dim:整數。前饋網路的隱藏大小。
  • dropout:浮點數。應用於前饋網路的 dropout 值。預設值為 0.
  • activation:字串或 keras.activations。前饋網路的激活函數。預設值為 "relu"
  • layer_norm_epsilon:浮點數。層歸一化組件中的 epsilon 值。預設值為 1e-5
  • kernel_initializerstrkeras.initializers 初始化器。密集層的核初始化器。預設值為 "glorot_uniform"
  • bias_initializer:"string" 或 keras.initializers 初始化器。密集層的偏差初始化器。預設值為 "zeros"
  • **kwargs:傳遞給 keras.layers.Layer 的其他關鍵字參數,包括 nametrainabledtype 等。

範例

# Create a single FNet encoder layer.
encoder = keras_nlp.layers.FNetEncoder(
    intermediate_dim=64)

# Create a simple model containing the encoder.
input = keras.Input(shape=(10, 64))
output = encoder(input)
model = keras.Model(inputs=input, outputs=output)

# Call encoder on the inputs.
input_data = np.random.uniform(size=(1, 10, 64))
output = model(input_data)

參考