Keras 3 API 文件 / KerasCV / 圖層 / 增強圖層 / GridMask 圖層

GridMask 圖層

[來源]

GridMask 類別

keras_cv.layers.GridMask(
    ratio_factor=(0, 0.5),
    rotation_factor=0.15,
    fill_mode="constant",
    fill_value=0.0,
    seed=None,
    **kwargs
)

用於網格遮罩增強的 GridMask 類別。

輸入形狀

值介於 [0, 255] 之間的整數或浮點數張量。具有以下形狀的 3D(未批次化)或 4D(批次化)張量:(..., 高度, 寬度, 通道),採用 "channels_last" 格式。

輸出形狀

具有以下形狀的 3D(未批次化)或 4D(批次化)張量:(..., 高度, 寬度, 通道),採用 "channels_last" 格式。

參數

  • ratio_factor:浮點數、兩個浮點數的元組或 keras_cv.FactorSampler。比例決定了間距與網格遮罩的比例。較低的值會使網格尺寸較小,而較高的值會使網格遮罩較大。浮點數應介於 [0, 1] 範圍內。0.5 表示網格和間距的大小相等。若要始終使用相同的值,請傳遞 keras_cv.src.ConstantFactorSampler()

    預設值為 (0, 0.5)。- rotation_factor:rotation_factor 將用於在訓練期間隨機旋轉 grid_mask。預設值為 0.1,這會導致輸出旋轉 [-10% * 2pi, 10% * 2pi] 範圍內的隨機量。

    表示為 2 Pi 分數的浮點數,或表示順時針和逆時針旋轉上下限的 2 個元素的元組。正值表示逆時針旋轉,而負值表示順時針旋轉。當表示為單一浮點數時,此值將用於上下限。例如,factor=(-0.2, 0.3) 會導致輸出旋轉 [-20% * 2pi, 30% * 2pi] 範圍內的隨機量。factor=0.2 會導致輸出旋轉 [-20% * 2pi, 20% * 2pi] 範圍內的隨機量。- __ fill_mode__: 網格區塊內的像素將根據給定的模式({"constant", "gaussian_noise"} 之一)進行填充,預設值為 "constant"。- constant:像素將填充相同的常數值。- gaussian_noise:像素將填充隨機的高斯雜訊。- fill_value:一個整數,表示當 fill_mode="constant" 時要在網格區塊內填充的值。有效的整數範圍為 [0 到 255]- seed:整數。用於建立隨機種子。

範例

(images, labels), _ = keras.datasets.cifar10.load_data()
random_gridmask = keras_cv.layers.preprocessing.GridMask()
augmented_images = random_gridmask(images)

參考