► Keras 3 API 文件 / 層 API / 卷積層 / Conv2D 層

Conv2D 層

`Conv2D` 類別

keras.layers.Conv2D(
    filters,
    kernel_size,
    strides=(1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1),
    groups=1,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

2D 卷積層。

此層建立一個卷積核，該卷積核在 2D 空間（或時間）維度（高度和寬度）上與層輸入進行卷積，以產生輸出張量。如果 use_bias 為 True，則會建立一個偏置向量並添加到輸出中。最後，如果 activation 不是 None，也會將其應用於輸出。

數值精度注意事項：雖然通常 Keras 運算執行結果在不同後端之間對於 float32 精度都一致到 1e-7，但 Conv2D 運算可能會顯示較大的差異。由於卷積運算中大量的逐元素乘法和加法，特別是在使用大型輸入或核心大小時，累積的浮點差異可能會超過 1e-7 的閾值。當使用不同的後端（例如，TensorFlow 與 JAX）或不同的硬體時，這些差異尤其明顯。

參數

filters：int，輸出空間的維度（卷積中濾波器的數量）。
kernel_size：int 或 2 個整數的 tuple/list，指定卷積窗口的大小。
strides：int 或 2 個整數的 tuple/list，指定卷積的步幅長度。strides > 1 與 dilation_rate > 1 不相容。
padding：字串，可以是 "valid" 或 "same"（不區分大小寫）。"valid" 表示不填充。"same" 會導致在輸入的左/右或上/下均勻填充。當 padding="same" 且 strides=1 時，輸出與輸入大小相同。
data_format：字串，可以是 "channels_last" 或 "channels_first"。輸入中維度的順序。"channels_last" 對應於形狀為 (batch_size, height, width, channels) 的輸入，而 "channels_first" 對應於形狀為 (batch_size, channels, height, width) 的輸入。它預設為在您的 Keras 設定檔 ~/.keras/keras.json 中找到的 image_data_format 值。如果您從未設定它，則它將為 "channels_last"。
dilation_rate：int 或 2 個整數的 tuple/list，指定用於擴張卷積的擴張率。
groups：一個正整數，指定輸入沿通道軸分割成的組數。每個組都與 filters // groups 個濾波器分開卷積。輸出是沿通道軸連接所有 groups 結果。輸入通道和 filters 都必須能被 groups 整除。
activation：激活函數。如果為 None，則不應用激活函數。
use_bias：bool，如果為 True，則會將偏置添加到輸出。
kernel_initializer：卷積核的初始化器。如果為 None，將使用預設初始化器 ("glorot_uniform")。
bias_initializer：偏置向量的初始化器。如果為 None，將使用預設初始化器 ("zeros")。
kernel_regularizer：卷積核的可選正規化器。
bias_regularizer：偏置向量的可選正規化器。
activity_regularizer：輸出的可選正規化函數。
kernel_constraint：可選的投影函數，在卷積核被 Optimizer 更新後應用於卷積核（例如，用於實作層權重的範數約束或值約束）。該函數必須將未投影的變數作為輸入，並且必須返回投影的變數（必須具有相同的形狀）。在執行非同步分散式訓練時，約束是不安全的。
bias_constraint：可選的投影函數，在偏置被 Optimizer 更新後應用於偏置。

輸入形狀

如果 data_format="channels_last"：一個 4D 張量，形狀為：(batch_size, height, width, channels)
如果 data_format="channels_first"：一個 4D 張量，形狀為：(batch_size, channels, height, width)

輸出形狀

如果 data_format="channels_last"：一個 4D 張量，形狀為：(batch_size, new_height, new_width, filters)
如果 data_format="channels_first"：一個 4D 張量，形狀為：(batch_size, filters, new_height, new_width)

一個 4D 張量，表示 activation(conv2d(inputs, kernel) + bias)。

引發

ValueError：當 strides > 1 和 dilation_rate > 1 時。

範例

>>> x = np.random.rand(4, 10, 10, 128)
>>> y = keras.layers.Conv2D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 32)

Conv2D 層

Conv2D 類別

Conv2D 層

Conv2D 類別

`Conv2D` 類別