Keras 3 API 文件 / 層 API / 卷積層 / Conv3D 層

Conv3D 層

[原始碼]

Conv3D 類別

keras.layers.Conv3D(
    filters,
    kernel_size,
    strides=(1, 1, 1),
    padding="valid",
    data_format=None,
    dilation_rate=(1, 1, 1),
    groups=1,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

3D 卷積層。

此層創建一個卷積核,該卷積核與層輸入在 3D 空間(或時間)維度(寬度、高度和深度)上進行卷積,以產生輸出張量。如果 use_bias 為 True,則會創建一個偏置向量並添加到輸出中。最後,如果 activation 不是 None,它也會應用於輸出。

參數

  • filters:整數,輸出空間的維度(卷積中的濾波器數量)。
  • kernel_size:整數或 3 個整數的元組/列表,指定卷積窗口的大小。
  • strides:整數或 3 個整數的元組/列表,指定卷積的步幅長度。strides > 1dilation_rate > 1 不相容。
  • padding:字串,"valid""same"(不區分大小寫)。"valid" 表示無填充。"same" 會均勻地填充輸入的左/右或上/下。當 padding="same"strides=1 時,輸出與輸入具有相同的大小。
  • data_format:字串,"channels_last""channels_first"。輸入中維度的順序。"channels_last" 對應於形狀為 (batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels) 的輸入,而 "channels_first" 對應於形狀為 (batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3) 的輸入。它預設為在您的 Keras 設定檔 ~/.keras/keras.json 中找到的 image_data_format 值。如果您從未設定它,則它將為 "channels_last"
  • dilation_rate:整數或 3 個整數的元組/列表,指定用於擴張卷積的擴張率。
  • groups:一個正整數,指定輸入沿通道軸分割成的組數。每個組與 filters // groups 個濾波器分開進行卷積。輸出是沿通道軸的所有 groups 結果的串聯。輸入通道和 filters 都必須可被 groups 整除。
  • activation:激活函數。如果為 None,則不應用激活函數。
  • use_bias:布林值,如果為 True,則會將偏置添加到輸出中。
  • kernel_initializer:卷積核的初始化器。如果為 None,將使用預設初始化器 ("glorot_uniform")。
  • bias_initializer:偏置向量的初始化器。如果為 None,將使用預設初始化器 ("zeros")。
  • kernel_regularizer:卷積核的可選正規化器。
  • bias_regularizer:偏置向量的可選正規化器。
  • activity_regularizer:輸出的可選正規化函數。
  • kernel_constraint:可選的投影函數,用於在 Optimizer 更新後應用於核(例如,用於為層權重實施範數約束或值約束)。該函數必須將未投影的變數作為輸入,並且必須傳回投影的變數(必須具有相同的形狀)。當執行異步分佈式訓練時,約束是不安全的。
  • bias_constraint:可選的投影函數,用於在 Optimizer 更新後應用於偏置。

輸入形狀

  • 如果 data_format="channels_last":5D 張量,形狀為:(batch_size, spatial_dim1, spatial_dim2, spatial_dim3, channels)
  • 如果 data_format="channels_first":5D 張量,形狀為:(batch_size, channels, spatial_dim1, spatial_dim2, spatial_dim3)

輸出形狀

  • 如果 data_format="channels_last":5D 張量,形狀為:(batch_size, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3, filters)
  • 如果 data_format="channels_first":5D 張量,形狀為:(batch_size, filters, new_spatial_dim1, new_spatial_dim2, new_spatial_dim3)

返回

表示 activation(conv3d(inputs, kernel) + bias) 的 5D 張量。

引發

  • ValueError:當 strides > 1dilation_rate > 1 時。

範例

>>> x = np.random.rand(4, 10, 10, 10, 128)
>>> y = keras.layers.Conv3D(32, 3, activation='relu')(x)
>>> print(y.shape)
(4, 8, 8, 8, 32)