Keras 3 API 文件 / Keras 應用程式 / VGG16 與 VGG19

VGG16 與 VGG19

[原始碼]

VGG16 函數

keras.applications.VGG16(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg16",
)

實例化 VGG16 模型。

參考文獻

對於圖像分類的使用案例,請參閱此頁面以獲取詳細範例

對於遷移學習的使用案例,請務必閱讀遷移學習與微調指南

此模型的預設輸入大小為 224x224。

注意:每個 Keras 應用程式都期望特定類型的輸入預處理。對於 VGG16,在將輸入傳遞到模型之前,請在您的輸入上呼叫 keras.applications.vgg16.preprocess_inputvgg16.preprocess_input 會將輸入圖像從 RGB 轉換為 BGR,然後相對於 ImageNet 資料集將每個顏色通道歸零中心,而不進行縮放。

參數

  • include_top:是否包含網路頂部的 3 個全連接層。
  • weightsNone(隨機初始化)、"imagenet"(在 ImageNet 上預訓練)或要載入的權重檔案路徑之一。
  • input_tensor:可選的 Keras 張量(即 layers.Input() 的輸出),用作模型的圖像輸入。
  • input_shape:可選的形狀元組,僅當 include_topFalse 時才指定(否則輸入形狀必須為 (224, 224, 3)(使用 channels_last 資料格式)或 (3, 224, 224)(使用 "channels_first" 資料格式)。它應該正好有 3 個輸入通道,並且寬度和高度應不小於 32。例如,(200, 200, 3) 將是一個有效值。
  • pooling:當 include_topFalse 時,用於特徵提取的可選池化模式。
    • None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
    • avg 表示將對最後一個卷積區塊的輸出應用全局平均池化,因此模型的輸出將是 2D 張量。
    • max 表示將應用全局最大池化。
  • classes:用於將圖像分類成的可選類別數量,僅當 include_topTrue 且未指定 weights 參數時才指定。
  • classifier_activationstr 或可呼叫物件。要在「頂部」層上使用的激活函數。除非 include_top=True,否則忽略。設定 classifier_activation=None 以傳回「頂部」層的 logits。載入預訓練權重時,classifier_activation 只能是 None"softmax"
  • name:模型的名稱(字串)。

返回

一個 Model 實例。


[原始碼]

VGG19 函數

keras.applications.VGG19(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg19",
)

實例化 VGG19 模型。

參考文獻

對於圖像分類的使用案例,請參閱此頁面以獲取詳細範例

對於遷移學習的使用案例,請務必閱讀遷移學習與微調指南

此模型的預設輸入大小為 224x224。

注意:每個 Keras 應用程式都期望特定類型的輸入預處理。對於 VGG19,在將輸入傳遞到模型之前,請在您的輸入上呼叫 keras.applications.vgg19.preprocess_inputvgg19.preprocess_input 會將輸入圖像從 RGB 轉換為 BGR,然後相對於 ImageNet 資料集將每個顏色通道歸零中心,而不進行縮放。

參數

  • include_top:是否包含網路頂部的 3 個全連接層。
  • weightsNone(隨機初始化)、"imagenet"(在 ImageNet 上預訓練)或要載入的權重檔案路徑之一。
  • input_tensor:可選的 Keras 張量(即 layers.Input() 的輸出),用作模型的圖像輸入。
  • input_shape:可選的形狀元組,僅當 include_topFalse 時才指定(否則輸入形狀必須為 (224, 224, 3)(使用 channels_last 資料格式)或 (3, 224, 224)(使用 "channels_first" 資料格式)。它應該正好有 3 個輸入通道,並且寬度和高度應不小於 32。例如,(200, 200, 3) 將是一個有效值。
  • pooling:當 include_topFalse 時,用於特徵提取的可選池化模式。
    • None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
    • avg 表示將對最後一個卷積區塊的輸出應用全局平均池化,因此模型的輸出將是 2D 張量。
    • max 表示將應用全局最大池化。
  • classes:用於將圖像分類成的可選類別數量,僅當 include_topTrue 且未指定 weights 參數時才指定。
  • classifier_activationstr 或可呼叫物件。要在「頂部」層上使用的激活函數。除非 include_top=True,否則忽略。設定 classifier_activation=None 以傳回「頂部」層的 logits。載入預訓練權重時,classifier_activation 只能是 None"softmax"
  • name:模型的名稱(字串)。

返回

一個模型實例。