► Keras 3 API 文件 / Keras 應用程式 / VGG16 與 VGG19

VGG16 與 VGG19

`VGG16` 函數

keras.applications.VGG16(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg16",
)

實例化 VGG16 模型。

參考文獻

用於大規模圖像識別的極深卷積網路 (ICLR 2015)

對於圖像分類的使用案例，請參閱此頁面以獲取詳細範例。

對於遷移學習的使用案例，請務必閱讀遷移學習與微調指南。

此模型的預設輸入大小為 224x224。

注意：每個 Keras 應用程式都期望特定類型的輸入預處理。對於 VGG16，在將輸入傳遞到模型之前，請在您的輸入上呼叫 keras.applications.vgg16.preprocess_input。vgg16.preprocess_input 會將輸入圖像從 RGB 轉換為 BGR，然後相對於 ImageNet 資料集將每個顏色通道歸零中心，而不進行縮放。

參數

include_top：是否包含網路頂部的 3 個全連接層。
weights：None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。
input_tensor：可選的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。
input_shape：可選的形狀元組，僅當 include_top 為 False 時才指定（否則輸入形狀必須為 (224, 224, 3)（使用 channels_last 資料格式）或 (3, 224, 224)（使用 "channels_first" 資料格式）。它應該正好有 3 個輸入通道，並且寬度和高度應不小於 32。例如，(200, 200, 3) 將是一個有效值。
pooling：當 include_top 為 False 時，用於特徵提取的可選池化模式。
- None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全局平均池化，因此模型的輸出將是 2D 張量。
- max 表示將應用全局最大池化。
classes：用於將圖像分類成的可選類別數量，僅當 include_top 為 True 且未指定 weights 參數時才指定。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的激活函數。除非 include_top=True，否則忽略。設定 classifier_activation=None 以傳回「頂部」層的 logits。載入預訓練權重時，classifier_activation 只能是 None 或 "softmax"。
name：模型的名稱（字串）。

一個 Model 實例。

[原始碼]

`VGG19` 函數

keras.applications.VGG19(
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    input_shape=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name="vgg19",
)

實例化 VGG19 模型。

參考文獻

用於大規模圖像識別的極深卷積網路 (ICLR 2015)

對於圖像分類的使用案例，請參閱此頁面以獲取詳細範例。

對於遷移學習的使用案例，請務必閱讀遷移學習與微調指南。

此模型的預設輸入大小為 224x224。

注意：每個 Keras 應用程式都期望特定類型的輸入預處理。對於 VGG19，在將輸入傳遞到模型之前，請在您的輸入上呼叫 keras.applications.vgg19.preprocess_input。vgg19.preprocess_input 會將輸入圖像從 RGB 轉換為 BGR，然後相對於 ImageNet 資料集將每個顏色通道歸零中心，而不進行縮放。

參數

include_top：是否包含網路頂部的 3 個全連接層。
weights：None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。
input_tensor：可選的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。
input_shape：可選的形狀元組，僅當 include_top 為 False 時才指定（否則輸入形狀必須為 (224, 224, 3)（使用 channels_last 資料格式）或 (3, 224, 224)（使用 "channels_first" 資料格式）。它應該正好有 3 個輸入通道，並且寬度和高度應不小於 32。例如，(200, 200, 3) 將是一個有效值。
pooling：當 include_top 為 False 時，用於特徵提取的可選池化模式。
- None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全局平均池化，因此模型的輸出將是 2D 張量。
- max 表示將應用全局最大池化。
classes：用於將圖像分類成的可選類別數量，僅當 include_top 為 True 且未指定 weights 參數時才指定。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的激活函數。除非 include_top=True，否則忽略。設定 classifier_activation=None 以傳回「頂部」層的 logits。載入預訓練權重時，classifier_activation 只能是 None 或 "softmax"。
name：模型的名稱（字串）。

一個模型實例。

VGG16 與 VGG19

VGG16 函數

VGG19 函數

VGG16 與 VGG19

VGG16 函數

VGG19 函數

`VGG16` 函數

`VGG19` 函數