► Keras 3 API 文件 / Keras 應用程式 / MobileNet、MobileNetV2 和 MobileNetV3

MobileNet、MobileNetV2 和 MobileNetV3

`MobileNet` 函數

keras.applications.MobileNet(
    input_shape=None,
    alpha=1.0,
    depth_multiplier=1,
    dropout=0.001,
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name=None,
)

實例化 MobileNet 架構。

參考文獻

MobileNets：用於行動視覺應用程式的高效率卷積神經網路

此函數回傳一個 Keras 圖像分類模型，可選擇性載入在 ImageNet 上預先訓練的權重。

對於圖像分類使用案例，請參閱此頁面以取得詳細範例。

對於遷移學習使用案例，請務必閱讀遷移學習與微調指南。

請注意：每個 Keras 應用程式都期望特定的輸入預處理方式。對於 MobileNet，在將輸入傳遞至模型之前，請在您的輸入上呼叫 keras.applications.mobilenet.preprocess_input。mobilenet.preprocess_input 將輸入像素縮放至 -1 和 1 之間。

引數

input_shape：選用形狀元組，僅在 include_top 為 False 時指定（否則輸入形狀必須為 (224, 224, 3)（使用 "channels_last" 資料格式）或 (3, 224, 224)（使用 "channels_first" 資料格式）。它應精確地具有 3 個輸入通道，且寬度和高度應不小於 32。例如，(200, 200, 3) 將會是一個有效值。預設為 None。如果提供了 input_tensor，則會忽略 input_shape。
alpha：控制網路的寬度。這在 MobileNet 論文中稱為寬度乘數。
- 如果 alpha < 1.0，則按比例減少每層中的濾波器數量。
- 如果 alpha > 1.0，則按比例增加每層中的濾波器數量。
- 如果 alpha == 1，則在每層中使用論文中的預設濾波器數量。預設為 1.0。
depth_multiplier：深度可分離卷積的深度乘數。這在 MobileNet 論文中稱為解析度乘數。預設為 1.0。
dropout：Dropout 率。預設為 0.001。
include_top：布林值，是否在網路頂部包含全連接層。預設為 True。
weights：None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。預設為 "imagenet"。
input_tensor：選用的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。input_tensor 對於在多個不同網路之間共享輸入非常有用。預設為 None。
pooling：當 include_top 為 False 時，用於特徵提取的選用池化模式。
- None（預設）表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全域平均池化，因此模型的輸出將會是 2D 張量。
- max 表示將應用全域最大池化。
classes：選用的類別數量，用於將圖像分類為這些類別，僅在 include_top 為 True 且未指定 weights 引數時指定。預設為 1000。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的啟動函數。除非 include_top=True，否則會忽略。設定 classifier_activation=None 以回傳「頂部」層的 logits。當載入預訓練權重時，classifier_activation 只能為 None 或 "softmax"。
name：字串，模型的名稱。

回傳

一個模型實例。

[原始碼]

`MobileNetV2` 函數

keras.applications.MobileNetV2(
    input_shape=None,
    alpha=1.0,
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    pooling=None,
    classes=1000,
    classifier_activation="softmax",
    name=None,
)

實例化 MobileNetV2 架構。

MobileNetV2 與原始 MobileNet 非常相似，不同之處在於它使用具有瓶頸特徵的反向殘差區塊。它的參數計數明顯低於原始 MobileNet。MobileNet 支援任何大於 32 x 32 的輸入大小，較大的圖像大小可提供更好的效能。

參考文獻

MobileNetV2：反向殘差和線性瓶頸 (CVPR 2018)

此函數回傳一個 Keras 圖像分類模型，可選擇性載入在 ImageNet 上預先訓練的權重。

對於圖像分類使用案例，請參閱此頁面以取得詳細範例。

對於遷移學習使用案例，請務必閱讀遷移學習與微調指南。

請注意：每個 Keras 應用程式都期望特定的輸入預處理方式。對於 MobileNetV2，在將輸入傳遞至模型之前，請在您的輸入上呼叫 keras.applications.mobilenet_v2.preprocess_input。mobilenet_v2.preprocess_input 將輸入像素縮放至 -1 和 1 之間。

引數

input_shape：選用形狀元組，僅在 include_top 為 False 時指定（否則輸入形狀必須為 (224, 224, 3)（使用 "channels_last" 資料格式）或 (3, 224, 224)（使用 "channels_first" 資料格式）。它應精確地具有 3 個輸入通道，且寬度和高度應不小於 32。例如，(200, 200, 3) 將會是一個有效值。預設為 None。如果提供了 input_tensor，則會忽略 input_shape。
alpha：控制網路的寬度。這在 MobileNet 論文中稱為寬度乘數。
- 如果 alpha < 1.0，則按比例減少每層中的濾波器數量。
- 如果 alpha > 1.0，則按比例增加每層中的濾波器數量。
- 如果 alpha == 1，則在每層中使用論文中的預設濾波器數量。預設為 1.0。
include_top：布林值，是否在網路頂部包含全連接層。預設為 True。
weights：None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。預設為 "imagenet"。
input_tensor：選用的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。input_tensor 對於在多個不同網路之間共享輸入非常有用。預設為 None。
pooling：當 include_top 為 False 時，用於特徵提取的選用池化模式。
- None（預設）表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全域平均池化，因此模型的輸出將會是 2D 張量。
- max 表示將應用全域最大池化。
classes：選用的類別數量，用於將圖像分類為這些類別，僅在 include_top 為 True 且未指定 weights 引數時指定。預設為 1000。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的啟動函數。除非 include_top=True，否則會忽略。設定 classifier_activation=None 以回傳「頂部」層的 logits。當載入預訓練權重時，classifier_activation 只能為 None 或 "softmax"。
name：字串，模型的名稱。

回傳

一個模型實例。

[原始碼]

`MobileNetV3Small` 函數

keras.applications.MobileNetV3Small(
    input_shape=None,
    alpha=1.0,
    minimalistic=False,
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    classes=1000,
    pooling=None,
    dropout_rate=0.2,
    classifier_activation="softmax",
    include_preprocessing=True,
    name="MobileNetV3Small",
)

實例化 MobileNetV3Small 架構。

參考文獻

搜尋 MobileNetV3 (ICCV 2019)

下表描述了 MobileNet v3 的效能

MACs 代表乘法累加運算

分類檢查點	MACs(M)	參數(M)	Top1 準確度	Pixel1 CPU(毫秒)
mobilenet_v3_large_1.0_224	217	5.4	75.6	51.2
mobilenet_v3_large_0.75_224	155	4.0	73.3	39.8
mobilenet_v3_large_minimalistic_1.0_224	209	3.9	72.3	44.1
mobilenet_v3_small_1.0_224	66	2.9	68.1	15.8
mobilenet_v3_small_0.75_224	44	2.4	65.4	12.8
mobilenet_v3_small_minimalistic_1.0_224	65	2.0	61.9	12.2

對於圖像分類使用案例，請參閱此頁面以取得詳細範例。

對於遷移學習使用案例，請務必閱讀遷移學習與微調指南。

請注意：每個 Keras 應用程式都期望特定的輸入預處理方式。對於 MobileNetV3，預設情況下，輸入預處理作為模型的一部分包含在內（作為 Rescaling 層），因此 keras.applications.mobilenet_v3.preprocess_input 實際上是一個直通函數。在此使用案例中，MobileNetV3 模型期望其輸入為浮點張量像素，其值在 [0-255] 範圍內。同時，可以透過將 include_preprocessing 引數設定為 False 來停用作為模型一部分的預處理（即 Rescaling 層）。在停用預處理的情況下，MobileNetV3 模型期望其輸入為浮點張量像素，其值在 [-1, 1] 範圍內。

引數

input_shape：選用形狀元組，如果您想要使用輸入圖像解析度不是 (224, 224, 3) 的模型，則需要指定此選項。它應精確地具有 3 個輸入通道。如果您想要從 input_tensor 推斷 input_shape，也可以省略此選項。如果您選擇同時包含 input_tensor 和 input_shape，則如果它們匹配，將會使用 input_shape；如果形狀不匹配，我們將會拋出錯誤。例如，(160, 160, 3) 將會是一個有效值。
alpha：控制網路的寬度。這在 MobileNetV3 論文中稱為深度乘數，但為了與 Keras 中的 MobileNetV1 保持一致而保留了名稱。
- 如果 alpha < 1.0，則按比例減少每層中的濾波器數量。
- 如果 alpha > 1.0，則按比例增加每層中的濾波器數量。
- 如果 alpha == 1，則在每層中使用論文中的預設濾波器數量。
minimalistic：除了大型和小型模型之外，此模組還包含所謂的極簡模型，這些模型具有與 MobilenetV3 相同的每層維度特性，但是，它們不使用任何進階區塊（squeeze-and-excite 單元、hard-swish 和 5x5 卷積）。雖然這些模型在 CPU 上的效率較低，但它們在 GPU/DSP 上的效能要高得多。
include_top：布林值，是否在網路頂部包含全連接層。預設為 True。
weights：字串，None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。
input_tensor：選用的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。
pooling：字串，當 include_top 為 False 時，用於特徵提取的選用池化模式。
- None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全域平均池化，因此模型的輸出將會是 2D 張量。
- max 表示將應用全域最大池化。
classes：整數，選用的類別數量，用於將圖像分類為這些類別，僅在 include_top 為 True 且未指定 weights 引數時指定。
dropout_rate：在最後一層要 dropout 的輸入單元比例。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的啟動函數。除非 include_top=True，否則會忽略。設定 classifier_activation=None 以回傳「頂部」層的 logits。當載入預訓練權重時，classifier_activation 只能為 None 或 "softmax"。
include_preprocessing：布林值，是否在網路底部包含預處理層 (Rescaling)。預設為 True。
name：字串，模型的名稱。

呼叫引數

inputs：浮點 numpy.array 或後端原生張量，4D 且具有 3 個顏色通道，如果 include_preprocessing 為 True，則值在 [0, 255] 範圍內，否則在 [-1, 1] 範圍內。

回傳

一個模型實例。

[原始碼]

`MobileNetV3Large` 函數

keras.applications.MobileNetV3Large(
    input_shape=None,
    alpha=1.0,
    minimalistic=False,
    include_top=True,
    weights="imagenet",
    input_tensor=None,
    classes=1000,
    pooling=None,
    dropout_rate=0.2,
    classifier_activation="softmax",
    include_preprocessing=True,
    name="MobileNetV3Large",
)

實例化 MobileNetV3Large 架構。

參考文獻

搜尋 MobileNetV3 (ICCV 2019)

下表描述了 MobileNet v3 的效能

MACs 代表乘法累加運算

分類檢查點	MACs(M)	參數(M)	Top1 準確度	Pixel1 CPU(毫秒)
mobilenet_v3_large_1.0_224	217	5.4	75.6	51.2
mobilenet_v3_large_0.75_224	155	4.0	73.3	39.8
mobilenet_v3_large_minimalistic_1.0_224	209	3.9	72.3	44.1
mobilenet_v3_small_1.0_224	66	2.9	68.1	15.8
mobilenet_v3_small_0.75_224	44	2.4	65.4	12.8
mobilenet_v3_small_minimalistic_1.0_224	65	2.0	61.9	12.2

對於圖像分類使用案例，請參閱此頁面以取得詳細範例。

對於遷移學習使用案例，請務必閱讀遷移學習與微調指南。

引數

input_shape：選用形狀元組，如果您想要使用輸入圖像解析度不是 (224, 224, 3) 的模型，則需要指定此選項。它應精確地具有 3 個輸入通道。如果您想要從 input_tensor 推斷 input_shape，也可以省略此選項。如果您選擇同時包含 input_tensor 和 input_shape，則如果它們匹配，將會使用 input_shape；如果形狀不匹配，我們將會拋出錯誤。例如，(160, 160, 3) 將會是一個有效值。
alpha：控制網路的寬度。這在 MobileNetV3 論文中稱為深度乘數，但為了與 Keras 中的 MobileNetV1 保持一致而保留了名稱。
- 如果 alpha < 1.0，則按比例減少每層中的濾波器數量。
- 如果 alpha > 1.0，則按比例增加每層中的濾波器數量。
- 如果 alpha == 1，則在每層中使用論文中的預設濾波器數量。
minimalistic：除了大型和小型模型之外，此模組還包含所謂的極簡模型，這些模型具有與 MobilenetV3 相同的每層維度特性，但是，它們不使用任何進階區塊（squeeze-and-excite 單元、hard-swish 和 5x5 卷積）。雖然這些模型在 CPU 上的效率較低，但它們在 GPU/DSP 上的效能要高得多。
include_top：布林值，是否在網路頂部包含全連接層。預設為 True。
weights：字串，None（隨機初始化）、"imagenet"（在 ImageNet 上預訓練）或要載入的權重檔案路徑之一。
input_tensor：選用的 Keras 張量（即 layers.Input() 的輸出），用作模型的圖像輸入。
pooling：字串，當 include_top 為 False 時，用於特徵提取的選用池化模式。
- None 表示模型的輸出將是最後一個卷積區塊的 4D 張量輸出。
- avg 表示將對最後一個卷積區塊的輸出應用全域平均池化，因此模型的輸出將會是 2D 張量。
- max 表示將應用全域最大池化。
classes：整數，選用的類別數量，用於將圖像分類為這些類別，僅在 include_top 為 True 且未指定 weights 引數時指定。
dropout_rate：在最後一層要 dropout 的輸入單元比例。
classifier_activation：str 或可呼叫物件。要在「頂部」層上使用的啟動函數。除非 include_top=True，否則會忽略。設定 classifier_activation=None 以回傳「頂部」層的 logits。當載入預訓練權重時，classifier_activation 只能為 None 或 "softmax"。
include_preprocessing：布林值，是否在網路底部包含預處理層 (Rescaling)。預設為 True。
name：字串，模型的名稱。

呼叫引數

inputs：浮點 numpy.array 或後端原生張量，4D 且具有 3 個顏色通道，如果 include_preprocessing 為 True，則值在 [0, 255] 範圍內，否則在 [-1, 1] 範圍內。

回傳

一個模型實例。

MobileNet、MobileNetV2 和 MobileNetV3

MobileNet 函數

MobileNetV2 函數

MobileNetV3Small 函數

MobileNetV3Large 函數

MobileNet、MobileNetV2 和 MobileNetV3

MobileNet 函數

MobileNetV2 函數

MobileNetV3Small 函數

下表描述了 MobileNet v3 的效能

MobileNetV3Large 函數

下表描述了 MobileNet v3 的效能

`MobileNet` 函數

`MobileNetV2` 函數

`MobileNetV3Small` 函數

`MobileNetV3Large` 函數