► KerasHub：預訓練模型 / API 文件 / 模型 API / ImageClassifier

ImageClassifier

`ImageClassifier` 類別

keras_hub.models.ImageClassifier(
    backbone,
    num_classes,
    preprocessor=None,
    pooling="avg",
    activation=None,
    dropout=0.0,
    head_dtype=None,
    **kwargs
)

所有影像分類任務的基礎類別。

ImageClassifier 任務封裝了 keras_hub.models.Backbone 和 keras_hub.models.Preprocessor，以建立可用於影像分類的模型。ImageClassifier 任務接受額外的 num_classes 引數，以控制預測的輸出類別數量。

若要使用 fit() 進行微調，請傳遞包含 (x, y) 標籤tuple的資料集，其中 x 是字串，而 y 是 [0, num_classes) 範圍內的整數。所有 ImageClassifier 任務都包含 from_preset() 建構函式，可用於載入預先訓練的設定檔和權重。

引數

backbone：keras_hub.models.Backbone 執行個體或 keras.Model。
num_classes：整數。要預測的類別數量。
preprocessor：None、keras_hub.models.Preprocessor 執行個體、keras.Layer 執行個體或可呼叫物件。如果為 None，則不會將預處理套用至輸入。
pooling："avg" 或 "max"。要套用在 backbone 輸出上的池化類型。預設為平均池化。
activation：None、字串或可呼叫物件。要在 Dense 層上使用的啟動函式。設定 activation=None 以傳回輸出 logits。預設為 "softmax"。
head_dtype：None、字串或 keras.mixed_precision.DTypePolicy。用於分類head的計算和權重的 dtype。

範例

呼叫 predict() 以執行推論。

# Load preset and train
images = np.random.randint(0, 256, size=(2, 224, 224, 3))
classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.predict(images)

在單一批次上呼叫 fit()。

# Load preset and train
images = np.random.randint(0, 256, size=(2, 224, 224, 3))
labels = [0, 3]
classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.fit(x=images, y=labels, batch_size=2)

使用自訂損失、最佳化器和 backbone 呼叫 fit()。

classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=keras.optimizers.Adam(5e-5),
)
classifier.backbone.trainable = False
classifier.fit(x=images, y=labels, batch_size=2)

自訂 backbone。

images = np.random.randint(0, 256, size=(2, 224, 224, 3))
labels = [0, 3]
backbone = keras_hub.models.ResNetBackbone(
    stackwise_num_filters=[64, 64, 64],
    stackwise_num_blocks=[2, 2, 2],
    stackwise_num_strides=[1, 2, 2],
    block_type="basic_block",
    use_pre_activation=True,
    pooling="avg",
)
classifier = keras_hub.models.ImageClassifier(
    backbone=backbone,
    num_classes=4,
)
classifier.fit(x=images, y=labels, batch_size=2)

[source]

`from_preset` 方法

ImageClassifier.from_preset(preset, load_weights=True, **kwargs)

從模型預設集例項化 keras_hub.models.Task。

預設集是組態、權重和其他檔案資產的目錄，用於儲存和載入預先訓練的模型。preset 可以作為下列其中一項傳遞：

內建預設集識別碼，例如 'bert_base_en'
Kaggle Models 控制代碼，例如 'kaggle://user/bert/keras/bert_base_en'
Hugging Face 控制代碼，例如 'hf://user/bert_base_en'
本機預設集目錄的路徑，例如 './bert_base_en'

對於任何 Task 子類別，您可以執行 cls.presets.keys() 以列出類別上可用的所有內建預設集。

此建構函式可以透過兩種方式之一呼叫。從任務特定的基礎類別（例如 keras_hub.models.CausalLM.from_preset()）呼叫，或從模型類別（例如 keras_hub.models.BertTextClassifier.from_preset()）呼叫。如果從基礎類別呼叫，則傳回物件的子類別將從預設集目錄中的組態推斷而來。

引數

preset：字串。內建預設集識別碼、Kaggle Models 控制代碼、Hugging Face 控制代碼或本機目錄的路徑。
load_weights：布林值。如果為 True，則儲存的權重將載入至模型架構中。如果為 False，則所有權重都將隨機初始化。

範例

# Load a Gemma generative task.
causal_lm = keras_hub.models.CausalLM.from_preset(
    "gemma_2b_en",
)

# Load a Bert classification task.
model = keras_hub.models.TextClassifier.from_preset(
    "bert_base_en",
    num_classes=2,
)

預設集	參數	說明
densenet_121_imagenet	7.04M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 121 層 DenseNet 模型。
densenet_169_imagenet	12.64M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 169 層 DenseNet 模型。
densenet_201_imagenet	18.32M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 201 層 DenseNet 模型。
efficientnet_lite0_ra_imagenet	4.65M	使用 RandAugment 配方在 ImageNet 1k 資料集上微調的 EfficientNet-Lite 模型。
efficientnet_b0_ra_imagenet	5.29M	使用 RandAugment 配方在 ImageNet 1k 資料集上預先訓練的 EfficientNet B0 模型。
efficientnet_b0_ra4_e3600_r224_imagenet	5.29M	Ross Wightman 在 ImageNet 1k 資料集上預先訓練的 EfficientNet B0 模型。使用 timm 指令碼訓練，其超參數靈感來自 MobileNet-V4 small，並混合了 timm 和「ResNet Strikes Back」的常用超參數。
efficientnet_es_ra_imagenet	5.44M	使用 RandAugment 配方在 ImageNet 1k 資料集上訓練的 EfficientNet-EdgeTPU Small 模型。
efficientnet_em_ra2_imagenet	6.90M	使用 RandAugment2 配方在 ImageNet 1k 資料集上訓練的 EfficientNet-EdgeTPU Medium 模型。
efficientnet_b1_ft_imagenet	7.79M	在 ImageNet 1k 資料集上微調的 EfficientNet B1 模型。
efficientnet_b1_ra4_e3600_r240_imagenet	7.79M	Ross Wightman 在 ImageNet 1k 資料集上預先訓練的 EfficientNet B1 模型。使用 timm 指令碼訓練，其超參數靈感來自 MobileNet-V4 small，並混合了 timm 和「ResNet Strikes Back」的常用超參數。
efficientnet_b2_ra_imagenet	9.11M	使用 RandAugment 配方在 ImageNet 1k 資料集上預先訓練的 EfficientNet B2 模型。
efficientnet_el_ra_imagenet	10.59M	使用 RandAugment 配方在 ImageNet 1k 資料集上訓練的 EfficientNet-EdgeTPU Large 模型。
efficientnet_b3_ra2_imagenet	12.23M	使用 RandAugment2 配方在 ImageNet 1k 資料集上預先訓練的 EfficientNet B3 模型。
efficientnet2_rw_t_ra2_imagenet	13.65M	使用 RandAugment2 配方在 ImageNet 1k 資料集上訓練的 EfficientNet-v2 Tiny 模型。
efficientnet_b4_ra2_imagenet	19.34M	使用 RandAugment2 配方在 ImageNet 1k 資料集上預先訓練的 EfficientNet B4 模型。
efficientnet2_rw_s_ra2_imagenet	23.94M	使用 RandAugment2 配方在 ImageNet 1k 資料集上訓練的 EfficientNet-v2 Small 模型。
efficientnet_b5_sw_imagenet	30.39M	Ross Wightman 在 ImageNet 12k 資料集上預先訓練的 EfficientNet B5 模型。基於 Swin Transformer 訓練/預先訓練配方，並進行了修改（與 DeiT 和 ConvNeXt 配方相關）。
efficientnet_b5_sw_ft_imagenet	30.39M	Ross Wightman 在 ImageNet 12k 資料集上預先訓練，並在 ImageNet-1k 上微調的 EfficientNet B5 模型。基於 Swin Transformer 訓練/預先訓練配方，並進行了修改（與 DeiT 和 ConvNeXt 配方相關）。
efficientnet2_rw_m_agc_imagenet	53.24M	使用自適應梯度裁剪在 ImageNet 1k 資料集上訓練的 EfficientNet-v2 Medium 模型。
mit_b0_ade20k_512	3.32M	具有 8 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b0_cityscapes_1024	3.32M	具有 8 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b1_ade20k_512	13.16M	具有 8 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b1_cityscapes_1024	13.16M	具有 8 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b2_ade20k_512	24.20M	具有 16 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b2_cityscapes_1024	24.20M	具有 16 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b3_ade20k_512	44.08M	具有 28 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b3_cityscapes_1024	44.08M	具有 28 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b4_ade20k_512	60.85M	具有 41 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b4_cityscapes_1024	60.85M	具有 41 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b5_ade20k_640	81.45M	具有 52 個 transformer 區塊的 MiT (MixTransformer) 模型。
mit_b5_cityscapes_1024	81.45M	具有 52 個 transformer 區塊的 MiT (MixTransformer) 模型。
mobilenet_v3_small_050_imagenet	278.78K	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 Small MobileNet V3 模型。
resnet_18_imagenet	11.19M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 18 層 ResNet 模型。
resnet_vd_18_imagenet	11.72M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 18 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_34_imagenet	21.84M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 34 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_50_imagenet	23.56M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 50 層 ResNet 模型。
resnet_v2_50_imagenet	23.56M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 50 層 ResNetV2 模型。
resnet_vd_50_imagenet	25.63M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 50 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_50_ssld_imagenet	25.63M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練，並具有知識蒸餾的 50 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_50_ssld_v2_imagenet	25.63M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練，並具有知識蒸餾和 AutoAugment 的 50 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_50_ssld_v2_fix_imagenet	25.63M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練，並具有知識蒸餾、AutoAugment 和分類head額外微調的 50 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_101_imagenet	42.61M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 101 層 ResNet 模型。
resnet_v2_101_imagenet	42.61M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 101 層 ResNetV2 模型。
resnet_vd_101_imagenet	44.67M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 101 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_101_ssld_imagenet	44.67M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練，並具有知識蒸餾的 101 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_152_imagenet	58.30M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 152 層 ResNet 模型。
resnet_vd_152_imagenet	60.36M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 152 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
resnet_vd_200_imagenet	74.93M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 200 層 ResNetVD（具有 bag of tricks 的 ResNet）模型。
vgg_11_imagenet	9.22M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 11 層 vgg 模型。
vgg_13_imagenet	9.40M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 13 層 vgg 模型。
vgg_16_imagenet	14.71M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 16 層 vgg 模型。
vgg_19_imagenet	20.02M	在 ImageNet 1k 資料集上以 224x224 解析度預先訓練的 19 層 vgg 模型。
vit_base_patch16_224_imagenet	85.80M	在 ImageNet 1k 資料集上以 224x224 影像解析度預先訓練的 ViT-B16 模型
vit_base_patch16_224_imagenet21k	85.80M	在 ImageNet 21k 資料集上以 224x224 影像解析度預先訓練的 ViT-B16 backbone
vit_base_patch16_384_imagenet	86.09M	在 ImageNet 1k 資料集上以 384x384 影像解析度預先訓練的 ViT-B16 模型
vit_base_patch32_224_imagenet21k	87.46M	在 ImageNet 21k 資料集上以 224x224 影像解析度預先訓練的 ViT-B32 backbone
vit_base_patch32_384_imagenet	87.53M	在 ImageNet 1k 資料集上以 384x384 影像解析度預先訓練的 ViT-B32 模型
vit_large_patch16_224_imagenet	303.30M	在 ImageNet 1k 資料集上以 224x224 影像解析度預先訓練的 ViT-L16 模型
vit_large_patch16_224_imagenet21k	303.30M	在 ImageNet 21k 資料集上以 224x224 影像解析度預先訓練的 ViT-L16 backbone
vit_large_patch16_384_imagenet	303.69M	在 ImageNet 1k 資料集上以 384x384 影像解析度預先訓練的 ViT-L16 模型
vit_large_patch32_224_imagenet21k	305.51M	在 ImageNet 21k 資料集上以 224x224 影像解析度預先訓練的 ViT-L32 backbone
vit_large_patch32_384_imagenet	305.61M	在 ImageNet 1k 資料集上以 384x384 影像解析度預先訓練的 ViT-L32 模型
vit_huge_patch14_224_imagenet21k	630.76M	在 ImageNet 21k 資料集上以 224x224 影像解析度預先訓練的 ViT-H14 backbone

[source]

`compile` 方法

ImageClassifier.compile(optimizer="auto", loss="auto", metrics="auto", **kwargs)

設定 ImageClassifier 任務以進行訓練。

ImageClassifier 任務使用 optimizer、loss 和 metrics 的預設值擴充了 keras.Model.compile 的預設編譯簽章。若要覆寫這些預設值，請在編譯期間將任何值傳遞至這些引數。

引數

optimizer："auto"、最佳化器名稱或 keras.Optimizer 執行個體。預設為 "auto"，這會針對指定的模型和任務使用預設最佳化器。如需有關可能的 optimizer 值的詳細資訊，請參閱 keras.Model.compile 和 keras.optimizers。
loss："auto"、損失名稱或 keras.losses.Loss 執行個體。預設為 "auto"，其中 keras.losses.SparseCategoricalCrossentropy 損失將套用於分類任務。如需有關可能的 loss 值的詳細資訊，請參閱 keras.Model.compile 和 keras.losses。
metrics："auto"，或要在訓練和測試期間由模型評估的metrics清單。預設為 "auto"，其中 keras.metrics.SparseCategoricalAccuracy 將套用以追蹤模型在訓練期間的準確度。如需有關可能的 metrics 值的詳細資訊，請參閱 keras.Model.compile 和 keras.metrics。
**kwargs：如需編譯方法支援的完整引數清單，請參閱 keras.Model.compile。

[source]

`save_to_preset` 方法

ImageClassifier.save_to_preset(preset_dir)

將任務儲存到預設集目錄。

引數

preset_dir：本機模型預設集目錄的路徑。

`preprocessor` 屬性

keras_hub.models.ImageClassifier.preprocessor

用於預處理輸入的 keras_hub.models.Preprocessor 層。

`backbone` 屬性

keras_hub.models.ImageClassifier.backbone

具有核心架構的 keras_hub.models.Backbone 模型。

ImageClassifier

ImageClassifier 類別

from_preset 方法

compile 方法

save_to_preset 方法

preprocessor 屬性

backbone 屬性

ImageClassifier