KerasHub:預訓練模型 / API 文件 / 模型架構 / ResNet / ResNetImageClassifier 模型

ResNetImageClassifier 模型

[原始碼]

ResNetImageClassifier 類別

keras_hub.models.ResNetImageClassifier(
    backbone,
    num_classes,
    preprocessor=None,
    pooling="avg",
    activation=None,
    dropout=0.0,
    head_dtype=None,
    **kwargs
)

所有圖像分類任務的基底類別。

ImageClassifier 任務封裝了 keras_hub.models.Backbonekeras_hub.models.Preprocessor,以建立可用於圖像分類的模型。ImageClassifier 任務接受額外的 num_classes 參數,用於控制預測的輸出類別數量。

若要使用 fit() 進行微調,請傳遞包含 (x, y) 標籤元組的資料集,其中 x 是字串,y[0, num_classes) 範圍內的整數。所有 ImageClassifier 任務都包含 from_preset() 建構子,可用於載入預訓練的組態和權重。

引數

  • backbonekeras_hub.models.Backbone 實例或 keras.Model
  • num_classes:整數。要預測的類別數量。
  • preprocessorNonekeras_hub.models.Preprocessor 實例、keras.Layer 實例或可呼叫物件。如果為 None,則不會對輸入套用任何預處理。
  • pooling"avg""max"。要在 backbone 輸出上套用的池化類型。預設為平均池化。
  • activationNone、字串或可呼叫物件。要在 Dense 層上使用的啟動函數。設定 activation=None 以傳回輸出 logits。預設為 "softmax"
  • head_dtypeNone、字串或 keras.mixed_precision.DTypePolicy。用於分類 head 的計算和權重的 dtype。

範例

呼叫 predict() 以執行推論。

# Load preset and train
images = np.random.randint(0, 256, size=(2, 224, 224, 3))
classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.predict(images)

在單一批次上呼叫 fit()

# Load preset and train
images = np.random.randint(0, 256, size=(2, 224, 224, 3))
labels = [0, 3]
classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.fit(x=images, y=labels, batch_size=2)

使用自訂的損失函數、最佳化器和 backbone 呼叫 fit()

classifier = keras_hub.models.ImageClassifier.from_preset(
    "resnet_50_imagenet"
)
classifier.compile(
    loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
    optimizer=keras.optimizers.Adam(5e-5),
)
classifier.backbone.trainable = False
classifier.fit(x=images, y=labels, batch_size=2)

自訂 backbone。

images = np.random.randint(0, 256, size=(2, 224, 224, 3))
labels = [0, 3]
backbone = keras_hub.models.ResNetBackbone(
    stackwise_num_filters=[64, 64, 64],
    stackwise_num_blocks=[2, 2, 2],
    stackwise_num_strides=[1, 2, 2],
    block_type="basic_block",
    use_pre_activation=True,
    pooling="avg",
)
classifier = keras_hub.models.ImageClassifier(
    backbone=backbone,
    num_classes=4,
)
classifier.fit(x=images, y=labels, batch_size=2)

[原始碼]

from_preset 方法

ResNetImageClassifier.from_preset(preset, load_weights=True, **kwargs)

從模型預設實例化 keras_hub.models.Task

預設是一個目錄,其中包含用於儲存和載入預訓練模型的組態、權重和其他檔案資產。preset 可以作為以下其中一種傳遞

  1. 內建預設識別符,例如 'bert_base_en'
  2. Kaggle Models 句柄,例如 'kaggle://user/bert/keras/bert_base_en'
  3. Hugging Face 句柄,例如 'hf://user/bert_base_en'
  4. 本機預設目錄的路徑,例如 './bert_base_en'

對於任何 Task 子類別,您可以執行 cls.presets.keys() 以列出該類別上所有可用的內建預設。

此建構子可以透過兩種方式之一呼叫。可以從任務特定的基底類別呼叫,例如 keras_hub.models.CausalLM.from_preset(),也可以從模型類別呼叫,例如 keras_hub.models.BertTextClassifier.from_preset()。如果從基底類別呼叫,則傳回物件的子類別將從預設目錄中的組態推斷出來。

引數

  • preset:字串。內建預設識別符、Kaggle Models 句柄、Hugging Face 句柄或本機目錄的路徑。
  • load_weights:布林值。如果為 True,則會將儲存的權重載入到模型架構中。如果為 False,則所有權重都將隨機初始化。

範例

# Load a Gemma generative task.
causal_lm = keras_hub.models.CausalLM.from_preset(
    "gemma_2b_en",
)

# Load a Bert classification task.
model = keras_hub.models.TextClassifier.from_preset(
    "bert_base_en",
    num_classes=2,
)
預設 參數 描述
resnet_18_imagenet 11.19M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 18 層 ResNet 模型。
resnet_vd_18_imagenet 11.72M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 18 層 ResNetVD(具有技巧包的 ResNet)模型。
resnet_vd_34_imagenet 21.84M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 34 層 ResNetVD(具有技巧包的 ResNet)模型。
resnet_50_imagenet 23.56M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNet 模型。
resnet_v2_50_imagenet 23.56M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNetV2 模型。
resnet_vd_50_imagenet 25.63M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNetVD(具有技巧包的 ResNet)模型。
resnet_vd_50_ssld_imagenet 25.63M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNetVD(具有技巧包的 ResNet)模型,具有知識蒸餾。
resnet_vd_50_ssld_v2_imagenet 25.63M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNetVD(具有技巧包的 ResNet)模型,具有知識蒸餾和 AutoAugment。
resnet_vd_50_ssld_v2_fix_imagenet 25.63M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 50 層 ResNetVD(具有技巧包的 ResNet)模型,具有知識蒸餾、AutoAugment 和分類 head 的額外微調。
resnet_101_imagenet 42.61M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 101 層 ResNet 模型。
resnet_v2_101_imagenet 42.61M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 101 層 ResNetV2 模型。
resnet_vd_101_imagenet 44.67M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 101 層 ResNetVD(具有技巧包的 ResNet)模型。
resnet_vd_101_ssld_imagenet 44.67M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 101 層 ResNetVD(具有技巧包的 ResNet)模型,具有知識蒸餾。
resnet_152_imagenet 58.30M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 152 層 ResNet 模型。
resnet_vd_152_imagenet 60.36M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 152 層 ResNetVD(具有技巧包的 ResNet)模型。
resnet_vd_200_imagenet 74.93M 在 ImageNet 1k 資料集上以 224x224 解析度預訓練的 200 層 ResNetVD(具有技巧包的 ResNet)模型。

backbone 屬性

keras_hub.models.ResNetImageClassifier.backbone

具有核心架構的 keras_hub.models.Backbone 模型。


preprocessor 屬性

keras_hub.models.ResNetImageClassifier.preprocessor

用於預處理輸入的 keras_hub.models.Preprocessor 層。