► Keras 3 API 文件 / 回調 API / BackupAndRestore

備份與還原

`BackupAndRestore` 類別

keras.callbacks.BackupAndRestore(
    backup_dir, save_freq="epoch", double_checkpoint=False, delete_checkpoint=True
)

用於備份與還原訓練狀態的回調。

BackupAndRestore 回調旨在從 Model.fit 執行過程中發生的中斷中恢復訓練，方法是在每個 epoch 結束時，將訓練狀態備份到臨時檢查點檔案中。每次備份都會覆寫先前寫入的檢查點檔案，因此在任何給定時間，最多只有一個此類檢查點檔案用於備份/還原目的。

如果在完成之前重新開始訓練，訓練狀態（包括 Model 權重和 epoch 數）將在新 Model.fit 執行開始時還原到最近儲存的狀態。在 Model.fit 執行完成時，臨時檢查點檔案將被刪除。

請注意，使用者有責任在中斷後恢復作業。此回調對於容錯目的的備份和還原機制非常重要，並且從先前檢查點還原的模型應與用於備份的模型相同。如果使用者更改傳遞給 compile 或 fit 的參數，則為容錯儲存的檢查點可能會失效。

範例

>>> class InterruptingCallback(keras.callbacks.Callback):
...   def on_epoch_begin(self, epoch, logs=None):
...     if epoch == 4:
...       raise RuntimeError('Interrupting!')
>>> callback = keras.callbacks.BackupAndRestore(backup_dir="/tmp/backup")
>>> model = keras.models.Sequential([keras.layers.Dense(10)])
>>> model.compile(keras.optimizers.SGD(), loss='mse')
>>> model.build(input_shape=(None, 20))
>>> try:
...   model.fit(np.arange(100).reshape(5, 20), np.zeros(5), epochs=10,
...             batch_size=1, callbacks=[callback, InterruptingCallback()],
...             verbose=0)
... except:
...   pass
>>> history = model.fit(np.arange(100).reshape(5, 20), np.zeros(5),
...                     epochs=10, batch_size=1, callbacks=[callback],
...                     verbose=0)
>>> # Only 6 more epochs are run, since first training got interrupted at
>>> # zero-indexed epoch 4, second training will continue from 4 to 9.
>>> len(history.history['loss'])
>>> 6

參數

backup_dir：字串，用於儲存還原模型所需資料的目錄路徑。該目錄不能在其他地方重複使用來儲存其他檔案，例如，由另一個訓練執行的 BackupAndRestore 回調，或由同一個訓練執行的另一個回調（例如 ModelCheckpoint）。
save_freq："epoch"、整數或 False。當設定為 "epoch" 時，回調會在每個 epoch 結束時儲存檢查點。當設定為整數時，回調會每 save_freq 個批次儲存檢查點。僅當使用搶佔式檢查點 (即使用 save_before_preemption=True) 時，才設定 save_freq=False。
double_checkpoint：布林值。如果啟用，BackupAndRestore 回調將儲存 2 個最後的訓練狀態（目前和先前的狀態）。中斷後，如果由於 IO 錯誤（例如檔案損壞）而無法載入目前狀態，它將嘗試還原先前的狀態。這種行為會消耗兩倍的磁碟空間，但會提高容錯能力。預設為 False。
delete_checkpoint：布林值。此 BackupAndRestore 回調透過儲存檢查點來備份訓練狀態。如果 delete_checkpoint=True，則在訓練完成後將刪除檢查點。如果您想保留檢查點以供日後使用，請使用 False。預設為 True。

備份與還原

BackupAndRestore 類別

備份與還原

BackupAndRestore 類別

`BackupAndRestore` 類別