萬聖節快樂,ResNet 請客!

社群文章 釋出於 2024 年 10 月 31 日

一點萬聖節小禮物🎃,我剛剛上傳了一些小型的 ResNet,它們經過了前所未有的訓練。應使用者要求,我將最近的一組超引數(MobileNet-v4 Conv Small x ResNet Strikes Back / timm,表格中的 ra4)應用於 'Basic Block' ResNet-18 和 34,包括 V2(預啟用)變體。

結果非常好!ResNet-18 的準確率達到 73-74%,ResNet-34 達到 77-78%,哇哦!

請參閱下表以瞭解更多背景資訊。我列出了一些過去的“最佳”ResNet 結果:

  • ResNet Strikes Back (a1, a1h)
  • torchvision “自帶電池” ResNets (tv2),它們是 RSB 的後續版本
  • O.G. torchvision (tv) ResNets,範圍在 18-50

實際上,我確實用類似的 ra4 超引數訓練了一個 D 變體的 ResNet50,但它們的改進不如過去那麼多,可能需要進一步的超引數調整和更多的增廣。

模型 影像尺寸 top1 top5 引數數量
resnet50d.ra4_e3600_r224_in1k 224 80.958 95.372 25.58
resnet50.tv2_in1k 224 80.856 95.43 25.56
resnet50d.a1_in1k 224 80.686 94.712 25.58
resnet50.a1h_in1k 224 80.662 95.306 25.56
resnet50.a1_in1k 224 80.368 94.59 25.56
resnetv2_34d.ra4_e3600_r224_in1k 224 78.268 93.956 21.82
resnetv2_34.ra4_e3600_r224_in1k 224 77.636 93.528 21.8
resnet34.ra4_e3600_r224_in1k 224 77.448 93.502 21.8
resnet34.a1_in1k 224 76.428 92.88 21.8
resnet50.tv_in1k 224 76.128 92.858 25.56
resnetv2_18d.ra4_e3600_r224_in1k 224 74.412 91.928 11.71
resnet18d.ra4_e3600_r224_in1k 224 74.324 91.832 11.71
resnetv2_18.ra4_e3600_r224_in1k 224 73.578 91.352 11.69
resnet34.tv_in1k 224 73.316 91.422 21.8
resnet18.a1_in1k 224 71.49 90.076 11.69
resnet18.tv_in1k 224 69.758 89.074 11.69

所有新權重在推理時都能很好地擴充套件到更高解析度。這裡有一些值得注意的地方。tv2a1h ResNet50 是在 176x176 解析度下訓練的,透過在 224x224 下評估,它們試圖達到訓練-測試解析度差異的“峰值”(https://arxiv.org/abs/1906.06423)。當我研究 RSB 方法時,我不想為了在 224x224 評估時獲得峰值而犧牲高解析度擴充套件,只有在較低解析度下訓練的低成本 a3 才這樣。你可以在這個 288x288 表格中看到,a1 RSB 還有更多的潛力,tv2 已經處於下降趨勢,而 a1h 剛剛越過峰值。這些新的 ra4 是解析度縮放的佼佼者,還有一些提升空間。

模型 影像尺寸 top1 top5 引數數量
resnet50d.ra4_e3600_r224_in1k 288 81.812 95.91 25.58
resnet50d.a1_in1k 288 81.45 95.216 25.58
resnet50.a1_in1k 288 81.232 95.108 25.56
resnet50.a1h_in1k 288 80.914 95.516 25.56
resnet50.tv2_in1k 288 80.87 95.646 25.56
resnetv2_34d.ra4_e3600_r224_in1k 288 79.59 94.77 21.82
resnetv2_34.ra4_e3600_r224_in1k 288 79.072 94.566 21.8
resnet34.ra4_e3600_r224_in1k 288 78.952 94.45 21.8
resnet34.a1_in1k 288 77.91 93.768 21.8
resnet50.tv_in1k 288 77.252 93.606 25.56
resnetv2_18d.ra4_e3600_r224_in1k 288 76.044 93.02 11.71
resnet18d.ra4_e3600_r224_in1k 288 76.024 92.78 11.71
resnetv2_18.ra4_e3600_r224_in1k 288 75.34 92.678 11.69
resnet34.tv_in1k 288 74.8 92.356 21.8
resnet18.a1_in1k 288 73.152 91.036 11.69
resnet18.tv_in1k 288 71.274 90.244 11.69

社群

我發現這篇文章很有幫助

註冊登入 以評論

© . This site is unofficial and not affiliated with Hugging Face, Inc.