萬聖節快樂,ResNet 請客!
社群文章 釋出於 2024 年 10 月 31 日
一點萬聖節小禮物🎃,我剛剛上傳了一些小型的 ResNet,它們經過了前所未有的訓練。應使用者要求,我將最近的一組超引數(MobileNet-v4 Conv Small x ResNet Strikes Back / timm
,表格中的 ra4
)應用於 'Basic Block' ResNet-18 和 34,包括 V2(預啟用)變體。
結果非常好!ResNet-18 的準確率達到 73-74%,ResNet-34 達到 77-78%,哇哦!
請參閱下表以瞭解更多背景資訊。我列出了一些過去的“最佳”ResNet 結果:
- ResNet Strikes Back (
a1
,a1h
) - torchvision “自帶電池” ResNets (
tv2
),它們是 RSB 的後續版本 - O.G. torchvision (
tv
) ResNets,範圍在 18-50
實際上,我確實用類似的 ra4
超引數訓練了一個 D
變體的 ResNet50,但它們的改進不如過去那麼多,可能需要進一步的超引數調整和更多的增廣。
模型 | 影像尺寸 | top1 | top5 | 引數數量 |
---|---|---|---|---|
resnet50d.ra4_e3600_r224_in1k | 224 | 80.958 | 95.372 | 25.58 |
resnet50.tv2_in1k | 224 | 80.856 | 95.43 | 25.56 |
resnet50d.a1_in1k | 224 | 80.686 | 94.712 | 25.58 |
resnet50.a1h_in1k | 224 | 80.662 | 95.306 | 25.56 |
resnet50.a1_in1k | 224 | 80.368 | 94.59 | 25.56 |
resnetv2_34d.ra4_e3600_r224_in1k | 224 | 78.268 | 93.956 | 21.82 |
resnetv2_34.ra4_e3600_r224_in1k | 224 | 77.636 | 93.528 | 21.8 |
resnet34.ra4_e3600_r224_in1k | 224 | 77.448 | 93.502 | 21.8 |
resnet34.a1_in1k | 224 | 76.428 | 92.88 | 21.8 |
resnet50.tv_in1k | 224 | 76.128 | 92.858 | 25.56 |
resnetv2_18d.ra4_e3600_r224_in1k | 224 | 74.412 | 91.928 | 11.71 |
resnet18d.ra4_e3600_r224_in1k | 224 | 74.324 | 91.832 | 11.71 |
resnetv2_18.ra4_e3600_r224_in1k | 224 | 73.578 | 91.352 | 11.69 |
resnet34.tv_in1k | 224 | 73.316 | 91.422 | 21.8 |
resnet18.a1_in1k | 224 | 71.49 | 90.076 | 11.69 |
resnet18.tv_in1k | 224 | 69.758 | 89.074 | 11.69 |
所有新權重在推理時都能很好地擴充套件到更高解析度。這裡有一些值得注意的地方。tv2
和 a1h
ResNet50 是在 176x176 解析度下訓練的,透過在 224x224 下評估,它們試圖達到訓練-測試解析度差異的“峰值”(https://arxiv.org/abs/1906.06423)。當我研究 RSB 方法時,我不想為了在 224x224 評估時獲得峰值而犧牲高解析度擴充套件,只有在較低解析度下訓練的低成本 a3
才這樣。你可以在這個 288x288 表格中看到,a1
RSB 還有更多的潛力,tv2
已經處於下降趨勢,而 a1h
剛剛越過峰值。這些新的 ra4
是解析度縮放的佼佼者,還有一些提升空間。
模型 | 影像尺寸 | top1 | top5 | 引數數量 |
---|---|---|---|---|
resnet50d.ra4_e3600_r224_in1k | 288 | 81.812 | 95.91 | 25.58 |
resnet50d.a1_in1k | 288 | 81.45 | 95.216 | 25.58 |
resnet50.a1_in1k | 288 | 81.232 | 95.108 | 25.56 |
resnet50.a1h_in1k | 288 | 80.914 | 95.516 | 25.56 |
resnet50.tv2_in1k | 288 | 80.87 | 95.646 | 25.56 |
resnetv2_34d.ra4_e3600_r224_in1k | 288 | 79.59 | 94.77 | 21.82 |
resnetv2_34.ra4_e3600_r224_in1k | 288 | 79.072 | 94.566 | 21.8 |
resnet34.ra4_e3600_r224_in1k | 288 | 78.952 | 94.45 | 21.8 |
resnet34.a1_in1k | 288 | 77.91 | 93.768 | 21.8 |
resnet50.tv_in1k | 288 | 77.252 | 93.606 | 25.56 |
resnetv2_18d.ra4_e3600_r224_in1k | 288 | 76.044 | 93.02 | 11.71 |
resnet18d.ra4_e3600_r224_in1k | 288 | 76.024 | 92.78 | 11.71 |
resnetv2_18.ra4_e3600_r224_in1k | 288 | 75.34 | 92.678 | 11.69 |
resnet34.tv_in1k | 288 | 74.8 | 92.356 | 21.8 |
resnet18.a1_in1k | 288 | 73.152 | 91.036 | 11.69 |
resnet18.tv_in1k | 288 | 71.274 | 90.244 | 11.69 |