diff --git a/docs/PUBLIC_MODELS.rst b/docs/PUBLIC_MODELS.rst index cc9019ad..a3064f63 100644 --- a/docs/PUBLIC_MODELS.rst +++ b/docs/PUBLIC_MODELS.rst @@ -19,7 +19,7 @@ Here, we give the full list of publicly pre-trained models supported by the Hail * `Object Detection`_ * `Semantic Segmentation`_ * `Pose Estimation`_ - * `Single Person Pose Estimation`_ + * `Single Person`_ * `Face Detection`_ * `Instance Segmentation`_ * `Depth Estimation`_ @@ -60,7 +60,7 @@ ImageNet - 9.70 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_lite0 - 74.99 - 73.91 @@ -69,7 +69,7 @@ ImageNet - 0.39 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_lite1 - 76.68 - 76.36 @@ -78,7 +78,7 @@ ImageNet - 0.61 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_lite2 - 77.45 - 76.74 @@ -87,7 +87,7 @@ ImageNet - 0.87 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_lite3 - 79.29 - 78.71 @@ -96,7 +96,7 @@ ImageNet - 1.40 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_lite4 - 80.79 - 80.47 @@ -105,7 +105,7 @@ ImageNet - 2.58 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_m |rocket| - 78.91 - 78.63 @@ -114,7 +114,7 @@ ImageNet - 3.68 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientnet_s - 77.64 - 77.32 @@ -123,7 +123,7 @@ ImageNet - 2.36 - `link `_ - `link `_ - - `link `_ + - `link `_ * - hardnet39ds - 73.43 - 72.23 @@ -132,7 +132,7 @@ ImageNet - 0.43 - `link `_ - `link `_ - - `link `_ + - `link `_ * - hardnet68 - 75.47 - 75.04 @@ -141,7 +141,7 @@ ImageNet - 4.25 - `link `_ - `link `_ - - `link `_ + - `link `_ * - inception_v1 - 69.74 - 69.3 @@ -150,7 +150,7 @@ ImageNet - 1.50 - `link `_ - `link `_ - - `link `_ + - `link `_ * - mobilenet_v1 - 70.97 - 70.25 @@ -159,7 +159,7 @@ ImageNet - 0.57 - `link `_ - `link `_ - - `link `_ + - `link `_ * - mobilenet_v2_1.0 |rocket| - 71.78 - 70.64 @@ -168,7 +168,7 @@ ImageNet - 0.31 - `link `_ - `link `_ - - `link `_ + - `link `_ * - mobilenet_v2_1.4 - 74.18 - 73.07 @@ -177,7 +177,7 @@ ImageNet - 0.59 - `link `_ - `link `_ - - `link `_ + - `link `_ * - mobilenet_v3 - 72.21 - 71.73 @@ -186,7 +186,7 @@ ImageNet - 1.00 - `link `_ - `link `_ - - `link `_ + - `link `_ * - mobilenet_v3_large_minimalistic - 72.11 - 71.24 @@ -195,7 +195,7 @@ ImageNet - 0.21 - `link `_ - `link `_ - - `link `_ + - `link `_ * - regnetx_1.6gf - 77.05 - 76.75 @@ -204,7 +204,7 @@ ImageNet - 1.61 - `link `_ - `link `_ - - `link `_ + - `link `_ * - regnetx_800mf - 75.16 - 74.84 @@ -213,7 +213,7 @@ ImageNet - 0.80 - `link `_ - `link `_ - - `link `_ + - `link `_ * - regnety_200mf - 70.38 - 69.91 @@ -222,7 +222,7 @@ ImageNet - 0.20 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resmlp12_relu - 75.26 - 74.06 @@ -231,7 +231,7 @@ ImageNet - 3.02 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnet_v1_18 - 71.26 - 70.64 @@ -240,7 +240,7 @@ ImageNet - 1.82 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnet_v1_34 - 72.7 - 72.14 @@ -249,7 +249,7 @@ ImageNet - 3.67 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnet_v1_50 |rocket| |star| - 75.12 - 74.47 @@ -258,7 +258,7 @@ ImageNet - 3.49 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnet_v2_18 - 69.57 - 69.1 @@ -267,7 +267,7 @@ ImageNet - 1.82 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnet_v2_34 - 73.07 - 72.72 @@ -276,7 +276,7 @@ ImageNet - 3.67 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnext26_32x4d - 76.18 - 75.78 @@ -285,7 +285,7 @@ ImageNet - 2.48 - `link `_ - `link `_ - - `link `_ + - `link `_ * - resnext50_32x4d - 79.31 - 78.39 @@ -294,7 +294,7 @@ ImageNet - 4.24 - `link `_ - `link `_ - - `link `_ + - `link `_ * - shufflenet_g8_w1 - 66.3 - 65.44 @@ -303,7 +303,7 @@ ImageNet - 0.18 - `link `_ - `link `_ - - `link `_ + - `link `_ * - squeezenet_v1.1 - 59.85 - 59.4 @@ -312,7 +312,7 @@ ImageNet - 0.39 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Object Detection: @@ -343,7 +343,7 @@ COCO - 15.63 - `link `_ - `link `_ - - `link `_ + - `link `_ * - centernet_resnet_v1_50_postprocess - 31.78 - 29.64 @@ -352,7 +352,7 @@ COCO - 28.46 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientdet_lite0 - 27.43 - 26.27 @@ -361,7 +361,7 @@ COCO - 0.99 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientdet_lite1 - 32.46 - 31.69 @@ -370,7 +370,7 @@ COCO - 2 - `link `_ - `link `_ - - `link `_ + - `link `_ * - efficientdet_lite2 - 36.16 - 35.06 @@ -379,7 +379,7 @@ COCO - 3.42 - `link `_ - `link `_ - - `link `_ + - `link `_ * - nanodet_repvgg - 29.3 - 28.53 @@ -388,7 +388,7 @@ COCO - 5.64 - `link `_ - `link `_ - - `link `_ + - `link `_ * - nanodet_repvgg_a1_640 - 33.28 - 32.88 @@ -397,7 +397,7 @@ COCO - 21.4 - `link `_ - `link `_ - - `link `_ + - `link `_ * - ssd_mobilenet_v1 |rocket| |star| - 23.17 - 22.29 @@ -406,7 +406,7 @@ COCO - 1.25 - `link `_ - `link `_ - - `link `_ + - `link `_ * - ssd_mobilenet_v1_hd - 17.66 - 15.73 @@ -415,7 +415,7 @@ COCO - 12.26 - `link `_ - `link `_ - - `link `_ + - `link `_ * - ssd_mobilenet_v2 - 24.15 - 23.28 @@ -424,7 +424,7 @@ COCO - 0.76 - `link `_ - `link `_ - - `link `_ + - `link `_ * - tiny_yolov3 - 14.36 - 13.45 @@ -433,7 +433,7 @@ COCO - 2.79 - `link `_ - `link `_ - - `link `_ + - `link `_ * - tiny_yolov4 - 19.18 - 17.73 @@ -442,16 +442,16 @@ COCO - 3.46 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov3 |star| - 38.42 - - 37.88 + - 37.32 - 608x608x3 - 68.79 - 79.17 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov3_416 - 37.73 - 35.86 @@ -460,7 +460,7 @@ COCO - 32.97 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov3_gluon |rocket| |star| - 37.28 - 35.64 @@ -469,7 +469,7 @@ COCO - 79.17 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov3_gluon_416 |star| - 36.27 - 34.92 @@ -478,16 +478,16 @@ COCO - 32.97 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov4_leaky |star| - - 42.37 - - 41.13 + - 48.32 + - 46.96 - 512x512x3 - 64.33 - 45.60 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5l - 46.01 - 44.01 @@ -496,7 +496,7 @@ COCO - 60.78 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5m - 42.59 - 41.19 @@ -505,7 +505,7 @@ COCO - 26.14 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5m_wo_spp |rocket| - 42.46 - 40.66 @@ -514,7 +514,7 @@ COCO - 26.49 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5s - 35.33 - 34.25 @@ -523,16 +523,16 @@ COCO - 8.72 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5s_personface - 47.7 - - 45.55 + - 45.75 - 640x640x3 - 7.25 - 8.38 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5xs_wo_spp - 32.78 - 31.8 @@ -541,7 +541,7 @@ COCO - 5.68 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov5xs_wo_spp_nms - 32.57 - 30.7 @@ -550,7 +550,7 @@ COCO - 5.68 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov6n - 34.29 - 32.29 @@ -559,16 +559,16 @@ COCO - 5.57 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov7 - 49.72 - - 47.06 + - 46.92 - 640x640x3 - 36.91 - 52.34 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolov7_tiny - 36.49 - 35.39 @@ -577,7 +577,7 @@ COCO - 6.87 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolox_l_leaky |star| - 48.68 - 47.18 @@ -586,7 +586,7 @@ COCO - 77.74 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolox_s_leaky - 38.13 - 37.33 @@ -595,7 +595,7 @@ COCO - 13.37 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolox_s_wide_leaky - 42.4 - 41.01 @@ -604,7 +604,7 @@ COCO - 29.73 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolox_tiny - 32.64 - 31.32 @@ -613,7 +613,7 @@ COCO - 3.22 - `link `_ - `link `_ - - `link `_ + - `link `_ VisDrone ^^^^^^^^ @@ -639,7 +639,7 @@ VisDrone - 1.15 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Semantic Segmentation: @@ -670,7 +670,7 @@ Cityscapes - 71.26 - `link `_ - `link `_ - - `link `_ + - `link `_ * - fcn8_resnet_v1_18 - 68.75 - 67.97 @@ -679,7 +679,7 @@ Cityscapes - 71.51 - `link `_ - `link `_ - - `link `_ + - `link `_ * - fcn8_resnet_v1_22 - 67.55 - 67.39 @@ -688,7 +688,7 @@ Cityscapes - 150.04 - `link `_ - `link `_ - - `link `_ + - `link `_ * - stdc1 - 74.57 - 73.32 @@ -697,7 +697,7 @@ Cityscapes - 63.34 - `link `_ - `link `_ - - `link `_ + - `link `_ Oxford-IIIT Pet ^^^^^^^^^^^^^^^ @@ -723,7 +723,7 @@ Oxford-IIIT Pet - 14.44 - `link `_ - `link `_ - - `link `_ + - `link `_ Pascal VOC ^^^^^^^^^^ @@ -749,7 +749,7 @@ Pascal VOC - 8.91 - `link `_ - `link `_ - - `link `_ + - `link `_ * - deeplab_v3_mobilenet_v2_wo_dilation - 71.46 - 71.08 @@ -758,7 +758,7 @@ Pascal VOC - 1.64 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Pose Estimation: @@ -789,7 +789,7 @@ COCO - 32.38 - `link `_ - `link `_ - - `link `_ + - `link `_ * - centerpose_regnetx_800mf - 44.07 - 41.66 @@ -798,7 +798,7 @@ COCO - 43.06 - `link `_ - `link `_ - - `link `_ + - `link `_ * - centerpose_repvgg_a0 |star| - 39.17 - 37.22 @@ -807,9 +807,9 @@ COCO - 14.15 - `link `_ - `link `_ - - `link `_ + - `link `_ -.. _Single Person Pose Estimation: +.. _Single Person: Single Person Pose Estimation ----------------------------- @@ -829,34 +829,16 @@ COCO - FLOPs (G) - Pretrained - Source - - Compiled - * - centerpose_regnetx_1.6gf_fpn |star| - - 53.54 - - 47.54 - - 640x640x3 - - 14.28 - - 32.38 - - `link `_ - - `link `_ - - `link `_ - * - centerpose_regnetx_800mf - - 44.07 - - 41.66 - - 512x512x3 - - 12.31 - - 43.06 - - `link `_ - - `link `_ - - `link `_ - * - centerpose_repvgg_a0 |star| - - 39.17 - - 37.22 - - 416x416x3 - - 11.71 - - 14.15 - - `link `_ - - `link `_ - - `link `_ + - Compiled + * - mspn_regnetx_800mf + - 70.8 + - 70.23 + - 256x192x3 + - 7.17 + - 1.47 + - `link `_ + - `link `_ + - `link `_ .. _Face Detection: @@ -887,7 +869,7 @@ WiderFace - 0.08 - `link `_ - `link `_ - - `link `_ + - `link `_ * - retinaface_mobilenet_v1 |star| - 81.27 - 81.03 @@ -896,7 +878,7 @@ WiderFace - 12.57 - `link `_ - `link `_ - - `link `_ + - `link `_ * - scrfd_10g - 82.13 - 82.03 @@ -905,7 +887,7 @@ WiderFace - 13.37 - `link `_ - `link `_ - - `link `_ + - `link `_ * - scrfd_2.5g - 76.59 - 76.32 @@ -914,7 +896,7 @@ WiderFace - 3.44 - `link `_ - `link `_ - - `link `_ + - `link `_ * - scrfd_500m - 68.98 - 68.45 @@ -923,7 +905,7 @@ WiderFace - 0.75 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Instance Segmentation: @@ -954,7 +936,7 @@ COCO - 51.92 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolact_regnetx_1.6gf - 30.26 - 29.68 @@ -963,7 +945,7 @@ COCO - 62.67 - `link `_ - `link `_ - - `link `_ + - `link `_ * - yolact_regnetx_800mf - 28.5 - 28.2 @@ -972,24 +954,16 @@ COCO - 58.375 - `link `_ - `link `_ - - `link `_ -.. list-table:: - :header-rows: 1 - - * - Network Name - - Input Resolution (HxWxC) - - Params (M) - - FLOPs (G) - - Pretrained - - Source - - Compiled + - `link `_ * - yolact_regnetx_800mf_20classes |star| + - 22.86 + - 22.85 - 512x512x3 - 21.97 - 51.47 - `link `_ - `link `_ - - `link `_ + - `link `_ D2S ^^^ @@ -1015,7 +989,7 @@ D2S - 51.62 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Depth Estimation: @@ -1046,7 +1020,7 @@ NYU - 0.37 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Facial Landmark: @@ -1077,7 +1051,7 @@ AFLW2k3d - 0.18 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Person Re-ID: @@ -1108,7 +1082,7 @@ Market1501 - 0.99 - `link `_ - `link `_ - - `link `_ + - `link `_ * - repvgg_a0_person_reid_2048 - 90.02 - 89.47 @@ -1117,7 +1091,7 @@ Market1501 - 0.89 - `link `_ - `link `_ - - `link `_ + - `link `_ * - repvgg_a0_person_reid_512 - 89.9 - 89.4 @@ -1126,7 +1100,7 @@ Market1501 - 0.89 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Super Resolution: @@ -1157,7 +1131,7 @@ BSD100 - 0.8 - `link `_ - `link `_ - - `link `_ + - `link `_ * - espcn_x3 - 28.41 - 27.86 @@ -1166,7 +1140,7 @@ BSD100 - 0.38 - `link `_ - `link `_ - - `link `_ + - `link `_ * - espcn_x4 - 26.83 - 26.43 @@ -1175,7 +1149,7 @@ BSD100 - 0.23 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Face Recognition: @@ -1206,7 +1180,7 @@ LFW - 0.44 - `link `_ - `link `_ - - `link `_ + - `link `_ * - arcface_r50 - 99.72 - 99.71 @@ -1215,7 +1189,7 @@ LFW - 6.30 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Person Attribute: @@ -1246,7 +1220,7 @@ PETA - 1.82 - `link `_ - `link `_ - - `link `_ + - `link `_ .. _Hand Landmark detection: @@ -1272,4 +1246,4 @@ Hand Landmark - 0.15 - `link `_ - `link `_ - - `link `_ + - `link `_