2021计算机视觉-包揽所有前沿论文源码 -上半年

大家是否遇到过这种情况，就是在工作或者学习的时候，想去找一些方向的网络，但是呢，尴尬的是，老旧的网络里不想要，前沿的网络又不知道有哪些。为了解决大家的这个困扰，本人决定收集2021年上半年大部分前沿的网络相关链接，之后我会( 文末附带 \color{blue}{文末附带} 文末附带公众号 − \color{blue}{公众号 -} 公众号− 海量资源。 \color{blue}{ 海量资源}。海量资源。)：

每周一更新一次（下面是我多年年收集的链接地址） \color{red}{每周一更新一次（下面是我多年年收集的链接地址） } 每周一更新一次（下面是我多年年收集的链接地址）计算机视觉-包揽所有前沿论文源码

有兴趣的朋友可以加微信：17575010159 相互讨论技术。若是帮助到了你什么，一定要记得点赞！因为这是对我最大的鼓励!

视觉工作项目-为后来的你，提供一份帮助！上面这个链接是我所有工作项目的详细解。 \color{red}{上面这个链接是我所有工作项目的详细解。} 上面这个链接是我所有工作项目的详细解。

文章分类

（01）AAAI 2021 | 腾讯优图11篇论文入选，涵盖动作识别、人群密度估计、人脸安全等领域（02）重磅！网易伏羲9篇论文入选AI顶会AAAI 2021 （03）CVPR2020 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】（04）CVPR、ECCV 2020 两大会议论文分类索引（05）人体姿态估计、识别与生成最新技术一览（06）一文概览 CVPR2021 最新18篇 Oral 论文（07）WACV 2021 论文大盘点-GAN 篇与行人监控篇（08）近期必看的视觉综述，含 GAN、Transformer、人脸超分辨、遥感等（09）CVPR2021 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】（10）重磅！悉尼科大ReLER实验室13篇论文入选CVPR 2021 （21）WACV 2021 论文大盘点目标检测与图像分割篇（持续更新）（22）WACV 2021 论文大盘点-GAN 篇与行人监控篇（23）近期必看的视觉综述，含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等（24）WACV 2021 论文大盘点-人体动作检测与识别 & 图像与视频检索篇（25）AAAI 2021 | 微软亚洲研究院优秀论文汇总！（26）一文概览 CVPR2021 最新18篇 Oral 论文（27）CVPR2021 最全整理：论文汇总 / 代码 / 项目 / 论文解读（更新中）【计算机视觉】（28）CVPR2021最新接收论文合集！22个方向100+篇论文汇总｜持续更新（29）推荐几篇近期必看的视觉综述，含GAN、Transformer、人脸超分辨、遥感等（30）推荐几篇近期必看的视觉综述，含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等（31）强调应用的WACV 2021，5篇最佳论文都在这里了（32）CVPR 2021 论文分类汇总！持续更新中！（33）https://github.com/52CV/CVPR-2021-Papers

（34）CVPR2021中的目标检测和语义分割论文汇总（35）一文概览 CVPR2021 最新18篇 Oral 论文（36）CVPR 2021 | 腾讯AI Lab入选论文解读（37）顶会论文分类汇总，包含WACV21/CVPR19、20/ECCV20（附下载）（38）2021 最新CV综述分类汇总（持续更新）（39）CVPR 2021 论文/代码分类汇总！持续更新中！（40）CVPR 2021 速览 | 旷视研究院22篇入选学术成果盘点（41）一文概览 CVPR2021 最新18篇 Oral 论文（42）CVPR 2021放榜，腾讯优图20篇论文都在这里了！（43）CVPR 二十年，影响力最大的10篇论文！（44）CVPR 2021公布最佳论文候选！华人占据半壁江山，何恺明、沈春华等人上榜（45）添加链接描述CVPR 2021大奖出炉！何恺明获最佳论文提名，华人四篇“最佳”！第一届Thomas S. Huang 纪念奖颁发）（46）CVPR 二十年，影响力最大的10篇论文！（47）刚刚，CVPR 2021 最佳论文、最佳学生论文等奖项出炉了！（附论文下载地址）（48）CVPR 2021奖项出炉：最佳论文花落马普所，何恺明获提名，首届黄煦涛纪念奖颁布（49）本周开源论文推荐：含人脸识别、实例分割、跟踪、SR等（50）CVPR 2021 论文开放下载了！（51）[CVPR 2021 Best Paper Candidate] 32篇最佳论文候选已公布，猜一猜哪篇最终荣获 CVPR 2021 最佳论文？（52）【6月2日】十篇（将）开源论文代码分享（53）5月26日】七篇（将）开源论文代码分享（56）2021 745 篇已出论文最全分类汇总！（57）推荐几篇新出的 CVPR 2021开源论文，含图像分割、域适应、图像检索、视线估计等

人脸技术

（01）CVPR2020最佳新框架｜大规模人脸表情识别（附源代码）（02）大盘点｜轻量级人脸检测算法实现，快到没朋友的都在这里了～（03）10种轻量级人脸检测算法大PK ｜代码开源（04）人脸识别剩下难题：从遮挡，年龄，姿态，妆造到亲属关系，人脸攻击（05）人脸识别中的活体检测算法综述（06）TinaFace：人脸检测新纪录！（07）准确率超99.5%！滴滴开源防疫口罩识别技术，及视觉比赛进展（08）京东AI：戴口罩人脸识别pytorch开源库（09）无需人脸检测和关键点定位，Facebook 等提出实时 3D 人脸姿态估计新方法（11）大盘点 | 2020年「13篇」人脸算法最佳综述（12）WACV 2021 论文大盘点-图像质量 & 姿态估计 & 3D 篇（13）WACV 2021 论文大盘点-视频理解篇 & 图像质量篇（14）OpenVINO + OpenCV 实现点头与摇头识别验证（15）无需人脸检测和关键点定位，Facebook 等提出实时 3D 人脸姿态估计新方法（16）如何入门多视角人脸正面化生成？不得不看的超详细最新综述！（07）WACV 2021 论文大盘点-人脸技术篇（08）重要！分享几个业界新出人脸识别数据集（09）Facebook等新提出的视听语音分离的方法VisualVoice，利用跨模态一致性 VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency 单位 |德克萨斯大学奥斯汀分校，Facebook 论文 |https://arxiv.org/abs/2101.03149 代码 |https://github.com/facebookresearch/VisualVoice 主页 |http://vision.cs.utexas.edu/projects/VisualVoice/ （10）人脸超分辨率，基于迭代合作的方法（11）不得不赞！京东开源FaceX-Zoo，一站式人脸识别研究平台（12）跳过人脸检测和关键点定位，Facebook等提出实时3D人脸姿态估计新方法（13）无需人脸检测和关键点定位，Facebook等提出实时3D人脸姿态估计新方法（14）CVPR 2021 | 中科大联合快手，提出人脸伪造检测新方法（15）Face Transformer for Recognition用于人脸识别（16）中国队拿下口罩人脸识别世界第一！（17）开源了！仅有85K个参数的人脸检测算法（18）遮挡人脸问题 | 详细解读 Attention-Based 方法解决遮挡人脸识别问题（附论文下载）（19）CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破：基于生成网络的渲染器！几何形状更精准！渲染效果更真实！（20）OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测（21）腾讯优图TFace正式开源，更可信的人脸识别！（22）CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破：基于生成网络的渲染器！几何形状更精准！渲染效果更真实！（23）单目3D人脸重建，皱纹可以随着表情而产生自然变化，更加逼真。（24）D人脸建模 Snap 等提出首个 one-shot 3D 人脸风格迁移化的框架，只需要一张任意风格的图像，它可以生成具有夸张的几何形状和纹理风格化的三维人脸模型，

目标检测

（01）视频目标检测大盘点（02）R-CenterNet:用CenterNet对旋转目标进行检测（03）香港大学提出OneNet：一阶段端到端目标检测网络，无需NMS！无需二分匹配！（04）异常检测（Anomaly Detection）综述（05）开源软件 | 深度学习用于道路病害检测（06）Transformer 又立功了！又快(420 fps)又好的车道线检测算法（07）NanoDet：轻量级（1.8MB）、超快速（移动端97fps）目标检测项目（08）用实力给自己正名，YOLOv5：道路损伤检测我最强！GRDDC’2020大赛报告（09）YOLO之外的另一选择，手机端97FPS的Anchor-Free目标检测模型NanoDet现已开源~ （10）优秀！港大同济伯克利提出Sparse R-CNN: 目标检测新范式（11）目标检测无痛涨点之 Generalized Focal Loss V2 （12）用CenterNet对旋转目标进行检测（13）基于计算机视觉的裂纹检测方案（14）香港中文大学多媒体实验室 | 开源视频目标检测&跟踪平台（附源码下载）（15）基于密度图的航空物体检测：理论与代码实现（16）目标检测的稀疏对抗攻击，代码已开源（17）北亚利桑那大学等推出：航拍森林火情检测数据集 FLAME （18）无需NMS的目标检测，OneNet （19）NAS在检测中的应用（20）NeurIPS 2020 | 微软亚洲研究院论文摘录之目标检测篇（21）难以置信的目标检测小妙招：多训练几个epochs，平均一下就能获得更好的模型

（22）目标检测的稀疏对抗攻击，代码已开源（23）C++ 实现 yolov5 的 OpenVINO 部署（24）极市直播回放丨第75期-方浩：车道线检测新SOTA，RESA：循环特征位移聚合器（AAAI2021）（25）一文梳理缺陷检测方法（26）开源项目｜基于YOLO-V5实现行人社交距离风险提示(附完整源码) （27）重磅！13 篇基于 Anchor free 的目标检测方法（28）旋转目标检测方法解读（DCL, CVPR2021）（29）一文梳理缺陷检测方法（30）没有NMS！阿里巴巴和阿大提出PSS：更简单有效的端到端目标检测（14）涨点技巧！小目标检测：数据增广（15）AAAI 2021 目标检测论文大盘点（YOLObile/R3Det/StarNet等）（16）目标检测比赛思路、tricks集锦、资料汇总（17）CVPR 2021 | GFLV2：目标检测良心技术，无Cost涨点！（18）实用教程详解：用OpenCV的DNN模块部署YOLOv5目标检测（19）干货实践 | Anchor 优化后在目标检测提升这么明显（20）物体检测中的小物体问题（21）大改 Yolo 框架 | 能源消耗极低的目标检测新框架（附论文下载）（22）小目标检测：数据增强（23）大盘点 | 2020年 2 篇异常算法最佳综述（24）小目标检测：Feature Extraction （25）工业图像异常检测最新研究总结（2019-2020）（26）综述丨工业金属平面材料表面缺陷检测的研究进展（27）详解基于深度学习的伪装目标检测（28）基于 Caffe 格式部署 YOLOV5 模型（29）#WACV 2021 FisheyeYOLO：用于自动驾驶的鱼眼相机上的通用物体检测。针对鱼眼图像中的物体检测，研究不同的物体表示方法中作者找到了更好的表示方法，如定向边界盒、椭圆和通用多边形。并设计了一种新型的曲线边界盒模型，该模型具有鱼眼畸变模型的最佳特性。FisheyeYOLO: Generalized Object Detection on Fisheye Cameras for Autonomous Driving单位 | 利默里克大学,Valeo论文 | https://www.researchgate.net/publication/346931586_FisheyeYOLO_Object_Detection_on_Fisheye_Cameras_for_Autonomous_Driving代码 | 暂未

（30）基于密度图的航空物体检测：理论与代码实现（31）WACV 2021 论文大盘点-目标检测篇（32）AAAI 2021中的目标检测（详细版with code）（33）从L1 loss到EIoU loss，目标检测边框回归的损失函数一览（34）#城市天眼# 由美国 Skylark Labs 公司开发，无人机安防监控，可在高空中（3-90米）对人群检测并分析行为，发现可疑活动。来源：https://twitter.com/i/status/1364086835266211843 （35）不用激光雷达，照样又快又准！3D目标检测之SMOKE （36）理解物体检测中的Objectness

（37）目标检测一卷到底之后，终于有人为它挖了个新坑｜CVPR2021 Oral （38）CVPR2021目标检测佳作 | Weighted boxes fusion（附github源码及论文下载）（39）基于YOLOV4深度网络的车辆压实线检测算法（40）56.4 AP！超越YOLOv4，更快更强的CenterNet2来了！（41）CVPR2121目标检测 | 少见的知识蒸馏用于目标检测（附论文下载）（42）用于自动驾驶的实时车道线检测和智能告警（43）全新FPN！CE-FPN：通道增强特征金字塔网络，助力目标检测涨点！（44）极市项目｜未拴绳遛狗识别算法需求（45）基于YOLOV5深度网络模型的火焰检测（46）基于YOLOV5深度网络模型的交通标志设施的模型训练（47）基于深度学习YOLOV5网络的道路状况检测（48）基于YOLOV5深度网络的公路病害检测（49）使用Disentangling形式的损失函数回归2D和3D目标框（50）CVPR 2021 | 腾讯AI Lab入选论文解读（51）实操教程：android camera nanodet 实时物体检测的高效实现总结（52）CVPR2021 目标检测佳作 | Weighted boxes fusion（附 GitHub 源码及论文下载）（53）我扔掉FPN来做目标检测，效果竟然这么强！YOLOF开源：你只需要看一层特征｜CVPR2021 （54）【入门教程】异常检测（Anomaly Detection）到底是什么？（55）最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型（56）mmdetection性能简单优化方法（57）目标检测一卷到底之后，终于有人为它挖了个新坑｜CVPR2021 Oral （58）轻量高速检测器LFFD升级版LFD发布！用Pytorch部署，支持多类检测（59）船舶检测 | 计算机视觉来看苏伊士运河堵船（60）基于YOLOV4的印刷电路板PCB目标检测（61）INT4量化用于目标检测（62）超越YOLOv5！PP-YOLOv2：更快更好的目标检测网络（62）Hugging Face发布PyTorch新库「Accelerate」：适用于多GPU、TPU、混合精度训练（63）超越YOLOv5还不够！这个目标检测开源项目又上新了（64）60.6 AP！打破COCO记录！微软提出DyHead：将注意力与目标检测Heads统一（65）当YOLOv5遇见OpenVINO！（66）OpenVINO™ 头部姿态评估网络应用演示（67）实操教程｜YOLOv5实现自定义对象训练与OpenVINO部署全解析（68）缺陷检测算法汇总（传统+深度学习方式）|综述、源码（69）一文梳理水下目标检测方法（70）不容忽视的问题：行人检测器的泛化能力（71）让检测告别遮挡 | NMS-Loss是如何解决目标检测中的遮挡问题的？（72）旋转目标检测 | 基于高斯 Wasserstein 距离损失的目标检测（附源代码）（73）干货 | 利用像机图像通过卷积神经网络实时进行水稻检测（致敬袁老）（74）MaskedFace-Net | 新冠疫情中的口罩检测（附论文及源代码）（75）CVPR 2021 | 谷歌提出MobileDets：轻量化目标检测网络（76）收藏 | 使用合成数据集做目标检测（77）运动目标检测之-ViBe算法（78）目标检测精选系列，目前最全的总结！（附论文下载）（79）特别小的目标检测识别（附论文下载）（80）新目标检测框架 | 基于改进的one-shot的目标检测（81）PPCNN：细粒度特征提取和定位用于目标检测（附论文下载）（82）基于深度学习的车道线检测算法（83）CVPR实时移动端检测场景竞赛：字节跳动绝对优势夺冠（84）极市项目｜物料空仓检测识别算法（85）目标检测 | 基于统计自适应线性回归的目标尺寸预测（86）YOLOF：速度和效果均超过YOLOv4的检测模型（87）基于深度学习的公路病害检测方法研究（88）OTA：目标检测中的最优传输分配（89）目标检测干货 | 多级特征重复使用大幅度提升检测精度（文末附论文下载）（89）基于图像处理的道路路面裂缝检测研究现状（90）开源项目推荐 yolov5-face：

分类,重识别（主干网络）

（01）1.8M超轻量目标检测模型NanoDet，比YOLO跑得快，上线两天Star量超200 （02）中山大学提出新型行人重识别方法和史上最大评测基准（03）ECCV 2020 论文大盘点-遥感与航空影像处理识别篇（04）中山大学提出新型行人重识别方法和史上最大评测基准（05）视频人员重识别：关系引导空间注意力 + 时间特征提取模型（06）武汉大学等发布ReID最新综述！囊括三大视觉顶会，提出新基准方法AGW｜TPAMI2021 （07）中山大学提出新型行人重识别方法和史上最大评测基准（08）全面升级！FastReID V1.0正式开源：Beyond reID （09）最强ResNet变体！归一化再见！DeepMind提出NFNet，代码已开源！（10）深度学习行人重识别综述与展望，TPAMI 2021 最新文章（11）摄像机域内监督行人重识别问题（12）WACV 2021 论文大盘点-图像分类篇（13）WACV 2021 论文大盘点-图像与视频检索篇（14）CVPR 2021 | 目标引导的人类注意力估计提升零样本学习（15）大道至简！深度解读CVPR2021论文RepVGG！（16）提出端到端的原型跨域自监督学习(PCS)框架，用于 Few-shot 无监督域适应(FUDA)。（17）ResNet强势升级，仅改进训练和扩展策略便与EfficientNets一争高下

（19）CVPR2021|ACNet再进化，清华大学&旷视科技提出Inception类型的DBB （20）时隔两年，EfficientNet v2来了！更快，更小，更强！（21）89.77%准确率！谷歌提出CoAtNet：将卷积与自注意力结合（22）CVPR 2021 Oral | 超越卷积的自注意力新模型！谷歌提出：HaloNet，又一超强视觉主干… （23）高光谱图像的遥感图像分类研究现状以及问题（24）谷歌提出「卷积+注意力」新模型，超越ResNet最强变体！（25）全球首个开源图像识别系统上线了（26）字节跳动获CVPR2021 细粒度图像竞赛双料冠军（27）干货 | 阿里的图像搜索架构（28）EfficientNetV2

语义目标分割

（01）NeurIPS 2020 Oral: 利用像素级别循环一致性来解决域适应语义分割问题（02）性能提升30%以上！产业SOTA的实时实例分割算法SOLOv2，更快更强！（03）CVPR 2020 论文大盘点-抠图 Matting 篇（04）不用绿幕也能实时抠图，商汤等提出只需单张图像、单个模型的新方法MODNet （05）性能提升30%以上，实时实例分割算法SOLOv2实现产业SOTA （06）YolactEdge，首个边缘设备上实时实例分割法(Jetson AGX Xavier:30 FPS （07）医学图像分割最佳方法的全面比较：U-Net和U-Net++ （06）MODNet 很容易以端到端的方式进行训练。它的速度比同期抠图方法快得多，运行速度为每秒 63 帧。

（07）该工作中，作者提出 BoxInst，可以只用实例包围框标注（而非实例掩码标注）（08）作者将这一联合任务命名为深度感知视频全景分割，并为其提出了一个新的评估指标以及两个衍生数据集，并表示这些数据集将被公开。（09）图像分割二十年，盘点影响力最大的10篇论文（10）2020年「21篇」医学影像算法最佳综述（11）重新思考语义分割范式：SETR （12）一文读懂Image matting（图像抠图）（13）大盘点 | 2020年5篇图像分割算法最佳综述（14）大盘点 | 2020年「21篇」医学影像算法最佳综述（15）【资源】全景分割相关资源大列表（16）OpenVINO + OpenCV 实现车辆检测与道路分割（17）超快速的端到端实例分割模型，手把手教你用opencv部署Yolact （18）WACV 2021 论文大盘点-图像分割篇（19）2020 CCF BDCI 地块分割Top1方案 & 语义分割trick整理（20）首个 Text Matting（文本抠图）方法，灵活好用（21）Transformer再突破！MedT：医学图像分割新网络（22）CVPR 2021 | MSRA提出像素级别自监督预训练方法PixPro，大幅提升下游检测分割任务性能（23）SG-net：一次视频实例分割的空间粒度网络（24）Panoptic FCN：真正End-to-End的全景分割（25）CVPR 2021 Oral | Transformer再突破！美团等提出VisTR：视频实例分割网络（26）CVPR 2021 | 250 FPS！让实时语义分割飞起！重新思考BiSeNet （27）顶刊TPAMI 2021！南开大学提出深度霍夫变换：语义线检测新方法（28）Segmenter：基于纯Transformer的语义分割网络（29）谷歌等新作：视觉Transformer的有趣特性（30）视觉Transformer比CNN更鲁棒！IBM华人研究员新作（31）更快更强！谷歌提出NesT：收敛更快、鲁棒更好的Transformer

（32）种实时，高分辨率的背景替换技术，可在4K分辨率下以30fps的速度运行，HD情况下以60fps的速度运行，代码已开源！（33）港大&NVIDIA提出SegFormer：简单有效Transformer的语义分割新思路（34）实操教程｜使用图像分割来做缺陷检测的一个例子（35）CVPR2021佳作 | One-Shot都嫌多，Zero-Shot实例样本分割（36）训练数据不需要手工标注分割，也能实现图像分割？（37）CVPR2021 双图层实例分割，大幅提升遮挡处理性能（38）Google发布语义分割新数据集！顺带开发个模型屠榜，已被CVPR2021接收

目标追踪

（01）收藏 | 多目标跟踪（MOT）入门（02）单目标跟踪综述（03）简单粗暴的多目标跟踪神器 – DeepSort （04）结合重检测的长时目标跟踪（05）目标跟踪又添重磅开源工具箱，MMTracking来了！（06）遥感图像+CNN，预测区域人口收入水平（07）目标追踪综述（08）WACV 2021 论文大盘点-目标跟踪篇

（09）不经意的“走两步”就能锁定身份信息，这就是步态识别黑科技。推荐一篇新出的综述，全面介绍了步态识别的发展，包含技术演进、主要数据集、现在技术达到的水平，了解深度学习步态识别的必读论文。 Deep Gait Recognition: A Survey https://arxiv.org/pdf/2102.09546.pdf

（10）#手部跟踪# 人手是极其灵活的，存在各种复杂的自接触和遮挡，给跟踪带来了困难。Facebook现实实验室近日发明了一种极其精确的人手跟踪方法，通过在视觉模型中加入物理特性限制达成。无论是单手还是双手，均可实现高度精确的跟踪。 Constraining Dense Hand Surface Tracking with Elasticity 主页 |https://research.fb.com/publications/constraining-dense-hand-surface-tracking-with-elasticity/

（11）TraDeS ：CVPR 2021多目标跟踪算法，改进了目前联合检测与跟踪的在线方法，使用跟踪线索辅助检测，在多个数据集实现了大幅精度提升，作者来自纽约州立大学。论文尚未公布，代码将开源。 Track to Detect and Segment: An Online Multi-Object Tracker 项目主页：https://jialianwu.com/projects/TraDeS.html

(12)基于尺度不变特征变换的多路监控视频拼接系统（13）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法（14）基于SIFT尺度不变特征变换的图像拼接算法（15）最新开源！TransReID：首个基于Transformer的ReID网络，各项任务全面领先！（16）WACV2021论文解读-Scale Equivariance Improves Siamese Tracking （17）端到端的多目标跟踪，代码将开源，Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using Spatial and Temporal Transformers （18）提出 SiamGAT，用于目标跟踪，性能领先许多当前先进跟踪器，达到 SOTA。（19）TCSVT2021：一种结合全局和局部细粒度特征的行人再识别方法（20）CVPR 2021 | 首个无需锚框（Anchor-Free）的行人搜索框架（附代码）（21）基于YOLOV3与DeepSort的行人多目标跟踪（22）从理论到实战！视频流车辆计数和目标跟踪（23）TPAMI 2021 ：基于 event stream 的步态识别，准确率高达90% （24）极市直播回放丨第80期-张新宇：CVPR 2021-Alpha Refine：通过精确的边界框估计提高跟踪性能（25）目标跟踪入门篇-相关滤波

动作检测与识别

（01）MMAction2: 新一代视频理解工具箱（02）WACV 2021 论文大盘点-人体动作检测与识别篇（03）CVPR 2021 | 用于动作识别，即插即用、混合注意力机制的 ACTION 模块（04）CVPR 2021 | 商汤提出最强时序动作提名修正网络：TCANet （05）人体动作识别与生成：基于ST-GCN的方法（06）刷爆HACS挑战赛时序动作检测榜单！TCANet：最强时序动作提名修正网络 CVPR 2021 （07）更快更强！视频理解模型PP-TSM重磅发布：速度比SlowFast快4.5倍（08）视频异常行为检测算法MPN，在多个数据库上达到SOTA （09）CVPR2021Oral #人体运动捕捉使用 4 个RGBD摄像头进行人体运动捕捉，在几何重建和纹理生成上效果都更好（10）CVPR 2021 | 又好又快的视频异常检测，引入元学习的动态原型学习组件

姿态估算

（01）多人姿态识别框架——AlphaPose （02）GitHub：人体姿态估计最全资料集锦（03）人体姿态估计 (Human Pose Estimation) 常用方法总结（04）CVPR2020 | 旷视研究院提出 PVN3D：基于 3D 关键点投票网络的单目 6DoF 位姿估计算法（05）人体姿态估计、识别与生成最新技术一览（06）深度学习人体姿态估计：2014-2020全面调研（07）最新开源：端到端6D物体姿态跟踪，无需标注数据集！（08）手势识别基础～手势骨架与关键点提取（09）动物姿态估计！马、老虎、牛、鹿、狗狗的姿态都能搞定！斩获CVPR 2021 Oral （10）OpenVINO™ 头部姿态评估网络应用演示（11）CVPR 2021 | 微软提出"解构式关键点回归"，刷新COCO自底向上多人姿态检测记录！

OCR

（01）万字长文 | 图表示学习中的Encoder-Decoder框架（02）霸榜Github：又一款OCR神器面世！（03）新视角：用图像分类来建模文字识别也可以SOTA （05）都2021了，别再堆砌网络了！10万奖金悬赏最强轻量化OCR模型（06）顶刊TPAMI 2021！PAN++：精确高效的任意形状文本检测与识别（07）最新！CVPR 2021 OCR领域论文大盘点（22篇）（08）论文推荐｜【KSII TIIS 2021】DP-LinkNet：一种用于古籍文档图像二值化的卷积网络(有源码)

3D,深度估算,点云,SLAM

（01）CVPR2020 | 3D 目标检测新框架：3DSSD （02）CenterFusion：融合雷达与摄像头数据的高精度3D目标检测（03）最佳论文！商汤提出手机端实时单目三维重建系统 | ISMAR 2020

（04）商汤提出手机端实时单目三维重建系统，实现逼真AR效果和交互（05）基于深度学习的图像匹配技术一览（06）极市直播｜AAAI’21杰出论文许鸿斌：一个解决三维重建对数据依赖的新框架（已开源）（07）OpenCV再升级！修改一行代码，将图像匹配效果提升14%！（08）重磅！谷歌开源TensorFlow 3D场景理解库（09）极市直播回放丨第76期-许鸿斌：AAAI’21杰出论文，一个解决三维重建对数据依赖的新框架（已开源）（10）可用于大规模点云表面重建的深度学习算法（11）可用于大规模点云表面重建的深度学习算法

（12）深度估计是机器人和自动驾驶研究的重要内容，而这往往需要特殊设备，如RGB-D相机或激光雷达，如何使用RGB相机感知深度呢？研究人员曾经做了很多的尝试。该视频是CVPR 2021论文Depth from Camera Motion and Object Detection结果，通过使用“普通手机摄像头运动+目标检测的包围框”数据，设计RNN网络实现了达到最先进精度的目标深度估计。单位 | 密歇根大学，史蒂文森理工学院论文 | https://arxiv.org/abs/2103.01468代码 | https://github.com/griffbr/ODMD （13）CVPR 2021 | TPCN 点云就是这么美妙（14）一文了解激光点云的组织形式（15）基于YOLO的新型RGB-D融合方法对行人进行检测和3D定位（16）ECCV2020 | 夜间图像的无监督单目深度估计（17）MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo （18）在 KITTI 基准数据集上实现最先进的单目3D目标检测结果，表现与基于单目视频的方法相当。（19）真正实用的退化模型：ETH开源业内首个广义盲图像超分退化模型，性能效果绝佳（20）ResNet也能用在3D模型上了！清华计图首创三角网格面片上的卷积神经网络：SubdivNet （21）开源｜AAAI‘21杰出论文-三维重建新探索：解决数据依赖问题，让自监督信号更可靠！（22）综述：基于点云的自动驾驶3D目标检测和分类方法（23）PatchmatchNet：一种高效multi-view stereo框架 (CVPR2021 Oral) （24）CVPR2021｜神经网络如何进行深度估计？（25）DXSLAM：一种基于深度特征的鲁棒且高效的视觉SLAM系统（26）实时高分辨率 RGB-D表面重建（CVPR2021）（27）Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪（28）HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法（29）基于点云的3D障碍物检测（30）极市直播丨朱思语：基于深度学习的视觉稠密建图和定位（31）基于3D Surfel图的单目直接法稀疏定位（32）将合成 3D 场景表示合并到生成模型中，从而实现更可控的图像合成。（33）传统单图像深度估计往往只能给出低分辨率结果，细节也不够丰富，视觉上总给人模糊不清的感觉，来自SFU和Adobe的研究者通过合并不同分辨率生成高分辨率的深度估计，终于可以还原清晰的细节。（34）OmniPhotos，目前最快的360°全景VR摄影方法。代码已开源。（35）作者提出并集成GrooMeD-NMS–一种新颖的分组数学可区分的NMS，用于单眼3D物体检测，（36）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

GUN（图像生成,超分辨,动作迁移）

（01）CVPR 2020 论文大盘点-图像增强与图像恢复篇（02）哈工大等提出轻量级盲超分辨模型LESRCNN，代码已开源（03）最新！图像去噪综合比较研究（04）无需用户输入，Adobe提出自动高质量图像合成新方法（05）NVIDIA Research的研究人员提出了一种自适应鉴别器增强机制，该机制可显着稳定有限数据环境中的训练。（06）照片秒变卡通风！教你用PaddleGAN快速生成你的专属卡通头像（07）精准生成Fake人脸！Amazon全新GAN模型给你全方位无死角美颜（08）博士后姐把“二次元老婆生成器”升级了！AniGAN：这一次可以指定画风（09）训练 GANs 一年我学到的 10 个教训（10）涵盖 18+ SOTA GAN 实现，这个开源工程 PyTorch 库火了（11）6ms 的EfficientDeRain：颇具启发的简单高效去雨算法（12）PULSE:一种基于隐式空间的图像超分辨率算法（13）解决以往单图像超分辨率算法仅在合成数据上效果好，无法适用于真实场景的问题。无需对特定类型相机图像训练，即可泛化到不同的相机上。Exploiting Raw Images for Real-Scene Super-Resolution单位 | 卡内基梅隆大学，商汤，加州大学论文 | https://arxiv.org/pdf/2102.01579.pdf代码 | https://www.dropbox.com/s/a66iuwoswul65da/RawSR_PAMI20.zip?dl=0主页 | https://sites.google.com/view/xiangyuxu/rawsr_pami （14）下一代更衣室！国外一位设计师做的虚拟试衣应用。基于OpenPose 进行2D关节点跟踪，使用 Houdini 特效渲染。来源：https://80.lv/articles/next-gen-dressing-room-with-markerless-tracking-in-houdini/

（15）#GAN #WACV2021 SinGAN-GIF 可以生成任意长宽比的样本，进行超分辨率，改变时帧率，并可用于视频编辑应用。 SinGAN-GIF: Learning a Generative Video Model From a Single GIF 作者 | Rajat Arora, Yong Jae Lee 单位 | 加利福尼亚大学戴维斯分校论文 | https://openaccess.thecvf.com/content/WACV2021/papers/Arora_SinGAN-GIF_Learning_a_Generative_Video_Model_From_a_Single_GIF_WACV_2021_paper.pdf 主页 | https://rajat95.github.io/singan-gif/

（16）WACV 2021 论文大盘点-图像质量篇

（17）Morph-UGATIT：一种支持渐进式域迁移的图像翻译方法（18）近日由加州大学圣迭戈分校、CMU、Facebook 提出的一种极快速的视频插帧方法，比之前最精确的方法快384倍，比之前最快的8倍插值方法快23倍。该视频为使用该方法得到的慢动作影像。代码将开源。 FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation units | 加利福尼亚大学圣迭戈分校；卡内基梅隆大学；Facebook AI paper | https://arxiv.org/abs/2012.08512 github | coming home | https://tarun005.github.io/FLAVR/

（19）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody（即将）

（20）CVPR 2021接收论文：AdCo基于对抗的对比学习

（21）第一个同时采用传感器数据和图像进行视频稳定的 DNN 解决方案。Deep Online Fused Video Stabilization单位 | 威斯康星麦迪逊大学，谷歌论文 | https://arxiv.org/abs/2102.01279代码 | 即将主页 | https://zhmeishi.github.io/dvs/

（22）浙大等学者发明的Neural Body算法，输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody（即将）

（23）TIP 2021论文：多曝光图像融合及超分辨的联合实现（24）CVPR 2021 Oral｜只用静态图像，就能实时渲染出丝滑3D效果（25）智趣丨实时风格迁移，移动端运行，人脸特效又有了新玩法（26）CVPR 2021 | 港科大：如何利用闪光图像(flash image)来去除反光？（27）CVPR 2021 | Neighbor2Neighbor：仅需噪声图像即可训练任意降噪网络的方法（28）多功能的图像超分辨模型：用于盲图像超分辨的非对称卷积神经网络（29）深度图像修复的一个突破（30）GANSpace: Discovering Interpretable GAN Controls （31）TIP2021| 视频超分辨率中的多级特征融合网络（32）rtFlow: Unbiased Image Style Transfer via Reversible Neural Flows提出 ArtFlow 来防止通用风格迁移过程中的 content leak（内容泄漏）。ArtFlow 由可逆的神经流和无偏的特征迁移模块组成。同时支持前向和后向推理，并采用投影-转移-还原的方案进行操作。ArtFlow 在避免 content leak（内容泄漏）的同时，实现了与最先进的风格迁移方法相当的性能。（33）极市直播丨邓欣：TIP 2021-多曝光图像融合及超分辨的联合实现方法（34）Weather GAN：实现晴、阴、雾、雨、雪之间的天气状况自由迁移（35）CVPR 2021 | 五官画风都能改，用无监督方法控制 GAN (附源码) -周博磊团队（36）CVPR 2021｜Neighbor2Neighbor：无需干净图像的自监督图像降噪（37）图像反光能被一键去除了？港科大开源RFC，仅用一个操作，强反光也能完美去除｜CVPR2021 （38）你好，这是微视AI还原的李焕英（39）有限数据来训练GAN的一种思路（40）揭秘腾讯微视人脸技术「黑科技」，基于GAN的人脸魔法特效（41）添加链接描述（42）CVPR2021｜超分性能不降低，计算量降低50%，董超等人提出加速图像超分的ClassSR （43）RealSR性能大幅提升！旷视+快手+电子科大联合提出“先发散再收敛”的D2CSR （44）仅需2张图！AI便可生成完整运动过程（45）PornHub 用独家数据集！修复了百年前的电影… （46）新垣结衣夫妇的孩子会长啥样？我用BabyGAN预测试试… （47）刚刚！AMD发布超分辨率新技术FSR：N卡也能用（48）Transformer再下一城！ETH提出：视频超分辨率Transformer （49）蔡徐坤x特xxx梦幻联动！这个神器能让图像实时模仿人的动作（50）人人皆可二次元！这个GAN网络让小姐姐生成不同风格的动漫形象！肤色、发型皆可变（51）这款AI神器，让父亲重返18岁！（52）DSRL：灵活而简单的框架,提高网络精度的且不引入额外的计算量,CVPR2020 （53）实时 4K “image-to-image translation”，港理工&达摩院张磊团队提出拉普拉斯金字塔变换网络（54）NBNet：抛开复杂的网络结构设计，旷世&快手提出子空间注意力模块用于图像降噪（55）开源 | 性能炸裂，旷视提出适用于底层问题的Half Instance Normalization （56）GNN 模型在生物化学和医疗健康中的典型应用（57）超强面经：文本检测与GAN篇（含答案）（58）CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性（59）LeCun点赞！GAN模型130毫秒生成动漫肖像！（60）Deepfake文字版横空出世：AI高仿你的笔迹只需1个词！（61）【开源】对基于图像背景的字体生成、人体姿势预测、关键点检测、超分辨率等探讨（62）https://intel-isl.github.io/PhotorealismEnhancement/ （63）图像填充不怕区域大！MSRA等提出协同调制生成对抗网络（54）CVPR 2021 Oral | GLEAN: 基于隐式生成库的高倍率图像超分辨率（55）技压群雄！2021 NTIRE @CVPR 2021的三冠一亚视频超分方案：BasicVSR++

GNN（图神经相关）

（01）ECCV 2020 论文大盘点-图像视频修复篇（02）详解：多模态知识图谱种类及其应用（03）Facebook@ICLR2021：GNN中加入标签传播，训练时间直降100倍

Transformer

（01）Transformer 再下一城，Facebook 等提出多目标跟踪算法 TrackFormer （02）全文翻译 | 华为、北大、悉尼大学：最新视觉Transformer综述（2017-2020年）（03）计算机视觉中的Transformer （04）Transformer 最新应用，3D 点云处理，实现 S3DIS 数据集场景分割mIoU首次突破 70% ！

（05）用Pytorch轻松实现28个视觉Transformer，开源库 timm 了解一下！（附代码解读）（06）一文看懂9种Transformer结构（07）更深、更轻量级的Transformer！Facebook提出：DeLighT （08）刷爆AI圈！基于Transformer的DALL-E代码刚刚开源了（09）Transformer又来了！这个谷歌3D大法闻歌起舞，流畅且自然！（10）视觉Transformer之简单总结（11）效果远超Transformer！AAAI 2021最佳论文Informer：最强最快的序列预测神器（12）Transformer携手Evolving Attention在CV与NLP领域全面涨点！（13）无卷积！金字塔视觉Transformer(PVT)：用于密集预测的多功能backbone （14）CVPR 2021 | Transformer进军low-level视觉！北大华为等提出预训练模型IPT （15）CVPR 2021 Oral | Transformer再发力！华南理工和微信提出UP-DETR：无监督预训练检测器（16）搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（二）（17）CNN与Transformer的强强联合！谷歌最新开源BoTNet，ImageNet达84.7%准确率（18）ResNet被全面超越了，是Transformer干的：依图科技开源“可大可小”T2T-ViT，轻量版优于MobileNet （19）来自Transformer的降维打击：ReID各项任务全面领先，阿里&浙大提出TransReID （20）论文速递：金字塔Transformer，更适合稠密预测任务的Transformer骨干架构（21）视觉 Transformer 的可视化｜CVPR2021 （22）美团提出具有「位置编码」的Transformer，性能优于ViT和DeiT （23）刷爆AI圈！基于Transformer的DALL-E代码刚刚开源了（24）CVPR2021 | 用Transformers无监督预训练进行目标检测（25）CVPR2021 | 用Transformers无监督预训练进行目标检测（26）Facebook首发时空Transformer 训练速度远超3D CNN！（27）添加链接描述（28）CVPR 2021 | Transformer再下一城！复旦等提出SETR：语义分割网络（29）霸榜各大CV任务榜单，Swin Transformer横空出世！（30）https://arxiv.org/abs/2103.14803 （31）On the Adversarial Robustness of Visual Transformers论 Visual Transformers 的对抗鲁棒性（32）Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers （33）CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image Classification用于图像分类，代码将开源（34）HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval用于视频文本检索（35）TransCenter: Transformers with Dense Queries for Multiple-Object Tracking用于多目标跟踪，代码将开源（36）TFPose: Direct Human Pose Estimation with Transformers用于人体姿态估计，代码开源（37）Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding （38）https://zhuanlan.zhihu.com/p/361092528 （39）https://zhuanlan.zhihu.com/p/361059921 （40）新论文石锤Transformer：别只看注意力，没有残差和MLP，它啥都不是（41）CNN再助力！CoaT：Co-Scale卷积-注意力图像Transformer （42）复旦提出M2TR：首个多模态多尺度Transformer （43）吴恩达真顶流！新增Transformer！深度学习课程更新，近60万人报名… （44）Twins：重新思考视觉Transformer中的空间注意力机制（45）屠榜各大CV任务！「百度顶会论文复现营」携Swin Transformer来袭！（46）重磅开源！Twins：更高效的视觉Transformer主干网，完美适配下游检测、分割任务（47）Transformer的中年危机（48）Transformer再下一城！厦大等提出ISTR：端到端实例分割（49）Transformer再下一城！Swin-Unet：首个纯Transformer的医学图像分割网络（50）谷歌用傅里叶变换替换Transformer自注意力层！在GPU上快7倍、TPU上快2倍… （51）DeepViT：迈向更深的视觉Transformer （52）超越PVT！南大提出ResT：高效多尺度的视觉Transformer （53）超越PVT！南大提出ResT：高效多尺度的视觉Transformer （54）Transformer再下一城！DeepMind新模型自动生成CAD草图，网友：建筑设计要起飞了（55）重新思考：在ResNet与Transformer均适用的跳跃连接（56）最新！CVPR 2021 视觉Transformer论文大盘点（43篇）（57）Transformer再下一城！low-level多个任务榜首被占领，中科大等联合提出：Uformer （58）清华提出DynamicViT：动态Token稀疏化的高效视觉Transformer （59）超越StyleGAN！TransGAN更新！用纯Transformer构建高分辨率GAN （60）不是所有图像都值16x16个词！清华&华为提出DVT：动态视觉Transformer （61）腾讯提出Shuffle Transformer：重新思考视觉Transformer的空间Shuffle （62）Transformer杀疯了！竟在图神经网络的ImageNet大赛中夺冠，力压DeepMind、百度… （63）谷歌大脑新作：教你训练自己的视觉Transfomer模型（64）南开&阿里提出P2T：基于金字塔池化的视觉Transformer！可用于各类下游场景理解任务！（65）谷歌新作：视觉Transformer超越ResNet！！！从头开始训练！（66）Apple新作：没有注意力的Transformer依然是顶流！！！（67）超越PVT！南大提出ResT：高效多尺度的视觉Transformer （68）浙大&华为等提出VTP：首个用于视觉Transformer的剪枝方法（69）Transformer 进行端到端的目标检测及跟踪（附源代码）（70）如何看待无监督学习在 vision transformer 上的应用前景？（71）你仅需要看一个序列！YOLOS：重新思考Transformer的泛化性能（72）通用性 Transformer 基石视觉架构，带来大范围性能提升！（附项目地址）（73）基于 detectron2 实现的 PVT 开源了；可用于密集任务 Backbone 的金字塔视觉 transformer （74）搞懂 Vision Transformer 原理和代码，看这篇技术综述就够了（九）（75）极市直播丨陈鑫：CVPR 2021-TransT: 基于Transformer的高性能单目标跟踪算（76）打破Transformer宿命，新秀VOLO开源！横扫CV多项记录，首个超越87%的模型（77）OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测（78）各类Transformer都得稍逊一筹，LV-ViT：探索多个用于提升ViT性能的高效Trick （79）利用TRansformer进行端到端的目标检测及跟踪（附源代码）（80）COTR 一种基于Transformer的图像匹配网络（81）谷歌AI用30亿数据训练了一个20亿参数Vision Transformer模型，在ImageNet上达到新的SOTA！（82）FcaNet：从频域角度重新思考注意力机制（83）重磅开源！Twins：更高效的视觉Transformer主干网，完美适配下游检测、分割任务（84）将Transformer引入CV届的Facebook 这次又有新发现：自监督学习 + Vision Transformers更配！

半监督，无监督，强化学习

（01）伪标签还能这样用？半监督力作UPS（ICLR 2021）大揭秘！（02）深度学习中的3个秘密：集成，知识蒸馏和自蒸馏（03）伪标签还能这样用？半监督力作UPS（ICLR 2021）大揭秘！（04）从 SimCLR 到 BarLow Twins ，一文了解自监督学习不断打脸的认知发展史（05）从4篇顶会论文看Self-training最新研究进展（06）大盘点 | 何恺明团队在自监督领域的工作：MoCo三部曲（07）CVPR 2021 Oral | 妙啊！不怕遮挡的图像线段匹配 SOLD2，还能联合自监督线段检测（08）CVPR 2021 | 何恺明等人新作！深入探究无监督时空表征学习（09）超越SEED！腾讯优图提出DisCo：拯救小模型在自监督学习中的效果（10）CVPR 2021 | 突破性研究！将自监督学习应用到自动驾驶上（11）LeCun联手华人博士后提出自监督学习新作！却遭Reddit网友质疑：第一张图就错了… （12）CVPR 2021 | 北大&MSRA提出CPS：基于交叉伪监督的半监督语义分割（13）深度了解自监督学习，就看这篇解读！Hinton团队力作：SimCLR系列

模型优化,压缩,加速，NAS（网络搜索），注意力机制

（01）超越MobileNetv3！Facebook提出FP-NAS：搜索速度快，精度更高添加链接描述（02）如何简单有效地实现迁移学习？ECCV 2020 论文介绍（03）超越 EfficientNet与MobileNetV3，NeurIPS 2020 微软NAS方向最新研究（04）模型压缩新突破，刷新滤波器剪枝的SOTA效果，优图NeurIPS 2020论文（05）从频域角度重新思考注意力机制——FcaNet （06）即插即用！视频超分中的涨点神器：iSeeBetter （07）可变形卷积的深度思考（08）真正的即插即用！盘点11种CNN网络设计中精巧通用的“小”插件（10）深度学习模型压缩与加速综述（11）量化新方：模型压缩 6 倍，无需重训练（12）用20篇论文走完知识蒸馏在 2014-2020 年的技术进展（13）基于TensorRT量化部署YOLOV5s 4.0模型（14）推理实践落地 | 最详细的 Pytorch 底层算子扩展总结（文末附源码）（15）教程：基于TensorRT完成NanoDet模型部署（16）基于深度学习的图像与视频压缩（17）深度学习精度提升 3 个小妙招：模型集成、知识蒸馏、自蒸馏（18）CVPR2021深度框架训练 | 不是所有数据增强都可以提升最终精度（19）CVPR 2021 | KeepAugment：一种简单的信息保存数据扩增方法, 助力分类/分割/检测涨点！（20）CVPR Oral：我给大家表演一个无中生有｜北航商汤耶鲁（21）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式（22）动态滤波器卷积新高度！DDF：同时解决内容不可知与计算量两大缺陷｜CVPR 2021 （23）Attention九层塔：注意力机制的九重理解（24）CNN可视化又添新作！南大提出Group-CAM：高效的显著图生成方法（25）超越自注意力！清华提出EA和EAMLP：使用两个线性层的新注意力机制（26）即插即用！浙大&港中文提出CompConv卷积：让模型不丢精度还可以提速（27）深度学习中的 Attention 机制总结与代码实现（2017-2021年）（28）基于深度学习的图像增强综述（29）完全解析 RNN, Seq2Seq, Attention 注意力机制（30）综述 | 注意力机制（31）CVPR 2021 | 超越卷积，自注意力模型HaloNet （32）CVPR 2021 | 基于随机标签的神经架构搜索（33）这可能是最强的AI算法可视化神器！

数据集,比赛,标注工具,实用工具

（01）CVPR 2020 算法竞赛大盘点（02）不规则四边形坐标的标注工具（可用于车牌 / OCR / 人脸关键点）（03）从3D人脸到自动驾驶，CVPR2020十个顶级开源数据集（04）80GB医学影像数据集发布！OCTA-500公开下载（05）火爆GitHub！3.2k Star的可视化神器开源！（06）近距离看CNN训练！360度可视化，网友：美得不真实（07）Tianchi 完整开源数据集！（08）RTX 3090的深度学习环境配置指南：Pytorch、TensorFlow、Keras （09）擦除：提升 CNN 特征可视化的 3 种重要手段（10）50万奖金，10亿像素，这个目标检测与跟踪可不简单（11）超2000万图片，全球最大人眼图像数据集开源了（12）#大场景目标检测比赛# PANDA 行人、车辆多目标检测数据已开放下载，今天初赛正式开赛啦！总计7G的数据集和相关标注，PANDA-Image由 555 张静态十亿像素图片组成，总共包含21个不同的场景，其中Training集包括390张图片。报名链接：https://tianchi.aliyun.com/s/be6691073b92dc4f2c2f230db97af7f5 技术解读：https://mp.weixin.qq.com/s/AYW7_yJjKv3dmkYJEJDJNg

（13）终于来了！我们发布了 PAKDD 2021 智能运维大赛 baseline （14）RankDataset：超大规模数据集加载利器（15）史上最全RGB-D数据集在这里！附详细对比下载文档！（16）10万奖励+10万数据集！垃圾分类/表情识别等赛事全面启动！2021高通人工智能应用创新大赛来了（17）ImageNet验证集6%的标签都是错的，MIT：十大常用数据集没那么靠谱（18）PANDA行人和车辆多目标检测方案及baseline代码（19）10万+数据集，表情识别/农作物病虫害识别/垃圾分类识别/手绘图像识别四大赛题等你挑战（20）CVPR 2021 | Short-video Face Parsing Challenge 开赛，数据集已开放！（21）54万奖金！目标检测新赛事！百度发起"智能交通检测"大赛（22）CVPR 2021商品识别竞赛来了！阿里达摩院主办（23）31万奖金！目标检测新赛事！第六届信也科技杯智能零售算法大赛来了（24）ICCV 2021 | 规模最大的戴口罩人脸识别比赛启动！（25）ICCV 2021 | 首个大规模视频语义分割比赛启动！（26）10万奖金池！OpenMMLab算法生态大赛正式启动！（27）动作检测/定位/解析三大赛道！ICCV 2021 DeeperAction挑战赛来了

（28）神仙打架丨NTIRE2021视频超分挑战双赛道方案（29）3D人体目标检测与行为分析竞赛开赛，奖池7万+，数据集达16671张！

杂项

（01）MultiPoseNet:人体检测、姿态估计、语义分割一 “网” 打尽（02）10 个开源 Python OpenCV 小项目，YouTube热门（03）图像算法可以稳定处理视频了！港科大开源通用算法，解决视频处理时域不稳定问题｜NeurIPS 2020 （04）性能SOTA、适用多种类型物体，国防科技大学单张RGB-D图像预测物体对称性（05）遥感图像+CNN，预测区域人口收入水平（06）清华&旷视提出RepVGG：让你的CNN一卷到底！（07）RepVGG：极简架构，SOTA性能，让VGG式模型再次伟大！（08）ICLR 2021 | SEED：自监督蒸馏学习，显著提升小模型性能！（09）麻省理工新框架 | MIT 开源高性能自动微分框架，速度提升 4.5 倍（附框架源码）（10）多模态深度学习：用深度学习的方式融合各种信息（11）AdvProp：两组Batch Normalization助你在CNN对抗训练中高效涨点（12）顶刊TPAMI 2021 | 换个损失函数就能实现数据扩增？（13）旷视提出MomentumBN：缓解自监督学习的大batch要求，涨点明显！（14）涨点神器！南京大学提出IC Networks：对CNN的基础单元重新建模（15）涨点神器！重新标记ImageNet，让CNN涨点明显！代码已开源（16）DeepMind重新设计高性能ResNet！无需激活归一化层（17）泛化神器！李沐等人提出两种正则化技术：在CV和NLP均有大幅度提升（18）CVPR 2021 | RepVGG：极简架构，SOTA性能，让VGG式模型再次伟大！（19）CVPR 2021 | 涨点神器！IC-Conv：使用高效空洞搜索的Inception卷积，全方位提升！（12）CVPR 2021 | 即插即用！ CA：新注意力机制，助力分类/检测/分割涨点！（13）ICLR2021 Oral｜9行代码提高少样本学习泛化能力，代码已开源（24）综述：轻量级CNN架构设计（25）将位置信息嵌入通道注意力！NUS提出新机制，显著提升卷积特征表达｜CVPR2021 （26）添加链接描述CVPR2021 佳作 | 重新标记 ImageNet：从全局标签到局部标签（附 GitHub 代码及论文）（27）重新标注 ImageNet：多标签，全面提升模型性能（28）刚刚！频域通道注意力网络FcaNet开源了！（29）我卷我自己——cvpr2021：Involution （30）白给的性能不要？cvpr2021-Diverse branch block （31）极市沙龙回顾｜CVPR2021-李铎：通过反转卷积的内在性质进行视觉识别（32）DO-Conv无痛涨点：使用over-parameterized卷积层提高CNN性能（33）动态卷积超进化！通道融合替换注意力，减少75%参数量且性能显著提升 ICLR 2021 （34）CVPR’21 | Involution：超越卷积和自注意力的神经网络新算子（35）【新Attention】最强的Attention函数诞生啦，带给你意想不到的巨大提升！（36）ICML 2021 (Long Oral) | 深入研究不平衡回归问题（37）谷歌大脑新工作：把注意力放在MLP上！（38）ICML 2021 | 稀疏训练新方法：In-Time Over-Parameterization （40）清华提出RepMLP：FC“内卷”，卷出性能！（41）图灵奖得主Bengio又出新论文：用强化学习提升模型泛化性！网友崩溃：idea撞车了… （42）一文看尽深度学习中的20种卷积（附源码整理和论文解读）（43）干货｜深度学习中的重参数技巧（44）登上更高峰！颜水成、程明明团队开源ViP，引入三维信息编码机制，无需卷积与注意力（45）最新视频防抖论文精选 + 开源代码汇总（46）CVPR 2021 | 任何人都能“不讲武德”，姿态可控的语音驱动说话人脸（47）CV圈杀疯了！继谷歌后，清华、牛津等学者又发表三篇MLP相关论文，LeCun也在发声（48）领域泛化最新综述（49）实践教程｜利用CNN来检测伪造图像（50）介绍一种新的激活函数族ACON （51）CVPR 2021 图像压缩最新进展（52）Google发布语义分割新数据集！顺带开发个模型屠榜，已被CVPR2021接收（53）CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式

文章阅读

（01）LS-Net：单双目视觉的非线性最小二乘学习算法（02）GNN、RL强势崛起，CNN初现疲态？这是ICLR 2021最全论文主题分析（03）何恺明团队最新力作SimSiam：消除表征学习“崩溃解”，探寻对比表达学习成功之根源（04）简洁的架构还能高效和准确？清华&华为提出新型残差循环超分模型：RRN！（05）华为北大等联手打造的Transformer竟在CV领域超过了CNN：多项底层视觉任务达到SOTA （06）腾讯微视模型 | 单模型史上最佳成绩，（BLENDer）登顶权威榜单VCR （07）令人“细思极恐”的Faster-R-CNN （08）ACCV 2020 最受关注的 Top10 代码开源论文!

（09）详解：多模态知识图谱种类及其应用（10）噪声样本优秀论文综述（2017-2020）（11）当频域（DCT）遇见CNN （11）小哥质疑谷歌顶会CV论文有错！并且拿出了复现代码来证明（12）深入研究模型压缩经典Ghostnet：如何用少量计算生成大量特征图？（13）AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！（14）深度学习的目标检测算法是如何解决尺度问题的？（15）图解RepVGG （16）详解：多模态知识图谱种类及其应用（17）激活还是不激活？CVPR2021-Activate Or Not: Learning Customized Activation （18）当CV遇上联邦学习！FedVision：首个轻量级、可扩展的视觉联邦开源框架（19）深度学习前人精度很高了，该怎么创新？（20）谷歌AI研究院：被低估的数据！被高估的模型… （21）新坑来了！谷歌提出MLP-Mixer：一种纯MLP构成的视觉架构（22）我为中国第一张火星照片做鱼眼矫正（23）同行评审就是个笑话！Nature爆料：计算机生成的垃圾文章竟还能被接受，64%来自中国（24）视觉架构大一统！港中文提出：Container，对CNN、Transformer和MLP-Mixer进行了大一统（25）真·自行车！华为天才少年刚刚「发布」了一款无人驾驶自行车，网友：这TM不比特斯拉燃？（26）论文无法复现！真公开处刑！PapersWithCode上线「论文复现报告」（27）2021年，深度学习还有哪些未饱和、有潜力且处于上升期的研究方向？（28）波士顿动力机器狗打工这一年（29）无人驾驶车辆跟踪技术研究介绍

在这里插入图片描述

2021计算机视觉-包揽所有前沿论文源码 -上半年

最近更新

热门博客

[ 申请 ]友情链接：