大家是否遇到过这种情况,就是在工作或者学习的时候,想去找一些方向的网络,但是呢,尴尬的是,老旧的网络里不想要,前沿的网络又不知道有哪些。为了解决大家的这个困扰,本人决定收集2021年上半年大部分前沿的网络相关链接,之后我会( 文末附带 \color{blue}{文末附带} 文末附带 公众号 − \color{blue}{公众号 -} 公众号− 海量资源。 \color{blue}{ 海量资源}。 海量资源。):
每周一更新一次(下面是我多年年收集的链接地址) \color{red}{每周一更新一次(下面是我多年年收集的链接地址) } 每周一更新一次(下面是我多年年收集的链接地址) 计算机视觉-包揽所有前沿论文源码
有兴趣的朋友可以加微信:17575010159 相互讨论技术。若是帮助到了你什么,一定要记得点赞!因为这是对我最大的鼓励!
视觉工作项目-为后来的你,提供一份帮助! 上面这个链接是我所有工作项目的详细解。 \color{red}{上面这个链接是我所有工作项目的详细解。} 上面这个链接是我所有工作项目的详细解。
文章分类
(01)AAAI 2021 | 腾讯优图11篇论文入选,涵盖动作识别、人群密度估计、人脸安全等领域 (02)重磅!网易伏羲9篇论文入选AI顶会AAAI 2021 (03)CVPR2020 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】 (04)CVPR、ECCV 2020 两大会议论文分类索引 (05)人体姿态估计、识别与生成最新技术一览 (06)一文概览 CVPR2021 最新18篇 Oral 论文 (07)WACV 2021 论文大盘点-GAN 篇与行人监控篇 (08)近期必看的视觉综述,含 GAN、Transformer、人脸超分辨、遥感等 (09)CVPR2021 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】 (10)重磅!悉尼科大ReLER实验室13篇论文入选CVPR 2021 (21)WACV 2021 论文大盘点 目标检测与图像分割篇(持续更新) (22)WACV 2021 论文大盘点-GAN 篇与行人监控篇 (23)近期必看的视觉综述,含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等 (24)WACV 2021 论文大盘点-人体动作检测与识别 & 图像与视频检索篇 (25)AAAI 2021 | 微软亚洲研究院优秀论文汇总! (26)一文概览 CVPR2021 最新18篇 Oral 论文 (27)CVPR2021 最全整理:论文汇总 / 代码 / 项目 / 论文解读(更新中)【计算机视觉】 (28)CVPR2021最新接收论文合集!22个方向100+篇论文汇总|持续更新 (29)推荐几篇近期必看的视觉综述,含GAN、Transformer、人脸超分辨、遥感等 (30)推荐几篇近期必看的视觉综述,含图像检索、目标检测、人脸关键点检测、医学图像分割、遥感、模型优化等 (31)强调应用的WACV 2021,5篇最佳论文都在这里了 (32)CVPR 2021 论文分类汇总!持续更新中! (33)https://github.com/52CV/CVPR-2021-Papers
(34)CVPR2021中的目标检测和语义分割论文汇总 (35)一文概览 CVPR2021 最新18篇 Oral 论文 (36)CVPR 2021 | 腾讯AI Lab入选论文解读 (37)顶会论文分类汇总,包含WACV21/CVPR19、20/ECCV20(附下载) (38)2021 最新CV综述分类汇总(持续更新) (39)CVPR 2021 论文/代码分类汇总!持续更新中! (40)CVPR 2021 速览 | 旷视研究院22篇入选学术成果盘点 (41)一文概览 CVPR2021 最新18篇 Oral 论文 (42)CVPR 2021放榜,腾讯优图20篇论文都在这里了! (43)CVPR 二十年,影响力最大的10篇论文! (44)CVPR 2021公布最佳论文候选!华人占据半壁江山,何恺明、沈春华等人上榜 (45)添加链接描述CVPR 2021大奖出炉!何恺明获最佳论文提名,华人四篇“最佳”!第一届Thomas S. Huang 纪念奖颁发) (46)CVPR 二十年,影响力最大的10篇论文! (47)刚刚,CVPR 2021 最佳论文、最佳学生论文等奖项出炉了!(附论文下载地址) (48)CVPR 2021奖项出炉:最佳论文花落马普所,何恺明获提名,首届黄煦涛纪念奖颁布 (49)本周开源论文推荐:含人脸识别、实例分割、跟踪、SR等 (50)CVPR 2021 论文开放下载了! (51)[CVPR 2021 Best Paper Candidate] 32篇最佳论文候选已公布,猜一猜哪篇最终荣获 CVPR 2021 最佳论文? (52)【6月2日】十篇(将)开源论文代码分享 (53)5月26日】七篇(将)开源论文代码分享 (56)2021 745 篇已出论文最全分类汇总! (57)推荐几篇新出的 CVPR 2021开源论文,含图像分割、域适应、图像检索、视线估计等
人脸技术
(01)CVPR2020最佳新框架|大规模人脸表情识别(附源代码) (02)大盘点|轻量级人脸检测算法实现,快到没朋友的都在这里了~ (03)10种轻量级人脸检测算法大PK | 代码开源 (04)人脸识别剩下难题:从遮挡,年龄,姿态,妆造到亲属关系,人脸攻击 (05)人脸识别中的活体检测算法综述 (06)TinaFace:人脸检测新纪录! (07)准确率超99.5%!滴滴开源防疫口罩识别技术,及视觉比赛进展 (08)京东AI:戴口罩人脸识别pytorch开源库 (09)无需人脸检测和关键点定位,Facebook 等提出实时 3D 人脸姿态估计新方法 (11)大盘点 | 2020年「13篇」人脸算法最佳综述 (12)WACV 2021 论文大盘点-图像质量 & 姿态估计 & 3D 篇 (13)WACV 2021 论文大盘点-视频理解篇 & 图像质量篇 (14)OpenVINO + OpenCV 实现点头与摇头识别验证 (15)无需人脸检测和关键点定位,Facebook 等提出实时 3D 人脸姿态估计新方法 (16)如何入门多视角人脸正面化生成?不得不看的超详细最新综述! (07)WACV 2021 论文大盘点-人脸技术篇 (08)重要!分享几个业界新出人脸识别数据集 (09)Facebook等新提出的视听语音分离的方法VisualVoice,利用跨模态一致性 VisualVoice: Audio-Visual Speech Separation with Cross-Modal Consistency 单位 |德克萨斯大学奥斯汀分校,Facebook 论文 |https://arxiv.org/abs/2101.03149 代码 |https://github.com/facebookresearch/VisualVoice 主页 |http://vision.cs.utexas.edu/projects/VisualVoice/ (10)人脸超分辨率,基于迭代合作的方法 (11)不得不赞!京东开源FaceX-Zoo,一站式人脸识别研究平台 (12)跳过人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法 (13)无需人脸检测和关键点定位,Facebook等提出实时3D人脸姿态估计新方法 (14)CVPR 2021 | 中科大联合快手,提出人脸伪造检测新方法 (15)Face Transformer for Recognition用于人脸识别 (16)中国队拿下口罩人脸识别世界第一! (17)开源了!仅有85K个参数的人脸检测算法 (18)遮挡人脸问题 | 详细解读 Attention-Based 方法解决遮挡人脸识别问题(附论文下载) (19)CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实! (20)OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测 (21)腾讯优图TFace正式开源,更可信的人脸识别! (22)CVPR2021(Oral) 商汤、港中文实现单目人脸重建新突破: 基于生成网络的渲染器!几何形状更精准!渲染效果更真实! (23)单目3D人脸重建,皱纹可以随着表情而产生自然变化,更加逼真。 (24)D人脸建模 Snap 等提出首个 one-shot 3D 人脸风格迁移化的框架,只需要一张任意风格的图像,它可以生成具有夸张的几何形状和纹理风格化的三维人脸模型,
目标检测
(01)视频目标检测大盘点 (02)R-CenterNet:用CenterNet对旋转目标进行检测 (03)香港大学提出OneNet:一阶段端到端目标检测网络,无需NMS!无需二分匹配! (04)异常检测(Anomaly Detection)综述 (05)开源软件 | 深度学习用于道路病害检测 (06)Transformer 又立功了!又快(420 fps)又好的车道线检测算法 (07)NanoDet:轻量级(1.8MB)、超快速(移动端97fps)目标检测项目 (08)用实力给自己正名,YOLOv5:道路损伤检测我最强!GRDDC’2020大赛报告 (09)YOLO之外的另一选择,手机端97FPS的Anchor-Free目标检测模型NanoDet现已开源~ (10)优秀!港大同济伯克利提出Sparse R-CNN: 目标检测新范式 (11)目标检测无痛涨点之 Generalized Focal Loss V2 (12)用CenterNet对旋转目标进行检测 (13)基于计算机视觉的裂纹检测方案 (14)香港中文大学多媒体实验室 | 开源视频目标检测&跟踪平台(附源码下载) (15)基于密度图的航空物体检测:理论与代码实现 (16)目标检测的稀疏对抗攻击,代码已开源 (17)北亚利桑那大学等推出:航拍森林火情检测数据集 FLAME (18)无需NMS的目标检测,OneNet (19)NAS在检测中的应用 (20)NeurIPS 2020 | 微软亚洲研究院论文摘录之目标检测篇 (21)难以置信的目标检测小妙招:多训练几个epochs,平均一下就能获得更好的模型
(22)目标检测的稀疏对抗攻击,代码已开源 (23)C++ 实现 yolov5 的 OpenVINO 部署 (24)极市直播回放丨第75期-方浩:车道线检测新SOTA,RESA:循环特征位移聚合器(AAAI2021) (25)一文梳理缺陷检测方法 (26)开源项目|基于YOLO-V5实现行人社交距离风险提示(附完整源码) (27)重磅!13 篇基于 Anchor free 的目标检测方法 (28)旋转目标检测方法解读(DCL, CVPR2021) (29)一文梳理缺陷检测方法 (30)没有NMS!阿里巴巴和阿大提出PSS:更简单有效的端到端目标检测 (14)涨点技巧!小目标检测:数据增广 (15)AAAI 2021 目标检测论文大盘点(YOLObile/R3Det/StarNet等) (16)目标检测比赛思路、tricks集锦、资料汇总 (17)CVPR 2021 | GFLV2:目标检测良心技术,无Cost涨点! (18)实用教程详解:用OpenCV的DNN模块部署YOLOv5目标检测 (19)干货实践 | Anchor 优化后在目标检测提升这么明显 (20)物体检测中的小物体问题 (21)大改 Yolo 框架 | 能源消耗极低的目标检测新框架(附论文下载) (22)小目标检测:数据增强 (23)大盘点 | 2020年 2 篇异常算法最佳综述 (24)小目标检测:Feature Extraction (25)工业图像异常检测最新研究总结(2019-2020) (26)综述丨工业金属平面材料表面缺陷检测的研究进展 (27)详解基于深度学习的伪装目标检测 (28)基于 Caffe 格式部署 YOLOV5 模型 (29)#WACV 2021 FisheyeYOLO:用于自动驾驶的鱼眼相机上的通用物体检测。针对鱼眼图像中的物体检测,研究不同的物体表示方法中作者找到了更好的表示方法,如定向边界盒、椭圆和通用多边形。并设计了一种新型的曲线边界盒模型,该模型具有鱼眼畸变模型的最佳特性。FisheyeYOLO: Generalized Object Detection on Fisheye Cameras for Autonomous Driving单位 | 利默里克大学,Valeo论文 | https://www.researchgate.net/publication/346931586_FisheyeYOLO_Object_Detection_on_Fisheye_Cameras_for_Autonomous_Driving代码 | 暂未
(30)基于密度图的航空物体检测:理论与代码实现 (31)WACV 2021 论文大盘点-目标检测篇 (32)AAAI 2021中的目标检测(详细版with code) (33)从L1 loss到EIoU loss,目标检测边框回归的损失函数一览 (34)#城市天眼# 由美国 Skylark Labs 公司开发,无人机安防监控,可在高空中(3-90米)对人群检测并分析行为,发现可疑活动。 来源:https://twitter.com/i/status/1364086835266211843 (35)不用激光雷达,照样又快又准!3D目标检测之SMOKE (36)理解物体检测中的Objectness
(37)目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral (38)CVPR2021目标检测佳作 | Weighted boxes fusion(附github源码及论文下载) (39)基于YOLOV4深度网络的车辆压实线检测算法 (40)56.4 AP!超越YOLOv4,更快更强的CenterNet2来了! (41)CVPR2121目标检测 | 少见的知识蒸馏用于目标检测(附论文下载) (42)用于自动驾驶的实时车道线检测和智能告警 (43)全新FPN!CE-FPN:通道增强特征金字塔网络,助力目标检测涨点! (44)极市项目|未拴绳遛狗识别算法需求 (45)基于YOLOV5深度网络模型的火焰检测 (46)基于YOLOV5深度网络模型的交通标志设施的模型训练 (47)基于深度学习YOLOV5网络的道路状况检测 (48)基于YOLOV5深度网络的公路病害检测 (49)使用Disentangling形式的损失函数回归2D和3D目标框 (50)CVPR 2021 | 腾讯AI Lab入选论文解读 (51)实操教程:android camera nanodet 实时物体检测的高效实现总结 (52)CVPR2021 目标检测佳作 | Weighted boxes fusion(附 GitHub 源码及论文下载) (53)我扔掉FPN来做目标检测,效果竟然这么强!YOLOF开源:你只需要看一层特征|CVPR2021 (54)【入门教程】异常检测(Anomaly Detection)到底是什么? (55)最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型 (56)mmdetection性能简单优化方法 (57)目标检测一卷到底之后,终于有人为它挖了个新坑|CVPR2021 Oral (58)轻量高速检测器LFFD升级版LFD发布!用Pytorch部署,支持多类检测 (59)船舶检测 | 计算机视觉来看苏伊士运河堵船 (60)基于YOLOV4的印刷电路板PCB目标检测 (61)INT4量化用于目标检测 (62)超越YOLOv5!PP-YOLOv2:更快更好的目标检测网络 (62)Hugging Face发布PyTorch新库「Accelerate」:适用于多GPU、TPU、混合精度训练 (63)超越YOLOv5还不够!这个目标检测开源项目又上新了 (64)60.6 AP!打破COCO记录!微软提出DyHead:将注意力与目标检测Heads统一 (65)当YOLOv5遇见OpenVINO! (66)OpenVINO™ 头部姿态评估网络应用演示 (67)实操教程|YOLOv5实现自定义对象训练与OpenVINO部署全解析 (68)缺陷检测算法汇总(传统+深度学习方式)|综述、源码 (69)一文梳理水下目标检测方法 (70)不容忽视的问题:行人检测器的泛化能力 (71)让检测告别遮挡 | NMS-Loss是如何解决目标检测中的遮挡问题的? (72)旋转目标检测 | 基于高斯 Wasserstein 距离损失的目标检测(附源代码) (73)干货 | 利用像机图像通过卷积神经网络实时进行水稻检测(致敬袁老) (74)MaskedFace-Net | 新冠疫情中的口罩检测(附论文及源代码) (75)CVPR 2021 | 谷歌提出MobileDets:轻量化目标检测网络 (76)收藏 | 使用合成数据集做目标检测 (77)运动目标检测之-ViBe算法 (78)目标检测精选系列,目前最全的总结!(附论文下载) (79)特别小的目标检测识别(附论文下载) (80)新目标检测框架 | 基于改进的one-shot的目标检测 (81)PPCNN:细粒度特征提取和定位用于目标检测(附论文下载) (82)基于深度学习的车道线检测算法 (83)CVPR实时移动端检测场景竞赛:字节跳动绝对优势夺冠 (84)极市项目|物料空仓检测识别算法 (85)目标检测 | 基于统计自适应线性回归的目标尺寸预测 (86)YOLOF:速度和效果均超过YOLOv4的检测模型 (87)基于深度学习的公路病害检测方法研究 (88)OTA:目标检测中的最优传输分配 (89)目标检测干货 | 多级特征重复使用大幅度提升检测精度(文末附论文下载) (89)基于图像处理的道路路面裂缝检测研究现状 (90)开源项目推荐 yolov5-face:
分类,重识别(主干网络)
(01)1.8M超轻量目标检测模型NanoDet,比YOLO跑得快,上线两天Star量超200 (02)中山大学提出新型行人重识别方法和史上最大评测基准 (03)ECCV 2020 论文大盘点-遥感与航空影像处理识别篇 (04)中山大学提出新型行人重识别方法和史上最大评测基准 (05)视频人员重识别:关系引导空间注意力 + 时间特征提取模型 (06)武汉大学等发布ReID最新综述!囊括三大视觉顶会,提出新基准方法AGW|TPAMI2021 (07)中山大学提出新型行人重识别方法和史上最大评测基准 (08)全面升级!FastReID V1.0正式开源:Beyond reID (09)最强ResNet变体!归一化再见!DeepMind提出NFNet,代码已开源! (10)深度学习行人重识别综述与展望,TPAMI 2021 最新文章 (11)摄像机域内监督行人重识别问题 (12)WACV 2021 论文大盘点-图像分类篇 (13)WACV 2021 论文大盘点-图像与视频检索篇 (14)CVPR 2021 | 目标引导的人类注意力估计提升零样本学习 (15)大道至简!深度解读CVPR2021论文RepVGG! (16)提出端到端的原型跨域自监督学习(PCS)框架,用于 Few-shot 无监督域适应(FUDA)。 (17)ResNet强势升级,仅改进训练和扩展策略便与EfficientNets一争高下
(19)CVPR2021|ACNet再进化,清华大学&旷视科技提出Inception类型的DBB (20)时隔两年,EfficientNet v2来了!更快,更小,更强! (21)89.77%准确率!谷歌提出CoAtNet:将卷积与自注意力结合 (22)CVPR 2021 Oral | 超越卷积的自注意力新模型!谷歌提出:HaloNet,又一超强视觉主干… (23)高光谱图像的遥感图像分类研究现状以及问题 (24)谷歌提出「卷积+注意力」新模型,超越ResNet最强变体! (25)全球首个开源图像识别系统上线了 (26)字节跳动获CVPR2021 细粒度图像竞赛双料冠军 (27)干货 | 阿里的图像搜索架构 (28)EfficientNetV2
语义目标分割
(01)NeurIPS 2020 Oral: 利用像素级别循环一致性来解决域适应语义分割问题 (02)性能提升30%以上!产业SOTA的实时实例分割算法SOLOv2,更快更强! (03)CVPR 2020 论文大盘点-抠图 Matting 篇 (04)不用绿幕也能实时抠图,商汤等提出只需单张图像、单个模型的新方法MODNet (05)性能提升30%以上,实时实例分割算法SOLOv2实现产业SOTA (06)YolactEdge,首个边缘设备上实时实例分割法(Jetson AGX Xavier:30 FPS (07)医学图像分割最佳方法的全面比较:U-Net和U-Net++ (06)MODNet 很容易以端到端的方式进行训练。它的速度比同期抠图方法快得多,运行速度为每秒 63 帧。
(07)该工作中,作者提出 BoxInst,可以只用实例包围框标注(而非实例掩码标注) (08)作者将这一联合任务命名为深度感知视频全景分割,并为其提出了一个新的评估指标以及两个衍生数据集,并表示这些数据集将被公开。 (09)图像分割二十年,盘点影响力最大的10篇论文 (10)2020年「21篇」医学影像算法最佳综述 (11)重新思考语义分割范式:SETR (12)一文读懂Image matting(图像抠图) (13)大盘点 | 2020年5篇图像分割算法最佳综述 (14)大盘点 | 2020年「21篇」医学影像算法最佳综述 (15)【资源】全景分割相关资源大列表 (16)OpenVINO + OpenCV 实现车辆检测与道路分割 (17)超快速的端到端实例分割模型,手把手教你用opencv部署Yolact (18)WACV 2021 论文大盘点-图像分割篇 (19)2020 CCF BDCI 地块分割Top1方案 & 语义分割trick整理 (20)首个 Text Matting(文本抠图)方法,灵活好用 (21)Transformer再突破!MedT:医学图像分割新网络 (22)CVPR 2021 | MSRA提出像素级别自监督预训练方法PixPro,大幅提升下游检测分割任务性能 (23)SG-net:一次视频实例分割的空间粒度网络 (24)Panoptic FCN:真正End-to-End的全景分割 (25)CVPR 2021 Oral | Transformer再突破!美团等提出VisTR:视频实例分割网络 (26)CVPR 2021 | 250 FPS!让实时语义分割飞起!重新思考BiSeNet (27)顶刊TPAMI 2021!南开大学提出深度霍夫变换:语义线检测新方法 (28)Segmenter:基于纯Transformer的语义分割网络 (29)谷歌等新作:视觉Transformer的有趣特性 (30)视觉Transformer比CNN更鲁棒!IBM华人研究员新作 (31)更快更强!谷歌提出NesT:收敛更快、鲁棒更好的Transformer
(32)种实时,高分辨率的背景替换技术,可在4K分辨率下以30fps的速度运行,HD情况下以60fps的速度运行,代码已开源! (33)港大&NVIDIA提出SegFormer:简单有效Transformer的语义分割新思路 (34)实操教程|使用图像分割来做缺陷检测的一个例子 (35)CVPR2021佳作 | One-Shot都嫌多,Zero-Shot实例样本分割 (36)训练数据不需要手工标注分割,也能实现图像分割? (37)CVPR2021 双图层实例分割,大幅提升遮挡处理性能 (38)Google发布语义分割新数据集!顺带开发个模型屠榜,已被CVPR2021接收
目标追踪
(01)收藏 | 多目标跟踪(MOT)入门 (02)单目标跟踪综述 (03)简单粗暴的多目标跟踪神器 – DeepSort (04)结合重检测的长时目标跟踪 (05)目标跟踪又添重磅开源工具箱,MMTracking来了! (06)遥感图像+CNN,预测区域人口收入水平 (07)目标追踪综述 (08)WACV 2021 论文大盘点-目标跟踪篇
(09)不经意的“走两步”就能锁定身份信息,这就是步态识别黑科技。 推荐一篇新出的综述,全面介绍了步态识别的发展,包含技术演进、主要数据集、现在技术达到的水平,了解深度学习步态识别的必读论文。 Deep Gait Recognition: A Survey https://arxiv.org/pdf/2102.09546.pdf
(10)#手部跟踪# 人手是极其灵活的,存在各种复杂的自接触和遮挡,给跟踪带来了困难。Facebook现实实验室近日发明了一种极其精确的人手跟踪方法,通过在视觉模型中加入物理特性限制达成。无论是单手还是双手,均可实现高度精确的跟踪。 Constraining Dense Hand Surface Tracking with Elasticity 主页 |https://research.fb.com/publications/constraining-dense-hand-surface-tracking-with-elasticity/
(11)TraDeS :CVPR 2021多目标跟踪算法,改进了目前联合检测与跟踪的在线方法,使用跟踪线索辅助检测,在多个数据集实现了大幅精度提升,作者来自纽约州立大学。论文尚未公布,代码将开源。 Track to Detect and Segment: An Online Multi-Object Tracker 项目主页:https://jialianwu.com/projects/TraDeS.html
(12)基于尺度不变特征变换的多路监控视频拼接系统 (13)TCSVT2021:一种结合全局和局部细粒度特征的行人再识别方法 (14)基于SIFT尺度不变特征变换的图像拼接算法 (15)最新开源!TransReID:首个基于Transformer的ReID网络,各项任务全面领先! (16)WACV2021论文解读-Scale Equivariance Improves Siamese Tracking (17)端到端的多目标跟踪,代码将开源,Looking Beyond Two Frames: End-to-End Multi-Object Tracking Using Spatial and Temporal Transformers (18)提出 SiamGAT,用于目标跟踪,性能领先许多当前先进跟踪器,达到 SOTA。 (19)TCSVT2021:一种结合全局和局部细粒度特征的行人再识别方法 (20)CVPR 2021 | 首个无需锚框(Anchor-Free)的行人搜索框架(附代码) (21)基于YOLOV3与DeepSort的行人多目标跟踪 (22)从理论到实战!视频流车辆计数和目标跟踪 (23)TPAMI 2021 :基于 event stream 的步态识别,准确率高达90% (24)极市直播回放丨第80期-张新宇:CVPR 2021-Alpha Refine:通过精确的边界框估计提高跟踪性能 (25)目标跟踪入门篇-相关滤波
动作检测与识别
(01)MMAction2: 新一代视频理解工具箱 (02)WACV 2021 论文大盘点-人体动作检测与识别篇 (03)CVPR 2021 | 用于动作识别,即插即用、混合注意力机制的 ACTION 模块 (04)CVPR 2021 | 商汤提出最强时序动作提名修正网络:TCANet (05)人体动作识别与生成:基于ST-GCN的方法 (06)刷爆HACS挑战赛时序动作检测榜单!TCANet:最强时序动作提名修正网络 CVPR 2021 (07)更快更强!视频理解模型PP-TSM重磅发布:速度比SlowFast快4.5倍 (08)视频异常行为检测算法MPN,在多个数据库上达到SOTA (09)CVPR2021Oral #人体运动捕捉使用 4 个RGBD摄像头进行人体运动捕捉,在几何重建和纹理生成上效果都更好 (10)CVPR 2021 | 又好又快的视频异常检测,引入元学习的动态原型学习组件
姿态估算
(01)多人姿态识别框架——AlphaPose (02)GitHub:人体姿态估计最全资料集锦 (03)人体姿态估计 (Human Pose Estimation) 常用方法总结 (04)CVPR2020 | 旷视研究院提出 PVN3D:基于 3D 关键点投票网络的单目 6DoF 位姿估计算法 (05)人体姿态估计、识别与生成最新技术一览 (06)深度学习人体姿态估计:2014-2020全面调研 (07)最新开源:端到端6D物体姿态跟踪,无需标注数据集! (08)手势识别基础~手势骨架与关键点提取 (09)动物姿态估计!马、老虎、牛、鹿、狗狗的姿态都能搞定!斩获CVPR 2021 Oral (10)OpenVINO™ 头部姿态评估网络应用演示 (11)CVPR 2021 | 微软提出"解构式关键点回归", 刷新COCO自底向上多人姿态检测记录!
OCR
(01)万字长文 | 图表示学习中的Encoder-Decoder框架 (02)霸榜Github:又一款OCR神器面世! (03)新视角:用图像分类来建模文字识别也可以SOTA (05)都2021了,别再堆砌网络了!10万奖金悬赏最强轻量化OCR模型 (06)顶刊TPAMI 2021!PAN++:精确高效的任意形状文本检测与识别 (07)最新!CVPR 2021 OCR领域论文大盘点(22篇) (08)论文推荐|【KSII TIIS 2021】DP-LinkNet:一种用于古籍文档图像二值化的卷积网络(有源码)
3D,深度估算,点云,SLAM
(01)CVPR2020 | 3D 目标检测新框架:3DSSD (02)CenterFusion:融合雷达与摄像头数据的高精度3D目标检测 (03)最佳论文!商汤提出手机端实时单目三维重建系统 | ISMAR 2020
(04)商汤提出手机端实时单目三维重建系统,实现逼真AR效果和交互 (05)基于深度学习的图像匹配技术一览 (06)极市直播|AAAI’21杰出论文许鸿斌:一个解决三维重建对数据依赖的新框架(已开源) (07)OpenCV再升级!修改一行代码,将图像匹配效果提升14%! (08)重磅!谷歌开源TensorFlow 3D场景理解库 (09)极市直播回放丨第76期-许鸿斌:AAAI’21杰出论文,一个解决三维重建对数据依赖的新框架(已开源) (10)可用于大规模点云表面重建的深度学习算法 (11)可用于大规模点云表面重建的深度学习算法
(12)深度估计是机器人和自动驾驶研究的重要内容,而这往往需要特殊设备,如RGB-D相机或激光雷达,如何使用RGB相机感知深度呢?研究人员曾经做了很多的尝试。该视频是CVPR 2021论文Depth from Camera Motion and Object Detection结果,通过使用“普通手机摄像头运动+目标检测的包围框”数据,设计RNN网络实现了达到最先进精度的目标深度估计。单位 | 密歇根大学,史蒂文森理工学院论文 | https://arxiv.org/abs/2103.01468代码 | https://github.com/griffbr/ODMD (13)CVPR 2021 | TPCN 点云就是这么美妙 (14)一文了解激光点云的组织形式 (15)基于YOLO的新型RGB-D融合方法对行人进行检测和3D定位 (16)ECCV2020 | 夜间图像的无监督单目深度估计 (17)MVSNeRF: Fast Generalizable Radiance Field Reconstruction from Multi-View Stereo (18)在 KITTI 基准数据集上实现最先进的单目3D目标检测结果,表现与基于单目视频的方法相当。 (19)真正实用的退化模型:ETH开源业内首个广义盲图像超分退化模型,性能效果绝佳 (20)ResNet也能用在3D模型上了!清华计图首创三角网格面片上的卷积神经网络:SubdivNet (21)开源|AAAI‘21杰出论文-三维重建新探索:解决数据依赖问题,让自监督信号更可靠! (22)综述:基于点云的自动驾驶3D目标检测和分类方法 (23)PatchmatchNet:一种高效multi-view stereo框架 (CVPR2021 Oral) (24)CVPR2021|神经网络如何进行深度估计? (25)DXSLAM:一种基于深度特征的鲁棒且高效的视觉SLAM系统 (26)实时高分辨率 RGB-D表面重建(CVPR2021) (27)Complexer-YOLO:基于语义点云的实时三维目标检测与跟踪 (28)HDRUNet | 深圳先进院董超团队提出带降噪与反量化功能的单帧HDR重建算法 (29)基于点云的3D障碍物检测 (30)极市直播丨朱思语:基于深度学习的视觉稠密建图和定位 (31)基于3D Surfel图的单目直接法稀疏定位 (32)将合成 3D 场景表示合并到生成模型中,从而实现更可控的图像合成。 (33)传统单图像深度估计往往只能给出低分辨率结果,细节也不够丰富,视觉上总给人模糊不清的感觉,来自SFU和Adobe的研究者通过合并不同分辨率生成高分辨率的深度估计,终于可以还原清晰的细节。 (34)OmniPhotos, 目前最快的360°全景VR摄影方法。代码已开源。 (35)作者提出并集成GrooMeD-NMS–一种新颖的分组数学可区分的NMS,用于单眼3D物体检测, (36)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式
GUN(图像生成,超分辨,动作迁移)
(01)CVPR 2020 论文大盘点-图像增强与图像恢复篇 (02)哈工大等提出轻量级盲超分辨模型LESRCNN,代码已开源 (03)最新!图像去噪综合比较研究 (04)无需用户输入,Adobe提出自动高质量图像合成新方法 (05)NVIDIA Research的研究人员提出了一种自适应鉴别器增强机制,该机制可显着稳定有限数据环境中的训练。 (06)照片秒变卡通风!教你用PaddleGAN快速生成你的专属卡通头像 (07)精准生成Fake人脸!Amazon全新GAN模型给你全方位无死角美颜 (08)博士后姐把“二次元老婆生成器”升级了!AniGAN:这一次可以指定画风 (09)训练 GANs 一年我学到的 10 个教训 (10)涵盖 18+ SOTA GAN 实现,这个开源工程 PyTorch 库火了 (11)6ms 的EfficientDeRain:颇具启发的简单高效去雨算法 (12)PULSE:一种基于隐式空间的图像超分辨率算法 (13)解决以往单图像超分辨率算法仅在合成数据上效果好,无法适用于真实场景的问题。无需对特定类型相机图像训练,即可泛化到不同的相机上。Exploiting Raw Images for Real-Scene Super-Resolution单位 | 卡内基梅隆大学,商汤,加州大学论文 | https://arxiv.org/pdf/2102.01579.pdf代码 | https://www.dropbox.com/s/a66iuwoswul65da/RawSR_PAMI20.zip?dl=0主页 | https://sites.google.com/view/xiangyuxu/rawsr_pami (14)下一代更衣室!国外一位设计师做的虚拟试衣应用。基于OpenPose 进行2D关节点跟踪,使用 Houdini 特效渲染。 来源:https://80.lv/articles/next-gen-dressing-room-with-markerless-tracking-in-houdini/
(15)#GAN #WACV2021 SinGAN-GIF 可以生成任意长宽比的样本,进行超分辨率,改变时帧率,并可用于视频编辑应用。 SinGAN-GIF: Learning a Generative Video Model From a Single GIF 作者 | Rajat Arora, Yong Jae Lee 单位 | 加利福尼亚大学戴维斯分校 论文 | https://openaccess.thecvf.com/content/WACV2021/papers/Arora_SinGAN-GIF_Learning_a_Generative_Video_Model_From_a_Single_GIF_WACV_2021_paper.pdf 主页 | https://rajat95.github.io/singan-gif/
(16)WACV 2021 论文大盘点-图像质量篇
(17)Morph-UGATIT:一种支持渐进式域迁移的图像翻译方法 (18)近日由加州大学圣迭戈分校、CMU、Facebook 提出的一种极快速的视频插帧方法,比之前最精确的方法快384倍,比之前最快的8倍插值方法快23倍。该视频为使用该方法得到的慢动作影像。代码将开源。 FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation units | 加利福尼亚大学圣迭戈分校;卡内基梅隆大学;Facebook AI paper | https://arxiv.org/abs/2012.08512 github | coming home | https://tarun005.github.io/FLAVR/
(19)浙大等学者发明的Neural Body算法,输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody(即将)
(20)CVPR 2021接收论文:AdCo基于对抗的对比学习
(21)第一个同时采用传感器数据和图像进行视频稳定的 DNN 解决方案。Deep Online Fused Video Stabilization单位 | 威斯康星麦迪逊大学,谷歌论文 | https://arxiv.org/abs/2102.01279代码 | 即将主页 | https://zhmeishi.github.io/dvs/
(22)浙大等学者发明的Neural Body算法,输入多角度视频可输出3D人体和新角度视图。论文 | https://arxiv.org/pdf/2012.15838.pdf代码 | https://github.com/zju3dv/neuralbody(即将)
(23)TIP 2021论文:多曝光图像融合及超分辨的联合实现 (24)CVPR 2021 Oral|只用静态图像,就能实时渲染出丝滑3D效果 (25)智趣丨实时风格迁移,移动端运行,人脸特效又有了新玩法 (26)CVPR 2021 | 港科大:如何利用闪光图像(flash image)来去除反光? (27)CVPR 2021 | Neighbor2Neighbor:仅需噪声图像即可训练任意降噪网络的方法 (28)多功能的图像超分辨模型:用于盲图像超分辨的非对称卷积神经网络 (29)深度图像修复的一个突破 (30)GANSpace: Discovering Interpretable GAN Controls (31)TIP2021| 视频超分辨率中的多级特征融合网络 (32)rtFlow: Unbiased Image Style Transfer via Reversible Neural Flows提出 ArtFlow 来防止通用风格迁移过程中的 content leak(内容泄漏)。ArtFlow 由可逆的神经流和无偏的特征迁移模块组成。同时支持前向和后向推理,并采用投影-转移-还原的方案进行操作。ArtFlow 在避免 content leak(内容泄漏)的同时,实现了与最先进的风格迁移方法相当的性能。 (33)极市直播丨邓欣:TIP 2021-多曝光图像融合及超分辨的联合实现方法 (34)Weather GAN:实现晴、阴、雾、雨、雪之间的天气状况自由迁移 (35)CVPR 2021 | 五官画风都能改,用无监督方法控制 GAN (附源码) -周博磊团队 (36)CVPR 2021|Neighbor2Neighbor:无需干净图像的自监督图像降噪 (37)图像反光能被一键去除了?港科大开源RFC,仅用一个操作,强反光也能完美去除|CVPR2021 (38)你好,这是微视AI还原的李焕英 (39)有限数据来训练GAN的一种思路 (40)揭秘腾讯微视人脸技术「黑科技」,基于GAN的人脸魔法特效 (41)添加链接描述 (42)CVPR2021|超分性能不降低,计算量降低50%,董超等人提出加速图像超分的ClassSR (43)RealSR性能大幅提升!旷视+快手+电子科大联合提出“先发散再收敛”的D2CSR (44)仅需2张图!AI便可生成完整运动过程 (45)PornHub 用独家数据集!修复了百年前的电影… (46)新垣结衣夫妇的孩子会长啥样?我用BabyGAN预测试试… (47)刚刚!AMD发布超分辨率新技术FSR:N卡也能用 (48)Transformer再下一城!ETH提出:视频超分辨率Transformer (49)蔡徐坤x特xxx梦幻联动!这个神器能让图像实时模仿人的动作 (50)人人皆可二次元!这个GAN网络让小姐姐生成不同风格的动漫形象!肤色、发型皆可变 (51)这款AI神器,让父亲重返18岁! (52)DSRL:灵活而简单的框架,提高网络精度的且不引入额外的计算量,CVPR2020 (53)实时 4K “image-to-image translation”,港理工&达摩院张磊团队提出拉普拉斯金字塔变换网络 (54)NBNet:抛开复杂的网络结构设计,旷世&快手提出子空间注意力模块用于图像降噪 (55)开源 | 性能炸裂,旷视提出适用于底层问题的Half Instance Normalization (56)GNN 模型在生物化学和医疗健康中的典型应用 (57)超强面经:文本检测与GAN篇(含答案) (58)CVPR2021 最佳论文候选—提高图像风格迁移的鲁棒性 (59)LeCun点赞!GAN模型130毫秒生成动漫肖像! (60)Deepfake文字版横空出世:AI高仿你的笔迹只需1个词! (61)【开源】对基于图像背景的字体生成、人体姿势预测、关键点检测、超分辨率等探讨 (62)https://intel-isl.github.io/PhotorealismEnhancement/ (63)图像填充不怕区域大!MSRA等提出协同调制生成对抗网络 (54)CVPR 2021 Oral | GLEAN: 基于隐式生成库的高倍率图像超分辨率 (55)技压群雄!2021 NTIRE @CVPR 2021的三冠一亚视频超分方案:BasicVSR++
GNN(图神经相关)
(01)ECCV 2020 论文大盘点-图像视频修复篇 (02)详解:多模态知识图谱种类及其应用 (03)Facebook@ICLR2021:GNN中加入标签传播,训练时间直降100倍
Transformer
(01)Transformer 再下一城,Facebook 等提出多目标跟踪算法 TrackFormer (02)全文翻译 | 华为、北大、悉尼大学:最新视觉Transformer综述(2017-2020年) (03)计算机视觉中的Transformer (04)Transformer 最新应用,3D 点云处理,实现 S3DIS 数据集场景分割mIoU首次突破 70% !
(05)用Pytorch轻松实现28个视觉Transformer,开源库 timm 了解一下!(附代码解读) (06)一文看懂9种Transformer结构 (07)更深、更轻量级的Transformer!Facebook提出:DeLighT (08)刷爆AI圈!基于Transformer的DALL-E代码刚刚开源了 (09)Transformer又来了!这个谷歌3D大法闻歌起舞,流畅且自然! (10)视觉Transformer之简单总结 (11)效果远超Transformer!AAAI 2021最佳论文Informer:最强最快的序列预测神器 (12)Transformer携手Evolving Attention在CV与NLP领域全面涨点! (13)无卷积!金字塔视觉Transformer(PVT):用于密集预测的多功能backbone (14)CVPR 2021 | Transformer进军low-level视觉!北大华为等提出预训练模型IPT (15)CVPR 2021 Oral | Transformer再发力!华南理工和微信提出UP-DETR:无监督预训练检测器 (16)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(二) (17)CNN与Transformer的强强联合!谷歌最新开源BoTNet,ImageNet达84.7%准确率 (18)ResNet被全面超越了,是Transformer干的:依图科技开源“可大可小”T2T-ViT,轻量版优于MobileNet (19)来自Transformer的降维打击:ReID各项任务全面领先,阿里&浙大提出TransReID (20)论文速递:金字塔Transformer,更适合稠密预测任务的Transformer骨干架构 (21)视觉 Transformer 的可视化|CVPR2021 (22)美团提出具有「位置编码」的Transformer,性能优于ViT和DeiT (23)刷爆AI圈!基于Transformer的DALL-E代码刚刚开源了 (24)CVPR2021 | 用Transformers无监督预训练进行目标检测 (25)CVPR2021 | 用Transformers无监督预训练进行目标检测 (26)Facebook首发时空Transformer 训练速度远超3D CNN! (27)添加链接描述 (28)CVPR 2021 | Transformer再下一城!复旦等提出SETR:语义分割网络 (29)霸榜各大CV任务榜单,Swin Transformer横空出世! (30)https://arxiv.org/abs/2103.14803 (31)On the Adversarial Robustness of Visual Transformers论 Visual Transformers 的对抗鲁棒性 (32)Generic Attention-model Explainability for Interpreting Bi-Modal and Encoder-Decoder Transformers (33)CrossViT: Cross-Attention Multi-Scale Vision Transformer for Image Classification用于图像分类,代码将开源 (34)HiT: Hierarchical Transformer with Momentum Contrast for Video-Text Retrieval用于视频文本检索 (35)TransCenter: Transformers with Dense Queries for Multiple-Object Tracking用于多目标跟踪,代码将开源 (36)TFPose: Direct Human Pose Estimation with Transformers用于人体姿态估计,代码开源 (37)Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding (38)https://zhuanlan.zhihu.com/p/361092528 (39)https://zhuanlan.zhihu.com/p/361059921 (40)新论文石锤Transformer:别只看注意力,没有残差和MLP,它啥都不是 (41)CNN再助力!CoaT:Co-Scale卷积-注意力图像Transformer (42)复旦提出M2TR:首个多模态多尺度Transformer (43)吴恩达真顶流!新增Transformer!深度学习课程更新,近60万人报名… (44)Twins:重新思考视觉Transformer中的空间注意力机制 (45)屠榜各大CV任务!「百度顶会论文复现营」携Swin Transformer来袭! (46)重磅开源!Twins:更高效的视觉Transformer主干网,完美适配下游检测、分割任务 (47)Transformer的中年危机 (48)Transformer再下一城!厦大等提出ISTR:端到端实例分割 (49)Transformer再下一城!Swin-Unet:首个纯Transformer的医学图像分割网络 (50)谷歌用傅里叶变换替换Transformer自注意力层!在GPU上快7倍、TPU上快2倍… (51)DeepViT:迈向更深的视觉Transformer (52)超越PVT!南大提出ResT:高效多尺度的视觉Transformer (53)超越PVT!南大提出ResT:高效多尺度的视觉Transformer (54)Transformer再下一城!DeepMind新模型自动生成CAD草图,网友:建筑设计要起飞了 (55)重新思考:在ResNet与Transformer均适用的跳跃连接 (56)最新!CVPR 2021 视觉Transformer论文大盘点(43篇) (57)Transformer再下一城!low-level多个任务榜首被占领,中科大等联合提出:Uformer (58)清华提出DynamicViT:动态Token稀疏化的高效视觉Transformer (59)超越StyleGAN!TransGAN更新!用纯Transformer构建高分辨率GAN (60)不是所有图像都值16x16个词!清华&华为提出DVT:动态视觉Transformer (61)腾讯提出Shuffle Transformer:重新思考视觉Transformer的空间Shuffle (62)Transformer杀疯了!竟在图神经网络的ImageNet大赛中夺冠,力压DeepMind、百度… (63)谷歌大脑新作:教你训练自己的视觉Transfomer模型 (64)南开&阿里提出P2T:基于金字塔池化的视觉Transformer!可用于各类下游场景理解任务! (65)谷歌新作:视觉Transformer超越ResNet!!!从头开始训练! (66)Apple新作:没有注意力的Transformer依然是顶流!!! (67)超越PVT!南大提出ResT:高效多尺度的视觉Transformer (68)浙大&华为等提出VTP:首个用于视觉Transformer的剪枝方法 (69)Transformer 进行端到端的目标检测及跟踪(附源代码) (70)如何看待无监督学习在 vision transformer 上的应用前景? (71)你仅需要看一个序列!YOLOS:重新思考Transformer的泛化性能 (72)通用性 Transformer 基石视觉架构,带来大范围性能提升!(附项目地址) (73)基于 detectron2 实现的 PVT 开源了;可用于密集任务 Backbone 的金字塔视觉 transformer (74)搞懂 Vision Transformer 原理和代码,看这篇技术综述就够了(九) (75)极市直播丨陈鑫:CVPR 2021-TransT: 基于Transformer的高性能单目标跟踪算 (76)打破Transformer宿命,新秀VOLO开源!横扫CV多项记录,首个超越87%的模型 (77)OpenVINO™ 基于人脸 landmark 检测实现眼睛疲劳 / 睡意检测 (78)各类Transformer都得稍逊一筹,LV-ViT:探索多个用于提升ViT性能的高效Trick (79)利用TRansformer进行端到端的目标检测及跟踪(附源代码) (80)COTR 一种基于Transformer的图像匹配网络 (81)谷歌AI用30亿数据训练了一个20亿参数Vision Transformer模型,在ImageNet上达到新的SOTA! (82)FcaNet:从频域角度重新思考注意力机制 (83)重磅开源!Twins:更高效的视觉Transformer主干网,完美适配下游检测、分割任务 (84)将Transformer引入CV届的Facebook 这次又有新发现:自监督学习 + Vision Transformers更配!
半监督 ,无监督,强化学习
(01)伪标签还能这样用?半监督力作UPS(ICLR 2021)大揭秘! (02)深度学习中的3个秘密:集成,知识蒸馏和自蒸馏 (03)伪标签还能这样用?半监督力作UPS(ICLR 2021)大揭秘! (04)从 SimCLR 到 BarLow Twins ,一文了解自监督学习不断打脸的认知发展史 (05)从4篇顶会论文看Self-training最新研究进展 (06)大盘点 | 何恺明团队在自监督领域的工作:MoCo三部曲 (07)CVPR 2021 Oral | 妙啊!不怕遮挡的图像线段匹配 SOLD2,还能联合自监督线段检测 (08)CVPR 2021 | 何恺明等人新作!深入探究无监督时空表征学习 (09)超越SEED!腾讯优图提出DisCo:拯救小模型在自监督学习中的效果 (10)CVPR 2021 | 突破性研究!将自监督学习应用到自动驾驶上 (11)LeCun联手华人博士后提出自监督学习新作!却遭Reddit网友质疑:第一张图就错了… (12)CVPR 2021 | 北大&MSRA提出CPS:基于交叉伪监督的半监督语义分割 (13)深度了解自监督学习,就看这篇解读 !Hinton团队力作:SimCLR系列
模型优化,压缩,加速,NAS(网络搜索),注意力机制
(01)超越MobileNetv3!Facebook提出FP-NAS:搜索速度快,精度更高添加链接描述 (02)如何简单有效地实现迁移学习?ECCV 2020 论文介绍 (03)超越 EfficientNet与MobileNetV3,NeurIPS 2020 微软NAS方向最新研究 (04)模型压缩新突破,刷新滤波器剪枝的SOTA效果,优图NeurIPS 2020论文 (05)从频域角度重新思考注意力机制——FcaNet (06)即插即用!视频超分中的涨点神器:iSeeBetter (07)可变形卷积的深度思考 (08)真正的即插即用!盘点11种CNN网络设计中精巧通用的“小”插件 (10)深度学习模型压缩与加速综述 (11)量化新方:模型压缩 6 倍,无需重训练 (12)用20篇论文走完知识蒸馏在 2014-2020 年的技术进展 (13)基于TensorRT量化部署YOLOV5s 4.0模型 (14)推理实践落地 | 最详细的 Pytorch 底层算子扩展总结(文末附源码) (15)教程:基于TensorRT完成NanoDet模型部署 (16)基于深度学习的图像与视频压缩 (17)深度学习精度提升 3 个小妙招:模型集成、知识蒸馏、自蒸馏 (18)CVPR2021深度框架训练 | 不是所有数据增强都可以提升最终精度 (19)CVPR 2021 | KeepAugment:一种简单的信息保存数据扩增方法, 助力分类/分割/检测涨点! (20)CVPR Oral:我给大家表演一个无中生有|北航商汤耶鲁 (21)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式 (22)动态滤波器卷积新高度!DDF:同时解决内容不可知与计算量两大缺陷|CVPR 2021 (23)Attention九层塔:注意力机制的九重理解 (24)CNN可视化又添新作!南大提出Group-CAM:高效的显著图生成方法 (25)超越自注意力!清华提出EA和EAMLP:使用两个线性层的新注意力机制 (26)即插即用!浙大&港中文提出CompConv卷积:让模型不丢精度还可以提速 (27)深度学习中的 Attention 机制总结与代码实现(2017-2021年) (28)基于深度学习的图像增强综述 (29)完全解析 RNN, Seq2Seq, Attention 注意力机制 (30)综述 | 注意力机制 (31)CVPR 2021 | 超越卷积,自注意力模型HaloNet (32)CVPR 2021 | 基于随机标签的神经架构搜索 (33)这可能是最强的AI算法可视化神器!
数据集,比赛,标注工具,实用工具
(01)CVPR 2020 算法竞赛大盘点 (02)不规则四边形坐标的标注工具(可用于车牌 / OCR / 人脸关键点) (03)从3D人脸到自动驾驶,CVPR2020十个顶级开源数据集 (04)80GB医学影像数据集发布!OCTA-500公开下载 (05)火爆GitHub!3.2k Star的可视化神器开源! (06)近距离看CNN训练!360度可视化,网友:美得不真实 (07)Tianchi 完整开源数据集! (08)RTX 3090的深度学习环境配置指南:Pytorch、TensorFlow、Keras (09)擦除:提升 CNN 特征可视化的 3 种重要手段 (10)50万奖金,10亿像素,这个目标检测与跟踪可不简单 (11)超2000万图片,全球最大人眼图像数据集开源了 (12)#大场景目标检测比赛# PANDA 行人、车辆多目标检测数据已开放下载,今天初赛正式开赛啦! 总计7G的数据集和相关标注,PANDA-Image由 555 张静态 十亿像素图片组成,总共包含21个不同的场景,其中Training集包括390张图片。 报名链接:https://tianchi.aliyun.com/s/be6691073b92dc4f2c2f230db97af7f5 技术解读:https://mp.weixin.qq.com/s/AYW7_yJjKv3dmkYJEJDJNg
(13)终于来了!我们发布了 PAKDD 2021 智能运维大赛 baseline (14)RankDataset:超大规模数据集加载利器 (15)史上最全RGB-D数据集在这里!附详细对比下载文档! (16)10万奖励+10万数据集!垃圾分类/表情识别等赛事全面启动!2021高通人工智能应用创新大赛来了 (17)ImageNet验证集6%的标签都是错的,MIT:十大常用数据集没那么靠谱 (18)PANDA行人和车辆多目标检测方案及baseline代码 (19)10万+数据集,表情识别/农作物病虫害识别/垃圾分类识别/手绘图像识别四大赛题等你挑战 (20)CVPR 2021 | Short-video Face Parsing Challenge 开赛,数据集已开放! (21)54万奖金!目标检测新赛事!百度发起"智能交通检测"大赛 (22)CVPR 2021商品识别竞赛来了!阿里达摩院主办 (23)31万奖金!目标检测新赛事!第六届信也科技杯智能零售算法大赛来了 (24)ICCV 2021 | 规模最大的戴口罩人脸识别比赛启动! (25)ICCV 2021 | 首个大规模视频语义分割比赛启动! (26)10万奖金池!OpenMMLab算法生态大赛正式启动! (27)动作检测/定位/解析三大赛道!ICCV 2021 DeeperAction挑战赛来了
(28)神仙打架丨NTIRE2021视频超分挑战双赛道方案 (29)3D人体目标检测与行为分析竞赛开赛,奖池7万+,数据集达16671张!
杂项(01)MultiPoseNet:人体检测、姿态估计、语义分割一 “网” 打尽 (02)10 个开源 Python OpenCV 小项目,YouTube热门 (03)图像算法可以稳定处理视频了!港科大开源通用算法,解决视频处理时域不稳定问题|NeurIPS 2020 (04)性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性 (05)遥感图像+CNN,预测区域人口收入水平 (06)清华&旷视提出RepVGG:让你的CNN一卷到底! (07)RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大! (08)ICLR 2021 | SEED:自监督蒸馏学习,显著提升小模型性能! (09)麻省理工新框架 | MIT 开源高性能自动微分框架,速度提升 4.5 倍(附框架源码) (10)多模态深度学习:用深度学习的方式融合各种信息 (11)AdvProp:两组Batch Normalization助你在CNN对抗训练中高效涨点 (12)顶刊TPAMI 2021 | 换个损失函数就能实现数据扩增? (13)旷视提出MomentumBN:缓解自监督学习的大batch要求,涨点明显! (14)涨点神器!南京大学提出IC Networks:对CNN的基础单元重新建模 (15)涨点神器!重新标记ImageNet,让CNN涨点明显!代码已开源 (16)DeepMind重新设计高性能ResNet!无需激活归一化层 (17)泛化神器!李沐等人提出两种正则化技术:在CV和NLP均有大幅度提升 (18)CVPR 2021 | RepVGG:极简架构,SOTA性能,让VGG式模型再次伟大! (19)CVPR 2021 | 涨点神器!IC-Conv:使用高效空洞搜索的Inception卷积,全方位提升! (12)CVPR 2021 | 即插即用! CA:新注意力机制,助力分类/检测/分割涨点! (13)ICLR2021 Oral|9行代码提高少样本学习泛化能力,代码已开源 (24)综述:轻量级CNN架构设计 (25)将位置信息嵌入通道注意力!NUS提出新机制,显著提升卷积特征表达|CVPR2021 (26)添加链接描述CVPR2021 佳作 | 重新标记 ImageNet:从全局标签到局部标签(附 GitHub 代码及论文) (27)重新标注 ImageNet:多标签,全面提升模型性能 (28)刚刚!频域通道注意力网络FcaNet开源了! (29)我卷我自己——cvpr2021:Involution (30)白给的性能不要?cvpr2021-Diverse branch block (31)极市沙龙回顾|CVPR2021-李铎:通过反转卷积的内在性质进行视觉识别 (32)DO-Conv无痛涨点:使用over-parameterized卷积层提高CNN性能 (33)动态卷积超进化!通道融合替换注意力,减少75%参数量且性能显著提升 ICLR 2021 (34)CVPR’21 | Involution:超越卷积和自注意力的神经网络新算子 (35)【新Attention】最强的Attention函数诞生啦,带给你意想不到的巨大提升! (36)ICML 2021 (Long Oral) | 深入研究不平衡回归问题 (37)谷歌大脑新工作:把注意力放在MLP上! (38)ICML 2021 | 稀疏训练新方法:In-Time Over-Parameterization (40)清华提出RepMLP:FC“内卷”,卷出性能! (41)图灵奖得主Bengio又出新论文:用强化学习提升模型泛化性!网友崩溃:idea撞车了… (42)一文看尽深度学习中的20种卷积(附源码整理和论文解读) (43)干货|深度学习中的重参数技巧 (44)登上更高峰!颜水成、程明明团队开源ViP,引入三维信息编码机制,无需卷积与注意力 (45)最新视频防抖论文精选 + 开源代码汇总 (46)CVPR 2021 | 任何人都能“不讲武德”,姿态可控的语音驱动说话人脸 (47)CV圈杀疯了!继谷歌后,清华、牛津等学者又发表三篇MLP相关论文,LeCun也在发声 (48)领域泛化最新综述 (49)实践教程|利用CNN来检测伪造图像 (50)介绍一种新的激活函数族ACON (51)CVPR 2021 图像压缩最新进展 (52)Google发布语义分割新数据集!顺带开发个模型屠榜,已被CVPR2021接收 (53)CVPR 2021 | 自适应激活函数ACON: 统一ReLU和Swish的新范式
文章阅读
(01)LS-Net:单双目视觉的非线性最小二乘学习算法 (02)GNN、RL强势崛起,CNN初现疲态?这是ICLR 2021最全论文主题分析 (03)何恺明团队最新力作SimSiam:消除表征学习“崩溃解”,探寻对比表达学习成功之根源 (04)简洁的架构还能高效和准确?清华&华为提出新型残差循环超分模型:RRN! (05)华为北大等联手打造的Transformer竟在CV领域超过了CNN:多项底层视觉任务达到SOTA (06)腾讯微视模型 | 单模型史上最佳成绩,(BLENDer)登顶权威榜单VCR (07)令人“细思极恐”的Faster-R-CNN (08)ACCV 2020 最受关注的 Top10 代码开源论文!
(09)详解:多模态知识图谱种类及其应用 (10)噪声样本优秀论文综述(2017-2020) (11)当频域(DCT)遇见CNN (11)小哥质疑谷歌顶会CV论文有错!并且拿出了复现代码来证明 (12)深入研究模型压缩经典Ghostnet:如何用少量计算生成大量特征图? (13)AAAI21最佳论文Informer:效果远超Transformer的长序列预测神器! (14)深度学习的目标检测算法是如何解决尺度问题的? (15)图解RepVGG (16)详解:多模态知识图谱种类及其应用 (17)激活还是不激活?CVPR2021-Activate Or Not: Learning Customized Activation (18)当CV遇上联邦学习!FedVision:首个轻量级、可扩展的视觉联邦开源框架 (19)深度学习前人精度很高了,该怎么创新? (20)谷歌AI研究院:被低估的数据!被高估的模型… (21)新坑来了!谷歌提出MLP-Mixer:一种纯MLP构成的视觉架构 (22)我为中国第一张火星照片做鱼眼矫正 (23)同行评审就是个笑话!Nature爆料:计算机生成的垃圾文章竟还能被接受,64%来自中国 (24)视觉架构大一统!港中文提出:Container,对CNN、Transformer和MLP-Mixer进行了大一统 (25)真·自行车!华为天才少年刚刚「发布」了一款无人驾驶自行车,网友:这TM不比特斯拉燃? (26)论文无法复现!真公开处刑!PapersWithCode上线「论文复现报告」 (27)2021年,深度学习还有哪些未饱和、有潜力且处于上升期的研究方向? (28)波士顿动力机器狗打工这一年 (29)无人驾驶车辆跟踪技术研究介绍