您当前的位置: 首页 >  人工智能

互联网志

暂无认证

  • 0浏览

    0关注

    1585博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

任务通用和数据学习效率是制约当前人工智能发展的核心瓶颈问题

互联网志 发布时间:2021-11-17 23:42:11 ,浏览量:0

  11月17日,上海人工智能实验室联合商汤科技SenseTime、香港中文大学、上海交通大学共同发布新一代通用视觉技术体系“书生”(INTERN),该体系旨在系统化解决当下人工智能视觉领域中存在的任务通用、场景泛化和数据效率等一系列瓶颈问题。

  目前技术报告已在arXiv平台发布),基于“书生”的通用视觉开源平台OpenGVLab也将在明年年初正式开源,向学术界和产业界公开预训练模型及其使用范式、数据系统和评测基准等。

  任务通用和数据学习效率是制约当前人工智能发展的核心瓶颈问题。根据相关技术报告,一个“书生”基模型即可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。在ImageNet等26个最具代表性的下游场景中,书生模型广泛展现了极强的通用性,显著提升了这些视觉场景中长尾小样本设定下的性能。

  相较于OpenAI于2021年发布的CLIP这一当前最强开源模型,“书生”在准确率和数据使用效率上均取得大幅提升。基于同样的下游场景数据,“书生”在分类、目标检测、语义分割及深度估计四大任务26个数据集上的平均错误率分别降低了40.2%、47.3%、34.8%和9.4%。“书生”在数据效率方面的提升尤为令人瞩目:只需要1/10的下游数据,就能超过CLIP(openai.com/blog/clip)基于完整下游数据的准确度,例如在花卉种类识别FLOWER任务上,每一类只需两个训练样本,就能实现99.7%的准确率。

关注
打赏
1665506070
查看更多评论
立即登录/注册

微信扫码登录

0.0411s