网上有很多的深度学习训练集, 他们很优秀,但是也具有如下几种缺点:
- 数据集一般很巨大, 下载带宽是限制
- 数据并不是很形象,很难去窥探为什么使用这个数据
- 数据质量不是那么可控
- 用来训练非常耗时,耗资源,比方只有 GPU 机器才能跑等等
基于以上的事实,我在平时的工作中,就不得不写一些数据集生成代码。写的过程中,我也觉得非常有启发, 下面我们分享这一过程的心得。
包括以下内容:
- 生成数据
- 如何加杂噪声,如何控制生成数据的质量
- 怎么可视化生成的数据集
- 如何在训练过程中使用自己造的数据
阅读全文: http://gitbook.cn/gitchat/activity/5b766bd3bdbeb65b7490711f
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。