数据增强后的数据量(机器学习笔记 – 使用 GAN 进行数据增强以进行缺陷检测)
一 、用于数据增强的 GAN
在机器学习中 ,训练数据量不足往往会阻碍分类算法的性能 。经验表明 ,训练数据不足是常态 ,而不是例外 ,这就是为什么人们提出了数据增强方法 。
我们可以使用数据增强 ,例如稍微旋转或翻转原始数据以生成新的训练数据 。但这当然不会给我们带来真正的新形象 。
反过来 ,GAN 确实输出了全新的图像 。您可能听说过 GAN 作为一种创建极其逼真的假图像和视频的手段(在“Deepfake ”一词下广为流传) 。正如最近的研究(例如Antoniou 等人 2017 、Wang 等人 2018和Frid-Adar 等人 2018)所表明的 ,它们还可以通过生成额外的训练数据来提高机器学习分类器的性能 。
(1)工业应用
当我们处理稀缺的训练数据时 ,GAN 数据增强方法特别有前途 。
想象一下 ,我们想要训练一个机器学习模型来识别工业生产流程中的缺陷组件 。希望缺陷很少发生;但这也意味着我们可能只有少量图像显示出典型的缺陷来训练网络 。
使用 GAN ,我们可以为任何给定的缺陷类型生成额外的图像 。
(2)数据
我们使用NEU 表面缺陷数据库 ,其中包含 300
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!