正样本太少(深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂))
1. 前序
在读论文或者看一些博客的时候 ,经常会出现这种名词:正样本 、负样本 、简单样本以及困难样本 ,最近自己为了加深这方面的理解,参考网上的一些资料 ,整理了下这几者之间的区别 ,方便自己查看也方便初学者快速了解 。
2. 名词解释
正样本
: 与真值对应的目标类别来说该样本为正样本 。
负样本: 与真值不对应的其他所有目标类别来说该样本为负样本 。
简单样本: 预测时与真值标签误差较小的样本 。
困难样本: 预测时与真值标签误差较大的样本 。补充下:真值其实就是我们选择的这个样本的 ,比如说当前样本是猫 ,其他的狗、马之类的就不是真值 。
3. 举例说明
我们以猫狗分类来举例说明什么是正负样本:
label = dog
的所有图片都是 这个类的正样本 ,其他图片作为负样本
label = cat 的所有图片都是 这个类的正样本 ,其他图片作为负样本同理 ,在目标检测任务中
box 中有目标对象就是正样本 ,没有目标对象 ,也就是前景,看做负样本
接下来我们在用图片分类来说明什么是简单困难样本:
假如我们需要识别马 、羊 、牛三个类别 。
给一张马的图片 。对于预测马来说这个样本为正样本 ,对于预测羊和牛来说该样本为负样本。
真值one-hot标签:[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时 ,
真值one-hot标签相差较大,则此时该样本是困难样本。
而预测出[0.98, 0.01, 0.01]时 ,与真值one-hot标签相差较小 ,则此时该样本为简单样本 。对于困难样本因为真值one-hot标签[1,0,0] 其中按照我们人为思路给定的这张为马的图片概率是1,但是预测出来的概率为0.3 ,这与实际相差太大了 ,所以称这样的样本为困难样本 。
4. 参考文献
1. 文献1
2. 文献2创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!