首页IT科技正样本太少(深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂))

正样本太少(深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂))

时间2025-05-01 21:33:39分类IT科技浏览4544
导读:1. 前序 在读论文或者看一些博客的时候,经常会出现这种名词:正样本、负样本、简单样本以及困难样本,最近自己为了加深这方面的理解,参考网上的一些资料,整理了下这几者之间的区别,方便自己查看也方便初学者快速了解。...

1. 前序

在读论文或者看一些博客的时候           ,经常会出现这种名词:正样本           、负样本                 、简单样本以及困难样本                 ,最近自己为了加深这方面的理解      ,参考网上的一些资料           ,整理了下这几者之间的区别                 ,方便自己查看也方便初学者快速了解           。

2. 名词解释

正样本

: 与真值对应的目标类别来说该样本为正样本                 。

负样本

: 与真值不对应的其他所有目标类别来说该样本为负样本      。

简单样本

: 预测时与真值标签误差较小的样本     。

困难样本: 预测时与真值标签误差较大的样本                 。

补充下:真值其实就是我们选择的这个样本的      ,比如说当前样本是猫     ,其他的狗      、马之类的就不是真值            。

3. 举例说明

我们以猫狗分类来举例说明什么是正负样本:

label = dog

的所有图片都是 这个类的正样本                 ,其他图片作为负样本

label = cat 的所有图片都是 这个类的正样本           ,其他图片作为负样本

同理     ,在目标检测任务中

box 中有目标对象就是正样本                 ,没有目标对象           ,也就是前景,看做负样本

接下来我们在用图片分类来说明什么是简单困难样本:

假如我们需要识别马           、羊                 、牛三个类别     。

给一张马的图片                。对于预测马来说这个样本为正样本                 ,对于预测羊和牛来说该样本为负样本

            。

真值one-hot标签:[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时                 ,

真值one-hot标签相差较大,则此时该样本是困难样本

。

而预测出[0.98, 0.01, 0.01]时           ,与真值one-hot标签相差较小                 ,则此时该样本为简单样本                。

对于困难样本因为真值one-hot标签[1,0,0] 其中按照我们人为思路给定的这张为马的图片概率是1      ,但是预测出来的概率为0.3           ,这与实际相差太大了                 ,所以称这样的样本为困难样本                 。

4. 参考文献

1. 文献1

2. 文献2
声明:本站所有文章      ,如无特殊说明或标注     ,均为本站原创发布。任何个人或组织                 ,在未征得本站同意时           ,禁止复制      、盗用     、采集                 、发布本站内容到任何网站           、书籍等各类媒体平台           。如若本站内容侵犯了原著者的合法权益     ,可联系我们进行处理                 。

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
QT400-17是什么材料(Qt4 Synchronous HTTP Request) html5有哪些新特性?(有趣的HTML实例(二) 404页面)