首页IT科技正样本太少(深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂))

正样本太少(深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂))

时间2025-06-17 00:50:59分类IT科技浏览5823
导读:1. 前序 在读论文或者看一些博客的时候,经常会出现这种名词:正样本、负样本、简单样本以及困难样本,最近自己为了加深这方面的理解,参考网上的一些资料,整理了下这几者之间的区别,方便自己查看也方便初学者快速了解。...

1. 前序

在读论文或者看一些博客的时候            ,经常会出现这种名词:正样本            、负样本                   、简单样本以及困难样本                   ,最近自己为了加深这方面的理解      ,参考网上的一些资料            ,整理了下这几者之间的区别                   ,方便自己查看也方便初学者快速了解            。

2. 名词解释

正样本

: 与真值对应的目标类别来说该样本为正样本                  。

负样本

: 与真值不对应的其他所有目标类别来说该样本为负样本       。

简单样本

: 预测时与真值标签误差较小的样本      。

困难样本: 预测时与真值标签误差较大的样本                  。

补充下:真值其实就是我们选择的这个样本的      ,比如说当前样本是猫      ,其他的狗      、马之类的就不是真值             。

3. 举例说明

我们以猫狗分类来举例说明什么是正负样本:

label = dog

的所有图片都是 这个类的正样本                   ,其他图片作为负样本

label = cat 的所有图片都是 这个类的正样本            ,其他图片作为负样本

同理      ,在目标检测任务中

box 中有目标对象就是正样本                   ,没有目标对象            ,也就是前景,看做负样本

接下来我们在用图片分类来说明什么是简单困难样本:

假如我们需要识别马            、羊                   、牛三个类别      。

给一张马的图片                  。对于预测马来说这个样本为正样本                   ,对于预测羊和牛来说该样本为负样本

             。

真值one-hot标签:[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时                   ,

真值one-hot标签相差较大,则此时该样本是困难样本

。

而预测出[0.98, 0.01, 0.01]时            ,与真值one-hot标签相差较小                   ,则此时该样本为简单样本                  。

对于困难样本因为真值one-hot标签[1,0,0] 其中按照我们人为思路给定的这张为马的图片概率是1      ,但是预测出来的概率为0.3            ,这与实际相差太大了                   ,所以称这样的样本为困难样本                   。

4. 参考文献

1. 文献1

2. 文献2
声明:本站所有文章      ,如无特殊说明或标注      ,均为本站原创发布。任何个人或组织                   ,在未征得本站同意时            ,禁止复制      、盗用      、采集                   、发布本站内容到任何网站            、书籍等各类媒体平台            。如若本站内容侵犯了原著者的合法权益      ,可联系我们进行处理                   。

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
你part(【AutoGPT】你自己运行,我先睡了—— ChatGPT过时了吗?) 请升级您的浏览器(请升级你的浏览器后再访问)