正样本太少（深度学习中正样本、负样本、简单样本、困难样本的区别（简单易懂））

时间2025-09-19 16:43:55分类IT科技浏览7422

导读：1. 前序在读论文或者看一些博客的时候，经常会出现这种名词：正样本、负样本、简单样本以及困难样本，最近自己为了加深这方面的理解，参考网上的一些资料，整理了下这几者之间的区别，方便自己查看也方便初学者快速了解。...

1. 前序

在读论文或者看一些博客的时候，经常会出现这种名词：正样本、负样本、简单样本以及困难样本，最近自己为了加深这方面的理解，参考网上的一些资料，整理了下这几者之间的区别，方便自己查看也方便初学者快速了解。

正样本

：与真值对应的目标类别来说该样本为正样本。

负样本

：与真值不对应的其他所有目标类别来说该样本为负样本。

简单样本

：预测时与真值标签误差较小的样本。

困难样本：预测时与真值标签误差较大的样本。

补充下：真值其实就是我们选择的这个样本的，比如说当前样本是猫，其他的狗、马之类的就不是真值。

我们以猫狗分类来举例说明什么是正负样本：

label = dog

的所有图片都是这个类的正样本，其他图片作为负样本

label = cat 的所有图片都是这个类的正样本，其他图片作为负样本

同理，在目标检测任务中

box 中有目标对象就是正样本，没有目标对象，也就是前景，看做负样本

接下来我们在用图片分类来说明什么是简单困难样本：

假如我们需要识别马、羊、牛三个类别。

给一张马的图片。对于预测马来说这个样本为正样本 ，对于预测羊和牛来说该样本为负样本

。

真值one-hot标签：[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时，

真值one-hot标签相差较大，则此时该样本是困难样本

。

而预测出[0.98, 0.01, 0.01]时，与真值one-hot标签相差较小，则此时该样本为简单样本 。

对于困难样本因为真值one-hot标签[1,0,0] 其中按照我们人为思路给定的这张为马的图片概率是1，但是预测出来的概率为0.3 ，这与实际相差太大了，所以称这样的样本为困难样本。

1. 文献1

2. 文献2

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

展开全文READ MORE