模拟不收敛的原因(如何判断训练中的模型已经收敛)
可以通过查看训练集和测试集的loss变化来判断 。
一 、loss的变化情况分为以下几种情况:
1.train loss 下降 ,val loss下降: 表明网络还在学习
2. train loss下降 ,val loss稳定:网络过拟合
3.train loss稳定,val loss下降:数据集有问题
4.train loss稳定 ,val loss稳定:可能已经收敛 ,或者学习遇到瓶颈 ,可以调小学习率试试
5.train loss上升 ,val loss上升:网络结构设计有问题 ,或者训练参数设置不当等 ,及时停止学习 ,调整代码
二 、根据训练曲线判断是否收敛
1.欠拟合:欠拟合一般有两种典型表现
①loss曲线趋于水平或维持相对较高的loss值
②训练结束时 ,train loss依然持续减少 ,且val loss 有较大波动
2.过拟合:过拟合指的是模型对训练集学习的太好,导致网络泛化能力差 ,在验证集上反而效果不好 。
3.模型收敛:train loss 下降趋于稳定 ,val loss 下降也趋于稳定,且train loss 的值与val loss 的值相差不大
参考:机器学习如何判断模型训练是否充分_怎么看模型是否收敛_supermapsupport的博客-CSDN博客https://blog.csdn.net/supermapsupport/article/details/123912542?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-123912542-blog-122102672.pc_relevant_landingrelevant&spm=1001.2101.3001.4242.2&utm_relevant_index=4
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!