首页IT科技swin transformer训练自己的数据(SwinUnet官方代码训练自己数据集(单通道灰度图像的分割))

swin transformer训练自己的数据(SwinUnet官方代码训练自己数据集(单通道灰度图像的分割))

时间2025-05-04 23:15:20分类IT科技浏览7624
导读:***************************************************...

***************************************************

码字不易               ,收藏之余                      ,别忘了给我点个赞吧!

***************************************************

---------Start

关于swinUnet网络的测试部分请移步另一篇博文

官方代码:https://github.com/HuCaoFighting/Swin-Unet

目的:训练Swin-Unet分割肺部区域

官方数据集位置(可能下载不了):https://www.kaggle.com/datasets/nikhilpandey360/chest-xray-masks-and-labels

CSDN免费下载数据集

实现效果:

输入原图

输出标签

此文中只用了整个数据集中的345张图像用来完成整个分割任务!

1               、下载官方代码并解压

代码地址

解压后的文件夹:

2                      、下载数据集并解压

数据集地址

我们只需要用到以下两个文件夹:分别代表图片和标签               。原文件中图片有800张       ,标签只有704张               ,有部分img没有标签                      ,需要在制作npz文件的时候注意一下                      。

这是本文用到的345张图像和对应的mask

用于分割任务的标签       ,

3       、生成.npz文件

pycharm打开项目文件        ,配置好python解释器                      ,创建data目录

data目录中               ,train_npz是用来存放训练所用的npz文件        ,test_vol_h5用来存放测试所用的npz文件                      ,这是官方命名               ,可以少改代码       。

将图像和标签转化成.npz文件

将原图像和标签保持在同目录

转换代码:(根据自己数据的位置修改下路径),若是只有背景+目标两个类别,这个代码可以直接用                      ,若是三个及以上类别的分割                      ,代码应该根据你的图像数据做调整,调整之后保证以下代码的label数组中               ,背景用0像素                      ,目标用1,2,3,4…像素分别表示       ,一个像素值代表一种类别        。例如(0:背景               ,1:类别1                      ,2:类别2       ,3:类别3…)                      。 def npz(): #原图像路径 path = rG:\dataset\Segmentation\LungSegmentation\npz\images\*.png #项目中存放训练所用的npz文件路径 path2 = rG:\dataset\Unet\TransUnet-ori\data\Synapse\train_npz\\ for i,img_path in enumerate(glob.glob(path)): #读入图像 image = cv2.imread(img_path) image = cv2.cvtColor(image,cv2.COLOR_BGR2RGB) #读入标签 label_path = img_path.replace(images,labels) label = cv2.imread(label_path,flags=0) #将非目标像素设置为0 label[label!=255]=0 #将目标像素设置为1 label[label==255]=1 #保存npz np.savez(path2+str(i),image=image,label=label) print(------------,i) # 加载npz文件 # data = np.load(rG:\dataset\Unet\Swin-Unet-ori\data\Synapse\train_npz\0.npz, allow_pickle=True) # image, label = data[image], data[label] print(ok)

将训练和测试的图像数据分别生成为train_npz和test_vol_h5中的npz文件

生成npz文件对应的txt文件

txt文件的内容是模型训练和测试过程中读入图像数据的名称              。忽略my_tools.py文件        。

生成txt文件的代码        ,根据训练和测试的npz文件分别生成train.txt和test_vol.txt文件                       。 def write_name(): #npz文件路径 files = glob.glob(rC:\Users\22120\Desktop\Swin-Unet-main\data\Synapse\test_vol_h5\*.npz) #txt文件路径 f = open(rC:\Users\22120\Desktop\Swin-Unet-main\lists\lists_Synapse\test_vol.txt,w) for i in files: name = i.split(\\)[-1] name = name[:-4]+\n f.write(name)

4               、下载预训练权重

官方下载地址

csdn免费下载(推荐)

权重下载好之后                      ,放入项目的pretrained_ckpt文件夹下               ,官方只提供了输入大小为224的模型权重              。

5                      、修改部分代码

当你的图像数据是单通道时        ,按照文中写的内容修改后肯定能正常训练。若是三通道及以上的输入图像                      ,也照着文中写的内容修改               ,若仍有问题,可以评论或私信我                      ,一起解决吧                       。

5.1 修改train.py

修改常规参数                      ,配置文件路径,注意num_classes等于背景+预测目标类别个数                      。因为修改之处不多               ,见谅没有放上修改后的代码                      ,参考图中标识修改即可。

output_dir:训练日志和输出权重保存的路径

root_path:为数据集存放的根目录

5.2 修改dataset_synapse.py

自己生成的npz文件和官方的npz文件格式有差异       ,在这里做了调整               ,调整之后完全一致               。

5.3. 修改trainer.py文件

设置trainer.py文件中的DataLoader函数中的num_workers=0

至此                      ,所有代码修改完毕       ,执行train.py文件        ,若控制台有以下输出                      ,即成功跑通!

训练完毕后项目文件中的output文件夹里存放着训练的输出日志和模型权重                      。

总结: 由于仅文字表述某些操作存在局限性               ,故只能简略描述        ,有任何疑问可下方留言评论或私信                      ,回复不及还望见谅               ,感激不尽!

创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!

展开全文READ MORE
van-checkbox 阻止传递click事件(vantUI van-picker中的column使用,picker选择器展示对象数组里面的属性,自定义展示数据) Vue前端开发实训报告(Vue.js 前端项目在常见 Web 服务器上的部署配置)