基于改进YOLOv8n的儿童肠套叠B型超声图像特征检测_《生物医学工程学杂志》

作者：

刘晨雨 ¹ ,  徐健 ¹ , 李轲 ² , 王璐 ³

1. 西安工程大学电子信息学院（西安 710600）;
2. 空军军医大学附属西京医院超声医学科（西安 710000）;
3. 空军军医大学附属唐都医院超声医学科（西安 710038）;

关键词：

肠套叠病灶 EMC-YOLOv8n EfficientViT C2fMBC 坐标注意力机制模块

DOI：

10.7507/1001-5515.202401017

视频：

导出 下载 收藏 扫码 引用

摘要 全文 图表 视频 参考文献 施引文献 补充材料

为辅助基层超声科医生从儿童腹部超声图像中准确且快速地检测出肠套叠病灶，本文提出了一种基于改进YOLOv8n的儿童肠套叠检测算法EMC-YOLOv8n。首先，采用具有级联分组注意力模块的EfficientViT网络作为主干网络，以提高目标检测速度。其次，利用改进后的C2fMBC模块替换颈部网络中的C2f模块，降低网络复杂度，并在每个C2fMBC模块之后引入坐标注意力机制模块，以增强对位置信息的关注度。最后，在自建的儿童肠套叠数据集上进行实验。结果表明，EMC-YOLOv8n算法的召回率（Recall）、平均检测精度（mAP@0.5）及精确度（Precision）相较基线算法分别提高了3.9%、2.1%及0.9%。尽管网络参数量及计算量略微增加，但检测精度得到显著提升，能够高效完成检测任务，极具经济及社会价值。

引用本文： 刘晨雨, 徐健, 李轲, 王璐. 基于改进YOLOv8n的儿童肠套叠B型超声图像特征检测. 生物医学工程学杂志, 2024, 41(5): 903-910. doi: 10.7507/1001-5515.202401017 复制

0 引言

肠套叠是一种常见的儿科消化道疾病，主要发生在6个月至3岁之间的儿童中，其病理特征为一段肠管套入相邻的肠腔内，引起肠腔堵塞，导致患者出现腹痛、呕吐等症状，严重时可能导致肠道坏死等并发症，甚至危及生命^[1]。及时的诊断和治疗对缓解患者疼痛至关重要。临床上常用的肠套叠诊断方法包括X线片、计算机断层扫描（computed tomography，CT）和B型超声（brightness-mode ultrasound）。X线片可以显示肠道积气和堆叠现象，但对早期诊断不敏感；CT可以提供更详细的图像信息，但高昂的费用和较高的辐射限制了其应用；相比之下，B超是一种无创、无痛的诊断方法，在探头扫描时通常以动图的形式来呈现，使医生能够更直观地观察到肠套叠的位置，并且由于经济实惠，更容易成为首选^[2-4]。在B超图像中，肠套叠的表现形式主要有两种，分别为横切面的“同心圆”型和纵切面的“套筒”型^[5]。医生通常通过识别横切面的“同心圆”型来判断肠套叠的存在，而纵切面的“套筒”型则作为辅助诊断手段^[6]。但人工识别这些特征不仅容易受到主观因素的影响，还会耗费大量高级人力资源。

近年来，快速发展的深度学习技术已在医学领域中得到广泛应用，特别是医学图像分割^[7]和目标检测^[8]等方面。目标检测技术主要分为两阶段算法和单阶段算法，前者以其较高的准确率为优势，代表性算法包括Mask R-CNN^[9]和Fast R-CNN^[10]等；后者则以较快的检测速率为特点，代表性算法包括YOLO系列^[11]和SSD^[12]等。Kim等^[13]开发和测试了一种基于YOLOv3的深度学习算法来检测儿童腹部X线片中是否存在肠套叠病灶，实验表明该算法的精确度略高于放射科医生。Kwon等^[14]研究开发了一种深度卷积神经网络（deep convolutional neural network，DCNN）算法，该算法使用SSD+残差网络（ResNet）在儿童腹部X线片中检测肠套叠病灶。Li等^[15]研究开发了一种基于人工智能的超声图像“同心圆”征象自动检测系统，使用改进的Faster R-CNN算法模型作为框架来检测“同心圆”标志，提高了儿科肠套叠诊断的效率和准确性。Kim等^[16]开发了基于YOLOv5架构的深度学习模型，以每秒几十帧的速度以及高精度在灰度超声图像上诊断出肠套叠，证明了该算法的可行性。

显然，目标检测技术在儿童肠套叠图像分析中已有广泛应用，但仍存在一些不足之处，例如，文献[13]和文献[14]使用的X线片对早期诊断不敏感，而文献[15]和文献[16]采用了复杂度较高的算法模型。为解决这些问题，本文通过改进YOLOv8n算法，并结合医学B超图像，提出了一种基于EMC-YOLOv8n算法的儿童肠套叠特征检测方法，旨在提高检测精确度和准确性的同时，简化模型的复杂度和提高诊断效率，从而更好地辅助医生进行诊断。

1 方法

1.1 改进后的模型架构

在2023年，Ultralytics团队发布了最新的YOLOv8算法，旨在提升精度和速度，并优化网络参数，以解决现有模型的不足，该算法的网络结构主要由主干（Backbone）、颈部（Neck）和头部（Head）组成^[17]。本文选取了该系列中参数量最小的YOLOv8n模型进行改进，首先引入内存高效视觉转换器网络（memory efficient vision transformer，EfficientViT）^[18]替换原有的跨阶段Darknet53网络（cross stage partial darknet-53，CSPDarknet53）^[19]作为主干网络，以提高内存效率，增强不同特征通道之间的高效通信，提高注意力多样性和目标检测速度。在颈部网络，本文设计了C2fMBC模块替换C2f模块^[20]，进一步降低网络的参数量和复杂度，同时保持模型的高效性。此外，在每个C2fMBC模块之后加入坐标注意力机制（coordinate attention，CA）^[21]，使模型更加关注目标的通道特征，增强特征表达并提高模型性能。改进后的EMC-YOLOv8n模型架构如图1所示。

图1 EMC-YOLOv8n网络结构 Figure1. EMC-YOLOv8n network structure

图选项

Number	Models	Pre（%）	Rec（%）	mAP@0.5（%）	mAP@.5:.95（%）	Par	浮点运算数/GFLOPs	帧率/FPS
1	YOLOv8n	89.4	86.6	93.1	66.4	3.0E06	8.2	285
2	YOLOv8n-EfficientViT	90.1	87.2	94.0	67.2	4.0E06	9.5	227
3	YOLOv8n-EfficientViT-C2fMBC	90.3	89.5	94.7	68.0	3.7E06	9.0	222
4	YOLOv8n-EfficientViT-C2fMBC-CA	90.3	90.5	95.2	68.2	3.7E06	9.0	238
注：最优数据用加粗表示

1.	韦天军, 胡国兵, 朱向明, 等. 彩色多普勒超声诊断小儿急性肠套叠的应用价值. 皖南医学院学报, 2016, 35(3): 267-268.
2.	Li X Z, Wang H, Song J, et al. Ultrasonographic diagnosis of intussusception in children: a systematic review and meta‐analysis. J Ultras Med, 2021, 40(6): 1077-1084.
3.	Tsou P Y, Wang Y H, Ma Y K, et al. Accuracy of point-of-care ultrasound and radiology-performed ultrasound for intussusception: a systematic review and meta-analysis. Am J Emerg Med, 2019, 37(9): 1760-1769.
4.	Edwards E A, Pigg N, Courtier J, et al. Intussusception: past, present and future. Pediatr Radiol, 2017, 47(9): 1101-1108.
5.	Hryhorczuk A L, Strouse P J. Validation of US as a first-line diagnostic test for assessment of pediatric ileocolic intussusception. Pediatr Radiol, 2009, 39(10): 1075-1079.
6.	Henrikson S, Blane C E, Koujok K, et al. The effect of screening sonography on the positive rate of enemas for intussusception. Pediatr Radiol, 2003, 33(3): 190-193.
7.	宫进昌, 赵尚义, 王远军. 基于深度学习的医学图像分割研究进展. 中国医学物理学杂志, 2019, 36(4): 420-424.
8.	尹宏鹏, 陈波, 柴毅, 等. 基于视觉的目标检测与跟踪综述. 自动化学报, 2016, 42(10): 1466-1489.
9.	He K, Gkioxari G, Dollár P, et al. Mask R-CNN// Proceedings of the IEEE International Conference on Computer Vision (ICCV). Venice: IEEE, 2017: 2961-2969.
10.	Girshick R. Fast R-CNN/ /Proceedings of the IEEE International Conference on Computer Vision (ICCV). Santiago: IEEE, 2015: 1440-1448.
11.	Jiang P, Ergu D, Liu F, et al. A review of YOLO algorithm developments. Procedia Comput, 2022, 199: 1066-1073.
12.	Liu W, Anguelov D, Erhan D, et al. SSD: single shot multibox detector// Bastian L, Jiri M, Nicu S, et al. Computer Vision–ECCV 2016: 14th European Conference, Proceedings. Amsterdam: Springer International Publishing, 2016: 21-37.
13.	Kim S, Yoon H, Lee M J, et al. Performance of deep learning-based algorithm for detection of ileocolic intussusception on abdominal radiographs of young children. Sci Rep, 2019, 9(1): 19420.
14.	Kwon G, Ryu J, Oh J, et al. Deep learning algorithms for detecting and visualising intussusception on plain abdominal radiography in children: a retrospective multicenter study. Sci Rep, 2020, 10(1): 17582.
15.	Li Z, Song C, Huang J, et al. Performance of deep learning-based algorithm for detection of pediatric intussusception on abdominal ultrasound images. Gastroent Res Pract, 2022, 2022(1): 9285238.
16.	Kim S W, Cheon J E, Choi Y H, et al. Feasibility of a deep learning artificial intelligence model for the diagnosis of pediatric ileocolic intussusception with grayscale ultrasonography. Ultrasonography, 2024, 43(1): 57.
17.	Ju R Y, Cai W. Fracture detection in pediatric wrist trauma X-ray images using YOLOv8 algorithm. Sci Rep, 2023, 13(1): 20077.
18.	Liu X, Peng H, Zheng N, et al. EfficientViT: memory efficient vision transformer with cascaded group attention// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver: IEEE/CVF, 2023: 14420-14430.
19.	Mahasin M, Dewi I A. Comparison of CSPDarkNet53, CSPResNeXt-50, and EfficientNet-B0 backbones on YOLOv4 as object detector. IJEST, 2022, 2(3): 64-72.
20.	Wang C Y, Bochkovskiy A, Liao H Y M. YOLOv7: trainable bag-of-freebies sets new state-of-the-art for real-time object detectors// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Vancouver: IEEE/CVF, 2023: 7464-7475.
21.	Hou Q, Zhou D, Feng J. Coordinate attention for efficient mobile network design// Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Nashville: IEEE/CVF, 2021: 13708-13717.
22.	Xie E, Wang W, Yu Z, et al. SegFormer: simple and efficient design for semantic segmentation with transformers. NIPS, 2021, 34: 12077-12090.
23.	Tan M, Le Q. EfficientNet: rethinking model scaling for convolutional neural networks// International Conference on Machine Learning (ICML). Long Beach: PMLR, 2019: 6105-6114.

Number	Models	mAP@0.5（%）	Par	浮点运算数/GFLOPs	帧率/FPS
1	Faster R-CNN	86.2	137.1E06	370.2	26.1
2	SSD	91.7	26.3E06	62.8	82.7
3	YOLOv5s	87.0	7.0E06	16.0	77.5
4	EMC-YOLOv8n	95.2	3.7E06	9.0	238.0
注：最优数据用加粗表示

Number	Models	mAP@0.5（%）	Par	浮点运算数/GFLOPs	帧率/FPS
1	Faster R-CNN	86.2	137.1E06	370.2	26.1
2	SSD	91.7	26.3E06	62.8	82.7
3	YOLOv5s	87.0	7.0E06	16.0	77.5
4	EMC-YOLOv8n	95.2	3.7E06	9.0	238.0
注：最优数据用加粗表示

Number	Models	mAP@0.5（%）	Par	浮点运算数/GFLOPs	帧率/FPS
1	Faster R-CNN	86.2	137.1E06	370.2	26.1
2	SSD	91.7	26.3E06	62.8	82.7
3	YOLOv5s	87.0	7.0E06	16.0	77.5
4	EMC-YOLOv8n	95.2	3.7E06	9.0	238.0
注：最优数据用加粗表示

《生物医学工程学杂志》

基于改进YOLOv8n的儿童肠套叠B型超声图像特征检测

摘要 全文 图表 视频 参考文献 施引文献 补充材料

0 引言

1 方法

1.1 改进后的模型架构

1.2 EfficientViT网络架构

1.3 C2fMBC模块

1.4 注意力机制

2 实验过程与结果

2.1 数据集构建

2.2 实验环境配置与评估指标

2.3 消融实验

2.4 对比实验

2.5 算法检测验证

3 讨论

4 结论

0 引言

1 方法

1.1 改进后的模型架构

1.2 EfficientViT网络架构

1.3 C2fMBC模块

1.4 注意力机制

2 实验过程与结果

2.1 数据集构建

2.2 实验环境配置与评估指标

2.3 消融实验

2.4 对比实验

2.5 算法检测验证

3 讨论

4 结论

上一篇

下一篇

Format

Content

摘要全文图表视频参考文献施引文献补充材料