在眼底图像分割效果的评价中,针对传统评价方法只考虑像素点重合而未考虑视网膜血管拓扑结构的不足,本文提出一个新的评价方法。该方法首先利用数学形态学和细化算法得到血管的拓扑结构,然后统计并分析视网膜血管区域3个特征参数的分布情况,即以互信息、相关系数和节点率来获得基于拓扑结构的眼底图像分割评价结果。该方法的实验数据取自STARE公开数据库中专家手工分割及其腐蚀结果。实验结果表明:互信息、相关系数和节点率这三个特征参数可以从拓扑结构的角度来评价眼底图像视网膜血管的分割效果,且算法复杂程度较低,该方法对眼底图像视网膜血管分割评价方法的补充有重要意义。
引用本文: 盛韩伟, 戴培山, 刘智航, 张文妙韵, 赵亚丽, 范敏. 基于拓扑结构的眼底图像分割评价新方法. 生物医学工程学杂志, 2015, 32(5): 1100-1105. doi: 10.7507/1001-5515.20150195 复制
引言
眼底视网膜图像在如今的眼科疾病诊断中起着十分重要的作用[1]。研究证明视网膜血管结构特征的改变和许多疾病密切相关,比如心血管疾病、糖尿病、中风等[2]。在视网膜血管分割的研究中,由于获取的图像多,人工图像分析费时费力,计算机自动眼底图像视网膜血管分割成为一个重要的方向[3]。目前已开发出许多自动分割的方法[4]。
对于疾病的诊断,血管分割结果的好坏显得十分重要,而判断这种好坏依靠评价方法[5]。一般来说,目前的分割评价方法分为两类。一类是基于像素点的评价方法。其中,传统的基于像素点的评价方法有三大指标,分别是准确度(accuracy)、灵敏度(sensitivity)和特异度(specificity)[6]。这三个指标是将分割结果与金标准进行像素的比较。还有一些基于像素间计算的方法。如Uyen等[7]提出了一个新的评估方法,它是基于精确性和完整性的概念。此方法的一个重要特性是对细小局部错误的容错性,这些分割错误不会影响所需的血管特征。但该类方法没有考虑形态学的特征。另一类评价方法则是基于形态学拓扑结构的评价方法。Gegundez-arias等[8]构造了一个基于连接度、区域和长度的函数,用于表征血管结构,作为血管分割结果的评价指标,该结果证明利用该函数对分割结果进行评价更适于树状结构图像的分割评价,是对现有图像分割评价方法的补充。
目前大部分自动分割算法所用的评价方法是传统三大指标,没有考虑到血管形态学结构的特殊性--树状结构[9]。为了更好地评价眼底视网膜血管图像的分割效果,需要将分割结果的拓扑结构信息融入到评价方法中。为此,本文提出了一种基于拓扑结构的眼底血管分割效果的评价方法。该方法利用细化算法提取血管的拓扑结构,然后计算细化后的血管与细化后的金标准之间的特征参数,即互信息、相关系数和节点率,以此作为评价图像分割结果的指标。
1 实验数据的获取与预处理
对图像分割结果进行评价需要有一定的标准和待评价的图像。对于眼底图像来说,金标准是专家手工分割的结果[10]。在STARE数据库中,有20幅眼底彩色图像和两套相应的金标准图像,分别标记出了10.4%和14.9%属于血管的像素。本文采用STARE数据库中第一套金标准进行实验比较。
在确定了金标准之后,关键是获得待评价的图像。本文的设计思路是采用形态学方法对金标准进行处理得到待评价的图像,即分割效果较好和较差的图像。具体操作是对20幅金标准图像进行腐蚀,腐蚀程度越大则代表分割效果越差。进行了两次程度不同的腐蚀得到标记为好和差的图像各二十幅。图 1(a)是STARE数据库中第一套专家手工分割中某一幅眼底图像,图 1(b)和图 1(c)分别是用不同结构单元对图 1(a)进行腐蚀的结果。从直观角度看,从左到右图像的边缘信息丢失得越来越多。这三类图像代表手工分割的结果、直观判断分割质量较好的结果和直观判断分割质量较差的结果。

(a)金标准;(b)分割结果较好的图像;(c)分割结果较差的图像
Figure1. Going-to-be evaluated images with erosion of gold standard(a) gold standard; (b) the better segmented image; (c) the worse segmented image
为了对以上分割效果进行进一步量化分析,采用传统的评价指标来对上面直观的评估效果进行验证。在视网膜血管分割领域中,广泛使用的传统分割评价方法是基于准确度、灵敏度和特异度的分割评价标准[11]。
$ 准确度\text{=}\frac{TP+TN}{TP+FP+TN+FN} $ |
$ 灵敏度=\frac{TP}{TP+FN} $ |
$ 特异度=\frac{TP}{TP+FN} $ |
其中: TP表示正确分割的血管,FP表示本来属于背景但被误分割成血管,TN表示正确分割的背景,FN表示本来属于血管但被误分割成背景。
本文只采用准确度来评价腐蚀后的结果,它是代表正确分割的血管区域和背景区域占全部图像的百分比。对直观判断结果为好的20幅图像和直观判断结果为差的20幅图像分别计算准确度,结果如图 2所示。直观判断结果为好的图像准确度都是较高的,结果为差的值都是较低的。而且由于腐蚀程度的一致,两条曲线走势也基本相同。因此,这样获取待评价图像的方法是可行的。

2 评价特征提取
由于本文是从拓扑结构的角度来进行评价的,在确定待评价图像后,首先利用细化算法来提取血管的中心线,即体现了血管完整的拓扑结构。本文所采用的细化方法是MATLAB软件中的数学形态学函数bwmorph。图 3是图 1中三幅图片细化的结果。

(a)金标准的细化结果;(b)分割结果较好图像的细化结果;(c)分割结果较差图像的细化结果
Figure3. The thining results of the gold standard and its erosion(a) thining result of gold standard; (b) thining result of better segmented image; (c) thining result of worse segmented image
如图 3所示,细化后的图像体现了血管当前的拓扑结构。对于评价特征的提取,本文用到了3个特征参数,即互信息、相关系数和节点率。选择这三个特征参数的原因是互信息和相关系数均能表示自动分割结果和金标准的相关性大小,节点的数量能表示拓扑结构的复杂程度。
2.1 互信息
互信息是用来描述两个系统之间的统计相关性,一般用熵来表示[12]。系统A的熵为
$ H\left( A \right)=-\sum\limits_{a}{{{\text{p}}_{A}}\left( a \right){{\log }_{A}}\left( a \right)} $ |
其中:a∈A。而互信息函数为
$ I\left( A,B \right)=H\left( A \right)-H\left( A|B \right)=H\left( A \right)+H\left( B \right)-H\left( A,B \right) $ |
其中:H(A|B)表示已知系统B时A的条件熵,H(A,B)为两系统的联合熵。
互信息值越大说明所包含的相同信息也越多。因此,对分割图像进行细化后,再计算互信息,那么结果越大则说明两者之间的拓扑结构越相似。自从互信息作为图像配准的准则被引入以来,已获得多数研究者认可[13]。但是由于互信息测度对两图像的重叠区域大小比较敏感,因此Studholme等[14]又提出了正则化互信息,其表达式为
$ \text{NMI=}\left[\text{H}\left( A \right)+\text{H}\left( B \right) \right]/\text{H}\left( A,B \right) $ |
研究表明,正则化互信息有更好的鲁棒性,故本文采用式(6)计算互信息值。
2.2 相关系数
相关系数是测定变量之间关系密切程度的量,可用于表示两幅图像间的相关性[15]。通常以ρ表示总体的相关系数,以r表示样本的相关系数[16]。总体相关系数的定义公式是
$ \rho =\frac{\operatorname{cov}\left( X,Y \right)}{\sqrt{\operatorname{var}\left( X \right)\cdot var\left( Y \right)}} $ |
其中:cov(X,Y)是随机变量X和Y的协方差,var(X)和var(Y)是随机变量X和Y的方差。而样本相关系数的定义为
$ r=\frac{\sum{\left( {{x}_{i}}-\bar{x} \right)}\left( {{y}_{i}}-\bar{y} \right)}{\sqrt{\sum{{{\left( {{x}_{i}}-\bar{x} \right)}^{2}}\cdot \sum{{{\left( {{y}_{i}}-\bar{y} \right)}^{2}}}}}} $ |
其中:xi和yi别是X和Y的样本数据。
相关系数越接近1,则说明两者越相似。因此,对分割图像进行细化处理后,再计算相关系数,结果越大则说明两者之间的拓扑结构越相似。
2.3 节点率
以上两个评价参数是先细化眼底血管图像以突出其拓扑结构,然后用互信息和相关系数分析血管分割效果,间接地评价了形态结构的相似性。而眼底血管结构错综复杂,对于这类结构的拓扑分析在医学领域中应用广泛[17]。而眼底图像的节点数是一个可以直接反映拓扑结构的特征参数。
在拓扑学中,节点是网络任何支路的分叉点或网络中两个或更多支路的互连公共点[18]。因此对于一幅眼底图像,节点包括了分支点和交叉点。统计分割后图像中的节点数,与金标准中的节点数进行比较,两者结果相近,则说明分割结果较好。为了能更好地显示节点处所标记的红圈,进行了细化处理再展示节点,结果如图 4所示。

为了与互信息和相关系数的计算方式统一,本文提出一个新的概念--节点率。节点率等于待评价图像中节点数和金标准图像中节点数的比值。该值越接近1,则说明两者越相似,即能反映待评价图像和金标准的相似程度。节点的数量能反映眼底血管分支结构的复杂程度,因此这方面的拓扑分析对眼底图像分割效果的评价有重要意义。
3 实验结果与讨论
实验环境采用的是酷睿i7四核CPU为4 GB内存的PC机,在Windows 8平台上,编程软件为Matlab R2012a。原始数据是STARE数据库中的20幅第一套专家手工标记结果。将这20幅原始图像都进行如图 1所示的腐蚀,再进行如图 3所示的细化处理,得到60幅细化的图像,即包括了20幅金标准、20幅分割效果较好和20幅分割效果较差的细化图像。
最后分别计算这20幅效果较好图像和20幅效果较差图像相对于各自对应金标准的互信息、相关系数和节点率,结果如图 5所示。可以看出,直观判断结果较好图像的互信息、相关系数和节点率的折线都在结果较差图像的折线之上,与预期符合。而且每幅图中两条曲线的走势也基本相同,体现了对20幅金标准图像每一次腐蚀的程度是一致的。

综合以上实验结果可知,细化处理后的互信息、相关系数和节点率能够评估出眼底图像分割结果的好坏,并且是符合直观感知的。此外,为了区别互信息和相关系数跟准确率的差异,又对这20组效果较好图像和20组效果较差图像的准确率进行了计算,结果如图 6所示。可见,较好图像准确率的值大部分处在较差图像准确率的值上方,但十分接近,而且有几个相反的结果。此结果证明,准确率与互信息和相关系数在算法上有所不同。进而说明,细化后的准确率不能用来判断眼底图像分割的好坏。

最后对本文算法的复杂程度进行分析。算法的复杂度,即算法在编写成可执行程序后,运行时所需要的时间和空间资源,包括了时间复杂度和空间复杂度,其中本文重点讨论的是时间复杂度[19]。首先结合式(6)及其相应程序代码,最复杂的是双重循环,因此根据复杂度计算规则可得,互信息的时间复杂度是O(n2)。其次结合式(8)及其相应程序代码,最复杂的也是双重循环,同理可得,相关系数的时间复杂度也是O(n2)。最后,节点率涉及到邻域搜索和除法运算,因此它的时间复杂度是O(n4)。在此有个经验规则,时间复杂度由小到大依次为:c<log2n<n<n·log2n<n2<n3<2n<3n<n!,其中c是常量。若一个算法的时间复杂度为c、log2n、n、n·log2n,则这个算法的时间复杂度低,即时间效率比较高 ;若复杂度为2n、3n、n!,则稍微大一些的n会令算法运行困难。综上讨论可知,本文算法的复杂度较低。
4 结论
针对眼底图像视网膜血管分割效果评价的问题,本文提出了一个新的基于拓扑结构的评价方法。该方法是利用STARE数据库中的信息,将专家手工分割图像及其腐蚀后的结果进行了实验。首先是运用细化算法提取血管拓扑结构,然后计算互信息、相关系数和节点率的评价特征参数,再进行对比和分析。最后实验证明,提出的评估方法能够评价分割结果的质量,对补充眼底图像视网膜血管分割评价方法具有重要的意义。下一步工作将研究把互信息、相关系数和节点率这三个指标结合起来评价眼底图像分割的效果。
引言
眼底视网膜图像在如今的眼科疾病诊断中起着十分重要的作用[1]。研究证明视网膜血管结构特征的改变和许多疾病密切相关,比如心血管疾病、糖尿病、中风等[2]。在视网膜血管分割的研究中,由于获取的图像多,人工图像分析费时费力,计算机自动眼底图像视网膜血管分割成为一个重要的方向[3]。目前已开发出许多自动分割的方法[4]。
对于疾病的诊断,血管分割结果的好坏显得十分重要,而判断这种好坏依靠评价方法[5]。一般来说,目前的分割评价方法分为两类。一类是基于像素点的评价方法。其中,传统的基于像素点的评价方法有三大指标,分别是准确度(accuracy)、灵敏度(sensitivity)和特异度(specificity)[6]。这三个指标是将分割结果与金标准进行像素的比较。还有一些基于像素间计算的方法。如Uyen等[7]提出了一个新的评估方法,它是基于精确性和完整性的概念。此方法的一个重要特性是对细小局部错误的容错性,这些分割错误不会影响所需的血管特征。但该类方法没有考虑形态学的特征。另一类评价方法则是基于形态学拓扑结构的评价方法。Gegundez-arias等[8]构造了一个基于连接度、区域和长度的函数,用于表征血管结构,作为血管分割结果的评价指标,该结果证明利用该函数对分割结果进行评价更适于树状结构图像的分割评价,是对现有图像分割评价方法的补充。
目前大部分自动分割算法所用的评价方法是传统三大指标,没有考虑到血管形态学结构的特殊性--树状结构[9]。为了更好地评价眼底视网膜血管图像的分割效果,需要将分割结果的拓扑结构信息融入到评价方法中。为此,本文提出了一种基于拓扑结构的眼底血管分割效果的评价方法。该方法利用细化算法提取血管的拓扑结构,然后计算细化后的血管与细化后的金标准之间的特征参数,即互信息、相关系数和节点率,以此作为评价图像分割结果的指标。
1 实验数据的获取与预处理
对图像分割结果进行评价需要有一定的标准和待评价的图像。对于眼底图像来说,金标准是专家手工分割的结果[10]。在STARE数据库中,有20幅眼底彩色图像和两套相应的金标准图像,分别标记出了10.4%和14.9%属于血管的像素。本文采用STARE数据库中第一套金标准进行实验比较。
在确定了金标准之后,关键是获得待评价的图像。本文的设计思路是采用形态学方法对金标准进行处理得到待评价的图像,即分割效果较好和较差的图像。具体操作是对20幅金标准图像进行腐蚀,腐蚀程度越大则代表分割效果越差。进行了两次程度不同的腐蚀得到标记为好和差的图像各二十幅。图 1(a)是STARE数据库中第一套专家手工分割中某一幅眼底图像,图 1(b)和图 1(c)分别是用不同结构单元对图 1(a)进行腐蚀的结果。从直观角度看,从左到右图像的边缘信息丢失得越来越多。这三类图像代表手工分割的结果、直观判断分割质量较好的结果和直观判断分割质量较差的结果。

(a)金标准;(b)分割结果较好的图像;(c)分割结果较差的图像
Figure1. Going-to-be evaluated images with erosion of gold standard(a) gold standard; (b) the better segmented image; (c) the worse segmented image
为了对以上分割效果进行进一步量化分析,采用传统的评价指标来对上面直观的评估效果进行验证。在视网膜血管分割领域中,广泛使用的传统分割评价方法是基于准确度、灵敏度和特异度的分割评价标准[11]。
$ 准确度\text{=}\frac{TP+TN}{TP+FP+TN+FN} $ |
$ 灵敏度=\frac{TP}{TP+FN} $ |
$ 特异度=\frac{TP}{TP+FN} $ |
其中: TP表示正确分割的血管,FP表示本来属于背景但被误分割成血管,TN表示正确分割的背景,FN表示本来属于血管但被误分割成背景。
本文只采用准确度来评价腐蚀后的结果,它是代表正确分割的血管区域和背景区域占全部图像的百分比。对直观判断结果为好的20幅图像和直观判断结果为差的20幅图像分别计算准确度,结果如图 2所示。直观判断结果为好的图像准确度都是较高的,结果为差的值都是较低的。而且由于腐蚀程度的一致,两条曲线走势也基本相同。因此,这样获取待评价图像的方法是可行的。

2 评价特征提取
由于本文是从拓扑结构的角度来进行评价的,在确定待评价图像后,首先利用细化算法来提取血管的中心线,即体现了血管完整的拓扑结构。本文所采用的细化方法是MATLAB软件中的数学形态学函数bwmorph。图 3是图 1中三幅图片细化的结果。

(a)金标准的细化结果;(b)分割结果较好图像的细化结果;(c)分割结果较差图像的细化结果
Figure3. The thining results of the gold standard and its erosion(a) thining result of gold standard; (b) thining result of better segmented image; (c) thining result of worse segmented image
如图 3所示,细化后的图像体现了血管当前的拓扑结构。对于评价特征的提取,本文用到了3个特征参数,即互信息、相关系数和节点率。选择这三个特征参数的原因是互信息和相关系数均能表示自动分割结果和金标准的相关性大小,节点的数量能表示拓扑结构的复杂程度。
2.1 互信息
互信息是用来描述两个系统之间的统计相关性,一般用熵来表示[12]。系统A的熵为
$ H\left( A \right)=-\sum\limits_{a}{{{\text{p}}_{A}}\left( a \right){{\log }_{A}}\left( a \right)} $ |
其中:a∈A。而互信息函数为
$ I\left( A,B \right)=H\left( A \right)-H\left( A|B \right)=H\left( A \right)+H\left( B \right)-H\left( A,B \right) $ |
其中:H(A|B)表示已知系统B时A的条件熵,H(A,B)为两系统的联合熵。
互信息值越大说明所包含的相同信息也越多。因此,对分割图像进行细化后,再计算互信息,那么结果越大则说明两者之间的拓扑结构越相似。自从互信息作为图像配准的准则被引入以来,已获得多数研究者认可[13]。但是由于互信息测度对两图像的重叠区域大小比较敏感,因此Studholme等[14]又提出了正则化互信息,其表达式为
$ \text{NMI=}\left[\text{H}\left( A \right)+\text{H}\left( B \right) \right]/\text{H}\left( A,B \right) $ |
研究表明,正则化互信息有更好的鲁棒性,故本文采用式(6)计算互信息值。
2.2 相关系数
相关系数是测定变量之间关系密切程度的量,可用于表示两幅图像间的相关性[15]。通常以ρ表示总体的相关系数,以r表示样本的相关系数[16]。总体相关系数的定义公式是
$ \rho =\frac{\operatorname{cov}\left( X,Y \right)}{\sqrt{\operatorname{var}\left( X \right)\cdot var\left( Y \right)}} $ |
其中:cov(X,Y)是随机变量X和Y的协方差,var(X)和var(Y)是随机变量X和Y的方差。而样本相关系数的定义为
$ r=\frac{\sum{\left( {{x}_{i}}-\bar{x} \right)}\left( {{y}_{i}}-\bar{y} \right)}{\sqrt{\sum{{{\left( {{x}_{i}}-\bar{x} \right)}^{2}}\cdot \sum{{{\left( {{y}_{i}}-\bar{y} \right)}^{2}}}}}} $ |
其中:xi和yi别是X和Y的样本数据。
相关系数越接近1,则说明两者越相似。因此,对分割图像进行细化处理后,再计算相关系数,结果越大则说明两者之间的拓扑结构越相似。
2.3 节点率
以上两个评价参数是先细化眼底血管图像以突出其拓扑结构,然后用互信息和相关系数分析血管分割效果,间接地评价了形态结构的相似性。而眼底血管结构错综复杂,对于这类结构的拓扑分析在医学领域中应用广泛[17]。而眼底图像的节点数是一个可以直接反映拓扑结构的特征参数。
在拓扑学中,节点是网络任何支路的分叉点或网络中两个或更多支路的互连公共点[18]。因此对于一幅眼底图像,节点包括了分支点和交叉点。统计分割后图像中的节点数,与金标准中的节点数进行比较,两者结果相近,则说明分割结果较好。为了能更好地显示节点处所标记的红圈,进行了细化处理再展示节点,结果如图 4所示。

为了与互信息和相关系数的计算方式统一,本文提出一个新的概念--节点率。节点率等于待评价图像中节点数和金标准图像中节点数的比值。该值越接近1,则说明两者越相似,即能反映待评价图像和金标准的相似程度。节点的数量能反映眼底血管分支结构的复杂程度,因此这方面的拓扑分析对眼底图像分割效果的评价有重要意义。
3 实验结果与讨论
实验环境采用的是酷睿i7四核CPU为4 GB内存的PC机,在Windows 8平台上,编程软件为Matlab R2012a。原始数据是STARE数据库中的20幅第一套专家手工标记结果。将这20幅原始图像都进行如图 1所示的腐蚀,再进行如图 3所示的细化处理,得到60幅细化的图像,即包括了20幅金标准、20幅分割效果较好和20幅分割效果较差的细化图像。
最后分别计算这20幅效果较好图像和20幅效果较差图像相对于各自对应金标准的互信息、相关系数和节点率,结果如图 5所示。可以看出,直观判断结果较好图像的互信息、相关系数和节点率的折线都在结果较差图像的折线之上,与预期符合。而且每幅图中两条曲线的走势也基本相同,体现了对20幅金标准图像每一次腐蚀的程度是一致的。

综合以上实验结果可知,细化处理后的互信息、相关系数和节点率能够评估出眼底图像分割结果的好坏,并且是符合直观感知的。此外,为了区别互信息和相关系数跟准确率的差异,又对这20组效果较好图像和20组效果较差图像的准确率进行了计算,结果如图 6所示。可见,较好图像准确率的值大部分处在较差图像准确率的值上方,但十分接近,而且有几个相反的结果。此结果证明,准确率与互信息和相关系数在算法上有所不同。进而说明,细化后的准确率不能用来判断眼底图像分割的好坏。

最后对本文算法的复杂程度进行分析。算法的复杂度,即算法在编写成可执行程序后,运行时所需要的时间和空间资源,包括了时间复杂度和空间复杂度,其中本文重点讨论的是时间复杂度[19]。首先结合式(6)及其相应程序代码,最复杂的是双重循环,因此根据复杂度计算规则可得,互信息的时间复杂度是O(n2)。其次结合式(8)及其相应程序代码,最复杂的也是双重循环,同理可得,相关系数的时间复杂度也是O(n2)。最后,节点率涉及到邻域搜索和除法运算,因此它的时间复杂度是O(n4)。在此有个经验规则,时间复杂度由小到大依次为:c<log2n<n<n·log2n<n2<n3<2n<3n<n!,其中c是常量。若一个算法的时间复杂度为c、log2n、n、n·log2n,则这个算法的时间复杂度低,即时间效率比较高 ;若复杂度为2n、3n、n!,则稍微大一些的n会令算法运行困难。综上讨论可知,本文算法的复杂度较低。
4 结论
针对眼底图像视网膜血管分割效果评价的问题,本文提出了一个新的基于拓扑结构的评价方法。该方法是利用STARE数据库中的信息,将专家手工分割图像及其腐蚀后的结果进行了实验。首先是运用细化算法提取血管拓扑结构,然后计算互信息、相关系数和节点率的评价特征参数,再进行对比和分析。最后实验证明,提出的评估方法能够评价分割结果的质量,对补充眼底图像视网膜血管分割评价方法具有重要的意义。下一步工作将研究把互信息、相关系数和节点率这三个指标结合起来评价眼底图像分割的效果。