医学影像报告异常检测线上0.895开源-伙伴云

网友投稿 909 2022-05-30

赛题：全球人工智能技术创新大赛赛道一: 医学影像报告异常检测

赛题背景

影像科医生在工作时会观察医学影像（如CT、核磁共振影像），并对其作出描述，这些描述中包含了大量医学信息，对医疗AI具有重要意义。本任务需要参赛队伍根据医生对CT的影像描述文本数据，判断身体若干目标区域是否有异常以及异常的类型。初赛阶段仅需判断各区域是否有异常，复赛阶段除了判断有异常的区域外，还需判断异常的类型。判断的结果按照指定评价指标进行评测和排名，得分最优者获胜。

赛题描述及数据说明

sample数据

医生对若干CT的影像描述的明文数据，及描述中有异常区域与异常类型的label。样本数量为10份，以便使参赛队伍对比赛数据有直观的了解（Sample数据只是为了增进参赛选手对医疗影像描述的直观了解，实际训练与测试数据不一定与Sample数据具有相同特征或分布）。

每份样本占一行，使用分隔符“|,|”分割为3列，为不带表头的CSV数据格式。

需要预测的人体区域有17个，复赛中需要判断的异常类型有12种。由于数据安全需要，不会告知具体区域与类型的名称，只会以ID表示，区域ID为0到16，类型ID为0到11。每个影像描述中可能有零个、一个或多个区域存在异常；若此描述有异常区域，则可能包含一个或多个异常类型。

Training数据

脱敏后的影像描述与对应label。影像描述以字为单位脱敏，使用空格分割。初赛只进行各区域有无异常的判断，label只有异常区域ID。复赛除了判断各区域有无异常，还需要判断各区域异常的类型，因此label包含异常区域ID与异常类型ID。初赛Training集规模为10000例样本，复赛Training集规模为20000例样本。Training数据用于参赛选手的模型训练与预估。

初赛Training数据格式(不同列使用分隔符“|,|”分割）：

复赛Training数据格式(不同列使用分隔符“|,|”分割）：

Test数据

脱敏后的影像描述，脱敏方法和Training相同。Test数据用于参赛选手的模型评估和排名。初赛Test集分为AB榜，规模均为3000。复赛Test集规模为5000。

Test数据格式(不同列使用分隔符“|,|”分割）：

提交说明

对于Test数据report_ID,description，选手应提交report_ID,prediction，其中prediction是预测结果。初赛中prediction是17维向量，值在0到1之间，表示各区域有异常的概率，使用空格分割。复赛中prediction是29维向量，值在0到1之间，前17个值表示17个区域有异常的概率，后12个值表示此描述包含各异常类型的概率。

初赛提交数据格式(不同列使用分隔符“|,|”分割）：

复赛提交数据格式(不同列使用分隔符“|,|”分割）：

评估标准

在Test数据上将对选手提交结果计算mlogloss作为评估标准，最终分数为1-mlogloss。

在初赛阶段，一个样本对应M(M=17)个预测值，N个样本共MN个预测值。对此MN个值的真实值与预测值计算mlogloss，计算方式如下：

其中y_{n,m}yn,m 和\hat{y}_{n,m}y^ n,m 分别是第n个样本第m个标签的真实值和预测值。

初赛分数 S=1-mlogloss。为了让分数区间更合理，复赛阶段调整为S=1-2*mlogloss。

在复赛阶段，分数由两部分组成。第一部分与初赛相同，对预测值的前17维结合真实值计算S_1S1 得到。第二部分为对所有实际存在异常区域的测试样本，对其预测值后12维结合真实异常类型进行计算，方法与第一部分相同，若N个测试样本中有K个实际有异常区域，则将对12K个值进行计算（实际无异常的样本不参与第二部分计算），得到S_2S2 。复赛最终分数S=0.6S_1+0.4S_2S=0.6S1 +0.4S2 。

开源方案

本方案根据线上84.7的开源分享(基于textCNN)-天池技术圈-天池技术讨论区，提供的Baseline做的修改，主要修改该了Mode、数据处理部分。baseline的特点：

本baselien基于textCNN构建

构建词汇表，总共858个词语，编号为0-857。

统一样本的长度，这里选择50个词语作为样本长度，多的截断，少的补齐(用858补齐)

textCNN的第一层是对原始序列进行enmbeding，对每一个词都enmbed到固定维度，然后使用CNN来进行特征提取。

最后的输出采取BECWithlogitLoss()

线下验证指标采取auc和logloss两种方案

我主要做的修改：

统一样本的长度，这里选择64个词语作为样本长度，多的截断，少的补齐(用0补齐,用0补齐后大约有0.05的提高)

textCNN的第一层是对原始序列进行enmbeding，对每一个词都enmbed到固定维度，然后使用CNN来进行特征提取，enmbeding改为64.

最终的初赛成绩是88，这个很奇怪，我记着当时已经下滑到100以外了，加上没有思路我就放弃了，错过一次进决赛的机会。

Net

详见：net.py

我总结一下我的Net的特点：

1、引入了3个TransformerEncoder编码器，我看到有人在kaggle的一个比赛top1方案中使用了，所以就拿过试试。

2、使用CNN的主力机制Coordinate Attention ，参考这篇：注意力机制在CNN中使用总结_AI浩-CSDN博客

3、使用Mish激活函数。

4、构架多尺度的网络融合，和残差。

模型代码：

import torch

import torch.nn as nn

import torch.nn.functional as F

from collections import OrderedDict

channelNum = 64

class CA_Block(nn.Module):

def __init__(self, channel, h, w, reduction=16):

super(CA_Block, self).__init__()

self.h = h

self.w = w

self.avg_pool_x = nn.AdaptiveAvgPool2d((h, 1))

self.avg_pool_y = nn.AdaptiveAvgPool2d((1, w))

self.conv_1x1 = nn.Conv2d(in_channels=channel, out_channels=channel // reduction, kernel_size=1, stride=1,

bias=False)

self.relu = nn.ReLU()

self.bn = nn.BatchNorm2d(channel // reduction)

self.F_h = nn.Conv2d(in_channels=channel // reduction, out_channels=channel, kernel_size=1, stride=1,

bias=False)

self.F_w = nn.Conv2d(in_channels=channel // reduction, out_channels=channel, kernel_size=1, stride=1,

bias=False)

self.sigmoid_h = nn.Sigmoid()

self.sigmoid_w = nn.Sigmoid()

def forward(self, x):

x_h = self.avg_pool_x(x).permute(0, 1, 3, 2)

x_w = self.avg_pool_y(x)

x_cat_conv_relu = self.relu(self.conv_1x1(torch.cat((x_h, x_w), 3)))

x_cat_conv_split_h, x_cat_conv_split_w = x_cat_conv_relu.split([self.h, self.w], 3)

s_h = self.sigmoid_h(self.F_h(x_cat_conv_split_h.permute(0, 1, 3, 2)))

s_w = self.sigmoid_w(self.F_w(x_cat_conv_split_w))

out = x * s_h.expand_as(x) * s_w.expand_as(x)

return out

class Mish(torch.nn.Module):

def __init__(self):

super().__init__()

def forward(self, x):

x = x * (torch.tanh(torch.nn.functional.softplus(x)))

return x

class ConvBN(nn.Sequential):

def __init__(self, in_planes, out_planes, kernel_size, stride=1, groups=1):

if not isinstance(kernel_size, int):

padding = [(i - 1) // 2 for i in kernel_size]

else:

padding = (kernel_size - 1) // 2

super(ConvBN, self).__init__(OrderedDict([

('conv', nn.Conv2d(in_planes, out_planes, kernel_size, stride,

padding=padding, groups=groups, bias=False)),

('bn', nn.BatchNorm2d(out_planes)),

# ('Mish', Mish())

('Mish', nn.LeakyReLU(negative_slope=0.3, inplace=False))

]))

class ResBlock(nn.Module):

"""

Sequential residual blocks each of which consists of \

two convolution layers.

Args:

ch (int): number of input and output channels.

nblocks (int): number of residual blocks.

shortcut (bool): if True, residual tensor addition is enabled.

"""

def __init__(self, ch, nblocks=1, shortcut=True):

super().__init__()

self.shortcut = shortcut

self.module_list = nn.ModuleList()

for i in range(nblocks):

resblock_one = nn.ModuleList()

resblock_one.append(ConvBN(ch, ch, 1))

resblock_one.append(Mish())

resblock_one.append(ConvBN(ch, ch, 3))

resblock_one.append(Mish())

self.module_list.append(resblock_one)

def forward(self, x):

for module in self.module_list:

h = x

for res in module:

h = res(h)

x = x + h if self.shortcut else h

return x

class Encoder_conv(nn.Module):

def __init__(self, in_planes=128, blocks=2, h=32, w=64):

super().__init__()

self.conv2 = ConvBN(in_planes, in_planes * 2, [1, 9])

self.conv3 = ConvBN(in_planes * 2, in_planes * 4, [9, 1])

self.conv4 = ConvBN(in_planes * 4, in_planes, 1)

self.resBlock = ResBlock(ch=in_planes, nblocks=blocks)

self.conv5 = ConvBN(in_planes, in_planes * 2, [1, 7])

self.conv6 = ConvBN(in_planes * 2, in_planes * 4, [7, 1])

self.conv7 = ConvBN(in_planes * 4, in_planes, 1)

self.eca = CA_Block(in_planes, h=h, w=w)

self.relu = Mish()

def forward(self, input):

x2 = self.conv2(input)

x3 = self.conv3(x2)

x4 = self.conv4(x3)

r1 = self.resBlock(x4)

x5 = self.conv5(r1)

x6 = self.conv6(x5)

x7 = self.conv7(x6)

x8 = self.relu(x7 + x4)

e = self.eca(x8)

return e

class TransformerEncoder(torch.nn.Module):

def __init__(self, embed_dim, num_heads, dropout, feedforward_dim):

super().__init__()

self.attn = torch.nn.MultiheadAttention(embed_dim, num_heads, dropout=dropout)

self.linear_1 = torch.nn.Linear(embed_dim, feedforward_dim)

self.linear_2 = torch.nn.Linear(feedforward_dim, embed_dim)

self.layernorm_1 = torch.nn.LayerNorm(embed_dim)

self.layernorm_2 = torch.nn.LayerNorm(embed_dim)

def forward(self, x_in):

attn_out, _ = self.attn(x_in, x_in, x_in)

x = self.layernorm_1(x_in + attn_out)

ff_out = self.linear_2(torch.nn.functional.relu(self.linear_1(x)))

x = self.layernorm_2(x + ff_out)

return x

class CNN_Text(nn.Module):

def __init__(self, embed_num, static=False):

super(CNN_Text, self).__init__()

embed_dim = 128

class_num = 17

Ci = 1

self.embed = nn.Embedding(embed_num, embed_dim) # 词嵌入

self.tram = TransformerEncoder(embed_dim, 8, 0.5, 512)

self.encoder_2 = TransformerEncoder(embed_dim, 8, 0.5, 512)

self.encoder_3 = TransformerEncoder(embed_dim, 8, 0.5, 512)

self.encoder1 = nn.Sequential(OrderedDict([

("conv3_bn3", ConvBN(Ci, channelNum, 1)),

("encoder_conv1", Encoder_conv(channelNum, blocks=2, h=64, w=128)),

]))

self.encoder2 = nn.Sequential(OrderedDict([

("conv3_bn_3,3", ConvBN(Ci, channelNum * 2, 3)),

("conv3_bn1,1", ConvBN(channelNum * 2, channelNum // 2, 1)),

('se', CA_Block(channelNum // 2, h=64, w=128)),

]))

self.encoder3 = nn.Sequential(OrderedDict([

("conv3_bn3", ConvBN(Ci, channelNum * 2, [1, 3])),

("conv3_bn31", ConvBN(channelNum * 2, channelNum // 2, [3, 1])),

('se', CA_Block(channelNum // 2, h=64, w=128)),

]))

self.encoder_conv = Encoder_conv(channelNum * 2)

self.encoder_conv1 = nn.Sequential(OrderedDict([

("conv1x1_bn", ConvBN(channelNum * 2, 1, 1)),

]))

self.con1 = ConvBN(Ci, channelNum * 2, 1, stride=2)

self.relu = Mish()

self.pool = nn.AvgPool2d(2);

self.fc1 = nn.Linear(2048, class_num)

self.dp = nn.Dropout(0.5)

self.sg = nn.Sigmoid()

if static:

self.embed.weight.requires_grad = False

def forward(self, x):

x = self.embed(x) # (N, W, D)-batch,单词数量，维度

x1=self.tram(x)

x2=self.encoder_2(x1)

x = self.encoder_3(x2)

x = x.unsqueeze(1) # (N, Ci, W, D)

x = self.sg(x)

x0 = self.con1(x)

encode1 = self.encoder1(x)

encode2 = self.encoder2(x)

encode3 = self.encoder3(x)

x = torch.cat((encode1, encode2, encode3), dim=1)

x = self.relu(x)

x = self.pool(x)

x = self.encoder_conv(x)

x = self.relu(x + x0)

x = self.encoder_conv1(x)

x = x.contiguous().view(-1, 2048)

x = self.dp(x)

logit = self.fc1(x) # (N, C)

return logit

if __name__ == "__main__":

net = CNN_Text(embed_num=1000)

x = torch.LongTensor([[1, 2, 4, 5, 2, 35, 43, 113, 111, 451, 455, 22, 45, 55],

[14, 3, 12, 9, 13, 4, 51, 45, 53, 17, 57, 954, 156, 23]])

logit = net(x)

print(net)

数据分析

详见eda.py

我在数据分析上做的主要工作有：

1、数据长度的分析，数据最长是104，最短是4，平均值是41.

2、找出高频词，并在加载数据时，将高频词去除。（此操作不但没有提升分数，反而下降了，不学科啊）

import pandas as pd

import numpy as np

from collections import Counter

train_df=pd.read_csv('data/track1_round1_train_20210222.csv',header=None)

test_df=pd.read_csv('data/track1_round1_testA_20210222.csv',header=None)

train_df.columns=['report_ID','description','label']

test_df.columns=['report_ID','description']

train_df.drop(['report_ID'],axis=1,inplace=True)

test_df.drop(['report_ID'],axis=1,inplace=True)

print("train_df:{},test_df:{}".format(train_df.shape,test_df.shape))

new_des=[i.strip('|').strip() for i in train_df['description'].values]

new_label=[i.strip('|').strip() for i in train_df['label'].values]

train_df['description']=new_des

train_df['label']=new_label

new_des_test=[i.strip('|').strip() for i in test_df['description'].values]

test_df['description']=new_des_test

word_all=[]

len_list=[]

for i in range(len(new_des)):

tmp=[int(i) for i in new_des[i].split(' ')]

word_all+=tmp

len_list.append(len(tmp))

for i in range(len(new_des_test)):

tmp=[int(i) for i in new_des_test[i].split(' ')]

word_all+=tmp

len_list.append(len(tmp))

print(train_df['label'].unique())

a=Counter(word_all)

print(len(a))

a=dict(a)

a=sorted(a)#0-857

#print(a)

print(np.max(len_list),np.min(len_list),np.mean(len_list))

训练

这里面我对loss做了修改，本次loss如下：

pytorch中最接近的的loss是torch.nn.BCEWithLogitsLoss()，但是在计算有差别，所以我尝试自己写loss。

def logloss(y_true, y_pred):

# Clip y_pred between eps and 1-eps

p = torch.clamp(y_pred, 1e-5, 1-1e-5)

loss = torch.sum(y_true * torch.log(p) + (1 - y_true) * torch.log(1 - p))

return loss / len(y_true)

class Muti_logloss(torch.nn.Module):

def __init__(self):

super(Muti_logloss, self).__init__()

def forward(self, y, y_p):

allloss = []

for i in range(y.shape[1]):

loss = logloss(y[:, i], y_p[:, i])

allloss.append(loss)

allloss = torch.tensor(allloss, dtype=torch.float)

alllosssum = torch.sum(allloss)

lossre = alllosssum / (y.shape[1])

lossre = -Variable(lossre, requires_grad=True)

return lossre

写完loss后，接着训练，发现loss一直不收敛，找了几个大佬帮我核对loss没有问题。不知道哪里出问题了，先记录。最后还是用的 BCEWithLogitsLoss()。

完整的代码连接：

医学影像报告异常检测0.8956.zip-深度学习文档类资源-CSDN下载

医疗机器学习

两次写">MYSQL 两次写

909 2022-05-30

异常">异常

909 2022-05-30

服务器 异常停止的事物会如何应对">【MySQL】服务器 异常停止的事物会如何应对

909 2022-05-30

医学 影像 报告 异常 检测线上0.895开源

两次写">MYSQL 两次写

异常">异常

服务器 异常停止的事物会如何应对">【MySQL】服务器 异常停止的事物会如何应对

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理 系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

客户管理工具是什么？">客户管理工具是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接

医学影像报告异常检测线上0.895开源

微信扫一扫：分享

两次写">MYSQL 两次写

异常">异常

服务器异常停止的事物会如何应对">【MySQL】服务器异常停止的事物会如何应对

推荐文章

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜">零代码开发是什么？2022低代码平台排行榜

进销存库存管理系统（智慧进销存）">智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐">在线文档哪家强？8款在线文档编辑软件推荐

客户管理工具是什么？">客户管理工具是什么？

进销存库存管理盘点">简单进销存库存管理盘点

友情链接