皮肤病是发生在皮肤和皮肤附属器官疾病的总称。皮肤是人体最大的器官,皮肤病的种类不但繁多,多种内脏发生的疾病也可以在皮肤上有表现。严重的皮肤病,如恶黑,很可能致人死亡,误诊的后果会非常严重;症状轻的皮肤病(皮损),如痣,很多人不会选择去治疗。但是,很多致死皮肤病和轻微症状皮肤病形态学极其相似(如上面提到的恶黑和痣),因此如果能快速准确地识别皮肤疾病,那么就可以有效挽救患者的生命。
皮肤病
皮肤癌是最常见的一种癌症。特别是黑素瘤,尽管是最不常见的皮肤癌,但它造成了75%的皮肤癌死亡。美国癌症协会(American Cancer Society)估计,到2020年,将有超过10万例新的黑色素瘤病例被诊断出来。预计将有近7000人死于这种疾病。与其他癌症一样,早期准确的检测——可能借助于数据科学——可以使治疗更加有效。
目前,皮肤科医生评估病人的每一个痣,以确定异常病变或最有可能是黑色素瘤的疑似病例。现有的人工智能方法没有充分考虑到这一临床参考框架。如果检测算法考虑到同一患者的“背景”图像来确定哪些图像代表黑色素瘤,皮肤病学家可以提高诊断的准确性。如果成功,分类器将更准确,可以更好地支持皮肤科临床工作。
关于黑素瘤
皮肤癌是一个重大的公共健康问题,在美国每年有超过500万的新诊断病例。黑素瘤是最致命的一种皮肤癌,造成绝大多数皮肤癌患者的死亡。2015年,全球黑色素瘤发病率估计超过35万例,近6万人死亡。虽然死亡率很高,但早期发现时,黑素瘤生存率超过95%。
关于皮肤镜
由于色素病变发生在皮肤表面,黑素瘤是易于早期发现的专家的视觉检查。它也可以通过图像分析实现自动检测。鉴于高分辨率摄像机的广泛使用,能够提高我们筛查和检测麻烦病变能力的算法可能具有很大价值。因此,许多中心已经开始了他们自己的自动化分析研究工作。然而,一个集中的、协调的、比较的跨机构的努力还没有实施。
皮肤镜是一种消除皮肤表面反射的成像技术。通过消除表面反射,可以增强皮肤深层的视觉效果。先前的研究表明,与标准摄影相比,由皮肤科专家使用时,皮镜提供了更高的诊断准确性。随着智能手机的廉价消费者级皮肤镜附件开始进入市场,自动皮肤镜评估算法对病人护理产生积极影响的机会增加了。
ISIC
国际皮肤成像合作组织(ISIC)是由国际皮肤数字成像协会(ISDIS)赞助的旨在提高黑色素瘤诊断的国际组织。ISIC档案包含了最大的公开收集的质量控制皮肤损伤的皮镜图像。
目前,ISIC的档案包含了超过13000张皮镜图像,这些图像都是从国际领先的临床中心收集的,并从每个中心的各种设备中获得。广泛的国际图像来源事为了确保具有代表性的临床相关样本。
所有进入ISIC档案的图像都经过了隐私和质量保证的筛选。大多数图像都与临床元数据相关,而临床元数据已经过公认的黑色素瘤专家的审查。这些图像的一个子集已经被公认的皮肤癌专家进行了注释和标记。这些标记包括皮肤镜特征(例如。例如,图像中的全局和局部形态元素可以区分不同类型的皮肤损伤)。
SIIM-ISIC
医学影像资讯学会(SIIM)作为医学影像资讯的领先医疗保健组织,其使命是通过在多学科领域的教育、研究和创新来推进医学影像资讯。SIIM与国际皮肤成像合作组织(ISIC)合作,该组织致力于改善黑色素瘤诊断。ISIC档案包含了最大的公开收集的质量控制皮肤损伤的皮镜图像。
在这次比赛中,你将在皮肤损伤的图像中识别黑色素瘤。特别是,您将使用同一患者的图像,并确定哪些可能代表黑色素瘤。使用患者层面的上下文信息可能有助于图像分析工具的开发,从而更好地支持临床皮肤科医生。
图像以DICOM格式提供(共有33127个案例,大约100G)。可以使用pydicom
等常用库访问该库,其中包含图像和元数据。它是一种常用的医学成像数据格式。还以JPEG和TFRecord格式(分别在jpeg
和tfrecords
目录中)提供图像。TFRecord格式的图像已被调整为统一的1024x1024。 官方还以DICOM格式在CSV文件中提供了元数据。有关说明,请参见Columns
部分。
您正在为每个图像预测一个二进制目标。 您的模型应预测图像中病变为目标的概率在0.0到1.0之间(浮点)。在训练数据train.csv中,值0表示良性,值1表示恶性。
Files
-
train.csv - the training set
-
test.csv - the test set
-
sample_submission.csv - a sample submission file in the correct format
Columns
image_name
- unique identifier, points to filename of related DICOM imagepatient_id
- unique patient identifiersex
- the sex of the patient (when unknown, will be blank)age_approx
- approximate patient age at time of imaginganatom_site_general_challenge
- location of imaged sitediagnosis
- detailed diagnosis information (train only)benign_malignant
- indicator of malignancy of imaged lesiontarget
- binarized version of the target variable
ISIC2019
皮肤癌是全球最常见的癌症,黑色素瘤是最致命的一种。与肉眼检查相比,镜检是一种皮肤成像方式,可以辅助诊断皮肤癌。然而,为了读片,临床医生需要接受充分的培训。为了使专业知识更广泛地应用,国际皮肤成像协作组织(ISIC)开发了ISIC档案库,一个皮肤镜图像的国际资源库,用于临床培训,并通过主办ISIC挑战来支持自动化算法分析的技术研究。
2019年ISIC的目标是将皮肤镜图像分为九个不同的诊断类别:
- 黑素瘤(Melanoma)
- Melanocytic nevus(痣)
- 基底细胞癌(Basal cell carcinoma)
- 光化性角化病(Actinic keratosis)
- 良性角化病(太阳色斑/脂溢性角化病/扁平苔藓样角化病)
- 皮肤纤维瘤(Dermatofibroma)
- 血管病变(Vascular lesion)
- 鳞状细胞癌(Squamous cell carcinoma)
- 其他
有25,331幅图像可用于8个不同类别的训练。另外,测试数据集将包含一个训练数据中没有表示的额外的离群类,开发的系统必须能够识别它。
有两项任务可供参与:1)对无元数据(meta-data
)的皮肤镜图像进行分类,以及2)对有其他可用元数据的图像进行分类。
另外,ISIC2019的数据源自HAM_10000、BCN_20000以及MSK等皮肤镜数据集。
ISIC2018
Task 3: 数据集图片下载,3G,包含
Training images 10015, Test images 1512, Validation images 193
ISIC2018_Task3_Training_GroundTruth.zip
ISIC2018_Task3_Validation_Input.zip
ISIC2018_Task3_Test_Input.zip
ISIC2018_Task3_Training_Input.zip
ISIC2018_Task1_Training_GroundTruth.zip
链接:https://pan.baidu.com/s/1NiEu4WetewrMkIOVuWWNYg 密码:1k2f
ISIC2017
Task 3: 数据集图片下载,12G,包含
including 374 “melanoma”, 254 “seborrheic keratosis”, and the remainder as benign nevi (1372)
Validation data,with 150 images.
Test data,with 600 images.
ISIC-2017_Validation_Part3_GroundTruth.csv
ISIC-2017_Test_v2_Part3_GroundTruth.csv
ISIC-2017_Training_Part3_GroundTruth.csv
链接: https://pan.baidu.com/s/18mgfpm1CnDzApnTZmKzIjQ 提取码: nzct
ISIC2016
Task 3: 数据集图片下载,825M,包含
Training_Data(900张图片)
Test_Data(379张图片)
ISBI2016_ISIC_Part3_Test_GroundTruth.csv
ISBI2016_ISIC_Part3_Training_GroundTruth.csv
链接: https://pan.baidu.com/s/1CeLwSicZc3ddUljfEmlSTw 提取码: rkb8