数据集

本研究通过整合权威学术数据库检索与智能爬虫技术,构建多源异构医疗数据集,经标准化清洗与结构化处理后形成跨区域医疗视觉数据资源。该数据集覆盖眼部、胸腔、脑部及脊椎等解剖结构,包含多国、多性别、多族裔、全年龄段及多种疾病的标注信息,集成疾病诊断、治疗指南与病理研究等核心医学内容,最终形成符合多模态特性的医疗知识体系

以下展示的数据集点击名称即可跳转到相应界面

Kermany/Guangzhou

该数据集包含数千张经过验证的OCT和胸部X 射线图像,在“通过基于图像的深度学习识别医学诊断和可治疗疾病”中进行了描述和分析。 图像被拆分为一个训练集和一个独立患者的测试集。图像被标记为(疾病)-(随机患者 ID)-(该患者的图像编号)并分为4个目录:CNV,DME,DRUSEN和NORMAL

Canada OCT Retinal Images

该数据集包含500多张高分辨率的不同病理条件下的不同视网膜OCT图像。 图像类别包括正常(NO),黄斑裂孔(MH),年龄相关性黄斑变性(AMD),中枢性浆液性视网膜病变(CSR)和糖尿病视网膜病变(DR)

RIM-ONE Version 2

该数据集包含来自正常受试者的313份视网膜造影和来自青光眼患者的172 份视网膜造影。所有这些图像都经过了两位专家的评估,包括椎间盘和杯子的手动分割。该数据集描述了一个评估基准,其中包含卷积神经网络的不同模型

Ocular Disease Recognition

该数据集包含5000名患者的年龄、左右眼眼底彩色照片和医生的诊断关键词。 注释由训练有素的具有质量控制管理的人类读者标记。该数据集将患者分为八个类别,包括: 正常(N),糖尿病(D),青光眼(G),白内障(C),年龄相关性黄斑变性,高血压(H),病理性近视(M),其他疾病/异常(O)

PAPILA

该数据集包括同一患者双眼的医疗数据和眼底图像,提供了杯状和视盘的分割,以及根据临床资料的评估对患者进行标记。 文件夹ClinicalData包含244名患者的临床数据和诊断,文件夹expertssegmentation存储了两位眼科医生对每位患者双眼的视盘和视杯的分割

mBRSET

该数据集通过便携式相机拍摄,数据来自巴西巴伊亚州伊塔布纳的各种种族背景的人群。 该数据集包括来自1291名诊断为糖尿病的患者的5164张图像,并添加了临床和人口统计元数据

VQA-RAD

该数据集是一个关于放射学图像的问答对数据集,旨在用于训练和测试医学视觉问答(VQA)系统。数据集包含开放式问题和二元“是/否”问题,基于 MedPix 构建,这是一个免费的开放获取在线医学图像数据库,问答对由临床医生团队手动生成

ChestX-ray14

该数据集包含30805名独特患者的112120张正面胸部X射线图像,图像大小为1024×1024。 涵盖14种常见胸部疾病,包括积液、气胸、结节、肿块、肺不张、肺炎、肺水肿、肺纤维化、肺气肿、肺结核、心脏肥大、心包积液、胸腔积液、胸膜增厚等。

PMC-VQA

该数据集是一个大规模的医学视觉问答数据集,包含227k个VQA对和149k张医学图像,图像涵盖多种模态和疾病。 问题类型包括识别图像模式、视角、器官等简单问题,以及需要专业知识和判断的复杂问题。 答案中的词语主要包括位置描述、图像模态和特定解剖区域,大多数答案在5个单词左右。