VinDr

Blog

CasaCasa / Blog / VinDr

Nov 18, 2023

VinDr

Scientific Data volume 9,

Dati scientifici volume 9, numero articolo: 429 (2022) Citare questo articolo

8653 accessi

23 citazioni

2 Altmetrico

Dettagli sulle metriche

La maggior parte dei set di dati esistenti sulle radiografie del torace includono etichette da un elenco di risultati senza specificarne la posizione sulle radiografie. Ciò limita lo sviluppo di algoritmi di apprendimento automatico per il rilevamento e la localizzazione delle anomalie toraciche. In questo lavoro descriviamo un set di dati di oltre 100.000 scansioni radiografiche del torace raccolte retrospettivamente da due importanti ospedali del Vietnam. Di questi dati grezzi, rilasciamo 18.000 immagini che sono state annotate manualmente da un totale di 17 radiologi esperti con 22 etichette locali di rettangoli che circondano anomalie e 6 etichette globali di malattie sospette. Il set di dati rilasciato è suddiviso in un set di addestramento di 15.000 e un set di test di 3.000. Ciascuna scansione nel set di addestramento è stata etichettata in modo indipendente da 3 radiologi, mentre ciascuna scansione nel set di test è stata etichettata con il consenso di 5 radiologi. Abbiamo progettato e realizzato una piattaforma di etichettatura per le immagini DICOM per facilitare queste procedure di annotazione. Tutte le immagini sono rese pubblicamente disponibili in formato DICOM insieme alle etichette sia del set di addestramento che del set di test.

Misurazione(i)

malattie e risultati anomali delle radiografie del torace

Tipi di tecnologia

L’intelligenza artificiale viene utilizzata per rilevare malattie e risultati anomali

Caratteristica del campione: posizione

Vietnam

I sistemi di diagnosi assistita da computer (CAD) per le radiografie del torace (noti anche come radiografia del torace o CXR) hanno recentemente ottenuto un grande successo grazie alla disponibilità di grandi set di dati etichettati e ai recenti progressi degli algoritmi di apprendimento supervisionato ad alte prestazioni1,2, 3,4,5. Sfruttando le reti neurali convoluzionali profonde (CNN)6, questi sistemi possono raggiungere prestazioni di livello esperto nella classificazione delle malattie polmonari comuni e dei relativi risultati. L'addestramento di una CNN si basa fortemente su set di dati di alta qualità di immagini annotate. Tuttavia, creare tali set di dati è costoso e richiede molto tempo a causa di diversi vincoli: (1) i dati medici sono difficili da recuperare da ospedali o centri medici; (2) l'annotazione manuale da parte dei medici è costosa; (3) l'annotazione delle immagini mediche richiede il consenso di diversi lettori esperti per superare i pregiudizi umani7; e (4) manca un quadro di etichettatura efficiente per gestire e annotare set di dati medici su larga scala.

Notevoli set di dati pubblici di CXR includono ChestX-ray8, ChestX-ray148, Padchest9, CheXpert2 e MIMIC-CXR10. ChestX-ray14, una versione estesa di ChestX-ray8, è stata rilasciata dal National Institutes of Health (NIH) degli Stati Uniti, contenente oltre 112.000 scansioni CXR di oltre 30.000 pazienti. Senza essere annotato manualmente, questo set di dati pone problemi significativi legati alla qualità delle sue etichette11. Padchest è composto da oltre 160.000 immagini CXR, il 27% delle quali sono state etichettate manualmente dai radiologi con 174 risultati diversi e 19 diagnosi. Il resto del set di dati è stato etichettato utilizzando uno strumento di elaborazione del linguaggio naturale (NLP). CheXpert, rilasciato di recente, fornisce più di 200.000 CXR di 65.240 pazienti, che sono stati etichettati per la presenza di 14 osservazioni utilizzando un etichettatore automatizzato basato su regole che estrae parole chiave dai referti medici. Adottando lo stesso meccanismo di etichettatura, MIMIC-CXR contiene 377.110 immagini in formato DICOM insieme a referti radiologici a testo libero. La tabella 1 fornisce un riepilogo dei set di dati sopra menzionati insieme ad altri di dimensioni moderate, tra cui JSRT12, Indiana13, MC14 e SH14.

La maggior parte dei set di dati CXR esistenti dipendono da etichettatori automatizzati basati su regole che utilizzano la corrispondenza di parole chiave (ad esempio CheXpert2 e etichettatori NIH8) o un modello NLP per estrarre etichette di malattie da referti radiologici a testo libero. Questi strumenti possono produrre etichette su larga scala ma, allo stesso tempo, introdurre un alto tasso di incoerenza, incertezza ed errori11,15. Queste etichette rumorose possono portare alla deviazione degli algoritmi basati sul deep learning dalle prestazioni riportate quando valutate in un contesto reale16. Inoltre, gli approcci basati su report associano un'immagine CXR solo a una o più etichette in un elenco predefinito di risultati e diagnosi senza identificarne la posizione. Esistono alcuni set di dati CXR che includono posizioni di anomalie annotate, ma sono troppo piccoli per l'addestramento di modelli di deep learning (JSRT) o non sufficientemente dettagliati (PadChest). L'interpretazione di una CXR non riguarda solo la classificazione a livello di immagine; è ancora più importante, dal punto di vista del radiologo, localizzare le anomalie sull'immagine. Ciò spiega in parte perché le applicazioni dei sistemi CAD per la CXR nella pratica clinica sono ancora molto limitate.