Auto precisa

Notizia

CasaCasa / Notizia / Auto precisa

Nov 13, 2023

Auto precisa

Nature Communications volume

Nature Communications volume 13, numero articolo: 1867 (2022) Citare questo articolo

7083 accessi

6 citazioni

17 Altmetrico

Dettagli sulle metriche

L’incapacità di etichettare in modo accurato ed efficiente grandi set di dati di imaging medico ad accesso libero limita l’implementazione diffusa di modelli di intelligenza artificiale nel settore sanitario. Ci sono stati pochi tentativi, tuttavia, di automatizzare l'annotazione di tali database pubblici; un approccio, ad esempio, si concentrava sull’etichettatura manuale e ad alta intensità di lavoro di sottoinsiemi di questi set di dati da utilizzare per addestrare nuovi modelli. In questo studio, descriviamo un metodo per l'etichettatura standardizzata e automatizzata basato sulla somiglianza con un atlante derivato dal modello AI (xAI) precedentemente validato e spiegabile, per il quale l'utente può specificare una soglia quantitativa per un livello di accuratezza desiderato (la probabilità -di-somiglianza, metrica pSim). Mostriamo che il nostro modello xAI, calcolando i valori pSim per ciascuna etichetta di output clinico in base al confronto con l'atlante di riferimento derivato dal set di addestramento, può etichettare automaticamente i set di dati esterni con un livello elevato di precisione selezionato dall'utente, pari o superiore a quello di esperti umani. Mostriamo inoltre che, mettendo a punto il modello originale utilizzando gli esami etichettati automaticamente per la riqualificazione, le prestazioni possono essere preservate o migliorate, risultando in un modello altamente accurato e più generalizzato.

L’implementazione dell’intelligenza artificiale medica (AI) nella pratica clinica in generale, e nella pratica radiologica in particolare, è stata in gran parte limitata dal tempo, dai costi e dalle competenze necessarie per etichettare con precisione set di dati di imaging molto grandi, che possono fungere da livello di platino verità fondamentale per l’addestramento di modelli di intelligenza artificiale clinicamente rilevanti. La capacità di annotare in modo automatico ed efficiente grandi set di dati esterni, a un livello di precisione selezionato dall'utente, può quindi essere di notevole valore nello sviluppo di modelli di intelligenza artificiale medica importanti e di grande impatto che apportano valore aggiunto e sono ampiamente accettati da comunità sanitaria. Un simile approccio non solo ha il potenziale per favorire la riqualificazione per migliorare l'accuratezza dei modelli di intelligenza artificiale esistenti, ma, attraverso l'utilizzo di una metodologia spiegabile e basata su atlante derivata da modelli1, può aiutare a standardizzare l'etichettatura dei set di dati open source2,3,4,5 , per cui le etichette fornite possono essere rumorose, imprecise o assenti. Tale standardizzazione può, a sua volta, ridurre il numero di punti dati necessari per la creazione accurata di modelli, la facilitazione, la formazione e la riqualificazione a partire da set di dati iniziali piccoli ma ben annotati1,6.

In questo studio, sviluppiamo e dimostriamo un metodo per l'etichettatura standardizzata e automatizzata basato sulla somiglianza con un modello di AI spiegabile (xAI) precedentemente convalidato, utilizzando un approccio basato su atlante derivato dal modello per il quale l'utente può specificare una soglia quantitativa per un risultato desiderato livello di accuratezza (la probabilità di somiglianza o metrica pSim). I valori pSim vanno da una probabilità di somiglianza "di base" (pSim = 0, meno selettiva) a una probabilità di somiglianza "massima" (pSim = 1, più selettiva); pSim viene calcolato confrontando le caratteristiche dell'immagine derivate dal set di test e le caratteristiche dell'immagine recuperate dall'atlante di riferimento del modello (cioè la libreria). Questo atlante derivato dal modello viene costruito durante la costruzione del modello (Fig. 1a) dai casi del set di addestramento (Fig. 1a, b). Il valore pSim calcolato riflette la media armonica tra due parametri relativi al modello, la "somiglianza della patch" e la "confidenza" (Metodi, Fig. 1b, c).

Metodo di etichettatura standardizzato e automatizzato, basato sulla somiglianza con un modello AI (xAI) di rilevamento dei raggi X del torace (CXR) a cinque etichette precedentemente convalidato, utilizzando un approccio basato su atlante derivato dal modello xAI. a Il nostro sistema di intelligenza artificiale spiegabile basato su atlante derivato da un modello quantitativo calcola un valore di probabilità di somiglianza (pSim) per l'etichettatura automatizzata, in base alla media armonica tra la somiglianza del patch e la confidenza. La metrica pSim risultante può essere applicata a un algoritmo di "selezione della modalità", per etichettare le immagini di input esterne su una soglia di confidenza selezionata o avvisare l'utente che il valore pSim scende al di sotto di questa soglia selezionata. b Il metodo basato sull'atlante derivato dal modello calcola la somiglianza e la confidenza del patch, sulla base della mappatura di attivazione della classe (CAM)38,39 e della probabilità prevista dal modello, per ciascuna etichetta di output clinico. c La media armonica tra la somiglianza e la confidenza del patch viene quindi utilizzata per calcolare un pSim per ciascuna etichetta di output clinico nella selezione della modalità.

 = pSim threshold value (PPV, NPV = 1): then/p>

 = pSim threshold value (PPV, NPV = 1): then/p>