Se stesso

Notizia

CasaCasa / Notizia / Se stesso

Nov 14, 2023

Se stesso

Communications Biology volume

Biologia delle comunicazioni volume 5, numero articolo: 1162 (2022) Citare questo articolo

3397 accessi

1 Citazioni

7 Altmetrico

Dettagli sulle metriche

La segmentazione di singole cellule è un processo necessario per estrarre dati quantitativi da immagini di microscopia biologica. L'ultimo decennio ha visto l'avvento dei metodi di machine learning (ML) per facilitare questo processo, la stragrande maggioranza dei quali rientra nell'apprendimento supervisionato (SL) che richiede vaste librerie di etichette pre-elaborate e annotate da utenti per addestrare gli algoritmi ML. . Tale pre-elaborazione SL richiede molta manodopera, può introdurre errori, varia a seconda degli utenti finali e deve ancora essere dimostrata capace di modelli robusti da utilizzare efficacemente in tutta la più ampia comunità di biologia cellulare. Qui, per risolvere questo problema di pre-elaborazione, offriamo un approccio di apprendimento autosupervisionato (SSL) che utilizza il movimento cellulare tra immagini consecutive per autoaddestrare un classificatore ML, consentendo la segmentazione di celle e sfondo senza la necessità di parametri regolabili o immagini curate . Sfruttando il movimento, otteniamo una segmentazione accurata che si addestra direttamente sui dati dell'utente finale, è indipendente dalla modalità ottica, supera i metodi SL contemporanei e lo fa in modo completamente automatizzato, eliminando così la variabilità e i pregiudizi dell'utente finale. Per quanto ne sappiamo, questo algoritmo SSL rappresenta un primo sforzo nel suo genere e presenta caratteristiche interessanti che lo rendono un candidato ideale come strumento di segmentazione per la più ampia comunità di ricerca sulla biologia cellulare.

Le informazioni memorizzate nelle immagini al microscopio di cellule vive in time-lapse sono di fondamentale importanza per la biologia cellulare. In particolare, le colture e gli esperimenti cellulari bidimensionali (2D) sono diffusi sia nella ricerca accademica che industriale, nei processi normativi e nelle condutture commerciali. Pertanto, esiste una necessità consolidata di strumenti di analisi quantitativa delle bioimmagini, spesso sotto forma di segmentazione cellulare. Negli ultimi dieci anni, l’apprendimento automatico è emerso come un potente metodo per la segmentazione cellulare1,2,3. L'apprendimento automatico offre un framework, l'apprendimento supervisionato (SL), che combina i dati con etichette annotate da persone per formare un modello di classificazione per identificare le caratteristiche di interesse. In particolare, negli ultimi anni le reti neurali artificiali (ANN) sono state una tecnica SL popolare nell'analisi di bioimmagini, poiché in genere superano le prestazioni delle pipeline di elaborazione delle immagini standard3,4.

Uno dei principali svantaggi dell’apprendimento automatico è che è affamato di dati. In particolare, le ANN richiedono in genere un’enorme quantità di dati etichettati per ottenere buone prestazioni su set di dati complessi, in una fase generalmente definita pre-elaborazione dei dati. Ad esempio, le librerie standard di formazione sulla visione artificiale come COCO di Microsoft contengono oltre 1 milione di oggetti etichetta per addestrare adeguatamente le ANN5. Il problema con questo approccio è che le immagini nella biologia cellulare sono incredibilmente diverse rispetto alle immagini tipiche dei problemi di visione artificiale legati a Internet (ad esempio il riconoscimento degli animali). Di conseguenza, ci sono numerosi sforzi su larga scala per creare librerie di formazione sempre più grandi per rispondere a questa esigenza, come le librerie EVICAN6 (26.000 oggetti etichettati), CellPose7 (70.000 oggetti etichettati), recentemente curate, e LIVEcell8 (1,6 milioni di oggetti etichettati), in spera di ottenere modelli robusti che possano essere semplicemente utilizzati dalla più ampia comunità di ricerca sulla biologia cellulare. Tuttavia, alla base di tutti gli SL, comprese le ANN, c’è il fatto che i modelli funzioneranno in modo affidabile solo su dati simili a quelli utilizzati durante l’addestramento9. Questo approccio da "grande biblioteca" non può competere con l'ampiezza dei tipi di cellule, delle modalità ottiche, delle configurazioni del microscopio, degli ambienti extracellulari 2D e 3D e delle condizioni sperimentali personalizzate che incorporano la microscopia cellulare, tutti in continua evoluzione. Il motto comune nell'apprendimento automatico, "in caso di dubbio, riqualificare", è una chiara testimonianza di questo fatto, ma l'addestramento dei modelli è tutt'altro che banale e un compito notoriamente ad alta intensità di lavoro10, spesso a spese dell'utente finale.