Utilizzo dell'apprendimento automatico per migliorare la valutazione della tossicità delle sostanze chimiche

Notizia

CasaCasa / Notizia / Utilizzo dell'apprendimento automatico per migliorare la valutazione della tossicità delle sostanze chimiche

Jan 28, 2024

Utilizzo dell'apprendimento automatico per migliorare la valutazione della tossicità delle sostanze chimiche

Researchers of the University of Amsterdam, together with colleagues at the

I ricercatori dell’Università di Amsterdam, insieme ai colleghi dell’Università del Queensland e dell’Istituto norvegese per la ricerca sull’acqua, hanno sviluppato una strategia per valutare la tossicità delle sostanze chimiche utilizzando l’apprendimento automatico.Presentano il loro approccio in un articolo in Scienze e tecnologie ambientali per il numero speciale "Data Science for Advancing Environmental Science, Engineering, and Technology". I modelli sviluppati in questo studio possono portare a miglioramenti sostanziali rispetto alle tradizionali valutazioni in silico basate sulla modellazione quantitativa struttura-attività (QSAR).

Secondo i ricercatori, l’uso dell’apprendimento automatico può migliorare notevolmente la valutazione del rischio delle molecole, sia nello sviluppo sicuro fin dalla progettazione di nuove sostanze chimiche sia nella valutazione delle sostanze chimiche esistenti. L’importanza di quest’ultimo è illustrata dal fatto che le agenzie chimiche europee e statunitensi hanno elencato circa 800.000 sostanze chimiche che sono state sviluppate nel corso degli anni ma di cui c’è poca o nessuna conoscenza sul destino ambientale o sulla tossicità.

Poiché una valutazione sperimentale del destino e della tossicità delle sostanze chimiche richiede molto tempo, impegno e risorse, gli approcci di modellizzazione sono già utilizzati per prevedere gli indicatori di pericolo. In particolare viene spesso applicata la modellazione Quantitative Structure-Activity Relationship (QSAR), che mette in relazione caratteristiche molecolari come la disposizione atomica e la struttura 3D con proprietà fisico-chimiche e attività biologica. Sulla base dei risultati della modellazione (o dei dati misurati, ove disponibili), gli esperti classificano una molecola in categorie come definito ad esempio nel Sistema globale armonizzato di classificazione ed etichettatura delle sostanze chimiche (GHS). Per categorie specifiche, le molecole vengono poi sottoposte a ulteriori ricerche, a un monitoraggio più attivo e infine alla legislazione.

Tuttavia, questo processo presenta degli inconvenienti intrinseci, molti dei quali possono essere ricondotti ai limiti dei modelli QSAR. Si basano spesso su insiemi di formazione molto omogenei e presuppongono una relazione lineare struttura-attività per effettuare estrapolazioni. Di conseguenza, molte sostanze chimiche non sono ben rappresentate dai modelli QSAR esistenti e il loro utilizzo può potenzialmente portare a sostanziali errori di previsione e ad errata classificazione delle sostanze chimiche.

Nell’articolo pubblicato su Environmental Science & Technology, il dottor Saer Samanipour e i coautori propongono una strategia di valutazione alternativa che salta del tutto la fase di previsione QSAR. Samanipour, scienziato analitico ambientale presso l'Istituto di scienze molecolari Van 't Hoff dell'Università di Amsterdam, ha collaborato con la dott.ssa Antonia Praetorius, chimica ambientale presso l'Istituto per la biodiversità e la dinamica degli ecosistemi della stessa università. Insieme ai colleghi dell’Università del Queensland e dell’Istituto norvegese per la ricerca sull’acqua, hanno sviluppato una strategia basata sull’apprendimento automatico per la classificazione diretta della tossicità acquatica acuta delle sostanze chimiche sulla base di descrittori molecolari.

Il modello è stato sviluppato e testato tramite 907 dati ottenuti sperimentalmente per la tossicità acuta dei pesci (valori LC50 a 96 ore). Il nuovo modello salta la previsione esplicita di un valore di tossicità (96 ore LC50) per ciascuna sostanza chimica, ma classifica direttamente ciascuna sostanza chimica in una serie di categorie di tossicità predefinite. Queste categorie possono ad esempio essere definite da regolamenti specifici o sistemi di standardizzazione, come dimostrato nell'articolo con le categorie GHS per il pericolo acquatico acuto. Il modello spiegava circa il 90% della varianza nei dati utilizzati nel set di addestramento e circa l'80% per i dati del set di test.

Questa strategia di classificazione diretta ha comportato una diminuzione di cinque volte nella categorizzazione errata rispetto a una strategia basata su un modello di regressione QSAR. Successivamente, i ricercatori hanno ampliato la loro strategia per prevedere le categorie di tossicità di un ampio insieme di 32.000 sostanze chimiche.

Dimostrano che il loro approccio di classificazione diretta si traduce in previsioni di maggiore precisione perché set di dati sperimentali provenienti da diverse fonti e per diverse famiglie chimiche possono essere raggruppati per generare set di addestramento più ampi. Può essere adattato a diverse categorie predefinite come prescritto da varie normative internazionali e sistemi di classificazione o etichettatura. In futuro, l'approccio di classificazione diretta può essere esteso anche ad altre categorie di pericolo (ad esempio, tossicità cronica) nonché al destino ambientale (ad esempio, mobilità o persistenza) e mostra un grande potenziale per migliorare gli strumenti in silico per i pericoli e i rischi chimici. valutazione.