Iscriviti ora

Accesso

Password dimenticata

Hai perso la tua password? Inserisci il tuo indirizzo email. Riceverai un link e verrà creata una nuova password via e-mail.

Add postale

Devi effettuare il login per aggiungere post .

Aggiungere domanda

Devi effettuare il login per fare una domanda.

Accesso

Iscriviti ora

Benvenuti a Scholarsark.com! La tua registrazione ti darà accesso a utilizzare più funzionalità di questa piattaforma. È possibile porre domande, contributi o fornire risposte, Guarda i profili di altri utenti e molto altro ancora. Iscriviti ora!

Il protocollo crittografico consente una maggiore collaborazione nella scoperta di farmaci, una rete neurale che trovi in ​​modo sicuro potenziali farmaci potrebbe incoraggiare la condivisione su larga scala di dati sensibili.

I ricercatori del MIT hanno sviluppato un sistema crittografico che potrebbe aiutare le reti neurali a identificare promettenti farmaci candidati in enormi set di dati farmacologici, mantenendo i dati privati. Il calcolo sicuro effettuato su scala così massiccia potrebbe consentire un’ampia condivisione di dati farmacologici sensibili per la scoperta predittiva di farmaci.

Set di dati sulle interazioni farmaco-bersaglio (DTI), che mostrano se i composti candidati agiscono sulle proteine ​​bersaglio, sono fondamentali per aiutare i ricercatori a sviluppare nuovi farmaci. I modelli possono essere addestrati per elaborare set di dati di DTI noti e poi, utilizzando tali informazioni, trovare nuovi farmaci candidati.

Negli ultimi anni, aziende farmaceutiche, università, e altri enti si sono aperti alla raccolta di dati farmacologici in database più grandi che possono migliorare notevolmente la formazione di questi modelli. A causa di questioni di proprietà intellettuale e altri problemi di privacy, tuttavia, questi set di dati rimangono di portata limitata. I metodi di crittografia per proteggere i dati sono così intensivi dal punto di vista computazionale che non si adattano bene ai set di dati successivi, dire, decine di migliaia di DTI, che è relativamente piccolo.

In un articolo pubblicato oggi in Scienza, ricercatori del Laboratorio di informatica e intelligenza artificiale del MIT (CSAIL) descrivere una rete neurale addestrata e testata in modo sicuro su un set di dati di oltre un milione di DTI. La rete sfrutta moderni strumenti crittografici e tecniche di ottimizzazione per mantenere privati ​​i dati di input, mentre si esegue in modo rapido ed efficiente su larga scala.

Gli esperimenti del team mostrano che la rete funziona più velocemente e con maggiore precisione rispetto agli approcci esistenti; può elaborare enormi set di dati in pochi giorni, mentre altri framework crittografici richiederebbero mesi. inoltre, la rete ha identificato diverse nuove interazioni, compreso uno tra il farmaco contro la leucemia imatinib e un enzima ErbB4 – le cui mutazioni sono state associate al cancro – che potrebbe avere un significato clinico.

“Le persone si rendono conto che devono mettere in comune i propri dati per accelerare notevolmente il processo di scoperta dei farmaci e consentirci, insieme, compiere progressi scientifici nella soluzione di importanti malattie umane, come il cancro o il diabete. Ma non hanno buoni modi per farlo,", afferma l'autrice corrispondente Bonnie Berger, il professore di matematica Simons e ricercatore principale presso CSAIL. “Con questo lavoro, forniamo a queste entità un modo per raggruppare e analizzare in modo efficiente i propri dati su scala molto ampia”.

Insieme a Berger nell'articolo ci sono i co-primi autori Brian Hie e Hyunghoon Cho, sia studenti laureati in Ingegneria Elettrica e Informatica che ricercatori del gruppo di Calcolo e Biologia dello CSAIL.

Dati di “condivisione segreta”.

Il nuovo documento si basa sul precedente opera dai ricercatori nel proteggere la riservatezza dei pazienti negli studi genomici, che trovano collegamenti tra particolari varianti genetiche e incidenza della malattia. Tali dati genomici potrebbero potenzialmente rivelare informazioni personali, quindi i pazienti possono essere riluttanti ad arruolarsi negli studi. In quel lavoro, Berger, Dare, e un ex studente di dottorato della Stanford University hanno sviluppato un protocollo basato su un framework di crittografia chiamato “condivisione segreta”.," che analizza in modo sicuro ed efficiente set di dati di un milione di genomi. In contrasto, le proposte esistenti potrebbero gestire solo poche migliaia di genomi.

La condivisione segreta viene utilizzata nel calcolo multipartitico, dove i dati sensibili sono divisi in “condivisioni” separate tra più server. Durante il calcolo, ciascuna parte avrà sempre e solo la sua parte di dati, che appare del tutto casuale. Collettivamente, tuttavia, i server possono ancora comunicare ed eseguire operazioni utili sui dati privati ​​sottostanti. Alla fine del calcolo, quando è necessario un risultato, le parti combinano le loro azioni per rivelare il risultato.

“Abbiamo utilizzato il nostro lavoro precedente come base per applicare la condivisione segreta al problema della collaborazione farmacologica, ma non ha funzionato subito,", dice Berger.

Un'innovazione chiave è stata la riduzione dei calcoli necessari durante la formazione e i test. I modelli predittivi di scoperta di farmaci esistenti rappresentano le strutture chimiche e proteiche dei DTI come grafici o matrici. Questi approcci, tuttavia, scala quadratica, o quadrato, con il numero di DTI nel set di dati. Fondamentalmente, l'elaborazione di queste rappresentazioni diventa estremamente intensiva dal punto di vista computazionale man mano che la dimensione del set di dati cresce. “Anche se può andare bene per lavorare con i dati grezzi, se lo provi nel calcolo sicuro, è irrealizzabile," Hie dice.

I ricercatori hanno invece addestrato una rete neurale che si basa su calcoli lineari, che si adattano in modo molto più efficiente con i dati. “Avevamo assolutamente bisogno di scalabilità, perché stiamo cercando di fornire un modo per mettere insieme i dati [in] set di dati molto più grandi,"dice Cho.

I ricercatori hanno addestrato una rete neurale sul set di dati STITCH, che ha 1.5 milioni di DTI, rendendolo il più grande set di dati disponibile al pubblico nel suo genere. In allenamento, la rete codifica ciascun composto farmaceutico e struttura proteica come una semplice rappresentazione vettoriale. Ciò essenzialmente condensa le strutture complicate come 1 e 0 che un computer può facilmente elaborare. Da quei vettori, la rete quindi apprende i modelli di interazioni e non interazioni. Alimentato nuove coppie di composti e strutture proteiche, la rete quindi prevede se interagiranno.

La rete ha anche un'architettura ottimizzata per efficienza e sicurezza. Ogni strato di una rete neurale richiede una funzione di attivazione che determina come inviare le informazioni allo strato successivo. Nella loro rete, i ricercatori hanno utilizzato un’efficiente funzione di attivazione chiamata unità lineare rettificata (riprendere). Questa funzione richiede solo un singolo, confronto numerico sicuro di un'interazione per determinare se inviare (1) o non inviare (0) i dati al livello successivo, senza mai rivelare nulla sui dati reali. Questa operazione può essere più efficiente nel calcolo sicuro rispetto a funzioni più complesse, quindi riduce il carico computazionale garantendo al tempo stesso la privacy dei dati.

“La ragione importante è che vogliamo farlo all’interno del quadro di condivisione segreta… e non vogliamo aumentare il sovraccarico computazionale,", dice Berger. Alla fine, «nessun parametro del modello viene rivelato e tutti i dati di input sono i farmaci, obiettivi, e le interazioni - sono mantenute private.

Trovare interazioni

I ricercatori hanno confrontato la loro rete con diversi prodotti all'avanguardia, testo in chiaro (non crittografato) modelli su una porzione di DTI noti di DrugBank, un set di dati popolare contenente circa 2,000 DTI. Oltre a mantenere i dati privati, la rete dei ricercatori ha sovraperformato tutti i modelli in termini di accuratezza della previsione. Solo due modelli di base potrebbero ragionevolmente adattarsi al set di dati STITCH, e il modello dei ricercatori ha raggiunto quasi il doppio della precisione di tali modelli.

I ricercatori hanno anche testato coppie farmaco-bersaglio senza interazioni elencate nello STITCH, e ho trovato diverse interazioni farmacologiche clinicamente accertate che non erano elencate nel database ma che dovrebbero esserlo. Nel giornale, i ricercatori elencano le previsioni più forti, Compreso: droloxifene e un recettore per gli estrogeni, che ha raggiunto studi clinici di fase III come trattamento per il cancro al seno; e seocalcitolo e un recettore della vitamina D per trattare altri tumori. Cho e Hie hanno convalidato in modo indipendente le nuove interazioni con il punteggio più alto tramite organizzazioni di ricerca a contratto.


fonte:

http://news.mit.edu, di Rob Matheson

Autore

Di Marie

Lascia un commento