Registrar agora

Entrar

Senha perdida

Perdeu sua senha? Por favor, indique o seu endereço de e-mail. Você receberá um link e vai criar uma nova senha via e-mail.

Adicionar pós

Você deve entrar para adicionar pós .

Adicionar pergunta

Você deve fazer login para fazer uma pergunta.

Entrar

Registrar agora

Bem-vindo ao Scholarsark.com! O seu registo irá conceder-lhe o acesso ao uso de mais recursos desta plataforma. Você pode fazer perguntas, fazer contribuições ou fornecer respostas, ver perfis de outros usuários e muito mais. Registrar agora!

protocolo criptográfico permite uma maior colaboração na descoberta de medicamentos, Uma rede neural que encontra firmemente potenciais drogas poderia incentivar pooling em larga escala de dados sensíveis.

pesquisadores do MIT desenvolveram um sistema criptográfico que poderia ajudar a redes neurais identificar medicamentos candidatos promissores em conjuntos de dados farmacológicos maciças, mantendo a dados privados. Seguro cálculo feito a uma escala tão maciça poderia permitir uma ampla partilha de dados farmacológicos sensíveis para a descoberta de medicamentos preditivo.

Os conjuntos de dados de interacções fármaco-alvo (DTI), que mostra se os compostos candidatos actuar sobre proteínas alvo, são fundamentais para ajudar os pesquisadores a desenvolver novos medicamentos. Os modelos podem ser treinados para triturar conjuntos de dados de conhecidos IDT e, em seguida,, usar essas informações, encontrar novos candidatos de droga.

Nos últimos anos, empresas farmacêuticas, universidades, e outras entidades tornaram-se aberto a dados farmacológicos agrupamento em bancos de dados maiores que podem melhorar muito a formação destes modelos. Devido a questões de propriedade intelectual e outras questões de privacidade, Contudo, estes conjuntos de dados continuam a ser limitados no seu âmbito. métodos de criptografia para proteger os dados são tão computacionalmente intensivas eles não escala bem para conjuntos de dados para além, dizer, dezenas de milhares de DTIs, que é relativamente pequeno.

Em artigo publicado hoje na Ciência, pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) descreve uma rede neural treinada e testada com segurança em um conjunto de dados de mais de um milhão de DTIs. A rede utiliza ferramentas criptográficas modernas e técnicas de otimização para manter os dados de entrada privados, durante a execução rápida e eficiente em escala.

Os experimentos da equipe mostram que a rede funciona com mais rapidez e precisão do que as abordagens existentes; ele pode processar grandes conjuntos de dados em dias, Considerando que outras estruturas criptográficas levariam meses. Além disso, a rede identificou várias novas interações, incluindo um entre o medicamento para leucemia imatinib e uma enzima ErbB4 - cujas mutações foram associadas ao câncer - que podem ter significado clínico.

“As pessoas percebem que precisam reunir seus dados para acelerar bastante o processo de descoberta de medicamentos e nos permitir, juntos, para fazer avanços científicos na resolução de importantes doenças humanas, como câncer ou diabetes. Mas eles não têm boas maneiras de fazer isso,” diz o autor correspondente Bonnie Berger, o Simons Professor of Mathematics e um investigador principal no CSAIL. “Com este trabalho, nós fornecemos uma maneira para essas entidades agruparem e analisarem seus dados de forma eficiente em uma escala muito grande.”

Juntando-se a Berger no papel estão os co-primeiros autores Brian Hie e Hyunghoon Cho, alunos de pós-graduação em engenharia elétrica e ciência da computação e pesquisadores do grupo de Computação e Biologia do CSAIL.

Dados de “compartilhamento secreto”

O novo artigo se baseia em anteriores trabalhos pelos pesquisadores na proteção da confidencialidade do paciente em estudos genômicos, que encontram ligações entre variantes genéticas particulares e a incidência de doenças. Esses dados genômicos podem potencialmente revelar informações pessoais, para que os pacientes possam relutar em se inscrever nos estudos. nesse trabalho, Berger, Dar, e um ex-aluno de doutorado da Universidade de Stanford desenvolveu um protocolo baseado em uma estrutura de criptografia chamada “compartilhamento secreto,” que analisa com segurança e eficiência conjuntos de dados de um milhão de genomas. Em contraste, propostas existentes poderiam lidar com apenas alguns milhares de genomas.

O compartilhamento secreto é usado na computação multipartidária, onde dados confidenciais são divididos em "compartilhamentos" separados entre vários servidores. Ao longo da computação, cada parte sempre terá apenas sua parte dos dados, que parece totalmente aleatório. Coletivamente, Contudo, os servidores ainda podem se comunicar e realizar operações úteis nos dados privados subjacentes. No final do cálculo, quando um resultado é necessário, as partes combinam suas ações para revelar o resultado.

“Usamos nosso trabalho anterior como base para aplicar o compartilhamento de segredos ao problema da colaboração farmacológica., mas não funcionou imediatamente,” Berger diz.

Uma inovação importante foi reduzir a computação necessária em treinamento e teste. Os modelos existentes de descoberta de medicamentos preditivos representam as estruturas químicas e proteicas dos DTIs como gráficos ou matrizes. Essas abordagens, Contudo, escalar quadraticamente, ou quadrado, com o número de DTIs no conjunto de dados. Basicamente, o processamento dessas representações torna-se extremamente intensivo computacionalmente à medida que o tamanho do conjunto de dados aumenta. “Embora isso possa ser bom para trabalhar com os dados brutos, se você tentar isso em computação segura, é inviável,” Hie diz.

Em vez disso, os pesquisadores treinaram uma rede neural que se baseia em cálculos lineares, que escalam com muito mais eficiência com os dados. “Precisávamos absolutamente de escalabilidade, porque estamos tentando fornecer uma maneira de agrupar dados [em] conjuntos de dados muito maiores,”Cho diz.

Os pesquisadores treinaram uma rede neural no conjunto de dados STITCH, que tem 1.5 milhões de DTIs, tornando-o o maior conjunto de dados publicamente disponível de seu tipo. Em treinamento, a rede codifica cada composto de droga e estrutura de proteína como uma representação vetorial simples. Isso essencialmente condensa as estruturas complicadas como 1s e 0s que um computador pode processar facilmente. A partir desses vetores, a rede então aprende os padrões de interações e não-interações. Alimentados com novos pares de compostos e estruturas de proteínas, a rede então prevê se eles vão interagir.

A rede também possui uma arquitetura otimizada para eficiência e segurança. Cada camada de uma rede neural requer alguma função de ativação que determina como enviar as informações para a próxima camada. Na rede deles, os pesquisadores usaram uma função de ativação eficiente chamada de unidade linear retificada (retomar). Esta função requer apenas um único, comparação numérica segura de uma interação para determinar se deve enviar (1) ou não enviar (0) os dados para a próxima camada, enquanto também nunca revela nada sobre os dados reais. Esta operação pode ser mais eficiente em computação segura em comparação com funções mais complexas, por isso reduz a carga computacional, garantindo a privacidade dos dados.

“A razão pela qual isso é importante é que queremos fazer isso dentro da estrutura de compartilhamento secreto… e não queremos aumentar a sobrecarga computacional,” Berger diz. No final, “nenhum parâmetro do modelo é revelado e todos os dados de entrada - as drogas, alvos, e interações – são mantidas em sigilo.”

Encontrando interações

Os pesquisadores confrontaram sua rede com várias tecnologias de ponta, texto simples (não criptografado) modelos em uma porção de DTIs conhecidos do DrugBank, um conjunto de dados popular contendo cerca de 2,000 DTIs. Além de manter os dados privados, a rede dos pesquisadores superou todos os modelos em precisão de previsão. Apenas dois modelos de linha de base poderiam ser dimensionados razoavelmente para o conjunto de dados STITCH, e o modelo dos pesquisadores alcançou quase o dobro da precisão desses modelos.

Os pesquisadores também testaram pares de drogas-alvo sem interações listadas no STITCH, e encontraram várias interações medicamentosas clinicamente estabelecidas que não estavam listadas no banco de dados, mas deveriam ser. No papel, os pesquisadores listam as principais previsões mais fortes, Incluindo: droloxifeno e um receptor de estrogénio, que atingiu fase III de ensaios clínicos como um tratamento para o cancro da mama; e seocalcitol e de um receptor de vitamina D para o tratamento de outros cancros. Cho e Hie validados de forma independente os de maior pontuação novas interações via organizações de pesquisa contratadas.


Fonte:

http://news.mit.edu, por Rob Matheson

Autor

Sobre Marie

Deixe uma resposta