Зарегистрироваться

Авторизоваться

забытый пароль

Забыли пароль? Пожалуйста, введите свой адрес электронной почты. Вы получите ссылку и создать новый пароль по электронной почте.

Добавить запись

Вы должны войти в систему, чтобы добавить запись .

Добавить вопрос

Вы должны авторизоваться, чтобы задать вопрос.

Авторизоваться

Зарегистрироваться

Добро пожаловать в Scholarsark.com! Ваша регистрация даст вам доступ к использованию больше возможностей этой платформы. Вы можете задавать вопросы, вносить свой вклад или дать ответы, просматривать профили других пользователей и многих других. Зарегистрироваться!

Криптографический протокол позволяет более тесное сотрудничество в разработке лекарств, нейронная сеть, которая надежно находит потенциальные лекарственные средства могут стимулировать крупномасштабное объединение конфиденциальных данных.

Исследователи MIT разработали криптографическую систему, которая могла бы помочь нейронные сети выявления перспективных кандидатов наркотиков в массовых фармакологических наборах данных, при сохранении приватных данных. Безопасный расчет делается на таком массовом масштабе может обеспечить широкое объединение чувствительных фармакологических данных для обнаружения наркотиков предиктивного.

Наборы данных лекарственно-мишеней взаимодействий (DTI), которые показывают, действуют ли соединения-кандидаты на целевых белков, имеют решающее значение в оказании помощи исследователям разработать новые лекарства. Модели могут быть обучены хруст наборов данных известных ДИИТ, а затем, использование этой информации, найти новых кандидатов наркотиков.

В былые времена, фармацевтические фирмы, университеты, и другие организации стали открыты для аккумулирования фармакологических данных в большие базы данных, которые могут значительно улучшить подготовку этих моделей. В связи с вопросами интеллектуальной собственности и других проблем конфиденциальности, тем не мение, эти наборы данных, по-прежнему ограничен. методы криптографии для защиты данных являются настолько интенсивными вычислениями они хорошо не масштабируются наборы данных за пределами, сказать, десятки тысяч ДИИТ, который является относительно небольшим.

В статье, опубликованной сегодня в Наука, Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) описывать нейронную сеть надежно обучение и тестирование на наборе более миллиона ДИИТ. Сеть использует современные криптографические средства и методы оптимизации, чтобы держать приватным ввода данных, в то время как быстро и эффективно работает в масштабе.

Эксперименты команды показывают, сеть выполняет быстрее и более точно, чем существующие подходы; он может обрабатывать огромные массивы данных в днях, в то время как другие криптографические механизмы бы месяцы. более того, сеть идентифицировала несколько новых взаимодействий, в том числе один между иматиниба лейкоз наркотиков и фермента ErbB4 - мутации, которые были связаны с раком - что может иметь клиническое значение.

«Люди понимают, что они должны объединить свои данные, чтобы значительно ускорить процесс обнаружения наркотиков и позволяют, все вместе, чтобы научные достижения в решении важных заболеваний человека, такие как рак или диабет. Но они не имеют хорошие способы сделать это,»Говорит соответствующий автор Бонни Berger, Саймоновский профессор математики и главный исследователь CSAIL. «С этой работой, мы предлагаем путь эти объекты эффективно объединять и анализировать свои данные в очень больших масштабах «.

Присоединение Бергера на бумаге являются со-первых авторов Брайан ГИЭ и Hyunghoon Cho, оба аспиранта в области электротехники и вычислительной техники и исследователей в подсчетах и ​​биологии группы CSAIL в.

данные «Секрет обмена»

Новый документ опирается на предыдущий Работа исследователями в защите конфиденциальности пациентов в геномных исследованиях, которые находят связи между конкретными генетическими вариантами и заболеваемости. То, что геномные данные потенциально могут раскрыть личную информацию, поэтому пациенты могут не захотеть поступить в исследованиях. В этой работе, Бергер, дать, и бывший Стэнфордский университет Аспирант разработал протокол, основанный на рамках криптографии под названием «секрет обмен,», Которые надежно и эффективно анализирует наборы данных миллиона геномов. По сравнению, существующие предложения могут обрабатывать только несколько тысяч геномов.

Секретный обмен используются в многопартийных вычислениях, где чувствительные данные разделены на отдельные «акции» между несколькими серверами. На протяжении вычислений, каждая сторона всегда будет иметь только свою долю данных, который появляется полностью случайным. коллективно, тем не мение, сервера могут по-прежнему общаться и выполнять полезные операции над подстилающими личными данными. В конце вычислений, когда результат нужен, Стороны объединяют свои акции, чтобы показать результат.

«Мы использовали нашу предыдущую работу в качестве основы для применения секретного обмена к проблеме фармакологического сотрудничества, но он не работает прямо с полки,»Бергер говорит.

Ключевое нововведение было сведение вычисления, необходимое в процессе обучения и тестировании. Существующие модели прогнозирования наркотиков обнаружений представляют собой химические и белковые структуры ДИЯТ в виде графиков или матриц. Эти подходы, тем не мение, масштаб квадратично, или квадрат, с числом ДИИТ в наборе данных. В принципе, обработки этих представлений становится чрезвычайно большим объемом вычислений, как размер набора данных растет. «Несмотря на то, что может быть хорошо для работы с необработанными данными, если вы пытаетесь, что в безопасных вычислениях, это неосуществимо,»Hie говорит.

Исследователи вместо обучения нейронной сети, которая опирается на линейных вычислениях, которые масштабируются гораздо более эффективны с данными. «Мы абсолютно необходимы масштабируемость, потому что мы пытаемся обеспечить способ для объединения данных вместе [в] гораздо большие наборы данных,»Чо говорит.

Исследователи обучили нейронную сеть на игольной наборе данных, у которого есть 1.5 млн ДИИТ, что делает его крупнейшим общедоступным набор данных в своем роде. В обучении, сеть кодирует каждый лекарственное соединение и структуру белка в качестве простого векторного представления. Это по существу конденсируется сложные структуры, как 1 и 0, что компьютер может легко процесс. Из этих векторов, Затем сеть узнает закономерности взаимодействий и noninteractions. Fed новые пары соединений и белковых структур, сеть затем предсказывает, если они будут взаимодействовать.

Сеть также имеет архитектуру, оптимизированную для эффективности и безопасности. Каждый слой нейронной сети требует некоторой функции активации, которая определяет, как отправить информацию к следующему слою. В своей сети, исследователи использовали эффективную функцию активации под названием выпрямленного линейный блок (резюме). Эта функция требует только одного, обеспечить численное сравнение взаимодействия, чтобы определить, следует ли отправить (1) или не посылать (0) данные к следующему слою, в то же время никогда не раскрывая ничего о фактических данных. Эта операция может быть более эффективной в безопасных вычислениях по сравнению с более сложными функциями, так что уменьшает вычислительную нагрузку, обеспечивая при этом конфиденциальность данных.

«Причина того, что важно, что мы хотим сделать это в секретном рамках обмена ... и мы не хотим, чтобы нарастить вычислительную нагрузку,»Бергер говорит. В конце, «Никаких параметров модели не раскрываются, и все входные данные - наркотики, цели, и взаимодействия - являются конфиденциальными «.

Поиск взаимодействия

Исследователи ямки своей сети от нескольких внедренных, простой текст (незашифрованном) модели на части известных ДИЯТ от DrugBank, популярный набор данных, содержащий около 2,000 ДИИТ. В дополнение к поддержанию приватных данных, сеть исследователей превзошла все модели в точности прогнозирования. Только две базовые модели могли бы разумно масштабировать до стежка набора данных, и модель исследователей достигается почти в два раза точность этих моделей.

Исследователи также протестировали наркотики целевых пары без каких-либо перечисленных взаимодействий в STITCH, и нашел несколько клинический установленных взаимодействий лекарственных средств, которые не были перечислены в базе данных, но должна быть. В статье, список исследователей топ самых сильных предсказаний, в том числе: дролоксифен и рецептор эстрогена, которые достигли фазы III клинических испытаний в качестве средства для лечения рака молочной железы; и сеокальцитола и рецептор витамина D для лечения других видов рака. Cho и Hie независимо подтверждены наивысшим тонировка новых взаимодействий через контрактных исследовательских организаций.


Источник:

HTTP://news.mit.edu, Роб Мэтисон

Около мари

Оставьте ответ