سجل الآن

تسجيل دخول

فقدت كلمة المرور

فقدت كلمة المرور الخاصة بك؟ الرجاء إدخال عنوان البريد الإلكتروني الخاص بك. ستتلقى رابطا وستنشئ كلمة مرور جديدة عبر البريد الإلكتروني.

أضف مقالة جديدة

‎يجب تسجيل الدخول لتستطيع أضافة مقالة .

أضف سؤال جديد

يجب عليك تسجيل الدخول لطرح سؤال.

تسجيل دخول

سجل الآن

مرحبا بكم في Scholarsark.com! سوف تسجيلك تمنح لك الوصول إلى استخدام المزيد من الميزات من هذا المنبر. يمكنك طرح الأسئلة, تقديم مساهمات أو تقديم إجابات, عرض لمحات من المستخدمين الآخرين، وغيرها الكثير. سجل الان!

يتيح بروتوكول تشفير مزيد من التعاون في اكتشاف المخدرات, شبكة العصبية أن يرى بشكل آمن الأدوية المحتملة يمكن أن يشجع تجميع واسعة النطاق للبيانات حساسة.

طور باحثون من معهد ماساتشوستس للتكنولوجيا نظام التشفير التي يمكن أن تساعد الشبكات العصبية تحديد المرشحين المخدرات واعدة في مجموعات البيانات الضخمة الدوائية, مع الحفاظ على سرية البيانات. حساب آمن به في هذا نطاق واسع قد يمكن تجميع واسعة من البيانات الدوائية الحساسة لاكتشاف الأدوية التنبؤي.

قواعد البيانات من التفاعلات الهدف المخدرات (DTI), والتي تظهر ما إذا كانت مركبات مرشح تعمل على البروتينات المستهدفة, تعتبر بالغة الأهمية في مساعدة العلماء على تطوير أدوية جديدة. يمكن تدريب نماذج لازمة مجموعات البيانات من الدراسات التشخيصية المعروفة ثم, استخدام تلك المعلومات, عثور على مرشحين المخدرات رواية.

فى السنوات الاخيرة, شركات الأدوية, الجامعات, وأصبحت كيانات أخرى مفتوحة للبيانات الدوائية ذلك تجميع في قواعد البيانات الكبيرة التي يمكن أن تحسن كثيرا من هذه النماذج التدريبية. بسبب قضايا الملكية الفكرية والمخاوف المتعلقة بخصوصية أخرى, ومع ذلك, تبقى هذه المجموعات محدودة النطاق. طرق التشفير لتأمين البيانات حتى مكثفة حسابيا أنها لا مقياس جيد لمجموعات البيانات خارج, قل, عشرات الآلاف من الدراسات التشخيصية, التي هي صغيرة نسبيا.

في ورقة نشرت اليوم في علم, باحثون من مختبر علوم الحاسوب والذكاء الاصطناعي في معهد ماساتشوستس للتكنولوجيا (CSAIL) وصف الشبكة العصبية المدربة بشكل آمن واختبارها على مجموعة بيانات من أكثر من مليون الدراسات التشخيصية. شبكة روافع أدوات التشفير الحديثة وتقنيات التحسين للحفاظ على سرية البيانات المدخلة, في حين تعمل بسرعة وكفاءة على نطاق واسع.

تبين التجارب الفريق الشبكة ينفذ بشكل أسرع وأكثر دقة من النهج القائمة; فإنه يمكن معالجة مجموعات البيانات الضخمة في أيام, في حين الأطر التشفير الأخرى سوف يستغرق شهورا. علاوة على ذلك, حددت الشبكة عدة تفاعلات جديدة, بما في ذلك واحد بين إيماتينب اللوكيميا المخدرات وErbB4 انزيم - الطفرات التي ارتبطت مع سرطان - والتي يمكن أن يكون لها أهمية سريرية.

وقال "الناس يدركون أنهم بحاجة إلى تجميع البيانات الخاصة بهم لتسريع إلى حد كبير عملية اكتشاف المخدرات وتمكيننا, سويا, لجعل التقدم العلمي في حل الأمراض البشرية الهامة, مثل السرطان أو السكري. ولكن ليس لديهم وسائل جيدة للقيام بذلك,"يقول المؤلف المقابلة بوني برغر, أستاذ سيمونز الرياضيات والباحث الرئيسي في CSAIL. "مع هذا العمل, نحن نقدم وسيلة لهذه الكيانات إلى بركة بكفاءة وتحليل البيانات الخاصة بهم على نطاق واسع جدا ".

الانضمام Berger على الورق الذي شارك في أول الكتاب بريان عجل وHyunghoon تشو, كل من طلاب الدراسات العليا في الهندسة الكهربائية وعلوم الحاسوب والباحثين في مجموعة الحساب وعلم الأحياء CSAIL ل.

البيانات "تقاسم السري"

الورقة الجديدة مبنية على السابق عمل من قبل الباحثين في حماية سرية المريض في الدراسات الجينومية, التي تجد الروابط بين معينة المتغيرات الجينية والإصابة بأمراض. يمكن أن بيانات الجينوم يحتمل أن تكشف عن معلومات الشخصية, حتى المرضى يمكن أن يكونوا راغبين في الانخراط في الدراسات. في هذا العمل, بيرغر, منح, وطالب دكتوراه في جامعة ستانفورد السابق وضع بروتوكول تستند إلى إطار التشفير تسمى "تقاسم السري,"الذي آمن وفعال تحليل مجموعات البيانات مليون الجينوم. في المقابل, المقترحات القائمة يمكن التعامل فقط بضعة آلاف من الجينوم.

يستخدم تقاسم السري في حساب التعددية الحزبية, حيث ينقسم إلى بيانات حساسة "سهم" منفصلة بين ملقمات متعددة. طوال حساب, وكل طرف أن يكون دائما فقط حصتها من البيانات, والذي يظهر بشكل عشوائي تماما. جماعي, ومع ذلك, خوادم لا يزال التواصل وتنفيذ عمليات مفيدة على البيانات الخاصة الأساسي. في نهاية حساب, عند الحاجة نتيجة ل, الجمع بين الأطراف أسهمها للكشف عن نتيجة.

"كنا عملنا السابق كأساس لتطبيق تقاسم السري لمشكلة التعاون الدوائي, لكنها لم تنجح الصحيح من على الرف,"يقول بيرغر.

وهناك ابتكار رئيسي والحد من حساب المطلوبة في التدريب والاختبار. تمثل القائمة النماذج التنبؤية اكتشاف المخدرات الهياكل الكيميائية والبروتين من الدراسات التشخيصية في هيئة رسوم بيانية أو المصفوفات. هذه المناهج, ومع ذلك, توسيع نطاق تربيعيا, أو مربع, مع عدد من الدراسات التشخيصية في مجموعة البيانات. في الأساس, معالجة هذه التأكيدات يصبح غاية مكثفة حسابيا ويبلغ حجم مجموعة البيانات ينمو. "على الرغم من أن قد يكون على ما يرام للعمل مع البيانات الخام, إذا حاولت أن في حساب آمن, انها غير عملي,"يقول عجل.

الباحثون بدلا تدريب الشبكة العصبية التي تعتمد على العمليات الحسابية الخطية, الذي تسلق أكثر كفاءة مع البيانات. "قابلية نحن في حاجة على الاطلاق, لأننا نحاول توفير وسيلة لتجميع البيانات معا [إلى] مجموعات البيانات أكبر من ذلك بكثير,"يقول تشو.

وقام الباحثون بتدريب الشبكة العصبية على بيانات غرزة, التي لديها 1.5 مليون الدراسات التشخيصية, مما يجعلها أكبر مجموعة البيانات متاحة للجمهور من نوعه. في التدريب, شبكة بترميز كل مجمع المخدرات وبنية البروتين وتمثيل ناقلات بسيط. هذا يتكثف أساسا هياكل معقدة كما 1S و 0s أن الكمبيوتر يمكن بسهولة عملية. من تلك النواقل, الشبكة ثم يتعلم أنماط من التفاعلات وnoninteractions. بنك الاحتياطي الفيدرالي أزواج جديدة من المركبات والهياكل بروتين, ثم يتوقع الشبكة اذا كانت سوف تتفاعل.

لديه الشبكة أيضا بنية الأمثل لتحقيق الكفاءة والأمن. كل طبقة من الشبكة العصبية تتطلب بعض الوظائف تفعيل يحدد كيفية إرسال المعلومات إلى الطبقة التالية. في شبكتهم, استخدم الباحثون وظيفة تفعيل كفاءة يسمى خطي وحدة تصحيح (سيرة ذاتية). تتطلب هذه الوظيفة فقط واحدة, تأمين المقارنة العددية للتفاعل لتحديد ما اذا كان سيرسل (1) أو لا ترسل (0) البيانات إلى الطبقة التالية, في حين أيضا لم يكشف أي شيء عن البيانات الفعلية. هذه العملية يمكن أن تكون أكثر كفاءة في حساب آمن بالمقارنة مع وظائف أكثر تعقيدا, لذلك يقلل عبء الحسابية مع ضمان خصوصية البيانات.

"والسبب في ذلك هو مهم هو أننا نريد أن نفعل هذا في إطار تقاسم سرية ... ونحن لا نريد لزيادة النفقات العامة الحسابية,"يقول بيرغر. فى النهايه, "وكشف أية معلمات النموذج وجميع البيانات المدخلة - الأدوية, أهداف, والتفاعلات - تظل خاصة. "

العثور على التفاعلات

حرض الباحثون شبكتهم ضد عدة للدولة من بين الفن, نص عادي (غير مشفرة) نماذج على جزء من الدراسات التشخيصية المعروفة من DrugBank, مجموعة بيانات شعبية تحتوي على حوالي 2,000 الدراسات التشخيصية. بالإضافة إلى الحفاظ على سرية البيانات, شبكة الباحثين تفوقت كل من النماذج في دقة التنبؤ. نماذج أساسية اثنين فقط يمكن توسيع نطاق معقول إلى مجموعة البيانات غرزة, ونموذج الباحثين حقق ما يقرب من ضعف دقة تلك النماذج.

واختبر الباحثون أيضا أزواج الهدف المخدرات مع عدم وجود التفاعلات المدرجة في غرزة, وجدت العديد من التفاعلات المخدرات أنشئت سريريا التي لم تكن مدرجة في قاعدة البيانات ولكن يجب أن يكون. في ورقة, قائمة الباحثين أعلى أقوى التوقعات, بما فيها: droloxifene ومستقبلات هرمون الاستروجين, التي وصلت إلى المرحلة الثالثة من التجارب السريرية لعلاج سرطان الثدي; وseocalcitol ومستقبلات فيتامين D لعلاج أنواع أخرى من السرطان. تشو وعجل التحقق من صحتها بشكل مستقل أعلى من المباراة التفاعلات الجديدة عن طريق منظمة البحوث التعاقدية.


مصدر:

HTTP://news.mit.edu, روب ماثيسون

عن ماري

‎إضافة تعليق