الآلات التي تعلم أكثر من لغة مثل الاطفال تفعل: نموذج حاسوبي يمكن أن تحسن التفاعل بين الإنسان والآلة, توفير نظرة ثاقبة كيف يتعلم الأطفال اللغة.
الأطفال يتعلمون اللغة من خلال مراقبة بيئتهم, الاستماع إلى الناس من حولهم, والربط بين النقاط بين ما يرونه ويسمعونه. ضمن أشياء أخرى, هذا يساعد الأطفال على وضع ترتيب الكلمات لغتهم ل, مثل حيث المواضيع والأفعال تندرج في الجملة. في الحوسبة, تعلم اللغة هو مهمة موزعي النحوي والدلالي. ويتم تدريب هذه الأنظمة على الأحكام المشروح من قبل البشر التي تصف بنية ومعنى وراء الكلمات. أصبحت موزعي أهمية متزايدة لعمليات البحث على شبكة الإنترنت, الاستعلام عن قاعدة بيانات اللغة الطبيعية, ونظم التعرف على الصوت مثل اليكسا وسيري. هكذا, أنها يمكن أن تستخدم أيضا لالروبوتات المنزلية.
طور باحثون من معهد ماساتشوستس للتكنولوجيا "محلل الدلالي" أن يتعلم من خلال الملاحظة لمحاكاة عن كثب عملية لغة اكتساب الطفل, والتي قد تمتد إلى حد كبير قدرات الحوسبة ل.
صورة فوتوغرافية: MIT أخبار
ولكن جمع البيانات الشرح يمكن أن يكون وقتا طويلا وصعبا للغات أقل شيوعا. بالإضافة إلى, البشر لا يتفقون دائما على شروح, وشروح أنفسهم قد لا تعكس بدقة كيف يتحدث الناس بشكل طبيعي.
في ورقة يجري عرضها في طرق تطبيقية هذا الأسبوع في مؤتمر معالجة اللغات الطبيعية, وصف الباحثون MIT محلل أن يتعلم من خلال الملاحظة لمحاكاة عن كثب عملية لغة اكتساب الطفل, والتي يمكن أن توسع قدرات المحلل اللغوي بشكل كبير. لمعرفة بنية اللغة, محلل يلاحظ الفيديو علق, مع أي معلومات أخرى, وتربط الكلمات مع الأشياء والأعمال المسجلة. حكم عليه بالسجن جديدة, يمكن للمحلل ثم استخدام ما تعلمه عن بنية اللغة على التنبؤ بدقة معنى الجملة ل, دون الفيديو.
هذا النهج "أشرف ضعيف" - وهذا يعني أنه يتطلب بيانات التدريب محدود - يقلد كيف يمكن للأطفال مراقبة العالم من حولهم وتعلم اللغة, دون أن توفير السياق المباشر. النهج يمكن أن يتوسع أنواع البيانات وتقليل الجهد اللازم لموزعي التدريب, وفقا للباحثين. وبعض الجمل المشروح مباشرة, على سبيل المثال, يمكن جنبا إلى جنب مع العديد من أشرطة الفيديو في العنوان, والتي هي أسهل أن يأتي من قبل, لتحسين الأداء.
فى المستقبل, يمكن استخدام محلل لتحسين التفاعل الطبيعي بين البشر والروبوتات الشخصية. والروبوت مجهز محلل, على سبيل المثال, يمكن أن نلاحظ باستمرار بيئتها لتعزيز فهمها للالأوامر المنطوقة, بما في ذلك عندما الجمل المنطوقة ليست النحوية بشكل كامل أو واضحة. "الناس يتحدثون إلى بعضهم البعض في جمل جزئية, تشغيل على الأفكار, واللغة الملتبسة. كنت ترغب في الروبوت في منزلك التي سوف التكيف مع طريقة خاصة بهم للتحدث ... ومازال معرفة ما تعنيه,"يقول المؤلف المشارك اندريه باربو, باحث في مختبر العلوم والحاسوب الاصطناعي الذكاء (CSAIL) ومركز المخ, العقول, والآلات (CBMM) في معهد ماكغفرن معهد ماساتشوستس للتكنولوجيا.
يمكن للمحلل أن يساعد الباحثين على فهم أفضل لكيفية تعلم الأطفال اللغة. "طفل لديه حق الوصول إلى زائدة عن الحاجة, معلومات تكميلية من طرائق مختلفة, بما في ذلك الآباء السمع والأشقاء نتحدث عن العالم, فضلا عن المعلومات عن طريق اللمس والمعلومات البصرية, [التي تساعد له أو لها] لفهم العالم,"يقول المؤلف المشارك بوريس كاتس, عالم أبحاث رئيسي ورئيس المجموعة InfoLab في CSAIL. واضاف "انها لغز مدهش, لمعالجة كافة هذه المدخلات الحسية في وقت واحد. هذا العمل هو جزء من قطعة أكبر لفهم كيفية حدوث هذا النوع من التعلم في العالم ".
شارك في الكتاب على ورقة هي: أول مؤلف كانديس روس, طالب دراسات عليا في قسم الهندسة الكهربائية وعلوم الحاسوب وCSAIL, والباحث في CBMM; يفغيني Berzak الدكتوراه '17, ومرحلة ما بعد الدكتوراه في المجموعة الحاسوبية علم اللغة النفسي في قسم المخ والعلوم المعرفية; وCSAIL طالب دراسات عليا باتوشيغ ميانغانبايار.
متعلم بصري
لعملهم, الجمع بين الباحثين محلل الدلالي مع مكونات الكمبيوتر الرؤية تدريب في وجوه, بشري, والاعتراف النشاط في الفيديو. ويتم تدريب موزعي الدلالي عموما على جمل المشروح مع التعليمات البرمجية التي ينسب هذا يعني أن كل كلمة والعلاقات بين الكلمات. تم تدريب بعض على الصور الثابتة أو المحاكاة الحاسوبية.
محلل الجديد هو الأول للتدريب باستخدام الفيديو, يقول روس. في جزء, أشرطة الفيديو هي أكثر فائدة في الحد من الغموض. إذا محلل هو متأكد من, قل, إجراء أو كائن في الجملة, فإنه يمكن الرجوع إلى الفيديو لتوضيح الامور. وقال "هناك عناصر الزمانية - أدوات تتفاعل مع بعضها البعض ومع الناس - وخصائص رفيع المستوى لن تشاهد في صورة ثابتة أو فقط في اللغة,"يقول روس.
الباحثون بتجميع بيانات من حوالي 400 أشرطة الفيديو التي تصور الناس تنفيذ عدد من الإجراءات, بما في ذلك التقاط كائن أو وضعه أسفل, والمشي نحو كائن. قدم المشاركون على منصة التعهيد الجماعي الترك الميكانيكية ثم 1,200 تعليق لأولئك أشرطة الفيديو. وضعوا جانبا 840 أمثلة توضيحية فيديو للتدريب وضبط, وتستخدم 360 للاختبار. ومن مزايا استخدام الرؤية القائمة على التوزيع هي "لا تحتاج بيانات ما يقرب من قدر - ولكن إذا كان لديك [البيانات], هل يمكن رفع مستوى لمجموعات البيانات الضخمة,"يقول باربو.
في التدريب, وقدم الباحثون محلل الهدف من تحديد ما إذا كان الحكم يصف بدقة شريط فيديو معين. أنها تتغذى محلل فيديو ومطابقة التعليق. محلل مقتطفات من المعاني المحتملة للشرح كما التعبيرات الرياضية المنطقية. الجملة, "المرأة هو التقاط تفاحة," على سبيل المثال, ويمكن التعبير عنها: λxy. امرأة س,امسك س و, تفاحة و.
وإدخالها تلك التعبيرات والفيديو إلى خوارزمية الكمبيوتر الرؤية, ودعا "المقتفي الجملة,"التي وضعتها باربو وغيرهم من الباحثين. تبدو الخوارزمية في كل إطار فيديو لتتبع كيف الأشياء والناس تتحول مع مرور الوقت, لتحديد ما إذا يلعبون الإجراءات خارج كما هو موضح. في هذا الطريق, أنه يحدد إذا كان المعنى هو ربما ينطبق على الفيديو.
توصيل النقاط
التعبير مع تمثيل مطابقة بشكل وثيق للكائنات, البشر, والإجراءات يصبح معنى الأرجح التسمية التوضيحية. التعبير, في البداية, قد تشير إلى العديد من الأشياء وإجراءات مختلفة في الفيديو, ولكن مجموعة من المعاني الممكنة بمثابة إشارة التدريب التي تساعد محلل غربلة باستمرار أسفل الاحتمالات. "بافتراض أن كل الجمل يجب أن تتبع نفس القواعد, وأنهم جميعا من نفس اللغة, ويرى العديد من أشرطة الفيديو في العنوان, يمكنك تضييق معاني مزيد,"يقول باربو.
بالمختصر, محلل يتعلم من خلال الملاحظة السلبية: لتحديد ما إذا كان شرح صحيح من شريط فيديو, محلل بحكم الضرورة ويجب تحديد أعلى احتمال معنى التسمية التوضيحية. "الطريقة الوحيدة لمعرفة إذا كانت العقوبة هي الحقيقية للفيديو [هو] للذهاب من خلال هذه الخطوة المتوسطة من, "ماذا تعني الجملة?' غير ذلك, لديك أي فكرة عن كيفية ربط اثنين,"ويوضح باربو. "نحن لا نعطي النظام معنى للجملة. نحن نقول, "هناك حكما والفيديو. الجملة يجب أن يكون صحيحا من الفيديو. معرفة بعض التمثيل الوسيط الذي يجعل هذا صحيح من شريط الفيديو. "
تدريب تنتج القواعد النحوية والدلالية للكلمات وعلم أنه. حكم عليه بالسجن جديدة, محلل لم يعد يتطلب أشرطة الفيديو, ولكن تعزز قواعدها ومعجم لتحديد بنية الجملة والمعنى.
في النهاية, هذه العملية هي تعلم "كما لو كنت طفلا,"يقول باربو. "أنت ترى العالم من حولك وتسمع الناس يتحدثون لمعرفة معنى. يوما ما, وأستطيع أن أعطي لكم الجملة و نسأل ما يعنيه و, حتى بدون وجود البصرية, هل تعرف معنى ".
"هذا البحث هو بالضبط الاتجاه الصحيح لمعالجة اللغة الطبيعية,"تقول ستيفاني Tellex, أستاذ علوم الكمبيوتر في جامعة براون ويركز على مساعدة الروبوتات على استخدام اللغة الطبيعية للتواصل مع البشر. "لتفسير لغة الارض, نحتاج التمثيل الدلالي, ولكنه ليس عمليا لجعلها متاحة في وقت التدريب. في حين أن, هذا العمل يجسد التمثيل الهيكل التركيبي باستخدام السياق من أشرطة الفيديو علق. هذا هو ورقة لقد كنت في انتظار ل!"
في العمل في المستقبل, الباحثون المهتمين في التفاعلات النمذجة, ليس فقط الملاحظات السلبية. "الأطفال يتفاعلون مع البيئة كما انهم تعلم. فكرتنا هي أن يكون نموذجا من شأنه أيضا استخدام التصور لمعرفة,"يقول روس
مصدر: HTTP://news.mit.edu, روب ماثيسون
إضافة تعليق
يجب عليك تسجيل الدخول او التسجيل لتستطيع اضافه تعليق .