अभी पंजीकरण करें

लॉग इन करें

पासवर्ड खो गया

आपका पासवर्ड खो गया है? कृपया अपना पूरा ईमेल दर्ज करें. आपको एक लिंक प्राप्त होगा और आप ईमेल के माध्यम से एक नया पासवर्ड बनाएंगे.

पोस्ट जोड़ें

पोस्ट जोड़ने के लिए आपको लॉगिन करना होगा .

प्रश्न जोड़ें

प्रश्न पूछने के लिए आपको लॉगिन करना होगा.

लॉग इन करें

अभी पंजीकरण करें

स्कॉलरसार्क.कॉम में आपका स्वागत है! आपका पंजीकरण आपको इस प्लेटफॉर्म की अधिक सुविधाओं का उपयोग करने की अनुमति देगा. आप सवाल पूछ सकते हैं, योगदान दें या उत्तर दें, अन्य उपयोगकर्ताओं के प्रोफ़ाइल देखें और बहुत कुछ. अभी पंजीकरण करें!

मशीनें जो बच्चों की तरह भाषा सीखती हैं: कंप्यूटर मॉडल मानव-मशीन संपर्क में सुधार कर सकता है, बच्चे भाषा कैसे सीखते हैं, इसकी जानकारी प्रदान करें.

बच्चे अपने परिवेश को देखकर भाषा सीखते हैं, अपने आस-पास के लोगों की बातें सुनना, और जो कुछ वे देखते और सुनते हैं उसके बीच के बिंदुओं को जोड़ना. अन्य बातों के अलावा, इससे बच्चों को अपनी भाषा का शब्द क्रम स्थापित करने में मदद मिलती है, जैसे कि जहां विषय और क्रिया एक वाक्य में आते हैं. कंप्यूटिंग में, भाषा सीखना वाक्य-विन्यास और शब्दार्थ पार्सर्स का कार्य है. इन प्रणालियों को मनुष्यों द्वारा एनोटेट किए गए वाक्यों पर प्रशिक्षित किया जाता है जो शब्दों के पीछे की संरचना और अर्थ का वर्णन करते हैं. वेब खोजों के लिए पार्सर तेजी से महत्वपूर्ण होते जा रहे हैं, प्राकृतिक भाषा डेटाबेस क्वेरी, और आवाज-पहचान प्रणाली जैसे एलेक्सा और सिरी. जल्द ही, इनका उपयोग घरेलू रोबोटिक्स के लिए भी किया जा सकता है.

एमआईटी शोधकर्ताओं ने एक "सिमेंटिक पार्सर" विकसित किया है जो अवलोकन के माध्यम से बच्चे की भाषा-अधिग्रहण प्रक्रिया की अधिक बारीकी से नकल करना सीखता है।, जो कंप्यूटिंग की क्षमताओं को काफी हद तक बढ़ा सकता है.
तस्वीर: एमआईटी समाचार

लेकिन कम आम भाषाओं के लिए एनोटेशन डेटा इकट्ठा करना समय लेने वाला और कठिन हो सकता है. इसके साथ ही, मनुष्य हमेशा टिप्पणियों पर सहमत नहीं होते हैं, और टिप्पणियाँ स्वयं सटीक रूप से प्रतिबिंबित नहीं कर सकतीं कि लोग स्वाभाविक रूप से कैसे बोलते हैं.

इस सप्ताह के प्राकृतिक भाषा प्रसंस्करण सम्मेलन में अनुभवजन्य तरीकों में प्रस्तुत किए जा रहे एक पेपर में, एमआईटी शोधकर्ता एक पार्सर का वर्णन करते हैं जो अवलोकन के माध्यम से सीखता है ताकि बच्चे की भाषा-अधिग्रहण प्रक्रिया की अधिक बारीकी से नकल की जा सके, जो पार्सर की क्षमताओं को काफी हद तक बढ़ा सकता है. भाषा की संरचना जानने के लिए, पार्सर कैप्शन वाले वीडियो का अवलोकन करता है, बिना किसी अन्य जानकारी के, और शब्दों को रिकॉर्ड की गई वस्तुओं और क्रियाओं से जोड़ता है. एक नया वाक्य दिया, फिर पार्सर किसी वाक्य के अर्थ की सटीक भविष्यवाणी करने के लिए भाषा की संरचना के बारे में सीखी गई बातों का उपयोग कर सकता है, वीडियो के बिना.

यह "कमजोर पर्यवेक्षित" दृष्टिकोण - जिसका अर्थ है कि इसके लिए सीमित प्रशिक्षण डेटा की आवश्यकता होती है - यह नकल करता है कि बच्चे अपने आसपास की दुनिया को कैसे देख सकते हैं और भाषा सीख सकते हैं, बिना किसी के सीधे सन्दर्भ प्रदान किये. यह दृष्टिकोण डेटा के प्रकारों का विस्तार कर सकता है और पार्सर्स को प्रशिक्षित करने के लिए आवश्यक प्रयास को कम कर सकता है, शोधकर्ताओं के अनुसार. कुछ सीधे तौर पर व्याख्या किये गये वाक्य, उदाहरण के लिए, कई कैप्शन वाले वीडियो के साथ जोड़ा जा सकता है, जिन्हें प्राप्त करना आसान है, प्रदर्शन में सुधार करने के लिए.

भविष्य में, पार्सर का उपयोग मनुष्यों और व्यक्तिगत रोबोटों के बीच प्राकृतिक संपर्क को बेहतर बनाने के लिए किया जा सकता है. पार्सर से सुसज्जित एक रोबोट, उदाहरण के लिए, बोले गए आदेशों की अपनी समझ को सुदृढ़ करने के लिए लगातार अपने परिवेश का निरीक्षण कर सकता है, इसमें तब भी शामिल है जब बोले गए वाक्य पूरी तरह से व्याकरणिक या स्पष्ट नहीं हैं. “लोग एक-दूसरे से आंशिक वाक्यों में बात करते हैं, चल रहे विचार, और अव्यवस्थित भाषा. आप अपने घर में एक ऐसा रोबोट चाहते हैं जो उनके बोलने के विशेष तरीके को अपना सके... और फिर भी समझ सके कि उनका क्या मतलब है,सह-लेखक आंद्रेई बारबू कहते हैं, कंप्यूटर विज्ञान और कृत्रिम बुद्धिमत्ता प्रयोगशाला में एक शोधकर्ता (सीएसएएल) और मस्तिष्क के लिए केंद्र, मन, और मशीनें (सीबीएमएम) एमआईटी के मैकगवर्न इंस्टीट्यूट के भीतर.

पार्सर शोधकर्ताओं को यह बेहतर ढंग से समझने में भी मदद कर सकता है कि छोटे बच्चे भाषा कैसे सीखते हैं. “एक बच्चे के पास अनावश्यक चीजों तक पहुंच होती है, विभिन्न तौर-तरीकों से पूरक जानकारी, इसमें माता-पिता और भाई-बहनों को दुनिया भर के बारे में बातें सुनना भी शामिल है, साथ ही स्पर्श संबंधी जानकारी और दृश्य जानकारी, [जो उसकी मदद करते हैं] दुनिया को समझने के लिए,सह-लेखक बोरिस काट्ज़ कहते हैं, एक प्रमुख अनुसंधान वैज्ञानिक और CSAIL में इन्फोलैब समूह के प्रमुख. “यह एक अद्भुत पहेली है, इस सभी एक साथ संवेदी इनपुट को संसाधित करने के लिए. यह काम यह समझने के लिए बड़े पैमाने पर काम का हिस्सा है कि दुनिया में इस तरह की सीख कैसे होती है।

पेपर पर सह-लेखक हैं: प्रथम लेखक कैंडेस रॉस, इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान विभाग और CSAIL में स्नातक छात्र, और सीबीएमएम में एक शोधकर्ता; येवगेनी बर्ज़क पीएचडी '17, मस्तिष्क और संज्ञानात्मक विज्ञान विभाग में कम्प्यूटेशनल मनोविज्ञान विज्ञान समूह में पोस्टडॉक; और CSAIL के स्नातक छात्र बटुशिग म्यांगनबयार.

देखकर सीखने वाला

उनके काम के लिए, शोधकर्ताओं ने सिमेंटिक पार्सर को ऑब्जेक्ट में प्रशिक्षित कंप्यूटर-विज़न घटक के साथ जोड़ा, मानव, और वीडियो में गतिविधि पहचान. सिमेंटिक पार्सर्स को आम तौर पर कोड के साथ एनोटेट किए गए वाक्यों पर प्रशिक्षित किया जाता है जो प्रत्येक शब्द के अर्थ और शब्दों के बीच के संबंधों को बताते हैं।. कुछ को स्थिर छवियों या कंप्यूटर सिमुलेशन पर प्रशिक्षित किया गया है.

नया पार्सर वीडियो का उपयोग करके प्रशिक्षित होने वाला पहला पार्सर है, रॉस कहते हैं. भाग में, अस्पष्टता को कम करने में वीडियो अधिक उपयोगी हैं. यदि पार्सर इसके बारे में अनिश्चित है, कहो, वाक्य में कोई क्रिया या वस्तु, यह चीजों को स्पष्ट करने के लिए वीडियो का संदर्भ ले सकता है. "अस्थायी घटक हैं - वस्तुएं एक-दूसरे के साथ और लोगों के साथ बातचीत करती हैं - और उच्च-स्तरीय गुण जिन्हें आप स्थिर छवि या सिर्फ भाषा में नहीं देख पाएंगे,रॉस कहते हैं.

शोधकर्ताओं ने इसके बारे में एक डेटासेट संकलित किया 400 वीडियो में लोगों को कई गतिविधियां करते हुए दिखाया गया है, जिसमें किसी वस्तु को उठाना या नीचे रखना शामिल है, और किसी वस्तु की ओर चलना. इसके बाद क्राउडसोर्सिंग प्लेटफॉर्म मैकेनिकल तुर्क पर प्रतिभागियों को प्रदान किया गया 1,200 उन वीडियो के लिए कैप्शन. उन्होंने अलग रख दिया 840 प्रशिक्षण और ट्यूनिंग के लिए वीडियो-कैप्शन उदाहरण, और प्रयोग किया गया 360 परीक्षण के लिए. दृष्टि-आधारित पार्सिंग का उपयोग करने का एक फायदा यह है कि "आपको लगभग उतने डेटा की आवश्यकता नहीं है - हालाँकि यदि आपके पास था [आंकड़ा], आप विशाल डेटासेट तक स्केल कर सकते हैं,बार्बू कहते हैं.

प्रशिक्षण में हूं, शोधकर्ताओं ने पार्सर को यह निर्धारित करने का उद्देश्य दिया कि क्या कोई वाक्य किसी दिए गए वीडियो का सटीक वर्णन करता है. उन्होंने पार्सर को एक वीडियो और उससे मिलता-जुलता कैप्शन दिया. पार्सर तार्किक गणितीय अभिव्यक्ति के रूप में कैप्शन के संभावित अर्थ निकालता है. वाक्य, “महिला एक सेब उठा रही है," उदाहरण के लिए, के रूप में व्यक्त किया जा सकता है: λxy. महिला एक्स,उठाना x y, सेब लाभ कमाने के लिए मुझे इस वस्तु का कितना हिस्सा बेचने की आवश्यकता है.

उन अभिव्यक्तियों और वीडियो को कंप्यूटर-विज़न एल्गोरिदम में इनपुट किया जाता है, "वाक्य ट्रैकर" कहा जाता है,बारबू और अन्य शोधकर्ताओं द्वारा विकसित. समय के साथ वस्तुएं और लोग कैसे बदलते हैं, यह ट्रैक करने के लिए एल्गोरिदम प्रत्येक वीडियो फ़्रेम को देखता है, यह निर्धारित करने के लिए कि क्या क्रियाएँ वर्णित अनुसार चल रही हैं. इस तरह, यह निर्धारित करता है कि वीडियो का अर्थ संभवतः सत्य है या नहीं.

बिंदुओं को कनेक्ट करना

वस्तुओं के लिए सबसे अधिक निकटता से मेल खाने वाली अभिव्यक्ति, इंसानों, और क्रियाएँ कैप्शन का सबसे संभावित अर्थ बन जाती हैं. इजहार, शुरू में, वीडियो में कई अलग-अलग वस्तुओं और क्रियाओं का उल्लेख हो सकता है, लेकिन संभावित अर्थों का सेट एक प्रशिक्षण संकेत के रूप में कार्य करता है जो पार्सर को लगातार संभावनाओं को जानने में मदद करता है. “यह मानकर कि सभी वाक्यों को समान नियमों का पालन करना चाहिए, कि वे सभी एक ही भाषा से आये हैं, और कई कैप्शन वाले वीडियो देख रहे हैं, आप अर्थों को और भी सीमित कर सकते हैं,बार्बू कहते हैं.

संक्षेप में, पार्सर निष्क्रिय अवलोकन के माध्यम से सीखता है: यह निर्धारित करने के लिए कि क्या कोई कैप्शन किसी वीडियो के लिए सत्य है, पार्सर को आवश्यकतानुसार कैप्शन के उच्चतम संभावना वाले अर्थ की पहचान करनी चाहिए. “यह पता लगाने का एकमात्र तरीका है कि क्या वाक्य किसी वीडियो के लिए सत्य है [है] के इस मध्यवर्ती चरण से गुजरना, 'इस वाक्य का क्या मतलब है??' अन्यथा, आपको पता नहीं है कि दोनों को कैसे जोड़ा जाए,बार्बू बताते हैं. “हम सिस्टम को वाक्य का अर्थ नहीं देते हैं. हम कहते हैं, 'वहाँ एक वाक्य और एक वीडियो है. वाक्य वीडियो के अनुरूप होना चाहिए. कुछ मध्यवर्ती प्रतिनिधित्व का पता लगाएं जो इसे वीडियो के बारे में सच बनाता है।''

प्रशिक्षण सीखे गए शब्दों के लिए एक वाक्यात्मक और अर्थ संबंधी व्याकरण तैयार करता है. एक नया वाक्य दिया, पार्सर को अब वीडियो की आवश्यकता नहीं है, लेकिन वाक्य संरचना और अर्थ निर्धारित करने के लिए अपने व्याकरण और शब्दकोष का लाभ उठाता है.

अंत में, यह प्रक्रिया ऐसे सीख रही है जैसे कि आप एक बच्चे हों,बार्बू कहते हैं. “आप अपने चारों ओर की दुनिया को देखते हैं और अर्थ सीखने के लिए लोगों को बोलते हुए सुनते हैं. एक दिन, मैं आपको एक वाक्य दे सकता हूं और पूछ सकता हूं कि इसका क्या मतलब है और, बिना किसी दृश्य के भी, आप इसका मतलब जानते हैं।”

“यह शोध प्राकृतिक भाषा प्रसंस्करण के लिए बिल्कुल सही दिशा है,स्टेफनी टेलेक्स कहती हैं, ब्राउन विश्वविद्यालय में कंप्यूटर विज्ञान के एक प्रोफेसर जो रोबोटों को मनुष्यों के साथ संवाद करने के लिए प्राकृतिक भाषा का उपयोग करने में मदद करने पर ध्यान केंद्रित करते हैं. “जमीनी भाषा की व्याख्या करना, हमें अर्थपूर्ण निरूपण की आवश्यकता है, लेकिन इसे प्रशिक्षण के समय उपलब्ध कराना व्यावहारिक नहीं है. बजाय, यह कार्य कैप्शन वाले वीडियो के संदर्भ का उपयोग करके रचनात्मक संरचना का प्रतिनिधित्व करता है. यह वह पेपर है जिसका मैं इंतजार कर रहा था!"

भविष्य के कार्य में, शोधकर्ता मॉडलिंग इंटरैक्शन में रुचि रखते हैं, सिर्फ निष्क्रिय अवलोकन नहीं. “बच्चे सीखते समय पर्यावरण के साथ बातचीत करते हैं. हमारा विचार एक ऐसा मॉडल बनाना है जो सीखने के लिए धारणा का भी उपयोग करेगा,रॉस कहते हैं


स्रोत: एचटीटीपी://news.mit.edu, रॉब मैथेसन द्वारा

के बारे में मैरी

उत्तर छोड़ दें