https://frosthead.com

न्यूरोसाइंटिस्ट्स ने मौखिक भाषण में मस्तिष्क की तरंगों को रूपांतरित किया है

वही तकनीक जो आपके चैट मोबाइल सहायक को शक्ति प्रदान करती है, वह एक दिन उन लोगों को आवाज दे सकती है, जो बोलने की क्षमता खो चुके हैं। जैसा कि रेने फॉर्च्यून के लिए रिपोर्ट करता है, कोलंबिया विश्वविद्यालय के न्यूरोसाइंटिस्ट्स ने हाल ही में इस भविष्य के लक्ष्य की दिशा में एक बड़ी प्रगति की, मस्तिष्क तरंगों को पहली बार समझदार भाषण में सफलतापूर्वक अनुवाद किया।

साइंटिफिक रिपोर्ट्स में प्रकाशित टीम के शोध में कुछ अपरंपरागत दृष्टिकोण शामिल है। भाषण देने के लिए विचारों पर सीधे नज़र रखने के बजाय, शोधकर्ताओं ने परीक्षण विषयों द्वारा उत्पन्न न्यूरोलॉजिकल पैटर्न रिकॉर्ड किए, जो दूसरों को बोलते हुए सुनते हैं। इन मस्तिष्क तरंगों को एक वोडरोड - एक कृत्रिम बुद्धिमत्ता एल्गोरिथ्म में खिलाया गया था जो भाषण को संश्लेषित करता है - और फिर इसे सुस्पष्ट, यद्यपि रोबोटिक-साउंडिंग में परिवर्तित कर दिया जाता है, प्रतिभागियों द्वारा सुनाए गए वाक्यांशों को दर्शाता है।

कोलम्बिया के न्यूरोबिरिया कार्यक्रम में एक इंजीनियर नीमा मेसर्जानी का कहना है, "हमारी आवाज़ें हमें अपने दोस्तों, परिवार और हमारे आस-पास की दुनिया से जोड़ती हैं, जो चोट या बीमारी के कारण किसी की आवाज़ की शक्ति खो देती है।" एक बयान। “आज के अध्ययन के साथ, हमारे पास उस शक्ति को बहाल करने का एक संभावित तरीका है। हमने दिखाया है कि सही तकनीक के साथ, इन लोगों के विचारों को किसी भी श्रोता द्वारा समझा और समझा जा सकता है। ”

यह ध्यान देने योग्य है, गिज़मोडो के जॉर्ज ड्वॉर्स्की के अनुसार, वैज्ञानिकों ने अभी तक यह पता नहीं लगाया है कि आंतरिक विचारों का अनुवाद कैसे किया जाए, जिसे कल्पना भाषण के रूप में भी जाना जाता है। इस आदर्श परिदृश्य में, भाषण प्रौद्योगिकी का उपयोग करने वाले व्यक्ति केवल यह कहना चाहते हैं कि वे क्या कहना चाहते हैं, फिर अपने विचारों को मौखिक रूप से बताने के लिए एक कृत्रिम ध्वनि प्रणाली की प्रतीक्षा करें।

दिवंगत ब्रिटिश भौतिक विज्ञानी स्टीफन हॉकिंग ने दूसरों के साथ संवाद करने के लिए भाषण संश्लेषण प्रौद्योगिकी के एक अल्पविकसित संस्करण का उपयोग किया। जैसा कि नीना गोडेलेव्स्की ने न्यूज़वीक के लिए लिखा है, हॉकिंग को 21 साल की उम्र में एम्योट्रोफ़िक लेटरल स्क्लेरोसिस (एएलएस) का पता चला था। मोटर न्यूरॉन बीमारी ने अंततः उनकी भाषण क्षमताओं का दावा किया, जिससे उन्होंने भाषण को ट्रिगर करने के लिए हाथ से आयोजित क्लिकर का उपयोग करने के लिए मजबूर किया।

जब हॉकिंग ने अपने हाथों का उपयोग खो दिया, तो उन्होंने चेहरे की गतिविधियों के आधार पर एक प्रणाली पर स्विच किया; गिज़मोडो ड्वोर्स्की आगे बताते हैं कि वैज्ञानिक ने एक ध्वनि सिंथेसाइज़र द्वारा बोले गए शब्दों को चुनने के लिए अपने चश्मे से जुड़े एक गाल स्विच का उपयोग किया।

इस तकनीक का एक उन्नत चलना मध्यम व्यक्ति को छोड़ देगा, जो उपयोगकर्ताओं को कंप्यूटर या आंदोलन-संवेदी प्रणाली की सहायता के बिना भाषण का उत्पादन करने में सक्षम करेगा।

तुलनात्मक रूप से, एवरी थॉम्पसन ने लोकप्रिय यांत्रिकी के लिए नोट किया, कोलंबिया टीम का अध्ययन "अत्यधिक भाषण" का अनुवाद करने पर केंद्रित है। शोधकर्ताओं ने मस्तिष्क की सर्जरी के लिए निर्धारित पांच मिर्गी रोगियों को भर्ती किया और उनसे बोले गए शब्दों की एक सरणी सुनने के लिए कहा- उदाहरण के लिए, किसी की रिकॉर्डिंग। शून्य से नौ तक गिनती-जबकि तंत्रिका निगरानी उपकरणों के लिए झुका।

इन उपकरणों द्वारा कैप्चर की गई मस्तिष्क तरंगों को शब्दकोष में रखा गया था, जो कि फ्यूचरिज्म के क्रिस्टिन हाउसर के शब्दों में प्रशिक्षित न्यूरल नेटवर्क की मदद से भाषण को "क्लीन अप" आउटपुट के लिए संश्लेषित करता है और ध्वनियों को समझदारी से प्रस्तुत करता है।

इसके बाद, वैज्ञानिकों ने 11 अन्य प्रतिभागियों को AI- सक्षम भाषण सुनने के लिए कहा। गौरतलब है कि अध्ययन के सह-लेखक मेसगरानी ने कोलंबिया के बयान में बताया है, ये व्यक्ति 75 प्रतिशत समय के दौरान ध्वनियों को "समझने और दोहराने" में सक्षम थे - किसी भी पिछले प्रयोगों में देखी गई दरों को "अच्छी तरह से और परे"। (आप यहां अपने लिए रिकॉर्डिंग को जज कर सकते हैं।)

गिजमोडो के ड्वॉर्स्की के साथ एक साक्षात्कार में, मेसगरानी का कहना है कि वह और उनके सहयोगियों को निकट भविष्य में अधिक जटिल वाक्यांशों को संश्लेषित करने की उम्मीद है। शोधकर्ता परीक्षण विषयों द्वारा उत्पन्न मस्तिष्क संकेतों को भी रिकॉर्ड करना चाहते हैं, जो केवल दूसरों को सुनने के बजाय बोलने की क्रिया को सोच या कल्पना कर रहे हैं। अंत में, मेस्गरानी ने बयान में कहा, टीम का उद्देश्य एक दिन प्रौद्योगिकी को एक प्रत्यारोपण में बदलना है जो पहनने वाले के विचारों को सीधे शब्दों में अनुवाद करने में सक्षम है।

नए शोध की संभावित सीमाओं में इसके छोटे नमूने का आकार शामिल है और, न्यूकैसल विश्वविद्यालय के न्यूरोसाइंटिस्ट एंड्रयू जैक्सन के अनुसार, जो अध्ययन में शामिल नहीं थे, इस तथ्य से कि तंत्रिका नेटवर्क को अपने नए प्रतिभागी से बड़ी संख्या में मस्तिष्क के संकेतों को पेश करने की आवश्यकता होगी। नौ के माध्यम से शून्य से परे भाषण को संश्लेषित करने के लिए।

"भविष्य में यह देखना दिलचस्प होगा कि एक व्यक्ति के लिए अच्छी तरह से डिकोडर प्रशिक्षित करने वाले अन्य व्यक्तियों को सामान्य कैसे बनाते हैं" जैक्सन गिजमोदो को बताता है। “यह शुरुआती भाषण मान्यता प्रणालियों की तरह एक सा है, जिसे उपयोगकर्ता द्वारा व्यक्तिगत रूप से प्रशिक्षित करने की आवश्यकता है, जैसे कि आज की तकनीक के विपरीत, जैसे सिरी और एलेक्सा, जो किसी की आवाज का अर्थ बना सकते हैं, फिर से तंत्रिका नेटवर्क का उपयोग कर सकते हैं। केवल समय ही बताएगा कि क्या ये तकनीकें एक दिन मस्तिष्क के संकेतों के लिए भी ऐसा कर सकती हैं। ”

न्यूरोसाइंटिस्ट्स ने मौखिक भाषण में मस्तिष्क की तरंगों को रूपांतरित किया है