लंबे समय तक, सार्वभौमिक अनुवादक एक पॉप संस्कृति जुनून रहा है। स्टार ट्रेक इसे एक हाथ से चलने वाली मशीन के रूप में प्रस्तुत करता है, एक माइक्रोफोन से मिलता-जुलता है, जो अधिकांश भाषाओं को तुरंत अनुवाद कर सकता है । द हिचहाइकर गाइड टू द गैलेक्सी में एक बबेल मछली, एक प्राणी है, जो किसी के कान के अंदर फंस जाने पर आकाशगंगा में किसी भी भाषा का त्वरित अनुवाद प्रस्तुत करता है।
इसलिए यह कोई आश्चर्य की बात नहीं है कि वर्तमान समय में मनुष्य एक ऐसा उपकरण बनाने की कोशिश कर रहे हैं जो काम करता है। दर्जनों अनुवाद स्मार्टफोन एप्लिकेशन मौजूद हैं, लेकिन अधिकांश अनुवाद सरल, एक-से-एक आधार पर करते हैं; एक उपयोगकर्ता प्रकार या एक शब्द बोलता है और एप्लिकेशन अनुवाद के साथ वापस उछलता है। अब, लक्ष्य, और वास्तविक मौद्रिक घुमाव, इंजीनियरों और उद्यमियों के लिए दो लोगों के लिए अलग-अलग भाषाओं में समझाना संभव बनाता है, जबकि एक छोटा उपकरण वास्तविक समय में अनुवाद करता है।
मौजूदा अनुवाद ऐप्स
ग्रीस की यात्रा पर, अंग्रेजी बोलने वाले एंड्रयू लाउडर बीमार पड़ गए।
वोकरे ट्रांसलेशन के सीईओ लाउडर कहते हैं, "मैं फार्मेसी में गया, और वे किसी भी अंग्रेजी को नहीं समझ सके, इसलिए मुझे कोई मेड नहीं मिली।" दवा के लेबल उसे सचमुच ग्रीक थे। दुनिया के यात्रियों के लिए भाषा बाधाएं आम हैं। एक विदेशी देश में, दवा खरीदने या दिशा-निर्देश प्राप्त करने जैसे छोटे लेनदेन - एक और कठिनाई का सामना करना पड़ता है, जो लॉडर का सामना करना पड़ता है - वह है हर्कुलियन कार्य।
जब वह राज्यों में वापस आया, लॉडर ने वोक्रे ट्रांसलेशन, एक आवाज और पाठ अनुवाद ऐप बनाया। यह एक टेक्स्ट-टू-टेक्स्ट ऐप (MyLangauge कहा जाता है) के रूप में शुरू हुआ, फिर शुरू में एक स्पीच-टू-टेक्स्ट मॉडल में तब्दील हो गया, जैसे कि SayHi Translate सहित अन्य ऐप ने एक पारंपरिक मॉडल का उपयोग किया जिसमें एक शब्द दूसरे शब्द में सीधे अनुवाद करता है। "हैलो, " कहें और स्मार्टफोन या टैबलेट एक स्वचालित "होला" को वापस कर देता है। "अलविदा" सयोनारा बन जाता है। "और इसी तरह, एक पाठ अनुवादक की तरह।
सरल ऑडियो अनुवाद बनाने के लिए, इन ऐप्स के रचनाकारों को डेटा की आवश्यकता होती है। वोकरे ने सार्वजनिक डोमेन रिकॉर्डिंग और दस्तावेजों, जैसे पुरानी फिल्मों या सार्वजनिक सुनवाई से इसकी जानकारी खींची। SayHi के सीईओ ली बोसियर कहते हैं, "हम मूल रूप से एक वॉइसमेल ट्रांसक्रिप्शन सेवा की मांग करते हैं, ताकि हम भाषण मान्यता के लिए उनके क्लाउड का उपयोग कर सकें।"
एक बार इंजीनियरों के पास ऑडियो और टेक्स्ट डेटा था, उन्होंने ऑडियो और टेक्स्ट, वर्ड फॉर वर्ड को पेयर किया। वॉइस रिकग्निशन सॉफ्टवेयर "चीज" को पहचानता है और इसे टेक्स्ट में परिवर्तित करता है। यह फ्रेंच में परिवर्तित हो गया है, और एप्लिकेशन "उच्चारण" के लिए फ्रेंच उच्चारण ढूंढता है।
अगर उपयोगकर्ता किसी चीज़ को "चीज़ी" कहता है, तो अनुवादक भी काम नहीं करता है, क्योंकि बोली जाने वाली भाषा लगभग लिखित भाषा की तरह स्थिर नहीं होती है। ताल, स्लैंग, विभक्ति, उच्चारण, बोली और संवादी प्रवाह अर्थ बदल सकते हैं
हालांकि, समय के साथ, लॉडर एक अधिक संवादी उपकरण चाहता था। एक ईमेल में, वे कहते हैं, "हमारे उपयोग डेटा के आधार पर, हमने पाया है कि लोग अपने लिखने के तरीके से बहुत अलग तरीके से बोलते हैं। बोला गया शब्द बहुत अधिक सहज और बहुत कम औपचारिक और शाब्दिक है। ”इसलिए उन्होंने सांख्यिकीय मशीन अनुवाद को नियोजित किया, जो कि Google द्वारा उपयोग किया जाने वाला एक तरीका है जो पारंपरिक शब्द-से-शब्द अनुवाद मॉडल के लिए, सामान्य शब्द उपयोग को खोजने के लिए डेटा का उपयोग करता है। मूल रूप से, वोकरे सीखता है जैसे कि इसका उपयोग किया जाता है। “यह हर बातचीत, हर वाक्यांश के आधार पर सीखता है जो इसके माध्यम से जाता है। यह कुछ ऐसा है जो समय के साथ होशियार हो जाता है, ”लॉडर कहते हैं।
फिर भी, वर्तमान में, दोनों ऐप को अनुवाद करने में कुछ सेकंड लगते हैं, लेकिन इसमें कोई संदेह नहीं है कि विशेष रूप से बॉडी लैंग्वेज के साथ कंसर्ट में, खाने का ऑर्डर देने जैसी बातचीत के लिए। आखिरकार, मानव वर्षों से गैर-देशी भाषाओं में भोजन का आदेश दे रहा है और हमेशा अभी भी खाने का प्रबंधन करता है। लेकिन वे गहराई से, जटिल बातचीत नहीं कर पाए।
वोकरे और साही के साथ, बातचीत में बहुत सख्ती हो सकती है, लेकिन यह आपकी मूल भाषा में चैटिंग के समान नहीं है। Google इसे पूरी तरह से बदलने का इरादा रखता है।
Google का दृष्टिकोण (सांख्यिकीय मशीन अनुवाद)
स्कूल में एक नई भाषा सीखते समय, हम व्यक्तिगत शब्दावली शब्दों के साथ शुरू करते हैं। लेकिन भाषा अधिक तरल है - शब्दों को संदर्भ की आवश्यकता है।
Google अनुवाद के लिए एक सॉफ्टवेयर इंजीनियर जोश एस्टेले कहते हैं, "[दृष्टिकोण] Google एक अधिक सामान्य दृष्टिकोण है।" "इन सभी नियमों को हार्डकोड करने के बजाय, हम डेटा को देखकर नियमों को जानने की कोशिश करते हैं।"
टेक कंपनी वन-टू-वन, वर्ड-फॉर-वर्ड विधि से बचती है और इसके बजाय सांख्यिकीय मशीन अनुवाद का उपयोग करती है, यह देखने में नहीं है कि शब्दों का क्या अर्थ है, लेकिन भाषा कैसे मॉडलिंग की जाती है, जिसे वह डेटा के माध्यम से सीखता है । तो, यह जंगल का लक्ष्य है, न कि पेड़ों का। एक अंग्रेजी उदाहरण: हम "ब्रेक" और "अप" शब्द की परिभाषा जानते हैं, लेकिन "ब्रेक अप" वाक्यांश दो शब्दों का शाब्दिक संयोजन नहीं है।
सांख्यिकीय मशीन अनुवाद के लिए डेटा की आवश्यकता होती है। इसके पर्वत। काम करने के तरीके के लिए, यह न केवल इस तथ्य की आवश्यकता है कि "फ्रेज" पनीर के लिए फ्रेंच है, लेकिन "फ्रेज" और पनीर दोनों के 100 उदाहरण वास्तविक वाक्यों में उपयोग किए जा रहे हैं।
एस्टेले का कहना है कि अगर एक अंग्रेजी बोलने वाले के पास दो मेनू हैं, तो इस तथ्य के लिए समान रूप से बचाएं कि एक अंग्रेजी में मुद्रित है और एक चीनी में, "आप शायद समझ सकते हैं कि चीनी चरित्र 'सूप' के लिए क्या है।" संदर्भ राजा है। लेकिन उस संदर्भ को बनाने के लिए, आपको लाखों मेनू, और हर दूसरे दस्तावेज़ की कल्पना करने की आवश्यकता है।
जो वास्तव में Google के पास है। डेटा के ढेर को इकट्ठा करने के लिए वेब दिग्गज के बिना, एक वास्तविक दुनिया की बाबेल मछली मौजूद नहीं हो सकती है। यह वेब को क्रॉल करता है और सब कुछ इकट्ठा करता है- टेक्स्ट और ऑडियो। फिर, यह इस डेटा को एल्गोरिदम में फीड करता है जो हर चीज की तुलना हर चीज से करता है। इन तुलनाओं से यह पता चलता है कि भाषा स्वाभाविक रूप से कैसे काम करती है।
"एक बात जो लोगों को आश्चर्यचकित करती है जब हम अनुवाद के बारे में बात करते हैं तो हमारी टीम उस पर कोई भाषाविद् नहीं रखती है, " एस्टेले कहते हैं। “हमने 71 भाषाएं लॉन्च की हैं, और मैं कहूंगा कि हमारी टीम को पता नहीं है कि उनमें से अधिकांश को कैसे बोलना है। एक मानव अनुवादक इन सभी नियमों और चीजों को उतनी तेजी से नहीं सीख सकता है जितना कि हमारा [डेटा] वेब से सीख सकता है। ”
क्या बात है?
Google की तरह, Facebook लाभ देखता है। अनुवाद में सोशल मीडिया साइट के अपने विचार पर विचार करें।
फेसबुक पर इंजीनियरिंग के निदेशक टॉम स्टॉकी कहते हैं, "फेसबुक का मिशन पूरी दुनिया को जोड़ता रहा है, और दुनिया को जोड़ने की बाधाओं में से हर कोई एक ही भाषा नहीं बोलता है।" "अनुवाद पक्ष में, मुझे लगता है कि भविष्य के लिए वास्तव में महत्वाकांक्षी दृष्टि है यदि आप अपनी मूल भाषा में फेसबुक का उपयोग कर सकते हैं और किसी अन्य भाषा के साथ बातचीत कर सकते हैं।"
इस पिछले अगस्त में, फेसबुक ने एंड्रॉइड और आईओएस डिवाइसों के लिए उपलब्ध स्पीच-टू-स्पीच ट्रांसलेशन ऐप जिब्बिगो का अधिग्रहण किया।
उत्सुक फेसबुक उपयोगकर्ता ध्यान देंगे कि सोशल साइट पहले से ही कुछ अनुवादों को नियुक्त करती है। यदि आपने कभी भी अपने अंग्रेजी-आधारित पेज पर स्पेनिश पोस्ट डाली है, तो आपको तुरंत अपनी मूल भाषा में अनुवाद करने का अवसर दिया गया है।
लेकिन स्टॉकि वॉइस घटक को संभावित गेम चेंजर के रूप में देखता है। स्मार्टफोन और टैबलेट का उदय एक स्थायी रूप से परस्पर जुड़ी दुनिया का स्वागत करता है, और भाषण मान्यता सॉफ्टवेयर का उदय वेब इंटरैक्शन के नए साधनों को आमंत्रित कर रहा है। स्टॉकी एक ऐसे भविष्य की कल्पना करता है जिसमें उपयोगकर्ता केवल अपने स्मार्टफ़ोन के लिए एक कमांड बोल सकते हैं और अन्य उपयोगकर्ताओं के साथ बातचीत कर सकते हैं, एक तरफ भाषा अंतर।
"कोई सवाल नहीं है जो अंततः होगा, क्योंकि केवल सीमाएं हैं भाषा इंजन की शक्ति और निश्चित रूप से प्रसंस्करण समय और प्रसंस्करण शक्ति, " वे कहते हैं।
लौरा मर्फी, तुलाने विश्वविद्यालय में वैश्विक स्वास्थ्य प्रणालियों और विकास विभाग में एक प्रोफेसर और एक भर्ती प्रौद्योगिकी संदेहवादी, एक सार्वभौमिक अनुवादक के मूल्य पर सवाल उठाते हैं, और एक से अधिक भाषाओं को जानने की आवश्यकता नहीं है।
वह सोचती है कि डिवाइस यात्रा, व्यापार और अंतरराष्ट्रीय संबंधों के साथ कुछ उपयोगी हो सकता है लेकिन ग्राउंडब्रेकिंग नहीं। एक निश्चित स्तर पर, हमारे पास पहले से ही अनुवादक (लोग) मौजूद हैं, और जो विदेशी संबंधों में काम करते हैं, वे उपयुक्त भाषाओं को जानते हैं। एक उपकरण, मर्फी का मानना है, नकारात्मक परिणाम हो सकते हैं।
"मुझे लगता है कि यह लोगों को आलसी बना सकता है, " मर्फी कहते हैं। मस्तिष्क को मजबूर करके भाषाओं का अनुवाद करना मानसिक रूप से चुनौतीपूर्ण हो सकता है - विशेष रूप से एक जो दो से अधिक भाषाओं को जानता है - एक अलग तरीके से काम करने के लिए, लेकिन व्यायाम पुरस्कृत है, फिर भी। मस्तिष्क भाषाई सहानुभूति के एक स्थान से खींचता है कि यहां तक कि बेहतरीन आवाज अनुवादक भी कभी नहीं पहुंच सकता।
हालांकि यह सार्वभौमिक संचार एक सकारात्मक हो सकता है, मर्फी स्वीकार करता है, "यह लोगों को यह सोचने के लिए प्रेरित कर सकता है कि वे संचार कर रहे हैं जब वे नहीं हैं।" हमेशा जानकारी के पारित होने के बारे में।
जब हम इस प्रौद्योगिकी को देखने की उम्मीद कर सकते हैं?
"2005 में, 1, 000 वाक्यों का अनुवाद करने में हमें 40 घंटे लगे, " एस्टेले कहते हैं, Google के। "आज, हम हर 10 मिलीसेकंड में 1, 000 वाक्यों के बराबर अनुवाद करते हैं।"
जैसा कि 1970 के दशक की टीवी सीरीज़ द सिक्स मिलियन डॉलर मैन में रिचर्ड एंडरसन कहते हैं, "हमारे पास तकनीक है।" अब यह केवल आंकड़ों के एकत्रीकरण और विश्लेषण की प्रतीक्षा में है। एस्टेले के अनुसार, यह अज्ञात होने में कितना समय लगेगा। लेकिन सतर्क अनुमानों ने एक दशक के भीतर इस तरह के उपकरण को हमारे हाथों में डाल दिया।
जबकि Google और Facebook जैसी Bossier या विशाल कंपनियों के ऐप निर्माता, बाबेल के बाइबिल टॉवर के अपने संस्करणों का निर्माण नहीं करना चाहते हैं, लेकिन यह बब्बलिंग को समाप्त करना चाहता है। यह एक ऐसी दुनिया की कल्पना करता है जहां हम सभी चिकित्सा के बारे में, राजनीति के बारे में, विचारों के बारे में संवाद करते हैं।
और, वह दुनिया बहुत दूर नहीं हो सकती है।
संपादक का ध्यान दें: हमने इस कहानी को 4 अप्रैल 2014 को अपडेट किया, ताकि वोकरे ट्रांसलेशन तकनीक का सटीक वर्णन किया जा सके।