https://frosthead.com

कैसे जीपीएस आपकी भाषा बोलना सीखता है

ऑस्ट्रेलियाई गायक और आवाज अभिनेत्री, करेन जैकबसेन को न्यूयॉर्क पहुंचने के तुरंत बाद 2000 में टमटम मिला। निर्माता-कॉर्पोरेट प्रकारों ने उसे तीन सप्ताह के लिए एक रिकॉर्डिंग स्टूडियो में भेज दिया, जहाँ उसने प्रतिदिन चार घंटे यह कहते हुए बिताए कि "अगले चौराहे पर, बाईं ओर मुड़ें" और "पुनर्गणना" जैसी बातें अंत में, यह उसकी आवाज़ नहीं थी। वह तनावपूर्ण था। "मैंने लगभग 186 बार 'लगभग' कहा, " जैकबसेन याद करते हैं। "इस तरह की बात आपको गुदगुदा सकती है।"

संबंधित सामग्री

  • टॉलेमी से लेकर जीपीएस तक, मैप्स का संक्षिप्त इतिहास

दो साल बाद, उसे एक दोस्त का फोन आया। "करेन, " उसकी पलक झपकती है। "मैंने अपने पति को उन नई जीपीएस चीजों में से एक खरीदा है, और हमने इसे ऑस्ट्रेलियाई आवाज पर रखा है। यह तुम हो! ”इसी तरह से जैकबसेन को पता चला कि उसकी आवाज दुनिया भर के 400 मिलियन लोगों को दिशा दे रही है।

उनका काम रक्त और तकनीक के हाइब्रिड को उजागर करता है जो अब सर्वव्यापी आवाज़ों में जाता है जो हमें बताता है कि कहां मोड़ना है: हर महीने एक से अधिक लोग Google मानचित्र पर भरोसा करते हैं, और 80 प्रतिशत आवाज विकल्प को सक्रिय करते हैं।

आवाज़ के संश्लेषण के शुरुआती दिनों में - 1970 के दशक के अंत में स्पीक एंड स्पेल के रोबोटिक ध्वनियों के बारे में सोचें - एक एल्गोरिथ्म ने टेक्स्ट को एक मोनोटोन स्ट्रीम में बदल दिया। फिर, जैसे-जैसे डेटाबेस बढ़ता गया, आप जैकबसेन की तरह एक आवाज अभिनेता को रिकॉर्ड कर सकते हैं, जो शब्दांश और शब्दों के एक कोष का उच्चारण करता है, जिसे एल्गोरिदम बुनियादी नियमों के अनुसार संयोजित और बदल देगा। हाल ही में, Nuance जैसी फर्मों में सॉफ्टवेयर कोडर्स, जो कारों के लिए नेविगेशन इंटरफेस डिजाइन करते हैं, ने एक तीसरा दृष्टिकोण विकसित किया है - भाषण संश्लेषण के लिए गहन सीखने को लागू करना। यह दर्ज किए गए शब्दों और संश्लेषित स्निपेट्स को मिलाता है, उच्चारण को और अधिक मानवीय बनाने के लिए कृत्रिम बुद्धि पर निर्भर करता है। "वे नादानी स्वाभाविक लगते हैं, " नुअंस के मुख्य प्रौद्योगिकी अधिकारी, व्लाद सेजोनहा कहते हैं।

बेशक, भाषा की आवाज के सिस्टम के लिए एक चुनौती बनी हुई है। Google के प्रवक्ता का कहना है, "सोचिए 'बहुत' बनाम 'खरीदा, ' या 'पढ़ा' बनाम 'पढ़ा, "। "लेकिन उम्मीद है कि उपयोगकर्ता हमेशा अनुमान लगा सकता है कि हमारा क्या मतलब है।" अब जब एआई कार नव प्रणालियों को अधिक समझदारी से बोलने के लिए सिखा रहा है, तो अगला यह ऑनलाइन दुनिया की खोज करेगा और यह पता लगाएगा कि आप क्या करने से पहले भी जाना चाहते हैं।

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

सिर्फ $ 12 के लिए अब स्मिथसोनियन पत्रिका की सदस्यता लें

यह लेख स्मिथसोनियन पत्रिका के जुलाई / अगस्त अंक से चयन है

खरीदें
कैसे जीपीएस आपकी भाषा बोलना सीखता है