ऑस्ट्रेलियाई गायक और आवाज अभिनेत्री, करेन जैकबसेन को न्यूयॉर्क पहुंचने के तुरंत बाद 2000 में टमटम मिला। निर्माता-कॉर्पोरेट प्रकारों ने उसे तीन सप्ताह के लिए एक रिकॉर्डिंग स्टूडियो में भेज दिया, जहाँ उसने प्रतिदिन चार घंटे यह कहते हुए बिताए कि "अगले चौराहे पर, बाईं ओर मुड़ें" और "पुनर्गणना" जैसी बातें अंत में, यह उसकी आवाज़ नहीं थी। वह तनावपूर्ण था। "मैंने लगभग 186 बार 'लगभग' कहा, " जैकबसेन याद करते हैं। "इस तरह की बात आपको गुदगुदा सकती है।"
संबंधित सामग्री
- टॉलेमी से लेकर जीपीएस तक, मैप्स का संक्षिप्त इतिहास
दो साल बाद, उसे एक दोस्त का फोन आया। "करेन, " उसकी पलक झपकती है। "मैंने अपने पति को उन नई जीपीएस चीजों में से एक खरीदा है, और हमने इसे ऑस्ट्रेलियाई आवाज पर रखा है। यह तुम हो! ”इसी तरह से जैकबसेन को पता चला कि उसकी आवाज दुनिया भर के 400 मिलियन लोगों को दिशा दे रही है।
उनका काम रक्त और तकनीक के हाइब्रिड को उजागर करता है जो अब सर्वव्यापी आवाज़ों में जाता है जो हमें बताता है कि कहां मोड़ना है: हर महीने एक से अधिक लोग Google मानचित्र पर भरोसा करते हैं, और 80 प्रतिशत आवाज विकल्प को सक्रिय करते हैं।
आवाज़ के संश्लेषण के शुरुआती दिनों में - 1970 के दशक के अंत में स्पीक एंड स्पेल के रोबोटिक ध्वनियों के बारे में सोचें - एक एल्गोरिथ्म ने टेक्स्ट को एक मोनोटोन स्ट्रीम में बदल दिया। फिर, जैसे-जैसे डेटाबेस बढ़ता गया, आप जैकबसेन की तरह एक आवाज अभिनेता को रिकॉर्ड कर सकते हैं, जो शब्दांश और शब्दों के एक कोष का उच्चारण करता है, जिसे एल्गोरिदम बुनियादी नियमों के अनुसार संयोजित और बदल देगा। हाल ही में, Nuance जैसी फर्मों में सॉफ्टवेयर कोडर्स, जो कारों के लिए नेविगेशन इंटरफेस डिजाइन करते हैं, ने एक तीसरा दृष्टिकोण विकसित किया है - भाषण संश्लेषण के लिए गहन सीखने को लागू करना। यह दर्ज किए गए शब्दों और संश्लेषित स्निपेट्स को मिलाता है, उच्चारण को और अधिक मानवीय बनाने के लिए कृत्रिम बुद्धि पर निर्भर करता है। "वे नादानी स्वाभाविक लगते हैं, " नुअंस के मुख्य प्रौद्योगिकी अधिकारी, व्लाद सेजोनहा कहते हैं।
बेशक, भाषा की आवाज के सिस्टम के लिए एक चुनौती बनी हुई है। Google के प्रवक्ता का कहना है, "सोचिए 'बहुत' बनाम 'खरीदा, ' या 'पढ़ा' बनाम 'पढ़ा, "। "लेकिन उम्मीद है कि उपयोगकर्ता हमेशा अनुमान लगा सकता है कि हमारा क्या मतलब है।" अब जब एआई कार नव प्रणालियों को अधिक समझदारी से बोलने के लिए सिखा रहा है, तो अगला यह ऑनलाइन दुनिया की खोज करेगा और यह पता लगाएगा कि आप क्या करने से पहले भी जाना चाहते हैं।
सिर्फ $ 12 के लिए अब स्मिथसोनियन पत्रिका की सदस्यता लें
यह लेख स्मिथसोनियन पत्रिका के जुलाई / अगस्त अंक से चयन है
खरीदें