https://frosthead.com

नवीनतम एआई खुद को बिना किसी मानव सहायता के साथ खेलना सिखाता है

पिछले साल, Google के DeepMind टीम द्वारा बनाए गए AlphaGo नामक एक कृत्रिम बुद्धिमत्ता कार्यक्रम ने Go पर एक मानव चैंपियन को हराया, जो एक प्राचीन चीनी रणनीति खेल है जो शतरंज की तुलना में कई तरह से अधिक जटिल है। जैसा कि उस समय एमिली मैचर ने स्मिथसोनियन डॉट कॉम के लिए रिपोर्ट किया था, यह एक आश्चर्यजनक उपलब्धि थी, क्योंकि 1997 के अंत तक कुछ लोग भविष्यवाणी कर रहे थे कि कंप्यूटर पर एक इंसान को हराने में 100 साल लग जाएंगे।

करतब प्रभावशाली होने के साथ-साथ अल्फाजो ने इंसानों द्वारा खेले गए पिछले खेलों का विश्लेषण करके खेल खेलना सीखा। लेकिन एनपीआर की रिपोर्टों में मेरिट कैनेडी के रूप में, अल्फा इंटेलो जीरो नामक कृत्रिम बुद्धिमत्ता का एक नया संस्करण पता चला है कि कैसे गेम को अपने दम पर मास्टर करना है, जिसमें कोई मानव इनपुट या हेरफेर नहीं है - एक उन्नति जिसमें भविष्य के एआई विकास के लिए बड़े निहितार्थ हैं।

डीपमाइंड की एक प्रेस विज्ञप्ति के अनुसार, अल्फा के पिछले संस्करणों ने पेशेवर और मजबूत शौकिया खिलाड़ियों के बीच मैचों का अध्ययन करके खेल खेलना सीखा, खेल के नियमों और खेल की सफल रणनीतियों को अवशोषित किया। हालांकि, अल्फा जीरो ने मनुष्यों द्वारा खेले गए किसी भी खेल को नहीं देखा। इसके बजाय, इसे खेल के नियम दिए गए और फिर खुद के खिलाफ खेला गया, खुद को सही और गलत चाल और दीर्घकालिक रणनीति सिखाने के लिए सुदृढीकरण सीखने का उपयोग किया। जैसा कि एआई ने खेल खेला, उसने अपने प्रतिद्वंद्वी की चालों का बेहतर अनुमान लगाने के लिए अपने उन्नत तंत्रिका नेटवर्क को अपडेट किया।

शोधकर्ताओं ने देखा कि एआई ने वास्तविक समय में खेल में महारत हासिल की। तीन दिनों के बाद यह अल्फ़ागो ली नामक एक पिछले संस्करण को हराने में सक्षम था, जिसने 2016 में 5 में से 4 खेलों में कोरियाई गो मास्टर ली सेडोल को हराया। 21 दिनों के बाद इसने अल्फ़ागो मास्टर को सर्वश्रेष्ठ दिया, वह संस्करण जिसने 60 शीर्ष खिलाड़ियों को ऑनलाइन हराया और इस साल की शुरुआत में दुनिया के सर्वश्रेष्ठ खिलाड़ी के। लेटेस्ट वर्जन ने AlphaGo Master 100 गेम्स को 0. से 40 दिनों के बाद बेस्ट किया है। शोध जर्नल नेचर में दिखाई देता है

गूगल के डीपमाइंड के प्रमुख शोधकर्ता डेविड सिल्वर ने एक यूट्यूब वीडियो में कहा है, "थोड़े समय के अंतराल में, अल्फा गो जीरो ने उन सभी ज्ञान को समझ लिया है, जो हजारों वर्षों से अधिक समय तक मनुष्यों द्वारा संचित किए जाते हैं।" "कभी-कभी यह वास्तव में उससे आगे जाने के लिए चुना जाता है और कुछ ऐसा खोजा गया है जो मानवों ने इस समय अवधि में भी नहीं खोजा था और ज्ञान के नए टुकड़े की खोज की जो कई मायनों में रचनात्मक और उपन्यास हैं।"

एजेंस फ्रांस-प्रेसे की रिपोर्ट के अनुसार, अल्फ़ागो ज़ीरो अपने पूर्ववर्तियों की तुलना में बहुत अधिक कुशलता से इस स्तर तक पहुँच गया। जबकि पिछले पुनरावृत्ति में 48 डेटा प्रोसेसिंग इकाइयाँ थीं और कई महीनों के दौरान 30 मिलियन प्रशिक्षण खेल खेले, ज़ीरो में केवल 4 प्रसंस्करण इकाइयाँ थीं और तीन दिनों में 4.9 मिलियन प्रशिक्षण खेल खेले। "लोग मानते हैं कि मशीन लर्निंग बड़े डेटा और गणना की भारी मात्रा के बारे में है, लेकिन वास्तव में हमने अल्फ़ागो ज़ीरो के साथ जो देखा वह एल्गोरिदम बहुत अधिक मायने रखता है, " सिल्वर एएफपी को बताता है।

लेकिन शोध सिर्फ बोर्ड गेम में महारत हासिल करने से ज्यादा है। द गार्जियन की रिपोर्ट में इयान सैंपल के रूप में, इस प्रकार के तबला रस या रिक्त स्लेट, सीखने से सामान्य प्रयोजन की एक नई पीढ़ी कृत्रिम बुद्धिमत्ता पैदा हो सकती है जो उन क्षेत्रों में समस्याओं को हल करने में मदद कर सकती है जो एक कंप्यूटर में अच्छी तरह से सिम्युलेटेड हो सकते हैं, जैसे कि दवा संरचना।, प्रोटीन तह या कण भौतिकी। मानव गैसों या सीमाओं के बिना जमीन से अपने ज्ञान का निर्माण करके, एल्गोरिदम उन दिशाओं में जा सकते हैं जिन्हें मानव ने अभी तक देखने के लिए नहीं सोचा है।

जबकि एआई समुदाय के कई लोग अल्फ़ागो ज़ीरो को एक बड़ी उपलब्धि के रूप में देखते हैं, न्यूयॉर्क विश्वविद्यालय के मनोविज्ञान के प्रोफेसर गैरी मार्कस, जो कृत्रिम बुद्धि में माहिर हैं, एनपीआर के कैनेडी को बताते हैं कि उन्हें नहीं लगता कि एल्गोरिथम वास्तव में तबला रस है क्योंकि मानव ज्ञान गया था एल्गोरिथ्म के निर्माण में। वह यह भी नहीं सोचता कि तबला रस एआई जितना महत्वपूर्ण है उतना ही महत्वपूर्ण है। "[इन] जीव विज्ञान में, वास्तविक मानव दिमाग तबला रस नहीं है ... मुझे प्रिंसिपल सैद्धांतिक कारण नहीं दिखता है कि आपको ऐसा क्यों करना चाहिए, आपको दुनिया के बारे में बहुत सारे ज्ञान क्यों छोड़ना चाहिए, " वे कहते हैं।

फिर भी, अल्फा गो की खेल में तेजी से महारत प्रभावशाली है- और थोड़ा भयावह।

नवीनतम एआई खुद को बिना किसी मानव सहायता के साथ खेलना सिखाता है