https://frosthead.com

यह पोकर खेलने वाला एआई जानता है कि कब उन्हें पकड़ना है और कब उन्हें मोड़ना है

प्लूरीबस नाम के एक कंप्यूटर प्रोग्राम ने छह खिलाड़ियों की नो-लिमिट वाले टेक्सास होल्डम गेम की एक श्रृंखला में पोकर पेशेवरों को पछाड़ दिया है, जो कृत्रिम बुद्धिमत्ता अनुसंधान में एक मील का पत्थर तक पहुंचते हैं। यह एक जटिल मल्टीप्लेयर प्रतियोगिता में मनुष्यों को हराने वाला पहला बॉट है।

जर्नल साइंस में फेसबुक की एआई लैब और कार्नेगी मेलन यूनिवर्सिटी की रिपोर्ट के शोधकर्ताओं के अनुसार, प्लुरिबस मानव और एल्गोरिथ्म-वर्चस्व वाले दोनों मैचों में विजयी हुआ। प्रारंभ में, मेरिट कैनेडी एनपीआर के लिए लिखते हैं, बॉट के पांच संस्करणों ने एक पेशेवर पोकर खिलाड़ी के खिलाफ सामना किया; प्रयोगों के अगले दौर में, एक बॉट ने पांच मनुष्यों की भूमिका निभाई। एक फेसबुक ब्लॉग पोस्ट के अनुसार, एआई ने पांच मानव विरोधियों के खिलाफ खेलते हुए औसतन लगभग $ 5 प्रति हाथ, या $ 1, 000 प्रति घंटे जीता। इस दर को पोकर पेशेवरों के बीच "जीत का निर्णायक मार्जिन" माना जाता है।

कैनेडी के साथ बोलते हुए, चार बार के वर्ल्ड पोकर टूर चैंपियन डैरेन एलियास बताते हैं कि उन्होंने एआई की गलती होने पर बॉट प्रतिद्वंद्वियों और वैज्ञानिकों को सचेत करने के लिए चार तालिकाओं के खिलाफ प्रतिस्पर्धा करके प्लूरीबस को प्रशिक्षित करने में मदद की। जल्द ही, बॉट "बहुत तेजी से सुधार कर रहा था, [जा रहा है] एक मध्यस्थ खिलाड़ी होने के लिए मूल रूप से एक विश्व स्तरीय स्तर के पोकर खिलाड़ी के दिनों और हफ्तों के मामले में।" अनुभव, एलियास कहते हैं, "बहुत डरावना था।"

वर्ज के जेम्स विन्सेन्ट के अनुसार, प्लूरीबस-एक आश्चर्यजनक रूप से कम लागत वाली AI है, जिसकी लागत $ 150 से कम क्लाउड कंप्यूटिंग संसाधनों के साथ है - स्वयं की प्रतियों के खिलाफ खेलने और परीक्षण और त्रुटि के माध्यम से सीखने से पोकर रणनीति में महारत हासिल है। जैसा कि जेनिफर ओउलीलेट ने अर्स टेक्निका के लिए नोट किया था, बॉट ने तुरंत ही महसूस किया कि कार्रवाई का सबसे अच्छा कोर्स गेमप्ले और अप्रत्याशित चाल का एक संयोजन था।

अधिकांश मानव पेशेवरों "डोनट सट्टेबाजी" से बचते हैं, जो एक खिलाड़ी को कॉल के साथ एक दौर को समाप्त करता है और अगले को दांव के साथ शुरू करता है, लेकिन प्लूरीबस ने आसानी से अलोकप्रिय रणनीति को अपनाया। उसी समय, ओयूलेटलेट की रिपोर्ट में, एआई ने भी असामान्य शर्त आकार की पेशकश की और विरोधियों की तुलना में बेहतर यादृच्छिककरण का प्रदर्शन किया।

सीएमयू के एक बयान के अनुसार, एलियास ने कहा, "इसकी प्रमुख ताकत मिश्रित रणनीतियों का उपयोग करने की क्षमता है।" उन्होंने कहा, '' यह वही चीज है जो मनुष्य करने की कोशिश करता है। यह मनुष्यों के लिए निष्पादन की बात है - यह पूरी तरह से यादृच्छिक तरीके से करने के लिए और लगातार ऐसा करने के लिए। ज्यादातर लोग बस नहीं कर सकते। ”

प्लूरीबस मानव पेशेवरों को हराने वाला पहला पोकर-प्लेइंग एआई नहीं है। 2017 में, बॉट के रचनाकारों, नोअम ब्राउन और टूमस सैंडहोम, ने लाइब्रेटस नामक कार्यक्रम का एक पूर्व चलना विकसित किया। इस एआई ने निर्णायक रूप से दो खिलाड़ी टेक्सास होल्डम के 120, 000 हाथों में चार पोकर मुकदमों को हराया, लेकिन जैसा कि फेसबुक ब्लॉग पोस्ट बताती है, इस तथ्य से सीमित था कि यह केवल एक समय में एक प्रतिद्वंद्वी के साथ सामना करना पड़ा।

एमआईटी टेक्नोलॉजी रिव्यू विल नाइट के अनुसार, पोकर एआई को चुनौती देता है क्योंकि इसमें कई खिलाड़ी शामिल होते हैं और छिपी हुई जानकारी की अधिकता होती है। तुलनात्मक रूप से, शतरंज और गो जैसे खेल सिर्फ दो प्रतिभागियों को शामिल करते हैं, और खिलाड़ियों की स्थिति सभी को दिखाई देती है।

इन बाधाओं को दूर करने के लिए, ब्राउन और सैंडहोम ने गेम के अंत के माध्यम से अपने कदमों को नापने के बजाय विरोधियों की अगली दो या तीन चालों की भविष्यवाणी करने के लिए एक एल्गोरिथम बनाया। हालांकि यह रणनीति दीर्घकालिक जीत पर अल्पकालिक लाभ को प्राथमिकता देने के लिए लग सकती है, Verge के विन्सेन्ट लिखते हैं कि "अल्पावधि की क्षमता वास्तव में आप सभी की आवश्यकता है।"

आगे बढ़ते हुए, प्लुरिबस जैसे मल्टीप्लेयर प्रोग्रामों का उपयोग एंटीबायोटिक-प्रतिरोधी बैक्टीरिया से लड़ने में सक्षम दवाओं को डिजाइन करने के लिए किया जा सकता है, साथ ही साइबर सुरक्षा और सैन्य रोबोट प्रणालियों में सुधार किया जा सकता है। जैसा Ars Technica के Ouellette नोट, अन्य संभावित अनुप्रयोगों में बहु-पक्ष वार्ता, मूल्य निर्धारण उत्पाद और मंथन नीलामी बोली रणनीतियों की निगरानी शामिल है।

अब के लिए, ब्राउन नाइट बताता है, एल्गोरिथ्म मुख्य रूप से लपेटे के तहत रहेगा - मुख्य रूप से ऑनलाइन पोकर उद्योग को विनाशकारी वित्तीय नुकसान से बचाने के लिए।

शोधकर्ता ने निष्कर्ष निकाला, "यह पोकर समुदाय के लिए बहुत खतरनाक हो सकता है।"

यह पोकर खेलने वाला एआई जानता है कि कब उन्हें पकड़ना है और कब उन्हें मोड़ना है