क्या ऐ कभी चार साल के बच्चे से ज्यादा स्मार्ट होगा? | नवाचार | स्मिथसोनियन - लेख, नवाचार, शिक्षा, प्रौद्योगिकी

कृत्रिम बुद्धि और विशेष रूप से मशीन सीखने में नए अग्रिमों के बारे में सभी ने सुना है। आपने यूटोपियन या एपोकैलिप्टिक भविष्यवाणियों के बारे में भी सुना है कि उन अग्रिमों का क्या मतलब है। उन्हें या तो अमरता या दुनिया के अंत के बारे में बताया गया है, और उन दोनों संभावनाओं के बारे में बहुत कुछ लिखा गया है। लेकिन सबसे परिष्कृत एआई अभी भी उन समस्याओं को हल करने में सक्षम है जो मानव चार साल के बच्चे आसानी से पूरा करते हैं। प्रभावशाली नाम के बावजूद, कृत्रिम बुद्धिमत्ता में बड़े डेटा सेटों में सांख्यिकीय प्रतिमानों का पता लगाने के लिए काफी हद तक तकनीक होती है। मानव सीखने के लिए बहुत कुछ है।

हम संभवतः अपने आस-पास की दुनिया के बारे में इतना कैसे जान सकते हैं? जब हम छोटे बच्चे होते हैं तब भी हम एक बड़ी राशि सीखते हैं; चार साल के बच्चों को पहले से ही पौधों और जानवरों और मशीनों के बारे में पता है; इच्छाओं, विश्वासों और भावनाओं; यहां तक कि डायनासोर और अंतरिक्ष यान भी।

विज्ञान ने दुनिया के बारे में हमारे ज्ञान को अकल्पनीय रूप से बड़े और असीम रूप से छोटे, ब्रह्मांड के किनारे और समय की शुरुआत तक बढ़ा दिया है। और हम उस ज्ञान का उपयोग नई वर्गीकरण और भविष्यवाणियां करने, नई संभावनाओं की कल्पना करने और दुनिया में नई चीजें बनाने के लिए करते हैं। लेकिन दुनिया से हम में से किसी भी तक पहुँचता है, हमारे रेटिनों और हमारे कानों में हवा की गड़बड़ी को मारने वाले फोटोन की एक धारा है। हम दुनिया के बारे में इतना कैसे सीखते हैं जब हमारे पास मौजूद सबूत इतने सीमित होते हैं? और हम यह सब कैसे करते हैं कि ग्रे गू के कुछ पाउंड के साथ हमारी आंखों के पीछे बैठता है?

अब तक का सबसे अच्छा उत्तर यह है कि हमारे दिमाग ठोस, विशेष रूप से, गंदे डेटा हमारी इंद्रियों पर पहुंचने की गणना करते हैं, और उन गणनाओं से दुनिया का सटीक प्रतिनिधित्व होता है। अभ्यावेदन संरचित, अमूर्त और श्रेणीबद्ध प्रतीत होते हैं; उनमें त्रि-आयामी वस्तुओं की धारणा, भाषा के आधार पर व्याकरण और "मन के सिद्धांत" जैसी मानसिक क्षमताएं शामिल हैं, जो हमें यह समझने देती हैं कि अन्य लोग क्या सोचते हैं। वे प्रतिनिधित्व हमें नई भविष्यवाणियों की एक विस्तृत श्रृंखला बनाने और एक विशिष्ट रचनात्मक मानवीय तरीके से कई नई संभावनाओं की कल्पना करने की अनुमति देते हैं।

इस तरह की सीख केवल एक प्रकार की बुद्धिमत्ता नहीं है, बल्कि यह मनुष्य के लिए विशेष रूप से महत्वपूर्ण है। और यह बुद्धि की तरह है जो छोटे बच्चों की विशेषता है। हालाँकि बच्चे योजना और निर्णय लेने में नाटकीय रूप से बुरे हैं, वे ब्रह्मांड में सबसे अच्छे सीखने वाले हैं। डेटा को सिद्धांतों में बदलने की अधिकांश प्रक्रिया हम पाँच होने से पहले होती है।

अरस्तू और प्लेटो के बाद से, समस्या का समाधान करने के दो बुनियादी तरीके हैं कि हम जो जानते हैं उसे कैसे जानते हैं, और वे अभी भी मशीन सीखने में मुख्य दृष्टिकोण हैं। अरस्तू ने समस्या को नीचे से ऊपर तक पहुँचाया: इंद्रियों से शुरू करें- फोटॉन और वायु कंपन की धारा (या डिजिटल छवि या रिकॉर्डिंग के पिक्सल या ध्वनि नमूने) - और देखें कि क्या आप उनसे पैटर्न निकाल सकते हैं। इस तरह के दृष्टिकोण को आगे चलकर ऐसे दार्शनिकों डेविड ह्यूम और जेएस मिल और पावलोव और बीएफ स्किनर जैसे मनोवैज्ञानिक मनोवैज्ञानिकों द्वारा आगे बढ़ाया गया। इस दृष्टिकोण पर, निरूपण और प्रतिनिधित्व की पदानुक्रमित संरचना कुछ भ्रम की स्थिति है, या कम से कम एक एपिप्रोमिनॉन। सभी काम एसोसिएशन और पैटर्न का पता लगाने के द्वारा किया जा सकता है - खासकर अगर पर्याप्त डेटा हो।

Preview thumbnail for video 'Possible Minds: 25 Ways of Looking at AI

संभावित मन: एआई को देखने के 25 तरीके

विज्ञान की दुनिया के दिग्गज जॉन ब्रॉकमैन पच्चीस सबसे महत्वपूर्ण वैज्ञानिक दिमागों को इकट्ठा करते हैं, जो लोग अपने करियर के अधिकांश क्षेत्रों के लिए कृत्रिम बुद्धिमत्ता के बारे में सोचते हैं, मन, सोच, बुद्धिमत्ता और इसके बारे में एक अद्वितीय गोलमेज परीक्षा के लिए मानवीय बनें।

खरीदें

समय के साथ, सीखने के रहस्य और प्लेटो के विकल्प, टॉप-डाउन वन के इस नीचे-अप दृष्टिकोण के बीच एक सीसा हुआ है। हो सकता है कि हम ठोस डेटा से अमूर्त ज्ञान प्राप्त करें क्योंकि हम पहले से ही बहुत कुछ जानते हैं, और विशेष रूप से क्योंकि हमारे पास पहले से ही बुनियादी अमूर्त अवधारणाओं की एक सरणी है, विकास के लिए धन्यवाद। वैज्ञानिकों की तरह, हम दुनिया के बारे में परिकल्पना तैयार करने के लिए उन अवधारणाओं का उपयोग कर सकते हैं। फिर, कच्चे डेटा से पैटर्न निकालने की कोशिश करने के बजाय, हम उन अनुमानों के बारे में भविष्यवाणियां कर सकते हैं कि क्या डेटा दिखना चाहिए, अगर वे परिकल्पनाएं सही हैं। प्लेटो के साथ-साथ डेसकार्टेस और नोआम चॉम्स्की जैसे "तर्कवादी" दार्शनिकों और मनोवैज्ञानिकों ने इस दृष्टिकोण को अपनाया।

यहाँ एक रोज़ का उदाहरण है जो दो तरीकों के बीच अंतर को दिखाता है: स्पैम प्लेग को हल करना। डेटा में आपके इनबॉक्स में संदेशों की लंबी, अनसुलझी सूची है। वास्तविकता यह है कि इनमें से कुछ संदेश वास्तविक हैं और कुछ स्पैम हैं। आप उनके बीच भेदभाव करने के लिए डेटा का उपयोग कैसे कर सकते हैं?

पहले बॉटम-अप तकनीक पर विचार करें। आप देखते हैं कि स्पैम संदेशों में विशिष्ट विशेषताएं हैं: पते की एक लंबी सूची, नाइजीरिया में उत्पन्न, मिलियन-डॉलर के पुरस्कार, या वियाग्रा के संदर्भ में। परेशानी यह है कि पूरी तरह से उपयोगी संदेशों में ये विशेषताएं भी हो सकती हैं। यदि आपने स्पैम और नॉनस्पैम ईमेल के पर्याप्त उदाहरणों को देखा, तो आप न केवल यह देख सकते हैं कि स्पैम ईमेल में वे विशेषताएं हैं, बल्कि यह कि वे विशेष रूप से एक साथ चलते हैं (नाइजीरिया में एक मिलियन डॉलर से अधिक परेशानी होती है)। वास्तव में, कुछ सूक्ष्म उच्च-स्तरीय सहसंबंध हो सकते हैं जो उपयोगी लोगों से स्पैम संदेशों को भेदभाव करते हैं - विशेष रूप से गलत वर्तनी और आईपी पते, पैटर्न। यदि आप उन पैटर्नों का पता लगाते हैं, तो आप स्पैम को फ़िल्टर कर सकते हैं।

बॉटम-अप मशीन-लर्निंग तकनीक बस यही करती है। सीखने वाले को लाखों उदाहरण मिलते हैं, प्रत्येक में कुछ विशेषताओं के साथ और प्रत्येक को स्पैम (या किसी अन्य श्रेणी) के रूप में लेबल किया जाता है या नहीं। कंप्यूटर उन विशेषताओं के पैटर्न को निकाल सकता है जो दोनों को अलग करता है, भले ही यह काफी सूक्ष्म हो।

ऊपर-नीचे के दृष्टिकोण के बारे में कैसे? मुझे जर्नल ऑफ क्लिनिकल बायोलॉजी के संपादक से एक ईमेल मिलता है। यह मेरे एक पेपर को संदर्भित करता है और कहता है कि वे मेरे द्वारा एक लेख प्रकाशित करना चाहेंगे। कोई नाइजीरिया, कोई वियाग्रा, कोई मिलियन डॉलर; ईमेल में स्पैम की कोई भी विशेषता नहीं है। लेकिन जो मैं पहले से जानता हूं, उसका उपयोग करके और स्पैम का निर्माण करने वाली प्रक्रिया के बारे में एक अमूर्त तरीके से सोचकर, मैं यह पता लगा सकता हूं कि यह ईमेल वास्तव में है:

1. मुझे पता है कि स्पैमर मानव लालच की अपील करके लोगों से पैसे निकालने की कोशिश करते हैं।

2. मुझे यह भी पता है कि वैध "ओपन एक्सेस" पत्रिकाओं ने ग्राहकों के बजाय लेखकों पर शुल्क लगाकर उनकी लागत को कवर करना शुरू कर दिया है, और मैं नैदानिक जीव विज्ञान की तरह कुछ भी अभ्यास नहीं करता हूं।

उस सब को एक साथ रखो और मैं एक अच्छी नई परिकल्पना उत्पन्न कर सकता हूं कि यह ईमेल कहां से आया है। यह एक फर्जी जर्नल में एक लेख "प्रकाशित" करने के लिए भुगतान करने के लिए चूसने वाले शिक्षाविदों के लिए डिज़ाइन किया गया है। ईमेल अन्य स्पैम ईमेल की तरह ही संदिग्ध प्रक्रिया का एक परिणाम था, भले ही यह उनके जैसा कुछ भी नहीं दिखता था। मैं इस निष्कर्ष को सिर्फ एक उदाहरण से आकर्षित कर सकता हूं, और मैं अपनी परिकल्पना का परीक्षण करने के लिए आगे बढ़ सकता हूं, ईमेल में कुछ भी परे, "संपादक" को गुगली करके।

कंप्यूटर के संदर्भ में, मैंने एक "जेनेरिक मॉडल" के साथ शुरुआत की, जिसमें लालच और धोखे जैसी अमूर्त अवधारणाएं शामिल हैं और यह उस प्रक्रिया का वर्णन करती है जो ईमेल स्कैम पैदा करती है। यह मुझे क्लासिक नाइजीरियाई ईमेल स्पैम को पहचानने देता है, लेकिन यह मुझे कई तरह के संभावित स्पैम की कल्पना करने देता है। जब मुझे जर्नल ईमेल मिलता है, तो मैं पिछड़े काम कर सकता हूं: "ऐसा लगता है कि बस एक तरह का मेल है जो स्पैम-जनरेट करने वाली प्रक्रिया से बाहर निकलेगा।"

एआई के बारे में नया उत्साह आता है क्योंकि एआई शोधकर्ताओं ने हाल ही में इन दोनों सीखने के तरीकों के शक्तिशाली और प्रभावी संस्करण तैयार किए हैं। लेकिन खुद के तरीकों के बारे में कुछ भी नया नहीं है।

बॉटम-अप डीप लर्निंग

1980 के दशक में, कंप्यूटर वैज्ञानिकों ने डेटा में पैटर्न का पता लगाने के लिए कंप्यूटर प्राप्त करने के लिए एक सरल तरीका तैयार किया: कनेक्शनवादी, या तंत्रिका-नेटवर्क, वास्तुकला ("तंत्रिका" हिस्सा था, और अभी भी, रूपक है)। 1990 के दशक में दृष्टिकोण बहुत कम हो गया, लेकिन हाल ही में Google के दीपइंड जैसे शक्तिशाली "गहन-शिक्षण" तरीकों से पुनर्जीवित किया गया है।

उदाहरण के लिए, आप एक डीप-लर्निंग प्रोग्राम को "कैट, " लेबल वाले अन्य इंटरनेट छवियों का एक गुच्छा दे सकते हैं, जिन्हें "घर", और इसी तरह से लेबल किया गया है। कार्यक्रम छवियों के दो सेटों को विभेदित करने वाले पैटर्न का पता लगा सकता है और नई छवियों को सही ढंग से लेबल करने के लिए उस जानकारी का उपयोग कर सकता है। मशीन लर्निंग के कुछ प्रकार, जिन्हें अनप्रूव्ड लर्निंग कहा जाता है, बिना किसी लेबल के डेटा में पैटर्न का पता लगा सकते हैं; वे बस सुविधाओं के समूहों की तलाश करते हैं - जिसे वैज्ञानिक एक कारक विश्लेषण कहते हैं। गहन-शिक्षण मशीनों में, इन प्रक्रियाओं को विभिन्न स्तरों पर दोहराया जाता है। कुछ कार्यक्रम पिक्सेल या ध्वनियों के कच्चे डेटा से प्रासंगिक सुविधाओं की खोज भी कर सकते हैं; कंप्यूटर कच्ची छवि में पैटर्न का पता लगाने से शुरू हो सकता है जो किनारों और रेखाओं के अनुरूप है और फिर उन पैटर्नों में पैटर्न ढूंढते हैं जो चेहरे से मेल खाते हैं, और इसी तरह।

एक लंबे इतिहास के साथ एक और नीचे-अप तकनीक सुदृढीकरण सीखने है। 1950 के दशक में, जॉन वॉटसन के काम पर बीएफ स्किनर, प्रसिद्ध कबूतरों को विस्तृत कार्य करने के लिए प्रोग्राम करते थे- यहां तक कि हवा में मार करने वाली मिसाइलों को अपने लक्ष्यों (हालिया एआई की एक परेशान करने वाली गूंज) के लिए उन्हें पुरस्कार और दंड का एक विशेष कार्यक्रम देकर मार्गदर्शन करते थे। । आवश्यक विचार यह था कि जिन कार्यों को पुरस्कृत किया गया था, उन्हें दोहराया जाएगा और जिन्हें दंडित किया जाएगा, वे तब तक नहीं करेंगे जब तक कि वांछित व्यवहार प्राप्त नहीं किया गया था। स्किनर के दिन में भी, यह सरल प्रक्रिया, बार-बार दोहराए जाने से जटिल व्यवहार हो सकता है। कंप्यूटर को साधारण पैमाने पर सरल ऑपरेशन करने के लिए डिज़ाइन किया गया है जो मानव कल्पना को बौना बनाता है, और कम्प्यूटेशनल सिस्टम इस तरह से उल्लेखनीय रूप से जटिल कौशल सीख सकते हैं।

उदाहरण के लिए, Google के DeepMind के शोधकर्ताओं ने अटारी वीडियो गेम खेलने के लिए कंप्यूटर सिखाने के लिए गहरी सीखने और सुदृढीकरण सीखने के संयोजन का उपयोग किया। कंप्यूटर को कुछ भी नहीं पता था कि गेम कैसे काम करता है। यह बेतरतीब ढंग से अभिनय करके शुरू हुआ और केवल इस बारे में जानकारी मिली कि प्रत्येक क्षण स्क्रीन कैसी दिखती थी और इसने कितना अच्छा स्कोर बनाया था। दीप लर्निंग ने स्क्रीन पर सुविधाओं की व्याख्या करने में मदद की, और सुदृढीकरण सीखने ने उच्च स्कोर के लिए सिस्टम को पुरस्कृत किया। कंप्यूटर कई गेम खेलने में बहुत अच्छा लगता है, लेकिन यह पूरी तरह से दूसरों पर भी बमबारी करता है जो कि मनुष्यों के लिए मास्टर करना जितना आसान था।

गहरी शिक्षा और सुदृढीकरण सीखने के एक समान संयोजन ने दीपमाइंड के अल्फाज़ेरो की सफलता को सक्षम किया है, जो एक ऐसा कार्यक्रम है जो शतरंज और गो दोनों पर मानव खिलाड़ियों को हराने में कामयाब रहा, जो खेल के नियमों और कुछ नियोजन क्षमताओं के मूल ज्ञान से लैस है। अल्फ़ाज़ेरो की एक और दिलचस्प विशेषता है: यह अपने खिलाफ करोड़ों खेल खेलकर काम करता है। जैसा कि वह ऐसा करता है, यह गलतियों को स्वीकार करता है जिसके कारण नुकसान हुआ, और यह दोहराता है और रणनीतियों पर विस्तृत होता है जिसने जीत हासिल की। इस तरह की प्रणालियाँ, और अन्य तकनीकें जिनमें जनरेटरों के प्रतिकूल नेटवर्क शामिल हैं, डेटा उत्पन्न करने के साथ-साथ डेटा का अवलोकन भी करती हैं।

जब आपके पास उन तकनीकों को बहुत बड़े डेटा सेट या लाखों ईमेल संदेशों, इंस्टाग्राम छवियों, या वॉयस रिकॉर्डिंग में लागू करने की कम्प्यूटेशनल शक्ति होती है, तो आप उन समस्याओं को हल कर सकते हैं जो पहले बहुत कठिन लगती थीं। यह कंप्यूटर विज्ञान में बहुत अधिक उत्तेजना का स्रोत है। लेकिन यह याद रखने योग्य है कि वे समस्याएं - जैसे कि यह पहचानना कि एक छवि एक बिल्ली है या एक बोला गया शब्द सिरी है - एक मानव बच्चा के लिए तुच्छ है। कंप्यूटर विज्ञान की सबसे दिलचस्प खोजों में से एक यह है कि समस्याएं जो हमारे लिए आसान हैं (जैसे बिल्लियों की पहचान करना) कंप्यूटर के लिए कठिन हैं - शतरंज या गो खेलने की तुलना में बहुत कठिन। कंप्यूटर को वस्तुओं को वर्गीकृत करने के लिए लाखों उदाहरणों की आवश्यकता होती है जिन्हें हम कुछ के साथ वर्गीकृत कर सकते हैं। ये बॉटम-अप सिस्टम नए उदाहरणों को सामान्य कर सकते हैं; वे बिलकुल सटीक रूप से एक बिल्ली के रूप में एक नई छवि को लेबल कर सकते हैं। लेकिन वे मनुष्यों के सामान्यीकरण से काफी भिन्न तरीकों से ऐसा करते हैं। बिल्ली के चित्र के समान लगभग कुछ छवियां हमारे द्वारा बिल्लियों के रूप में पहचानी नहीं जाएंगी। अन्य जो एक यादृच्छिक धुंधला की तरह दिखते हैं।

टॉप-डाउन बायेसियन मॉडल

शीर्ष-नीचे के दृष्टिकोण ने प्रारंभिक एआई में एक बड़ी भूमिका निभाई, और 2000 के दशक में भी, संभाव्य, या बायेसियन, जेनेरेटिव मॉडल के रूप में एक पुनरुद्धार का अनुभव किया।

इस दृष्टिकोण का उपयोग करने के शुरुआती प्रयासों में दो प्रकार की समस्याओं का सामना करना पड़ा। सबसे पहले, प्रमाण के अधिकांश पैटर्न को सिद्धांत रूप में कई अलग-अलग परिकल्पनाओं द्वारा समझाया जा सकता है: यह संभव है कि मेरी पत्रिका ईमेल संदेश वास्तविक है, यह सिर्फ संभावना नहीं लगती है। दूसरा, पहले मॉडल में जेनेटिक मॉडल का उपयोग करने वाली अवधारणाएं कहां से आती हैं? प्लेटो और चॉम्स्की ने कहा कि आप उनके साथ पैदा हुए हैं। लेकिन हम कैसे समझा सकते हैं कि हम विज्ञान की नवीनतम अवधारणाओं को कैसे सीखते हैं? या छोटे बच्चे डायनासोर और रॉकेट जहाजों के बारे में भी कैसे समझ पाते हैं?

बायेसियन मॉडल जेनेरिक मॉडल और परिकल्पना परीक्षण को संभाव्यता सिद्धांत के साथ जोड़ते हैं, और वे इन दो समस्याओं को संबोधित करते हैं। एक बायेसियन मॉडल आपको यह गणना करने की सुविधा देता है कि यह एक विशेष परिकल्पना सच है, डेटा को देखते हुए। और हमारे पास पहले से मौजूद मॉडल के लिए छोटे लेकिन व्यवस्थित मोड़ देकर, और डेटा के खिलाफ उनका परीक्षण करके, हम कभी-कभी पुराने से नई अवधारणाएं और मॉडल बना सकते हैं। लेकिन ये फायदे अन्य समस्याओं से ऑफसेट हैं। बायेसियन तकनीक आपको यह चुनने में मदद कर सकती है कि दो परिकल्पनाओं में से कौन सी अधिक संभावना है, लेकिन लगभग हमेशा संभावित परिकल्पनाओं की एक विशाल संख्या होती है, और कोई भी प्रणाली कुशलता से उन सभी पर विचार नहीं कर सकती है। आप कैसे तय करते हैं कि कौन सी परिकल्पना पहली जगह में परीक्षण के लायक है?

NYU में ब्रेंडेन लेक और उनके सहयोगियों ने एक और समस्या को हल करने के लिए इस प्रकार के टॉप-डाउन तरीकों का उपयोग किया है जो लोगों के लिए आसान है लेकिन कंप्यूटर के लिए बेहद मुश्किल है: अपरिचित हस्तलिखित पात्रों को पहचानना। एक जापानी स्क्रॉल पर एक चरित्र को देखो। यहां तक कि अगर आपने इसे पहले कभी नहीं देखा है, तो आप शायद यह बता सकते हैं कि यह किसी अन्य जापानी स्क्रॉल पर एक चरित्र से समान या अलग है। आप संभवतः इसे आकर्षित कर सकते हैं और यहां तक कि एक नकली जापानी चरित्र को डिजाइन कर सकते हैं, जिसे आप देखते हैं - वह जो एक कोरियाई या रूसी चरित्र से काफी अलग दिखाई देगा।

हस्तलिखित पात्रों को पहचानने के लिए नीचे-ऊपर विधि कंप्यूटर को प्रत्येक के हजारों उदाहरण देने के लिए है और इसे मुख्य विशेषताओं को बाहर निकालने दें। इसके बजाय, लेक एट अल। कार्यक्रम को एक सामान्य मॉडल दिया कि आप एक चरित्र कैसे बनाते हैं: एक स्ट्रोक या तो दाएं या बाएं जाता है; एक को पूरा करने के बाद, आप दूसरा शुरू करते हैं; और इसी तरह। जब कार्यक्रम ने एक विशेष चरित्र को देखा, तो यह उन स्ट्रोक के अनुक्रम का अनुमान लगा सकता है, जिनके कारण इसकी संभावना सबसे अधिक थी - जैसे मैंने अनुमान लगाया कि स्पैम समर्थक उपकर ने मेरे संदिग्ध ईमेल का नेतृत्व किया। तब यह न्याय कर सकता है कि उस अनुक्रम से या एक अलग से एक नए चरित्र का परिणाम होने की संभावना थी, और यह खुद को स्ट्रोक के समान सेट का उत्पादन कर सकता है। कार्यक्रम ने एक समान डेटा पर लागू एक गहन-शिक्षण कार्यक्रम की तुलना में बहुत बेहतर काम किया, और इसने मानव के प्रदर्शन को बारीकी से दिखाया।

मशीन लर्निंग के इन दो दृष्टिकोणों में पूरक ताकत और कमजोरियां हैं। नीचे-अप दृष्टिकोण में, कार्यक्रम को शुरू करने के लिए बहुत अधिक ज्ञान की आवश्यकता नहीं होती है, लेकिन इसके लिए बहुत अधिक डेटा की आवश्यकता होती है, और यह केवल एक सीमित तरीके से सामान्य कर सकता है। टॉप-डाउन दृष्टिकोण में, कार्यक्रम केवल कुछ उदाहरणों से सीख सकता है और बहुत व्यापक और अधिक विविध सामान्यीकरण बना सकता है, लेकिन आपको इसे शुरू करने के लिए बहुत अधिक निर्माण करने की आवश्यकता है। कई अन्वेषक वर्तमान में दो दृष्टिकोणों को संयोजित करने की कोशिश कर रहे हैं, जो बायेसियन इंट्रेंस को लागू करने के लिए गहन सीखने का उपयोग कर रहे हैं।

एआई की हालिया सफलता आंशिक रूप से उन पुराने विचारों के विस्तार का परिणाम है। लेकिन इसका इस तथ्य से अधिक लेना है कि, इंटरनेट के लिए धन्यवाद, हमारे पास बहुत अधिक डेटा है, और मूर के कानून के लिए धन्यवाद हमारे पास उस डेटा को लागू करने के लिए बहुत अधिक कम्प्यूटेशनल शक्ति है। इसके अलावा, एक अप्राप्य तथ्य यह है कि हमारे द्वारा किया गया डेटा पहले से ही मनुष्यों द्वारा क्रमबद्ध और संसाधित किया गया है। वेब पर पोस्ट की गई कैट पिक्चर्स कैनोनिकल कैट पिक्चर्स- ऐसी तस्वीरें हैं जिन्हें इंसानों ने पहले से ही "अच्छी" तस्वीरों के रूप में चुना है। Google अनुवाद इसलिए काम करता है क्योंकि यह लाखों मानव अनुवादों का लाभ उठाता है और उन्हें वाक्यों को समझने के बजाय उन्हें नए पाठ के लिए सामान्यीकृत करता है।

लेकिन मानव बच्चों के बारे में वास्तव में उल्लेखनीय बात यह है कि वे किसी भी तरह प्रत्येक दृष्टिकोण की सर्वोत्तम विशेषताओं को जोड़ते हैं और फिर उनसे आगे निकल जाते हैं। पिछले पंद्रह वर्षों में, विकासवादियों ने बच्चों को डेटा से संरचना सीखने के तरीके की खोज की है। चार साल के बच्चे डेटा के सिर्फ एक या दो उदाहरण लेकर सीख सकते हैं, जैसा कि टॉप-डाउन सिस्टम करता है, और बहुत अलग अवधारणाओं को सामान्य करता है। लेकिन वे डेटा से नई अवधारणाएं और मॉडल भी सीख सकते हैं, जैसा कि एक बॉटम-अप सिस्टम करता है।

उदाहरण के लिए, हमारी प्रयोगशाला में हम छोटे बच्चों को एक "ब्लिट डिटेक्टर" -एक नई मशीन देते हैं, जिसे वे पहले कभी नहीं देख पाए हैं। यह एक ऐसा बॉक्स होता है, जब आप कुछ वस्तुओं को नहीं बल्कि दूसरों को भी संगीत देते हैं और संगीत बजाते हैं। हम बच्चों को सिर्फ एक या दो उदाहरण देते हैं कि मशीन कैसे काम करती है, उन्हें दिखाते हुए, कहते हैं, दो लाल ब्लॉक इसे बनाते हैं, जबकि एक हरा-और-पीला संयोजन नहीं होता है। यहां तक कि अठारह-महीने के बच्चे भी सामान्य सिद्धांत का तुरंत पता लगा लेते हैं कि इसे बनाने के लिए दो वस्तुओं का एक जैसा होना जरूरी है, और वे उस सिद्धांत को नए उदाहरणों के लिए सामान्य करते हैं: उदाहरण के लिए, वे दो वस्तुओं का चयन करेंगे जिनके आकार समान हैं मशीन का काम। अन्य प्रयोगों में, हमने दिखाया है कि बच्चे यह भी पता लगा सकते हैं कि कुछ छिपी हुई अदृश्य संपत्ति मशीन को बनाती है, या यह कि मशीन कुछ अमूर्त तार्किक सिद्धांत पर काम करती है।

आप इसे बच्चों की रोजमर्रा की पढ़ाई में भी दिखा सकते हैं। युवा बच्चे तेजी से जीव विज्ञान, भौतिकी और मनोविज्ञान के अमूर्त सहज ज्ञान युक्त सिद्धांतों को सीखते हैं, जो कि अपेक्षाकृत कम डेटा के साथ भी वयस्क वैज्ञानिक करते हैं।

हाल के एआई सिस्टम की उल्लेखनीय मशीन-लर्निंग उपलब्धियाँ, नीचे और ऊपर दोनों, परिकल्पनाओं और अवधारणाओं की एक संकीर्ण और अच्छी तरह से परिभाषित जगह में जगह लेती हैं - खेल के टुकड़ों और चालों का एक सटीक सेट, छवियों का एक पूर्व निर्धारित सेट । इसके विपरीत, बच्चों और वैज्ञानिकों ने कभी-कभी अपनी अवधारणाओं को कट्टरपंथी तरीकों से बदल दिया, प्रतिमानों को बदलने के बजाय केवल पहले से ही अवधारणाओं को बदल दिया।

चार वर्षीय बच्चे बिल्लियों को तुरंत पहचान सकते हैं और शब्दों को समझ सकते हैं, लेकिन वे रचनात्मक और आश्चर्यजनक नए निष्कर्ष भी बना सकते हैं जो उनके अनुभव से बहुत आगे जाते हैं। मेरे अपने पोते ने हाल ही में समझाया, उदाहरण के लिए, कि यदि एक वयस्क फिर से एक बच्चा बनना चाहता है, तो उसे किसी भी स्वस्थ सब्जियां खाने की कोशिश नहीं करनी चाहिए, क्योंकि स्वस्थ सब्जियां एक बच्चे को एक वयस्क में विकसित करती हैं। इस तरह की परिकल्पना, एक प्रशंसनीय जो कभी बड़ा नहीं होता, वह छोटे बच्चों का मनोरंजन करता है। वास्तव में, मेरे सहयोगियों और मैंने व्यवस्थित रूप से दिखाया है कि पूर्वस्कूली बड़े बच्चों और वयस्कों की तुलना में अप्रत्याशित परिकल्पना के साथ आने में बेहतर हैं। हमें इस बात का लगभग कोई अंदाजा नहीं है कि इस तरह का रचनात्मक शिक्षण और नवाचार कैसे संभव है।

हालांकि, बच्चे क्या करते हैं, यह देखते हुए, प्रोग्रामर को कंप्यूटर सीखने के निर्देशों के बारे में उपयोगी संकेत दे सकते हैं। बच्चों की सीखने की दो विशेषताएं विशेष रूप से हड़ताली हैं। बच्चे सक्रिय शिक्षार्थी हैं; वे सिर्फ निष्क्रिय नहीं करते हैं जैसे एआई करते हैं। जैसे ही वैज्ञानिक प्रयोग करते हैं, बच्चों को उनके अंतहीन खेल और अन्वेषण के माध्यम से दुनिया भर की जानकारी निकालने के लिए आंतरिक रूप से प्रेरित किया जाता है। हाल के अध्ययनों से पता चलता है कि यह अन्वेषण दिखता है की तुलना में अधिक व्यवस्थित है और परिकल्पना गठन और सिद्धांत पसंद का समर्थन करने के लिए प्रेरक सबूत खोजने के लिए अच्छी तरह से अनुकूलित है। मशीनों में जिज्ञासा पैदा करना और उन्हें दुनिया के साथ सक्रिय रूप से बातचीत करने की अनुमति देना अधिक यथार्थवादी और व्यापक सीखने का मार्ग हो सकता है।

दूसरे, बच्चे, मौजूदा एआई के विपरीत, सामाजिक और सांस्कृतिक शिक्षार्थी हैं। मनुष्य अलगाव में नहीं सीखता बल्कि पिछली पीढ़ियों के संचित ज्ञान का लाभ उठाता है। हाल के अध्ययनों से पता चलता है कि पूर्वस्कूली भी नकल के माध्यम से और दूसरों की गवाही को सुनकर सीखते हैं। लेकिन वे केवल अपने शिक्षकों का निष्क्रिय रूप से पालन नहीं करते हैं। इसके बजाय वे दूसरों से जानकारी में सूक्ष्म और संवेदनशील तरीके से जानकारी लेते हैं, इस बारे में जटिल निष्कर्ष बनाते हैं कि जानकारी कहाँ से आती है और यह कितना विश्वसनीय है और व्यवस्थित रूप से अपने स्वयं के अनुभवों को एकीकृत कर रहा है कि वे क्या सुन रहे हैं।

"आर्टिफिशियल इंटेलिजेंस" और "मशीन लर्निंग" ध्वनि डरावना। और कुछ मायनों में वे हैं। इन प्रणालियों का उपयोग हथियारों को नियंत्रित करने के लिए किया जा रहा है, उदाहरण के लिए, और हमें वास्तव में इस बारे में डरना चाहिए। फिर भी, कृत्रिम बुद्धिमत्ता की तुलना में प्राकृतिक मूर्खता कहीं अधिक कहर बरपा सकती है; हम मनुष्यों को नई तकनीकों को नियमित रूप से विनियमित करने के लिए अतीत की तुलना में अधिक होशियार होने की आवश्यकता होगी। लेकिन इंसानों की जगह लेने वाले एआई के सर्वनाश या यूटोपियन दृष्टि के लिए बहुत आधार नहीं है। जब तक हम सीखने के मूल विरोधाभास को हल नहीं करते हैं, तब तक सबसे अच्छा कृत्रिम बुद्धिमत्ता औसत मानव चार वर्षीय व्यक्ति के साथ प्रतिस्पर्धा करने में असमर्थ होगा।

आगामी संग्रह से POSSIBLE MINDS: जॉन ब्रोकमैन द्वारा संपादित AI की तलाश के 25 तरीके। पेंग्विन रैंडम हाउस एलएलसी के सदस्य पेंगुइन प्रेस के साथ व्यवस्था द्वारा प्रकाशित। कॉपीराइट © 2019 जॉन ब्रॉकमैन।