https://frosthead.com

अब ट्यूरिंग टेस्ट विजुअल हो जाता है

फेसबुक के एल्गोरिदम आपके चेहरे को भीड़ से बाहर निकाल सकते हैं (या कम से कम प्रयास करें), लेकिन यह अभी भी नहीं बता सकता है कि क्या आप एक परिवार के चित्र में प्रस्तुत कर रहे हैं या दोस्तों के साथ पी रहे हैं - यह आपको नहीं बता सकता है कि आप दूसरों के साथ कैसे बातचीत कर रहे हैं । हालांकि भविष्य में, कंप्यूटर ऐसा करने में सक्षम हो सकता है। अब शोधकर्ताओं ने यह पता लगाने का एक तरीका प्रस्तावित किया है कि दृश्य पहचान में स्मार्ट कंप्यूटर कैसे हैं। वे अपने परीक्षण को विजुअल ट्यूरिंग टेस्ट कहते हैं, कंप्यूटर वैज्ञानिक एलन ट्यूरिंग के परीक्षण के बाद कि क्या कंप्यूटर मानव जैसी बुद्धि प्रदर्शित कर सकता है।

परीक्षण की लोकप्रिय धारणा यह है कि इसका उपयोग कंप्यूटरों से मनुष्यों को अलग करने के लिए किया जाता है - और एक संस्करण का उपयोग उस प्रभाव के लिए किया जाता है, जब आप एक नए ईमेल के लिए साइन अप करने के लिए कैप्चा करते हैं। लेकिन कृत्रिम बुद्धिमत्ता शोधकर्ता वास्तव में परीक्षण के बारे में सोचते हैं कि यह मापने का तरीका है कि कंप्यूटर की उन्नत बुद्धि अब तक कितनी उन्नत है।

ब्राउन यूनिवर्सिटी के गणित के प्रोफेसर स्टुअर्ट जेमन और शोधकर्ताओं ने नए मूल्यांकन का प्रस्ताव देते हुए कहा, '' हाल के वर्षों में कंप्यूटर की दृष्टि में कुछ प्रभावशाली प्रगति हुई है। "हमने महसूस किया कि इन प्रणालियों का मूल्यांकन और बेंचमार्क कैसे किया जाता है, इसके संदर्भ में बार उठाने का समय हो सकता है।"

केवल यह मानने के बजाय कि एक छवि दो लोगों को दिखाती है, परीक्षण यह देखता है कि क्या कंप्यूटर यह पता लगा सकते हैं कि दो लोग बातचीत कर रहे हैं या एक तर्क भी। वर्तमान में, शोधकर्ता अपने कार्यक्रमों का परीक्षण करने के लिए सार्वजनिक रूप से उपलब्ध डेटा सेट का उपयोग करते हैं- MIT में LableMe है, जो उदाहरण के लिए, छवियों में "कार, " "ट्री, " और "बिल्डिंग" की पहचान करने के लिए क्राउडसोर्सिंग का उपयोग करता है। इस पर सुधार करने और एक बड़ी चुनौती पेश करने के लिए, ब्राउन पर आधारित शोधकर्ताओं ने एक मानकीकृत दृश्य ट्यूरिंग परीक्षण के लिए एक रूपरेखा तैयार की।

IEEE स्पेक्ट्रम रिपोर्ट के लिए ली गोम्स:

उनकी प्रस्तावित विधि मानव परीक्षण-डिजाइनरों को कुछ विशेषताओं की एक सूची विकसित करने के लिए बुलाती है, जो एक तस्वीर हो सकती है, जैसे कि एक सड़क दृश्य में लोग हैं या क्या लोग कुछ भी ले जा रहे हैं या एक दूसरे के साथ बात कर रहे हैं। इन मानदंडों पर तस्वीरों को पहले मनुष्यों द्वारा हाथ से बनाया जाएगा; एक कंप्यूटर विज़न सिस्टम को फिर "जवाब" के बिना एक ही तस्वीर दिखाई जाएगी, यह निर्धारित करने के लिए कि क्या यह पता लगाने में सक्षम था कि मनुष्य क्या देखा था।

प्रारंभ में, प्रश्न अल्पविकसित होंगे, यह पूछते हुए कि क्या चित्र के निर्दिष्ट क्षेत्र में कोई व्यक्ति है, उदाहरण के लिए। लेकिन जैसे-जैसे कार्यक्रम अधिक परिष्कृत होते गए, जटिलताएँ बढ़ती गईं; अधिक जटिल प्रश्न चित्र में विभिन्न लोगों के बीच बातचीत की प्रकृति को शामिल कर सकता है।

टीम ने नेशनल एकेडमी ऑफ साइंसेज की कार्यवाही में परीक्षण का वर्णन किया। अब तक, जर्मन का कहना है कि कोई भी कंप्यूटर प्रणाली नए परीक्षण के सरल संस्करणों को भी पारित नहीं कर सकती है। लेकिन वे भविष्य में करेंगे। चूंकि किसी भी तस्वीर के लिए कई संभावित विशेषताएं हैं, इसलिए शोधकर्ताओं को अपने कंप्यूटरों के लिए फोटो का आकलन करने के लिए अभिनव तरीकों के साथ आना होगा।

जेमन बयान में कहते हैं, "शोधकर्ताओं के रूप में, हम 'टेस्ट को पढ़ाने' के लिए जाते हैं।" “अगर कुछ निश्चित प्रतियोगिताएँ हैं जो हर किसी के प्रवेश हैं और वे सफलता के उपाय हैं, तो हम उसी पर ध्यान केंद्रित करते हैं। इसलिए परीक्षण को बदलना, वर्तमान दृष्टि प्रणालियों की पहुंच से बाहर रखना बुद्धिमानी भरा हो सकता है। ”

अब ट्यूरिंग टेस्ट विजुअल हो जाता है