https://frosthead.com

बिग डेटा बस आईबीएम के वाटसन के रूप में बड़ा हो गया है जीवन के विश्वकोश को पूरा करता है

2, 000 वर्षों के बाद, जीवन का अंतिम विश्वकोश एक नए डेटा-संचालित युग की समाप्ति पर है। नेशनल साइंस फाउंडेशन के एक अनुदान को द इनसाइक्लोपीडिया ऑफ लाइफ (ईओएल), आईबीएम और जॉर्जिया इंस्टीट्यूट ऑफ टेक्नोलॉजी से सम्मानित किया गया है। अनुदान बड़े पैमाने पर डेटा को संसाधित करने और उन तरीकों से पार करने में सक्षम करेगा जो ग्राउंडब्रेकिंग विज्ञान को करने की अनुमति देगा।

संबंधित सामग्री

  • प्रस्तावित न्यू मरीन रिज़र्व सिस्टम लॉबस्टर और लॉबस्टर फिशरमैन दोनों के लिए रोज़ी आउटलुक प्रदान करता है

77 ईस्वी में, प्लिनी द एल्डर ने दुनिया का पहला विश्वकोश, प्राकृतिक इतिहास लिखना शुरू किया इसमें एस्ट्रोनॉमी से लेकर वनस्पति विज्ञान से लेकर जंतु विज्ञान से लेकर मानवशास्त्र तक सब कुछ शामिल था। प्लिनी ने वह सब कुछ डालने का प्रयास किया जो व्यक्तिगत रूप से प्राकृतिक दुनिया के बारे में एक ही लिखित कार्य में इकट्ठा कर सकता था। पिछले 2, 000 वर्षों से, प्लिनी से प्रेरित वैज्ञानिकों के एक लंबे उत्तराधिकार ने एक ही दृष्टि का पीछा किया है।

प्लिनी ने 36 खंडों में 20, 000 विषयों को शामिल किया, लेकिन एक मानव जीवन काल के भीतर एक अकेला व्यक्ति क्या खोज, रिकॉर्ड और प्रक्रिया कर सकता है, इसकी सीमाओं में भाग गया। माउंट वेसुवियस के विस्फोट के दौरान उनकी मृत्यु हो गई, इससे पहले कि वह अपने मैग्नम ऑपस का अंतिम संपादन पूरा कर सकें। यहां तक ​​कि अपने स्वयं के युग में, एक व्यक्ति के लिए सभी पुस्तकों को पढ़ना, सभी चीजों को सीखना और दुनिया को यह सब समझाना संभव नहीं था।

जैसा कि बाद के वैज्ञानिकों, संपादकों और पुस्तकालयाध्यक्षों ने एक ऐसी दुनिया में खोजा, जो प्रत्येक गुजरते साल के साथ अधिक लिखित ज्ञान को जोड़ता है, भले ही आप दुनिया की सभी पुस्तकों और शोधों को एक इमारत में संग्रहीत कर सकें, यह सभी प्रासंगिक सूचनाओं को उपलब्ध कराना एक चुनौती है। शोधकर्ताओं ने अपने संक्षिप्त मानव जीवन की सीमाओं के दौरान।

ईओएल जैविक डेटा के संग्रह को अलग करने के लिए अत्याधुनिक कम्प्यूटेशनल शक्ति को लागू करके इसे बदलने में सक्षम हो सकता है। परियोजना जैव विविधता तथ्यों, लेखों और मल्टीमीडिया का एक स्वतंत्र और खुला डिजिटल संग्रह है, जो दुनिया में सबसे बड़ा है। स्मिथसोनियन इंस्टीट्यूशन में और इसके 357 भागीदारों और सामग्री प्रदाताओं सहित हार्वर्ड विश्वविद्यालय और मिस्र में अलेक्जेंड्रिया की नई लाइब्रेरी के साथ, ईओएल 30, 000 पृष्ठों से बढ़ गया है जब यह 2008 में 2 मिलियन से अधिक पाठ, मैप्स के 1.3 मिलियन पृष्ठों के साथ लॉन्च हुआ।, वीडियो, ऑडियो और तस्वीरें, और 20 भाषाओं का समर्थन करता है।

"मैं सॉफ्टवेयर उद्योग से 2010 में स्मिथसोनियन आया था, " ईओएल के निदेशक बॉब कोरिगन कहते हैं। उन्होंने कहा, '' मैंने यहां आने वाली खोजों में से एक यह है कि आईटी हर जगह है, लेकिन इसने संग्रहालय की दुनिया में उसी तरह प्रवेश नहीं किया है जिस तरह से यह वाणिज्यिक दुनिया में प्रवेश कर चुका है। विशेष रूप से जीव विज्ञान में, सबसे महत्वपूर्ण डेटा पाठ्यपुस्तकों और स्प्रेडशीट में दफन किया गया है। ”

पृथ्वी पर जीवन की नई अंतर्दृष्टि के लिए विभिन्न रूपों में जैविक डेटा को कैसे संयोजित और खनन किया जा सकता है? यदि एक दशक में अफ्रीका में तितलियों की जैव विविधता खेती की प्रथाओं और वर्षा के आंकड़ों के साथ संयुक्त हो जाए, तो क्या होगा? क्या कुछ नया सीखा जा सकता है? ऐसा करने के लिए मानव मस्तिष्क की तुलना में कुछ बड़ा होता है। आईबीएम के वाटसन सुपर कंप्यूटर जैसा कुछ।

ईओएल के कार्यक्रम निदेशक जेनिफर हैमॉक का कहना है, "आईबीएम [वाटसन के एक संस्करण] के लिए प्रयास और पहुंच में योगदान दे रहा है।" उन्होंने कहा, '' वे लोग भी इस पर काम कर रहे हैं। आईबीएम यह एक तरह के योगदान के रूप में कर रहा है। ”

वॉटसन एक सुपर कंप्यूटर है जो बड़े संस्करणों में संख्याओं की कमी नहीं करता है। यह उपयोगकर्ताओं को सादे भाषा में प्रश्न पूछने की अनुमति देने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करता है।

"मैं एक उपयोगकर्ता के दृष्टिकोण से कहूंगा, इसका मतलब है कि डेटाबेस एक ऐसी चीज है जिसे आप चल सकते हैं और एक प्रश्न पूछ सकते हैं जैसे कि आप एक इंसान के हैं, " हैमॉक कहते हैं। "जैसे, क्या आप मुझे बता सकते हैं कि क्या यह बैंगनी तितली अफ्रीका में होती है?"

"किसी भी भाषा में एक सरल प्रश्न का उत्तर देना पर्दे के पीछे बहुत सारे ज्ञान की मौजूदगी को मानता है, " कोरिगन कहते हैं। "यहां तक ​​कि" शब्द] बैंगनी, यह मानता है कि हम जानते हैं कि बैंगनी क्या है। या एक तितली, [कंप्यूटर] को एक तितली और एक पतंगे के बीच अंतर को समझना होगा। इसके शीर्ष पर, डेटा सेट में स्वयं इन अलग-अलग शब्दों के बारे में सोचने के विभिन्न तरीके हैं। यह सब डेटा शर्तों के रोसेटा पत्थर के बिना मेरा होना मुश्किल है। और यह ईओएल क्या कर रहा है के जादू का हिस्सा है। "

एक वैज्ञानिक सवाल है कि ईओएल, आईबीएम और जॉर्जिया टेक के बीच साझेदारी को हल करने की उम्मीद है, प्लवक का विरोधाभास है।

हैमॉक के अनुसार, कंप्यूटर सिमुलेशन के साथ काम करने वाले वैज्ञानिक "मॉडल में यह बताने की कोशिश करते हैं कि समुद्र में ऐसा क्या होता है कि सूरज चमकता है और शैवाल बढ़ता है। । । इसमें किसी न किसी प्रकार का सन्निकटन होता है, लेकिन वे स्थिर होने के लिए [पारिस्थितिकी तंत्र के कंप्यूटर मॉडल] को प्राप्त नहीं कर सकते हैं। वे थोड़ी देर के लिए जाते हैं और फिर दुर्घटनाग्रस्त हो जाते हैं। क्योंकि वे बहुत सरल हैं। उन्हें उम्मीद है कि अगर वे अपने मॉडल वाले जीवमंडल में थोड़ी अधिक विविधता दिखा सकते हैं, तो वे और अधिक स्थिर हो जाएंगे। । । । विरोधाभास होने के नाते: महासागर जीवमंडल कैसे मौजूद है? यह दुर्घटना क्यों नहीं है?

"लोग डेटा पर बैठे हैं, " कोरिगन कहते हैं। “पूरे ग्रह में जैव विविधता माप के अविश्वसनीय भंडार हैं। मुझे ऐसे लोगों से बहुत सारे फोन आते हैं जो इस डेटा पर बैठे हैं और इसे व्यापक संदर्भ में रखने में मदद चाहते हैं। यह महत्वपूर्ण है क्योंकि हम इस ग्रह का अध्ययन करने की दौड़ में हैं और सीखते हैं कि हमारा विकास हमारे बहुत ही सीमित संसाधनों पर जोर दे रहा है। । । स्मिथसोनियन इन सभी स्रोतों से ज्ञान की वृद्धि में भूमिका निभा सकता है और इसे फैलाने के लिए एक वास्तविक शक्ति हो सकता है। ”

$ 1 मिलियन अनुदान के एक चौथाई को स्मिथसोनियन को काम के अपने हिस्से के लिए सम्मानित किया जाएगा, लेकिन ईओएल में बहुत सारे अन्य खिलाड़ी शामिल हैं। कुछ डेवलपर्स मिस्र में हैं; एक शिक्षा दल हार्वर्ड से बाहर आधारित है; और स्पेनिश भाषा इकाई मेक्सिको सिटी में है।

ईओएल के सभी डेटा सार्वजनिक डोमेन में या क्रिएटिव कॉमन्स के तहत लाइसेंस प्राप्त करना जारी रखेंगे। अनुसंधान और डेटा का उद्देश्य सार्वजनिक रूप से सुलभ होना है और भुगतान के पीछे छिपा नहीं है।

"यह एक बहुत पुराना सपना है, " हैमॉक कहते हैं। “एक इंसान शायद यह सब नहीं सीख सकता। यह सब कुछ एक जगह पर रखना मुश्किल है, जहां इसे सचेत रूप से खुद के खिलाफ जांचा जा सके। लेकिन अब हमारे पास कंप्यूटर हैं। ”

प्लिनी या तो बहुत प्रसन्न होगी या बहुत ईर्ष्या करेगी।

बिग डेटा बस आईबीएम के वाटसन के रूप में बड़ा हो गया है जीवन के विश्वकोश को पूरा करता है