https://frosthead.com

पुराने वैज्ञानिक अध्ययन से कच्चे डेटा का विशाल बहुमत अब गायब हो सकता है

वैज्ञानिक विधि की नींव में से एक परिणाम की प्रतिलिपि प्रस्तुत करने योग्यता है। दुनिया भर में कहीं भी एक प्रयोगशाला में, एक शोधकर्ता को उसी विषय का अध्ययन करने में सक्षम होना चाहिए जो एक अन्य वैज्ञानिक के समान है और उसी डेटा को पुन: पेश करता है, या उसी डेटा का विश्लेषण करता है और उसी पैटर्न को नोटिस करता है।

यही कारण है कि वर्तमान जीवविज्ञान में आज प्रकाशित एक अध्ययन के निष्कर्ष इतने विषय हैं। जब शोधकर्ताओं के एक समूह ने 1991 और 2011 के बीच प्रकाशित 516 जैविक अध्ययन के लेखकों को ईमेल करने और कच्चे डेटा के लिए पूछने की कोशिश की, तो उन्हें यह पता लगाने में निराशा हुई कि 90 प्रतिशत सबसे पुराने डेटा (20 साल से अधिक पहले लिखे गए कागजात से) थे दुर्गम। कुल मिलाकर, यहां तक ​​कि हाल ही में 2011 तक प्रकाशित किए गए कागजात भी, वे केवल 23 प्रतिशत के लिए डेटा को ट्रैक करने में सक्षम थे।

ब्रिटिश कोलंबिया विश्वविद्यालय के एक प्राणीशास्त्री टिमोथी वाइन कहते हैं, "यदि आप पुराने अध्ययनों के डेटा के लिए एक शोधकर्ता से पूछते हैं, तो वे जानते हैं कि हेम और हौ, क्योंकि वे नहीं जानते कि यह कहां है, हर कोई जानता है।" प्रयास। "लेकिन वास्तव में कभी भी व्यवस्थित अनुमान नहीं लगाया गया था कि लेखकों द्वारा रखे गए डेटा वास्तव में कितनी जल्दी गायब हो जाते हैं।"

उनका अनुमान लगाने के लिए, उनके समूह ने एक प्रकार का डेटा चुना जो कि समय के साथ अपेक्षाकृत संगत रहा है- पौधों और जानवरों का शारीरिक माप - और इस तरह के डेटा का उपयोग करने की अवधि के दौरान प्रत्येक विषम वर्ष के लिए 25 और 40 कागजों के बीच खोदा, देखने के लिए अगर वे कच्चे नंबरों का शिकार कर सकते हैं।

उनकी जांच की एक आश्चर्यजनक राशि पहले चरण में रुकी हुई थी: 25 प्रतिशत अध्ययनों के लिए, सक्रिय ईमेल पते नहीं मिल सकते थे, कागज पर स्वयं को सूचीबद्ध पते और वेब खोजों के साथ कोई भी चालू चालू नहीं था। अन्य 38 प्रतिशत अध्ययनों के लिए, उनके प्रश्नों ने कोई प्रतिक्रिया नहीं दी। डेटा सेट का एक और 7 प्रतिशत खो गया था या दुर्गम था।

"कुछ समय, उदाहरण के लिए, इसे साढ़े तीन इंच फ्लॉपी डिस्क पर सहेजा गया था, इसलिए कोई भी इसे एक्सेस नहीं कर सकता था, क्योंकि उनके पास अब उचित ड्राइव नहीं था, " वाइन कहते हैं। क्योंकि डेटा रखने का मूल विचार यह है कि इसका उपयोग भविष्य के अनुसंधान में दूसरों द्वारा किया जा सकता है, इस प्रकार की अप्रचलन अनिवार्य रूप से डेटा को बेकार कर देता है।

ये सांसारिक बाधाओं की तरह लग सकते हैं, लेकिन वैज्ञानिक हम में से बाकी लोगों की तरह ही हैं - वे ईमेल पते बदलते हैं, उन्हें अलग-अलग ड्राइव के साथ नए कंप्यूटर मिलते हैं, वे अपने फ़ाइल बैकअप को खो देते हैं - इसलिए ये रुझान विज्ञान में गंभीर, प्रणालीगत समस्याओं को दर्शाते हैं।

और डेटा को संरक्षित करना बहुत महत्वपूर्ण है, यह याद रखने योग्य है, क्योंकि यह भविष्यवाणी करना असंभव है कि भविष्य में किन दिशाओं में अनुसंधान आगे बढ़ेगा। मसलन, वाइन पूर्वी यूरोप के मूल निवासी टॉड प्रजातियों की एक जोड़ी पर अपना शोध कर रही है, जो संकरण की प्रक्रिया में लगती हैं। 1980 के दशक में, वे कहते हैं, शोधकर्ताओं की एक अलग टीम एक ही विषय पर काम कर रही थी, और 1930 के दशक में इन टॉड्स के वितरण का दस्तावेजीकरण करने वाले एक पुराने कागज पर आया था। यह जानते हुए कि उनके वितरण में हस्तक्षेप के दशकों में अपेक्षाकृत कम परिवर्तन हुआ था, जिससे वैज्ञानिकों को सभी प्रकार की गणना करने की अनुमति मिली जो अन्यथा संभव नहीं थी। "मूल डेटा पोलिश में लिखे गए एक बहुत छोटे अध्ययन से उपलब्ध है, 70 साल बाद आने वाले शोधकर्ताओं के लिए अविश्वसनीय रूप से उपयोगी था, " वे कहते हैं।

इस तथ्य पर भी ध्यान दिया जाता है कि इस शोध का अधिकांश हिस्सा सार्वजनिक धन के लिए दिया जाता है, इसका अधिकांश हिस्सा ऐसे अनुदानों के माध्यम से आता है जो कि परिणामी डेटा को स्वतंत्र रूप से जनता के लिए उपलब्ध कराया जाता है। इसके अतिरिक्त, फ़ील्ड डेटा उस वातावरण की परिस्थितियों से प्रभावित होता है जिसमें इसे एकत्र किया जाता है - इस प्रकार, बाद में पूरी तरह से दोहराने पर असंभव है, जब स्थितियां बदल गई हैं।

इसका क्या उपाय है? कुछ पत्रिकाओं-जिनमें आणविक पारिस्थितिकी शामिल है, जिनमें से वाइन एक प्रबंध संपादक है- ने ऐसी नीतियां अपनाई हैं जिनके लिए लेखकों को अपने कागजात के साथ कच्चे डेटा को प्रस्तुत करने की आवश्यकता होती है, जिससे पत्रिका स्वयं को डेटा को अनित्यता में संग्रहीत करने की अनुमति देती है। यद्यपि पत्रिकाओं, लोगों की तरह, ईमेल पते और तकनीकी अप्रचलन को बदलने के लिए अतिसंवेदनशील होते हैं, इन समस्याओं को संस्थागत पैमाने पर आसानी से प्रबंधित किया जा सकता है।

पुराने वैज्ञानिक अध्ययन से कच्चे डेटा का विशाल बहुमत अब गायब हो सकता है