गैलप का वार्षिक सर्वेक्षण, जिसमें प्रोफेशनल्स सबसे भरोसेमंद हैं, वैज्ञानिकों के बारे में नहीं पूछते हैं, लेकिन यह कहना सुरक्षित है कि बहुत कम से कम वे कार की बिक्री करने वालों और निचले स्तर पर कांग्रेस के सदस्यों की तुलना में अधिक रैंक लेंगे।
उसी समय, विश्व स्तर पर हजारों लोगों के बीच जो विज्ञान का अभ्यास करते हैं और अपने परिणामों को प्रकाशित करते हैं, कुछ अल्पसंख्यक ध्यान-प्राप्ति (और धन-अनुकूल) परिणाम प्राप्त करने के लिए डेटा की मालिश करने के लिए प्रलोभन देते हैं। हाल के वर्षों में, यह कुछ लोगों के लिए इस संभावना को जब्त करने और जानबूझकर वैज्ञानिक धोखाधड़ी का आरोप लगाने के लिए राजनीतिक रूप से उपयोगी हो गया है। (आरोप है कि मानव-निर्मित जलवायु परिवर्तन एक व्यापक वैज्ञानिक साजिश है, जो केवल 2009 के तथाकथित क्लिमेटेट कांड के बाद से अधिक आम हो गया है, कई जांचों के बावजूद जो धोखाधड़ी या वैज्ञानिक कदाचार के किसी भी सबूत को खोजने में विफल रहे हैं।)
लेकिन वैज्ञानिक वास्तव में अपने डेटा के बारे में कितनी बार झूठ बोलते हैं? दूसरे शब्दों में, हमें उन पर कितना भरोसा करना चाहिए?
कम से कम प्रोसीडिंग्स ऑफ द नेशनल एकेडमी ऑफ साइंसेज में आज प्रकाशित एक अध्ययन के अनुसार, इसका जवाब यह है कि कुल मिलाकर, वैज्ञानिक एक बहुत ईमानदार समूह हैं। कागज में, वाशिंगटन विश्वविद्यालय के चिकित्सा शोधकर्ताओं और अन्य जगहों पर पाया गया कि नेशनल इंस्टीट्यूट ऑफ हेल्थ प्यूम्ड डेटाबेस में प्रकाशित 25 मिलियन से अधिक बायोमेडिकल अनुसंधान से संबंधित लेख जो कि 1940 के दशक में वापस आ गए थे, 2, 047 उनके बिंदु से किसी भी समय वापस ले लिए गए थे। प्रकाशन। डेटाबेस में सभी कागजात का 0.01 प्रतिशत से भी कम है।
शोधकर्ताओं ने प्रत्येक परिणाम को एक प्रकार का कारण बताने का प्रयास करते हुए अपने परिणामों को और नीचे गिरा दिया। उनके हिसाब से, 21.3 प्रतिशत ईमानदार त्रुटि के कारण थे, जैसे कि डेटा की अनजाने में गलत व्याख्या। इस बीच, 67.4 प्रतिशत प्रत्यावर्तन किसी प्रकार के कदाचार के लिए जिम्मेदार ठहराया जा सकता है, जिसमें धोखाधड़ी या निर्माण (43.4 प्रतिशत), साहित्यिक चोरी (9.8 प्रतिशत) और डुप्लिकेट प्रकाशन (14.2 प्रतिशत) शामिल हैं। जब 1975 से पहले हटाए गए लेखों के साथ तुलना की जाती है, तो बाद में पीछे हटने वालों को एक ईमानदार गलती के विपरीत, धोखाधड़ी होने की संभावना दस गुना अधिक थी।
धोखाधड़ी की समग्र मामूली दर यह बता सकती है कि ब्लॉग के लेखक रिट्रेक्शन वॉच, जो दस्तावेजों को पीछे हटाते हैं, को विरोध का सामना करना पड़ा है। कुछ लोगों का कहना है कि बेईमानी के अलग-अलग मामलों पर ध्यान देने से सीधे तौर पर विज्ञान में सार्वजनिक अविश्वास बढ़ता है। "तर्क कुछ इस तरह से चलता है, " उन्होंने मई में लैब टाइम्स में लिखा था। "वैज्ञानिक धोखाधड़ी दुर्लभ है, इसलिए कदाचार पर ध्यान केंद्रित करने से अनुसंधान का एक विकृत चित्र मिलता है जो केवल आलोचकों को गोला बारूद देगा, जो जलवायु परिवर्तन और टीका सुरक्षा जैसे विषयों पर संदेह करना चाहते हैं।"
एक प्रतिक्रिया यह हो सकती है कि हम वास्तव में यह नहीं जानते हैं कि इस नए PNAS अध्ययन में 0.01 प्रतिशत के पीछे हटने के बावजूद कितना दुर्लभ धोखाधड़ी है। जैसा कि अध्ययन के लेखकों ने ध्यान दिया, कई मामलों में एक लेख पर संदेह हो सकता है लेकिन एक पत्रिका के पास वास्तव में इसे वापस लेने के लिए पर्याप्त प्रमाण नहीं है। 2005 में, उदाहरण के लिए, द लांसेट ने एक अध्ययन के परिणामों के बारे में चिंता व्यक्त की, जिसमें भूमध्य आहार और हृदय रोग के कम जोखिम के बीच संबंध पाया गया था, लेकिन वे अंततः कागज को वापस नहीं लेते थे।
इसके अलावा, हमारे पास यह जानने का कोई तरीका नहीं है कि कितने संदिग्ध डेटा सेट कभी भी प्रकाश में नहीं आते हैं। एक गढ़ा हुआ डेटा सेट अन्य शोधकर्ताओं द्वारा प्रतिरूपनीय साबित नहीं हो सकता है, लेकिन कई मामलों में, यह संदेहजनक है कि यह उन्हें बेईमानी पर आरोप लगाने के लिए प्रेरित करेगा। ऐतिहासिक रूप से, वैज्ञानिक धोखाधड़ी के कई मामले केवल आंतरिक सीटी-ब्लोअर द्वारा उजागर होते हैं।
हाल की घटनाओं, हालांकि, यह दर्शाता है कि हम एक ऐसे युग में प्रवेश कर रहे हैं जिसमें वैज्ञानिक खोजें वास्तव में धोखाधड़ी का पता लगाने में मदद करती हैं, या कम से कम इसके कुछ प्रकार। इस पिछले जुलाई में, पेंसिल्वेनिया विश्वविद्यालय के सामाजिक मनोवैज्ञानिक उरी सिमोनशोहन ने सामाजिक मनोवैज्ञानिक डर्क स्मेस्टर्स के काम में गढ़े हुए आंकड़ों का पता लगाने के लिए एक नवीन सांख्यिकीय विश्लेषण का उपयोग करके सुर्खियां बटोरीं, जिन्होंने उपभोक्ता व्यवहार पर रंग के लिए सकारात्मक प्रभाव खोजने वाला एक पेपर लिखा था।
साइमनोशन की तकनीक जटिल है लेकिन इस तथ्य पर निर्भर करती है कि लोग वास्तविक घटनाओं में होने वाली एक ही तरह की यादृच्छिकता द्वारा विशेषता डेटा के फ़ेकिंग सेट पर कुख्यात हैं। सिमोनसोहन ने नेचर को बताया कि "मूल विचार यह देखना है कि क्या डेटा सैद्धांतिक भविष्यवाणी के बहुत करीब है, या यदि कई अनुमान एक दूसरे के समान हैं।"
स्मेस्टर्स के इस्तीफे के तुरंत बाद, साइमनोशन ने अपने एल्गोरिथ्म को सार्वजनिक किया, जिससे शोधकर्ताओं ने अपने कच्चे डेटा को प्रकाशित करने और दूसरों को परीक्षण के लिए प्रोत्साहित किया। उन्हें उम्मीद है कि किसी भी शोधकर्ता ने अपने डेटा में हेरफेर करने के लिए लुभाए जाने की वास्तविक संभावना एक शक्तिशाली निवारक के रूप में काम किया होगा। यह, सिद्धांत रूप में, न केवल धोखाधड़ी की मात्रा को कम करेगा, बल्कि यह उन विश्वासों को भी बढ़ाएगा जो हम विज्ञान के उत्पादों में समग्र रूप से डाल सकते हैं।