https://frosthead.com

कैसे मार्गरेट Dayhoff जीवविज्ञान के लिए आधुनिक कम्प्यूटिंग लाया

1984 में, नेशनल बायोमेडिकल रिसर्च फाउंडेशन ने एक मुफ्त ऑनलाइन डेटाबेस लॉन्च किया जिसमें 283, 000 से अधिक प्रोटीन अनुक्रम थे। आज प्रोटीन सूचना संसाधन दुनिया भर के वैज्ञानिकों को एक अज्ञात प्रोटीन लेने की अनुमति देता है, इसकी तुलना डेटाबेस में मौजूद हजारों ज्ञात प्रोटीनों से करता है, और उन तरीकों को निर्धारित करता है जिनमें यह एक जैसा और अलग है। उस डेटा से वे प्रोटीन के विकास के इतिहास और जीवन के विभिन्न रूपों के संबंध में जल्दी और सही कटौती कर सकते हैं।

इस विशाल ऑनलाइन डेटाबेस की विनम्र उत्पत्ति इंटरनेट से बहुत पहले शुरू होती है। यह सब प्रोटीन सीक्वेंस एंड स्ट्रक्चर के एटलस के साथ शुरू हुआ, 1965 की मुद्रित पुस्तक जिसमें 65 तत्कालीन ज्ञात प्रोटीन अनुक्रम थे, जो मार्गरेट डेहॉफ नामक एक महिला द्वारा संकलित किया गया था। अपने एटलस को बनाने के लिए, डेहॉफ़ ने जैविक प्रश्नों के समाधान खोजने के लिए अत्याधुनिक कंप्यूटर तकनीकों को लागू किया, एक नए क्षेत्र के जन्म में मदद करने के लिए जिसे अब हम जैव सूचना विज्ञान कहते हैं। मूल रूप से एक रसायनज्ञ, डेहॉफ़ ने द्वितीय विश्व युद्ध के बाद के युग के अग्रणी उपकरणों के लिए नई और विकसित तकनीकों का उपयोग किया, जो कि केमिस्ट, जीवविज्ञानी और खगोलविद एक जैसे पृथ्वी पर जीवन की उत्पत्ति के अनुशासनात्मक अध्ययन में उपयोग कर सकते थे।

डेहॉफ़ (तब मार्गरेट ओकले) का जन्म 11 मार्च, 1925 को रूथ क्लार्क, एक हाई स्कूल गणित शिक्षक और केनेथ ओकली, एक छोटे व्यवसाय के मालिक, फिलाडेल्फिया में हुआ था। दस साल की उम्र में, उनका परिवार न्यूयॉर्क शहर चला गया। वहाँ, उन्होंने सार्वजनिक स्कूलों में भाग लिया, आखिरकार 1942 में बेयसाइड हाई के वेलेडकोरियन बन गए। उन्होंने न्यूयॉर्क विश्वविद्यालय के वाशिंगटन स्क्वायर कॉलेज में भाग लिया, जो कि 1945 में सिर्फ तीन साल बाद गणित में मेग्ना कम लॉड के स्नातक थे।

उसी वर्ष, प्रमुख रसायनज्ञ और द्वितीय विश्व युद्ध के संचालन शोधकर्ता जॉर्ज किमबॉल की सलाह के तहत क्वांटम रसायन विज्ञान में पीएचडी करने के लिए डेहॉफ़ ने कोलंबिया विश्वविद्यालय में प्रवेश किया। उसकी स्वीकृति उस समय के लिए दुर्लभ थी। WWII के बाद, अधिक पुरुषों ने विज्ञान में प्रवेश किया, और पिछले दशक की तुलना में रसायन विज्ञान और भी अधिक पुरुष-प्रधान हो गया, केवल पांच प्रतिशत रसायन विज्ञान पीएचडी महिलाओं के लिए जा रहा था, आठ प्रतिशत से नीचे।

विश्वविद्यालय में डेहॉफ़ के समय, कंप्यूटिंग तकनीक के लिए कोलंबिया एक गर्म स्थान था। इसने अमेरिका में पहली कंप्यूटिंग प्रयोगशालाओं में से कुछ पर गर्व किया, और 1945 में खगोलविद डब्ल्यूजे एकर्ट के नेतृत्व में आईबीएम वाटसन साइंटिफिक लैबोरेटरी का घर बन गया। Watson lab ने सबसे पहले WWII के अंतिम महीनों में मित्र राष्ट्रों के लिए एक कंप्यूटिंग केंद्र के रूप में कार्य किया था। युद्ध के बाद, यह कुछ पहले सुपर कंप्यूटरों को विकसित करने के लिए एक साइट बन गया, जिसमें सेलेक्टिव सीक्वेंस इलेक्ट्रॉनिक कैलकुलेटर (एसएसईसी) शामिल था, जिसे बाद में एकर्ट ने अपोलो मिशनों के लिए चंद्र कक्षाओं की गणना करने के लिए उपयोग किया था।

अपनी उंगलियों पर इस तकनीक के साथ, डेहॉफ़ ने रसायन विज्ञान में अपनी रुचि को छिद्रित-कार्ड मशीनों के माध्यम से कंप्यूटिंग के साथ जोड़ा - अनिवार्य रूप से डिजिटल कंप्यूटर के साथ। मशीनों ने डेहॉफ़ को कार्ड और डेटा के एक सेट पर एक एल्गोरिथ्म का भंडारण करते हुए, उसकी गणना को स्वचालित करने की अनुमति दी। मशीन का उपयोग करके, वह हाथ से कहीं अधिक तेजी से और सही तरीके से गणना करने में सक्षम थी।

डेहॉफ़ की रुचि का विशेष विषय पॉलीसाइक्लिक कार्बनिक यौगिक थे, जो अणु हैं जो तीन या अधिक परमाणुओं से मिलकर होते हैं जो एक करीबी रिंग में शामिल होते हैं। उसने आणविक बंधन और बंधन दूरियों की संभावना को निर्धारित करने के लिए अणुओं की गुंजयमान ऊर्जा (एक विशेष राज्य और औसत राज्य की अणु की संभावित ऊर्जा के बीच अंतर) पर बड़ी संख्या में गणना करने के लिए छिद्रित-कार्ड मशीनों का उपयोग किया।

डेहॉफ़ ने मात्र तीन वर्षों में क्वांटम रसायन विज्ञान में डॉक्टरेट की उपाधि प्राप्त की। एक स्नातक छात्र के रूप में उन्होंने जो शोध किया, वह प्रकाशित किया गया था, 1949 में किमबॉल के साथ, केमिकल फिजिक्स जर्नल में रेजोनेंस एनर्जी के पंच्ड कार्ड गणना के साधारण शीर्षक के तहत।

इसके अलावा 1948 में, डेहॉफ़ ने प्रायोगिक भौतिकी में एक छात्र एडवर्ड डेहॉफ़ से शादी की, जिनसे वह कोलंबिया में मिले थे। 1952 में, यह जोड़ी वाशिंगटन, डीसी चली गई, जहां एडवर्ड ने नेशनल ब्यूरो ऑफ स्टैंडर्ड्स में एक पद संभाला और डेहॉफ़ ने अपनी पहली दो बेटियों, रूथ को जन्म दिया। डेहॉफ़ जल्द ही रुथ और उनकी छोटी बेटी जूडिथ के लिए एक घर पर रहने वाली माँ बनने के लिए अनुसंधान से बाहर हो गईं, मैरीलैंड विश्वविद्यालय में दो साल के पोस्टडॉक्टरल पद के लिए बचाएं।

जब वह शोध करने के लिए वापस लौटीं और 1962 में अपने काम को पूरा करने के लिए अनुदान के लिए आवेदन करने लगीं, तो एक झटके में उनकी मुलाकात हुई। नेशनल इंस्टीट्यूट ऑफ हेल्थ ने एक अनुदान आवेदन को खारिज कर दिया, जिसमें डेहॉफ़ को प्रमुख अन्वेषक के रूप में सूचीबद्ध किया गया था, इस स्पष्टीकरण के साथ कि "[डेहॉफ़] कुछ समय के लिए अंतरंग स्पर्श से बाहर रहा है ... इस जटिल और तेजी से आगे बढ़ने वाले क्षेत्र के साथ, " इतिहासकार ब्रून स्ट्रैसर के रूप में लिखते हैं। उनकी आगामी पुस्तक कलेक्टिंग एक्सपेरिमेंट्स: मेकिंग बिग डेटा बायोलॉजी । बच्चों को पालने के लिए समय निकालने वाली महिलाओं के लिए इस तरह की कठिन चढ़ाई सिर्फ एक तरीका है जिससे वैज्ञानिक संस्थान रुके हुए हैं- और महिलाओं की उन्नति में बाधा बने हुए हैं।

NIH के समर्थन में कमी के बावजूद, डेहॉफ़ अपने करियर के सबसे परिणामी दशक में प्रवेश करने वाली थी। 1960 में, उन्होंने रॉबर्ट लेडली के एक अग्रणी निमंत्रण को स्वीकार किया, जो कि उनके पति के माध्यम से मिले थे, जो कि उनके पति के माध्यम से सिल्वर स्प्रिंग, मैरीलैंड में नेशनल बायोमेडिकल रिसर्च फाउंडेशन में शामिल होने के लिए उनसे मिलीं। लेडले को पता था कि कंप्यूटिंग, जीव विज्ञान और चिकित्सा के क्षेत्रों के संयोजन के लिए डेहॉफ का कंप्यूटर कौशल नींव के लक्ष्य के लिए महत्वपूर्ण होगा। वह 21 साल तक उनकी सहयोगी निर्देशक के रूप में काम करेंगी।

एक बार मैरीलैंड में, डेहॉफ ने जॉर्ज टाउन विश्वविद्यालय के ब्रांड-न्यू आईबीएम 7090 मेनफ्रेम के उपयोग के लिए स्वतंत्र रूप से लगाम लगाई थी। आईबीएम प्रणाली को जटिल अनुप्रयोगों को संभालने के लिए डिज़ाइन किया गया था, जिसमें कंप्यूटिंग गति पिछले मॉडल की तुलना में छह गुना तेज है। तेज, अधिक कुशल ट्रांजिस्टर (1s और 0s कंप्यूटर का निर्माण करने वाले घटक) के साथ धीमी, बल्क वैक्यूम वैक्यूम प्रौद्योगिकी को प्रतिस्थापित करके यह गति प्राप्त की गई थी। मेनफ्रेम का उपयोग करते हुए, डेहॉफ और लेडले ने फोरट्रान कार्यक्रमों के साथ पेप्टाइड अनुक्रमों की खोज शुरू की और कहा कि उन्होंने पूर्ण प्रोटीन में आंशिक दृश्यों को इकट्ठा करने के प्रयास में खुद को लिखा था।

आईबीएम 7090 आईबीएम 729 चुंबकीय टेप ड्राइव के दो बैंकों के साथ 1961 में नासा एम्स रिसर्च सेंटर में आईबीएम 7090 ऑपरेटर का कंसोल। (नासा)

जीव विज्ञान और रसायन विज्ञान के लिए कंप्यूटर विश्लेषण को लागू करने के लिए डेहॉफ और लेडले की प्रतिबद्धता असामान्य थी। "सांख्यिकीय विश्लेषण की संस्कृति, डिजिटल कंप्यूटिंग के अकेले चलो, अधिकांश [जैव रसायनविदों] के लिए पूरी तरह से विदेशी थे, " स्मिथसोनियन डॉट कॉम के साथ एक साक्षात्कार में स्ट्रैसर बताते हैं। "कुछ ने खुद को 'सिद्धांतवादी' न होने के लिए प्रेरित किया, जो कि गणितीय मॉडल का उपयोग करते हुए डेटा विश्लेषण को कैसे समझते हैं।"

एक वैज्ञानिक अनुशासन जहां डेहॉफ के कंप्यूटर प्रेमी की सराहना की गई थी, हालांकि, खगोल विज्ञान था। कंप्यूटिंग में यह रुचि WJ Eckhart के लिए धन्यवाद थी, जिन्होंने 1940 में आईबीएम पंच-कार्ड मशीनों का उपयोग ग्रहों की कक्षाओं की भविष्यवाणी करने के लिए किया था। और 1960 के दशक में, अंतरिक्ष अन्वेषण में अमेरिकी रुचि पूरे जोरों पर थी, जिसका अर्थ था नासा के लिए धन। मैरीलैंड विश्वविद्यालय में, डेहॉफ़ ने स्पेक्ट्रोस्कोपिस्ट एलिस लिपिंकॉट से मुलाकात की, जिसने उन्हें 1961 में हार्वर्ड में कार्ल सागन के साथ छह साल के सहयोग से लाया। इन तीनों ने पदार्थ के रासायनिक श्रृंगार के थर्मोडायनामिक मॉडल विकसित किए, और डेहॉफ़ ने एक कंप्यूटर प्रोग्राम तैयार किया। ग्रहों के वायुमंडल में गैसों के संतुलन सांद्रता की गणना कर सकता है।

डेहॉफ के कार्यक्रम के साथ, वह, लिप्पिनकोट और सागन विश्लेषण करने के लिए एक तत्व चुनने में सक्षम थे, जिससे उन्हें कई अलग-अलग वायुमंडलीय रचनाओं की जांच करने की अनुमति मिली। अंततः, उन्होंने शुक्र, बृहस्पति, मंगल और यहां तक ​​कि पृथ्वी के एक आदिम वातावरण के लिए वायुमंडलीय मॉडल विकसित किए।

आसमान की खोज करते हुए, डेहॉफ ने एक सवाल भी उठाया कि शोधकर्ता कम से कम 1950 के दशक से खोज कर रहे थे: प्रोटीन का कार्य क्या है? जवाब में प्रोटीन प्राप्त करना एक साधन था, लेकिन व्यक्तिगत प्रोटीन का अनुक्रमण अत्यधिक अक्षम था। डेहॉफ और लेडले ने एक अलग दृष्टिकोण लिया। अलगाव में प्रोटीन का विश्लेषण करने के बजाय, उन्होंने विभिन्न पौधों और जानवरों की प्रजातियों से प्राप्त प्रोटीन की तुलना की। स्ट्रैसर कहते हैं, "विभिन्न प्रजातियों में एक ही प्रोटीन के अनुक्रम की तुलना करके, कोई भी यह देख सकता है कि अनुक्रम के कौन से हिस्से हमेशा सभी प्रजातियों में समान थे, एक अच्छा संकेत है कि अनुक्रम का यह हिस्सा प्रोटीन की भलाई के लिए महत्वपूर्ण था, " स्ट्रैसर कहते हैं।

डेहॉफ ने प्रोटीन के साझा इतिहास को देखते हुए गहराई से जांच की। उसने न केवल उन हिस्सों पर विश्लेषण किया जो प्रजातियों में समान थे, बल्कि उनकी विविधताएं भी थीं। "वे इन अंतरों को प्रजातियों के बीच विकासवादी दूरियों के एक उपाय के रूप में लेते हैं, जिससे उन्हें फ़ाइलोजेनेटिक पेड़ों को फिर से संगठित करने की अनुमति मिलती है, " स्ट्रैसस बताते हैं।

डेहॉफ, हमेशा नई तकनीक की शक्ति का उपयोग करने के लिए तैयार है, प्रोटीन अनुक्रमों को निर्धारित करने के लिए कम्प्यूटरीकृत तरीके विकसित किए हैं। उसने कैंडिडा कवक से व्हेल तक विभिन्न प्रकार की प्रजातियों में प्रोटीन का एक कंप्यूटर विश्लेषण चलाया। फिर उसने अपने पुश्तैनी रिश्तों को निर्धारित करने के लिए अपने मतभेदों का इस्तेमाल किया। 1966 में, रिचर्ड ईक की मदद से, डेहॉफ़ ने एक फ़ाइलोजेनेटिक पेड़ का पहला पुनर्निर्माण बनाया।

1969 के वैज्ञानिक अमेरिकी लेख में, "प्रोटीन विकास के कंप्यूटर विश्लेषण, " डेहॉफ़ ने प्रोटीन के अनुक्रमण के लिए कंप्यूटर का उपयोग करते हुए अपने शोध के साथ इन पेड़ों में से एक को जनता के सामने प्रस्तुत किया। "प्रत्येक प्रोटीन अनुक्रम जो स्थापित किया गया है, प्रत्येक विकासवादी तंत्र जो प्रबुद्ध है, जो कि फाइटोलैनेटिक इतिहास में प्रत्येक प्रमुख नवाचार है जो सामने आया है वह जीवन के इतिहास के बारे में हमारी समझ में सुधार करेगा।" वह जीवन विज्ञान समुदाय को कम्प्यूटरीकृत मॉडल की क्षमता दिखाने की कोशिश कर रहा था।

उसका अगला लक्ष्य सभी ज्ञात प्रोटीनों को एक स्थान पर इकट्ठा करना था, जहां शोधकर्ता अनुक्रमों को ढूंढ सकते थे और उनकी तुलना दूसरों से कर सकते थे। आज के विपरीत, जब केवल एक कीवर्ड के साथ इलेक्ट्रॉनिक डेटाबेस पर स्रोतों को कॉल करना आसान होता है, तो डेहॉफ को उन प्रोटीनों को खोजने के लिए भौतिक पत्रिकाओं को परिमार्जन करना पड़ता था जिन्हें वह खोज रहे थे। कई उदाहरणों में, इसका मतलब है कि त्रुटियों के लिए साथी शोधकर्ता के काम की जाँच करना। यहां तक ​​कि एक कंप्यूटर की सहायता से, अनुक्रमों को इकट्ठा करने और सूचीबद्ध करने के काम के लिए समय की प्रचुर मात्रा और एक बुद्धिमान वैज्ञानिक आंख की आवश्यकता होती है।

हर कोई मूल्य नहीं देखता था कि वह क्या कर रही है। अन्य शोधकर्ताओं के लिए, डेहॉफ के काम ने 20 वीं शताब्दी के वैज्ञानिक के प्रयोगात्मक कार्य के बजाय 19 वीं शताब्दी के प्राकृतिक इतिहास के संग्रह और कैटलॉगिंग कार्य के समान था। स्टैसर कहते हैं, "प्रकृति की चीजों को एकत्र करना, तुलना करना और वर्गीकृत करना 20 वीं शताब्दी के उत्तरार्ध में कई प्रायोगिक जीवविज्ञानी के लिए पुराने जमाने का लग रहा था।" वह एक बाहरी व्यक्ति के रूप में डेहॉफ़ को संदर्भित करता है। "" वह एक ऐसे क्षेत्र में योगदान करती है जो मौजूद नहीं था और इस तरह कोई पेशेवर मान्यता नहीं थी, "वे कहते हैं।

1965 में, डेहॉफ़ ने पहली बार अपने डेटाबेस के एक मुद्रित संस्करण, प्रोटीन अनुक्रम और संरचना के एटलस में 65 ज्ञात प्रोटीनों के अपने संग्रह को प्रकाशित किया। आखिरकार डेटा चुंबकीय टेप में चला गया, और अब यह ऑनलाइन रहता है जहां शोधकर्ता हजारों और प्रोटीन खोजने के लिए अपने डेटा का उपयोग करना जारी रखते हैं। अन्य बायोमेडिकल डेटाबेस फ्रेट में शामिल हो गए हैं, जिसमें प्रोटीन डेटा बैंक, 1971 में शुरू किया गया प्रोटीन और न्यूक्लिक एसिड का एक सहयोगी संग्रह और 1982 में शुरू किए गए आनुवंशिक अनुक्रम डेटाबेस जेनबैंक शामिल हैं। डेहॉफ़ ने एक वैज्ञानिक क्रांति शुरू की।

"आज, प्रायोगिक जीव विज्ञान में हर एक प्रकाशन में नए प्रयोगात्मक डेटा का संयोजन होता है और सार्वजनिक डेटाबेस में उपलब्ध कराए गए अन्य डेटा के साथ तुलना से तैयार किए गए निष्कर्ष, एक दृष्टिकोण जो डेढ़ सदी पहले शुरू हुआ था, " स्ट्रैसर कहते हैं।

जैसे-जैसे जैव सूचना विज्ञान बढ़ता गया, संग्रह और संगणना के कार्य काफी हद तक महिलाओं के लिए गिर गए। एटलस पर डेहॉफ़ के सहयोगी लेडले को छोड़कर सभी महिलाएं थीं। 1960 के दशक में NASA की महिलाओं के "कंप्यूटर" और द्वितीय विश्व युद्ध के महिला कोडब्रेकर्स की तरह, इन महिलाओं को जल्द ही वैज्ञानिक अभ्यास के हाशिये पर धकेल दिया गया। जेनिफर लाइट की गणना करने वाले इतिहासकार, पहले डिजिटल, सामान्य प्रयोजन वाले कंप्यूटर को प्रोग्राम करने वाली "ENIAC लड़कियों" का जिक्र करते हुए लिखते हैं कि "यह ठीक ऐसे निम्न दर्जे के व्यावसायिक वर्गीकरणों की परिधि में है जो महिलाएं अभूतपूर्व काम में लगी थीं।"

डेहॉफ की जीवनी संबंधी रेखाचित्र में, उनके साथ एटलस पर काम करने वाले लोइस टी। हंट ने लिखा है कि डेहॉफ़ का मानना ​​है कि पृथ्वी के आदिकालीन वातावरण में उनकी जाँच उन्हें "जीवन के निर्माण के लिए आवश्यक यौगिक" दे सकती है। यह, शायद इससे भी अधिक। कंप्यूटिंग, क्या Dayhoff के वैज्ञानिक अनुसंधान के अलग-अलग हिस्सों को एक साथ जोड़ता है। छोटे प्रोटीन से विशाल वातावरण तक, डेहॉफ़ इस ग्रह पर जीवन के उद्भव के रहस्यों की खोज कर रहे थे। हालांकि उसने उन सभी को अनलॉक नहीं किया, लेकिन उसने खोज जारी रखने के लिए आधुनिक विज्ञान को उपकरण और तरीके दिए।

कैसे मार्गरेट Dayhoff जीवविज्ञान के लिए आधुनिक कम्प्यूटिंग लाया