1854 में, लंदन के माध्यम से व्यापक विनाशकारी हैजा महामारी के जवाब में, ब्रिटिश चिकित्सक जॉन स्नो ने एक विचार पेश किया जो सार्वजनिक स्वास्थ्य के क्षेत्र में क्रांति लाएगा: महामारी विज्ञान का नक्शा। शहर के विभिन्न मोहल्लों में हैजा के उदाहरणों को दर्ज करके और मरीजों के आवासों के आधार पर उन्हें एक मानचित्र पर तैयार करते हुए, उन्होंने पाया कि एक भी दूषित जल पंप संक्रमण के एक महान सौदे के लिए जिम्मेदार था।
नक्शे ने उसे और - अंततः, सार्वजनिक अधिकारियों को राजी कर लिया- बीमारी का मायामा सिद्धांत (जिसमें दावा किया गया था कि बीमारियां गैसों से फैलती हैं) झूठी थीं, और यह कि रोगाणु सिद्धांत (जो सही ढंग से दावा करते थे कि सूक्ष्मजीवों को दोष देना था) सच था। वे प्रकोप के लिए जिम्मेदार पंप के हैंडल पर ताला लगाते हैं, एक प्रतिमान बदलाव का संकेत देते हैं जो स्थायी रूप से बदल जाता है कि हम संक्रामक रोगों और इस प्रकार स्वच्छता से कैसे निपटते हैं।
मैपिंग तकनीक काफी अलग है, जैसा कि बीमारी है, लेकिन स्नो के नक्शे और रोचेस्टर विश्वविद्यालय के हेनरी कौत्ज़ के नेतृत्व में शोधकर्ताओं के एक समूह द्वारा संचालित एक नई परियोजना के बीच एक निश्चित समानता है। एल्गोरिदम बनाकर, जो फ्लू के रुझानों को देख सकते हैं और सार्वजनिक रूप से उपलब्ध जियोटैगेड ट्वीट्स में कीवर्ड के आधार पर भविष्यवाणियां कर सकते हैं, वे बीमारी के संचरण का अध्ययन करने के लिए एक नया तरीका अपना रहे हैं - एक ऐसा तरीका जिससे हम अध्ययन कर सकते हैं और समाज में बीमारियों की गति को ट्रैक कर सकते हैं। ।
"हम लोगों को सेंसर के रूप में सोच सकते हैं जो उनके आसपास की दुनिया को देख रहे हैं और फिर सोशल मीडिया पर वे जो देख रहे हैं और अनुभव कर रहे हैं, उसे रिपोर्ट करते हैं, " कौत्ज़ बताते हैं। "यह हमें एक जनसंख्या पैमाने पर विस्तृत माप करने की अनुमति देता है, और सक्रिय उपयोगकर्ता की भागीदारी की आवश्यकता नहीं है।"
दूसरे शब्दों में, जब हम ट्वीट करते हैं कि हमें सिर्फ एक दर्दनाक खांसी और बुखार से कम रखा गया है, तो हम अनजाने में एक विशाल सार्वजनिक स्वास्थ्य प्रयोग के लिए समृद्ध डेटा प्रदान कर रहे हैं, ऐसी जानकारी जो शोधकर्ता फ्लू जैसी बीमारियों की गति को ट्रैक करने के लिए उपयोग कर सकते हैं। उच्च संकल्प और वास्तविक समय में।
कौतज़ की परियोजना, जिसे सोशलहेल्थ कहा जाता है, ने सार्वजनिक स्वास्थ्य के मुद्दों की एक श्रृंखला को ट्रैक करने के लिए ट्वीट्स और अन्य प्रकार के सोशल मीडिया का उपयोग किया है- हाल ही में, उन्होंने न्यूयॉर्क शहर के रेस्तरां में हर किसी को लॉग इन करके खाद्य विषाक्तता के मामलों की निगरानी करने के लिए ट्वीट्स का उपयोग करना शुरू किया एक रेस्तरां से जियोटैग किए गए ट्वीट, फिर अगले 72 घंटों के लिए उनके ट्वीट का अनुसरण करते हुए उल्टी, दस्त, पेट दर्द, बुखार या ठंड लगने के लक्षणों की जांच करते हैं। ऐसा करने पर, उन्होंने खाद्य विषाक्तता के 480 संभावित उदाहरणों का पता लगाया।
लेकिन जैसे-जैसे मौसम बदलता है, यह उनका काम है जो सबसे अधिक आंखें खोलने वाले इन्फ्लुएंजा वायरस पर नज़र रखता है। Google फ़्लू रुझान ने फ़्लू की गति को ट्रैक करने के लिए Google खोजकर्ताओं का उपयोग करने की समान रूप से मांग की है, लेकिन पिछले साल के प्रकोप को मॉडल ने बहुत कम कर दिया, शायद इसलिए कि फ़्लू के मीडिया कवरेज ने लोगों को फ़्लू से संबंधित प्रश्न बनाने शुरू कर दिए। ट्विटर विश्लेषण कुछ गुणों के साथ एक नए डेटासेट का प्रतिनिधित्व करता है - एक उच्च भौगोलिक संकल्प और समय के साथ एक उपयोगकर्ता के आंदोलन को पकड़ने की क्षमता - जो बेहतर भविष्यवाणियां दे सकता है।
अपने फ़्लू-ट्रैकिंग प्रोजेक्ट को शुरू करने के लिए, सोशल हेल्थ के शोधकर्ताओं ने विशेष रूप से न्यूयॉर्क में देखा, तीन महीने के समय के लिए 600, 000 उपयोगकर्ताओं से प्रति माह लगभग 16 मिलियन जियोटैग किए गए सार्वजनिक ट्वीट एकत्र किए। नीचे एक न्यूयॉर्क ट्विटर दिन का समय व्यतीत होता है, जिसमें विभिन्न रंग उस स्थान पर ट्वीट्स की विभिन्न आवृत्तियों का प्रतिनिधित्व करते हैं (नीले और हरे रंग का मतलब कम ट्वीट, नारंगी और लाल का मतलब अधिक होता है):
इस सभी डेटा का उपयोग करने के लिए, उनकी टीम ने एक एल्गोरिथ्म विकसित किया जो यह निर्धारित करता है कि प्रत्येक ट्वीट फ्लू जैसे लक्षणों की रिपोर्ट का प्रतिनिधित्व करता है। इससे पहले, अन्य शोधकर्ताओं ने ट्वीट्स ("बीमार, उदाहरण के लिए") में कीवर्ड खोजकर ऐसा किया था, लेकिन उनकी टीम ने पाया कि दृष्टिकोण गलत सकारात्मकता की ओर जाता है: कई और उपयोगकर्ता ट्वीट करते हैं कि वे होमवर्क से बीमार हैं। बीमार महसूस करना।
इसके लिए, उनकी टीम का एल्गोरिदम एक पंक्ति में (एक के बजाय) तीन शब्दों की तलाश करता है, और यह मानता है कि कितनी बार विशेष अनुक्रम एक बीमारी का संकेत है, ट्वीट्स के एक सेट के आधार पर वे मैन्युअल रूप से लेबल किए गए थे। उदाहरण के लिए, "फ्लू का बीमार", दृढ़ता से बीमारी से संबंधित है, जबकि "बीमार और थका हुआ" कम है। कुछ विशेष शब्द- सिरदर्द, बुखार, खांसी - दृढ़ता से बीमारी से जुड़े हुए हैं, चाहे वे तीन-शब्द अनुक्रम का हिस्सा हों।
एक बार जब इन लाखों ट्वीट्स को कोड कर लिया गया, तो शोधकर्ता उनके साथ कुछ पेचीदा बातें कर सकते थे। शुरुआत के लिए, उन्होंने समय के साथ फ्लू से संबंधित ट्वीट्स में बदलावों को देखा और उनकी तुलना सीडीसी द्वारा रिपोर्ट किए गए फ्लू के स्तर से की, जिससे पुष्टि हुई कि ट्वीट्स ने फ्लू की दरों में समग्र प्रवृत्ति पर सटीक रूप से कब्जा कर लिया है। हालांकि, सीडीसी डेटा के विपरीत, यह तथ्य के बाद एक या दो सप्ताह के बजाय लगभग वास्तविक समय में उपलब्ध है।
लेकिन वे अलग-अलग उपयोगकर्ताओं के बीच बातचीत को देखते हुए और भी गहरे होते चले गए - जैसा कि एक ही स्थान से ट्वीट करने वाले दो उपयोगकर्ताओं द्वारा दर्शाया गया है (एक ही घंटे के भीतर जीपीएस रिज़ॉल्यूशन लगभग आधा सिटी ब्लॉक है) - मॉडल करने के लिए कि यह कितना स्वस्थ व्यक्ति है फ्लू के साथ किसी के संपर्क में आने के बाद बीमार हो जाएगा। जाहिर है, एक ही ब्लॉक से 40 मिनट अलग-अलग ट्वीट करने वाले दो लोग जरूरी तौर पर व्यक्तिगत रूप से नहीं मिलते थे, लेकिन उनमें से मिलने की संभावना दो यादृच्छिक उपयोगकर्ताओं की तुलना में थोड़ी अधिक है।
नतीजतन, जब आप इंटरैक्शन के एक बड़े पर्याप्त डेटासेट को देखते हैं, तो ट्रांसमिशन की एक तस्वीर उभरती है। उन्होंने पाया कि यदि एक स्वस्थ उपयोगकर्ता 40 अन्य उपयोगकर्ताओं का सामना करता है, जो फ्लू के लक्षणों के साथ खुद को बीमार बताते हैं, तो अगले दिन फ्लू के लक्षण मिलने की उसकी संभावना एक प्रतिशत से 20 प्रतिशत तक कम हो जाती है। 60 इंटरैक्शन के साथ, यह संख्या 50 प्रतिशत तक बढ़ जाती है।
टीम ने खुद ट्विटर पर बातचीत को भी देखा, उन उपयोगकर्ताओं के जोड़े को अलग किया जो एक-दूसरे का अनुसरण करते हैं और उन्हें "दोस्ती" कहते हैं। हालांकि कई ट्विटर रिश्ते केवल वेब पर मौजूद हैं, कुछ वास्तविक जीवन की बातचीत के अनुरूप हैं, और उन्होंने पाया कि एक उपयोगकर्ता दस दोस्त हैं जो खुद को बीमार बताते हैं, अगले दिन बीमार होने की संभावना 28 प्रतिशत अधिक है। कुल मिलाकर, इन दोनों प्रकार के इंटरैक्शन का उपयोग करते हुए, उनका एल्गोरिथ्म यह अनुमान लगाने में सक्षम था कि क्या कोई स्वस्थ व्यक्ति 90 प्रतिशत सटीकता के साथ बीमार (और इसके बारे में ट्वीट) करेगा।
हम अभी भी इस शोध के शुरुआती चरणों में हैं, और बहुत सी सीमाएँ हैं: अधिकांश लोग अभी भी ट्विटर का उपयोग नहीं करते हैं (हाँ, वास्तव में) और यहां तक कि अगर वे करते हैं, तो वे बीमार होने के बारे में ट्वीट नहीं कर सकते हैं।
लेकिन अगर इस तरह की प्रणाली को और विकसित किया जा सकता है, तो सभी प्रकार के अनुप्रयोगों की कल्पना करना आसान है। उदाहरण के लिए, आपका स्मार्टफ़ोन आपको स्वचालित रूप से चेतावनी दे सकता है, यदि आप फ्लू से पीड़ित लोगों के कब्जे वाले स्थानों में बहुत अधिक समय बिताते हैं, तो आपको संक्रमण के रास्ते में खुद को रोकने के लिए घर जाने के लिए प्रेरित करता है। एक पूरे शहर के निवासियों को भी चेतावनी दी जा सकती है अगर यह प्रकोप के कगार पर थे।
जॉन स्नो की रोग-मानचित्रण सफलता से हटाए गए 150 वर्षों के बावजूद, यह स्पष्ट है कि बीमारी की जानकारी के अभी भी पहलू हैं जिन्हें हम पूरी तरह से नहीं समझते हैं। अब, तब तक, डेटा मैप करने से उत्तर प्राप्त करने में मदद मिल सकती है।