बड़ा डेटा या बहुत अधिक जानकारी? | नवाचार | स्मिथसोनियन - लेख, ब्लॉग, नवाचार, नवाचार, विज्ञान, प्रौद्योगिकी और अंतरिक्ष

हम सभी जानते हैं कि हमारी दुनिया में पहले की तुलना में बहुत अधिक जानकारी है जो पहले हुआ करती थी। के रूप में कितना अधिक करने के लिए, ठीक है, हम में से ज्यादातर बहुत स्पष्ट हैं।

संबंधित सामग्री

विज्ञान के माध्यम से इन्फोग्राफिक्स विज्ञान के दृश्य सौंदर्य को उजागर करते हैं
Google फ़्लू ट्रेंड फ़्लू को ट्रैक नहीं कर सकता (फिर भी)

यहां आईबीएम में सुपरकंप्यूटर विकास के प्रभारी डेव ट्यूरेक की तारीफ के बारे में उस जानकारी के बारे में एक अनमोल डला है: वर्ष 2003 से और मानव इतिहास की शुरुआत के पीछे काम करते हुए, हमने आईबीएम की गणना के अनुसार, पांच एक्साबाइट्स उत्पन्न किए। पांच बिलियन गीगाबाइट की जानकारी। पिछले साल तक, हम हर दो दिनों में उस डेटा को क्रैंक कर रहे थे। अगले साल तक, ट्यूरेक की भविष्यवाणी करता है, हम इसे हर 10 मिनट में करेंगे।

लेकिन यह कैसे संभव है? ऐसे डिजिटल कुडज़ू कैसे बने डेटा? सीधे शब्दों में कहें, हर बार जब आपका सेल फोन अपना जीपीएस स्थान भेजता है, तो हर बार जब आप ऑनलाइन कुछ खरीदते हैं, तो हर बार जब आप फेसबुक पर लाइक बटन पर क्लिक करते हैं, तो आप एक बोतल में एक और डिजिटल संदेश डाल रहे होते हैं। और अब महासागर उनके साथ बहुत अधिक आच्छादित हैं।

और यह कहानी का केवल एक हिस्सा है। पाठ संदेश, ग्राहक रिकॉर्ड, एटीएम लेनदेन, सुरक्षा कैमरा छवियां ... सूची आगे बढ़ती है। इसका वर्णन करने का मूलमंत्र "बिग डेटा" है, हालांकि यह मुश्किल से हमारे द्वारा बनाए गए राक्षस के पैमाने के साथ न्याय करता है।

यह तकनीक का नवीनतम उदाहरण है जो इसे इस्तेमाल करने की हमारी क्षमता को बढ़ाता है। इस मामले में, हमने सूचनाओं को पकड़ने की हमारी क्षमता को पकड़ना शुरू नहीं किया है, यही वजह है कि इन दिनों प्रबंधन पंडितों की एक पसंदीदा ट्रॉप यह है कि भविष्य उन कंपनियों और सरकारों का है जो सभी डेटा का बोध करा सकते हैं। संग्रह, अधिमानतः वास्तविक समय में।

ऐसे व्यवसाय जो प्रत्येक डिजिटल ब्रेडक्रम्ब की व्याख्या कर सकते हैं, उनके ग्राहक पीछे छूट जाते हैं, सोच में बढ़त होती है - न केवल वह जो पिछले एक घंटे में खरीदा है - लेकिन क्या उन्होंने इसके बारे में ट्वीट किया है या सामाजिक नेटवर्क के चक्कर में कहीं फोटो पोस्ट किया है। वही उन शहरों के लिए जाता है जो हजारों सेंसर से डेटा इकट्ठा कर सकते हैं जो अब डॉट शहरी परिदृश्य हैं और शहर के जीवन की जटिलताओं को चालू करते हैं, जैसे कि यातायात प्रवाह, एक विज्ञान में।

आश्चर्य की बात नहीं है कि राजनीतिक अभियान पहले से ही “नानोटार्गेटिंग” मतदाताओं पर अपना ध्यान केंद्रित करने के लिए डेटा का जमकर इस्तेमाल कर रहे हैं, ताकि वे ठीक से जान सकें कि उन्हें अपने वोट और पैसे के लिए कैसे पिच करना है। न्यू यॉर्क टाइम्स के स्तंभकार थॉमस एडसॉल के अनुसार, विश्लेषकों ने निष्कर्ष निकाला है कि क्या रिपब्लिकन "द ऑफिस" और क्रैकर बैरल रेस्तरां के लिए वरीयता दिखाते हैं, जबकि डेमोक्रेट के लिए "लेट नाइट विद डेविड लेटरमैन को देखने और चक ई पर खाने की अधिक संभावना है। । पनीर।

डिजिटल फ्लैट्ससम की व्याख्या करने की यह हड़बड़ी बताती है कि क्यों पिछले सप्ताह Google ने घोषणा की कि वह एक उत्पाद बेचना शुरू कर देगा, जिसे बिगविक कहते हैं, सॉफ्टवेयर जो सेकंड में टेराबाइट्स की जानकारी को स्कैन कर सकता है। और स्प्लंक नाम का एक स्टार्टअप क्यों, जिसमें ऐसी तकनीक है जो भारी मात्रा में ग्राहक और लेनदेन डेटा का विश्लेषण कर सकता है, पिछले महीने सार्वजनिक होने के दिन इसके शेयरों का मूल्य लगभग 90 प्रतिशत चढ़ गया। यह, पिछले साल 11 मिलियन डॉलर का नुकसान उठाने वाली कंपनी के लिए।

डेटा वैज्ञानिक का उदय

लेकिन यहां तक कि सर्वश्रेष्ठ डेटा डिक्रीफ़रिंग टूल तक पहुंच महान ज्ञान की गारंटी नहीं है। बहुत कम कंपनियों के पास प्रशिक्षण के साथ कर्मचारी हैं जो न केवल डेटा के पहाड़ों का मूल्यांकन करने के लिए-जिनमें लाखों फेसबुक पेजों और स्मार्ट फोन से असंरचित tidbits का भार शामिल है - बल्कि वास्तव में इसके साथ कुछ करने के लिए भी।

पिछले साल मैक्किंसे ग्लोबल इंसेंटेज ने "बिग डेटा" को "इनोवेशन के लिए अगला फ्रंटियर" बताते हुए एक रिपोर्ट जारी की, लेकिन यह भी भविष्यवाणी की कि 2018 तक अमेरिका में कंपनियों के पास आवश्यक विश्लेषणात्मक कौशल के लिए प्रतिभा की गंभीर कमी होगी- कई 190, 000 लोग। और यह दावा करता है कि एक और 1.5 मिलियन प्रबंधकों को अपने रास्ते में आने वाले आंकड़ों के धार के साथ रणनीतिक निर्णय लेने के लिए प्रशिक्षित करने की आवश्यकता होगी।

हालांकि, हर कोई बिग डेटा के जादू में विश्वास करने वाला नहीं है। पीटर फादर, पेन के व्हार्टन स्कूल ऑफ बिजनेस में मार्केटिंग के प्रोफेसर हैं, उन्होंने इस बात पर यकीन नहीं किया कि अधिक डेटा बेहतर है। ऐसा नहीं है कि उन्हें लगता है कि किसी कंपनी को अपने ग्राहकों के बारे में उतना जानने की कोशिश नहीं करनी चाहिए। यह सिर्फ इतना है कि अब हर बिट डेटा एकत्र करने पर इतना ध्यान केंद्रित है कि वह सोचता है कि सच्चे विश्लेषण पर मात्रा का मूल्य है।

यहां एमआईटी की प्रौद्योगिकी समीक्षा के साथ हाल ही में एक साक्षात्कार से फादर का कहना है : “अतीत के व्यवहार के अनंत ज्ञान के साथ, हमारे पास भविष्य के बारे में सार्थक भविष्यवाणियां करने के लिए अक्सर पर्याप्त जानकारी नहीं होगी। वास्तव में, हमारे पास जितना अधिक डेटा होगा, उतना ही गलत विश्वास होगा ... महत्वपूर्ण हिस्सा यह समझना है कि हमारी सीमाएं क्या हैं और अंतराल को भरने के लिए सर्वोत्तम संभव विज्ञान का उपयोग करना है। दुनिया का सारा डेटा हमारे लिए वह लक्ष्य कभी हासिल नहीं करेगा। ”

आपका डेटा कौन है?

बड़ी समस्याओं को हल करने के लिए बिग डेटा का उपयोग कैसे किया जा रहा है, इसका नमूना यहां दिया गया है:

वे जानते हैं कि जब वे खराब या अच्छे रहे हैं: जबकि अधिकांश कंपनियां अपने ग्राहकों के विश्लेषण पर ध्यान केंद्रित कर रही हैं, अमेज़ॅन बिग डेटा का उपयोग करके उनकी मदद करने के लिए अंक स्कोर कर रहा है।
स्टड का अध्ययन: आप जानना चाहते हैं कि कौन से बैल सबसे अधिक दूध देने वाली गायों को पालते हैं? डेयरी उद्योग ने संख्या को कम करने का एक तरीका तैयार कर लिया है।
डेटा द्वारा निदान: SUNY बफ़ेलो के शोधकर्ता यह निर्धारित करने के लिए अपने प्रयास में डेटा के बड़े पैमाने पर सेट का विश्लेषण कर रहे हैं कि क्या मल्टीपल स्केलेरोसिस और पर्यावरणीय कारकों के बीच एक कड़ी है, जैसे कि सूर्य के प्रकाश के पर्याप्त संपर्क नहीं।
परेशानी की तलाश: रिकॉर्डेड फ्यूचर नामक कंपनी सामाजिक नेटवर्क और सरकारी और वित्तीय साइटों से खनन की जानकारी देती है ताकि यह अनुमान लगाया जा सके कि जनसंख्या वृद्धि, पानी की कमी और चरम मौसम भविष्य की राजनीतिक अशांति और आतंकवाद का कारण कैसे बन सकते हैं।

वीडियो बोनस: डेटा पर कब्जा करना एक बात है। यह आकर्षक और समझ में आता है एक पूरी अन्य चुनौती है। इस टेड टॉक में "सूचना मानचित्र" की शक्ति पर डेविड मैककंडलेस मोम।