https://frosthead.com

द मिलियन वर्ड मार्च

यह हुआ करता था कि जो शब्द था या नहीं, उस पर विशेषज्ञ स्रोत उस स्कूल-डे स्टेपल: डिक्शनरी था। अमेरिकन हेरिटेज, वेबस्टर थर्ड, ऑक्सफोर्ड इंग्लिश: गेम में कुछ भरोसेमंद खिलाड़ी थे।

लेकिन क्या होगा अगर वे खिलाड़ी अपनी बढ़त खो रहे हैं?

शब्द ले लो "रहने"। प्रवासन, जिसका अर्थ है घर पर छुट्टी बिताना, हाल ही में न्यूयॉर्क टाइम्स, यूएसए टुडे और एमएसएनबीसी में दिखाई दिया लेकिन यह जल्द ही किसी शब्दकोश में जल्द ही प्रदर्शित होने की संभावना नहीं है। वही "ब्रैकेटोलॉजी", (एनसीएए मार्च पागलपन सट्टेबाजी का विज्ञान) फेसबुक और विकिपीडिया के लिए जाता है

अमेरिकन हेरिटेज डिक्शनरी के कार्यकारी संपादक जो पिकेट कहते हैं, "हम सबसे अधिक नमकीन" शब्दों को ढंकने की कोशिश करते हैं। "पढ़े-लिखे व्यक्ति को क्या पता होना चाहिए?"

जो लोग शब्दकोश बनाते हैं उन्हें लेक्सिकोग्राफ़र के रूप में जाना जाता है ("किसी शब्दकोश के लेखक या संपादक। धन्यवाद, मेरियम-वेबस्टर)। और उनके पास यह समय-परीक्षण करने की विधि है कि कौन से नए शब्दों को प्रमाणित करना है और कौन से शब्दकोश के वेब साइट के अगले संस्करण या अपडेट से पहले टॉस करना है।

एक शब्दकोश में संपादकों के समूह विशिष्ट विषय क्षेत्रों को देखते हैं, हिट को एक नया शब्द मिलता है। एक "हिट" एक किताब, अखबार या वेब साइट में एक उल्लेख है। फिर वे एक डेटाबेस में हिट डालते हैं और नए शब्दों की तुलना उन शब्दों से करते हैं जो उनके पास पहले से हैं। इसलिए हालांकि, फेसबुक, एक ब्रांड नाम होने के नाते, योग्य नहीं है, शेक्सपियर के नाटकों में हर शब्द शामिल है - जिसमें कैप-ए-पाई ("सिर से पैर तक") और फरदेल ("बोझ") शामिल हैं। सृजनात्मक भाषा विज्ञान की दादी होने के नाते, शेक्सपियर ने 1, 700 से अधिक शब्दों का आविष्कार किया। वे सभी एक अस्पष्ट शब्दकोश में दिखाई देते हैं।

शब्दकोश बहुत अधिक तकनीकी होने के लिए शब्दों को अस्वीकार कर देता है (यहां तक ​​कि सबसे ज्यादा मरने वाला "ग्रे की एनाटॉमी" प्रशंसक को कभी भी यह जानने की जरूरत नहीं होगी कि एक मैमोसोमैटोट्रॉफ़ क्या है) या बहुत छोटा होने (रहने के लिए)।

वे ब्रांड नामों (कोक, फेसबुक, विकिपीडिया) या अधिकांश विदेशी शब्दों और वाक्यांशों की गिनती नहीं करते हैं।

"हम विकिपीडिया बनने की कोशिश नहीं कर रहे हैं, " पिकेट ने कहा।

तो कौन है? अंग्रेजी बोलने वालों के शब्दों को रोजमर्रा के आधार पर रखने, गिनने और छांटने का ट्रैक किसने रखा है?

ऑस्टिन, टेक्स।, पिछले पांच वर्षों से शब्दों पर नज़र रख रहा है। विशेषज्ञों की अपनी टीमों और अपने एल्गोरिथ्म का उपयोग करते हुए, वे कहते हैं कि अंग्रेजी हर 98 मिनट में एक नया शब्द जोड़ती है। इसका मतलब है कि दुनिया में 900, 000 से अधिक अंग्रेजी शब्द हैं, और अप्रैल 2009 में एक-लाखवां हिस्सा दिखाई देगा।

इसके विपरीत, अधिकांश मानक शब्दकोशों में लगभग 200, 000 शब्द हैं, 600, 000 के बारे में अस्पष्ट शब्दकोष हैं।

लेकिन मॉनिटर अपने नंबरों के बारे में इतना निश्चित है कि उसने एक मिलियन वर्ड मार्च शुरू कर दिया है, एक मिलियन शब्द के लिए उलटी गिनती।

"हम मध्य अंग्रेजी में वापस गए और देखा कि एक शब्द की परिभाषा 'एक विचार बोला गया था, " पॉल जेजे पेक, मॉनिटर पर अध्यक्ष और मुख्य शब्द विश्लेषक ने कहा, "जिसका अर्थ है अगर मैं एक शब्द कहता हूं, और आप समझते हैं मेरे लिए, यह एक वास्तविक शब्द है। "

Payack शब्दों के रूप में रहने, फेसबुक और विकिपीडिया की गणना करता है। लेकिन वह कुछ पुराने नियमों का पालन भी करता है। उदाहरण के लिए, शब्द जो संज्ञा और क्रिया दोनों हैं, जैसे कि "पानी" केवल एक बार गिना जाता है। वह उन सभी नामों की गिनती नहीं करता है जो रसायनों के लिए हैं, क्योंकि वहाँ सैकड़ों हजारों हैं।

एक बार मॉनिटर एक शब्द की पहचान करता है, यह समय के साथ इसे ट्रैक करता है, यह देखने के लिए कि यह शब्द कहां दिखाई देता है। उस माप के आधार पर, वे तय करते हैं कि शब्द में "गति" है, मूल रूप से, चाहे वह अधिक लोकप्रिय हो रहा हो या अगर यह भाषाई दुनिया का एक-हिट आश्चर्य है।

पहली नज़र में, यह एक शब्दकोश प्रणाली की तरह बहुत कुछ लगता है।

"यह पुरानी [विधि] के समान है, बस नई वास्तविकता को पहचानना है, " पेक ने कहा। मॉनिटर का तरीका ऑनलाइन उद्धरणों को बहुत अधिक वजन देता है।

लेकिन क्या पेक की "नई वास्तविकता" अच्छी तरह से, वास्तविक है? उनका दावा है कि जानकारी के तेज प्रवाह और वैश्विक अंग्रेजी के आगमन ने लोगों के शब्दों के इस्तेमाल के तरीके को बदल दिया है। और यह कि लोगों द्वारा इस्तेमाल किए जाने वाले शब्दों और शब्दकोशों में दिखाई देने वाले शब्दों के बीच अंतर बढ़ सकता है।

"यह पता चला है कि एक बार कुछ इंटरनेट में प्रवेश करता है, यह एक प्रतिध्वनि कक्ष की तरह है, " पेक ने कहा। 1991 में पहला वेब ब्राउज़र दिखाई देने के बाद से, इंटरनेट ने अंग्रेजी भाषा-डॉट-कॉम, ब्लॉग में बहुत सारे शब्द जोड़े हैं और यह इन शब्दों को तेजी से जोड़ रहा है। वेब ने मौजूदा शब्दों को भी नए कानों में ले लिया है।

पिकेट ने कहा, "मिड -90 के दशक में, एक शब्द के लिए कई हजार हिट्स मिले, जिससे हमें इसमें प्रवेश करने की इच्छा हुई। अब थ्रेशोल्ड बदल गया है, " पिकेट ने कहा। "आप अस्पष्ट शब्दों और अभिव्यक्तियों के लिए बहुत सारे सबूत पा सकते हैं।"

लेकिन शब्दकोशों का उपयोग कैच-अप खेलने के लिए किया जाता है। आखिरकार, इसे गढ़ा जाने से पहले एक शब्द को परिभाषित करना मुश्किल है।

पेकैक का कहना है कि इंटरनेट पारंपरिक शब्द-गिनती पद्धति के लिए सबसे अधिक चुनौतीपूर्ण चुनौती नहीं है। उनकी राय में, "वैश्विक अंग्रेजी है।"

Payack की व्याख्या करते हुए, अंग्रेजी में लगभग 400 मिलियन देशी वक्ताओं हैं, जो इसे दुनिया में दूसरे स्थान पर रखते हैं, लेकिन इसके 1.3 बिलियन स्पीकर हैं। यह भारत में 300 मिलियन से अधिक लोगों द्वारा दूसरी भाषा के रूप में बोली जाती है, और कम से कम चीन में कई दूसरे वक्ताओं द्वारा।

"जो कोई भी अंग्रेजी बोलता है, उसे अब ऐसा लगता है कि वे इसे अपना मानते हैं, " पेक कहते हैं। उदाहरण के लिए, विशेषण "ब्रोकेबैक" देखें। निर्देशक एंग ली के बाद उनकी फिल्म दो काउबॉय के बारे में बताई गई, जो "ब्रोकेबैक माउंटेन" से प्यार करती हैं, "ब्रोकेबैक" शब्द ने अंग्रेजी में 'गे' के पर्याय के रूप में अपना रास्ता खराब कर लिया। हालांकि, "ब्रोकेबैक" संयुक्त राज्य अमेरिका में अपने गौरव के दिनों से परे हो सकता है, इस नए अर्थ के साथ शब्द, अभी भी चीन में लोकप्रिय है, पेबैक ने कहा। यह ब्लॉग और वेब साइटों पर दिखाई देता है, जिसका अर्थ है कि इसकी गति है, जिसका अर्थ है कि यह एक शब्द है।

"आजकल हमारे पास दुनिया भर में सभी दिशाओं में जाने वाले मानव यातायात अधिक हैं, " शिकागो विश्वविद्यालय में भाषा विज्ञान के प्रोफेसर सालिकोको मुफ्विन ने कहा, जिन्होंने क्षेत्रीय बोलियों के विकास का अध्ययन किया है। उदाहरण के लिए, चीनी प्रेरित शब्द अमेरिकी अंग्रेजी का हिस्सा बनेंगे या नहीं, "इस बात पर निर्भर करता है कि अमेरिकी नियमित रूप से अंग्रेजी में एशियाई लोगों के साथ बातचीत करने जा रहे हैं, " उन्होंने कहा।

और अगर वे करते हैं, तो क्या अमेरिकी औसतन अधिक क्रिया करेंगे? औसत अमेरिकी एक दिन में लगभग 7, 500 शब्दों का उपयोग करते हैं और कुल 20, 000 के बारे में जानते हैं। यहां तक ​​कि शेक्सपियर केवल 60, 000 के बारे में जानते थे।

तो अंग्रेजी भाषा में शब्दों की संख्या हमेशा कई होगी, जो किसी एक व्यक्ति को जानता है या उपयोग करता है।

मुफ्विन और अमेरिकी विरासत के पिकेट दोनों ने कहा कि अंग्रेजी में पहले से ही एक लाख शब्द हो सकते हैं। शब्दों की गिनती, सब के बाद, एक अभेद्य विज्ञान है।

यह शब्दकोश का विज्ञान भी नहीं है। शब्दकोशों का काम हमेशा से होता रहा है, मुफ्विन ने कहा, "यह प्रतिबिंबित करने के लिए कि लोग कैसे बोलते हैं, न कि उन्हें कैसे बोलना सिखाएं।" यदि शब्दकोश प्रतिबिंब संकीर्ण हो जाता है, तो यह अभी भी मूल्यवान हो सकता है।

"आपको लोगों को शब्दकोश को संपादित करने और इसकी जिम्मेदारी लेने की आवश्यकता है, ताकि यह विश्वसनीय हो, " पिकेट ने कहा। "और मुझे नहीं लगता कि यह बदलने वाला है।"

द मिलियन वर्ड मार्च