https://frosthead.com

एक लेखक ने महान लेखन के रहस्यों को प्रकट करने के लिए सांख्यिकी का उपयोग किया

अधिकांश कॉलेज-स्तरीय साहित्य पाठ्यक्रमों में, आप छात्रों को साहित्यिक क्लासिक्स के छोटे भागों को विच्छेदित करते हुए पाते हैं: शेक्सपियर के एकांतवाद, जोयस की चेतना की धारा और हेमिंग्वे के स्टैकाटो वाक्यों को। इसमें कोई संदेह नहीं है, एक लेखक, उसके शिल्प और एक कहानी के अर्थ के बारे में इतना कुछ सीखा जा सकता है कि वह इस प्रकार के नज़दीक से पढ़ सके।

लेकिन बेन ब्लाट दूसरे दृष्टिकोण के लिए एक मजबूत तर्क देता है। कुछ वाक्यों और पैराग्राफों पर ध्यान केंद्रित करके, वह अपनी नई पुस्तक, नाबोकोव का पसंदीदा शब्द मौवे है, पाठकों को अन्य सभी शब्दों की उपेक्षा कर रहे हैं, जो औसत-लंबाई की उपन्यास राशि में हजारों डेटा बिंदुओं पर हैं।

पत्रकार और सांख्यिकीविद ने 20 वीं सदी के क्लासिक्स और बेस्टसेलर के एक पाठ से डेटाबेस का निर्माण किया, जो कि ब्याज के कई सवालों का जवाब देता है। उनके विश्लेषण से कुछ विचित्र पैटर्न का पता चला है जो अन्यथा किसी का ध्यान नहीं जा सकता है:

संख्याओं के अनुसार, उपन्यासों के लिए सबसे अच्छे शुरुआती वाक्य संक्षिप्त होते हैं। विपुल लेखक जेम्स पैटरसन प्रति 100, 000 शब्दों पर 160 क्लिच का औसत (जो कि जेन ऑस्टेन की तुलना में 115 अधिक है), और व्लादिमीर नाबोकोव ने पिछली दो शताब्दियों में औसत लेखक की तुलना में 44 बार मौवे शब्द का इस्तेमाल किया।

Smithsonian.com ने ब्लाट के साथ उनकी विधि, उनके कुछ महत्वपूर्ण निष्कर्षों और साहित्य के अध्ययन के लिए बड़ा डेटा क्यों महत्वपूर्ण है, के बारे में बात की।

आपने कहां के वाल्डो से सीनफेल्ड तक, फास्ट फूड जोड़ों से लेकर पॉप गानों तक सभी का अध्ययन करने के लिए एक सांख्यिकीय दृष्टिकोण लिया है। क्या आप अपनी विधि समझा सकते हैं, और आप जो करते हैं वह क्यों करते हैं?

मैं एक डेटा पत्रकार हूं, और मैं पॉप संस्कृति और कला में चीजों को देखता हूं। मैं वास्तव में मात्रात्मक और निष्पक्ष चीजों को देखना पसंद करता हूं जिसमें बहुत सारी जानकारी होती है जो लोगों को नहीं हुई है। यदि आप यह जानना चाहते हैं कि संयुक्त राज्य का विशिष्ट व्यक्ति कैसा है, तो यह उपयोगी होगा, लेकिन आप सिर्फ एक व्यक्ति से बात नहीं करेंगे, उनके बारे में सब कुछ जानेंगे और फिर मान लेंगे कि संयुक्त राज्य में लोगों के बारे में सब कुछ है वही। मुझे लगता है कि इस तरह के लेखन के साथ एक चीज खो जाती है कि आप एक लेखक द्वारा एक वाक्य पर ध्यान केंद्रित कर सकते हैं, विशेष रूप से रचनात्मक लेखन कक्षाएं, या एक मार्ग में, और आप इन सामान्य पैटर्न और रुझानों को देखने के लिए बड़ी तस्वीर खो देते हैं, जो लेखक उपयोग कर रहे हैं बार-बार, सैकड़ों और शायद हजारों बार अपने लेखन में।

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

नाबोकोव का पसंदीदा शब्द है मौवे: क्लासिक्स, बेस्टसेलर और हमारे अपने लेखन के बारे में संख्याएँ क्या बताती हैं

खरीदें

तो आपने साहित्य की ओर क्या रुख किया?

मेरी पृष्ठभूमि गणित और कंप्यूटर विज्ञान में है, लेकिन मुझे पढ़ना और लिखना हमेशा पसंद रहा है। जैसा कि मैं अधिक से अधिक लिख रहा था, मुझे बहुत दिलचस्पी थी कि विभिन्न लेखक और लोग लेखन सलाह कैसे देते हैं। इसमें बहुत कुछ है जो समझ में आता है लेकिन ऐसा लगता है कि जानकारी द्वारा समर्थित नहीं है, और यह बहुत कुछ है जो एक-दूसरे के साथ विवादित है। मैंने सोचा था कि इन विषयों को लिखित रूप में लेने का एक तरीका था कि लोग पहले से ही अच्छी तरह से जानते थे और बात कर रहे थे और उन्हें महान लेखकों और लोकप्रिय लेखकों पर परीक्षण करने के लिए यह देखने के लिए कि क्या यह सलाह वास्तविक है या यदि यह पूर्व निर्धारित सलाह है कि क्या नहीं है ' वास्तविक पुस्तकों और वास्तविक पृष्ठों में वास्तव में कुछ भी नहीं है।

साहित्यिक क्लासिक्स और बेस्टसेलर के बारे में पूछने वाला पहला सवाल क्या था?

पुस्तक में पहला अध्याय इस बात की सलाह पर है कि आपको-विशेषणों का उपयोग करना चाहिए या नहीं। यह पहला अध्याय है जिसे मैंने कालानुक्रमिक रूप से लिखा है। यह ज्यादातर स्टीफन किंग की सलाह पर है कि वे अपनी किताब ऑन राइटिंग में विशेषण का प्रयोग न करें, जो कि बहुत सारे लेखकों के लिए लेखन के लिए किताब है। लेकिन बहुत सारे अन्य लेखक- टोनी मॉरिसन, चक पलहिन्युक और किसी भी रचनात्मक लेखन वर्ग ने सलाह दी है कि किसी भी शब्द का प्रयोग न करें क्योंकि यह एक अनावश्यक शब्द है और यह संकेत है कि आप संक्षिप्त नहीं हो रहे हैं। कहने के बजाय, "वह जल्दी से भागा, " आप कह सकते हैं, "वह छिड़का।"

इसलिए मैं जानना चाहता था कि क्या यह वास्तव में सच है? यदि यह ऐसी अच्छी सलाह है, तो आप उम्मीद करेंगे कि महान लेखक वास्तव में इसका कम उपयोग करें। आपको उम्मीद होगी कि शौकिया लेखक इसे प्रकाशित लेखकों की तुलना में अधिक उपयोग कर रहे हैं। मैं सिर्फ सच में जानना चाहता था, शैलीगत रूप से, पहले अगर स्टीफन किंग ने अपनी सलाह का पालन किया, और फिर अगर यह अन्य सभी महान और पूजनीय लेखकों पर लागू होता है।

तो, आपने क्या पाया?

वास्तव में, एक प्रवृत्ति है कि हेमिंग्वे, मॉरिसन और स्टाइनबेक जैसे लेखक, उनकी सबसे अच्छी किताबें, जो लोग आयोजित किए जाते हैं और उन पर अब सबसे अधिक ध्यान दिया जाता है, वे सबसे कम मात्रा वाली विशेषण वाली किताबें हैं। इसके अलावा, यदि आप शौकिया फिक्शन लेखन और ऑनलाइन लेखन की तुलना करते हैं, जो हाल के दिनों के बेस्टसेलर और पुलित्जर पुरस्कार विजेताओं के साथ एकजुट है, तो एक विसंगति है, जहां प्रकाशित लेखकों द्वारा कम-विशेष रूप से कहावत का उपयोग किया जाता है। मैं इतना एकतरफा नहीं हूं कि मुझे लगता है कि आप सिर्फ-एक विशेषण को एक अच्छी किताब से निकाल सकते हैं और यह एक महान पुस्तक बन जाती है। जाहिर है कि यह कैसे काम करता है। लेकिन इस तथ्य के बारे में कुछ है कि जो लेखक बहुत सीधे तरीके से लिख रहे हैं, वे ऐसी पुस्तकों का उत्पादन करते हैं जो कुल मिलाकर सबसे लंबे समय तक रहते हैं।

p13 - Adverbs.JPG

साहित्यिक कृतियों का एक डेटाबेस बनाने के बारे में आप कैसे गए?

कई प्रश्नों के लिए, मैं उन्हीं 50 लेखकों का उपयोग कर रहा था जिन्हें मैंने कुछ मनमाने ढंग से चुना था। मूलतः यह उन लेखकों पर आधारित था जो बेस्टसेलर सूची के शीर्ष पर थे, लेखक जो सभी समय की सूची के सबसे महान लेखकों और शीर्ष लेखकों पर थे जो कि विभिन्न शैलियों और समय और पाठकों की एक श्रृंखला का प्रतिनिधित्व करते थे। इस तरह, पूरे पुस्तक में, आप इन लेखकों की तुलना कर सकते हैं और उन्हें जान सकते हैं।

यह मेरे लिए बहुत महत्वपूर्ण था कि अगर मैंने कुछ कहा, "इस दर पर टोनी मॉरिसन इस शब्द का उपयोग करता है, " मैं हर एक उपन्यास के बारे में बात कर रहा था जो उसने कभी लिखा है और केवल तीन नहीं है जो मैं पहले से ही करता हूं। मेरी पुस्तक में, ५० से १०० लेखक हैं, जो पूरे संदर्भ में हैं। मुझे उनकी ग्रंथ सूची मिली और फिर उनके सभी उपन्यास मिले जो उन्होंने उस बिंदु तक लिखे थे जो उनके पूर्ण रिकॉर्ड के रूप में थे। कुछ मायनों में, यह खेल के आंकड़ों को रखने जैसा है, जहां प्रत्येक पुस्तक एक सीज़न की तरह होती है और फिर ये सभी सीज़न या किताबें एक कैरियर के रूप में एक साथ आती हैं। आप देख सकते हैं कि लेखक समय के साथ कैसे बदलते हैं और वे समग्र रूप से कैसे करते हैं। एक बार जब आपके पास फाइल पर सभी किताबें होती हैं, तो इन सवालों का जवाब देना कि कुछ मायनों में बहुत कठिन है, बहुत ही सीधा है।

और आपने उस सभी पाठ को कैसे संसाधित किया?

एक प्रोग्रामिंग भाषा है जिसे पायथन कहा जाता है, और उसके भीतर, प्राकृतिक भाषा टूलकिट नामक उपकरण का एक सेट होता है, जिसे अक्सर NLKK संक्षिप्त किया जाता है। इसमें शामिल उपकरण किसी के लिए भी स्वतंत्र रूप से उपलब्ध हैं। आप पैकेज को ऑनलाइन डाउनलोड कर सकते हैं और इसे पायथन या अन्य भाषाओं में उपयोग कर सकते हैं। आप विशेष रूप से कई लेखन प्रश्न नहीं प्राप्त कर सकते हैं, लेकिन आप कह सकते हैं कि यह शब्द पाठ में कितनी बार दिखाई देता है? इसके माध्यम से जा सकते हैं और पहचान सकते हैं कि वाक्य कहाँ समाप्त होते हैं और कहाँ वाक्य शुरू होते हैं, और भाषण के कुछ हिस्सों - विशेषण बनाम क्रिया विशेषण बनाम क्रिया। तो एक बार जब आपके पास वे उपकरण होंगे, तो आप डेटा प्राप्त कर सकते हैं।

आपने कौन से आँकड़े मैन्युअल रूप से संकलित किए हैं? सबसे थकाऊ क्या था?

एक सेक्शन है जहां मैं शुरुआती वाक्यों को देखता हूं। एलमोर लियोनार्ड, जो एक बहुत ही सफल उपन्यासकार थे, ने कहा था, "मौसम के साथ कभी कोई पुस्तक न खोलें।" इसलिए मैंने सैकड़ों लेखकों के माध्यम से देखा कि वे मौसम पर अपनी पुस्तक को कितनी बार खोलते हैं। उदाहरण के लिए, डैनियल स्टील, मेरा मानना ​​है कि पुस्तकों में उसके पहले वाक्य का 45 प्रतिशत मौसम के बारे में है। कई बार यह सिर्फ "यह एक शानदार दिन था, " या "यह उज्ज्वल और धूप से बाहर था, " जैसी चीजें। उसके लिए, बिना किसी त्रुटि के स्वचालित रूप से ऐसा करने का कोई तरीका नहीं था, इसलिए मैं बस सभी पुस्तक फ़ाइलों के माध्यम से जाऊंगा और चिह्नित करूंगा कि क्या मौसम शामिल था। आप कह सकते हैं कि यह थकाऊ था, क्योंकि यह बहुत अधिक डेटा एकत्र किया गया था, लेकिन एक ही बार में सैकड़ों शुरुआती वाक्यों को पढ़ने और पढ़ने में मज़ा आया। अन्य पैटर्न हैं जो स्पष्ट रूप से समय के साथ लेखकों से निकलते हैं।

p207 --- Weather.jpg

जैसे आप कहते हैं, कुछ के लिए थकाऊ, दूसरों के लिए मजेदार। कुछ लोग सोच सकते हैं कि यह विश्लेषणात्मक दृष्टिकोण उबाऊ है, लेकिन आप तर्क देते हैं कि यह "मनोरंजक" और "अक्सर नीचा मजाकिया हो सकता है।" आपका सबसे मजेदार क्या था?

पुस्तक का शीर्षक, नाबोकोव का पसंदीदा शब्द इज़ मौवे है, संख्याओं के बारे में, अंग्रेजी के मुकाबले उच्चतम दर पर वह जिस शब्द का उपयोग करता है। यदि आप उसकी पृष्ठभूमि को देखते हैं, तो यह बहुत मायने रखता है, क्योंकि उसके पास सिन्थेसिया था। उन्होंने अपनी आत्मकथा में, इस बारे में बात की कि कैसे जब उन्होंने विभिन्न अक्षरों और ध्वनियों को सुना, तो उनका मस्तिष्क स्वचालित रूप से रंगों को जोड़ देगा।

मैंने 100 अन्य लेखकों पर प्रयोग करके देखा कि उनका पसंदीदा शब्द क्या है। नतीजतन, आपको तीन शब्द मिलते हैं जो उन शब्दों द्वारा उनके लेखन के प्रतिनिधि हैं जो वे सबसे अधिक उपयोग करते हैं। शिष्टता, कल्पनाशीलता और प्रतिस्पद्र्धा। वह जेन ऑस्टेन है। मुझे लगता है कि अगर आपने उन शब्दों को देखा, तो जेन ऑस्टेन आपके पहले अनुमानों में से एक हो सकता है। और फिर आपके पास जॉन अपडेटिक जैसे लेखक हैं, जो थोड़े अधिक किरकिरा और वास्तविक और एक अलग समय के हैं। उनके पसंदीदा शब्द रिम, चुभन और गड़बड़ हैं। मुझे लगता है कि इन सरल गणितीय सवालों के आधार पर व्यक्तित्व को देखना बहुत दिलचस्प है। यदि आपके पास एक पसंदीदा लेखक है, तो इसके माध्यम से जाने से उनके व्यक्तित्व के बारे में कुछ पता चलता है जो आपने पहले नहीं देखा होगा।

रे ब्रैडबरी ने लिखा था कि उनका पसंदीदा शब्द दालचीनी था। संख्या के हिसाब से, वह इसका भरपूर उपयोग करता है। दालचीनी क्यों पसंद करती है, इस बारे में उनकी व्याख्या ने उन्हें उनकी दादी की पेंट्री की याद दिला दी। इसलिए मैंने अन्य मसाले शब्दों और गंध वाले शब्दों को पाया और एक दादी की पेंट्री के साथ जोड़ा जा सकता था, और रे ब्रैडबरी ज्यादातर उन शब्दों का उपयोग बहुत उच्च दर पर करते हैं। कुछ अर्थों में, आप इस अजीब, फ्रायडियन को लेखकों के बचपन के बारे में कुछ देख सकते हैं। अगर रे ब्रैडबरी ने ऐसा नहीं कहा होता, तो शायद आप अभी भी इसका पता लगा लेते।

आपने अमेरिकी और ब्रिटिश लेखकों की तुलना की, एक स्टीरियोटाइप की पुष्टि की कि अमेरिकी जोर से हैं। क्या आप इसे समझा सकते हैं?

यह वास्तव में मूल रूप से स्टैनफोर्ड में एक स्नातक छात्र द्वारा किए गए अध्ययन पर आधारित था। उन्होंने ऐसे शब्दों की पहचान की थी जिनका उपयोग पुस्तकों में संवाद का वर्णन करने के लिए किया जाता है, और उन्हें ज़ोर से, तटस्थ या शांत रूप में वर्णित किया जाता है। "फुसफुसाया" और "बड़बड़ा" शांत हो जाएगा। तटस्थ "उन्होंने कहा" या "उसने कहा, " और जोर से "वह प्रशंसित" या "चिल्लाया होगा।" मैं उन 50 लेखकों के माध्यम से गया, जिन्हें मैंने देखा था, साथ ही साथ फैन फिक्शन के बड़े नमूने, और पाया, नहीं। एक पागल मार्जिन द्वारा लेकिन एक सार्थक मार्जिन, कि अमेरिकियों के पास उच्च कोटि के शांत शब्द हैं। कुछ स्पष्टीकरण हैं। यह हो सकता है कि अमेरिकी अपने पूरे जीवन में इस तरह से बात करते हैं, इसलिए यह तरीका है कि लेखक उन्हें अक्सर बात करते हुए वर्णन करते हैं। आप इसे सिर्फ अमेरिकी लेखकों के रूप में भी देख सकते हैं, जो अधिक सूक्ष्म लोगों की तुलना में अधिक एक्शन-आधारित, थ्रिलर, उच्च गति की कहानियों के लिए प्राथमिकता रखते हैं। अमेरिकियों को वास्तव में संख्याओं से जोरदार है।

Blatt_author photo_Credit सिएरा कटो.जेपीजी बेन ब्लाट, नाबोकोव के पसंदीदा शब्द इज़ मॉव (सिएरा काटो) के लेखक हैं

आपको लगता है कि लेखन को गणित लागू करना साहित्य का अध्ययन करने का एक अच्छा तरीका है?

मैं निश्चित रूप से इस बात की वकालत नहीं कर रहा हूं कि साहित्य का अध्ययन करने का यह पहला तरीका होना चाहिए, यदि आप अपने लेखन को बेहतर बनाने की कोशिश कर रहे हैं। लेकिन यहां तक ​​कि मध्यम लंबाई का एक उपन्यास शायद 50, 000 शब्द है, और यह 50, 000 डेटा बिंदु है। आप बस एक बार में सभी को भिगोने में सक्षम नहीं होने जा रहे हैं, और कुछ ऐसे प्रश्न होने जा रहे हैं, जिनके बारे में आप अपने दम पर पढ़ने का जवाब नहीं दे सकते। बड़ी तस्वीर देखकर अच्छा लगा। यदि आप एक पैराग्राफ का अध्ययन करते हैं, तो आप अपने रचनात्मक लेखन वर्ग में अपने प्रोफ़ेसर से बात कर रहे हैं, यदि उस पर ध्यान देने का कोई निर्धारित तरीका है, तो आप बस उस चीज़ को देखने जा रहे हैं। लेकिन डेटा के साथ, उस तरह का आपको इससे मुक्त करता है, और आप इन पूर्वाग्रहों के बिना कुछ सवालों के जवाब दे सकते हैं और वास्तव में कुछ नई जानकारी प्राप्त कर सकते हैं।

आप उल्लेख करते हैं कि आप रोनाल्ड डाहल के "द ग्रेट ग्राममेटीज़ेटर" पर वापस विचार करते रहे।

एक महान रोनाल्ड डाहल कहानी है जहां अनिवार्य रूप से एक इंजीनियर कहानी लिखने का एक तरीका तैयार करता है। इस प्रलय के दिन में, कोई व्यक्ति बस मशीन को एक प्लॉट दे सकता है और यह एक अंतिम उपन्यास को थूक देगा। इस बात पर जोर दिया गया है कि वे ऐसे उपन्यासों का निर्माण कर रहे हैं जो इतने फार्मूलाबद्ध और बुनियादी हैं। उस कहानी में नायक मशीन के संचालन में शामिल नहीं होना चुनता है और अपने लेखन और कला को बनाकर इसके खिलाफ लड़ता है।

मुझे निश्चित रूप से लगता है कि यह पुस्तक, यदि आप लेखन में हैं, तो आपके लिए बहुत सारे प्रश्नों का उत्तर देगी और निश्चित रूप से कुछ चीजों के बारे में आपके सोचने के तरीके को बदल देगी, लेकिन अंततः विचारों के लिए वास्तव में कोई प्रतिस्थापन नहीं है जो लोगों को सोचते हैं और दृश्य बनाते हैं जो लोगों को बनाते हैं भयभीत या पात्रों के साथ कनेक्ट। यह पुस्तक लेखन के शिल्प को देख रही है और जरूरी नहीं कि एक यादगार कहानी कैसे बनाई जाए। यह पुस्तक एक आदर्श उपन्यास के लिए इंजीनियर की कोशिश नहीं कर रही है, और मुझे नहीं लगता कि हम उस के करीब हैं क्योंकि कुछ लोग डर सकते हैं।

एक लेखक ने महान लेखन के रहस्यों को प्रकट करने के लिए सांख्यिकी का उपयोग किया