अधिकांश कॉलेज-स्तरीय साहित्य पाठ्यक्रमों में, आप छात्रों को साहित्यिक क्लासिक्स के छोटे भागों को विच्छेदित करते हुए पाते हैं: शेक्सपियर के एकांतवाद, जोयस की चेतना की धारा और हेमिंग्वे के स्टैकाटो वाक्यों को। इसमें कोई संदेह नहीं है, एक लेखक, उसके शिल्प और एक कहानी के अर्थ के बारे में इतना कुछ सीखा जा सकता है कि वह इस प्रकार के नज़दीक से पढ़ सके।
लेकिन बेन ब्लाट दूसरे दृष्टिकोण के लिए एक मजबूत तर्क देता है। कुछ वाक्यों और पैराग्राफों पर ध्यान केंद्रित करके, वह अपनी नई पुस्तक, नाबोकोव का पसंदीदा शब्द मौवे है, पाठकों को अन्य सभी शब्दों की उपेक्षा कर रहे हैं, जो औसत-लंबाई की उपन्यास राशि में हजारों डेटा बिंदुओं पर हैं।
पत्रकार और सांख्यिकीविद ने 20 वीं सदी के क्लासिक्स और बेस्टसेलर के एक पाठ से डेटाबेस का निर्माण किया, जो कि ब्याज के कई सवालों का जवाब देता है। उनके विश्लेषण से कुछ विचित्र पैटर्न का पता चला है जो अन्यथा किसी का ध्यान नहीं जा सकता है:
संख्याओं के अनुसार, उपन्यासों के लिए सबसे अच्छे शुरुआती वाक्य संक्षिप्त होते हैं। विपुल लेखक जेम्स पैटरसन प्रति 100, 000 शब्दों पर 160 क्लिच का औसत (जो कि जेन ऑस्टेन की तुलना में 115 अधिक है), और व्लादिमीर नाबोकोव ने पिछली दो शताब्दियों में औसत लेखक की तुलना में 44 बार मौवे शब्द का इस्तेमाल किया।
Smithsonian.com ने ब्लाट के साथ उनकी विधि, उनके कुछ महत्वपूर्ण निष्कर्षों और साहित्य के अध्ययन के लिए बड़ा डेटा क्यों महत्वपूर्ण है, के बारे में बात की।
आपने कहां के वाल्डो से सीनफेल्ड तक, फास्ट फूड जोड़ों से लेकर पॉप गानों तक सभी का अध्ययन करने के लिए एक सांख्यिकीय दृष्टिकोण लिया है। क्या आप अपनी विधि समझा सकते हैं, और आप जो करते हैं वह क्यों करते हैं?
मैं एक डेटा पत्रकार हूं, और मैं पॉप संस्कृति और कला में चीजों को देखता हूं। मैं वास्तव में मात्रात्मक और निष्पक्ष चीजों को देखना पसंद करता हूं जिसमें बहुत सारी जानकारी होती है जो लोगों को नहीं हुई है। यदि आप यह जानना चाहते हैं कि संयुक्त राज्य का विशिष्ट व्यक्ति कैसा है, तो यह उपयोगी होगा, लेकिन आप सिर्फ एक व्यक्ति से बात नहीं करेंगे, उनके बारे में सब कुछ जानेंगे और फिर मान लेंगे कि संयुक्त राज्य में लोगों के बारे में सब कुछ है वही। मुझे लगता है कि इस तरह के लेखन के साथ एक चीज खो जाती है कि आप एक लेखक द्वारा एक वाक्य पर ध्यान केंद्रित कर सकते हैं, विशेष रूप से रचनात्मक लेखन कक्षाएं, या एक मार्ग में, और आप इन सामान्य पैटर्न और रुझानों को देखने के लिए बड़ी तस्वीर खो देते हैं, जो लेखक उपयोग कर रहे हैं बार-बार, सैकड़ों और शायद हजारों बार अपने लेखन में।
नाबोकोव का पसंदीदा शब्द है मौवे: क्लासिक्स, बेस्टसेलर और हमारे अपने लेखन के बारे में संख्याएँ क्या बताती हैं
खरीदेंतो आपने साहित्य की ओर क्या रुख किया?
मेरी पृष्ठभूमि गणित और कंप्यूटर विज्ञान में है, लेकिन मुझे पढ़ना और लिखना हमेशा पसंद रहा है। जैसा कि मैं अधिक से अधिक लिख रहा था, मुझे बहुत दिलचस्पी थी कि विभिन्न लेखक और लोग लेखन सलाह कैसे देते हैं। इसमें बहुत कुछ है जो समझ में आता है लेकिन ऐसा लगता है कि जानकारी द्वारा समर्थित नहीं है, और यह बहुत कुछ है जो एक-दूसरे के साथ विवादित है। मैंने सोचा था कि इन विषयों को लिखित रूप में लेने का एक तरीका था कि लोग पहले से ही अच्छी तरह से जानते थे और बात कर रहे थे और उन्हें महान लेखकों और लोकप्रिय लेखकों पर परीक्षण करने के लिए यह देखने के लिए कि क्या यह सलाह वास्तविक है या यदि यह पूर्व निर्धारित सलाह है कि क्या नहीं है ' वास्तविक पुस्तकों और वास्तविक पृष्ठों में वास्तव में कुछ भी नहीं है।
साहित्यिक क्लासिक्स और बेस्टसेलर के बारे में पूछने वाला पहला सवाल क्या था?
पुस्तक में पहला अध्याय इस बात की सलाह पर है कि आपको-विशेषणों का उपयोग करना चाहिए या नहीं। यह पहला अध्याय है जिसे मैंने कालानुक्रमिक रूप से लिखा है। यह ज्यादातर स्टीफन किंग की सलाह पर है कि वे अपनी किताब ऑन राइटिंग में विशेषण का प्रयोग न करें, जो कि बहुत सारे लेखकों के लिए लेखन के लिए किताब है। लेकिन बहुत सारे अन्य लेखक- टोनी मॉरिसन, चक पलहिन्युक और किसी भी रचनात्मक लेखन वर्ग ने सलाह दी है कि किसी भी शब्द का प्रयोग न करें क्योंकि यह एक अनावश्यक शब्द है और यह संकेत है कि आप संक्षिप्त नहीं हो रहे हैं। कहने के बजाय, "वह जल्दी से भागा, " आप कह सकते हैं, "वह छिड़का।"
इसलिए मैं जानना चाहता था कि क्या यह वास्तव में सच है? यदि यह ऐसी अच्छी सलाह है, तो आप उम्मीद करेंगे कि महान लेखक वास्तव में इसका कम उपयोग करें। आपको उम्मीद होगी कि शौकिया लेखक इसे प्रकाशित लेखकों की तुलना में अधिक उपयोग कर रहे हैं। मैं सिर्फ सच में जानना चाहता था, शैलीगत रूप से, पहले अगर स्टीफन किंग ने अपनी सलाह का पालन किया, और फिर अगर यह अन्य सभी महान और पूजनीय लेखकों पर लागू होता है।
तो, आपने क्या पाया?
वास्तव में, एक प्रवृत्ति है कि हेमिंग्वे, मॉरिसन और स्टाइनबेक जैसे लेखक, उनकी सबसे अच्छी किताबें, जो लोग आयोजित किए जाते हैं और उन पर अब सबसे अधिक ध्यान दिया जाता है, वे सबसे कम मात्रा वाली विशेषण वाली किताबें हैं। इसके अलावा, यदि आप शौकिया फिक्शन लेखन और ऑनलाइन लेखन की तुलना करते हैं, जो हाल के दिनों के बेस्टसेलर और पुलित्जर पुरस्कार विजेताओं के साथ एकजुट है, तो एक विसंगति है, जहां प्रकाशित लेखकों द्वारा कम-विशेष रूप से कहावत का उपयोग किया जाता है। मैं इतना एकतरफा नहीं हूं कि मुझे लगता है कि आप सिर्फ-एक विशेषण को एक अच्छी किताब से निकाल सकते हैं और यह एक महान पुस्तक बन जाती है। जाहिर है कि यह कैसे काम करता है। लेकिन इस तथ्य के बारे में कुछ है कि जो लेखक बहुत सीधे तरीके से लिख रहे हैं, वे ऐसी पुस्तकों का उत्पादन करते हैं जो कुल मिलाकर सबसे लंबे समय तक रहते हैं।
साहित्यिक कृतियों का एक डेटाबेस बनाने के बारे में आप कैसे गए?
कई प्रश्नों के लिए, मैं उन्हीं 50 लेखकों का उपयोग कर रहा था जिन्हें मैंने कुछ मनमाने ढंग से चुना था। मूलतः यह उन लेखकों पर आधारित था जो बेस्टसेलर सूची के शीर्ष पर थे, लेखक जो सभी समय की सूची के सबसे महान लेखकों और शीर्ष लेखकों पर थे जो कि विभिन्न शैलियों और समय और पाठकों की एक श्रृंखला का प्रतिनिधित्व करते थे। इस तरह, पूरे पुस्तक में, आप इन लेखकों की तुलना कर सकते हैं और उन्हें जान सकते हैं।
यह मेरे लिए बहुत महत्वपूर्ण था कि अगर मैंने कुछ कहा, "इस दर पर टोनी मॉरिसन इस शब्द का उपयोग करता है, " मैं हर एक उपन्यास के बारे में बात कर रहा था जो उसने कभी लिखा है और केवल तीन नहीं है जो मैं पहले से ही करता हूं। मेरी पुस्तक में, ५० से १०० लेखक हैं, जो पूरे संदर्भ में हैं। मुझे उनकी ग्रंथ सूची मिली और फिर उनके सभी उपन्यास मिले जो उन्होंने उस बिंदु तक लिखे थे जो उनके पूर्ण रिकॉर्ड के रूप में थे। कुछ मायनों में, यह खेल के आंकड़ों को रखने जैसा है, जहां प्रत्येक पुस्तक एक सीज़न की तरह होती है और फिर ये सभी सीज़न या किताबें एक कैरियर के रूप में एक साथ आती हैं। आप देख सकते हैं कि लेखक समय के साथ कैसे बदलते हैं और वे समग्र रूप से कैसे करते हैं। एक बार जब आपके पास फाइल पर सभी किताबें होती हैं, तो इन सवालों का जवाब देना कि कुछ मायनों में बहुत कठिन है, बहुत ही सीधा है।
और आपने उस सभी पाठ को कैसे संसाधित किया?
एक प्रोग्रामिंग भाषा है जिसे पायथन कहा जाता है, और उसके भीतर, प्राकृतिक भाषा टूलकिट नामक उपकरण का एक सेट होता है, जिसे अक्सर NLKK संक्षिप्त किया जाता है। इसमें शामिल उपकरण किसी के लिए भी स्वतंत्र रूप से उपलब्ध हैं। आप पैकेज को ऑनलाइन डाउनलोड कर सकते हैं और इसे पायथन या अन्य भाषाओं में उपयोग कर सकते हैं। आप विशेष रूप से कई लेखन प्रश्न नहीं प्राप्त कर सकते हैं, लेकिन आप कह सकते हैं कि यह शब्द पाठ में कितनी बार दिखाई देता है? इसके माध्यम से जा सकते हैं और पहचान सकते हैं कि वाक्य कहाँ समाप्त होते हैं और कहाँ वाक्य शुरू होते हैं, और भाषण के कुछ हिस्सों - विशेषण बनाम क्रिया विशेषण बनाम क्रिया। तो एक बार जब आपके पास वे उपकरण होंगे, तो आप डेटा प्राप्त कर सकते हैं।
आपने कौन से आँकड़े मैन्युअल रूप से संकलित किए हैं? सबसे थकाऊ क्या था?
एक सेक्शन है जहां मैं शुरुआती वाक्यों को देखता हूं। एलमोर लियोनार्ड, जो एक बहुत ही सफल उपन्यासकार थे, ने कहा था, "मौसम के साथ कभी कोई पुस्तक न खोलें।" इसलिए मैंने सैकड़ों लेखकों के माध्यम से देखा कि वे मौसम पर अपनी पुस्तक को कितनी बार खोलते हैं। उदाहरण के लिए, डैनियल स्टील, मेरा मानना है कि पुस्तकों में उसके पहले वाक्य का 45 प्रतिशत मौसम के बारे में है। कई बार यह सिर्फ "यह एक शानदार दिन था, " या "यह उज्ज्वल और धूप से बाहर था, " जैसी चीजें। उसके लिए, बिना किसी त्रुटि के स्वचालित रूप से ऐसा करने का कोई तरीका नहीं था, इसलिए मैं बस सभी पुस्तक फ़ाइलों के माध्यम से जाऊंगा और चिह्नित करूंगा कि क्या मौसम शामिल था। आप कह सकते हैं कि यह थकाऊ था, क्योंकि यह बहुत अधिक डेटा एकत्र किया गया था, लेकिन एक ही बार में सैकड़ों शुरुआती वाक्यों को पढ़ने और पढ़ने में मज़ा आया। अन्य पैटर्न हैं जो स्पष्ट रूप से समय के साथ लेखकों से निकलते हैं।
जैसे आप कहते हैं, कुछ के लिए थकाऊ, दूसरों के लिए मजेदार। कुछ लोग सोच सकते हैं कि यह विश्लेषणात्मक दृष्टिकोण उबाऊ है, लेकिन आप तर्क देते हैं कि यह "मनोरंजक" और "अक्सर नीचा मजाकिया हो सकता है।" आपका सबसे मजेदार क्या था?
पुस्तक का शीर्षक, नाबोकोव का पसंदीदा शब्द इज़ मौवे है, संख्याओं के बारे में, अंग्रेजी के मुकाबले उच्चतम दर पर वह जिस शब्द का उपयोग करता है। यदि आप उसकी पृष्ठभूमि को देखते हैं, तो यह बहुत मायने रखता है, क्योंकि उसके पास सिन्थेसिया था। उन्होंने अपनी आत्मकथा में, इस बारे में बात की कि कैसे जब उन्होंने विभिन्न अक्षरों और ध्वनियों को सुना, तो उनका मस्तिष्क स्वचालित रूप से रंगों को जोड़ देगा।
मैंने 100 अन्य लेखकों पर प्रयोग करके देखा कि उनका पसंदीदा शब्द क्या है। नतीजतन, आपको तीन शब्द मिलते हैं जो उन शब्दों द्वारा उनके लेखन के प्रतिनिधि हैं जो वे सबसे अधिक उपयोग करते हैं। शिष्टता, कल्पनाशीलता और प्रतिस्पद्र्धा। वह जेन ऑस्टेन है। मुझे लगता है कि अगर आपने उन शब्दों को देखा, तो जेन ऑस्टेन आपके पहले अनुमानों में से एक हो सकता है। और फिर आपके पास जॉन अपडेटिक जैसे लेखक हैं, जो थोड़े अधिक किरकिरा और वास्तविक और एक अलग समय के हैं। उनके पसंदीदा शब्द रिम, चुभन और गड़बड़ हैं। मुझे लगता है कि इन सरल गणितीय सवालों के आधार पर व्यक्तित्व को देखना बहुत दिलचस्प है। यदि आपके पास एक पसंदीदा लेखक है, तो इसके माध्यम से जाने से उनके व्यक्तित्व के बारे में कुछ पता चलता है जो आपने पहले नहीं देखा होगा।
रे ब्रैडबरी ने लिखा था कि उनका पसंदीदा शब्द दालचीनी था। संख्या के हिसाब से, वह इसका भरपूर उपयोग करता है। दालचीनी क्यों पसंद करती है, इस बारे में उनकी व्याख्या ने उन्हें उनकी दादी की पेंट्री की याद दिला दी। इसलिए मैंने अन्य मसाले शब्दों और गंध वाले शब्दों को पाया और एक दादी की पेंट्री के साथ जोड़ा जा सकता था, और रे ब्रैडबरी ज्यादातर उन शब्दों का उपयोग बहुत उच्च दर पर करते हैं। कुछ अर्थों में, आप इस अजीब, फ्रायडियन को लेखकों के बचपन के बारे में कुछ देख सकते हैं। अगर रे ब्रैडबरी ने ऐसा नहीं कहा होता, तो शायद आप अभी भी इसका पता लगा लेते।
आपने अमेरिकी और ब्रिटिश लेखकों की तुलना की, एक स्टीरियोटाइप की पुष्टि की कि अमेरिकी जोर से हैं। क्या आप इसे समझा सकते हैं?
यह वास्तव में मूल रूप से स्टैनफोर्ड में एक स्नातक छात्र द्वारा किए गए अध्ययन पर आधारित था। उन्होंने ऐसे शब्दों की पहचान की थी जिनका उपयोग पुस्तकों में संवाद का वर्णन करने के लिए किया जाता है, और उन्हें ज़ोर से, तटस्थ या शांत रूप में वर्णित किया जाता है। "फुसफुसाया" और "बड़बड़ा" शांत हो जाएगा। तटस्थ "उन्होंने कहा" या "उसने कहा, " और जोर से "वह प्रशंसित" या "चिल्लाया होगा।" मैं उन 50 लेखकों के माध्यम से गया, जिन्हें मैंने देखा था, साथ ही साथ फैन फिक्शन के बड़े नमूने, और पाया, नहीं। एक पागल मार्जिन द्वारा लेकिन एक सार्थक मार्जिन, कि अमेरिकियों के पास उच्च कोटि के शांत शब्द हैं। कुछ स्पष्टीकरण हैं। यह हो सकता है कि अमेरिकी अपने पूरे जीवन में इस तरह से बात करते हैं, इसलिए यह तरीका है कि लेखक उन्हें अक्सर बात करते हुए वर्णन करते हैं। आप इसे सिर्फ अमेरिकी लेखकों के रूप में भी देख सकते हैं, जो अधिक सूक्ष्म लोगों की तुलना में अधिक एक्शन-आधारित, थ्रिलर, उच्च गति की कहानियों के लिए प्राथमिकता रखते हैं। अमेरिकियों को वास्तव में संख्याओं से जोरदार है।
बेन ब्लाट, नाबोकोव के पसंदीदा शब्द इज़ मॉव (सिएरा काटो) के लेखक हैंआपको लगता है कि लेखन को गणित लागू करना साहित्य का अध्ययन करने का एक अच्छा तरीका है?
मैं निश्चित रूप से इस बात की वकालत नहीं कर रहा हूं कि साहित्य का अध्ययन करने का यह पहला तरीका होना चाहिए, यदि आप अपने लेखन को बेहतर बनाने की कोशिश कर रहे हैं। लेकिन यहां तक कि मध्यम लंबाई का एक उपन्यास शायद 50, 000 शब्द है, और यह 50, 000 डेटा बिंदु है। आप बस एक बार में सभी को भिगोने में सक्षम नहीं होने जा रहे हैं, और कुछ ऐसे प्रश्न होने जा रहे हैं, जिनके बारे में आप अपने दम पर पढ़ने का जवाब नहीं दे सकते। बड़ी तस्वीर देखकर अच्छा लगा। यदि आप एक पैराग्राफ का अध्ययन करते हैं, तो आप अपने रचनात्मक लेखन वर्ग में अपने प्रोफ़ेसर से बात कर रहे हैं, यदि उस पर ध्यान देने का कोई निर्धारित तरीका है, तो आप बस उस चीज़ को देखने जा रहे हैं। लेकिन डेटा के साथ, उस तरह का आपको इससे मुक्त करता है, और आप इन पूर्वाग्रहों के बिना कुछ सवालों के जवाब दे सकते हैं और वास्तव में कुछ नई जानकारी प्राप्त कर सकते हैं।
आप उल्लेख करते हैं कि आप रोनाल्ड डाहल के "द ग्रेट ग्राममेटीज़ेटर" पर वापस विचार करते रहे।
एक महान रोनाल्ड डाहल कहानी है जहां अनिवार्य रूप से एक इंजीनियर कहानी लिखने का एक तरीका तैयार करता है। इस प्रलय के दिन में, कोई व्यक्ति बस मशीन को एक प्लॉट दे सकता है और यह एक अंतिम उपन्यास को थूक देगा। इस बात पर जोर दिया गया है कि वे ऐसे उपन्यासों का निर्माण कर रहे हैं जो इतने फार्मूलाबद्ध और बुनियादी हैं। उस कहानी में नायक मशीन के संचालन में शामिल नहीं होना चुनता है और अपने लेखन और कला को बनाकर इसके खिलाफ लड़ता है।
मुझे निश्चित रूप से लगता है कि यह पुस्तक, यदि आप लेखन में हैं, तो आपके लिए बहुत सारे प्रश्नों का उत्तर देगी और निश्चित रूप से कुछ चीजों के बारे में आपके सोचने के तरीके को बदल देगी, लेकिन अंततः विचारों के लिए वास्तव में कोई प्रतिस्थापन नहीं है जो लोगों को सोचते हैं और दृश्य बनाते हैं जो लोगों को बनाते हैं भयभीत या पात्रों के साथ कनेक्ट। यह पुस्तक लेखन के शिल्प को देख रही है और जरूरी नहीं कि एक यादगार कहानी कैसे बनाई जाए। यह पुस्तक एक आदर्श उपन्यास के लिए इंजीनियर की कोशिश नहीं कर रही है, और मुझे नहीं लगता कि हम उस के करीब हैं क्योंकि कुछ लोग डर सकते हैं।