https://frosthead.com

नया सॉफ्टवेयर वास्तव में अभिनेताओं के चेहरे की अभिव्यक्ति को संपादित कर सकता है

एक फिल्म में एक दृश्य की शूटिंग के लिए दर्जनों की आवश्यकता होती है, कभी-कभी अधिक। गॉन गर्ल में, निर्देशक डेविड फिन्चर से कहा गया कि वे औसतन प्रति सीन 50 बार लेते हैं। द सोशल नेटवर्क के अभिनेताओं के लिए रूनी मारा और जेसी ईसेनबर्ग ने 99 बार उद्घाटन दृश्य का अभिनय किया (फिंच द्वारा फिर से निर्देशित; जाहिर तौर पर वह इसके लिए कुख्यात हैं)। स्टेनली कुब्रिक की द शाइनिंग में कुख्यात दृश्य शामिल है जिसमें वेंडी जैक के बेसबॉल बैट को झूलते हुए सीढ़ियों का समर्थन करता है, जिसे इतिहास में किसी भी फिल्म के प्रति दृश्य के रूप में सबसे अधिक माना जाता है।

सरे विश्वविद्यालय के साथ मिलकर डिज़्नी रिसर्च का एक नया सॉफ्टवेयर, आवश्यक समय की संख्या में कटौती करने में मदद कर सकता है, जिससे समय और धन की बचत होती है। फेसडायरेक्टर कई छवियों को मिश्रित करता है, जिससे अभिनेताओं के चेहरे पर सटीक भावनाओं को संपादित करना संभव हो जाता है।

"एक फिल्म का निर्माण करना बहुत महंगा हो सकता है, इसलिए इस परियोजना का लक्ष्य प्रक्रिया को और अधिक कुशल बनाने की कोशिश करना था, " ज्यूरिख में डिज्नी रिसर्च के एक कंप्यूटर वैज्ञानिक डेरेक ब्रैडले कहते हैं, जिन्होंने सॉफ्टवेयर विकसित करने में मदद की।

डिज़्नी रिसर्च एक प्रकार का अनुसंधान प्रयोगशालाओं का एक अंतरराष्ट्रीय समूह है जो लॉस एंजिल्स, पिट्सबर्ग, बोस्टन और ज्यूरिख के स्थानों के साथ, उन नवाचारों के प्रकारों पर ध्यान केंद्रित करता है जो डिज्नी के लिए उपयोगी हो सकते हैं। हाल की परियोजनाओं में एक दीवार पर चढ़ने वाला रोबोट शामिल है, एक "संवर्धित वास्तविकता रंग पुस्तक" जहां बच्चे एक छवि को रंगीन कर सकते हैं जो एक ऐप पर एक चलती 3 डी चरित्र बन जाती है, और बच्चों के लिए एक बनियान जो कंपन या बारिश की बूंदों की अनुभूति के साथ संवेदना प्रदान करती है कहानी का दृश्य। फेसडायरेक्टर के पीछे की टीम ने पिछले साल दिसंबर में सैंटियागो, चिली में कंप्यूटर विजन पर अंतर्राष्ट्रीय सम्मेलन में अपना शोध प्रस्तुत करने से पहले लगभग एक साल तक इस परियोजना पर काम किया।

यह पता लगाना कि अलग-अलग टेक को कैसे सिंक्रोनाइज़ करना परियोजना का मुख्य लक्ष्य और इसकी सबसे बड़ी चुनौती थी। अभिनेता अलग-अलग समय में अलग-अलग स्वर में बोल सकते हैं, अलग-अलग स्वर में बोल सकते हैं या अलग-अलग स्वर में बोल सकते हैं। इसे हल करने के लिए, टीम ने एक कार्यक्रम बनाया जो चेहरे के भाव और ऑडियो संकेतों का विश्लेषण करता है। चेहरे और आंखों के कोनों की तरह चेहरे के स्थलों को मैप करके चेहरे के भावों को ट्रैक किया जाता है। कार्यक्रम तब निर्धारित करता है कि कौन से फ्रेम एक दूसरे में फिट हो सकते हैं, जैसे पहेली टुकड़े। प्रत्येक पहेली के टुकड़े में कई साथी होते हैं, इसलिए एक निर्देशक या संपादक वांछित चेहरे की अभिव्यक्ति बनाने के लिए सबसे अच्छा संयोजन तय कर सकता है।

जिस सामग्री के साथ प्रयोग करना है, उसे बनाने के लिए टीम ज्यूरिख यूनिवर्सिटी ऑफ़ आर्ट्स के छात्रों के समूह में लाई। छात्रों ने हर बार अलग-अलग चेहरे के भाव, खुश, क्रोधित, उत्साहित और ऐसा करने के लिए कई बार किए गए संवाद किए। टीम तब चेहरे की अभिव्यक्तियों के किसी भी संयोजन को बनाने के लिए सॉफ्टवेयर का उपयोग करने में सक्षम थी जिसने अधिक सूक्ष्म भावनाओं को व्यक्त किया था - उदास और थोड़ा गुस्सा, उत्साहित लेकिन भयभीत, और इसी तरह। वे उठने और गिरने वाली भावनाएँ पैदा करने के लिए कई तरह के मिश्रण कह सकते हैं, एक डरा हुआ और एक तटस्थ।

फेसडायरेक्टर टीम सुनिश्चित नहीं है कि सॉफ्टवेयर कब या कैसे व्यावसायिक रूप से उपलब्ध हो सकता है। स्थिर पृष्ठभूमि के सामने बैठने के दौरान फिल्माए गए दृश्यों के साथ उपयोग किए जाने पर उत्पाद अभी भी सबसे अच्छा काम करता है। मूविंग एक्टर्स और मूविंग आउटडोर विजुअल्स (सोचिए पेड़ों को काटते हुए, गुजरती हुई गाड़ियां) सिंक्रोनाइजेशन के लिए ज्यादा चुनौती पेश करते हैं।

नया सॉफ्टवेयर वास्तव में अभिनेताओं के चेहरे की अभिव्यक्ति को संपादित कर सकता है