Business

जैसे ही Adobe ने दुनिया में Firefly वीडियो मॉडल जारी किया, वीडियो जेनरेशन AI की लड़ाई शुरू हो गई

मियामी, फ्लोरिडा: वर्ष की शुरुआत जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) के अगले अध्याय की झलक के साथ हुई। सटीक होने के लिए वीडियो पीढ़ी। ओपनएआई ने फरवरी में सोरा की घोषणा की, लेकिन जोखिम और सटीकता का आकलन करने के लिए इसे ‘रेड टीमर्स’ के अलावा किसी के लिए भी जारी करने से परहेज किया। अक्टूबर में, मेटा ने मूवी जेन, उनके एआई वीडियो जनरेटर के बारे में बात की, लेकिन वह भी सार्वजनिक पहुंच के लिए नहीं है। उम्मीद है कि सटीकता और उपयोगकर्ता सुरक्षा को संतुलित करते हुए, 30 दिनों तक चलने वाले ट्रांज़िशन को जारी करने की घोषणा के साथ Adobe ने उन सभी को पीछे छोड़ दिया है। HT ने सितंबर में रिपोर्ट दी थी कि Adobe यह सुनिश्चित करना चाहता था कि Firefly वीडियो मॉडल उपयोगकर्ताओं के लिए सुरक्षित हो। वे जोर देकर कहते हैं कि वह समय आ गया है।

फ़ायरफ़्लाई वीडियो मॉडल का मूल आधार टेक्स्ट से वीडियो और छवि से वीडियो है। (आधिकारिक छवि)
फ़ायरफ़्लाई वीडियो मॉडल का मूल आधार टेक्स्ट से वीडियो और छवि से वीडियो है। (आधिकारिक छवि)

“हम समझते हैं कि प्रौद्योगिकी के अनपेक्षित परिणाम हो सकते हैं। यही कारण है कि हमने इस प्रौद्योगिकी के निहितार्थ को समझने की जिम्मेदारी हम सभी पर ली है। हमने यह सुनिश्चित करने के लिए व्यावसायिक रूप से सुरक्षित समाधान डिजाइन करने पर ध्यान केंद्रित किया कि हम निर्माता और बौद्धिक संपदा अधिकारों का सम्मान करते हैं,” एडोब के सीईओ शांतनु नारायण ने एडोब मैक्स कीनोट में एआई के लिए कंपनी के दृष्टिकोण को स्पष्ट किया। एक दृष्टि, जिसमें जुगनू एक महत्वपूर्ण भूमिका निभाता है।

फ़ायरफ़्लाई वीडियो मॉडल का मूल आधार टेक्स्ट से वीडियो और छवि से वीडियो है, अर्थात, वीडियो बनाने के लिए जेनेरिक एआई उसी तरह है जैसे जेनेरिक एआई ने हमें पिछले कुछ वर्षों में जेनरेट की गई तस्वीरों के साथ फिर से तैयार किया है। या तो संकेत के साथ, या साझा मीडिया फ़ाइल से सुझाव के साथ। लेकिन यह यहीं तक सीमित नहीं है. Adobe के ऐप्स और संपादन प्लेटफ़ॉर्म के पारिस्थितिकी तंत्र के भीतर, इसे और भी बहुत कुछ करने के लिए डिज़ाइन किया गया है।

“वीडियो कठिन है। हम इस पर कुछ समय से काम कर रहे थे और हम इसकी गुणवत्ता से खुश नहीं थे। लेकिन हमारे शोध विभाग ने यह सुनिश्चित करने के लिए कि हम इस शोध प्रक्रिया में महारत हासिल कर लें, हजारों और हजारों जीपीयू (या ग्राफिक्स प्रोसेसिंग यूनिट, एक कंप्यूटिंग हार्डवेयर) का उपयोग करके 100 गुना अधिक पिक्सेल, 100 गुना अधिक डेटा को संभालने के लिए अद्भुत काम किया है, “अलेक्जेंड्रू कॉस्टिन कहते हैं, एडोब में जेनेरेटिव एआई के उपाध्यक्ष ने एक ब्रीफिंग में उनके सामने आने वाली चुनौतियों का विवरण दिया, जिसमें एचटी भी एक हिस्सा था।

उदाहरण के लिए, प्रीमियर प्रो में जेनरेटिव एक्सटेंड, वीडियो संपादन सूट, फायरफ्लाई वीडियो मॉडल का उपयोग करता है। विचार फुटेज बनाने के लिए एआई का उपयोग करना है जो संपादित किए जा रहे वीडियो बी-रोल में अंतराल को भर सकता है, बदलाव को सुचारू कर सकता है या यहां तक ​​कि संपादकों को अधिक सटीक संपादन में सहायता के लिए फ्रेम को लंबे समय तक पकड़ने की अनुमति दे सकता है।

जुगनू वीडियो मॉडल का सीधे उपयोग करने के तीन मुख्य तरीके हैं। पहला वीडियो संकेतों के लिए पाठ है, जिसमें विभिन्न प्रकार के कैमरा नियंत्रण (ये कोण, गति और ज़ूम विशिष्ट होंगे) और पहलू अनुपात और फ्रेम प्रति सेकंड चयन, साथ ही फुटेज बनाने के लिए संदर्भ छवियों को चुनने का विकल्प है। यह आग, पानी, प्रकाश रिसाव और धुआं जैसे वायुमंडलीय तत्वों को उत्पन्न करने की भी विधि होगी। ये तत्व काले या हरे रंग की पृष्ठभूमि पर उत्पन्न होंगे, जो संपादकों को ब्लेंड मोड का उपयोग करके या एडोब के प्रीमियर प्रो या आफ्टर इफेक्ट्स सॉफ़्टवेयर के साथ मौजूदा वीडियो फुटेज पर उन्हें परत करने की सुविधा देगा।

“हमने आप में से कई लोगों से सुना है कि आपकी टाइमलाइन में अंतराल को भरने से जहां दृश्य प्रभाव शॉट्स को बाद में जोड़ने की योजना बनाई गई है, आपको अपनी कहानी गढ़ने में रचनात्मक खरीदारी हासिल करने में मदद मिलती है। एडोब प्रो वीडियो के प्रधान उत्पाद विपणन प्रबंधक मेगन कीन का कहना है, ”यहां शॉट डालें” प्लेसहोल्डर्स की कोई आवश्यकता नहीं है।

“कम बजट और त्वरित बदलाव पर काम करने वाली टीमों के लिए मुश्किल-से-पकड़ने वाले या महंगे शॉट्स के लिए रचनात्मक इरादे की कल्पना करना चुनौतीपूर्ण है। वीएफएक्स में जाने से पहले या पिक-अप शॉट्स के लिए सेट पर वापस जाने से पहले इन शॉट्स की कल्पना और योजना बनाने के लिए एडोब फायरफ्लाई का उपयोग उत्पादन और पोस्ट-प्रोडक्शन के बीच संचार को सुव्यवस्थित करने में मदद करता है, ”कीन ने फिल्म संपादन प्रक्रिया के दौरान प्रासंगिकता का विवरण देते हुए कहा।

दूसरी विधि छवि से वीडियो है, जिसका अर्थ है कि आप टेक्स्ट प्रॉम्प्ट के साथ एक संदर्भ छवि साझा कर सकते हैं। इससे आपके पास पहले से मौजूद सामग्री के लिए मानार्थ शॉट्स तैयार करने या छवियों की एक श्रृंखला से एक वीडियो बनाने की लचीलेपन में वृद्धि होती है। Adobe पुष्टि करता है कि कुछ मामलों में शॉट की मूल गति या इरादे को बदलना संभव है। इससे यह कल्पना करने में मदद मिलेगी कि वीडियो का एक टुकड़ा दोबारा शूट करने पर या जेनरेट होने पर कैसा दिखेगा।

तीसरा, जेनरेटिव एक्सटेंड के लिए प्रीमियर प्रो जैसे ऐप्स के भीतर एकीकरण के हिस्से के रूप में है। आपके पास मौजूद क्लिप में एक एक्सटेंशन जोड़ने का संकेत, पीढ़ी में मूल वीडियो से मेल खाने के लिए वीडियो, ऑडियो और पृष्ठभूमि दोनों शामिल होगा।

एडोब का कहना है कि इसे व्यावसायिक उपयोग के लिए फेलसेफ के साथ डिजाइन किया गया है। “हम फ़ायरफ़्लाई मॉडल को केवल Adobe के स्टॉक डेटा पर प्रशिक्षित करते हैं और हम ग्राहक डेटा पर प्रशिक्षण नहीं देते हैं,” कॉस्टिन ने आगे बताया, “हम फ़ायरफ़्लाई को सीधे इंटरनेट से प्राप्त डेटा पर प्रशिक्षित नहीं करते हैं।” Adobe के पास यह एक फायदा है।

जब कुछ दिन पहले कंटेंट ऑथेंटिसिटी वेब ऐप की घोषणा की गई थी, तो एडोब ने एचटी से पुष्टि की थी कि गोपनीयता उपायों के हिस्से के रूप में, यदि किसी निर्माता द्वारा ऑप्ट-आउट विकल्प चुना जाता है, तो वे अपनी सामग्री एडोब स्टॉक में सबमिट नहीं करेंगे। पुस्तकालय। यह सामग्री है, चाहे वह छवियाँ हों या अन्य मीडिया, जो एडोब स्टॉक का हिस्सा है, का उपयोग जुगनू मॉडल को प्रशिक्षित करने के लिए किया जाता है। सामग्री क्रेडेंशियल, लेखक, निर्माण विशिष्टताओं और संपादन इतिहास के संदर्भ में प्रत्येक छवि या पीढ़ी के पहचानकर्ता, जुगनू वीडियो मॉडल से प्रत्येक पीढ़ी से जुड़े होंगे।

“हम अपने जिम्मेदार एआई सिद्धांतों-जवाबदेही, जिम्मेदारी और पारदर्शिता का सम्मान करते हैं। जवाबदेही के विषय पर, हमारे पास यह तंत्र है जहां हमें अपने ग्राहकों से प्रतिक्रिया मिलती है और हम उस प्रतिक्रिया पर कार्य करते हैं। यह वही है जो रेलिंग को डिजाइन और बेहतर बनाने में मदद करता है जो पूर्वाग्रह और नुकसान को कम करता है, और हमारे मॉडल से डीपफेक की संभावना को कम करता है, ”कॉस्टिन बताते हैं। उन्होंने आगे कहा, “हमारे मॉडल विश्वसनीय हैं और वास्तविक वर्कफ़्लो में प्रयोग करने योग्य हैं।”

जैसे ही AI जेनरेटिव वीडियो चैप्टर लिखा जा रहा है, Adobe MAX 2024 कीनोट एक महत्वपूर्ण बुकमार्क बन जाता है। ओपनएआई और मेटा द्वारा अपने स्वयं के वीडियो मॉडल के साथ ऐसा करने से पहले फायरफ्लाई वीडियो मॉडल जारी करके, रनवे के जेन -3 अल्फा के साथ जो गर्मियों में अपनी जगहों पर जारी किया गया था, एडोब ने गति संतुलन सुरक्षा उपायों पर जोर दिया।


Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button