Business

माइक्रोसॉफ्ट ने एक ऐसा एआई स्पीच टूल बनाया है जो इतना यथार्थवादी है कि उन्होंने इसे जारी न करने का फैसला किया है

17 जुलाई, 2024 01:58 अपराह्न IST

माइक्रोसॉफ्ट के शोधकर्ताओं का दावा है कि VALL-E 2 ने भाषण निर्माण में “मानव समानता” हासिल कर ली है, जिसका अर्थ है कि यह जो कुछ भी कहता है, वह मानव आवाज से अलग नहीं हो सकता।

माइक्रोसॉफ्ट ने VALL-E 2 नामक टेक्स्ट-टू-स्पीच AI टूल बनाया है, जो इतना यथार्थवादी है कि कंपनी ने इसे जनता के लिए जारी न करने का निर्णय लिया है, क्योंकि उन्हें डर है कि अन्य लोगों की आवाज की नकल करने की इसकी क्षमता का दुरुपयोग हो सकता है।

अमेरिका के न्यूयॉर्क शहर में एक कार्यालय भवन पर माइक्रोसॉफ्ट का लोगो देखा जा सकता है। (रॉयटर्स)
अमेरिका के न्यूयॉर्क शहर में एक कार्यालय भवन पर माइक्रोसॉफ्ट का लोगो देखा जा सकता है। (रॉयटर्स)

माइक्रोसॉफ्ट के शोधकर्ताओं ने कहा, “VALL-E 2 पूरी तरह से एक शोध परियोजना है।” लिखा“फिलहाल, हमारे पास VALL-E 2 को किसी उत्पाद में शामिल करने या जनता तक पहुंच का विस्तार करने की कोई योजना नहीं है।”

यह भी पढ़ें: क्या आप आईटी सेक्टर में काम कर रहे हैं? कंपनियां अपने कर्मचारियों का मूल्यांकन इस तरह से करती हैं?

प्रौद्योगिकी दिग्गज के शोधकर्ताओं का कहना है कि VALL-E 2 ने भाषण सृजन में “मानव समानता” हासिल कर ली है, जिसका अर्थ है कि AI जो कुछ भी कहता है उसे वास्तविक मानव आवाज से अलग नहीं किया जा सकता है।

VALL-E 2 का उपयोग किस लिए किया जा सकता है?

VALL-E 2 का उपयोग वक्ता की पहचान को बनाए रखते हुए भाषण को संश्लेषित करने के लिए किया जा सकता है। माइक्रोसॉफ्ट रिसर्च के अनुसार, यह शैक्षिक शिक्षण, मनोरंजन, पत्रकारिता, स्व-लिखित सामग्री, पहुंच-योग्यता सुविधाओं, इंटरैक्टिव वॉयस रिस्पॉन्स सिस्टम, अनुवाद, चैटबॉट आदि में उपयोग के लिए उपयुक्त हो सकता है।

एआई किसी व्यक्ति के बोलने के कुछ सेकंड के ऑडियो का उपयोग करके, उपरोक्त सभी कार्यों के लिए उच्च सटीकता के साथ उस व्यक्ति की आवाज की नकल कर सकता है।

VALL-E 2 इतना यथार्थवादी कैसे बन पाया है?

एआई अपने कोड के दो पहलुओं का उपयोग करके इतना यथार्थवादी बन जाता है: इन्हें “पुनरावृत्ति जागरूक नमूनाकरण” और “समूहीकृत कोड मॉडलिंग” के रूप में जाना जाता है।

यह भी पढ़ें: कर्नाटक कन्नड़ आरक्षण विधेयक पर किरण मजूमदार शॉ: ‘इससे ​​प्रभावित नहीं होना चाहिए…’

पुनरावृत्ति जागरूक नमूनाकरण, एआई को भाषा की छोटी इकाइयों जैसे शब्दों या अक्षरों को पहचानकर नीरस भाषण को कम करने में मदद करता है, जिससे उनकी पुनरावृत्ति को रोका जा सके और अधिक स्वाभाविक ध्वनि निकले।

समूहीकृत कोड मॉडलिंग अनुक्रम की लंबाई को कम कर देता है और एआई को भाषण की कम इकाइयों को संसाधित करने की अनुमति देता है, जिससे भाषण निर्माण में तेजी आती है और लंबे वाक्यों को संसाधित करने की चुनौती कम हो जाती है।

यह भी पढ़ें: गूगल ने ओला, उबर को टक्कर देने वाले भारतीय ओपन सोर्स ऐप नम्मा यात्री में निवेश किया: रिपोर्ट

वीआईटी के एमबीए कार्यक्रम के साथ अपने कैरियर को ऊंचा उठाएं, जिसे इसके प्रशंसित संकाय द्वारा डिजाइन किया गया है और जो कार्यरत पेशेवरों के लिए एक प्रकाश स्तंभ के रूप में सामने आता है। अब अन्वेषण करें!

और देखें

हर बड़ी खबर यहां से पढ़ें केंद्रीय बजट 2024, निर्मला सीतारमण की घोषणाएं, आयकर परिवर्तन और बहुत कुछ एक ही स्थान पर।


Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button