माइक्रोसॉफ्ट ने एक ऐसा एआई स्पीच टूल बनाया है जो इतना यथार्थवादी है कि उन्होंने इसे जारी न करने का फैसला किया है

17 जुलाई, 2024 01:58 अपराह्न IST
माइक्रोसॉफ्ट के शोधकर्ताओं का दावा है कि VALL-E 2 ने भाषण निर्माण में “मानव समानता” हासिल कर ली है, जिसका अर्थ है कि यह जो कुछ भी कहता है, वह मानव आवाज से अलग नहीं हो सकता।
माइक्रोसॉफ्ट ने VALL-E 2 नामक टेक्स्ट-टू-स्पीच AI टूल बनाया है, जो इतना यथार्थवादी है कि कंपनी ने इसे जनता के लिए जारी न करने का निर्णय लिया है, क्योंकि उन्हें डर है कि अन्य लोगों की आवाज की नकल करने की इसकी क्षमता का दुरुपयोग हो सकता है।

माइक्रोसॉफ्ट के शोधकर्ताओं ने कहा, “VALL-E 2 पूरी तरह से एक शोध परियोजना है।” लिखा“फिलहाल, हमारे पास VALL-E 2 को किसी उत्पाद में शामिल करने या जनता तक पहुंच का विस्तार करने की कोई योजना नहीं है।”
यह भी पढ़ें: क्या आप आईटी सेक्टर में काम कर रहे हैं? कंपनियां अपने कर्मचारियों का मूल्यांकन इस तरह से करती हैं?
प्रौद्योगिकी दिग्गज के शोधकर्ताओं का कहना है कि VALL-E 2 ने भाषण सृजन में “मानव समानता” हासिल कर ली है, जिसका अर्थ है कि AI जो कुछ भी कहता है उसे वास्तविक मानव आवाज से अलग नहीं किया जा सकता है।
VALL-E 2 का उपयोग किस लिए किया जा सकता है?
VALL-E 2 का उपयोग वक्ता की पहचान को बनाए रखते हुए भाषण को संश्लेषित करने के लिए किया जा सकता है। माइक्रोसॉफ्ट रिसर्च के अनुसार, यह शैक्षिक शिक्षण, मनोरंजन, पत्रकारिता, स्व-लिखित सामग्री, पहुंच-योग्यता सुविधाओं, इंटरैक्टिव वॉयस रिस्पॉन्स सिस्टम, अनुवाद, चैटबॉट आदि में उपयोग के लिए उपयुक्त हो सकता है।
एआई किसी व्यक्ति के बोलने के कुछ सेकंड के ऑडियो का उपयोग करके, उपरोक्त सभी कार्यों के लिए उच्च सटीकता के साथ उस व्यक्ति की आवाज की नकल कर सकता है।
VALL-E 2 इतना यथार्थवादी कैसे बन पाया है?
एआई अपने कोड के दो पहलुओं का उपयोग करके इतना यथार्थवादी बन जाता है: इन्हें “पुनरावृत्ति जागरूक नमूनाकरण” और “समूहीकृत कोड मॉडलिंग” के रूप में जाना जाता है।
यह भी पढ़ें: कर्नाटक कन्नड़ आरक्षण विधेयक पर किरण मजूमदार शॉ: ‘इससे प्रभावित नहीं होना चाहिए…’
पुनरावृत्ति जागरूक नमूनाकरण, एआई को भाषा की छोटी इकाइयों जैसे शब्दों या अक्षरों को पहचानकर नीरस भाषण को कम करने में मदद करता है, जिससे उनकी पुनरावृत्ति को रोका जा सके और अधिक स्वाभाविक ध्वनि निकले।
समूहीकृत कोड मॉडलिंग अनुक्रम की लंबाई को कम कर देता है और एआई को भाषण की कम इकाइयों को संसाधित करने की अनुमति देता है, जिससे भाषण निर्माण में तेजी आती है और लंबे वाक्यों को संसाधित करने की चुनौती कम हो जाती है।
यह भी पढ़ें: गूगल ने ओला, उबर को टक्कर देने वाले भारतीय ओपन सोर्स ऐप नम्मा यात्री में निवेश किया: रिपोर्ट
वीआईटी के एमबीए कार्यक्रम के साथ अपने कैरियर को ऊंचा उठाएं, जिसे इसके प्रशंसित संकाय द्वारा डिजाइन किया गया है और जो कार्यरत पेशेवरों के लिए एक प्रकाश स्तंभ के रूप में सामने आता है। अब अन्वेषण करें!
और देखें
हर बड़ी खबर यहां से पढ़ें केंद्रीय बजट 2024, निर्मला सीतारमण की घोषणाएं, आयकर परिवर्तन और बहुत कुछ एक ही स्थान पर।
Source link