Business

Openai O3 & O4-Mini, GEMINI LIVE और एन्थ्रोपिक रिसर्च: AI ब्लॉक वादा पर नए बच्चे क्या हैं

वहाँ मुश्किल से निष्क्रियता की एक खिड़की बनी हुई है, क्योंकि कृत्रिम बुद्धिमत्ता (AI) कंपनियां मॉडल बहुमुखी प्रतिभा, क्षमताओं और वादा में एक के बाद एक संभावित छलांग पर दोगुनी हो जाती हैं। Openai ने एक नए GPT-4.5 मॉडल की घोषणा करने के कुछ ही दिनों बाद, जो कि डेवलपर्स को रुचि देगा, उन्होंने उपभोक्ताओं के लिए O3 और O4-Mini भी जारी किया है। वे केवल नई एआई क्षमताओं को जारी करने वाले नहीं हैं, हालांकि- Google ने एंड्रॉइड फोन के भीतर गहरे मिथुन लाइव पर शुरू किया है, और एन्थ्रोपिक अब Google कार्यक्षेत्र एकीकरण को रोल कर रहा है।

Google ने एंड्रॉइड फोन के भीतर गहरी मिथुन लाइव पर अपना काम किया है। (आधिकारिक तस्वीर)
Google ने एंड्रॉइड फोन के भीतर गहरी मिथुन लाइव पर अपना काम किया है। (आधिकारिक तस्वीर)

ये सिर्फ नए मॉडल नहीं हैं, अपेक्षित दावे के साथ उनसे पहले की किसी भी चीज़ से बेहतर होना चाहिए। “सबसे स्मार्ट मॉडल जो हमने आज तक जारी किए हैं,” एक पिच जो अस्पष्टता को बहुत कम छोड़ देती है। उनके पास एक बिंदु है, क्योंकि O3 और O4-Mini कोडिंग, गणित से लेकर दृश्य धारणा तक सब कुछ संभाल सकते हैं। इसके बजाय, उपयोगिता और सहजता के आसपास केंद्रित एक पूर्ण पारिस्थितिकी तंत्र के निर्माण की दिशा में एक निश्चित दृष्टिकोण है। कोडेक्स सीएलआई लाइटवेट कोडिंग एजेंट, जो O3 और O4-Mini की कोडिंग क्षमताओं पर खींचता है, उस अंतरंगता का एक उदाहरण है।

ओपनईएआई के सीईओ सैम अल्टमैन, क्वेरी के आधार पर, चैट के भीतर उपलब्ध प्रत्येक उपकरण का उपयोग और उपयोग कर सकते हैं और उपयोग कर सकते हैं। इसमें वेब खोज, पायथन (यह एक सक्षम, सामान्य उद्देश्य प्रोग्रामिंग भाषा है), छवि विश्लेषण, छवि पीढ़ी के साथ -साथ एक उपयोगकर्ता के शेयरों की फ़ाइलों की व्याख्या करना शामिल है। Altman ने X पर एक पोस्ट में लिखा है, “नए मॉडलों की प्रभावी रूप से उपकरण का प्रभावी ढंग से उपयोग करने की क्षमता ने मुझे वास्तव में आश्चर्यचकित कर दिया है। बौद्धिक रूप से मुझे पता था कि यह होने जा रहा था, लेकिन यह देखने के लिए अलग-अलग हिट करता है,” Altman ने X पर एक पोस्ट में लिखा है। लगभग सभी बेंचमार्क परिणामों में जो Openai ने साझा किया है, O3 और O4-Mini पूर्ववर्ती तर्क मॉडल की तुलना में अधिक स्कोर कर रहे हैं, O1 और O3-Mini।

उद्योग से प्रतिक्रिया सकारात्मक रही है, लेकिन प्रतिस्पर्धी परिदृश्य इन मॉडलों को बहुत सक्षम प्रतिद्वंद्वियों के खिलाफ खड़ा करता है।

“O3 लॉन्चिंग ने अब ARC-AGI पर 87.5% से अधिक का स्कोर किया है। मानव प्रदर्शन 85% पर है,” क्राफ्टफुल के सीईओ याना वेलिंडर कहते हैं, जो व्यवसायों और टीमों के लिए कोपिलॉट्स का निर्माण करती है। आर्क-एजी, जो वेलिंडर संदर्भ देता है, एक बेंचमार्क है जो यह आकलन करता है कि मानव बुद्धिमत्ता की एक मौलिक विशेषता को दर्शाते हुए, एआई कितनी कुशलता से सीख सकता है और न्यूनतम जानकारी से सामान्य हो सकता है।

यह भी पढ़ें:क्या ओपनई ने एलोन मस्क और सैम अल्टमैन झगड़े के बीच अपना एक्स-जैसे सोशल मीडिया नेटवर्क विकसित किया है?

अबाकस एआई के सीईओ बिंदू रेड्डी, एक कंपनी, जो एक ‘सुपर असिस्टेंट’ बनाती है, का मानना ​​है कि O4-Mini “वास्तविक कहानी” हो सकती है, जो Google GENINI 2.5 की तुलना में बेहतर बेंचमार्क परिणामों के कारण हो सकता है और डेवलपर्स के लिए कम लागत है, लेकिन चेतावनी देता है कि “O3 बहुत स्मार्ट है लेकिन खतरनाक रूप से महंगा है”। एक्स पर एक पोस्ट में, वह लिखती हैं, “जीपीटी 4.1 इस सप्ताह ओपनई की सबसे बड़ी जीत हो सकती है।”

O3 और O4-MINI तर्क दे रहे हैं, जो संरचित सोच, समस्या को हल करने और मल्टी-स्टेप क्वेरी को संभालने के लिए प्रशिक्षित हैं। जनरेटिव एआई मॉडल, जो अधिकांश उपभोक्ताओं ने नियमितता के साथ उपयोग किया होगा, सामग्री उत्पादन, बातचीत और सरल खोजों या प्रश्नों के लिए प्राइमेड हैं। तथ्य यह है कि इन मॉडलों को तर्क के लिए प्रशिक्षित किया जाता है, अधिक ‘एजेंटिक’ चैट के लिए अनुमति देता है; और इसका मतलब यह है कि यह सबसे करीबी उपभोक्ता-सामना करने वाला एआई उत्पाद एआई एजेंटों के लिए आया है कि उद्यम तेजी से तैनात कर रहे हैं।

XAI भी एक कैनवास जैसी सुविधा जोड़ रहा है, जिसे स्टूडियो से ग्रोक के साथ-साथ मूल अनुप्रयोगों के साथ-साथ एडिटिंग और एडिटिंग के लिए स्टूडियो टू ग्रोक कहा जाता है। ग्रोक 3, इस साल की शुरुआत में जारी किया गया और अपने पूर्ववर्तियों पर एक महत्वपूर्ण सुधार, अब दस्तावेज, कोड, रिपोर्ट और ब्राउज़र गेम उत्पन्न कर सकता है, “कंपनी कहती है। अब के लिए, ग्रोक स्टूडियो मुफ्त और भुगतान किए गए ग्राहकों के लिए उपलब्ध है।

वे केवल प्रोजेक्ट लिखने और कोड के साथ छेड़छाड़ करने के लिए एक कैनवास-एस्क कार्यक्षेत्र बनाने के लिए नहीं हैं। ओपनई ने एंथ्रोपिक के क्लाउड के कोडिंग स्मार्ट के बाद पिछले साल के अंत में कैनवास को चटप्ट में जोड़ा था।

“क्लाउड से पूछें कि पिछले सप्ताह से नोट्स को एक साथ खींचने के लिए, फॉलो-अप ईमेल थ्रेड्स से एक्शन आइटम की पहचान करें, और अतिरिक्त संदर्भ के लिए प्रासंगिक दस्तावेजों की खोज करें। क्लाउड इन अंतर्दृष्टि को सीधे आपके पास लाता है, मैनुअल काम के घंटों को समाप्त करता है,” एन्थ्रोपिक कहते हैं। अनुसंधान लिफाफे के हिस्से के रूप में, क्लाउड एजेंट-एलल का संचालन करता है। इसका मतलब है कि कई खोजों का संचालन करना जो एक दूसरे पर निर्माण करते हैं, जबकि यह निर्धारित करते हैं कि आगे क्या जांच करें।

एन्थ्रोपिक के मॉडल विजुअल कम्युनिकेशन सूट कैनवा की नई कोड क्षमताओं को भी रेखांकित करते हैं। “हम अपने स्वयं के मॉडल का बहुत निर्माण करते हैं, लेकिन ये मॉडल दुनिया के कुछ सर्वश्रेष्ठ ओपन-सोर्स मॉडल को अनिवार्य रूप से इसे संदर्भ और जानकारी देने के लिए लाभ उठाते हैं। जब यह कैनवा कोड की बात आती है, तो यह एन्थ्रोपिक के साथ साझेदारी में है, कुछ ऐसा है जिसके बारे में हम बहुत उत्साहित हैं,” क्लिफ ओब्रेक्ट, कैनवा के सह-संस्थापक और मुख्य परिचालन अधिकारी, एचटी को बताते हैं।

क्लाउड, व्यापक अनुसंधान क्षमताओं के हिस्से के रूप में, Google के लोकप्रिय कार्यक्षेत्र ऐप्स – जीमेल, कैलेंडर और डॉक्स के भीतर गहरा एकीकरण पा रहा है। विचार है, उपयोगकर्ता के काम और वेब से जानकारी को एक साथ लाने के लिए। “क्लाउड आपके संदर्भ को समझता है और जानकारी को ठीक से खींच सकता है जहां आपको इसकी आवश्यकता है,” कंपनी एक बयान में कहती है।

Google की मिथुन लाइव, स्मार्टफोन के लिए एक सामान्य AI ऐप, जो उपयोगकर्ता के तत्काल परिवेश से संदर्भ प्राप्त करता है, जिसमें फोन के कैमरे के माध्यम से दुनिया को देखना शामिल है, स्क्रीन शेयरिंग विकल्प भी जोड़ रहा है। यह मुफ्त में उपलब्ध होगा, जिसका अर्थ है कि उपयोगकर्ताओं को भुगतान करने की आवश्यकता नहीं है 1,950 प्रति माह मिथुन उन्नत सदस्यता, और आने वाले हफ्तों में सभी एंड्रॉइड फोन के लिए रोलिंग होगी।

Google बताते हैं, “मिथुन उस नए कौशल के आधार पर वास्तविक समय की प्रतिक्रिया प्रदान करेगा जो आप सीख रहे हैं या आप पूरा कर रहे हैं।

Windows PC की दुनिया में, Microsoft को एज वेब ब्राउज़र में कोपिलॉट विज़न जोड़ रहा है। Microsoft AI के सीईओ मुस्तफा सुलेमैन कहते हैं, “यह सचमुच देख सकता है कि आप स्क्रीन पर क्या देखते हैं। यह आपके साथ जोर से सोचता है जब आप ऑनलाइन ब्राउज़ कर रहे होते हैं। कोई अधिक अति-व्याख्या, कॉपी-पेस्टिंग, या शब्दों में कुछ डालने के लिए संघर्ष कर रहा है।” Microsoft ने इसे अभी के लिए एक ‘ऑप्ट-इन’ के रूप में रखा है, और एक व्यापक फीचर सेट को कोपिलॉट प्रो सब्सक्रिप्शन की आवश्यकता है। इसका मतलब है कि साथ बिदाई प्रति माह 2,000।

हम में, या एक प्रतिभाशाली स्तर के पास, एआई के साथ? जवाब कल्पना से अधिक कठिन हो सकता है।


Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button