Tech

GPT-4o का परीक्षण: पहले से अधिक तेज़ और बहुमुखी, लेकिन विश्वसनीयता पर सवाल

नवंबर 2022 से, जब ChatGPT को पहली बार जनता के लिए रोल आउट किया गया था, ओपनएआई आर्टिफिशियल इंटेलिजेंस (AI) स्पेस में सबसे आगे रहने वाली कंपनी रही है। अरबों डॉलर खर्च करने और अपना खुद का AI डिवीजन बनाने और उसका पुनर्गठन करने (आप, Google को देखते हुए) के बावजूद, प्रमुख तकनीकी दिग्गज लगातार खुद को AI फर्म के साथ पकड़ने की कोशिश करते हुए पाते हैं। पिछला महीना भी अलग नहीं था; जब Google के I/O इवेंट से ठीक एक दिन पहले, OpenAI ने अपना स्प्रिंग अपडेट इवेंट आयोजित किया और महत्वपूर्ण अपग्रेड के साथ GPT-4o पेश किया।

GPT-4o विशेषताएं

GPT-4o में ‘o’ का मतलब है ओमनीचैनल, जो OpenAI के नवीनतम फ्लैगशिप-ग्रेड AI मॉडल की नई क्षमताओं का एक प्रमुख केंद्र है। इसमें वास्तविक समय में भावनात्मक आवाज़ उत्पन्न करना, इंटरनेट तक पहुँच, कुछ क्लाउड सेवाओं के साथ एकीकरण, कंप्यूटर विज़न और बहुत कुछ शामिल है। जबकि सुविधाएँ कागज़ पर (और तकनीकी डेमो में) प्रभावशाली थीं, सबसे बड़ी हाइलाइट थी घोषणा GPT-4o संचालित चैटGPT सभी के लिए उपलब्ध होगा, जिसमें निःशुल्क उपयोगकर्ता भी शामिल होंगे।

हालाँकि, दो चेतावनियाँ थीं। मुफ़्त उपयोगकर्ताओं के पास केवल GPT-4o तक सीमित पहुँच है, जो मोटे तौर पर 5-6 बार बातचीत करने के बराबर है, यदि आप वेब खोज का उपयोग करते हैं और एक छवि अपलोड करते हैं (हाँ, मुफ़्त उपयोगकर्ताओं के लिए सीमा प्रति दिन एक छवि है)। साथ ही, वॉयस सुविधा मुफ़्त उपयोगकर्ताओं के लिए उपलब्ध नहीं है।

ओपनएआई को भी नए एआई मॉडल को जनता के सामने लाने में समय नहीं लगा। सौभाग्य से, मुझे कुछ ही दिनों में कंपनी के नवीनतम एआई निर्माण तक पहुँच मिल गई और मैंने तुरंत इसके साथ खेलना शुरू कर दिया। मैं इसके पूर्ववर्ती और बाजार में उपलब्ध सभी मुफ़्त एलएलएम की तुलना में इसके सुधार का परीक्षण करना चाहता था। मैंने अब एआई सहायक के साथ करीब दो सप्ताह बिताए हैं, और जबकि इसके कुछ पहलुओं ने मुझे विस्मित कर दिया है, अन्य ने मुझे निराश किया है। मुझे समझाने की अनुमति दें।

GPT-4o सामान्य जनरेटिव क्षमताएं

मैंने अपने लेख में कहा है परिक्षण गूगल के जेमिनी के बारे में मेरा मानना ​​है कि मैं चैटजीपीटी की सृजनात्मक क्षमताओं का प्रशंसक नहीं हूँ। मुझे यह बहुत औपचारिक और नीरस लगता है। इसका अधिकांश भाग अभी भी वैसा ही है। मैंने इसे अपनी माँ को यह बताने के लिए एक पत्र लिखने के लिए कहा कि मुझे मेरी नौकरी से निकाल दिया गया है, और इसने शानदार “मैं बहुत दुख और शोक महसूस कर रहा हूँ” लाइन लिखी। लेकिन एक बार जब मैंने इसे और अधिक संवादात्मक बनाने के लिए कहा, तो परिणाम बहुत बेहतर था।

gpt 4o ss1 GPT-4o स्क्रीनशॉट

GPT-4o जनरेटिव क्षमताएं

मैंने इसे कई ऐसे प्रॉम्प्ट के साथ परखा, जहाँ AI को अपने लेखन में कुछ भावनाएँ व्यक्त करनी थीं। लगभग सभी मामलों में, मुझे मूल प्रॉम्प्ट में पहले से ही ऐसा करने के बावजूद भावनाओं पर ज़ोर देने के लिए एक और प्रॉम्प्ट का पालन करना पड़ा। इसकी तुलना में, जेमिनी और कोपायलट के साथ मेरा अनुभव बहुत बेहतर था क्योंकि उन्होंने भाषा को बातचीत के तौर पर रखा और भावनाओं को मेरे लिखने के तरीके के बहुत करीब व्यक्त किया।

टेक्स्ट जनरेशन की गति के बारे में कुछ खास नहीं कहा जा सकता। टेक्स्ट आउटपुट की बात करें तो ज़्यादातर AI चैटबॉट काफ़ी तेज़ हैं, और OpenAI का नवीनतम AI मॉडल इसे काफ़ी हद तक मात नहीं देता।

GPT-4o संवादात्मक क्षमताएं

हालाँकि मेरे पास अपग्रेडेड वॉयस चैट सुविधा नहीं थी, लेकिन मैं AI मॉडल की संवादात्मक क्षमताओं का परीक्षण करना चाहता था क्योंकि यह अक्सर चैटबॉट का सबसे अनदेखा हिस्सा होता है। मैं चाहता था कि मेरा अनुभव किसी वास्तविक व्यक्ति से बात करने जैसा हो और मुझे उम्मीद थी कि यह पहले बताए गए विषयों का संदर्भ देने वाले अस्पष्ट वाक्यों को समझ सकता है। मैं यह भी देखना चाहता था कि जब कोई व्यक्ति मुश्किल में पड़ जाता है तो उसकी प्रतिक्रिया क्या होती है।

अपने परीक्षण में, मैंने पाया कि GPT-4o संवादात्मक क्षमताओं के मामले में काफी अच्छा है। यह मेरे साथ AI की नैतिकता पर विस्तार से चर्चा कर सकता था और जब मैंने कोई ठोस प्रस्ताव रखा तो वह मान गया। जब मैंने उसे बताया कि मैं दुखी हूँ (क्योंकि मुझे नौकरी से निकाला जा रहा था) तो उसने समर्थनपूर्वक जवाब दिया और विभिन्न तरीकों से मदद करने की पेशकश की। जब मैंने GPT-4o के बारे में कहा कि इसके सभी समाधान बेवकूफी भरे हैं, तो उसने दबावपूर्ण तरीके से जवाब नहीं दिया, न ही यह पूरी तरह से पीछे हटा, यह मेरे आश्चर्य की बात थी। उसने कहा, “मुझे यह सुनकर बहुत दुख हुआ कि आप ऐसा महसूस कर रहे हैं। मैं आपको कुछ जगह दूँगा। अगर आपको कभी बात करने या किसी सहायता की ज़रूरत होगी, तो मैं यहाँ रहूँगा। अपना ख्याल रखना।”

कुल मिलाकर, मैंने पाया कि GPT-4o बातचीत करने में अन्य की तुलना में बेहतर है। सह पायलट और मिथुन राशि. जेमिनी बहुत ज़्यादा प्रतिबंधात्मक लगता है, और जब जवाब अस्पष्ट हो जाते हैं तो कोपायलट अक्सर अलग दिशा में चला जाता है। चैटजीपीटी ने इनमें से कुछ भी नहीं किया।

अगर मुझे एक कमी बतानी हो, तो वह बुलेट पॉइंट और नंबरिंग का उपयोग होगा। अगर एआई मॉडल यह समझ जाए कि वास्तविक जीवन में लोग अच्छी तरह से प्रारूपित प्रतिक्रियाओं की तुलना में त्वरित क्रम में भेजे गए पाठ और कई छोटे संदेशों की दीवार को पसंद करते हैं, तो मेरा भ्रम कुछ मिनटों से अधिक समय तक निलंबित हो सकता है।

GPT-4o कंप्यूटर विज़न

कंप्यूटर विज़न ChatGPT द्वारा प्राप्त एक नई क्षमता है, और मैं इसे आज़माने के लिए उत्साहित था। संक्षेप में, यह आपको एक छवि अपलोड करने और आपको जानकारी देने के लिए उसका विश्लेषण करने की अनुमति देता है। मेरे शुरुआती परीक्षण में, मैंने पहचानने के लिए वस्तुओं की छवियाँ साझा कीं, और इसने उस पर बहुत अच्छा काम किया। हर उदाहरण में, यह वस्तु को पहचान सकता था और उसके बारे में जानकारी साझा कर सकता था।

gpt 4o ss2 GPT-4o स्क्रीनशॉट

GPT-4o कंप्यूटर विज़न: तकनीकी उपकरणों की पहचान

फिर, कठिनाई को बढ़ाने और वास्तविक जीवन के उपयोग के मामलों में इसकी क्षमताओं का परीक्षण करने का समय आ गया था। मेरी गर्लफ्रेंड अपनी अलमारी में बदलाव की तलाश कर रही थी, और एक अच्छा बॉयफ्रेंड होने के नाते, मैंने ChatGPT का उपयोग करके रंग विश्लेषण करने का फैसला किया ताकि यह सुझाव दिया जा सके कि उस पर क्या अच्छा लगेगा। मुझे आश्चर्य हुआ कि यह न केवल उसकी त्वचा की टोन और उसने क्या पहना हुआ था (समान रंग की पृष्ठभूमि से) का विश्लेषण करने में सक्षम था, बल्कि आउटफिट सुझावों के साथ एक विस्तृत विश्लेषण भी साझा करता था।

gpt 4o ss3 GPT-4o स्क्रीनशॉट

GPT-4o रंग विश्लेषण

कपड़ों के सुझाव देते समय, इसने उस खास परिधान के लिए अलग-अलग ऑनलाइन खुदरा विक्रेताओं के लिंक भी शेयर किए। हालांकि, निराशाजनक रूप से, कोई भी यूआरएल टेक्स्ट से मेल नहीं खाता था।

कुल मिलाकर, कंप्यूटर विज़न उत्कृष्ट है और शायद नए अपडेट में यह मेरी पसंदीदा विशेषता है, नकारात्मक पहलुओं को नजरअंदाज करते हुए।

GPT-4o वेब खोजें

इंटरनेट एक्सेस एक ऐसा क्षेत्र था जहाँ कोपायलट और जेमिनी दोनों ही चैटजीपीटी से आगे थे। लेकिन अब ऐसा नहीं है, क्योंकि चैटजीपीटी भी जानकारी के लिए इंटरनेट को खंगाल सकता है। मेरे शुरुआती परीक्षण में, चैटबॉट ने अच्छा प्रदर्शन किया। इसने आईपीएल 2024 की तालिका को सामने लाया और एआई के तीन गॉडफादरों में से एक, जेफ्री हिंटन के बारे में हाल के समाचार लेखों को देखा।

जब मैं अपने द्वारा चुने गए साक्षात्कारों के लिए प्रसिद्ध हस्तियों के बारे में शोध करना चाहता था, तो यह बहुत मददगार था। मैं उनके बारे में किसी भी हालिया समाचार लेख को सटीकता के साथ जल्दी से खोज सकता था, जो Google खोज से टक्कर लेता था। हालाँकि, इसने मेरे दिमाग में कुछ खतरे की घंटियाँ भी बजाईं।

गूगल ने मशहूर हस्तियों सहित लोगों के बारे में जानकारी देखने की क्षमता को निष्क्रिय कर दिया है। यह मुख्य रूप से उनकी गोपनीयता की रक्षा करने और किसी व्यक्ति के बारे में कोई गलत जानकारी साझा करने से बचने के लिए किया गया है। मुझे आश्चर्य हुआ कि चैटजीपीटी अभी भी इसकी अनुमति देता है, मैंने उससे कई सवाल पूछने शुरू कर दिए, जिनका जवाब उसे नहीं देना चाहिए था। मैं परिणामों से आश्चर्यचकित था।

हालाँकि दिखाई गई कोई भी जानकारी किसी गैर-सार्वजनिक स्रोत से नहीं ली गई थी, लेकिन यह तथ्य कि कोई भी व्यक्ति इतनी आसानी से मशहूर हस्तियों और डिजिटल फुटप्रिंट वाले लोगों के बारे में जानकारी प्राप्त कर सकता है, बहुत चिंताजनक है। खासकर जब कंपनी ने हाल ही में अपने मॉडल स्पेक को प्रकाशित करते समय जो सख्त नैतिक रुख अपनाया, उसे देखते हुए, यह मुझे अच्छा नहीं लगता। मैं आपको यह तय करने दूँगा कि यह ग्रे एरिया में है या यह बहुत समस्याग्रस्त है।

जीपीटी-4o तार्किक तर्क

स्प्रिंग अपडेट इवेंट के दौरान, OpenAI ने इस बारे में भी बात की कि कैसे GPT-4o बच्चों के लिए एक ट्यूटर के रूप में कार्य कर सकता है और उन्हें समस्याओं को हल करने में मदद कर सकता है। मैंने कुछ प्रसिद्ध तार्किक तर्क प्रश्नों का उपयोग करके इसका परीक्षण करने का निर्णय लिया। सामान्य तौर पर, इसने अच्छा प्रदर्शन किया। इसने कुछ ऐसे कठिन प्रश्नों के उत्तर भी दिए जो GPT 3.5 को परेशान कर रहे थे।

हालाँकि, अभी भी त्रुटियाँ हैं। मुझे संख्या श्रृंखला के कई उदाहरण मिले जहाँ AI ने चूक की और गलत उत्तर दिया। हालाँकि मैं अभी भी AI द्वारा कुछ त्रुटियाँ किए जाने को स्वीकार कर सकता हूँ, लेकिन यहाँ मुझे वास्तव में निराशा इस बात से हुई कि यह अभी भी कुछ बेहद आसान (लेकिन AI को धोखा देने के लिए) सवालों के लिए कैसे गिर गया।

gpt 4o ss4 GPT-4o स्क्रीनशॉट

GPT-4o के मतिभ्रम का उदाहरण

“स्ट्रॉबेरी शब्द में कितने हैं” पूछने पर, इसने आत्मविश्वास से दो का उत्तर दिया (यदि आप सोच रहे हैं तो सही उत्तर तीन है)। कई अन्य ट्रिकी प्रश्नों में भी यही समस्या थी। मेरे अनुभव में, GPT-4o की तार्किक तर्क और विश्वसनीयता इसके पूर्ववर्ती के समान है, जो बिल्कुल भी बढ़िया नहीं है।

GPT-4o: अंतिम विचार

कुल मिलाकर, मैं नए AI मॉडल के कुछ क्षेत्रों में उन्नयन से काफी प्रभावित हूँ, जिसमें कंप्यूटर विज़न और संवादी भाषण मेरे पसंदीदा हैं। मैं इसकी इंटरनेट सर्चिंग क्षमता से भी प्रभावित हूँ, लेकिन यह इतनी अच्छी है कि यह मुझे ज़्यादा चिंतित करती है। तार्किक तर्क और उत्पादक क्षमताओं की बात करें तो इसमें थोड़ा सुधार हुआ है।

मेरी राय में, यदि आपके पास GPT-4o तक प्रीमियम पहुंच है, तो यह समग्र डिलीवरी के मामले में किसी भी अन्य प्रतियोगी की तुलना में बेहतर है। हालाँकि, सुधार की बहुत गुंजाइश है, और AI पर आँख मूंदकर भरोसा नहीं किया जा सकता है।


Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button