आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में प्रतिस्पर्धा लगातार तेज होती जा रही है। शुरुआत ओपनआई के ChatGPT ने की थी और उसके बाद Anthropic ने अपने एआई मॉडल से पूरी दुनिया में तहलता मचा रखा है। इसी बीच Anthropic ने अपना नया फ्लैगशिप मॉडल Claude Opus 4.8 लॉन्च किया है, जिसे लेकर टेक जगत में काफी चर्चा हो रही है। लॉन्च के बाद एलन मस्क (Elon Musk) ने भी इसकी सराहना करते हुए सोशल मीडिया प्लेटफॉर्म X पर "Nice work" लिखकर कंपनी की प्रशंसा की।
Claude Opus 4.8 में क्या है नया?
Anthropic ने अपने इस मॉडल को लेकर दावा किया है कि Claude Opus 4.8 को पहले की तुलना में अधिक समझदार, जागरूक और लंबे समय तक स्वतंत्र रूप से काम करने में सक्षम बनाया गया है। कंपनी का दावा है कि यह मॉडल जटिल कार्यों को बेहतर तरीके से संभाल सकता है और अपनी सीमाओं को पहचानने में भी अधिक सक्षम है यानी इसमें पक्षपात की संभावना कम है। सबसे खास बात यह है कि नया मॉडल पुराने वर्जन की तुलना में बेहतर प्रदर्शन देने के बावजूद उसी कीमत पर उपलब्ध कराया जाएगा।
कोडिंग और रीजनिंग में बेहतर प्रदर्शन
Anthropic द्वारा साझा किए गए बेंचमार्क रिजल्ट के अनुसार, Claude Opus 4.8 ने SWE-Bench Pro में 69.2 प्रतिशत स्कोर हासिल किया। यह टेस्ट सॉफ्टवेयर इंजीनियरिंग और कोडिंग क्षमताओं को मापने के लिए इस्तेमाल किया जाता है। वहीं Humanity's Last Exam नामक हाईटेक रीजनिंग बेंचमार्क में मॉडल ने टूल्स के साथ 57.9 प्रतिशत स्कोर प्राप्त किया। कंपनी का कहना है कि वित्तीय विश्लेषण से जुड़े एजेंटिक कार्यों में भी मॉडल ने 53.9 प्रतिशत स्कोर हासिल किया, जो इसके पुराने वर्जन और कई प्रतिस्पर्धी मॉडलों से बेहतर है।
'4 गुना अधिक ईमानदार' होने का दावा
उन्नत AI मॉडलों की एक बड़ी समस्या यह रही है कि वे कई बार पर्याप्त प्रमाण न होने पर भी आत्मविश्वास के साथ गलत निष्कर्ष पेश कर देते हैं। Anthropic का दावा है कि Claude Opus 4.8 इस समस्या को काफी हद तक कम करता है। कंपनी के अनुसार, शुरुआती टेस्टर्स ने पाया कि नया मॉडल अपनी अनिश्चितताओं को अधिक स्पष्ट रूप से स्वीकार करता है और बिना पर्याप्त आधार के दावे करने की संभावना काफी कम है। कंपनी ने इंटरनलगसस परीक्षणों में यह भी पाया गया कि Opus 4.8 अपने पहले वाले Claude Opus 4.7 की तुलना में कोड में मौजूद खामियों को नजरअंदाज करने की संभावना लगभग चार गुना कम रखता है।
AI कंपनियों के बीच बढ़ी प्रतिस्पर्धा
Claude Opus 4.8 का लॉन्च ऐसे समय में हुआ है जब AI क्षेत्र में OpenAI, Google, xAI और Anthropic जैसी कंपनियां लगातार नए और अधिक सक्षम मॉडल पेश कर रही हैं। Anthropic का दावा है कि नया मॉडल वित्तीय विश्लेषण, हाइटेक रीजनिंग और एजेंटिक कोडिंग जैसे महत्वपूर्ण क्षेत्रों में उद्योग के कई प्रतिस्पर्धी मॉडलों से बेहतर प्रदर्शन करता है। ऐसे में Claude Opus 4.8 को AI बाजार में कंपनी के लिए एक महत्वपूर्ण कदम माना जा रहा है।
