टेक एंड गैजेट्स

भारत का Sarvam AI बना ग्लोबल सनसनी, Google Gemini और ChatGPT को छोड़ा पीछे

OCR के साथ-साथ Sarvam ने अपना नया टेक्स्ट-टू-स्पीच AI मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज में ऑडियो तैयार करता है। कंपनी के मुताबिक, Bulbul V3 खासतौर पर भारत से जुड़े उपयोग मामलों को ध्यान में रखकर बनाया गया है।

Sarvam AI

Sarvam AI/photo- Sarvam AI

अभी तक आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में अमेरिका और चीन का दबदबा माना जाता रहा है, लेकिन अब भारत भी इस रेस में मजबूती से उभर रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने अपने स्वदेशी AI मॉडल्स के दम पर दुनिया का ध्यान खींच लिया है। कंपनी का दावा है कि उसके टूल्स ने कुछ अहम बेंचमार्क पर Google Gemini और ChatGPT जैसे बड़े AI मॉडल्स को भी पीछे छोड़ दिया है।

‘सॉवरेन AI’ पर काम कर रही है Sarvam AI

Sarvam AI खुद को भारत का “सॉवरेन AI” बनाने की दिशा में काम करने वाला स्टार्टअप बताता है। इसका मतलब है कि कंपनी भारत में ही शुरू से लेकर अंत तक AI के फाउंडेशनल मॉडल तैयार कर रही है। इस हफ्ते Sarvam के दो टूल्स Sarvam Vision और Bulbul खूब चर्चा में हैं और इनके प्रदर्शन की हर तरफ तारीफ हो रही है।

OCR में Sarvam Vision का शानदार प्रदर्शन

Sarvam Vision एक खास AI मॉडल है, जो ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) में विशेषज्ञता रखता है। कंपनी के अनुसार, इस टूल ने olmOCR-Bench पर 84.3 प्रतिशत की सटीकता हासिल की है। यह स्कोर Google Gemini 3 Pro और DeepSeek OCR v2 जैसे आधुनिक मॉडल्स से भी बेहतर बताया जा रहा है, जबकि ChatGPT इस बेंचमार्क पर काफी पीछे रहा।

जटिल डॉक्यूमेंट्स पढ़ने में भी आगे

Sarvam Vision ने OmniDocBench v1.5 पर भी शानदार प्रदर्शन किया है। यह बेंचमार्क असली दुनिया के दस्तावेजों जैसे तकनीकी टेबल, जटिल लेआउट और गणितीय सूत्र को समझने की क्षमता जांचता है। Sarvam Vision ने यहां 93.28 प्रतिशत का कुल स्कोर हासिल किया, जो पारंपरिक OCR सिस्टम्स के लिए मुश्किल माने जाने वाले क्षेत्रों में भी इसकी मजबूती दिखाता है।

आलोचकों की राय बदली, मिल रही वैश्विक सराहना

पहले Sarvam AI पर सिर्फ भारतीय भाषाओं पर फोकस करने को लेकर सवाल उठते थे, लेकिन अब वही आलोचना तारीफ में बदल रही है। टेक कमेंटेटर Deedy Das ने माना कि उन्होंने कंपनी को पहले कम आंका था। उन्होंने कहा कि Sarvam के OCR और स्पीच मॉडल भारतीय भाषाओं के लिए बेहद उपयोगी हैं और बड़ी वैश्विक AI लैब्स ने इस क्षेत्र को नजरअंदाज किया है।

यूजर्स भी कर रहे हैं तारीफ

Sarvam के टूल्स को इस्तेमाल करने वाले यूजर्स ने भी सकारात्मक प्रतिक्रिया दी है। एक यूजर ने अनुभव साझा करते हुए लिखा, “मैंने इसे कुछ दिन पहले इस्तेमाल किया, वाकई कमाल का है।”

Bulbul V3: भारतीय भाषाओं में AI आवाज

OCR के साथ-साथ Sarvam ने अपना नया टेक्स्ट-टू-स्पीच AI मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज में ऑडियो तैयार करता है। कंपनी के मुताबिक, Bulbul V3 खासतौर पर भारत से जुड़े उपयोग मामलों को ध्यान में रखकर बनाया गया है।

11 भाषाओं में 35 से ज्यादा आवाजें

फिलहाल Bulbul V3 में 11 भारतीय भाषाओं के लिए 35 से अधिक वॉइस ऑप्शन उपलब्ध हैं। Sarvam का लक्ष्य इसे बढ़ाकर 22 भारतीय भाषाओं तक ले जाना है। KissanAI के संस्थापक प्रतीक देसाई ने भी Bulbul की तारीफ करते हुए कहा कि यह भारतीय भाषाओं के लिए सबसे बेहतर और किफायती टेक्स्ट-टू-स्पीच मॉडल बनता जा रहा है।

Pradeep Pandey
Pradeep Pandey author

प्रदीप पाण्डेय टाइम्स नाउ नवभारत डिजिटल में टेक और ऑटो बीट पर कंटेंट तैयार करते हैं। डिजिटल मीडिया में 10 वर्षों के अनुभव के साथ प्रदीप तकनीक की दुनिय... और देखें

End of Article