भारत का Sarvam AI बना ग्लोबल सनसनी, Google Gemini और ChatGPT को छोड़ा पीछे
- Authored by: Pradeep Pandey
- Updated Feb 9, 2026, 09:38 AM IST
OCR के साथ-साथ Sarvam ने अपना नया टेक्स्ट-टू-स्पीच AI मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज में ऑडियो तैयार करता है। कंपनी के मुताबिक, Bulbul V3 खासतौर पर भारत से जुड़े उपयोग मामलों को ध्यान में रखकर बनाया गया है।
Sarvam AI/photo- Sarvam AI
अभी तक आर्टिफिशियल इंटेलिजेंस (AI) की दुनिया में अमेरिका और चीन का दबदबा माना जाता रहा है, लेकिन अब भारत भी इस रेस में मजबूती से उभर रहा है। बेंगलुरु स्थित स्टार्टअप Sarvam AI ने अपने स्वदेशी AI मॉडल्स के दम पर दुनिया का ध्यान खींच लिया है। कंपनी का दावा है कि उसके टूल्स ने कुछ अहम बेंचमार्क पर Google Gemini और ChatGPT जैसे बड़े AI मॉडल्स को भी पीछे छोड़ दिया है।
‘सॉवरेन AI’ पर काम कर रही है Sarvam AI
Sarvam AI खुद को भारत का “सॉवरेन AI” बनाने की दिशा में काम करने वाला स्टार्टअप बताता है। इसका मतलब है कि कंपनी भारत में ही शुरू से लेकर अंत तक AI के फाउंडेशनल मॉडल तैयार कर रही है। इस हफ्ते Sarvam के दो टूल्स Sarvam Vision और Bulbul खूब चर्चा में हैं और इनके प्रदर्शन की हर तरफ तारीफ हो रही है।
OCR में Sarvam Vision का शानदार प्रदर्शन
Sarvam Vision एक खास AI मॉडल है, जो ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) में विशेषज्ञता रखता है। कंपनी के अनुसार, इस टूल ने olmOCR-Bench पर 84.3 प्रतिशत की सटीकता हासिल की है। यह स्कोर Google Gemini 3 Pro और DeepSeek OCR v2 जैसे आधुनिक मॉडल्स से भी बेहतर बताया जा रहा है, जबकि ChatGPT इस बेंचमार्क पर काफी पीछे रहा।
जटिल डॉक्यूमेंट्स पढ़ने में भी आगे
Sarvam Vision ने OmniDocBench v1.5 पर भी शानदार प्रदर्शन किया है। यह बेंचमार्क असली दुनिया के दस्तावेजों जैसे तकनीकी टेबल, जटिल लेआउट और गणितीय सूत्र को समझने की क्षमता जांचता है। Sarvam Vision ने यहां 93.28 प्रतिशत का कुल स्कोर हासिल किया, जो पारंपरिक OCR सिस्टम्स के लिए मुश्किल माने जाने वाले क्षेत्रों में भी इसकी मजबूती दिखाता है।
आलोचकों की राय बदली, मिल रही वैश्विक सराहना
पहले Sarvam AI पर सिर्फ भारतीय भाषाओं पर फोकस करने को लेकर सवाल उठते थे, लेकिन अब वही आलोचना तारीफ में बदल रही है। टेक कमेंटेटर Deedy Das ने माना कि उन्होंने कंपनी को पहले कम आंका था। उन्होंने कहा कि Sarvam के OCR और स्पीच मॉडल भारतीय भाषाओं के लिए बेहद उपयोगी हैं और बड़ी वैश्विक AI लैब्स ने इस क्षेत्र को नजरअंदाज किया है।
यूजर्स भी कर रहे हैं तारीफ
Sarvam के टूल्स को इस्तेमाल करने वाले यूजर्स ने भी सकारात्मक प्रतिक्रिया दी है। एक यूजर ने अनुभव साझा करते हुए लिखा, “मैंने इसे कुछ दिन पहले इस्तेमाल किया, वाकई कमाल का है।”
Bulbul V3: भारतीय भाषाओं में AI आवाज
OCR के साथ-साथ Sarvam ने अपना नया टेक्स्ट-टू-स्पीच AI मॉडल Bulbul V3 भी लॉन्च किया है। यह मॉडल भारतीय भाषाओं में प्राकृतिक और स्पष्ट आवाज में ऑडियो तैयार करता है। कंपनी के मुताबिक, Bulbul V3 खासतौर पर भारत से जुड़े उपयोग मामलों को ध्यान में रखकर बनाया गया है।
11 भाषाओं में 35 से ज्यादा आवाजें
फिलहाल Bulbul V3 में 11 भारतीय भाषाओं के लिए 35 से अधिक वॉइस ऑप्शन उपलब्ध हैं। Sarvam का लक्ष्य इसे बढ़ाकर 22 भारतीय भाषाओं तक ले जाना है। KissanAI के संस्थापक प्रतीक देसाई ने भी Bulbul की तारीफ करते हुए कहा कि यह भारतीय भाषाओं के लिए सबसे बेहतर और किफायती टेक्स्ट-टू-स्पीच मॉडल बनता जा रहा है।
