चीन के DeepSeek को मिलेगी जोरदार टक्कर, सरकार ने पहला घरेलू AI मॉडल बनाने के लिए इस कंपनी को चुना

सरकार ने बेंगलुरु की स्टार्टअप Sarvam को देश का पहला स्वदेशी AI लार्ज लैंग्वेज मॉडल (LLM) बनाने के लिए चुना है. Sarvam का मॉडल भारत में ही तैयार, डिप्लॉय और ऑप्टिमाइज़ होगा. इसमें 70 अरब पैरामीटर्स होंगे और यह भारतीय भाषाओं में काम करेगा. सरकार ने 6 महीने के लिए 4,000 GPUs की सुविधा दी है. Sarvam तीन वेरिएंट्स बनाएगा: Large, Small और Edge, जो अलग-अलग यूज केस के लिए होंगे.

AI की दुनिया में भारत का बड़ा कदम. Image Credit: @tv9

केंद्र सरकार ने देश का पहला स्वदेशी आर्टिफिशियल इंटेलिजेंस (AI) आधारित लार्ज लैंग्वेज मॉडल (LLM) बनाने के लिए बेंगलुरु की स्टार्टअप ‘Sarvam’ को चुना है. इसे चीन के कम लागत वाले मॉडल DeepSeek के जवाब के तौर पर देखा जा रहा है. 67 स्टार्टअप्स में से चुनी गई Sarvam को मॉडल बनाने के लिए सरकार की तरफ से कंप्यूट रिसोर्स जैसी मदद मिलेगी. Sarvam पहली स्टार्टअप है जिसे सरकार के 10,370 करोड़ रुपये के IndiaAI मिशन के तहत सुविधा (SOPs) मिली है. अभी और भी कई प्रपोजल्स की समीक्षा जारी है. Sarvam का कहना है कि उसका मॉडल रीजनिंग करने में सक्षम है. साथ ही आवाज आधारित और भारतीय भाषाओं में फ्लुएंट भी होगा. इसे बड़ी आबादी के इस्तेमाल के लिए तैयार किया जाएगा.

एक सीनियर अधिकारी ने कहा कि सरकार की तरफ से सपोर्ट के तौर पर Sarvam को 6 महीने के लिए 4,000 ग्राफिक्स प्रोसेसिंग यूनिट्स (GPUs) दिए जाएंगे, ताकि वह अपना मॉडल तैयार और ट्रेन कर सके. यह मॉडल ओपन-सोर्स नहीं होगा, लेकिन इसे खासतौर पर भारतीय भाषाओं के लिए फाइन-ट्यून किया जाएगा. सरकार ने जिन कंपनियों को भारत में AI डेटा सेंटर बनाने के लिए चुना है, वही कंपनियां Sarvam को ये GPUs उपलब्ध कराएंगी.

ये भी पढ़ें- एलन मस्क की साइबर ट्रक ने भारत में दी दस्तक, सूरत की सड़कों पर भर रही रफ्तार

मॉडल 70 अरब पैरामीटर्स वाला होगा

आईटी मंत्री अश्विनी वैष्णव ने कहा कि Sarvam का मॉडल 70 अरब पैरामीटर्स वाला होगा और इसमें प्रोग्रामिंग और इंजीनियरिंग दोनों में कई इनोवेशन होंगे. इन इनोवेशंस की मदद से, 70 अरब पैरामीटर्स वाला यह मॉडल दुनिया के टॉप मॉडल्स से मुकाबला कर सकेगा. Sarvam के LLM प्रोजेक्ट के तहत कंपनी तीन मॉडल वेरिएंट्स तैयार कर रही है, जो Sarvam-Large- एडवांस्ड रीजनिंग और कंटेंट जेनरेशन के लिए, Sarvam-Small- रियल-टाइम इंटरएक्टिव एप्लिकेशन के लिए और Sarvam Edge- छोटे और डिवाइस-बेस्ड टास्क के लिए हैं.

चीन का DeepSeek मॉडल

यह डेवलपमेंट ऐसे वक्त पर हो रहा है जब चीन का DeepSeek मॉडल तेजी से पॉपुलर हो रहा है. DeepSeek को ओपन-सोर्स, सटीक और कम लागत में बना मॉडल बताया जा रहा है. इसकी एंट्री के बाद से ही AI इंडस्ट्री में हलचल मच गई है और Nvidia के शेयरों में गिरावट देखी गई, क्योंकि DeepSeek का R1 मॉडल कमजोर GPUs पर भी अच्छा परफॉर्म कर पाया, जो OpenAI जैसे अमेरिकी मॉडल्स से काफी अलग है.

Sarvam का मॉडल पूरी तरह से भारत में तैयार, डिप्लॉय और ऑप्टिमाइज किया जाएगा. इसमें लोकल इंफ्रास्ट्रक्चर और भारत के नए टैलेंट का इस्तेमाल होगा. कंपनी ने प्रेस रिलीज में बताया कि इस पहल का मकसद भारत को AI में आत्मनिर्भर बनाना, देशी इनोवेशन को बढ़ाना और लंबी अवधि के लिए AI लीडरशिप हासिल करना है.

ये भी पढ़ें- मार्केट में बिक रहे हैं ‘नकली आम’, इन 6 तरीकों से करें असली की पहचान

क्या बोले Sarvam के को-फाउंडर

Sarvam के को-फाउंडर विवेक राघवन ने कहा कि यह कदम भारत के लिए एक मजबूत नेशनल AI इंफ्रास्ट्रक्चर बनाने की दिशा में बहुत जरूरी है. हमारा लक्ष्य है कि हम मल्टी-मोडल, मल्टी-स्केल फाउंडेशन मॉडल को पूरी तरह से खुद से तैयार करें. जब हम ऐसा करेंगे, तो अनगिनत नए एप्लिकेशन सामने आएंगे.