
जब सैम ऑल्टमैन ने पिछले साल भारत का दौरा किया था, तो उन्होंने कहा था कि किसी स्टार्टअप के लिए बैंक में 10 मिलियन डॉलर के साथ फाउंडेशन मॉडल के प्रशिक्षण में ओपनएआई के साथ प्रतिस्पर्धा करना असंभव होगा। भारतीय आईटी फर्म टेक महिंद्रा के पूर्व सीईओ सीपी गुरनानी की इस टिप्पणी ने बड़ी सुर्खियां बटोरीं कह रहा कि भारत में मूल रूप से जेनरेटिव एआई बनाने की चुनौती स्वीकार कर ली गई।
2024 की शुरुआत में, भारत, जो अपनी प्रौद्योगिकी प्रतिभा और कंपनियों के लिए जाना जाता है, जेनरेटिव एआई के साथ अच्छी तरह से आगे बढ़ रहा है। हालाँकि, दिलचस्प बात यह है कि ओपनएआई के जीपीटी मॉडल को लेने के लिए ठोस कदम उठाने वाला पहला भारतीय खिलाड़ी टेक महिंद्रा नहीं है, बल्कि – आपने अनुमान लगाया – भाविश अग्रवाल द्वारा स्थापित एक स्टार्टअप, जिसने राइड-हेलिंग कंपनी ओला कैब्स की भी स्थापना की थी। उबेर.
Ola Krutrim – जिसका अर्थ है “कृत्रिम” – ने पिछले महीने अपना पहला भाषा मॉडल, क्रुट्रिम बेस और इसके शीर्ष पर बनाया गया एक चैटबॉट लॉन्च किया, जबकि इसे बहुत जल्द मुख्यधारा में लाने की योजना का विवरण दिया। टेक महिंद्रा और रिलायंस इंडस्ट्रीज सहित अन्य खिलाड़ी भी दौड़ में शामिल होने की कोशिश कर रहे हैं।
स्थानीयकृत अनुभव प्रदान करने की होड़
जबकि ओपनएआई के जीपीटी परिवार और मेटा के लामा जैसे फाउंडेशन मॉडल भाषा, उत्तर और कोड तैयार करने में बहुत अच्छा काम करते हैं, वे कभी-कभी गैर-अंग्रेजी भाषाओं, विशेष रूप से कम-संसाधन वाले (छोटे डिजिटल पदचिह्न के साथ) में प्रश्नों को संभालने के लिए संघर्ष कर सकते हैं। इसे संबोधित करने और अधिक स्थानीयकृत अनुभवों को शक्ति प्रदान करने के लिए, विभिन्न देशों की प्रौद्योगिकी कंपनियां भी शामिल हैं दक्षिण कोरिया और चीनने अपने प्रशिक्षण डेटा में स्थानीय भाषाओं और सांस्कृतिक संदर्भों का प्रतिनिधित्व बढ़ाने के दृष्टिकोण के साथ मालिकाना मॉडल का प्रशिक्षण शुरू किया है।
यही चुनौती भारत की जनरेटिव एआई महत्वाकांक्षाओं में भी बाधा डालती है। हालाँकि, इस मामले में समस्या कई गुना बड़ी है। यह देश 1.4 अरब लोगों या दुनिया की लगभग 18% आबादी का घर है, और इसमें 22 आधिकारिक तौर पर मान्यता प्राप्त भाषाएँ, 1600+ बोलियाँ और 19200 अनौपचारिक बोलियाँ हैं। एक मॉडल को सभी को शामिल करने के लिए प्रशिक्षित करना अपने आप में एक कार्य है – और निश्चित रूप से एक पूंजी-गहन कार्य (जैसा कि ऑल्टमैन ने सुझाव दिया है)।
राइड-हेलिंग सेवाओं की पेशकश करने और इलेक्ट्रिक वाहनों को सफलतापूर्वक बेचने के बाद, अग्रवाल ने इस चुनौती को लेने के लिए अप्रैल 2023 में क्रुट्रिम को शामिल किया। कंपनी ने मैट्रिक्स पार्टनर्स से 24 मिलियन डॉलर का कर्ज जुटाया और दो ट्रिलियन टोकन पर क्रुट्रिम बेस को प्रशिक्षित किया। लॉन्च के समय उद्यमी ने कहा था कि इसमें इंडिक भाषाओं का सबसे बड़ा प्रतिनिधित्व शामिल है, जो किसी भी अन्य मॉडल की तुलना में 20 गुना अधिक है।
“क्रुत्रिम में मूल रूप से भारतीय लोकाचार हैं। यह भारतीय सांस्कृतिक संवेदनाओं और प्रासंगिकता की सहज भावना के साथ पाठ और कोड उत्पन्न करता है, ”उन्होंने कहा।
अपने वर्तमान स्वरूप में, ओला का मॉडल 20 भारतीय भाषाओं को समझता है और हिंदी और अंग्रेजी सहित 10 उत्पन्न करता है।
कंपनी के अनुसार, इंडिक भाषाओं में इसका प्रदर्शन पहले से ही GPT-4 से बेहतर है, लेकिन अंग्रेजी गुणवत्ता का प्रदर्शन पीछे है (आने वाले महीनों में इसमें सुधार होने की उम्मीद है)।
स्टार्टअप चरणों में आगे बढ़ रहा है और इसमें पाइपलाइन में कई विकास शामिल हैं, जिसमें सभी आधिकारिक तौर पर मान्यता प्राप्त इंडिक भाषाओं के लिए समर्थन और पाठ, दृष्टि और भाषण के समर्थन के साथ जटिल समस्या-समाधान के लिए मॉडल का प्रो संस्करण शामिल है।
मॉडलों के अलावा, जो व्यवसायों को प्रदान किए जाएंगे, अग्रवाल और टीम ने एक बनाया है चैटजीपीटी जैसा चैटबॉट अनुभव भारतीय दर्शकों के लिए. हालाँकि, यह इस स्तर पर जनता के लिए खुला नहीं है। कंपनी अपने AI सुपरकंप्यूटर के निर्माण के लिए हार्डवेयर के मोर्चे पर भी R&D कर रही है।
बड़ी बंदूकें कैचअप खेल रही हैं
हालांकि यह देखना बाकी है कि क्रुट्रिम के मॉडल वास्तविक दुनिया में कैसे काम करते हैं, जब डेवलपर्स और उपभोक्ता उनका उपयोग करना शुरू करते हैं, तो कंपनी ने खुद को बहुप्रचारित जेनरेटिव एआई स्पेस में सभी आधारों को कवर करने वाले पहले भारतीय खिलाड़ियों में से एक के रूप में स्थापित किया है। .
अन्य उल्लेखनीय कंपनियां जो पकड़ में आ रही हैं, वे हैं टेक महिंद्रा और अरबपति मुकेश अंबानी की रिलायंस इंडस्ट्रीज।
सीपी गुरनानी के नेतृत्व में टेक महिंद्रा ने ओपन-सोर्स लार्ज लैंग्वेज मॉडल पर काम करना शुरू किया सिंधु परियोजना अगस्त 2023 में और हाल ही में लॉन्च किया गया यह आंतरिक बीटा परीक्षण के लिए है।
यह पेशकश फरवरी 2024 में शुरू होने वाली है और कहा जाता है कि यह 539 मिलियन मापदंडों और 10 बिलियन हिंदी + बोली टोकन के साथ एक शुद्ध हिंदी एलएलएम है। इस मामले में भी, सभी भाषाएँ समर्थित नहीं हैं।
कंपनी ने अपने बयान में कहा, “पहले चरण में, हम हिंदी भाषा और 37 से अधिक बोलियों के लिए एलएलएम बनाएंगे, और फिर चरणबद्ध तरीके से अन्य भाषाओं और बोलियों को कवर करने के लिए आगे बढ़ेंगे।” वेबसाइट.
दूसरी ओर, रिलायंस इंडस्ट्रीज, जिसने जियो के साथ भारत में 4जी लहर का नेतृत्व किया और जिसके पास गूगल, मेटा और इंटेल जैसे समर्थक हैं, एआई की दौड़ में थोड़ी धीमी गति से आगे बढ़ती दिख रही है।
कंपनी ने पिछले साल और उसके बाद अपनी एजीएम में भारत के लिए भाषा मॉडल बनाने की योजना की घोषणा की थी एनवीडिया के साथ साझेदारी की GH200 सुपरचिप तक पहुंच प्राप्त करने और भारत में सबसे तेज़ सुपर कंप्यूटर की तुलना में अधिक शक्तिशाली AI बुनियादी ढांचे का निर्माण करने के लिए। अब, यह भारत जीपीटी नामक परियोजना को साकार करने के लिए भारतीय प्रौद्योगिकी संस्थान-बॉम्बे की एक टीम के साथ काम कर रहा है।
हालाँकि बहुत अधिक विवरण साझा नहीं किए गए हैं, लेकिन ऐसा प्रतीत होता है कि रिलायंस अपने ग्राहक-सामना वाले उत्पादों और सेवाओं में GPT की पेशकश लाने की योजना बना रहा है, जिसमें Jio द्वारा पेश किए गए उत्पाद भी शामिल हैं। यह स्पष्ट नहीं है कि कंपनी अलग से लॉन्च करेगी या नहीं, चैटजीपीटी जैसा उपभोक्ता-सामना वाला चैटबॉट या नहीं।
रिलायंस और टेकएम के साथ, बेंगलुरु स्थित सर्वम ए.आईजो हाल ही में 41 मिलियन डॉलर की फंडिंग के साथ गुप्त रूप से बाहर आया, ने भी महत्वपूर्ण ध्यान आकर्षित किया है।
स्टार्टअप ने एक बनाया है 7 बिलियन पैरामीटर इंडिक भाषा मॉडलLlama2 पर आधारित है, और कंपनियों को इसका उपयोग करके जेनरेटिव AI ऐप बनाने में मदद करने के लिए एक एंटरप्राइज़-केंद्रित प्लेटफ़ॉर्म लॉन्च करने की योजना बना रहा है।
Google समर्थित कोरोवर यह भी दावा किया गया है कि उसने संवादात्मक उद्यम चैटबॉट्स के लिए अपने प्लेटफॉर्म के लिए 22 भाषाओं का समर्थन करने वाला एक इंडिक भाषा मॉडल बनाया है।
जेनरेटर एआई के साथ बेहतर अनुभव
जैसे-जैसे पारिस्थितिकी तंत्र विकसित होता है, अधिक खिलाड़ी उभरते हैं और प्रौद्योगिकी परिपक्व होती है, देश में अधिक परिष्कृत बंद और खुले-स्रोत इंडिक भाषा मॉडल के आकार लेने की उम्मीद है। यह सब न केवल आंतरिक उद्यम वर्कफ़्लो में सुधार करेगा बल्कि विभिन्न क्षेत्रों में काम करने वाले संगठनों के लिए बेहतर अनुप्रयोगों को भी बढ़ावा देगा।
उदाहरण के लिए, टेक महिंद्रा का कहना है कि इंडस प्रोजेक्ट का एलएलएम 140 मिलियन से अधिक किसानों के लिए एक डिजिटल सहायक के विकास की ओर ले जा सकता है, जो उन्हें उनकी पसंदीदा भाषा में ऋण, कीटनाशकों और अन्य कृषि-संबंधी पहलुओं पर आवश्यक जानकारी प्रदान करेगा।
यह स्थानीय बोलियों में भाषण को समझने और कुछ ही सेकंड में उपयोगी जानकारी प्रदान करने के लिए स्वास्थ्य सेवा और वित्त कियोस्क को भी शक्ति प्रदान कर सकता है। संभावनाएं अनंत हैं।
इसके अलावा, यह देखना भी दिलचस्प होगा कि ये मॉडल प्रदर्शन के मामले में अपने वैश्विक समकक्षों के मुकाबले कैसा प्रदर्शन करते हैं, जिसमें ओपनएआई जैसे मार्केट लीडर शामिल हैं, जो जीपीटी-4.5 की ओर बढ़ रहा है, और गूगल, जो हाल ही में मॉडलों की जेमिनी श्रृंखला की शुरुआत की.
वेंचरबीट का मिशन परिवर्तनकारी उद्यम प्रौद्योगिकी और लेनदेन के बारे में ज्ञान प्राप्त करने के लिए तकनीकी निर्णय निर्माताओं के लिए एक डिजिटल टाउन स्क्वायर बनना है। हमारी ब्रीफिंग खोजें.