संदर्भ
भारत सरकार के प्रधान वैज्ञानिक सलाहकार के कार्यालय ने “एडवांसिंग इंडीजीनिअस फाउंडेशन मॉडल्स” (Advancing Indigenous Foundation Models) शीर्षक से एक श्वेत-पत्र जारी किया है।
संबंधित तथ्य
- इसमें भारत के अपने कृत्रिम बुद्धिमत्ता मॉडल विकसित करने और वैश्विक AI पारिस्थितिकी तंत्र में देश की स्थिति को मजबूत करने के लिए एक रोडमैप की रूपरेखा प्रस्तुत की गई है।
- सरकार सार्वजनिक संस्थानों और निजी कंपनियों के बीच सहयोग के माध्यम से स्वदेशी AI प्रणालियों के विकास को सक्रिय रूप से प्रोत्साहित कर रही है।
श्वेत पत्र की मुख्य विशेषताएँ
- स्वदेशी AI विकास को प्राथमिकता: इसमें समावेशी विकास, जन कल्याण और भारत के कानूनी ढाँचे, मूल्यों और सुरक्षा हितों के अनुरूप स्वदेशी आधारभूत मॉडलों के विकास को प्रमुख प्राथमिकता बताया गया है।
- भारत-विशिष्ट आधारभूत मॉडल: श्वेत-पत्र के अनुसार, भारत देश से संबंधित डेटासेट पर प्रशिक्षित अपने स्वयं के आधारभूत मॉडल विकसित करने की योजना बना रहा है।
- इस दृष्टिकोण से पारदर्शिता, समावेशिता और राष्ट्रीय प्राथमिकताओं के अनुरूपता में सुधार होने की आशा है, साथ ही वैश्विक AI परिदृश्य में भारत की भूमिका भी मजबूत होगी।
- विविध AI मॉडलों पर ध्यान: इसमें लार्ज लैंग्वेज मॉडल (LLM) और स्माल लैंग्वेज मॉडल (SLM) दोनों के महत्त्व पर भी जोर दिया गया है।
- जहाँ LLM विभिन्न क्षेत्रों में व्यापक कार्य कर सकते हैं, वहीं SLM विशिष्ट डोमेन के लिए डिजाइन किए गए विशेष मॉडल हैं और आमतौर पर संचालन में अधिक लागत प्रभावी होते हैं।
- अनुप्रयोग: भारत में, ऐसे मॉडलों का उपयोग कृषि, स्वास्थ्य सेवा, शिक्षा और सूक्ष्म, लघु और मध्यम उद्यमों जैसे क्षेत्रों में किया जा सकता है।
- LLM, SLM और मल्टीमॉडल AI मॉडल के संयोजन से भाषायी समावेशन, सामर्थ्य और ऊर्जा दक्षता को बढ़ावा मिलने की आशा है, साथ ही जलवायु, स्वास्थ्य, शिक्षा और शहरी शासन जैसे क्षेत्रों में नवाचार को सक्षम बनाने में भी सहायता मिलेगी।
भारत में स्वदेशी AI मॉडल के उदाहरण
- भारतजीपीटी: मद्रास स्थित भारतीय प्रौद्योगिकी संस्थान के शोधकर्ताओं द्वारा उद्योग जगत के साझेदारों के सहयोग से विकसित किया गया।
- इसे बैंकिंग, दूरसंचार और शासन जैसे कई भारतीय भाषाओं और क्षेत्रों को समर्थन देने के लिए डिजाइन किया गया है।
- सर्वम् AI मॉडल: सर्वम् AI द्वारा भारतीय भाषाओं और शासन संबंधी अनुप्रयोगों के लिए तैयार किए गए बड़े भाषा मॉडल बनाने के लिए विकसित किया गया।
सरकारी पहल
- इंडियाAI मिशन: इसका उद्देश्य AI कंप्यूटिंग इन्फ्रास्ट्रक्चर, डेटासेट और स्वदेशी आधारभूत मॉडल विकसित करना है।
- डिजिटल इंडिया: यह AI को अपनाने, डिजिटल शासन और तकनीकी नवाचार को बढ़ावा देता है।
|
फाउंडेशन मॉडल के बारे में
- फाउंडेशन मॉडल बड़े AI सिस्टम होते हैं, जिन्हें टेक्स्ट, इमेज, ऑडियो और वीडियो जैसे विशाल डेटासेट पर प्रशिक्षित किया जाता है।
- उदाहरण के लिए: GPT-4 और BERT जैसे मॉडल व्यापक रूप से उपयोग किए जाने वाले फाउंडेशन मॉडल हैं।
- कार्य सिद्धांत: ये मॉडल अनुवाद, सारांश, प्रश्नोत्तर और टेक्स्ट वर्गीकरण सहित कई प्रकार के कार्य कर सकते हैं और आधुनिक AI विकास में एक महत्त्वपूर्ण स्तर माने जाते हैं।
आवश्यकता
- वर्तमान में, भारत में उपयोग किए जाने वाले कई AI मॉडल विदेशों में विकसित किए गए हैं और ऐसे डेटासेट पर प्रशिक्षित किए गए हैं, जो देश की विविधता का पूर्णतः प्रतिनिधित्व नहीं करते हैं।
- इस कमी को दूर करने के लिए, सरकार अपनी डिजिटल अवसंरचना रणनीति के अंतर्गत स्थानीय AI विकास को प्राथमिकता दे रही है।
चुनौतियाँ
- उच्च कंप्यूटिंग और अवसंरचना संबंधी आवश्यकताएँ: आधारभूत मॉडल के प्रशिक्षण के लिए अत्यधिक कंप्यूटिंग शक्ति, उन्नत जीपीयू/टीपीयू और बड़े डेटा केंद्रों की आवश्यकता होती है, जिससे विकास महँगा और संसाधन-गहन हो जाता है।
- उदाहरण के लिए: ओपनAI और गूगल जैसी कंपनियाँ GPT-4 जैसे बड़े मॉडल को प्रशिक्षित करने के लिए कंप्यूटिंग अवसंरचना में अरबों डॉलर का निवेश करती हैं।
- डेटा उपलब्धता और गुणवत्ता संबंधी समस्याएँ: आधारभूत मॉडल के लिए बड़े, विविध और उच्च-गुणवत्ता वाले डेटासेट की आवश्यकता होती है। भारत सहित कई देशों में, क्षेत्रीय भाषाओं और विशिष्ट क्षेत्रों में संरचित डेटासेट सीमित हैं, जो मॉडल की सटीकता और समावेशिता को प्रभावित कर सकते हैं।
- उदाहरण के लिए: कई भारतीय भाषाओं में अंग्रेजी की तुलना में डिजिटल सामग्री बहुत कम है, जिससे बहुभाषी आबादी की सेवा करने वाले AI सिस्टम के लिए चुनौतियाँ उत्पन्न होती हैं।
- पूर्वाग्रह और नैतिक चिंताएँ: AI मॉडल प्रशिक्षण डेटासेट में मौजूद पूर्वाग्रहों को ग्रहण कर सकते हैं, जिससे भेदभावपूर्ण या अनुचित परिणाम हो सकते हैं। यह भर्ती, क्रेडिट स्कोरिंग या स्वास्थ्य सेवा जैसे संवेदनशील क्षेत्रों में निर्णय लेने को प्रभावित कर सकता है।
- उदाहरण के लिए: ऐतिहासिक रूप से अस्पष्ट रोजगार डेटा पर प्रशिक्षित किए जाने पर AI-आधारित भर्ती उपकरणों ने पहले पूर्वाग्रह का प्रदर्शन किया है।
- डेटा गोपनीयता और सुरक्षा जोखिम: बड़े मॉडल को प्रशिक्षित करने में भारी मात्रा में व्यक्तिगत और सार्वजनिक डेटा का प्रसंस्करण शामिल होता है, जिससे डेटा गोपनीयता, दुरुपयोग और निगरानी के बारे में चिंताएँ उत्पन्न होती हैं। उपयोगकर्ता डेटा की सुरक्षा के लिए मजबूत नियामक सुरक्षा उपायों की आवश्यकता है।
- उदाहरण के लिए: डेटा सुरक्षा संबंधी चिंताओं को डिजिटल व्यक्तिगत डेटा संरक्षण अधिनियम, 2023 जैसे ढाँचों में संबोधित किया गया है।
आगे की राह
- बहुभाषी और विशिष्ट क्षेत्र से संबंधित डेटासेट विकसित करना: क्षेत्रीय भाषाओं, शासन संबंधी डेटा, स्वास्थ्य सेवा, कृषि और जलवायु के लिए डेटासेट विकसित करने से AI की समावेशिता में सुधार होगा।
- छोटे और कुशल AI मॉडल को बढ़ावा देना: छोटे भाषा मॉडल (SLM) और ऊर्जा-कुशल आर्किटेक्चर को प्रोत्साहित करने से लागत और पर्यावरणीय प्रभाव को कम किया जा सकता है।
- नैतिक और नियामक ढाँचे को मजबूत करना: सरकारों को पूर्वाग्रह, जवाबदेही और AI के उत्तरदायित्वपूर्ण उपयोग को संबोधित करने वाले पारदर्शी AI शासन ढाँचे को अपनाना चाहिए।