परिचय व उद्देश : OpenAI Initiative on Indian Languages
-
IndQA हा OpenAI ने सादर केलेला भारतीय भाषा व संस्कृतीवर आधारित AI बेंचमार्क आहे.
-
उद्देश: AI प्रणाली भारतीय भाषा, सांस्कृतिक संदर्भ व बारकावे समजून घेण्यात किती प्रभावी आहेत हे तपासणे.
-
हा उपक्रम AI च्या बहुभाषिक व बहुसांस्कृतिक क्षमतेत वाढ करण्याचे पाऊल आहे.
विकास व संरचना
-
विकसित केलेले: भारतातील २६१ डोमेन तज्ञांच्या सहकार्याने.
-
डेटासेट:
-
१२ भारतीय भाषा
-
१० सांस्कृतिक क्षेत्रे
-
२,२७८ प्रश्न
-
-
प्रश्न “मूळपणे लिहिलेले” (originally authored) आहेत — भाषांतरित नाहीत, जेणेकरून सांस्कृतिक प्रामाणिकता टिकून राहील.
-
OpenAI च्या ध्येयाशी सुसंगत — AI मानवांच्या नैसर्गिक विचार व बोलण्याची पद्धत समजून घेईल.
मूल्यांकन पद्धत
-
“रुब्रिक-आधारित मूल्यांकन प्रणाली” (Rubric-based Evaluation System) वापरली जाते.
-
प्रत्येक प्रश्नामध्ये:
-
भारतीय भाषेतील संदर्भात्मक सूचना
-
इंग्रजी भाषांतर
-
ग्रेडिंग रूब्रिक
-
आदर्श तज्ञ-स्तरीय उत्तर
-
-
मूल्यांकन डोमेन तज्ञांनी ठरवलेल्या निकषांनुसार केले जाते.
-
अंतिम श्रेणी दाखवते की मॉडेल तर्क, सूक्ष्मता आणि सांस्कृतिक शुद्धता किती प्रमाणात साध्य करते.
भाषा व सांस्कृतिक व्याप्ती
-
समाविष्ट भाषा (१२):
बंगाली, इंग्रजी, हिंदी, हिंग्लिश, कन्नड, मराठी, ओडिया, तेलुगू, गुजराती, मल्याळम, पंजाबी, तमिळ -
समाविष्ट सांस्कृतिक क्षेत्रे:
वास्तुकला व डिझाइन, कला व संस्कृती, दैनंदिन जीवन, कायदा व नीतिमत्ता, माध्यम व मनोरंजन, धर्म व अध्यात्म, क्रीडा व मनोरंजन इ. -
भारताची निवड कारण:
-
जगातील सर्वाधिक भाषिक विविधता असलेला देश
-
जवळजवळ १ अब्ज लोक इंग्रजी प्राथमिक भाषा म्हणून वापरत नाहीत
-
परीक्षाभिमुख तथ्ये (UPSC-Focused Facts)
-
IndQA प्रश्नसंख्या: २,२७८
-
भाषा: १२ भारतीय भाषा
-
सांस्कृतिक क्षेत्रे: १०
-
विकसित करणारे: २६१ भारतीय डोमेन तज्ञ
-
मूल्यांकन पद्धत: रुब्रिक-आधारित, बहु-निवड प्रश्न नाहीत
-
बेंचमार्क केलेले मॉडेल्स: GPT-4o, OpenAI o3, GPT-4.5, GPT-5
महत्त्व आणि भविष्यातील योजना
-
उद्देश: AI ला प्रत्येक संस्कृतीतील सूक्ष्मता समजावून देणे – (CTO श्रीनिवास नारायणन).
-
OpenAI इतर प्रदेशांतही IndQA फ्रेमवर्कची प्रतिकृती तयार करणार आहे.
-
भारत हा ChatGPT चा दुसऱ्या क्रमांकाचा मोठा बाजार, त्यामुळे हा उपक्रम:
-
इंग्रजी नसलेल्या वापरकर्त्यांसाठी AI अधिक सुलभ व विश्वासार्ह करतो.
-
सांस्कृतिक अनुकूलता व समावेशकता वाढवतो.
-
UPSC संभाव्य प्रश्न उदाहरणे: OpenAI Initiative on Indian Languages
-
‘IndQA’ बेंचमार्क कोणत्या कंपनीने विकसित केला? – OpenAI
-
IndQA मध्ये किती भारतीय भाषा समाविष्ट आहेत? – १२
-
IndQA चे प्रश्न “भाषांतरित” आहेत का “मूळपणे लिहिलेले”? – मूळपणे लिहिलेले
-
IndQA मध्ये कोणती मूल्यांकन पद्धत वापरली जाते? – रुब्रिक-आधारित ग्रेडिंग
-
IndQA प्रकल्पात किती डोमेन तज्ञ सहभागी होते? – २६१




















