प्रोजेक्ट वाणी क्या है?
प्रोजेक्ट वाणी के तहत, 3 वर्षों में 773 जिलों के लगभग 1 मिलियन लोगों के भाषण सेट एकत्र करके पूरे भारत में उपयोग की जाने वाली विविध भाषाओं का मानचित्रण किया जाएगा।
इस परियोजना की अनुमानित लागत लगभग 30 से 40 मिलियन अमरीकी डालर है।
यह बेंगलुरु स्थित IISc और आर्टपार्क की भाशा एआई परियोजना का हिस्सा है जिसमें RESPIN (Recognizing Speech in Indian languages) और SYSPIN (Synthesizing Speech in Indian languages) शामिल है।
इस परियोजना में IISc और गूगल लगभग 1.5 लाख घंटे के भाषण की रिकॉर्डिंग करेंगे, जिसका एक हिस्सा स्थानीय लिपियों में लिप्यंतरित किया जाएगा।
यह परियोजना एक जिला-स्थिर दृष्टिकोण का उपयोग करती है, जिसमें प्रत्येक जिले से 1,000 से अधिक लोगों को बेतरतीब ढंग से चुनकर स्थानीय भाषणों को रिकॉर्ड करना शामिल है।
इस पहल के उद्देश्य क्या हैं?
इस परियोजना के मुख्य उद्देश्यों में से एक स्वचालित भाषण पहचान, भाषण से भाषण अनुवाद और प्राकृतिक भाषा समझ जैसी तकनीकों का विकास है।
इसका अंतिम लक्ष्य एक तकनीकी समाधान प्रदान करना है जो वर्तमान में प्रौद्योगिकी में मौजूद भाषाई बाधाओं को समाप्त कर सकता है और व्यापक श्रेणी के लोगों के लिए प्रौद्योगिकी की पहुंच में वृद्धि कर सकता है।
एक बार जब यह परियोजना पूरी तरह से पूरी हो जाएगी, तो एक कृत्रिम बुद्धि-आधारित भाषा मॉडल बनाने का प्रयास किया जाएगा जो भारत में उपयोग की जाने वाली विविध भाषाओं और बोलियों को समझ सके।
परियोजना की वर्तमान स्थिति क्या है?
पिछले कुछ महीनों में, पूरे भारत से लगभग 69 जिलों का भाषाई डेटा एकत्र किया गया है।
अब तक, लिंग और आयु-संतुलित तरीके से 841 विभिन्न पिन कोड से 30 से अधिक भाषाओं को कवर करते हुए, 150 घंटे से अधिक डेटा एकत्र किया गया है।
0 comments:
Post a Comment