गुरुग्राम के स्‍टूडेंट ने बोलने-सुनने में परेशानी झेल रहे लोगों के लिए एआई-पावर्ड स्‍पीच डिवाइस बनाई

हमारे देश में रैंक, कटऑफ और एंट्रेंस एग्जाम का ऐसा क्रेज है कि किशोरावस्था आईआईटी में दाखिले की दौड़ जैसी लगती है। लेकिन कभी-कभी कोई ऐसा स्‍टूडेंट सामने आता है जो इस आम सोच से हटकर कुछ अलग करने की हिम्मत दिखाता है।

गुरुग्राम के शिव नादर स्कूल में 11वीं कक्षा में पढ़ने वाले 16 वर्षीय प्रणेत खेतान ने इसका एक बेहतरीन उदाहरण पेश किया है। नंबरों की दौड़ में पड़ने के बजाय उन्होंने इंसानियत के लिए बातचीत का रास्ता चुना।

प्रणेत सैमसंग सॉल्व फॉर टुमॉरो 2025 की चार विजेता टीमों में से एक थे। उन्‍होंने ‘पैरास्पीक’ नाम का आसान डिवाइस बनाया। ये डिवाइस यूजर की आवाज रिकॉर्ड करता है, उसे क्लाउड पर एआई को भेजता है, और फिर हिंदी में साफ-सुथरी, अच्छी भाषा में अनुवाद करके प्‍ले करता है।

सैमसंग ‘सॉल्व फॉर टुमॉरो’ कंपनी का एक प्रमुख शिक्षा कार्यक्रम है, जो युवाओं को असली जीवन की समस्याओं को पहचानकर टेक्नोलॉजी से उसका हल खोजने के लिए प्रेरित करता है। इस साल पूरे देश में आयोजित इस प्रतियोगिता में चार थीम रखी गई थीं—एआई के ज़रिये एक सुरक्षित, स्मार्ट और समावेशी भारत; स्वास्थ्य, स्वच्छता और वेलनेस का भविष्य; तकनीक के माध्यम से पर्यावरणीय स्थिरता; और खेल व तकनीक के ज़रिये सामाजिक बदलाव। प्रतियोगिता की जीतने वाली चार टीमों को आईआईटी दिल्ली में 1 करोड़ रुपये की इंक्यूबेशन सहायता दी गई।

प्रणेत का अगला लक्ष्य पैरास्पीक को और बड़े पैमाने पर विकसित करना है—इसके नतीजों की सटीकता बढ़ाना, सहायक-तकनीकी कंपनियों के साथ मिलकर इसे देशभर के अस्पतालों और घरों तक पहुँचाना। वह इसकी भाषाई पहुँच भी बढ़ाना चाहते हैं। इसके लिए वे अन्य भारतीय भाषाओं के लिए ऐसे डेटाबेस तैयार करेंगे, जो आज भी ज्यादातर वैश्विक एआई सिस्टम में नज़रअंदाज़ किए जाते हैं।

प्रणेत बताते हैं, “यह आइडिया एक बहुत ही साधारण से सवाल से शुरू हुआ—जब कोई व्यक्ति बोलने में मुश्किल झेल रहा हो तो हिंदी भाषण को समझने वाला कोई उपकरण क्यों नहीं है?” स्कूल की आईटी लैब में उठाया गया यह मासूम-सा सवाल ही आगे चलकर उस नवाचार की नींव बना, जिसने उन्हें सैमसंग सॉल्व फॉर टुमॉरो 2025 के राष्ट्रीय विजेताओं में जगह दिलाई।

इसकी शुरुआत मई 2024 में हुई, जब प्रणेत ने नई दिल्ली के पास एक पैरालिसिस केयर सेंटर का दौरा किया। वहाँ उन्होंने ऐसे मरीज़ों से मुलाकात की, जो अपनी बात साफ़ तरीके से कह पाने के लिए रोज़ संघर्ष कर रहे थे — स्ट्रोक सर्वाइवर्स, सेरेब्रल पाल्सी से जूझ रहे लोग और पार्किंसन रोग से प्रभावित मरीज। अगले एक साल तक प्रणेत ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम की दुनिया में पूरी तरह डूब गए। जब उन्हें पता चला कि न्यूरोलॉजिकल समस्याओं के कारण बिगड़ चुकी हिंदी बोलचाल (डिसआर्थ्रिक स्पीच) का कोई बड़ा डेटाबेस मौजूद ही नहीं है, तो उन्होंने खुद ही ऐसा डेटाबेस तैयार करने की ठान ली।

उन्होंने बताया, “धीरे-धीरे यह मेरा खुद का तैयार किया हुआ डेटासेट बन गया। मैंने एआई मॉडल को इस तरह ट्रेन किया कि वह लड़खड़ाई हुई हिंदी बोलचाल को रीयल-टाइम में पहचान सके और उसे साफ़, समझ में आने वाले वाक्यों में दोबारा गढ़ सके। पहली बार जब मैंने इसे चलते हुए सुना, तो एहसास हुआ—यह तो जैसे किसी इंसान को उसकी खोई हुई आवाज़ वापस दिला रहा हो।”

ऐसी उम्र में जब उसके ज़्यादातर दोस्‍त कोचिंग की किताबों और एग्ज़ाम प्रेशर में उलझे रहते हैं, प्रणेत कुछ बिल्कुल अलग बना रहा है—वो पुल जो खामोश लोगों को फिर से दुनिया से जोड़ सके। उसका बनाया पैरास्पीक एक छोटी-सी, माचिस की डिब्बी जितनी आईओटी-इनेबल्‍ड डिवाइस है, लेकिन काम असाधारण करती है। आर्टिफिशियल इंटेलिजेंस (एआई) और मशीन लर्निंग (एमएल) से चलने वाली यह डिवाइस स्ट्रोक, लकवा, सेरेब्रल पाल्सी, पार्किंसन रोग, मस्तिष्क की चोट या उम्र से जुड़ी बदलाव जैसी स्थितियों से उत्पन्न होने वाली बोलने और आवाज की विकृतियों वाले मरीजों की मदद के लिए डिज़ाइन की गई है।

सिर्फ एक रिकॉर्डर लेकर प्रणेत अस्पतालों और पुनर्वास केंद्रों में गया, जहाँ उसने 28 मरीज़ों से बातचीत की और घंटों के वॉयस सैंपल जुटाए। उसके शब्दों में, हर रिकॉर्डिंग सिर्फ डेटा नहीं थी—वह गरिमा, धैर्य और इंसानी संघर्ष को समझने का एक सबक भी थी।

Leave a Comment

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

error: Content is protected !!