गा सकता, फुसफुसा सकता; IIT छात्र ने दुनिया का पहला 'स्पीच-टू-स्पीच' AI मॉडल बनाया
यह मॉडल गा सकता है, फुसफुसा सकता है और इमोशनल इंटेलिजेंस के साथ रिएक्ट भी कर सकता है। इस एआई का नाम है 'लूना एआई' मॉडल, जिसे 25 साल के स्पर्श अग्रवाल ने बनाया है।

तकनीकी दुनिया तेजी से बदल रही है। भारत के युवा भी इसके बदलाव का हिस्सा बन रहे हैं। इसी कड़ी में जयपुर में आईआईटी के छात्र ने कमाल का एआई मॉडल बनाया है। यह मॉडल गा सकता है, फुसफुसा सकता है और इमोशनल इंटेलिजेंस के साथ रिएक्ट भी कर सकता है। इस एआई का नाम है 'लूना एआई' मॉडल, जिसे 25 साल के स्पर्श अग्रवाल ने बनाया है।
अग्रवाल ने इसे अपने स्टार्टअप 'पिक्सा एआई' के तहत पेश किया है। उन्होंने कहा कि लूना एआई आवाज (ऑडियो) को पाठ (टेक्स्ट) में बदलने के बजाय सीधे उसे मानव जैसी आवाज में बदलने के लिए प्रोसेस करता है। उन्होंने बताया कि इस मॉडल की प्रणाली उसे फुसफुसाने, स्वर को नियंत्रित करने और यहां तक कि गाने की भी अनुमति देती है। इसको सुनने में मशीन के बजाय काफी हद तक इंसानों जैसी फीलिंग आती है।
अग्रवाल ने कहा, "मैंने लूना को बनाने के लिए कई जगह से रिसोर्स जुटाए हैं। यहां तक कि क्रेडिट कार्ड से कर्ज भी लिया है। यह इस बात का प्रमाण है कि केवल संसाधनों से नहीं, बल्कि कुशलता से भारत में विश्व स्तरीय तकनीक विकसित हो सकती है।"
अग्रवाल भारतीय प्रौद्योगिकी संस्थान (IIT-BHU) से ग्रेजुएट हैं। उनके अन्य साथी नितीश कार्तिक, अपूर्व सिंह और प्रत्यूष कुमार हैं। कुणाल शाह, कुणाल कपूर और निखिल कामथ जैसे इन्वेस्टर द्वारा चलाए जा रहे ‘पिक्सा एआई’ का लक्ष्य लूना को विश्व स्तर पर मनोरंजन, स्वास्थ्य और ऑटोमोटिव ईकोसिस्टम के लिए "वॉयस लेयर" बनाना है।
अग्रवाल के मुताबिक इसे लेकर वाहन निर्माताओं, गेमिंग प्लेटफ़ॉर्म और उपभोक्ता एआई कंपनियों की ओर से शुरुआती मांग सामने आई है।




