वाशिंगटन: माइक्रोसॉफ्ट ने एक आर्टिफिशियल इंटेलिजेंस-आधारित एआई सॉफ्टवेयर बनाया है जो किसी की भी आवाज को सिर्फ तीन सेकंड के लिए सुनकर उसकी नकल कर सकता है। सॉफ्टवेयर वॉयस पिच, इमोशनल टोन और उतार-चढ़ाव का भी अनुकरण करता है।
इंसानों की आवाज चुराने वाले इस सॉफ्टवेयर का नाम Wale, AI है। इससे पहले माइक्रोसॉफ्ट ने मशहूर कलाकार डेल ई की पेंटिंग्स की नकल करने के लिए एक और प्रोग्राम बनाया है। अब यह मॉडल टेक्स्ट-टू-स्पीच है यानी यह लिखित शब्दों को आवाज में बदल देता है। यह दुनिया में किसी की भी आवाज की नकल कर सकता है, इसके लिए केवल तीन सेकंड की ऑडियो फाइल की जरूरत होती है। हालाँकि, आगे के सुधारों के लिए थोड़ी लंबी ऑडियो फ़ाइल की आवश्यकता हो सकती है। सॉफ्टवेयर इस हद तक प्रभावी है कि यह मुखर कंपन और आवाज के भावनात्मक उतार-चढ़ाव का अनुकरण भी कर सकता है।
स्वतंत्र विश्लेषकों ने कहा है कि, माइक्रोसॉफ्ट के दावों के विपरीत, सॉफ़्टवेयर ने बहुत ही आशाजनक क्षमताएँ दिखाईं।
इस तरह आप वॉल-ई से ऐसा कोई भी किरदार निभा सकते हैं, जिसके बारे में उन्होंने कभी नहीं कहा। इससे नकली ऑडियो और नकली रिकॉर्डिंग की बाढ़ भी आ सकती है और विभिन्न समस्याएं पैदा हो सकती हैं। माइक्रोसॉफ्ट के मुताबिक, इसके आर्टिफिशियल इंटेलिजेंस-आधारित एल्गोरिद्म को 60,000 घंटों के अंग्रेजी भाषा के ऑडियो पर प्रशिक्षित किया गया है। इनमें कहानीकारों और पुस्तक पाठकों की आवाजें शामिल हैं।
हालाँकि, रिकॉर्ड किए गए वॉयस सैंपल या व्हाट्सएप संदेशों की गुणवत्ता कुछ हद तक गिर सकती है, लेकिन अगर कोई अच्छे माइक के साथ सीधे वॉल-ई पर आवाज रिकॉर्ड करता है, तो सॉफ्टवेयर के परिणाम वास्तविकता के करीब हैं। हालाँकि, स्वतंत्र विश्लेषकों ने कहा है कि, Microsoft के दावों के विपरीत, सॉफ़्टवेयर ने बहुत ही आशाजनक क्षमताएँ दिखाईं।
इस सम्बन्ध में माइक्रोसॉफ्ट ने कहा है कि इसके कुछ लाभ हो सकते हैं। यदि कोई कलाकार किसी फिल्म की डबिंग बीच में छोड़कर कहीं और व्यस्त हो जाता है तो सॉफ्टवेयर से डबिंग की जा सकती है। इस तरह के मामूली मामलों को ईएआई द्वारा अच्छी तरह से संभाला जा सकता है।