पालो अल्टो, कैलिफोर्निया: फेसबुक, इंस्टाग्राम और व्हाट्सएप की सरपरस्त कंपनी मेटा ने हाल ही में ‘वॉयसबॉक्स एआई’ नामक एक नया टूल पेश किया है। इसका काम ये है कि जब सामान्य उपयोगकर्ता अपनी भाषा में एक वाक्य दर्ज करते हैं, तो यह तुरंत इसका अनुवाद करता है और इसे टेक्स्ट में प्रदर्शित करता है।
वर्तमान में यह रिवर्स भी कर सकता है यानी एम्बेडेड टेक्स्ट को ऑडियो में ट्रांसलेट कर सकता है। हालाँकि इसे विभिन्न मोड और मूड आदि में सुना जा सकता है। कंपनी के मुताबिक यह टेक्स्ट-टू-ऑडियो ट्रांसलेशन बहुत अच्छे स्तर पर करता है।
हालाँकि अभी भी इसकी उपयोगिता का परीक्षण किया जा रहा है। VoiceBox कई अन्य काम कर सकता है। यह प्री-रिकॉर्डेड ऑडियो से हाई-क्वालिटी ऑडियो क्लिप बना सकता है। उदाहरण के लिए, यदि आपने किसी स्थान पर कुछ महत्वपूर्ण रिकॉर्ड किया है और पृष्ठभूमि में कार के हॉर्न और शोर हैं, तो वॉइसबॉक्स उन्हें हटा सकता है और सर्वश्रेष्ठ ऑडियो फ़ाइल प्रस्तुत कर सकता है।
Meta releases Voicebox, an innovative all-in-one generative speech model.
-6 languages
-Can perform tasks it wasn't trained on
-Noise removal, content editing, style conversion, and more
-Supports text-to-speech synthesis and cross-lingual style transfer pic.twitter.com/3J6oufY0Rt— The Rundown AI (@TheRundownAI) June 19, 2023
विश्लेषकों के अनुसार अगले चरण में वॉइसबॉक्स मानव आवाज के करीब हो जाएगा। इस तरह मशीन जनित आवाज थोड़ी ज्यादा यथार्थवादी और मानवीय रूप देने में सक्षम होगी। यह वर्तमान में छह भाषाओं तक सीमित है और भविष्य में इसका विस्तार किया जाएगा। यह अंततः मेटावर्स में आभासी वर्णों के लिए उपयोग किया जाएगा। शायद मेटा भी यही चाहती है।
दूसरी ओर दृष्टिबाधित लोग अपने दोस्तों द्वारा लिखे गए टेक्स्ट संदेशों को अपनी आवाज में सुन सकेंगे। इन सभी खूबियों की वजह से Voice Box का इस्तेमाल कई जरूरी कामों के लिए किया जा सकता है।
कुछ विशेषज्ञों ने चेतावनी दी है कि यह नकली वीडियो, आवाज और चरित्रों के लिए एक नया द्वार भी खोलेगा। हालांकि, इसकी उपयोगिता तो आने वाला वक्त ही बताएगा।