كشفت مايكروسوفت عن نظام ذكاء اصطناعي جديد قادر على محاكاة أي صوت بشكل مثالي مع عينة صوتية مدتها 3 ثوانٍ فقط.
تم إنشاء أحدث ابتكارات عملاق التكنولوجيا ، VALL-E ، مع القدرة على توليف صوت الشخص بمجرد معرفة صوته. بالإضافة إلى ذلك ، فهو قادر على توليد نغمات لإعطاء تأثير أكثر واقعية.يشير الفريق المسؤول عن إنشاء VALL-E إلى أنه يمكن استخدام هذا الذكاء الاصطناعي في المواقف التي تتطلب إنشاء صوت عالي الجودة من النص.
بالإضافة إلى ذلك ، فإن لديه أيضًا إمكانات بالاقتران مع ذكاء اصطناعي آخر ، مثل GPT3 لإنشاء محتوى صوتي جديد.
لتدريبه ، استخدمت مايكروسوفت مكتبة Meta الصوتية "LibriLight" ، والتي تحتوي على حوالي 60.000 ساعة من الكلام باللغة الإنجليزية من أكثر من 7000 شخص مختلف ، معظمهم من الكتب الصوتية ذات المجال العام LibriVox.
يخضع هذا النظام حاليًا لاختبارات مصنفة بشكل صارم ، نظرًا لوجود خطر من استخدامه لأغراض أخرى ، تمامًا كما حدث مع التكنولوجيا التي أفسحت المجال للتزييف العميق deepfake ، مما تسبب في عمليات احتيال وبعض المشكلات الأخرى.
ليست هناك تعليقات:
إرسال تعليق