مساعد الصوتي سيقدم صوت طبيعي أكثر بنظام WaveNet

التقنية بلا حدود 0 تعليق 2 ارسل لصديق نسخة للطباعة تبليغ

مساعد الصوتي سيبدو طبيعي أكثر بفضل نظام لتحويل النص إلى كلام مسموع يُدعى WaveNet، والذي أنشأه فرع DeepMind في .

ويختلف نظام WaveNet عن تقنية Concatenative TTS التقليدية، والتي تستخدم قاعدة كبيرة من العبارات المُسجلة مُسبقًا بصوت واحد، وتقنية Parametric TTS التي تستخدم صوت يُنتجه الحاسب لخلق موجات فردية باستخدام 16000 عينة في الثانية.

أما نظام WaveNet فيستخدم مجموعة كبيرة من عينات الكلام، وتم تدريبه لأكثر من 12 شهرا للتعرف على النغمات التي تتبع بعضها البعض وما هي أشكال موجات التحدث الواقعية.

هناك الكثير من التفاصيل الفنية في هذا النظام، والذي سيتم استخدامه في الوقت الحالي مع اللغة الإنجليزية الأمريكية واللغة اليابانية؛ لكن في الأغلب فأن ستقوم بجعل اللغات الأخرى طبيعية أكثر مع الوقت.

وقد استغرق فريق DeepMind مدة 12 شهر لصنع نظام WaveNet، وتخصيصه ليعمل بسرعة كافية على نطاق واسع.

المصدر

أخبار ذات صلة

0 تعليق