التعرف على الكلام المتقدم مع Conformer-2
كونفورمر-2 هو نموذج متقدم للتعرف التلقائي على الكلام مصمم لتعزيز دقة وكفاءة فك تشفير الكلام. بناءً على سلفه، كونفورمر-1، يظهر تحسينات كبيرة في التعامل مع الأسماء الصحيحة والبيانات الأبجدية الرقمية، خاصة في البيئات المزعجة. مع التدريب على 1.1 مليون ساعة من بيانات الصوت باللغة الإنجليزية، يحافظ على معدل خطأ الكلمات التنافسي بينما يقدم مقاييس أداء سهلة الاستخدام.
تشمل تقدمات النموذج خط أنابيب استدلال محسّن يقلل من زمن الانتظار، مما يعزز الاستجابة العامة. تستخدم تقنيته التدريبية المبتكرة عدة "معلمين" لتوليد التسميات، مما يقلل من تأثير فشل النماذج الفردية ويعزز المتانة. بالإضافة إلى ذلك، يقوم كونفورمر-2 بتوسيع معلمات النموذج وحجم بيانات التدريب بشكل فعال، مما يؤدي إلى أوقات استجابة أسرع دون التضحية بالأداء، مما يجعله خيارًا رائدًا في فئة توليد الصوت بالذكاء الاصطناعي.