نبذة عن مُنصِت

نموذج تحويل الكلام إلى نص عربي الأكثر دقة في العالم

تم تدريب منصت-1 على 15,000 ساعة من الكلام العربي المتنوع باستخدام أحدث تقنيات الإشراف الضعيف، ويتفوق على النماذج العالمية من OpenAI وMeta وMicrosoft في جميع معايير اللغة العربية الرئيسية.

انقر على الميكروفون وابدأ التحدث لتجربة مُنصِت.

Start speaking now to try it
توقف & تحميل

Transcript:

المعيار المرجعي

الرائد في أداء التعرف التلقائي على الصوت باللغة العربيّة

يقدم مُنصِت-1 نتائج متطورة على مستوى جميع معايير التعرّف على الكلام باللغة العربية الرئيسية - متفوقًا باستمرار على النماذج من الدرجة الأولى مثل Whisper (OpenAI) وSeamlessM4T (Meta) وNvidia Conformer.

عرض قائمة المتصدرين لـ Hugging Face

Munsit

V1

:

المعيار المرجعي لنماذج التعرّف التلقائي على الكلام باللغة العربيّة

مقارنة بين نماذج التعرف التلقائي على الكلمات العربية ومتوسط ​​معدل خطأ الكلمات (WER) عبر ست مجموعات بيانات قياسيّة في هذا المجال

تم اختباره عبر ستة معايير رئيسية للتعرف على الكلام العربي -  SADA, Common Voice, MASC (clean) , MASC (noisy) , Casablanca، وMGB-2 - وضع مُنصِت-1 معيارًا جديدًا للتعرف على الكلام العربي مع أقل متوسط لمعدل الخطأ في الكلمات (​​WER) بنسبة 26.68%.

Model
WER
CNTXT AI Munsit-1
26.68 %
NVIDIA Conformer-CTC Large V3
34.74 %
OpenAl Whisper
36.86 %
META SeamlessM4T V2 Large
38.16 %
ElevenLabs Scribe-V1
40.05 %
OpenAl GPT-4 Transcribe
44.94 %
Microsoft Azure STT
45.72 %
لماذا مُنصِت؟

#1 للكلام العربي:
لماذا مُنصِت هو الرائد؟

معظم نماذج ASR تعاني من مشكلة اللغة العربية. صُمم مُنصِت خصيصًا لذلك.

اختبر Munsit

15,000 ساعة

معظم نماذج ASR تعاني من مشكلة اللغة العربية. صُمم مُنصِت خصيصًا لذلك.

دقة واقعيّة تم التحقق منها

تم تقييمه بـ 6 مجموعات بيانات معيارية.

قوي ومتناسق عبر أكثر من 25 لهجة

من جميع أنحاء العالم العربي.

معالجة خالية من الانحياز للهجات

يتكيّف بسلاسة مع الاختلافات الإقليمية.

بنية Conformer

مصمم خصيصًا لمعالجة الكلام العربي.

أداء متميز في البيئات النقيّة والمليئة بالضجيج

مع دقّة ثابتة عبر مختلف الأجهزة وظروف التسجيل.