مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
نموذج الكلام من Mistral — لا يعمل إطلاقاً مع العربية.
تحويل صوت إلى نص عربي عالي الجودة بمعدل خطأ أقل بنسبة 44% من Google Chirp 3.
لم يُنتج أي نسخ نصي للصوت العربي. تم الاختبار بوجود معامل اللغة وبدونه.
جودة نسخ ممتازة أكدتها ملاحظات المستخدمين. لم يحتج أحد لتكرار كلامه. أدق بنسبة 44% من Google Chirp 3.
| الميزة | Mistral Voxtral Mini | Soniox STT RT v3 |
|---|---|---|
| التعرف على الكلام متعدد اللغات (مُعلن) | ✓ | ✗ |
| فهم الصوت | ✓ | ✗ |
| نسخ فوري بالبث المباشر | ✗ | ✓ |
| تلميحات اللغة | ✗ | ✓ |
| معدل خطأ كلمات منخفض | ✗ | ✓ |
| اكتشاف نهاية النطق | ✗ | ✓ |
| القدرة | Mistral Voxtral Mini | Soniox STT RT v3 |
|---|---|---|
| دعم البث المباشر | ✗ | ✓ |
| إضافة LiveKit | ✗ | ✗ |
| استضافة ذاتية | ✗ | ✗ |
| نمط الواجهة | REST | WebSocket streaming |
| حزم التطوير | Python, Node.js | Python, Node.js |
لا يعمل مع العربية على الإطلاق. لم يُنتج أي نسخ نصي في الاختبارات رغم ادعاء دعم متعدد اللغات.
كان سابقاً الخيار الأفضل لتحويل الصوت إلى نص بالعربية. جودة ممتازة بمعدل خطأ 16.2%، لكن Deepgram Nova-3 تجاوزه بسرعة أعلى بنسبة 75% مع جودة مماثلة.
Soniox STT RT v3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ ممتازة أكدتها ملاحظات المستخدمين. لم يحتج أحد لتكرار كلامه. أدق بنسبة 44% من Google Chirp 3.
كلا المزودين خياران قابلان للاستخدام. Mistral Voxtral Mini: لا يعمل مع العربية على الإطلاق. لم يُنتج أي نسخ نصي في الاختبارات رغم ادعاء دعم متعدد اللغات. Soniox STT RT v3: كان سابقاً الخيار الأفضل لتحويل الصوت إلى نص بالعربية. جودة ممتازة بمعدل خطأ 16.2%، لكن Deepgram Nova-3 تجاوزه بسرعة أعلى بنسبة 75% مع جودة مماثلة.
Mistral Voxtral Mini يبدأ من حسب الاستخدام لكل طلب (تسعير Mistral API). Soniox STT RT v3 يبدأ من $0.005 لكل دقيقة (بث مباشر).