مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.
نموذج الكلام من Mistral — لا يعمل إطلاقاً مع العربية.
جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
لم يُنتج أي نسخ نصي للصوت العربي. تم الاختبار بوجود معامل اللغة وبدونه.
| الميزة | Google Cloud STT — Chirp 3 | Mistral Voxtral Mini |
|---|---|---|
| نسخ فوري بالبث المباشر | ✓ | ✗ |
| دعم أكثر من 120 لغة | ✓ | ✗ |
| علامات ترقيم تلقائية | ✓ | ✗ |
| طوابع زمنية على مستوى الكلمة | ✓ | ✗ |
| تمييز المتحدثين | ✓ | ✗ |
| مفردات مخصصة | ✓ | ✗ |
| نماذج طبية وهاتفية | ✓ | ✗ |
| التعرف على الكلام متعدد اللغات (مُعلن) | ✗ | ✓ |
| فهم الصوت | ✗ | ✓ |
| القدرة | Google Cloud STT — Chirp 3 | Mistral Voxtral Mini |
|---|---|---|
| دعم البث المباشر | ✓ | ✗ |
| إضافة LiveKit | ✓ | ✗ |
| استضافة ذاتية | ✗ | ✗ |
| نمط الواجهة | gRPC streaming + REST | REST |
| حزم التطوير | Python, Node.js, Go, Java, C#, Ruby, PHP | Python, Node.js |
جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.
لا يعمل مع العربية على الإطلاق. لم يُنتج أي نسخ نصي في الاختبارات رغم ادعاء دعم متعدد اللغات.
Google Cloud STT — Chirp 3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
كلا المزودين خياران قابلان للاستخدام. Google Cloud STT — Chirp 3: جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً. Mistral Voxtral Mini: لا يعمل مع العربية على الإطلاق. لم يُنتج أي نسخ نصي في الاختبارات رغم ادعاء دعم متعدد اللغات.
Google Cloud STT — Chirp 3 يبدأ من $0.016 لكل 15 ثانية (نموذج Chirp 3). Mistral Voxtral Mini يبدأ من حسب الاستخدام لكل طلب (تسعير Mistral API).