مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.
استدلال Whisper سريع على عتاد Groq — جودة عربية ضعيفة مع تأخير غير مستقر.
جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
جودة نسخ سيئة جداً للعربية في الاختبارات الإنتاجية.
| الميزة | Google Cloud STT — Chirp 3 | Groq Whisper Large v3 Turbo |
|---|---|---|
| نسخ فوري بالبث المباشر | ✓ | ✗ |
| دعم أكثر من 120 لغة | ✓ | ✗ |
| علامات ترقيم تلقائية | ✓ | ✗ |
| طوابع زمنية على مستوى الكلمة | ✓ | ✗ |
| تمييز المتحدثين | ✓ | ✗ |
| مفردات مخصصة | ✓ | ✗ |
| نماذج طبية وهاتفية | ✓ | ✗ |
| استدلال مُسرّع بالعتاد | ✗ | ✓ |
| توافق مع نموذج Whisper | ✗ | ✓ |
| وضع دفعي وفوري | ✗ | ✓ |
| القدرة | Google Cloud STT — Chirp 3 | Groq Whisper Large v3 Turbo |
|---|---|---|
| دعم البث المباشر | ✓ | ✗ |
| إضافة LiveKit | ✓ | ✗ |
| استضافة ذاتية | ✗ | ✗ |
| نمط الواجهة | gRPC streaming + REST | REST (OpenAI-compatible) |
| حزم التطوير | Python, Node.js, Go, Java, C#, Ruby, PHP | Python, Node.js |
جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.
عتاد Groq السريع لا يعوّض ضعف معالجة Whisper للعربية. الجودة غير مقبولة والتأخير غير مستقر لوكلاء الصوت.
Groq Whisper Large v3 Turbo أسرع بمتوسط تأخير نهاية النطق 284ms–3388ms، وهو أسرع بـ 2092 مللي ثانية من Google Cloud STT — Chirp 3.
Google Cloud STT — Chirp 3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
كلا المزودين خياران قابلان للاستخدام. Google Cloud STT — Chirp 3: جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً. Groq Whisper Large v3 Turbo: عتاد Groq السريع لا يعوّض ضعف معالجة Whisper للعربية. الجودة غير مقبولة والتأخير غير مستقر لوكلاء الصوت.
Google Cloud STT — Chirp 3 يبدأ من $0.016 لكل 15 ثانية (نموذج Chirp 3). Groq Whisper Large v3 Turbo يبدأ من $0 لكل دقيقة (طبقة مجانية محدودة الاستخدام).