مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.
أفضل تحويل صوت إلى نص للعربية مع زمن استجابة فائق السرعة. الخيار الأول المُختبر في الإنتاج.
جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
يلتقط العبارات الخليجية بدقة عالية. لم يحتج المستخدمون لتكرار كلامهم في المكالمات الإنتاجية.
| الميزة | Google Cloud STT — Chirp 3 | Deepgram Nova-3 |
|---|---|---|
| نسخ فوري بالبث المباشر | ✓ | ✓ |
| دعم أكثر من 120 لغة | ✓ | ✗ |
| علامات ترقيم تلقائية | ✓ | ✗ |
| طوابع زمنية على مستوى الكلمة | ✓ | ✓ |
| تمييز المتحدثين | ✓ | ✗ |
| مفردات مخصصة | ✓ | ✓ |
| نماذج طبية وهاتفية | ✓ | ✗ |
| كشف تلقائي للغة | ✗ | ✓ |
| اكتشاف نهاية النطق | ✗ | ✓ |
| علامات الترقيم والتنسيق | ✗ | ✓ |
| دعم القنوات المتعددة | ✗ | ✓ |
| القدرة | Google Cloud STT — Chirp 3 | Deepgram Nova-3 |
|---|---|---|
| دعم البث المباشر | ✓ | ✓ |
| إضافة LiveKit | ✓ | ✓ |
| استضافة ذاتية | ✗ | ✗ |
| نمط الواجهة | gRPC streaming + REST | WebSocket streaming + REST |
| حزم التطوير | Python, Node.js, Go, Java, C#, Ruby, PHP | Python, Node.js, Go, .NET, Rust |
جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.
الفائز الواضح في تحويل الصوت إلى نص للعربية. يقدم Deepgram Nova-3 جودة ممتازة بمتوسط تأخير 424 مللي ثانية — سريع بما يكفي لوكلاء الصوت الفوريين.
Deepgram Nova-3 أسرع بمتوسط تأخير نهاية النطق 424ms، وهو أسرع بـ 1952 مللي ثانية من Google Cloud STT — Chirp 3.
Google Cloud STT — Chirp 3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
Deepgram Nova-3 موصى به للاستخدام الإنتاجي. الفائز الواضح في تحويل الصوت إلى نص للعربية. يقدم Deepgram Nova-3 جودة ممتازة بمتوسط تأخير 424 مللي ثانية — سريع بما يكفي لوكلاء الصوت الفوريين.
Google Cloud STT — Chirp 3 يبدأ من $0.016 لكل 15 ثانية (نموذج Chirp 3). Deepgram Nova-3 يبدأ من $0.0043 لكل دقيقة (بث Nova-3).