مُختبر في الإنتاجتحويل الصوت إلى نص

Google Cloud STT — Chirp 3

تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.

مقبول

جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.

يوفر نموذج Chirp 3 من Google Cloud جودة نسخ عربية ممتازة، وكان المعيار المرجعي في اختباراتنا الإنتاجية. لكن متوسط تأخير نهاية النطق البالغ 2.4 ثانية يجعله بطيئاً جداً لتطبيقات وكلاء الصوت الفورية.

الاختبارات

التأخير

متوسط تأخير EOU2376ms
أفضل حالة2000ms
أسوأ حالة3000ms
وقت الدورة الكاملة9000ms–10000ms

الجودة

التقييمممتاز
معدل خطأ الكلمات28.8%
دعم اللهجات العربية
العربية الخليجيةالفصحىالمصريةالشامية

جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.

المميزات

نسخ فوري بالبث المباشر
دعم أكثر من 120 لغة
علامات ترقيم تلقائية
طوابع زمنية على مستوى الكلمة
تمييز المتحدثين
مفردات مخصصة
نماذج طبية وهاتفية
البث المباشرإضافة LiveKit

الأسعارطبقة مجانية متاحة

الخطةالسعرالوحدة
القياسي$0.016لكل 15 ثانية

التكامل

حزم التطوير
PythonNode.jsGoJavaC#RubyPHP
نمط الواجهة

gRPC streaming + REST

التوثيق

الحكم

جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.

الأفضل لـ
النسخ الدفعيدعم اللهجات العربية المتعددةمتطلبات المؤسسات

المميزات

  • جودة نسخ ممتازة
  • أوسع دعم للهجات العربية
  • موثوقية على مستوى المؤسسات
  • منظومة SDK واسعة

العيوب

  • تأخير نهاية النطق 2.4 ثانية — بطيء جداً لوكلاء الصوت
  • تسعير أعلى من المنافسين
  • إعداد GCP معقد
زيارة Google Cloud STT — Chirp 3

الذهاب إلى https://cloud.google.com/speech-to-text

قارن مع مزودي تحويل الصوت إلى نص الآخرين