مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.
تحويل صوت إلى نص عربي فائق السرعة مع جودة نسخ ضعيفة.
جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
اضطر المستخدمون لتكرار كلامهم بشكل متكرر. الجودة غير مقبولة للاستخدام الإنتاجي.
| الميزة | Google Cloud STT — Chirp 3 | Speechmatics |
|---|---|---|
| نسخ فوري بالبث المباشر | ✓ | ✓ |
| دعم أكثر من 120 لغة | ✓ | ✗ |
| علامات ترقيم تلقائية | ✓ | ✗ |
| طوابع زمنية على مستوى الكلمة | ✓ | ✗ |
| تمييز المتحدثين | ✓ | ✗ |
| مفردات مخصصة | ✓ | ✗ |
| نماذج طبية وهاتفية | ✓ | ✗ |
| اكتشاف نهاية نطق قابل للتخصيص | ✗ | ✓ |
| مستويات تشغيل قياسية ومحسّنة | ✗ | ✓ |
| قاموس مخصص | ✗ | ✓ |
| القدرة | Google Cloud STT — Chirp 3 | Speechmatics |
|---|---|---|
| دعم البث المباشر | ✓ | ✓ |
| إضافة LiveKit | ✓ | ✗ |
| استضافة ذاتية | ✗ | ✓ |
| نمط الواجهة | gRPC streaming + REST | WebSocket streaming + REST |
| حزم التطوير | Python, Node.js, Go, Java, C#, Ruby, PHP | Python, Node.js |
جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.
سريع بشكل مذهل لكن جودة العربية ضعيفة جداً للاستخدام الإنتاجي. ميزة السرعة لا معنى لها عندما يضطر المستخدمون لتكرار كلامهم.
Speechmatics أسرع بمتوسط تأخير نهاية النطق 460ms، وهو أسرع بـ 1916 مللي ثانية من Google Cloud STT — Chirp 3.
Google Cloud STT — Chirp 3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
كلا المزودين خياران قابلان للاستخدام. Google Cloud STT — Chirp 3: جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً. Speechmatics: سريع بشكل مذهل لكن جودة العربية ضعيفة جداً للاستخدام الإنتاجي. ميزة السرعة لا معنى لها عندما يضطر المستخدمون لتكرار كلامهم.
Google Cloud STT — Chirp 3 يبدأ من $0.016 لكل 15 ثانية (نموذج Chirp 3). Speechmatics يبدأ من $0.0042 لكل دقيقة (بث مباشر).