مقارنة مباشرة بناءً على اختبارات إنتاج حقيقية مع متصلين بالعربية الخليجية.
تحويل صوت إلى نص عربي عالي الجودة من Google Cloud، لكن مع تأخير كبير.
خدمة تحويل الصوت إلى نص الفوري من ElevenLabs — جودة ضعيفة وبطيئة للعربية.
جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
جودة سيئة جداً في الاختبارات الإنتاجية. غير صالح للاستخدام مع العربية.
| الميزة | Google Cloud STT — Chirp 3 | ElevenLabs Scribe v2 |
|---|---|---|
| نسخ فوري بالبث المباشر | ✓ | ✓ |
| دعم أكثر من 120 لغة | ✓ | ✗ |
| علامات ترقيم تلقائية | ✓ | ✗ |
| طوابع زمنية على مستوى الكلمة | ✓ | ✗ |
| تمييز المتحدثين | ✓ | ✗ |
| مفردات مخصصة | ✓ | ✗ |
| نماذج طبية وهاتفية | ✓ | ✗ |
| دعم لغات متعددة | ✗ | ✓ |
| تكامل مع LiveKit Inference | ✗ | ✓ |
| القدرة | Google Cloud STT — Chirp 3 | ElevenLabs Scribe v2 |
|---|---|---|
| دعم البث المباشر | ✓ | ✓ |
| إضافة LiveKit | ✓ | ✓ |
| استضافة ذاتية | ✗ | ✗ |
| نمط الواجهة | gRPC streaming + REST | WebSocket streaming |
| حزم التطوير | Python, Node.js, Go, Java, C#, Ruby, PHP | Python, Node.js |
جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً.
جودة ضعيفة وتأخير عالٍ للعربية. غير مُوصى به لأي حالة استخدام لتحويل الصوت إلى نص بالعربية.
ElevenLabs Scribe v2 أسرع بمتوسط تأخير نهاية النطق 2000ms–2500ms، وهو أسرع بـ 376 مللي ثانية من Google Cloud STT — Chirp 3.
Google Cloud STT — Chirp 3 حصل على تقييم جودة 5/5 (ممتاز). جودة نسخ عالية. دعم واسع للهجات العربية من خلال رمز اللغة ar-XA.
كلا المزودين خياران قابلان للاستخدام. Google Cloud STT — Chirp 3: جودة ممتازة لكنه بطيء جداً لوكلاء الصوت الفوريين. الأنسب للنسخ الدفعي أو التطبيقات التي لا يُعد التأخير فيها عاملاً حاسماً. ElevenLabs Scribe v2: جودة ضعيفة وتأخير عالٍ للعربية. غير مُوصى به لأي حالة استخدام لتحويل الصوت إلى نص بالعربية.
Google Cloud STT — Chirp 3 يبدأ من $0.016 لكل 15 ثانية (نموذج Chirp 3). ElevenLabs Scribe v2 يبدأ من $5 شهرياً (يشمل رصيد STT).