مُختبر في الإنتاجكشف النشاط الصوتي

Silero VAD

كشف نشاط صوتي مفتوح المصدر يُستخدم في وكلاء الصوت الإنتاجيين.

موصى به

الخيار المعياري لكشف النشاط الصوتي في أنابيب وكلاء الصوت. مجاني وخفيف ويعمل بكفاءة مع الكلام العربي.

Silero VAD هو نموذج خفيف وعالي الدقة لكشف النشاط الصوتي. يُعد المعيار الفعلي لكشف النشاط الصوتي في أنابيب وكلاء الصوت، ويُستخدم لاكتشاف بداية ونهاية كلام المستخدم قبل تمرير الصوت إلى محرك تحويل الصوت إلى نص.

الاختبارات

التأخير

متوسط تأخير EOUN/A

الجودة

التقييمجيد
دعم اللهجات العربية
مستقل عن اللغة

يعمل بكفاءة مع الكلام العربي. عتبات الحساسية القابلة للتخصيص تسمح بالضبط لبيئات مختلفة.

المميزات

كشف نشاط صوتي فوري
عتبات حساسية قابلة للتخصيص
اكتشاف نهاية النطق
نموذج خفيف (أقل من 2 ميغابايت)
دعم بيئة تشغيل ONNX
مستقل عن اللغة
البث المباشرإضافة LiveKitاستضافة ذاتية

الأسعارطبقة مجانية متاحة

الخطةالسعرالوحدة
مفتوح المصدر$0مجاني

التكامل

حزم التطوير
PythonNode.jsC++
نمط الواجهة

Library / ONNX model

التوثيق

الحكم

الخيار المعياري لكشف النشاط الصوتي في أنابيب وكلاء الصوت. مجاني وخفيف ويعمل بكفاءة مع الكلام العربي.

الأفضل لـ
كشف النشاط الصوتي في وكلاء الصوتاكتشاف الكلام الفوريالأنابيب ذاتية الاستضافة

المميزات

  • مجاني ومفتوح المصدر
  • خفيف للغاية
  • مستقل عن اللغة (يعمل مع العربية)
  • قابل للتخصيص بدرجة عالية
  • تكامل مع LiveKit

العيوب

  • ضبط VAD له عوائد متناقصة
  • عنق زجاجة STT أهم من سرعة VAD
  • يتطلب ضبطاً للأداء الأمثل
زيارة Silero VAD

الذهاب إلى https://github.com/snakers4/silero-vad