كيفية تحويل الكلام إلى نص باستخدام Whisper

Whisper هي تقنية ذكاء اصطناعي من OpenAI تحول الكلام المسجل إلى نص مكتوب بدقة عالية. تدعم أكثر من 99 لغة وتعمل مع معظم أنواع الملفات الصوتية الشائعة.

  1. تثبيت Whisper على النظام. افتح Terminal أو Command Prompt واكتب الأمر pip install openai-whisper. انتظر حتى اكتمال التثبيت. للتأكد من نجاح التثبيت اكتب whisper --help وستظهر قائمة الخيارات المتاحة.
  2. تحضير الملف الصوتي. ضع الملف الصوتي في مجلد يمكن الوصول إليه بسهولة. يدعم Whisper صيغ MP3 وWAV وM4A وMKV وMP4. تأكد من وضوح جودة الصوت وعدم وجود ضوضاء مفرطة في الخلفية.
  3. تشغيل عملية التحويل. في Terminal انتقل إلى مجلد الملف باستخدام cd واكتب الأمر whisper filename.mp3. استبدل filename.mp3 باسم الملف الحقيقي. ستبدأ عملية التحليل والتحويل فوراً.
  4. اختيار نموذج الذكاء الاصطناعي. أضف --model base للنموذج الأساسي أو --model large للحصول على دقة أعلى. النموذج الكبير يحتاج ذاكرة أكبر لكنه يعطي نتائج أدق خاصة مع اللهجات المختلفة.
  5. تحديد صيغة الإخراج. أضف --output_format txt للحصول على ملف نص عادي، أو --output_format srt لإنشاء ملف ترجمة بالتوقيتات، أو --output_format vtt لصيغة WebVTT. سيحفظ الملف في نفس مجلد الملف الصوتي.
  6. مراجعة النتائج وتعديلها. افتح الملف النصي الناتج واقرأ المحتوى. راجع النص للتأكد من دقة التحويل وقم بتصحيح أي أخطاء إملائية أو كلمات غير دقيقة. احفظ التعديلات في نفس الملف أو في ملف جديد.

Related

  • كيفية استخدام الذكاء الاصطناعي في تفريغ الاجتماعات صوتياً
  • كيفية استخدام الذكاء الاصطناعي لترجمة الصوت في الوقت الفعلي
  • كيفية إنتاج الصوت بالذكاء الاصطناعي للكتب المسموعة
  • كيفية إنشاء تعليق صوتي بالذكاء الاصطناعي لفيديوهات يوتيوب
  • كيفية استخدام Adobe Podcast AI لتنظيف الصوت
  • كيفية تحرير الملفات الصوتية باستخدام الذكاء الاصطناعي في Descript