Speech Recognition

اخر تحديث مايو 30, 2025
5.0 /5
(1)
18 التحق بالفعل

حول هذه الدورة

في هذا المشروع، يتم تطبيق تقنيات معالجة اللغة الطبيعية (NLP) باستخدام نموذج Whisper لتحويل الكلام إلى نص مكتوب. يعد هذا النموذج أحد أبرز تطبيقات الذكاء الاصطناعي في مجال التعرف على الصوت، حيث يتيح إمكانية الترجمة من عدة لغات وتحويل الخطاب الصوتي إلى نصوص مكتوبة بدقة عالية. يُستخدم نموذج Whisper من قبل مجموعة واسعة من التطبيقات مثل أنظمة الترجمة التلقائية، المساعدين الصوتيين، والأنظمة التي تعتمد على الصوت في التواصل.

أهداف التعلم

فهم أساسيات التعرف على الصوت: التعرف على المبادئ الأساسية لتقنيات تحويل الكلام إلى نصوص مكتوبة.
تعلم كيفية استخدام نموذج Whisper: فهم طريقة عمل النموذج وتطبيقه على مختلف أنواع البيانات الصوتية.
اكتساب القدرة على الترجمة التلقائية: تعلم كيفية تحويل النصوص الصوتية من لغة إلى أخرى باستخدام تقنيات الذكاء الاصطناعي.
تصميم حلول ذكية لتحويل الصوت إلى نص: بناء أنظمة فعالة لتحويل الكلام إلى نصوص مكتوبة بدقة وسلاسة.
معالجة وتصفية البيانات الصوتية: التعرف على كيفية تنقية وتحليل البيانات الصوتية لتحسين النتائج.
تعلم تكامل نموذج Whisper مع التطبيقات: استخدام النموذج في تطبيقات مثل المساعدات الصوتية والأنظمة التفاعلية.
تطوير أنظمة ترجمة فورية: بناء حلول ذكية تتيح الترجمة الصوتية المباشرة في الوقت الفعلي.
فهم تقنيات تحليل النصوص الناتجة: استخدام النصوص المكتوبة لتحليل البيانات الصوتية وتطبيقات الذكاء الاصطناعي الأخرى.
تحسين التفاعل بين الإنسان والآلة: بناء تطبيقات تُسهل التواصل الطبيعي باستخدام الصوت.
استكشاف مجالات استخدام متعددة: تطوير أنظمة مخصصة لتطبيقات مثل الملاحظات الصوتية، التعليم، وخدمة العملاء.

المواد

  • What Is Speech Recognition
  • What is Transformers
  • The Old Ways of Speech Recognition
  • The Shift to Neural Networks
  • Whisper Overview
  • Whisper Architecture
  • Applications of Whisper

متطلبات

  • معرفة بأساسيات لغة البرمجة بايثون: القدرة على كتابة أكواد بسيطة واستخدام المكتبات.
  • إلمام بالمفاهيم الأساسية للذكاء الاصطناعي: فهم المبادئ الأساسية لتقنيات تعلم الآلة والشبكات العصبية.
  • فهم التعامل مع البيانات الصوتية: معرفة أساسية بمعالجة الإشارات الصوتية أو استعداد لتعلمها.
  • الاهتمام بتطوير حلول ذكية: الحافز لتعلم وبناء تطبيقات تُحسن من تجربة المستخدم في الأنظمة التفاعلية.

الجمهور المستهدف

  • لطلاب: الهندسة أو علوم الحاسب أو الرياضيات الذين يرغبون في التخصص في الذكاء الاصطناعي وتعلم الآلة.
  • المهنيون: المهندسون أو المحللون الذين يرغبون في اكتساب معرفة أعمق في كيفية استخدام الرياضيات لتحسين أداء النماذج الحاسوبية.
  • الهواة: أي شخص لديه خلفية في الرياضيات الأساسية ويرغب في فهم الأساسيات الرياضية وراء تقنيات تعلم الآلة.

منهاج دراسي

2 دروس1h

Speech Recognition

Introduction to Speech Recognition00:39:42
Whisper00:16:09

احصل على شهادة

أضف هذه الشهادة إلى سيرتك الذاتية لإثبات مهاراتك وزيادة فرصك في لفت الانتباه.

selected template

أساتذتك

Amr Ahmed

Artificial Intelligence Engineer at NeuroTech

5.0/5
8 Courses
4 Reviews
103 Students

As an AI Engineer with a strong background in machine learning, deep learning, and natural language processing (NLP), I am passionate about making complex AI concepts accessible to learners of all levels. With experience in building real-world applications using cutting-edge tools like Hugging Face, TensorFlow, and PyTorch, I specialize in developing advanced AI models for tasks such as text correction, sentiment analysis, and real-time transcription.Throughout my career, I have contributed to a wide range of projects, including RAG systems, OCR for financial data, and real-time speech analysis, and I have a deep commitment to sharing my knowledge. My goal is to empower students to master the skills they need to succeed in the rapidly evolving world of AI and data science

شاهد المزيد
مجانا
مستوى
جميع المستويات
المدة الزمنية 1 ساعة
محاضرات
2 محاضرات

المواد

  • What Is Speech Recognition
  • What is Transformers
  • The Old Ways of Speech Recognition
  • The Shift to Neural Networks
  • Whisper Overview
  • Whisper Architecture
  • Applications of Whisper

احدث الدورات

OCR
مجانا
RAG
مجانا

ليس لديك حساب حتى الآن؟ قم بالتسجيل مجانًا