سیگنال گفتار (Speech Signal)، در ریاضیات (Mathematics)
انواع سیگنال ها (Signal) را در آموزش زیر شرح دادیم :
سیگنال گفتار (Speech Signal) :
تعریف: سیگنال گفتار (speech) زیرمجموعه ای از سیگنال های صوتی است که مخصوص صدای انسان برای ارتباط کلامی است. این سیگنال توسط دستگاه صوتی انسان شامل ریه ها، تارهای صوتی، زبان، لب ها و بینی تولید می شود.
مدل تولید گفتار: مدل منبع-فیلتر (source-filter model): منبع می تواند دو نوع باشد: ۱- تحریک دوره ای (برای واکه ها و صداهای صدادار) که توسط ارتعاش تارهای صوتی تولید می شود. ۲- تحریک نویزی (برای همخوان های بی صدا مثل "س"). فیلتر مجرای صوتی است که شکل آن با حرکت زبان و لب ها تغییر می کند.
\[ s(t) = e(t) * v(t) * r(t) \]که e(t) تحریک، v(t) پاسخ مجرا، و r(t) پاسخ تشعشع لب ها است.
فرمنت ها (formants): فرکانس های تشدید مجرای صوتی که در طیف گفتار به صورت پیک هایی ظاهر می شوند. فرمنت اول (F1) و دوم (F2) مهم ترین فرمنت ها برای تشخیص واکه ها هستند.
زیروبمی (pitch): فرکانس پایه (fundamental frequency) تحریک تارهای صوتی که تعیین کننده زیروبمی صدا است. برای مردان حدود ۸۰-۱۵۰ هرتز، برای زنان ۱۵۰-۲۵۰ هرتز، و برای کودکان تا ۴۰۰ هرتز.
ویژگی های زمانی: گفتار شامل بخش های سکوت (silence)، بخش های بی صدا (unvoiced) مانند "س"، و بخش های صدادار (voiced) مانند "آ" است.
تحلیل گفتار: روش های متداول: ضرایب کپسترال مل (MFCC) که در تشخیص گفتار بسیار استفاده می شود، تحلیل LPC (کدگذاری پیش بینی خطی)، و تحلیل زمان-فرکانس.
کاربردها: تشخیص گفتار (speech recognition)، شناسایی گوینده (speaker identification)، سنتز گفتار (text-to-speech)، فشرده سازی گفتار (مثل کدک های تلفنی GSM)، بهبود کیفیت گفتار، و تشخیص احساسات از روی گفتار.
کدگذاری گفتار: برای ارسال کارآمد گفتار در خطوط تلفن و مخابرات دیجیتال، از کدک های مختلفی مانند CELP، AMR، و Opus استفاده می شود.
چالش ها: تنوع لهجه ها، نویز محیط، سرعت گفتار، و تفاوت های فردی از چالش های پردازش گفتار هستند.
مثال عملی: دستیار صوتی گوشی هوشمند (مثل سیری یا گوگل اسیستنت)، ابتدا سیگنال گفتار شما را دریافت، سپس آن را پردازش کرده و به متن تبدیل می کند، و در نهایت پاسخ مناسب را می دهد.
جمع بندی: سیگنال گفتار یکی از پیچیده ترین و در عین حال مهم ترین سیگنال ها برای تعامل انسان و ماشین است.