استخراج ویژگی های گفتار به کمک روش mfccبه همراه سورس برنامه به زبان مطلب
- استخراج ویژگی به روش[ MFCC]:
Mel frequency Cepstrum Coefficient
این پروژه شامل سه قسمت است :
2 عدد فایل pdf و دو عدد صدای ضبط شده یک مرد و یک زن با کیفیت خوب که تمامی کارهای پردازش صوتی روی آن را می توان انجام داد. و یک فایل سورس پروژه می باشد.
فایل pdf اول استخراج ویژگی به روش mfcc است و شامل 10 صفحه می باشد و فایل pdf دوم مراحل محاسبه mfcc است و شامل 6 صفحه می باشد.
و فایل سورس برنامه یک m فایل است که ویژگی های mfcc را در بردارهای 39 بعدی استخراج می نماید و خروجی نهایی یک ماتریس به ابعاد 39 در طول فایل صوتی استفاده شده می باشد.
شرح مختصری از پروژه :
محاسبه ضرایب MFCC برمبنای سیستم شنوایی انسان برای یک سیگنال صوتی انجام می شود . هر فریم سیگنال ابتدا در پنجره همینگ ضرب می شود و سپس از نتیجه تبدیل فوریه گسسته گرفته می شود . اندازه تبدیل فوریه گرفته شده محاسبه می شود و برروی پوش طیف بدست آمده مراحل زیر بررای استخراج ضرایب MFCC سیگنال انجام می شود .
فیلترها به شکل مثلثی بوده وشروع هرفیلتر از فرکانس مرکزی فیلتر قبلی وخاتمه آن در فرکانس مرکزی فیلتر بعدی است و ماکزیمم آن در فرکانس مرکزی خودش می باشد و CF فرکانس مرکزی فیلتر است .
مراحل استخراج ضرایب MFCC
- عبور سیگنال ازفیلتر پیش تاکید :
این فیلتر در واقع فرکانسهای زیر 100 هرتز و بالای 4000 هرتز را فیلتر می نماید.
فریم بندی سیگنال ورودی :
ابتدا باید طول فریم را مشخص نمود و سپس سیگنال را به فریم هایی با طول مشخص تقسیم نمود البته در اینجا چون کارما آفلاین است می توانیم از ابتدا تمام سیگنال را در اختیار داشت و کل سیگنال را فریم بندی نمود . ولی اگر سیگنال کامل در اختیار نباشد باید فریم به فریم عمل نمود.
– هر فریم را باید در پنجره همنیگ ضرب نمود . و حاصل را ذخیره نمود.
از فریم هایی که در پنجره همینگ ضرب شده است تبدیل فوریه سریع می گیریم .
حال باید فرکانس را به حوزه مل ببریم.
حالا باید یک بانک فیلتری طراحی نماییم ، که مراحل آن به صورت زیر می باشد :
طیف سیگنال ازتعداد دلخواهی فیلتر( معمولا 44-20 )فیلتربا عرض باند مقیاس mel عبورداده می شود. .این فیلترها تفکیک فرکانسی سیستم ادراک گوش انسان را شبیه سازی می کنند.
این فیلترها طیف متوسط در اطراف هر فرکانس مرکزی با افزایش پهنای باند محاسبه می شوند.
– خروجی بانک فیلتر را در اندازه تبدیل فوریه سیگنال ضرب می کنیم و ازآن تبدیل گسسته کسنوسی می گیریم