استخراج ویژگی های گفتار به کمک روش mfccبه همراه سورس برنامه به زبان مطلب

- استخراج ویژگی های گفتار به کمک روش  mfccبه همراه سورس برنامه به زبان مطلب

استخراج ویژگی های گفتار به کمک روش mfccبه همراه سورس برنامه به زبان مطلب

  • استخراج ویژگی به روش[ MFCC]:

       Mel frequency Cepstrum Coefficient

 

این پروژه شامل سه قسمت است :

2 عدد فایل  pdf و دو عدد صدای ضبط شده یک مرد و یک زن با کیفیت خوب که تمامی کارهای پردازش صوتی روی آن را می توان انجام داد. و یک فایل سورس پروژه می باشد.

فایل pdf  اول استخراج ویژگی به روش  mfcc است و شامل 10 صفحه می باشد و فایل pdf دوم مراحل محاسبه  mfcc است و شامل 6 صفحه می باشد.

و فایل سورس برنامه یک m فایل است که ویژگی های mfcc را در بردارهای 39 بعدی استخراج می نماید و خروجی نهایی یک ماتریس به ابعاد 39 در طول فایل صوتی استفاده شده می باشد.

شرح مختصری از پروژه :

 

محاسبه ضرایب MFCC برمبنای سیستم شنوایی انسان برای یک سیگنال صوتی انجام می شود . هر فریم سیگنال ابتدا در پنجره همینگ ضرب می شود و سپس از نتیجه تبدیل فوریه گسسته گرفته می شود . اندازه تبدیل فوریه گرفته شده محاسبه می شود و برروی پوش طیف بدست آمده مراحل زیر بررای استخراج ضرایب MFCC سیگنال انجام می شود . 

 

فیلترها به شکل مثلثی بوده وشروع هرفیلتر از فرکانس مرکزی فیلتر قبلی وخاتمه آن در فرکانس مرکزی فیلتر بعدی است و ماکزیمم آن در فرکانس مرکزی خودش می باشد و CF فرکانس مرکزی فیلتر است .

مراحل استخراج ضرایب MFCC

 

 

  • عبور سیگنال ازفیلتر پیش تاکید :

 

این فیلتر در واقع فرکانسهای زیر 100 هرتز و بالای 4000 هرتز را فیلتر می نماید.

فریم بندی سیگنال ورودی :

 

ابتدا باید طول فریم را مشخص نمود و سپس سیگنال را به فریم هایی با طول مشخص تقسیم نمود البته در اینجا چون کارما آفلاین است می توانیم از ابتدا تمام سیگنال را در اختیار داشت و کل سیگنال را فریم بندی نمود . ولی اگر سیگنال کامل در اختیار نباشد باید فریم به فریم عمل نمود.

 

– هر فریم را باید در پنجره همنیگ ضرب نمود . و حاصل را ذخیره نمود.

از فریم هایی که در پنجره همینگ ضرب شده است تبدیل فوریه سریع می گیریم .

حال باید فرکانس را به حوزه مل ببریم.

 

حالا باید یک بانک فیلتری طراحی نماییم ، که مراحل آن به صورت زیر می باشد :

 

طیف سیگنال ازتعداد دلخواهی فیلتر( معمولا 44-20 )فیلتربا عرض باند مقیاس mel عبورداده می شود. .این فیلترها تفکیک فرکانسی سیستم ادراک گوش انسان را شبیه سازی می کنند.

     این فیلترها طیف متوسط ​​در اطراف هر فرکانس مرکزی با افزایش پهنای باند محاسبه می شوند.

خروجی بانک فیلتر را در اندازه تبدیل فوریه سیگنال ضرب می کنیم و ازآن تبدیل گسسته کسنوسی می گیریم

 

 

                  

برای دانلود کلیک کنید