Shahed University

Rboust Classification of Speech Properties

Aminollah Mahabadi | Mohaddese Mirbeygi | Akbar ranjbar

URL :   http://research.shahed.ac.ir/WSR/WebPages/Report/PaperView.aspx?PaperID=148007
Date :  2020/06/25
Publish in :    ششمين کنگره انجمن مهندسي صوتيات ايران
DOI :  https://doi.org/ISC CODE: 98191-95334

Keywords :تفاضل طيفي، ماسک دودويي، ويژگي هاي سيگنال در حوزه زمان و فرکانس

Abstract :
در شرایط عادی سیگنال گفتار با نوفه همراه است که باعث کاهش کیفیت و قابلیت فهم گفتار می شود لذا در طراحی الگوریتم های مقاوم استخراج گفتار، شناسایی میزان حساسیت و مقاومت پارمترهای سیگنال نقش اساسی دارد. در این مقاله، کلاس بندی ویژگی های گوینده از قبیل انرژی، انتروپی انرژی، نرخ عبور از صفر، مرکز ثقل طیفی، گسترش طیفی، انتروپی طیفی، شار طیفی، ورل اف طیفی جهت سنجش میزان مقاومت به نوفه جهت طراحی الگوریتم های جداسازی سیگنال گفتار از نوفه مورد سنجش و ازمایش قرار گرفته است. به منظور حذف نوفه ابتدا از تفاضل طیفی بر سیگنال و سپس برای بهبود کیفیت از ماسک دودویی با ویژگی مقاوم مشخص شده، استفاده شده است. نتایج تجربی ازمایشات بر روی داده های AURORAنشان می دهد که میزان سیگنال به نوفه تقریبا 2 الی 3 دسی بل بهبود می یابد.



Files in this item :
Download Name : 148007_16444465742.pdf
Size : 1Mb
Format : PDF