Shahed University

Classification of Noise-robust Speech Features in the Speaker Authentication System

Mohaddeseh Mirbeygi | Akbar ranjbar | Aminollah Mahabadi

URL :   http://research.shahed.ac.ir/WSR/WebPages/Report/PaperView.aspx?PaperID=158485
Date :  2021/03/21
Publish in :    مجله انجمن مهندسي صوتيات ايران

Link :  https://joasi.ir/browse.php?slc_lang=fa&slc_sid=1&cur=1
Keywords :ماسک دودويي، استخراج ويژگي، تعيين هويت، سيگنال گفتار، نوفه، پردازش سيگنال

Abstract :
تشخیص خودکار هویت گوینده کاربردهای وسیعی در سیستمهای صنعتی و امنیتی دارد و وابسته به ویژگی سیگنال گفتار است. کاربرد ماتریس ویژگی در شناسایی بیدرنگ گوینده بسیار مهم و وجود نوفه محیطی و پردازشی منجر به تغییر مشخصات ویژگیها و تولید خطا در تعیین هویت است. افزایش دقت در تشخیص هویت به فرایند حذف نوفه برای تعیین صحیح ویژگی های انرژی، انتروپی انرژی، نرخ عبور از صفر، مرکز ثقل طیفی، گسترش طیفی، انتروپی طیفی، شار طیفی، و رل اف طیفی از سیگنال گوینده نیاز است. در طراحی الگوریتم های خودکار بیدرنگ و قابل اعتماد، فرایندهای مهم استخراج صحیح گفتار، شناسایی میزان حساسیت و سنجش میزان مقاومت پارامترهای سیگنال برای حذف نوفه و بهبود کیفیت گفتار در بهبود سیگنال به نوفه نقش اساسی دارند. ایده اصلی این مقاله ارایه کلاس بندی ویژگیهای سیگنال گفتار برای طراحی الگوریتم های بیدرنگ تعیین هویت گوینده و مقاوم به نوفه و سنجش میزان مقاومت ان است. روش پیشنهادی حذف نوفه از ماسک دودویی با ویژگی مقاوم مشخص بهره می برد و نتایج تجربی ازمایشات بر روی داده ها، بهبود سیگنال به نوفه 2 الی 3 دسی بل را نشان می دهد. ارزیابی ماتریس ویژگی در سیستم تشخیص هویت از ضریب کپسترال فرکانس مل و ضریب پیشگویی خطی و ضریب کپستروم تشکیل شده که با روش فاصله یابی اقلیدسی در مجموعه داده ها ارزیابی شده است.



Files in this item :
Download Name : 158485_17608634410.pdf
Size : 1Mb
Format : PDF