SBU-KWS دادگان گفتار فارسی در ارزیابی سامانههای تشخیص کلیدواژه
SBU-KWS A Persian Speech Datatset for Evaluation of Keyword Spotting Systems
نویسندگان :
سعید زارعی ( دانشگاه شهید بهشتی ) , یاسر شکفته ( دانشگاه شهید بهشتی )
چکیده
هدف سامانههای تشخیص کلیدواژه صوتی (KWS)، یافتن کلیدواژه مورد نظر در فایل صوتی است. به عبارتی این سامانهها موقعیت زمانی کلیدواژه موردنظر را در صورت وجود، مشخص میکنند. از آنجایی که ارزیابی یک سامانه KWS، از اهمیت بالایی برخوردار است، بنابراین به یک دادگان مناسب نیازمندیم. در این مقاله ابتدا به معرفی دادگان SBU-KWS که حاوی گفتار مکالمه و محاوره فارسی است، پرداخته شدهاست و در ادامه ارزیابی اولیه این دادگان بر اساس سامانه مبتنی بر مدل مخفی مارکوف و سامانه مبتنی بر شبکه عصبی عمیق انجام شدهاست. دقت FOM سامانه مبتنی بر مدل مخفی مارکوف بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۷۲.۵۷ و ۶۶.۳۱ شد. همچنین برای سامانه مبتنی بر شبکه عصبی عمیق دقت FOM بر روی دادگان توسعه و آزمون SBU-KWS به ترتیب ۵۵.۵۶ و ۶۰.۲۲ حاصل شد.کليدواژه ها
ارزیابی، تشخیص کلیدواژه، دادگان گفتار فارسی، شبکه عصبی عمیق، مدل مخفی مارکوفکد مقاله / لینک ثابت به این مقاله
برای لینک دهی به این مقاله، می توانید از لینک زیر استفاده نمایید. این لینک همیشه ثابت است :نحوه استناد به مقاله
در صورتی که می خواهید در اثر پژوهشی خود به این مقاله ارجاع دهید، به سادگی می توانید از عبارت زیر در بخش منابع و مراجع استفاده نمایید:سعید زارعی , 1400 , SBU-KWS دادگان گفتار فارسی در ارزیابی سامانههای تشخیص کلیدواژه , پنجمین کنفرانس مهندسی مخابرات ایران
دیگر مقالات این رویداد
وبگاه ها
تماس با ما
آدرس: شاهرود میدان هفت تیر، دانشگاه صنعتی شاهرود
شماره تماس: 9 - 02332392204
کد پستی: 3619995161
صندوق پستی: 316
پست الکترونیک: info@shahroodut.ac.ir
© کلیه حقوق متعلق به دانشگاه صنعتی شاهرود میباشد. (همایش نگار نسخه 10.1.1)