فریدون علینقی ها - دانشکده فنی و مهندسی
جلسه دفاع از پاياننامه برای دریافت درجه کارشناسی ارشد در رشته مهندسی کامپیوتر گرایش هوش مصنوعی
موضوع
کاهش نویز و بهسازی گفتار با استفاده از اطلاعات زبانی و مشخصات گوینده
استاد راهنما
دکتر محرم منصوریزاده
پژوهشگر
فریدون علینقیها
چکیده
گفتار ابزار اولیه ارتباط بین انسانهاست. انسانها به کمک گفتار، مفاهیم متفاوتی را به مخاطبان خود انتقال میدهند. همچنین گفتار ابزاری مناسب برای انتقال دانستهها، انتقال مفاهیم ذهنی و احساسات درونی نیز به حساب میآید. برتری بارز گفتار بر نوشتار متناظر با آن این است که گفتار اطلاعات جانبی بیشتری را به شنونده انتقال میدهد که بعضا هدف اصلی بیان جملات نیز انتقال همین اطلاعات است. یکی دیگر از ویژگیهای بارز گفتار، سهولت انتقال آن به مخاطب است. سیگنال گفتار، سیگنال زمانی یا نگاشتی است از فشار هوایی که با میکروفون احساس میشود. برای اینکه سیگنال ضبط شده کیفیت مناسب داشته باشد طبق قضیه نایکوئیست باید حداقل دو برابر ماکزیمم فرکانس موجود در سیگنال، نمونهبرداری شود. سیگنال گفتار، سیگنال ناایستان بوده و خواص آماری آن در طول زمان تغییر میکند. به همین دلیل تحلیل سیگنال در بازههای کوتاه انجام میشود. بهسازی گفتار بسته به مساله، هدف آن، ویژگیهای نویز و امکانات موجود قابل بررسی است. از این رو روشهای متفاوتی جهت بهسازی سیگنال گفتار ارائه شده است، که مواردی نظیر فیلتر وینر، فیلتر وفقی، تفریق طیفی، روشهای مبتنی بر تبدیل موجک و روشهای آماری را میتوان نام برد. هیچ کدام از روشهای بهسازی گفتار ارائه شده تا کنون قادر به کاهش یا حذف نویز به صورت موثر و در همه شرایط نویزی نیستند و همه روشها فقط از خود سیگنال برای حذف نویز استفاده میکنند و برای بهبود گفتار اطلاعات زبانی و مشخصات گوینده را در نظر نمیگیرند.
اطلاعات زبانی و مشخصات گوینده، دو ویژگی مهم از گفتار هستند که گفتار را از نویز متمایز میکنند. در این پایاننامه، روشی پیشنهاد شده است که بدون نیاز به اطلاعات پیشین درباره ماهیت نویز، این دو ویژگی را از سیگنال گفتار استخراج نموده و بر اساس آنها به بهسازی گفتار میپردازیم. با توجه به گفتار نویزی، رویکرد جدید گفتار تمیز را از طریق شناسایی بخشهای طولانی مجموعه کلی تخمین میزند. در بازشناسی از جملات گفتار تمیز پیکره که شناسایی شده به عنوان نمونه استفاده میشود؛ تطابق بین بخشهای جمله نویزی و جملات پیکره شناسایی میشود. تخمین نیز با بخشهای مطابقتیافته طولانی شکل میگیرد. تطابق بخشهای طولانیتر، اطلاعات زبانی و مشخصات گوینده قویتری نسبت به بخشهای گفتار کوتاهتر دارد. بنابراین، تخمین مبتنی بر شناسایی بخشهای طولانی، مصونیت از نویز را افزایش داده و از این رو تخمین دقیقتری بدست میآید. روش جدید شامل مدلسازی آماری برای ارائه اطلاعات زبانی از پیکره گفتار و الگوریتمی برای شناسایی بخشهای منطبق شده طولانی بین جمله نویزی و جملات پیکره است. آزمایشات نیز بر روی دیتاست Speech Separation Challenge برای بهبود گفتار تحریف شده با نویز سفید صورت گرفته است. روش جدید، بهبود کارایی قابل توجهای را در ارزیابی کیفی و کمی نشان میدهد. برای ارزیابی از دو روش SNR و PESQ استفاده نمودهایم.
زمان ارائه:
دوشنبه 27/11/93 ساعت 15 آمفی تئاتر دانشکده مهندسی
رزومه
تاریخ تولد : 12/01/1366
پست الکترونیکی: f.alinaghe@gmail.com شمارهی تلفن: 9128822819
تحصیلات
کاردانی نرمافزار کامپیوتر 30/06/1387
نام دانشگاه : دانشگاه بین الملل امام خمینی(ره)
کارشناسی نرمافزار کامپیوتر 22/04/1390
نام دانشگاه : سراسری زنجان
کارشناسی ارشد کامپیوتر-هوش مصنوعی 27/11/1393
نام دانشگاه : بوعلی سینا همدان
فعالیتها
طراحی وب سایت انتخاب واحد هوشمند برای دانشجویان با Asp.net (15/04/1390) (پروژه دوره کارشناسی)
طراحی نرم افزارهای تجاری از جمله مدیریت فروشگاه و سیستم جامع طلا فروشی با #C
کار با انواع مختلف از سیستمهای حسابداری و اتوماسیون اداری (دوره کارآموزی)
کار در بخش سایت کامپیوتر دانشگاه زنجان و آشنایی با سیستمهای شبکه
آشنایی کامل با نرم افزارهای Microsoft Office و نرم افزارهای Microsoft Windows
آشنا یی با SQL SERVER و MYSQL آشنایی با PHP
آشنایی با سیستمهای سخت افزاری کامپیوتر
آشنایی کامل با #C
آشنایی با نرم افزار متلب و پیادهسازی 3 مقاله مربوط به پردازش تصاویر
آشنایی با سیستمهای فازی و پیادهسازی مقالهای در این زمینه با نرم افزار متلب
پیاده سازی مقالهای در زمینه شناسایی آماری الگو با عنوان کلاسترینگ در نرم افزار متلب
پیادهسازی تشخیص اعداد دست نویس انگلیسی با دقت 98درصد در سایت Kaggle
پیادهسازی تشخيص اعداد 1 تا 10 فارسی از روي سيگنال صوت آنها با دقت 95 درصد
ارائه مقاله در کنفرانس داخلی در مورد Image Segmentation در دست داوری
کار با انواع شبکههای عصبی
آشنایی کامل با نرم افزارهای آندروید و ios
زبانهای خارجه
انگلیسی خواندن : در سطح خوب
نوشتن : در سطح متوسط
عربی خواندن : متوسط
نوشتن : متوسط