فریدون علینقی ها

فریدون علینقی ها


تاریخ انتشار : Publish : نسخه قابل چاپ Print

جلسه دفاع از پايان­نامه برای دریافت درجه کارشناسی ارشد در رشته مهندسی کامپیوتر گرایش هوش مصنوعی

 

 

موضوع

کاهش نویز و بهسازی گفتار با استفاده از اطلاعات زبانی و مشخصات گوینده

استاد راهنما

دکتر محرم منصوری­زاده

پژوهشگر

فریدون علینقی­ها

چکیده

گفتار ابزار اولیه ارتباط بین انسان­هاست. انسان­ها به کمک گفتار، مفاهیم متفاوتی را به مخاطبان خود انتقال می­دهند. همچنین گفتار ابزاری مناسب برای انتقال دانسته­ها، انتقال مفاهیم ذهنی و احساسات درونی نیز به حساب می­آید. برتری بارز گفتار بر نوشتار متناظر با آن این است که گفتار اطلاعات جانبی بیشتری را به شنونده انتقال می­دهد که بعضا هدف اصلی بیان جملات نیز انتقال همین اطلاعات است. یکی دیگر از ویژگی­های بارز گفتار، سهولت انتقال آن به مخاطب است. سیگنال گفتار، سیگنال زمانی یا نگاشتی است از فشار هوایی که با میکروفون احساس می­شود. برای اینکه سیگنال ضبط شده کیفیت مناسب داشته باشد طبق قضیه نایکوئیست باید حداقل دو برابر ماکزیمم فرکانس موجود در سیگنال، نمونه­برداری شود. سیگنال گفتار، سیگنال نا­ایستان بوده و خواص آماری آن در طول زمان تغییر می­کند. به همین دلیل تحلیل سیگنال در بازه­های کوتاه انجام می­شود. بهسازی گفتار بسته به مساله، هدف آن، ویژگی­های نویز و امکانات موجود قابل بررسی است. از این رو روش­های متفاوتی جهت بهسازی سیگنال گفتار ارائه شده است، که مواردی نظیر فیلتر وینر، فیلتر وفقی، تفریق طیفی، روش­های مبتنی بر تبدیل موجک و روش­های آماری را می­توان نام برد. هیچ کدام از روش­های بهسازی گفتار ارائه شده تا کنون قادر به کاهش یا حذف نویز به صورت موثر و در همه شرایط نویزی نیستند و همه روش­ها فقط از خود سیگنال برای حذف نویز استفاده می­کنند و برای بهبود گفتار اطلاعات زبانی و مشخصات گوینده را در نظر نمی­گیرند.

اطلاعات زبانی و مشخصات گوینده، دو ویژگی مهم از گفتار هستند که گفتار را از نویز متمایز می­کنند. در این پایان­نامه، روشی پیشنهاد شده است که بدون نیاز به اطلاعات پیشین درباره ماهیت نویز، این دو ویژگی را از سیگنال گفتار استخراج نموده و بر اساس آن­ها به بهسازی گفتار می­پردازیم. با توجه به گفتار نویزی، رویکرد جدید گفتار تمیز را از طریق شناسایی بخش­های طولانی مجموعه کلی تخمین می­زند. در بازشناسی از جملات گفتار تمیز پیکره که شناسایی شده به ­عنوان نمونه استفاده می­شود؛ تطابق بین بخش­های جمله نویزی و جملات پیکره شناسایی می­شود. تخمین نیز با بخش­های مطابقت­یافته طولانی شکل می­گیرد. تطابق بخش­های طولانی­تر، اطلاعات زبانی و مشخصات گوینده قوی­تری نسبت به بخش­های گفتار کوتاه­تر دارد. بنابراین، تخمین مبتنی بر شناسایی بخش­های طولانی، مصونیت از نویز را افزایش داده و از این رو تخمین دقیق­تری بدست می­آید. روش جدید شامل مدل­سازی آماری برای ارائه اطلاعات زبانی از پیکره گفتار و الگوریتمی برای شناسایی بخش­های منطبق شده طولانی بین جمله نویزی و جملات پیکره است. آزمایشات نیز بر روی دیتاست Speech Separation Challenge  برای بهبود گفتار تحریف شده با نویز سفید صورت گرفته است. روش جدید، بهبود کارایی قابل توجه­ای را در ارزیابی کیفی و کمی نشان می­دهد. برای ارزیابی از دو روش SNR و PESQ استفاده نموده­ایم.

زمان ارائه:

دوشنبه 27/11/93  ساعت 15 آمفی تئاتر دانشکده مهندسی


رزومه

تاریخ تولد : 12/01/1366                                          

پست الکترونیکی: f.alinaghe@gmail.com    شماره‌ی تلفن: 9128822819

 

تحصیلات              

                                کاردانی  نرم­افزار کامپیوتر 30/06/1387

                                نام دانشگاه :  دانشگاه بین الملل امام خمینی(ره)

 

کارشناسی  نرم­افزار کامپیوتر 22/04/1390

نام دانشگاه  :  سراسری زنجان

 

کارشناسی  ارشد کامپیوتر-هوش مصنوعی 27/11/1393

نام دانشگاه  :  بوعلی سینا همدان

 

 

فعالیت‌ها           

                                طراحی وب سایت انتخاب واحد هوشمند برای دانشجویان با  Asp.net        (15/04/1390) (پروژه دوره کارشناسی)

                                طراحی نرم افزار­های تجاری از جمله مدیریت فروشگاه و سیستم جامع طلا فروشی  با  #C

کار با انواع مختلف از سیستم­های حسابداری و اتوماسیون اداری (دوره کارآموزی)

کار در بخش سایت کامپیوتر دانشگاه زنجان و آشنایی با سیستم­های شبکه

آشنایی کامل با نرم افزارهای Microsoft Office و نرم افزارهای Microsoft Windows

آشنا یی  با SQL SERVER  و MYSQL  آشنایی با PHP

                       آشنایی با سیستم­های سخت افزاری کامپیوتر

 

 

 

 آشنایی کامل با #C

آشنایی با نرم افزار متلب و پیاده­سازی 3 مقاله مربوط به پردازش تصاویر

آشنایی با سیستم­های فازی و پیاده­سازی مقاله­ای در این زمینه با نرم افزار متلب

پیاده سازی مقاله­ای در زمینه شناسایی آماری الگو با عنوان کلاسترینگ در نرم افزار متلب

پیاده­سازی تشخیص اعداد دست نویس انگلیسی با دقت 98درصد در سایت Kaggle

پیاده­سازی تشخيص اعداد 1 تا 10 فارسی از روي سيگنال صوت آن­ها با دقت 95 درصد

ارائه مقاله در کنفرانس داخلی در مورد Image Segmentation در دست داوری

کار با انواع شبکه­های عصبی

آشنایی کامل با نرم افزارهای آندروید و ios

زبان­های خارجه

انگلیسی    خواندن : در سطح خوب

                                                نوشتن : در سطح متوسط

                               

عربی        خواندن : متوسط

                                                نوشتن : متوسط