تشخیص نویسنده براساس آنالیز دست‌خط با استفاده از یادگیری عمیق

نوع: Type: پایان نامه

مقطع: Segment: کارشناسی ارشد

عنوان: Title: تشخیص نویسنده براساس آنالیز دست‌خط با استفاده از یادگیری عمیق

ارائه دهنده: Provider: عذرا صولتی دالکی

اساتید راهنما: Supervisors: دکتر حسن ختن لو

اساتید مشاور: Advisory Professors:

اساتید ممتحن یا داور: Examining professors or referees: دکتر محرم منصوری زاده-دکتر رضا محمدی

زمان و تاریخ ارائه: Time and date of presentation: 1400/7/10 ساعت 16

مکان ارائه: Place of presentation: مجازی

چکیده: Abstract: در دنیای امروز حجم زیادی از اسناد کاغذی موجود توسط دوربین‌ها و اسکنرها به اسناد دیجیتال تبدیل می‌شوند. ذخیره‌سازی، بازسازی و مدیریت کارآمد این آرشیوهای تصویری، در بسیاری از برنامه‌ها نظیر اتوماسیون اداری و کتابخانه‌های دیجیتالی دارای اهمیت ویژه‌ای هستند. در نتیجه دستیابی به الگوریتم‌های موثر به منظور آنالیز تصاویر دیجیتال اسناد یک نیاز مبرم و اساسی می‌باشد. شناسایی نویسنده توسط آنالیز کردن اسناد به یکی از چالش‌های جالب در مسائل پردازش تصویر و شناسایی الگو تبدیل شده است. وابستگی به نوع دست‌خط، تفاوت ساختاری و گونه‌های متفاوت نوشتاری در افراد متفاوت از یک سو و کیفیت تصاویر حاصل شده نیز از سوی دیگر مسئله شناسایی نویسنده را با مشکل مواجه کرده است. تاکنون روش‌های زیادی برای حل مسئله شناسایی نویسنده ارائه شده است که در میان این روش‌ها یادگیری عمیق یکی از موفق‌ترین روش‌ها برای کمک به حل این مسئله بوده است. ما نیز در این پژوهش یک الگوریتم یادگیری عمیق با کمک شبکه‌های عصبی کانولوشنی ارائه داده‌ایم. در این پژوهش از یک شبکه عصبی کانولوشنی عمیق استفاده نموده‌ایم که این شبکه به دلیل دارا بودن لایه‌های کانولوشنی تا حدی که سبب وقوع سرریز در شبکه نشود به استخراج ویژگی‌های بهینه‌تر از تصاویر ورودی ما کمک شایانی می‌کند. ساختار و رویکرد ما شامل سه مرحله پیش‌پردازش، استخراج ویژگی و طبقه‌بندی می‌باشد. در مرحله پیش‌پردازش به استخراج تکه‌هایی با سایز یکسان از نقاط مختلف تصویر با هدف یکسان نمودن سایز ورودی‌های شبکه و افزایش داده‌ها می‌پردازیم، سپس به منظور بهبود کیفیت تصویر، تصاویر را نرمال‌سازی نموده و از یک فیلتر گاوسی برای حذف نویز و آستانه اتسو برای جداسازی متن از پس‌زمینه استفاده کرده و در نهایت تصاویر حاصل شده به منظور استخراج ویژگی خودکار به یک شبکه عصبی کانولوشنی عمیق داده شده است. معماری شبکه کانولوشنی استفاده شده ترکیبی از چندین لایه کانولوشنی است که با سه سایز مختلف و به صورت عمیق مورد استفاده قرار گرفته است. در آخرین مرحله ویژگی‌های استخراج شده توسط لایه اتصال کامل طبقه‌بندی می‎شوند. همچنین در این پژوهش چندین روش دیگر برای طبقه‌بندی بر روی دیتاست CVL اعمال گردیده است و نتایج حاصل شده از آن‌ها مورد بررسی و ارزیابی قرار گرفته است. مدل نهایی توسط معیارهای مختلف طبقه‌بندی ارزیابی و سنجیده می‌شود. نتایج حاصل شده توسط مدل روی دیتاست فوق الذکر نشان از عملکرد قابل قبول روش پیشنهادی می‌باشد