محمد هادی محمدذی

تاریخ انتشار : Publish : نسخه قابل چاپ Print

 

دانشکده فنی و مهندسی

گروه آموزشی مهندسی کامپیوتر

اطلاعیه دفاع پایان نامه کارشناسی ارشد در رشته مهندسی کامپیوتر

 

عنوان :

تشخیص سرقت ادبی از نوع نقل به مضمون در متون علمی

 

استاد راهنما :

جناب آقای دکتر محرم منصوری زاده

استاد مشاور :

جناب آقای دکتر مهدی سخائی نیا

اساتید ممتحن :

جناب آقای دکتر میرحسین دزفولیان

جناب آقای دکتر حسن ختن لو

 

پژوهشگر :

محمد هادی محمدی

زمان :

دوشنبه 09/07/1397  ساعت 11:30

دانشکده مهندسی، ساختمان نظری، کلاس 20

 

 

Bu_Ali Sina University

Faculty of Engineering

Department of Computer

Thesis submitted for Master of Science in computer Engineering-Artificial Intelligence and Robotic

 

Title:

Paraphrasing Plagiarism Detection

 

 

Supervisor:

Dr. Muharram Mansoori Zadeh

 

Reviewers:

Dr. Mir Hossein Dezfoulian

Dr. Hassan Khotanlou

 

By:

Mohammad Hadi Mohammadi

 

October ,1,2018

Class 20 ,Faculty of Engineering

11:30-13

 

چكيده

سرقت ادبی استفاده دوباره با کپی کردن متنی بدون ارجاع به نویسنده ی اصلی است. تشخیص سرقت ادبی به مجموعه راهکارهایی گفته می‌شود که استفاده از آن‌ها به کشف دستبرد علمی منجر می‌شود. استفاده از تکنیک های یادگیری ماشین و شبکه عصبی مصنوعی یکی از روش های مرسوم جهت تشخیص سرقت ادبی است. برای تشخیص دستبرد علمی در این پژوهش از ترکیب روش های واژگانی، نگارشی، معنایی استفاده شده است، با پیش پردازش اسناد مورد بررسی و تبدیل برداری رشته های لغوی جملات اصلی و تقلبی داده های خود را جهت بررسی آماده کردیم، ازالگوریتم jaccard و الگوریتم lcs در سه حالت برای تشخیص سرقت ادبی از نوع واژگانی و ساختاری استفاده شده است واز آنجاکه هر چه پایگاه دانش غنی تر شود تشخیص سرقت ادبی معنایی بهبود می یابد، از تبدیل های برداری word2vec و glove استفاده شده است، برای ساخت پایگاه دانش شبکه در glove از همان داده های آموزش خود این پایگاه را ساختیم و بردارهای عددی جملات را جهت بررسی استخراج کردیم ولی در word2vec از پایگاه دانشی که گوگل آن را با داده های متنی گسترده ای آموزش داده بود استفاده کردیم و داده های عددی را از آن استخراج کردیم. در مجموع تعداد 9 ویژگی بدست آمده از روش های مختلف را جهت آموزش به شبکه دادیم و در طبقه بندی شبکه از طبقه بنده های مختلف مثل svm,naive bayse,rbf  استفاده کردیم و به بررسی آنها روی داده های متنی پرداختیم و به این نتیجه رسیدیم که بهترین حالت ترکیب طبقه بندها بوده است که در این حالت توانستیم تشخیص سرقت ادبی را بهبود ببخشیم.

 

ABSTRACT

A literary theft is re - used by copying a text without reference to the original author. The diagnosis of literary theftis defined as a set of solutions that will lead to the discovery of scientific plagiarisim. using machine learning techniquesand artificial neural network is one of the conventional methods for detection of plagiarism. to distinguish scientific plagiarisimin this study using lexical and syntax methods, with  jaccard and lcs have been used in three cases todistinguish literary theft from the same training data, and we extracted numerical data from the same training dataand extracted numerical data from the knowledge base which Google had trained with extensive textual data andextracted numerical data. on the other hand, we used different methods for training the network and in the networkclassification of different classes such as svm, naive bayse, rbf, and we concluded that the best mode was the composition of the classifiers, and we found that we were able to improve the detection of literary theft.

 

 

محمد هادی محمدی

همدان ، دانشکاه بوعلی سینا، گروه مهندسی کامپصوتر

شماره تماس : 09183154116

Email : Mhadim20@gmail.com

 

تحصیلات :

هم اکنون : دانشجوی مقطع کارشناسی ارشد مهندسی کامپیوتر، گرایش نرم لفزار   معدل :16

89-94 : کارشناسی ، رشته ی مهندسی کامپیوتر ، گرایش نرم افزار

84-88 : دیپلم ریاضی فیزیک

لیست دست آوردها :

برنامه نویسی نرم افزارهای متعدد از جمله نرم افزار پژوهشی فارسی آشنا ، بازی هوشتا ، بازی کدو قلقله زن ، آفاق و ....

انجام پروژه های طراحی گرافیک تصویری و ویدیوئی .

انجام پروژه های پایگاه داده

مسئول انفورماتیک اداره بنیاد شهید شهرستان همدان

ساخت مستند های مختلف از جمله مستند ابووهب

تجربه آموزشی :

کلاس آموزش ساخت کلیپ ، طراحی پوستر و برنامه نویسی در تشکل های دانشجویی و کانون های مساجد

مهارتها :

تسلط بر زبانهای برنامه نویسی پایتون و اکشن اسکریپت

 

علایق :

Animation Building , SmartPhone App Programming , Software Design , Game Developing