Faculty - دانشکده فنی و مهندسی
Assistant Professor
Update: 2024-11-21
Mir hossein Dezfoulian
Faculty of Engineering / Department of Computer Engineering
P.H.D dissertations
-
توليد سيستم پرسش و پاسخ بصري با استفاده از تجميع روش هاي
مبتني بر تصويركاوي، پايگاه هاي دانش و يادگيري هوشمند
سميرا لويمي 2020چكيده : بينايي ماشين علمي براي ساخت سيستم هاي هوشمندي است كه هدف آنها آناليز، درك و استخراج اطلاعات مفيد از داده هاي بصري است. اين داده هاي بصري مي تواند تصاوير ساده، حجمي و توالي هاي ويدئويي باشد. پردازش زبان طبيعي، توانايي ماشين ها براي خواندن و درك زبان هاي انساني است. پرسش و پاسخ بصري يك مسئله تحقيقاتي هوش مصنوعي است كه مي توان آن را نقطه تقاطع يا تركيبي از پردازش زبان طبيعي، بينايي ماشين و استنتاج دانش دانست. در اين مسئله، به عنوان ورودي يك تصوير داده مي شود و سوالي در مورد آن پرسيده مي شود، و هدف يافتن پاسخ صحيح به سوال ورودي است. ار آنجا كه سوالات متنوعي در مورد تصوير پرسيده مي شود، سيستم به درك كاملي از تصوير، و مجموعه گسترده اي از قابليت-هاي هوش مصنوعي نياز دارد، مانند تشخيص شي، تشخيص رويداد و استدلال مبتني بر دانش. با توجه به عملكرد قابل توجه شبكه هاي عصبي عميق و عملگرهاي پركاربرد كلاسيك استخراج ويژگي از تصاوير، روش هاي پيشين نيز از اين روش ها براي حل اين مسئله استفاده كرده اند كه هريك نقاط ضعف و قوت مخصوص به خود را دارند. همچنين نكته ي ديگر قابل توجه در طراحي سيستم پرسش و پاسخ بصري، حوزه ي هدف براي استفاده از اين سيستم مي باشد. در حوزه هاي تخصصي مانند پزشكي كه با مسائل حياتي انسان سروكار دارند، علاوه بر تنوع و گستردگي سوالات، دقت بالاي سيستم در پاسخ دهي بسيار مهم است. در اين پژوهش، يك معماري جديد براي توليد مدل هاي پرسش و پاسخ بصري ارائه مي دهيم كه بيشتر از زبان مبتني بر آناليز داده هاي بصري است. همچنين، هدايت مراحل آناليز تصوير به طور مستقيم براساس پرسش مطرح شده انجام مي شود، تا بتوان در حوزه هاي تخصصي نيز متناسب با هر سوال مطرح شده مدلسازي را به گونه اي انجام داد كه بهترين مدل براي پيش بيني پاسخ آن سوال توليد كند. معماري پيشنهادي كه مبتني بر تكنيك توجه است، داراي دو بخش كلي شامل، استخراج ويژگي از تصاوير مبتني بر نوع سوال مطرح شده و پيش بيني پاسخ مي باشد. در اين راستا هفت ماژول پيشنهادي براي پاسخ به سوالات مطرح شده در مورد تصاوير ساده و حجمي، ارائه شده است. در اين ماژول ها متناسب با سوال مطرح شده يكي از روش هاي استخراج ويژگي هاي عميق (شامل استفاده از شبكه هاي عصبي كانولوشنال، موبايل نت و حافظه كوتاه مدت طولاني) يا روش هاي كلاسيك (شامل عملگرهاي معروف كلاس
Thesis summary
Master Theses
-
ارائه چارچوبي جهت طبقه بندي كلان داده با استفاده از شبكه هاي عصبي ELM
روح اله صفايي 2021در سالهاي اخير رشد انفجاري داده ها به قدري شديد بوده است كه هر دو سال مقدار داده ها تقريبا دو برابر مي شود. تحت تاثير اين رشد انفجاري داده هاي جهاني، عبارت كلان داده جهت توصيف داده هاي بسيار حجيم، داري سرعت رشد بالا و تنوع زياد مورد استفاده قرار مي گيرد. بنابراين مي توان گفت روش ها، الگوريتم ها و چارچوب هاي كلاسيك يادگيري ماشين براي مديريت و پردازش اين مقدار داده ناتوان مي باشند. الگوريتمهاي يادگيري ماشين تا زماني كه با كلان داده به چالش كشيده نشوند نويد بهبودي نخواهند داد. طبقه بندي يكي از روشهايي است كه در تحليل داده ها به ما كمك مي كند، از جمله تحليل داده هاي ساخت يافته، تحليل داده هاي متني، تحليل داده هاي وب سايت، تحليل داده هاي چندرسانه اي، تحليل داده هاي شبكه، تحليل داده هاي تلفن همراه. بنابراين مي توان گفته مساله طبقه بندي امروزه روي كلان داده بسيار حايز اهميت مي باشد. رسيدن به راهكاري جهت طبقه بندي، در مواردي با حجم داده هاي بالا چون شبكه هاي اجتماعي، تراكنش هاي مالي، تشخيص نفوذ در شبكه، بسيار راه گشا خواهد بود. در اين پژوهش سعي بر آن شد تا به روشي دست پيدا كنيم كه با استفاده از شبكه عصبي ELM ، با سرعت بالا و منابع كمتر بتوانيم طبقه بندي كلان داده را انجام دهيم. كلان داده به علت حجم بالا به طور كامل در حافظه اصلي بارگذاري نمي شود بنابراين ما روشي ارائه داديم كه با بخش بندي مجموعه داده، و آموزش هر بخش بطور مجزا و در نهايت با استفاده از يك مجمع رده بندها كه هدف آن استفاده از خرد جمعي يعني استفاده از نظر همه رده بندهاي آموزش ديده مي باشد، با حداقل منابع سخت افزاري و در زماني مناسب به دقتي قابل قبول برسيم كه هم قابليت موازي سازي داشته باشد و هم با روشهاي مبتني بر معماريهاي موازي چون نگاشت كاهش و آپاچي اسپارك قابل رقابت باشد. نتايج روش پيشنهادي روي مجموعه داده MNIST داراي نرخ خطاي 5.62 درصد مي باشد كه تفاوت آن با روش هايي كه از معماريهاي موازي و توزيع شده مانند آپاچي اسپارك و نگاشت كاهش استفاده مي كنند، چندان معنادار نمي باشد.
Thesis summary
-
بررسي وحل چالش تقسيم بندي داده هاي جريان در داده هاي حجيم
زهرا عميقي 2020جريان داده يك توالي نامحدود از داده هايي است كه با سرعت و در حجم بالا توليد مي شود. با در نظر گرفتن چنين تعريفي، پردازش اطلاعات جريان به عنوان يك موجوديت واحد بسيار دشوار و در برخي جريان ها ناممكن است. بنابراين، روش هايي ايجاد شده اند كه بتوانند پردازش چنين داده هايي را امكان پذير نمايند. يكي از رايج ترين اين روش ها، خوشه بندي نام دارد كه مي تواند اقلام اطلاعاتي مشابه را در تعدادي گروه قرار دهد. EvoStream يكي از الگوريتم هاي خوشه بندي جريان است كه با استفاده از يك الگوريتم تكاملي به صورت تدريجي در زمان هاي بيكاري جريان، خوشه بندي نهايي را انجام مي دهد. اين الگوريتم ضمن ايجاد نتايج رقابتي با ساير الگوريتم ها در اين حوزه، سربار محاسباتي مرحله آفلاين را به طور موثري كاهش مي دهد. تعداد خوشه ها در الگوريتم EvoStream ثابت درنظر گرفته مي شود، درحالي كه در جريان داده ي واقعي اين تعداد در طول زمان متغير است و به پيچيدگي داده هاي ورودي بستگي دارد. از طرف ديگر از آنجايي كه زمان وقوع بيكاري و طول زمان مذكور از الگوي خاصي تبعيت نمي كند ممكن است برخي گام هاي تكاملي به پايان نرسند كه اين امر با توجه به ثابت نبودن تعداد خوشه ها از كيفيت خوشه ها مي كاهد. در راستاي رفع اين مشكلات در اين پايان نامه الگوريتم جديدي ارائه شده است كه تعداد خوشه ها را به درستي تشخيص داده و ضمن بهبود كيفيت خوشه ها، اجراي مرحله ي تكاملي را تا چهار برابر تسريع مي كند.
Thesis summary
-
فهم سؤال در سيستمهاي پرسش و پاسخ با يادگيري عميق
مجيد كامران نژاد 2020پاسخ دادن به سؤال، يكي از شاخه هاي بازيابي اطلاعات و پردازش زبان هاي طبيعي است. به طوركلي، سيستم پرسش و پاسخ يك برنامه رايانه اي است كه مي تواند پاسخ ها را از مجموعه اسناد زبان طبيعي استخراج كند. يكي از حوزه هاي پرسش و پاسخ، درك مطلب ماشين است. درك مطلب ماشين، توانايي خواندن متن توسط ماشين و پاسخ دادن به سؤالات مطرح شده از متن است. به همين منظور سيستم بايد همانند انسان قادر به فهم درست كلمات متن و روابط بين آن ها باشد. با توجه به جديد بودن اين حوزه، بيشتر روش هاي ارائه شده مبتني بر يادگيري عميق هستند. روش پيشنهادي نيز مبتني بر يادگيري عميق است. در ابتدا، داده ها پيش پردازش شده و متن ها و سؤالات آن به كلمه و حروف تجزيه مي شوند. سپس كلمات با روش پنهان سازي GloVe و حروف با مقداردهي تصادفي به بردار عددي تبديل مي شوند و پس از كدگذاري با شبكه Bi-GRU به صورت متناظر با كلمات پاراگراف و سؤال الحاق مي شوند. با استفاده از شبكه Bi-GRU ماتريس جملات و سؤال كدگذاري شده و به وسيله مكانيسم توجه، توجه متن به سؤال به دست مي آيد. خروجي مكانيسم توجه توسط شبكه يادگيري افزايشي كدگذاري مي شود كه اين شبكه داراي لايه توجه خود تطبيق است. خروجي شبكه جهت تخمين پاسخ مورداستفاده قرارگرفته و پاسخ پيش بيني شده مورد ارزيابي قرار مي گيرد. در اين پژوهش از مجموعه داده SQuAD استفاده شده و سعي شده روشي ارائه شود كه به همراه افزايش سرعت اجرا، دقت و كارايي قابل قبولي ارائه دهد. نتايج بررسي نشان مي دهد كه مدل پيشنهادي به رشد مناسبي ازنظر سرعت و دقت نسبت به مدل هاي پيشين دست يافته است.
Thesis summary
-
شناسايي و دسته بندي ترافيك رمزشده با تاكيد بر برنامه هاي كاربردي پيام رسان
بي بي نيلوفر هاشمي 2019امروزه شناسايي و دستهبندي ترافيك يكي ازملزومات اساسي در مديريت شبكه است كه در طيف متنوعي از كاربردهاي شبكهاي ازجمله بهبودكيفيت خدمات، اولويت دهي به برخي جريانهاي ترافيكي، ارزشگذاري و حسابرسي، تشخيص نفوذ و مسدودسازي جريانهاي مخرب مورد استفاده قرار ميگيرد. از طرفي، با گسترش روز افزون مخاطرات امنيتي، بسياري از برنامههاي شبكهاي، از رمزنگاري جهت تأمين محرمانگي پيامها در بستر اينترنت بهره ميبرند. علاوه بر اين تعدادي از اين نرم افزارها از شماره درگاههاي تصادفي استفاده ميكنند كه شناسايي ترافيك آنها توسط روشهاي سنتي مبتني بر شماره درگاه يا محتوا غيرممكن ميگردد. اخيرا روشهاي يادگيري ماشين براي شناسايي اين نوع ترافيك مورد استقبال پژوهشگران قرار گرفته است. روشهاي يادگيري ماشين براي شناسايي نرمافزارهاي شبكه، بر اساس اطلاعات آماري در هر جريان عمل ميكنند. اين اطلاعات آماري از ويژگيهاي مستقل از محتوا همانند اندازه بسته، فاصله زماني بين ورود بستهها و غيره نشأت ميگيرند. دراين پژوهش، جريانهاي برنامههاي كاربردي پيامرسان Messenger Facebook،Hangouts وSkype تحت ترافيك هدف با استفاده از پنج الگوريتم يادگيري ماشين، موردشناسايي و دستهبندي قرار ميگيرند. ابتدا به ارزيابي نتايج، با استفاده از همه ويژگيها پرداخته و در ادامه الگوريتمهاي يادگيري ماشين موردنظر با مجموعههاي ويژگي بدست آمده از سه تكنيك انتخاب ويژگي، مورد آزمايش و ارزيابي قرار گرفته است. نتايج بدست آمده توسط هر روش از نقطه نظر معيارهاي ارزيابي مختلف از جمله دقت، فراخواني و measure_f گزارش ميشود. نتايج حاكي ازآن است كه ميتوان به كمك روشهاي يادگيري ماشين، جريانهاي ترافيكي رمز شده را با دقت قابل قبولي دستهبندي نمود و انتخاب ويژگيهاي موثر ميتواند به شناسايي بهتر جريانهاي ترافيكي رمزشده كمك نمايد.
Thesis summary
-
توليد ويديو از تصاوير با استفاده از شبكه مولد رقابتي
فاطمه سبحاني منش 2019پاسخ دادن به سؤال، يكي از شاخه هاي بازيابي اطلاعات و پردازش زبان هاي طبيعي است. به طوركلي، سيستم پرسش و پاسخ يك برنامه رايانه اي است كه مي تواند پاسخ ها را از مجموعه اسناد زبان طبيعي استخراج كند. يكي از حوزه هاي پرسش و پاسخ، درك مطلب ماشين است. درك مطلب ماشين، توانايي خواندن متن توسط ماشين و پاسخ دادن به سؤالات مطرح شده از متن است. به همين منظور سيستم بايد همانند انسان قادر به فهم درست كلمات متن و روابط بين آن ها باشد. با توجه به جديد بودن اين حوزه، بيشتر روش هاي ارائه شده مبتني بر يادگيري عميق هستند. روش پيشنهادي نيز مبتني بر يادگيري عميق است. در ابتدا، داده ها پيش پردازش شده و متن ها و سؤالات آن به كلمه و حروف تجزيه مي شوند. سپس كلمات با روش پنهان سازي GloVe و حروف با مقداردهي تصادفي به بردار عددي تبديل مي شوند و پس از كدگذاري با شبكه Bi-GRU به صورت متناظر با كلمات پاراگراف و سؤال الحاق مي شوند. با استفاده از شبكه Bi-GRU ماتريس جملات و سؤال كدگذاري شده و به وسيله مكانيسم توجه، توجه متن به سؤال به دست مي آيد. خروجي مكانيسم توجه توسط شبكه يادگيري افزايشي كدگذاري مي شود كه اين شبكه داراي لايه توجه خود تطبيق است. خروجي شبكه جهت تخمين پاسخ مورداستفاده قرارگرفته و پاسخ پيش بيني شده مورد ارزيابي قرار مي گيرد. در اين پژوهش از مجموعه داده SQuAD استفاده شده و سعي شده روشي ارائه شود كه به همراه افزايش سرعت اجرا، دقت و كارايي قابل قبولي ارائه دهد. نتايج بررسي نشان مي دهد كه مدل پيشنهادي به رشد مناسبي ازنظر سرعت و دقت نسبت به مدل هاي پيشين دست يافته است.
Thesis summary
-
كاوش زماني موضوع با استفاده از روش FCA
اميرحسين زند 2019امروزه اطلاعاتي كه در سطح وب وجود دارد، بسيار زياد است و هرروز اين اطلاعات در حال افزايش است، پيدا كردن موضوعات و اطلاعات موردنياز مشكلي هست كه سازمان ها با آن روبه رو هستند، دراين بين يكي از مهم ترين داده ها در سطح وب، داده هاي سايت توييتر محسوب ميشود و علت آن به روز بودن و فراگير بودن آن است. درنتيجه نياز به روش هايي كه اين داده ها را به اطلاعات مفيدتري تبديل كنند رو به افزايش است. البته اين داده ها به علت كوتاه بودن ابعاد برخلاف اسناد معمولي استخراج اطلاعات را با چالش مواجه كرده است. در بين روش هاي موجود براي كاوش موضوع مدل هاي موضوعي به خصوص مدل موضوعي ديريكله يكي از محبوب ترين و موفق ترين روش ها محسوب ميشود. گرچه اين مدل براي اسناد معمول ارائه شده است اما كاوش موضوع با اين روش عملكرد مطلوبي ندارد. به همين دليل اكثر محققان روش هاي ديگري را براي كاوش موضوع از توييتر ارائه مي كنند. درحالي كه اين روش با محاسبه مقادير پنهان در داده ها مي تواند روابط بين توييت ها را استخراج كند. در اين پايان نامه مسئله كاوش زماني داده هاي توييتر با تركيب روش هاي آماري و منطق رياضي موردبررسي قرارگرفته اند. در ابتدا داده ها از سايت توييتر جمع آوري شده و سپس براي دقت بهتر اطلاعات وابسته به متن توييت، انتخاب موضوعات را در هر بازه ي زماني موردتوجه قرار مي دهيم. سپس داده هايي كه داراي اطلاعات مفيد و موردنياز هستند پالايش مي شوند و به عنوان ورودي مدل موضوعي مورداستفاده قرار مي گيرند. به منظور افزايش دقت كاوش موضوعات، ديگر روش هاي كاوش موضوعات براي انتخاب موضوعات برتر مورداستفاده قرار مي گردد و سپس براي هر موضوع از روش هاي مبتني بر تجزيه وتحليل مفاهيم رسمي، موضوعات مختلف در هر بازه زماني به دست مي آيد. براي ارزيابي كار آيي روش پيشنهادي ابتدا وابستگي بين موضوعات و داده ها بررسي مي شوند و سپس نتايج حاصل با ديگر روش هاي مطرح در مجموعه دادگان مقايسه مي گردد. نتايج حاصل از پياده سازي نشان مي دهد كه روش پيشنهادي براي كاوش زماني موضوع به دقت و عملكرد قابل قبولي دست پيداكرده است.
Thesis summary
-
پاسخ به پرسش هاي مطرح شده از تصاوير به كمك تكنيك هاي يادگيري عميق
مجيد رفيعي 2019پاسخ گويي به پرسش هاي مطرح شده از تصاوير (VQA)، يك مسئله ي تحقيقاتي ميان رشته اي در هوش مصنوعي است. اين مسئله علاوه بر بينايي ماشين، حوزه هاي ديگري همانند پردازش زبان هاي طبيعي و نمايش دانش و استدلال را نيز پوشش مي دهد. از آن جا كه VQA، محيطي عملياتي براي سنجش درك عميق تصاوير به حساب مي آيد، طي ساليان گذشته با اقبال پژوهشگران حوزه ي هوش مصنوعي مواجه شد است. پژوهش پيش رو، به منظور ارائه ي راهكاري براي حل مسئله ي VQA طرح ريزي شده است. با آن كه در چند سال گذشته، تمامي روش هاي سرآمد VQA از معماري هاي نسبتاً پيچيده اي استفاده كرده اند، اما پژوهش هاي اخير نشان مي دهد، مدل هاي ساده تر نيز به شرط پياده سازي مناسب مي توانند عملكردي در حد مدل هاي پيچيده ارائه نمايند. بر اين اساس، در پژوهش جاري تلاش شده است تا مدلي ساده، سريع و قابل فهم براي حل مسئله ي VQA طراحي گردد كه عملكرد قابل قبولي نيز داشته باشد. سنگ بناي روش پيشنهادي، بر پايه ي روش Anderson و همكاران ] [ پي ريزي شده است. مهم ترين مزيت اين روش، ارائه ي سازوكاري تحت عنوان مكانيزم توجه پايين به بالا براي استخراج ويژگي هاي تصوير است. روش انتخاب شده با اتكا بر قابليت فوق العاده ي خود در تشخيص اشياء موفق به كسب رتبه نخست چالش VQA 2017 شده است. روش پيشنهادي اين پژوهش، بر مبناي شبكه هاي عصبي عميق بنا نهاده شده و از رويكرد مرسوم تعبيه سازي توأم ويژگي هاي تصوير و پرسش بهره مي برد. به صورت خلاصه، مدل پيشنهادي از پنج بخش اصلي تشكيل گرديده است:استخراج ويژگي هاي تصوير، تعبيه سازي پرسش، مكانيزم توجه، ادغام ويژگي ها و در نهايت توليد پاسخ. روش پيشنهادي پس از پياده سازي به كمك چارچوب يادگيري عميق Pytorch، بر روي ديتاست VQA v2.0 ] [ آموزش ديده است. در مسايل يادگيري عميق، بخش مهمي از هر پژوهش به تنظيم پارامتر هاي شبكه از طريق اعتبارسنجي و آزمايش هاي تجربي اختصاص مي يابد از اين رو، در اين پژوهش نيز به قصد دستيابي به مدلي بهينه، آزمايش هاي فراواني در جهت انتخاب بهترين معماري و بهينه ترين hyperparameterها صورت پذيرفته است. پس از انجام اين فرآيند بهينه سازي، درنهايت، مدلي به دست آمده است كه با كسب 65.19 درصد از امتياز هاي بخش test-dev ديتاست، در حدود 2 درصد نسبت به روش پايه بهبود داشته است. باوجود اين افزايش، اما نتايج نهايي مدل پيشنهادي نسبت
Thesis summary
-
برچسب گذاري تصاوير بدون نمونه آموزشي با كمك شبكه هاي عصبي بازگشتي
مهرداد باقري 2019امروزه، تصاوير نقش مهمي را در جا به جايي و انتقال اطلاعات و مفاهيم بر عهده دارند. تصوير برداري شخصي و اشتراك تصاوير در رسانه هاي اجتماعي، صفحات اينترنتي، مباحث علمي همچون هواشناسي و زمين شناسي، مسائل جرم شناسي همچون تشخيص چره و اثر انگشت و .... همگي نمونه هايي از كاربرد تصاوير در عرصه هاي مختلف هستند. براي استفاده از تصاوير در موارد ذكر شده، نيازمند روش هايي هستيم كه به صورت خودكار به بررسي و تحليل تصاوير بپردازند. برچسب زني و طبقه بندي تصاوير، از جمله مواردي است كه در سال هاي اخير، در زمينه پردازش تصاوير بسيار مورد توجه قرار گرفته است. يكي از چالش هاي موجود در اين راستا، محدوديت هاي مجموعه دادگان تصاوير، در زمينه برچسب گذاري و توصيف تصاوير است. چرا كه به صورت روزمره عناوين و مفاهيم و احساسات جديدي به تصاوير نسبت داده مي شود كه همگي آن ها در مجموعه داده هاي مورد استفاده قابل ذخيره سازي نيستند. از اين رو ارائه روش هاي كه بتوانند بدون نمونه هاي آموزشي به برچسب زني تصاوير بپردازند؛ به يكي از مسائل چالش برانگيز در سال هاي اخير تبديل شده است.
Thesis summary
-
تشخيص نقل به مضمون با استفاده از تكنيك هاي يادگيري عميق
حسن شاه محمدي 2019چكيده: تشخيص نقل به مضمون يكي از مسائل مهم در حوزه پردازش زبان هاي طبيعي است. نقل به مضمون به جملات يا عباراتي اشاره مي كند كه معني و مفهوم يكساني را به خواننده منتقل مي كنند اما ساختار و كلمات آن ها با هم متفاوت است. اين مسئله كاربردهاي فراواني در حوزه پردازش زبان هاي طبيعي دارد. ازجمله اين كاربردها مي توان به استفاده آن در خلاصه سازي متن، ترجمه ماشيني، سيستم هاي پرسش و پاسخ، تشخيص سرقت ادبي و موتور هاي جستجو اشاره كرد. در اين پژوهش، ابتدا مسئله با چندين روش مرسوم مانند وزن دهي TF-IDF و استفاده از طبقه بند هايي همچون ماشين بردار پشتيبان، حل و ارزيابي شده است. سپس با استفاده از نتايج بدست آمده از اين روش ها، يك مدل جديد براي تشخيص نقل به مضمون ارائه شده است. مدل پيشنهادي را مي توان به دو بخش تقسيم نمود. در بخش اول كه مسئله با تكنيك هاي يادگيري عميق حل مي-شود، جملات پس از عبور از مرحله پيش پردازش، با استفاده از تكنيك پنهان سازي GloVe به بردار هايي عددي تبديل مي-شوند. خروجي اين لايه پنهان سازي سپس به يك شبكه Bi-LSTM براي بيان كردن كل جمله داده مي شود. پس از اتمام آموزش مدل، خروجي اين شبكه به عنوان ويژگي هاي استخراج شده براي هر جمله در نظر گرفته مي شوند. در بخش دوم، يك سري ويژگي دستي براي بيان كردن ميزان شباهت معنايي بين دو جمله معرفي مي شوند. از ميان اين ويژگي ها، تعدادي از آن ها جديد بوده و براي اولين بار در اين پژوهش معرفي شده اند. مدل پيشنهادي از تركيب ويژگي هاي بدست آمده در اين دو بخش حاصل مي شود. دو مجموعه داده با نام هاي MSRP و Quora براي ارزيابي مدل پيشنهادي در نظر گرفته شده اند. نتايج مدل براي مجموعه داده MSRP نشان مي دهد كه اين مدل تقريبا از تمام پژوهش هاي انجام شده، كارايي بهتري از نظر صحت و f-measure را كسب مي كند. نتايج ارزيابي مدل براي مجموعه داده Quora نيز كارايي قابل قبول و قابل مقايسه اي با ساير پژوهش هاي انجام شده روي اين مجموعه داده را نشان مي دهد. به طوري كه مدل پيشنهادي جزء 24 درصد برتر روش ها از ميان بيش از 3000 تيم در سايت Kaggle است. نتايج ارزيابي همچنين نشان مي دهد كه مدل پيشنهادي براي مجموعه داده-هايي با تعداد نمونه هاي كم، كارايي بهتري در مقايسه با ساير مدل هاي جديد دارد.
Thesis summary
-
بازيابي تصوير مبتني بر محتوا با استفاده از مدل كيسه اي از واژگان چند سطحي
اكبر مقيميان 2018بازيابي تصوير مبتني بر محتوا استفاده از روش هاي بينايي ماشين براي بازيابي تصاويري از يك مجموعه است كه ازنظر محتوا به تصوير پرسش شبيه باشند. چالش اصلي سيستم هاي بازيابي تصوير كاهش شكاف معنايي بين ويژگي هاي ديداري سطح پايين تصوير و مفاهيم سطح بالاي موجود در آن است. دليل اصلي شكاف معنايي اين است كه پيكسل ها و تكه هاي تصوير در بيشتر موارد مفاهيم معنايي كمي را با خود حمل مي كنند. يكي از روش هاي كاهش اين فاصله استخراج ويژگي هاي سطح بالا در بازيابي تصوير است. از طرفي براي تفكيك تصاويري از دو گروه مختلف كه به وسيله ويژگي هاي سطح بالا قابل تفكيك نيستند، به ويژگي هاي سطح پايين نيز احتياج داريم. در اين پژوهش ويژگي هاي ديداري در چهار سطح پيكسل، ناحيه، شيء و مفهوم استخراج شده و تصاوير در اين چهار سطح با استفاده از مدل كيسه اي از واژگان نمايه سازي مي شوند. سپس از همجوشي اطلاعات اين چهار سطح به منظور كاهش شكاف معنايي و بهبود دقت و فراخواني بازيابي استفاده مي شود. در سطح پيكسل ويژگي هاي SIFT، فيلتر گابور و گشتاورهاي رنگ از تصاوير استخراج مي شود. در سطح ناحيه ابتدا تصوير با استفاده از الگوريتم Jseg به چند ناحيه افراز شده و سپس ويژگي هاي رنگ و بافت با استفاده از توصيفگر Hue و LBP از هر يك از نواحي تصوير استخراج مي شود. در سطح شيء از شبكه عصبي كانولوشني AlexNet براي بازشناسي اشياء و صحنه هاي درون تصوير استفاده مي شود و در سطح مفهوم از بازنمايي برداري واژگان متناظر با اين اشياء و صحنه ها، براي سنجش شباهت معنايي تصاوير استفاده مي شود. بازنمايي برداري واژگان با استفاده از شبكه عصبي Word2vec انجام مي شود. براي ساختن يك سيستم بازيابي تصوير مبتني بر محتواي چندسطحي نيز از دو راهكار همجوشي در سطح تصميم و همجوشي ويژگي ها استفاده شده است. نتايج اين مطالعه امكان سنجي روش پيشنهادي و بهبود عملكرد كلي سيستم بازيابي را در مجموعه تصاوير مختلف تائيد مي كند.
Thesis summary
-
نظركاوي جنبه گرا به كمك استخراج روابط معنايي
مايده شيخ حسني 2017يكي از دغدغههاي مصرف كننده محصولات، داشتن يك پيش زمينه ذهني با توجه به نظرات خريداران قبلي، نسبت به يك محصول، قبل از تصميم گيري براي خريد آن است.در كنار مصرف كنندگان، توليدكنندگان هم براي بهبود محصولات قبلي و پيشي گرفتن در بازار فروش نسبت به رقيبان به نظرات مصرف كنندگان محصولات خود اهميت ميدهند. امروزه با افزايش توليد برخط محتوا توسط كاربران در شبكههاي اجتماعي درباره يك شي واقعي يا انتزاعي، امكان رسيدن به اهداف بالا فراهم شده است. اما وجود انبوهي از اطلاعات، تحليل آن ها را سخت كرده است به همين دليل نظركاوي از جايگاه ويژهاي در متن كاوي برخوردار است. نظركاوي رشته اي از مطالعات است كه در آن عقيده، احساس، ارزيابي، گرايش و هيجان مردم از زبان نوشتاري تحليل ميشود. نمونهاي از نظركاوي، نظركاوي ريزدانه جنبه گرا است كه در آن جنبههاي مهم يك قلم از متن نظر استخراج شده و جهتگيري هر جنبه بر اساس احساس ذكرشده تخمين زده ميشود. در اينجا هر جنبه ويژگي يا جزئي از يك قلم و جهتگيري همان ارزش عددي بيان كننده احساس كاربر است. ما در اين پژوهش با استخراج ويژگيهاي معنايي متن و استفاده از ميدان تصادف شرطي به عنوان مدل يادگير، جنبههاي نهفته در متن نظرات را استخراج كرديم. نتايج آزمايش ها نشان مي دهد كه روش مورد استفاده در اين پژوهش عملكردي قابل رقابت با بهترين روشهاي موجود روي مجموعه دادگان Semeval2014 دارد.
Thesis summary
-
ارائه ي روشي براي شناخت حركت دست به منظور تعامل پزشك با سيستم پيمايش تصاوير MRI در اتاق عمل با استفاده از حسگر كينكت
اميرحسين براتي 2016بازشناسي حركت مي تواند به عنوان آغاز راهي براي تعامل انسان و ماشين باشد. اگر ماشين ها بتوانند حركات روزانه مردم را به صورت خودكار تفسير كنند، انقلابي در حوزه بينايي ماشين به وجود مي آيد. بازشناسي حركت كاربردهاي بسياري در زمينه هاي مختلف مانند بازي هاي ويدئويي، توانبخشي حركتي سالمندان، استفاده در اتاق عمل به عنوان ابزار كمكي پزشك براي مشاهده تصاوير دارد. استفاده از دوربين هاي RGB نياز به الگوريتم هاي پيچيده براي بازشناسي حركت دست دارد. با ارائه حسگر كينكت توسط مايكروسافت، انقلابي در بازشناسي حركت و صنعت بازي هاي تعاملي رخ داد. هدف از اين پژوهش استفاده از حسگر كينكت براي بازشناسي حركت دست پزشك در اتاق عمل است. در جراحي هاي مغز، پزشك نياز دارد كه تصاوير مختلف بيمار را مشاهده كند. شيوه مرسوم براي اين كار استفاده از نگاتوسكوپ است كه مشكلاتي مانند عدم بزرگ-نمايي، تغيير كنتراست و شدت روشنايي دارد. در اين پژوهش با استفاده از كينكت XBOX One، دو روش به منظور بازشناسي حركت دست ارائه شده است. در روش اول، ويژگي هاي سينماتيكي حركت با استفاده از داده هاي كينكت استخراج مي شود و از طبقه بندهاي مختلف براي طبقه بندي حركات استفاده مي شود. با توجه به اين كه دقت اين روش به ويژگي هاي استخراج شده، نوع طبقه بند و تعداد نمونه هاي آموزشي و آزمايشي بستگي دارد، روش دوم كه مبتني بر قوانين طراحي شده براي بازشناسي حركت عمل مي كند ارائه شده است. معيارهاي دقت و يادآوري به همراه ماتريس درهم ريختگي براي ارزيابي روش-هاي پيشنهادي به كار رفته اند. نتايج آزمايشات و مقايسه آن با كارهاي پيشين انجام شده در زمينه بازشناسي حركت دست در اتاق عمل، حاكي از كارايي بالاي روش هاي پيشنهادي هستند. همچنين نرم افزار بازشناسي حركت دست در اتاق عمل بيمارستان هاي عرفان و سينا تهران حين عمل جراحي در 6 نوبت توسط 8 پزشك مورد ارزيابي قرار گرفت و نتايج نشان-دهنده ميزان رضايت پزشكان از اين نرم افزار است
Thesis summary
-
رتبه بندي صفحات وب در جستجوي مفهومي به كمك روابط ساختاري و معنايي بين مفاهيم
مهنوش زندي 2016هدف از اين پژوهش، رتبه بندي صفحات وب با استفاده از اطلاعات مفهومي و معنايي بين مفاهيم مي باشد. يكي از روش هاي موثر و متداول رتبه بندي، مدل فضاي برداري است. درمدل فضاي برداري، اسناد به شكل بردارهايي هستند كه هر مولفه آن، وزن مربوط به واژه خاصي است. در اين مدل، واژگان با استفاده از روش هايي وزن دهي مي شوند. در صورت وجود واژه در سند متناسب با روش در نظر گرفته شده، وزن دهي شده و در صورت عدم وجود واژه در سند، وزن صفر مي گيرند. درصورتي كه مي دانيم واژگان مي توانند تعدادي معادل معنايي داشته باشند كه با مدل فضاي برداري، آنها در نظر گرفته نمي شوند . جهت رفع چنين نقطه ضعفي، تاكنون روش هاي جستجوي معنايي متعددي ارائه شده اند. يكي از اين روش هاي متداول، گسترش پرس وجو يا اضافه نمودن واژگان داراي معني مشترك با آن واژه به پرس وجو است. اين واژگان بايستي با دقت به معنا و مفهوم خود در متن زمينه آن واژه انتخاب شوند؛ در غير اينصورت تنها اثر آن منحرف ساختن بردار پرس وجو از بردار پرس وجوي بهينه است.
Thesis summary