Faculty - دانشکده فنی و مهندسی
Professor
Update: 2024-11-21
Hassan Khotanlou
Faculty of Engineering / Department of Computer Engineering
P.H.D dissertations
-
Multi-modal Fake News Recognition using Attention-based Ensemble of Deep Learners
2023Social networks have drastically changed how people obtain information. News in social net-works is accompanied by images and videos and thus receives more attention from readers as opposed to traditional ones. Unfortunately, fake news publishers often misuse these advantages to spread false information rapidly. Therefore, the early detection of fake news is crucial. The best way to address this issue is to design an automatic detector based on fake news content. So far, many fake news recognition systems including both traditional machine learning and deep learning models are proposed. Given that manual feature extraction methods are very time-consuming, deep learning methods are the preferred tools. This research aims to enhance the performance of existing approaches by utilizing an ensemble of deep learners based on attention mechanisms. To a great extent, the success of an ensemble model depends on the variety of its learners. To this end, we propose a novel loss function that enforces each learner to attend to different parts of news content on the one hand and obtain a good classification accuracy on the other hand. Also, the learners are built on a common deep feature extractor and only differ in their attention modules. As a result, the number of parameters is reduced efficiently, and the overfitting problem is addressed. Additionally, most research in automatic fake news detection is devoted to fully supervised setting. Given that the generation rate of news in social media is drastic and the labeling of a huge amount of data required by fully supervised models is expensive and time consuming, these models are not beneficial in real applications. To address this limitation, we extend our method for semi-supervised setting using effective augmentations, and a novel distribution-aware pseudo-labeling technique. The proposed augmentations enhance the robustness of learners and prevent overfitting effectively. Diverse learners are utilized to annotate the unlab
Thesis summary
-
بررسي اثر خستگي ناشي از ركاب زدن بر الگوي سينرژي و وزن نسبي منتخبي از عضلات اندام تحتاني طي دويدن در سه گانه كاران مبتدي: مقايسه چهار روش مختلف استخراج سينرژي عضلاني
مصطفي سپهريان 2022مقدمه: مطالعه سينرژي عضلاني روشي نوين جهت بررسي عملكرد سيستم كنترلي بدن انسان است. روشهاي رياضياتي مختلفي جهت استخراج سينرژي عضلاني از دادههاي الكترومايوگرافي بكار م يرود و اين عامل ميتواند باعث خروجيهاي متفاوت در سينرژيهاي عضلاني شود. همچنين خستگي عضلاني به عنوان متغيري تاثير گذار بر ويژگيهاي عصبي-عضلاني ميتواند سينرژيها را تحت تاثير قرار دهد. بنابر اين هدف از اين مطالعه بررسي سينرژيهاي عضلاني قبل و بعد از خستگي عضلاني با استفاده از چهار روش مختلف استخراج سينرژي حين دويدن بود. روش: در اين مطالعه نيمه تجربي، 12 دونده مرد شركت كردند. فعاليت الكترومايوگرافي عضلات دوقلو، نعلي، درشت ني قدامي، راست راني، پهن خارجي، پهن داخلي، نيم وتري و دوسر راني طي دويدن ثبت شد. از پروتكل خستگي دوازده مرحلهاي با استفاده از دوچرخه ثابت جهت ايجاد خستگي عضلاني استفاده شد. جهت استخراج سينرژي عضلاني از روشهاي الگوريتم تجزيه ماتري س نامنفي ، آناليز قدر مطلق مولفه اصلي ، آناليز مولف ههاي مستقل و آناليز عاملي استفاده شد. از روش آماري همبستگي پيرسون جهت ميزان شباهت الگوهاي استخراج شده و .)P<0/ از آناليز واريانس با اندازه گيري تكراري براي مقايسه وزن نسبي عضلات استفاده شد ) 05 يافته ها: الگوهاي سينرژي عضلاني با استفاده از روشهاي مختلف استخراج قبل و بعد از خستگي عضلاني، شباهت كم تا بالا را نشان دادند. زمان فعال سازي سينرژي عضلاني و نقاط پيك سينرژيها در قبل و بعد از پروتكل خستگي متفاوت بود. وزن نسبي عضلات پهن داخلي، پهن خارجي و دوقلو قبل از خستگي و عضلات راست راني، پهن داخلي و پهن خارجي بعد از خستگي با استفاده از روش هاي مختلف استخراج از داده هاي الكترومايوگرافي بدست آمد. VAF سينرژي عضلاني به شكل معني داري متفاوت بود. تعداد چهار سينرژي عضلاني توسط روش نتيجه گيري: با توجه به نتايج اين پژوهش، مشاهده شد روشهاي مختلف در استخراج سينرژ ي عضلاني م يتواند در تعداد سينرژي استخراج شده، الگوي سينرژيها و وزن نسبي عضلات، زمان فعال شدن سينرژيها و پيك سينرژي قبل و بعد از خستگي عضلاني تاثي ر زيادي داشته باشد و در نتيجه باعث ايجاد تفسير متفاوت در مطالعات شود.
Thesis summary
-
شناسايي خودكار احساس با استفاده از روشهاي يادگيري ماشين
سيده ساره صادقي 2021چكيده: امروزه منابع نوشتاري با سرعت بالايي در حال انتشار هستند و مقدار وسيعي از اين منابع در ارتباط با نظرات و احساس هاي كاربران است به همين دليل بررسي و تحليل اين گونه از نوشتار توجه بسياري از محققان را به خود جلب كرده است. طراحي سامانه اي بر اساس ويژگي هاي زبان شناسي شناختي و ماشين هاي يادگيري از اهداف تعيين شده براي اين رساله بوده است. بدين ترتيب در ابتدا پيكره اي احساسي تهيه شد كه برگرفته شده از پيكره بي جن خان با تنوع متون نوشتاري است. پيكره تهيه شده با مقدار 23000 سند با طول 24 كلمه، پنج احساس غم، شادي، خشم، حيرت و ترس را شامل مي شد. سپس ويژگي هاي شناختي از قبيل كلمات كليدي، مفاهيم استعاري و كنايي احساسي، مقولات نحوي مرتبط با احساس معرفي گرديد. در ادامه فهرستي نزديك به 350 كلمه با بار معنايي احساسي به عنوان فهرستي از كلمات كليدي مرتبط با احساس هاي گوناگون مشخص گرديد. همچنين بر اساس كتاب اصطلاحات فرهنگ عاميانه (نجفي 1387) كتاب نجفي و استعاره هاي احساسي مطالعه شده در زبان فارسي، فهرستي نيز از استعاره ها و مفاهيم كنايي مرتبط با احساس تهيه گرديد. به منظور تهيه فهرستي از مقولات نحوي مرتبط با احساس از برچسب زن نحوي خودكاري استفاده گرديد و با استفاده از حد آستانه، مقولات نحوي مرتبط با احساس نيز تهيه گرديد. در ادامه پس از مشخص شدن ويژگي هاي شناختي و توجه به حضور آن ها در جملات به روابط معنايي بين كلمات پرداخته شد. بدين ترتيب با استفاده از شبكه هاي عصبي مبتني بر دروازهروابط معنايي كلمات استخراج شده و با ويژگي هاي شناختي تركيب گرديد. در بخش هاي بعدي با استفاده از الگوريتم هاي دسته بندي كننده نايوبيز، درخت تصميم، ماشين بردار پشتيبانبه دسته بندي دادگان پرداخته شد. معيارهاي ارزيابي دقت، بازخواني، صحت و نرخ اشتباه براي ارزيابي عملكرد سامانه موردبررسي قرار گرفت. درنهايت نتايج به دست آمده نشان داد كه تركيب ويژگي هاي شناختي به همراه ويژگي هاي كسب شده از شبكه هاي عصبي يادگيري عميق در بهبود عملكرد سامانه تأثيرگذار بوده است و نتايج به دست آمده ميزان دقت بالاتري را نشان مي دهد به نسبت هنگامي كه اين ويژگي ها به طور مجزا در دسته بندي احساس بكار مي روند.
-
توسعه معماري چندمنظوره متن كاوي با استفاده از ساختارهاي مبتني بر آنتولوژي، پايگاه دانش و روش هاي يادگيري هوشمند
مرتضي جادريان 2020متن كاوي به مجموعه اي از مهم ترين تكنيك هايي گفته مي شود كه وظيفه تحليل و پردازش داده هاي غير ساخت يافته و نيمه ساخت يافته را بر عهده دارند. داده هاي غير ساخت يافته و نيمه ساخت يافته هم اكنون چيزي حدود 80 درصد از داده هاي موجود در سطح جهان را تشكيل مي دهند. امروزه درصد بسيار زيادي از شركت هاي تجاري، صنايع و مؤسسات تحقيقاتي، حجم عظيمي از داده هاي متني را جمع آوري و ذخيره سازي مي كنند. با افزايش روزافزون حجم اطلاعات جمع آوري و ذخيره سازي شده، نياز به پياده سازي تكنيك هايي كه بتوانند داده ها را تحليل، دانش موجود در آن ها را استخراج و منابع متني را جهت به كارگيري در حوزه هاي مختلف مدل سازي كنند، به شدت احساس مي شود. متن كاوي، ابزارها و روش هاي لازم را براي پردازش، تحليل، شناسايي و مدل سازي ساختارهاي دانش و منابع متني در اختيار شركت هاي تجاري و محققان حوزه پردازش اطلاعات قرار مي دهد. در رساله پيشنهادي يك معماري متن كاوي چندمنظوره ارائه شده است. قابليت هاي تعبيه شده براي معماري متن كاوي پيشنهادي از طريق يكپارچه سازي دانش ساخت يافته آنتولوژي، پايگاه هاي دانش ساخت يافته و روش هاي يادگيري ماشين در مدل پيشنهادي حاصل مي شود. اولين قدم در پياده سازي يك معماري متن كاوي، استخراج ويژگي ها و ساختارهاي اطلاعاتي موجود در داده هاي متني است. براي چنين كاري يك واحد پيش پردازش معنايي داده هاي متني پياده سازي شده است. وظيفه اين واحد استخراج محتواي اطلاعاتي داده هاي متني و الگوهاي ساخت يافته موجود در آن ها است. يكي از معضلاتي كه برخي از سيستم هاي متن كاوي با آن ها دست وپنجه نرم مي كنند، كمبود محتواي اطلاعاتي در اسناد متني است. در چنين حالتي، روش هاي مبتني بر دانش و يادگيري ماشين نياز است تا محتواي اطلاعاتي مرتبط با منابع متني شناسايي شوند. در اين رساله از يك واحد بديع جهت غني سازي محتواي متني استفاده شده است. در اين واحد، دانش ساخت يافته آنتولوژي و پايگاه دانش و ساختارهاي اطلاعاتي حاصل از مدل هاي يادگيري ماشين به طور كامل يكپارچه سازي شده است. در اين رساله، دو روش وزن دهي تركيبي به نام امتياز برجستگي و امتياز مشاركت جهت كاهش ابعاد فضاي مسئله و شناسايي مفاهيم و ساختارهاي اطلاعاتي كه مهم ترين نقش را در انتقال زمينه محتوايي اسناد متني دارند پياده سازي شده است. قابليت هاي تعبيه شده در اين روش
Thesis summary
-
سنجش كاركرد آموزش مبتني بر واقعيت افزوده در درس تاسيسات مكانيكي مقطع كارشناسي رشته معماري
شايسته ولدي 2020درس تاسيسات مكانيكي
-
تشخيص تعامل انسان در ويديو با استفاده از شبكه هاي عصبي عميق
مه لقا افراسيابي 2019چكيده: بسياري از ويديوهايي كه انسان ها را به تصوير مي كشد، داراي فعاليت هايي است كه بين انسان ها وجود دارد و نشان گر فرهنگ و رابطه بين آن هاست. با پيشرفت تشخيص كنش هاي انسان در ويديو، محققان به شناخت و پيش بيني تعامل انسان- انسان به طور خودكار پرداخته اند. هدف از پيش بيني تعامل تشخيص زود هنگام تعامل قبل از انجام كامل آن است. كه در بازيابي ويديو بر اساس محتوا، تعامل انسان و كامپيوتر و امنيت و نظارت كاربرد دارد. اما اين موضوع هنوز يك مسئله چالش برانگيز است، كه اين چالش مي تواند ناشي ازتغييرات تصوير، نحوه اجراي متفاوت افراد در انجام يك تعامل و .. باشد. روش هاي موجود در اين حوزه بر اساس ويژگي به ويژگي هاي دستي و ويژگي هاي يادگرفته شده تقسيم مي شوند. ويژگي هاي ياد گرفته شده تا حدودي چالش هاي تنظيمات ضبط، ظاهر فرد، اندازه تصوير و نقطه ديد را كاهش داده اند. انتظار ما اين است كه استفاده از استخراج ويژگي يادگرفته شده در مدل هاي پيشنهادي مي تواند چالش ها را تا حد امكان كاهش دهد. در اولين مدل پيشنهادي به نام Dual-Actor CNN از دو شبكه همسان براي استخراج ويژگي هاي دو فرد در حال تعامل استفاده شده است. كه اين مدل به علت استفاده از شبكه هاي همسان و به اشتراك گذاري وزن ها باعث مي شود چالش جهت و نقطه ديد انجام كنش حل شود. در روش پيشنهادي ديگر مسئله در قالب سري زماني به نام DTW-CNN مدل مي شود، فرض بر اين است كه استفاده از روش روش پيچ وتاب زماني پويا بتواند بر چالش نرخ زمان اجراي تعامل غلبه كند. از آنجايي كه انجام هر كنش يا تعامل ماهيتي فازي دارد و نمي-توان حركت مشخصي براي تعريف آن در نظر گرفت، استفاده از روش فازي مي تواند باعث افزايش دقت تشخيص تعامل شود، در مدل پيشنهادي Fuzzy-Relation CNN از حركات افراد در ويديو دو تصوير فازي ساخته مي شود كه شامل حركات افراد در حال تعامل است. اين تصاوير ايجاد شده اطلاعات پيش-زمينه و نا مرتبط به تعامل را حذف مي كند و تغييرات مهم حركت افراد را با توجه به زمان آن را نگه ميدارد. سپس از تصوير ايجاد شده ويژگي استخراج مي شود. سه مدل بر روي مجموعه داده هاي TV human interaction، BIT و UT ارزيابي شده اند. نتايج نشان مي دهد كه دقت اين مدل ها براي پيش-بيني تعامل نسبت به روش هاي پيشين بالاتر بوده و در بين اين سه مدل روش Dual-Actor دقت بالاتري داشته است.
Thesis summary
-
تدوين و ارائه روش تجربي جهت برآورد ريسك مواجهه با صدا در محيطهاي صنعتي بسته با به كارگيري تكنيك هاي هوش مصنوعي و آماري
وحيده ابوالحسن نژاد 2019تمامي مطالعات ذكر شده بر ريسك هاي مختلف مواجهه با صدا صحه گذاشته اند، اما الگوي ارتباطي فراگيري كه روند تاثير عوامل(استرسور) را با استرس ها و استرين هاي ايجاد شده شامل اثرات شنيداري و غير شنيداري فيزيولوژيك و سايكو-فيزيولوژيك با ارائه يك مدل قابل تعميم نشان دهد، در دست نيست. لذا، تدوين و ارائه يك روش تجربي بهينه كه بتواند ريسك مواجهه شاغلين با صدا را با در نظر گرفتن پتانسيل هاي خطر در محيطهاي صنعتي تخمين زده و در مقايسه با روشهاي سنجش كمي، ارزيابي دقيقتري ارائه نمايد، لازم و ضروري به نظر مي رسيد. اين پژوهش با هدف تدوين و ارائه روش تجربي جهت برآورد ريسك مواجهه با صدا در محيطهاي صنعتي بسته با بهكارگيري تكنيك هاي هوش مصنوعي و آماري انجام گرديد.
Thesis summary
-
تعامل مكاني انسان-ربات و برنامهريزي اجتماعي مسي
امير سالارپور 2018يكي از پژوهشهاي مهم در زمينه رباتيك توسعه روشهاي پيشرفتهاي است كه رباتها را قادر ميسازد تا در محيطهاي كارآمدي و رفتار ، حفظ ايمني ، مشترك با انسان كار كنند. يك الزام اساسي براي رفتار رباتها در محيطهاي انساني پيمايش محيط با توجه به الزامات گفتهشده است. پيمايش اجتماعي ، اجتماعي قابلقبول است. از مهمترين وظايف اوليه محيط نيازمند ديد كلي نسبت به محيط اطراف است كه با استفاده از آن افراد در محيط اطراف تشخيص داده شده و رهگيري شوند. از اطلاعات بهدستآمده از مرحله تشخيص و رهگيري كه شامل موقعيت و مسير افراد است، براي پيشبيني حركت افراد در محيط استفاده ميشود. سپس تعامل بين افراد در محيط بر اساس موقعيت، مسير و پيشبيني حركت افراد تشخيص از اطلاعات استخراجشده افراد و تعاملهاي آنها براي مدلسازي اجتماعي محيط اطراف و ، داده ميشوند. درنهايت برنامهريزي مسير مبتني بر اين مدل بهره گرفته ميشود. مجموعه اين وظايف ربات را قادر ميسازد تا به صورت ايمن و سازگار با قوانين اجتماعي در محيطهاي انساني پيمايش كند. تعامل مكاني ربات و انسان مبتني بر اطلاعات كسبشده از محيط انجام ميشود. امروزه كمابيش تمامي رباتها مجهز به سنسورهاي فاصلهياب هستند و استفاده از آن نياز به اعمال تغييري در ربات نخواهد داشت. مهمترين نوع سنسور فاصله ياب، سنسورهاي ليزر هستند كه قادرند اطلاعات فاصلهاي دقيق و سريع از محيط اطراف فراهم كنند. از اين رو، در اين تمركز شده ، پاياننامه بر پيمايش اجتماعي محيط با استفاده از دادههاي بهدستآمده از ليزر كه ابرنقطه ناميده ميشوند مرحله انطباق ابرهاي نقطه، تشخيص و رهگيري افراد 4 است. چارچوب پيمايش اجتماعي محيط مبتني بر دادههاي ليزر به پيشبيني حركت افراد، مدلسازي و برنامهريزي اجتماعي محيط تقسيم ميشوند. در اين پژوهش هر يك ، در محيط اطراف از مراحل چارچوب معرفيشده براي پيمايش اجتماعي محيط به صورت مجزا مورد بررسي قرار گرفته است و سعي شده تا عملكرد هر مؤلفه با ارائه يا توسعه رويكردهاي مرتبط بهبود داده شود. در مرحله انطباق ابرهاي نقطه يك بررسي كامل و جامع بر روي روش انطباق تكرار نزديكترين نقطه و توسعههاي آن جهت انتخاب بهترين معماري صورت گرفته است .در همين راستا، يك روش پيشنهادي مبتني بر ويژگي حفظ صلبيت تغييرات ابرهاي نقطه، براي ارتقا عملكرد كلي الگوريتم تكرار نزديكترين نقطه ارائه شده است. روش پيشنهادي با د
Thesis summary
-
پردازش تصوير در دامنه ي ديفرانسيل برداري دل
علي اكبر كيايي خوشرودباري 2018موضوع اين پايان نامه، استفاده از عملگر دل (Del operator) براي انتقال يك تصوير از ميدان عددي به برداري است. در پردازش تصوير، روشي كه بتواند يك تصوير را از ميدان عددي به برداري برده و به ميدان عددي بازگرداند وجود ندارد. به عبارتي ديگر، يكي از چالش هايي كه در پردازش تصوير وجود دارد اين است كه هرچند روش هاي مبتني بر گراديان به نظر تصوير را به فرم برداري درمي آوردند، اما اين تنها در كاربردهايي از آن صادق است كه نياز به بازسازي تصوير نباشد. در مواردي كه نياز به بازسازي تصوير باشد، در عمل اين روش ها از تصوير لاپلاس مي گيرند تا بتوانند به كمك حل معادله ي پواسن به فضاي تصوير برگردند. اما عمل لاپلاس گيري فضاي تصوير را از ميدان عددي به برداري نمي برد، بلكه در همان ميدان عددي مانده و فقط دامنه ي آن تغيير مي كند. بنابراين اين روش ها تنها در حالتي كه نياز به بازگشت به ميدان عددي نباشد مي توانند از مزاياي ميدان برداري بهره ببرند و در حالتي كه تصوير نياز به بازسازي دارد، از هيچ يك از اطلاعات، دست كاري ها، و تبديل هايي كه فقط در ميدان برداري معني دارند نمي توانند استفاده كنند. راهكار ارائه شده در اين پايان نامه براي تغيير ميدان از عددي به برداري، كمك گرفتن از ديفرانسيل رياضي است. بر اساس ديفرانسيل، يك تصوير ديجيتال (كه با آن مانند يك ماتريس عددي رفتار مي شود)، در دو راستاي افقي و عمودي تحت تأثير عملگر دل قرار مي گيرد و تبديل به يك ماتريس برداري مي شود. درنتيجه، تصوير تبديل يافته داراي هندسه، اندازه و اطلاعات كاملاً متفاوتي نسبت به تصوير اصلي است، زيرا عملگر دل تصوير را از ميدان عددي به برداري تبديل مي نمايد. براي بررسي صحت و كارايي اين تبديل، تعدادي از كاربردهاي پردازش تصوير نيز در اين پايان نامه ارائه شده و مورد ارزيابي قرارگرفته اند. ازجمله ي اين كاربردها مي توان به قطعه بندي تصوير، آميختگي تصوير، معيار ارزيابي عيني تصوير، تكميل سازي تصوير و ويرايش تصوير اشاره نمود. روش هاي تبديل تصوير كه تاكنون ارائه شده اند مبتني بر تبديل دامنه اند و به موجب آن ها تصوير همچنان در ميدان عددي باقي مي ماند؛ اما هدف اين پايان نامه تبديل تصوير از ميدان عددي به ميدان برداري است. نتيجه گيري آن كه، تبديل تصوير از ميدان عددي به برداري منجر به دسترسي گسترده اي از اطلاعات، تبديل هاي خطي و غيرخطي و تغييراتي
Thesis summary
-
پيش بيني فاكتورهاي حسي حركتي مؤثر بر ميزان ناپايداري مزمن مچ پا در زنان ورزشكار نخبه و ارائه مدل با رويكرد شبكه عصبي
فرزانه گندمي 2016مقدمه و هدف: بي ثباتي مزمن مچ پا، شايع ترين عارضه بعد از پيچ خوردگي حاد اوليه است كه حدود 60-15 درصد افراد آن را تجربه مي كنند. هدف پژوهش حاضر پيش بيني فاكتورهاي حسي حركتي مؤثر بر ميزان ناپايداري مزمن مچ پا در زنان ورزشكار نخبه و ارائه مدل با رويكرد شبكه عصبي بود. روش شناسي تحقيق: روش اين مطالعه همبستگي و از نوع Case Control بوده، 25 ورزشكار آسيب ديده و 25 ورزشكار سالم با استفاده از مقياس هاي FADI و فرم ورزشي FADI و نيز مقياس سنجش ميزان ناپايداري سايمون انتخاب و در مطالعه وارد شدند. فاكتورهاي حسي-حركتي پيش بين آسيب ناپايداري مزمن مچ پا شامل دامنه حركتر دورسي فلكشن در تحمل وزن، ثبات ناحيه مركزي، تعادل ايستا و پويا، فعاليت فيدبكي و فيد فورواردي عضلات (دوقلو خارجي، تيبياليس قدامي، نازك نئي بلند، نعلي، سريني مياني و سريني بزرگ) در مهارت فرود روي دستگاه سوپيناتور و پيچش ناگهاني مچ پا، هم انقباضي عضلات اطراف مفصل مچ پا در حين پيچش مچ پا پس از فرود روي دستگاه سوپيناتورمورد سنجش قرار گرفتند. جهت ارزيابي دامنه حركتي دورسي فلكشن در تحمل وزن از اينكلاينومتر، جهت ارزيابي تعادل پويا از تست ستاره اصلاح شده، جهت ارزيابي تعادل ايستا از بايودكس و نهايتاً جهت ارزيابي فعاليت الكتروميوگرافي عضلات از دستگاه الكتروميوگرافي سطحي استفاده شد. جهت پيش بيني اثرگذاري فاكتورهاي حسي-حركتي بر وقوع اسپرين مزمن از آمار رگرسيون لجستيك استفاده گرديد كه سطح معناداري آزمون ها 05/0 در نظر گرفته شد. همچنين از شبكه عصبي جهت تعيين مدل پيش بيني اسپرين مزمن استفاده گرديد. نتايج: نتايج اين پژوهش نشان داد كه مدل رگرسيوني 5/89% موردها را به طور صحيح طبقه بندي كرد كه در اين بين تنها متغيرِهاي " فعاليت فيدفورواردي عضله تيباليس قدامي، تعادل پويا و فعاليت فيدبكي پرونئوس لانگوس" سهم يگانه معنادار آماري در مدل داشتند. تعادل پويا داراي ضريب احتمال 86/0، ضريب احتمال براي شاخص فعاليت فيدفورواردي عضله تيباليس قدامي 75/0 و ضريب احتمال براي شاخص فعاليت فيدبكي عضله پرونئوس لانگوس 95/0 بود. نتايج شبكه عصبي مصنوعي نيز نشان داد؛ ضرايب رگرسيون براي داده هاي آموزش، اعتبارسنجي و تست در شبكه اي با يك لايه پنهان و پنج نرون در اين لايه به ترتيب 1، 503/0، 863/0 مي باشد كه نشان دهنده كارايي شبكه در پيش بيني ناپايداري مچ پا بوده و 6/93
Thesis summary
Master Theses
-
شبكه عصبي عميق با معماري معنايي-احساسي براي تشخيص احساس در متن با استفاده از جاسازي واژه هاي از پيش آموزش ديده
فائزه اسدبيگي 2024تشخيص احساسات از متن به سبب نياز سازمان ها و مراجع به اطلاعات موجود در داده هاي مكتوب از اهميت بالايي برخوردار است. پژوهش ها نشان داده است كه به علت وجود كلمات و عبارات عاميانه و يا خارج از دايره واژگاني و نيز بُعد پيچيده و متنوع بيان مكتوب احساسات در افراد مختلف، شبكه هاي عصبي عميق در ثبت الگوها و بازنمايي هاي پيچيده عملكرد بهتري نسبت به ديگر روش هاي موجود از خود نشان داده اند. در اين پژوهش، يك شبكه عصبي عميق به نام معماري معنايي-احساسي با استفاده از برچسب گذاري اجزاي كلام براي تشخيص احساسات در متن، با استفاده از جاسازي واژه هاي از پيش آموزش ديده پيشنهاد شده است. اين مدل اطلاعات معنايي و اطلاعات احساسي موجود در متن را با توجه به نقش گرامري كلمات در جمله، باهم ادغام مي كند تا معنا و احساس در متن را به خوبي به تصوير بكشد. از جاسازي هاي كلمات از پيش آموزش ديده، براي نمايش برداري كلمات استفاده شده است. اين بردارها اطلاعات معنايي غني را رمزگذاري مي كنند و مدل را قادر مي سازند تا زمينه و معناي كلمات را به طور مؤثرتر دريافت كند. معماري پيشنهادي از سه زيرلايه تشكيل شده است. اولين زيرشبكه از شبكه BiLSTM براي گرفتن اطلاعات متني و تمركز بر روابط معنايي استفاده مي كند. دومين زيرشبكه از شبكه CNN براي استخراج ويژگي هاي احساسي استفاده مي كند. اين زيرشبكه روابط عاطفي بين كلمات را نيز درنظر مي گيرد. سومين زيرشبكه از شبكه CNN و يك بلوك POS tagging براي استخراج ويژگي هاي بيشتر با توجه به نقش كلمات جمله، استفاده مي كند. روش پيشنهادي بر روي مجموعه داده ISEAR اعمال و آزموده شده است. نتايج بدست آمده از آزمايش روش پيشنهادي بر روي مجموعه داده و مقايسه آن با روش هاي پيشين نشان مي دهد كه مدل عملكرد مطلوبي داشته و به نتايج قابل قبولي دست يافته است.
Thesis summary
-
انتخاب ويژگي براي طبقه بندي با استفاده از محاسبات تكاملي
مهسا بوجاري 2024در بسياري از مسائل يادگيري ماشين تعداد زيادي ويژگي وجود دارد كه همه اين ويژگي ها ضروري نيستند؛ زيرا بسياري از آنها اضافي يا حتي نامربوط هستند كه ممكن است عملكرد يك الگوريتم طبقه بندي را كاهش دهند. هدف از انتخاب ويژگي، حل اين مشكل با انتخاب تنها زيرمجموعه كوچكي از ويژگي هاي مرتبط از مجموعه ويژگي بزرگ اصلي است. با حذف ويژگي هاي نامربوط و زائد، انتخاب ويژگي مي تواند ابعاد داده ها را كاهش دهد، روند يادگيري را تسريع كند، مدل آموخته شده را ساده سازي كند و يا كارايي را افزايش دهد. انتخاب ويژگي به دليل دارا بودن فضاي جستجوي بزرگ، كار دشواري است. از بين روش هاي مختلف موجود براي انتخاب ويژگي، روش هاي محاسبات تكاملي به دليل توانايي يا پتانسيل جستجوي سراسري خود براي حل مسئله انتخاب ويژگي در سال هاي اخير توجه زيادي را به خود جلب كرده اند. هدف اين پژوهش، بهبود دقت طبقه بندي در مسائل مساله انتخاب ويژگي با استفاده از الگوريتم هاي تكاملي است. مهم ترين چالش هاي مسئله انتخاب ويژگي، مقياس پذيري، هزينه محاسباتي، روش هاي جستجو، معيار ارزيابي و تعداد نمونه ها است. در اين پژوهش براي كاهش هزينه محاسباتي به ويژه در مقياس بزرگ از روشي براي تركيب انتخاب ويژگي و انتخاب نمونه استفاده شده است و اين روش به عنوان روش پايه در همه آزمايش ها استفاده شده است. براي بهبود دقت طبقه بندي از تركيب روش پايه با الگوريتم هاي تكاملي مختلف به عنوان روش جستجو استفاده شده است و از 13 مجموعه داده براي ارزيابي روش پيشنهادي استفاده شده است. پس از اجراي آزمايش هاي مختلف دقت طبقه بندي نسبت به روش پايه در همه 13 بهبود داده شده است.
Thesis summary
-
طبقه بندي تصاوير سي تي اسكن كبد به كمك روشهاي يادگيري نيمه نظارتي عميق
2024كبد يك عضو مهم و حياتي در بدن مهره داران است و سلامت كبد براي حفظ سلامتي كل بدن ضروري است. تشخيص و طبقه بندي ضايعات كانوني كبد از تصاوير سي تي اسكن، به دليل اهميت كبد در بدن انسان، چالشي بسيار مهم براي پزشكان است. اين پژوهش با هدف بهبود دقت طبقه بندي كبد سالم و ضايعات كانوني كبد از جمله كيست ، هيپرپلازي ندولار كانوني ، كارسينوم سلولي كبد و همانژيوم ايجاد شده است و از شبكه هاي عصبي عميق و يادگيري انتقالي استفاده كرده ايم. در اين پژوهش، از سه شبكه عصبي عميق ResNet، AlexNet و EfficientNet براي طبقه بندي تصاوير سي تي اسكن كبد با كنتراست بهبوديافته از سه مداليته مختلف NC، ART و PV استفاده شده است. به دليل تعداد محدود تصاوير سي تي اسكن كبد، از يادگيري انتقالي براي بهبود عملكرد مدل ها استفاده كرده ايم.در اين پژوهش از دو نوع تابع اتلاف ميانگين مربعات خطا و تابع اتلاف متقاطع آنتروپي استفاده كرده ايم. نتايج ارزيابي نشان مي دهد كه مدل ResNet با يادگيري انتقالي و تابع اتلاف متقاطع آنتروپي، بهترين عملكرد را در مقايسه با ساير مدل ها و روش هاي پيشرفته ديگر دارد و مقايسه ي آن با پژوهش هاي مشابه نشان دهنده نتايج مطلوب و قابل قبولي در حوزه قطعه بندي ضايعات كانوني كبد است. اين پژوهش نشان مي دهد كه استفاده از شبكه هاي عصبي عميق و يادگيري انتقالي مي تواند دقت طبقه بندي ضايعات كانوني كبد را از تصاوير سي تي اسكن به طور قابل توجهي افزايش دهد.
Thesis summary
-
جمعيت شماري ويدئويي با استفاده از شبكه هاي عصبي عميق توسعه يافته
2024اخيراً، شمارش تعداد افراد براي صحنه هاي ويدئويي پر ازدحام به دليل كاربردهاي گسترده آن (مانند نظارت تصويري، امنيت عمومي و تحليل محتواي چندرسانه اي) با استفاده از روش هاي مبتني بر يادگيري عميق مورد توجه قرارگرفته است. عمده روش ها روي تصاوير ثابت تمركز داشته اند و تعداد بسيار كمتري بر روي شمارش جمعيت مبتني بر ويدئو تمركز مي كنند. با اين وجود اين مدل ها به دليل عدم توجه به همبستگي زماني، داده هاي محدود، محيط متغير، انسداد و ساير موارد قابليت تعميم و كارايي مناسب براي صحنه هاي طبيعي را ندارند ضمن اينكه ممكن است به دليل كمبود و عدم تنوع داده دچار بيش برازش هم باشند. اين پژوهش، نشان مي دهد تخمين جريان افراد در مكان هاي تصوير بين تصاوير متوالي و استنتاج تراكم افراد از اين جريان ها بدون نياز به معماري پيچيده تر، عملكرد را به طور قابل توجهي افزايش مي دهد. علاوه بر اين، افزودن يك شبكه عصبي توجه مكاني-زماني براي تخمين تعداد عابران پياده نيز بررسي شده است.
Thesis summary
-
يادگيري با نمونه هاي محدود به كمك روش هاي مبتني بر پيام واره
2023امروزه، در پردازش زبان طبيعي، داده هاي برچسب گذاري شده مهم است، بااينحال، يافتن تعداد كافي از داده ها يك مرحله چالشبرانگيز است. بسياري از وظايف وجود دارد كه بهسختي مي ميتوان دادههاي آموزشي موردنياز را به دست آورد. براي مثال در ترجمه ماشيني بايد دادههاي زيادي را به زبان مقصد آماده كنيم تا عملكرد نهايي قابلقبول باشد؛ بااينحال، ممكن است نتوانيم دادههاي مفيد را در زبان مقصد جمعآوري كنيم. ازاينرو، نياز است از يادگيري با نمونه هاي محدود استفاده كنيم. اخيراً روشي به نام پيام واره نويسي معرفي شده است كه در آن ورودي هاي متن با استفاده از فرمت خاصي كه يك يا چند جاي خالي دارد، به متني با ساختار جديد تبديل مي شود. با توجه به متن جديد داراي جاي خالي، يك مدل زباني پيش آموزشديده بهترين كلمه را جايگزين جاي خالي مي كند. پيام واره مي تواند در زمينه يادگيري با نمونه ها هاي محدود به ما كمك كند. حتي در مواردي كه دادهاي وجود ندارد كه به يادگيري بدون نمونه معروف است. در كارهاي اخير از مدل هاي زباني بزرگ مانند GPT-2 و GPT-3 استفاده و با روش پيام واره نويسي، كارهايي مانند ترجمه ماشيني انجام مي شود. در اين تلاشها از هيچ داده آموزشي برچسب داري استفاده نمي كنند؛ بااين حال اين نوع مدلها با تعداد زيادي پارامتر به سختافزار قدرتمندي نياز دارند. در اين پژوهش، روشي مبتني بر پيام واره نويسي براي يادگيري با نمونه ها هاي محدود معرفي شده است. روش ارائه شده بر پايه ساختار PET ايجاد شده است. PET با استفاده از مدل ها هاي زباني كوچك مثل RoBERTa يادگيري با نمونه ها هاي محدود را با عملكرد قابلقبولي انجام مي دهد. بر اساس نتايج به دست آمده، روش ارائه شده با استفاده از PET و مهندسي پيام واره و مهندسي پاسخ و همچنين انجام پردازشهاي مختلف در دادههاي متني به نتايج قابلقبولي دستيافته است.
Thesis summary
-
قطعه بندي اسبك مغزي در تصاوير تشديد مغناطيسي با استفاده از شبكه هاي عصبي عميق
عليرضا صادقي 2023اسبك مغز يك ساختار مغزي كوچك، مياني و زير قشري است كه به حافظه بلند مدت و كوتاه مدت مربوط مي شود. شكل و شمايل اسبك مغزي تحت تاثير مواردي همچون زوال عصبي يا آلزايمر مي تواند تغيير پيدا كند. قطعه بندي اسبك مغزي از تصوير تشديد مغناطيسي براي تحقيقات اختلالات عصبي- روانپزشكي از اهميت بالايي برخوردار است و همچنين مي تواند در بررسي بيماري هايي مانند آلزايمر، صرع و اسكيزوفرني استفاده شود. يكي از ضرورت هاي بررسي و تحليل تصوير اسبك مغزي، همانطور كه گفته شد، پيش بيني احتمال ابتلا به آلزايمر مي باشد، در صورتي كه اين بيماري سريع تشخيص داده شود و روند درمان آن در مراحل ابتدايي صورت بگيرد احتمال بهبود آن بيشتر است و احتمال كارآمد بودن روش هاي درماني نيز بيشتر خواهد بود. هزينه هاي زياد مربوط به قطعه بندي دستي اسبك مغزي باعث شده است كه پژوهش هايي در حوزه قطعه بندي خودكار اسبك مغزي از تصاوير پزشكي انجام شود. يكي از مهم ترين چالشهاي سر راه براي جداسازي اسبك مغزي در تصاوير پزشكي كوچك بودن محدوده ي آن مي باشد بطوري كه تشخيص ناحيه قرارگيري اسبك مغز در تصاوير پزشكي با چشم غير مسلح دشوار است. هدف اين پژوهش ارائه ي مدلي براي قطعه بندي و تعيين مرز دقيق قرارگيري اسبك مغز در تصاوير تشديد مغناطيسي است. امروزه يادگيري عميق در بينايي رايانه داراي نقشي كليدي بوده و براي اهداف گوناگوني چون بازشناسي تصوير، تشخيص چهره، قطعه بندي و تقسيم بندي تصاوير پزشكي و... به كار مي رود. در اين پژوهش مدلي جمعي از يادگيري عميق با بهره گيري از ماسك فازي از پيش آموزش ديده براي قطعه بندي اسبك مغز ارائه شده است. براي افزايش دقت مدل در اين پژوهش يك ماسك فازي با استفاده از مدل شبكه عصبي كانولوشني ايجاد مي شود. استفاده از ماسك فازي از پيش آموزش ديده با حذف قسمت هاي اضافه تصوير تشديد مغناطيسي مي تواندپيچيدگي مدل جمعي نهايي را كاهش دهد و موجب افزايش دقت در قطعه بندي اسبك مغز شود. بعد از ماسك كردن تصاوير از يك مدل جمعي متشكل از شبكه هاي عصبي كانولوشني براي قطعه بندي اسبك مغز استفاده مي شود. مدل نهايي ارائه شده قادر است با دريافت يك تصوير تشديد مغناطيسي از مغز در صورت مشخص بودن اسبك مغز آن را با دقت قابل توجهي شناسايي كند. در ادامه بعد از ايجاد مدل با بخشي از داده هاي موجود در ديتاست، اقدام به ارزيابي مدل شد. نتيجه ارزيابي ان
Thesis summary
-
استفاده از روش برهمنگاري تصاوير ديجيتالي براي اندازهگيري تنش پسماند در روش سوراخ كاري مركزي
جلال نوري 2023روش برهمنگاري تصاوير ديجيتال در دهه اخير مورد توجه بسياري قرارگرفته است. بسياري از محققان در زمينههاي مختلف مهندسي، بهطور مثال در مهندسي مكانيك و در زمينه اندازهگيري ميدانهاي جابجايي و كرنش و در نتيجه اندازهگيري تنش نيز، پژوهشهاي گستردهايي انجام داداهاند. اين روش داراي ويژگيهاييست كه برتري آن را بر روشهاي ديگر اندازهگيري ميدان جابجايي بهخوبي نشان داده است. ويژگيهايي مانند عدم نياز به اپراتور حرفهايي، عدم نياز به پيشنيازهاي پيچيده و هزينهبر براي شروع آزمايش، عدم تأثير پذيري زياد از شرايط محيطي مانند دما و ... از جمله مزاياي اين روش ميباشد. همچنين سهولت دسترسي و ازراني تجهيزات تصويربرداري و محاسباتي و نيز پيشرفته شدن اين دو ملزوم اساسي براي روش برهمنگاري تصاوير ديجيتال هم بر افزايش قدرت اين روش و در نتيجه اشتياق محققين براي استفاده از آن افزوده است. اما اين روش عاري از نقص نميباشد. يكي از محدوديتهاي مهم در روش برهمنگاري تصوير ديجيتال، الزام به عمود بودن محور نوري آينه بر سطح قطعه است، بطوري كه اين محدوديت بهعنوان يكي از سه اصل اساسي روش برهمنگاري تصاوير ديجيتال بيان شده است. چندي از محققين با صراحت نتايج به دست آمده از اين روش، در صورتي عدم عمود بودن محور نوري دوربين بر سطح قطعه را بي اعتبار توصيف كردهاند. حال آنكه اين محدوديت باعث ناكارآمدي روش برهمنگاري تصاوير ديجيتال در موارد آزمايشگاهي و حتي صنعتي شده است. براي اندازهگيري تنشهاي پسماند با روشهاي سوراخكاري، ايجاد خطا در سوراخكاري در صورت برداشتن مته و ساير تجهيزات بهمنظور ثبت تصوير، باعث ناكارآمدي روش برهمنگاري تصوير ديجيتال ميشود. در مقالاتي ديگر براي اندازهگيري ميدان جابجايي در مواردي كه امكان عمود بودن دوربين بر سطح قطعه را ندارند، روش برهمنگاري تصاوير ديجيتال 3 بعدي را توصيه كردهاند كه خارج از حوصله بحث پژوهش حاضر است. مقالاتي ديگر نيز استفاده از ادوات اپتيك مانند آينه يا منشور را پيشنهاد دادهاند كه بايد گفت استفاده از آينه براي ثبت تصوير عمود هميشه عملي نيست. در پژوهش حاضر اقدام به رفع الزام عمود بودن محور نوري دوربين در روش برهمنگاري تصوير ديجيتال و همچنين ايجاد چينش و دستورالعملي براي اندازهگيري تنشهاي پسماند به روش سوراخكاري مركزي گامبهگام با اين شيوه، بهصورت دوبعدي (تنها با يك دوربين) است. در اين پژوهش مبا
Thesis summary
-
تحليل احساس چهره با استفاده از شبكه هاي عصبي عميق
الهام افشار 2022احساس چهره نقش مهمي در انتقال مفهوم در ارتباطات انساني دارد به طوري كه پژوهش ها نشان داده است كه تا 55% مفاهيم از طريق احساس چهره منتقل مي شود و فقط 7% آن با جملات و بيان فرد انتقال پيدا مي كند. اين موضوع بسياري از پژوهشگران را به حوزه تحليل و تشخيص احساس چهره علاقه مند كرد زيرا اين حوزه مي تواند در بسياري زمينه هاي بينايي ماشين ازجمله تعامل انسان و كامپيوتر و محاسبات احساسي به كاربرده شود. در سال هاي اخير با توجه به پيشرفت هاي روزافزون شبكه هاي عصبي، پژوهش هاي بسياري در حوزه تحليل و تشخيص احساس چهره انجام گرفته است. در اين پژوهش روشي مبتني بر طبقه بندي جمعي با استفاده از شبكه هاي عصبي كانولوشني جهت تحليل و تشخيص احساس چهره ارائه شده است. در شبكه عصبي اول، از الحاق ويژگي هاي فضايي تصوير به ويژگي هاي كلي آن جهت ايجاد نقشه ويژگي ها به عنوان ورودي مرحله كلاس بندي استفاده شده است. در شبكه دوم با همان ساختار شبكه اول، از الگوي دودويي محلي تصاوير به عنوان ورودي شبكه استفاده شده است. از آنجا كه الگوي دودويي محلي مي تواند بافت تصاوير را به خوبي استخراج كند، درنتيجه در تشخيص برجستگي ها و بيان صورت در احساسات مختلف چهره مي تواند مؤثر باشد. پس از آموزش دو شبكه پيشنهادي مذكور، جهت طبقه بندي احساس، احتمال بيشينه بين دو شبكه به عنوان خروجي نهايي در نظر گرفته مي شود. روش پيشنهادي بر روي مجموعه داده FER2013 اعمال و آزموده شده است. نتايج به دست آمده از آزمايش روش پيشنهادي بر روي مجموعه داده نشان مي دهد كه سازوكار عملكرد مطلوبي داشته و در مقايسه با روش هاي پيشين به نتايج قابل قبولي دست يافته است.
Thesis summary
-
شناسايي وطبقه بندي انواع ساختار پا مبتني بر فعاليت الكترومايوگرافي منتخبي از عضلات اندام تحتاني هنگام دويدن
معصومه وفايي حاجي آبادي 2022تجويز مداخلات درماني و عملكردي و پيش بيني اثر اين مداخلات ، همواره بخش مهمي از دانش بيومكانيك بوده است. تلاش هاي فراوان صورت گرفته در اين زمينه هميشه با چالش اساسي تفاوت هاي فردي و گستره ي وسيع پاسخ افراد به مداخلات روبرو بوده است. شايد بتوان عامل اصلي اين تفاوت ها را پيچيدگي هاي مكانيكي موجود در بدن انسان تلقي نمود . به نظرمي رسد كه نظريه ي گروه هاي عملكردي با دسته بندي افراد در گروه هاي معدود تحت عنوان گروه هاي عملكردي ، دشواري ها و پيچيدگي هاي بر شمرده شده ناشي از تفاوت هاي فردي را به نحو چشمگيري كاهش خواهد داد. جهت تعيين گروه هاي عملكردي ، به كار گيري روش هاي نوين داده كاوي يكي از نيازهاي اساسي است. پژوهش حاضر بر آن است تا با به كارگيري داده هاي الكترومايوگرافي وبا روش كلاسبندي SVM )ماشين بردار پشتيبان ( و PCA )آناليز مولفه اصلي ( براي انواع ساختارپا ،گروه هاي عملكردي را تعيين نمايد. در پژوهش حاضرداده هاي الكترومايوگرافي عضلات درشت ني قدامي، نعلي، دوقلوي داخلي، دوقلوي خارجي ، دوسرراني،پهن خارجي ونازك ني بلند، 27 نفر از دوندگان مرد مبتدي در مرحله ،جذب،پروپالژن و پيش فعاليت ثبت گرديد. براي انجام كلاسبندي داده ها و پيش بيني گروه هاي عملكردي از روش دسته بندي با نظارت ماشين بردار پشتيبان استفاده شد. كلاسبندي SVM با هفت 67 % صحت پيش بيني به دست آمد همچنين با / 22 % و در فاز پروپالژن با 2 / متغيردر فاز جذب با 80 % و در فاز پيش فعاليت با 0 كلاسبندي SVM 69 % به دست آمدكه بهترين درصد پيش بيني بود. گروه هاي عملكردي با صحت / با 70 متغير،صحت پيش بيني 0 %90 شناسايي شدند .با توجه به نتايج پژوهش حاضر با استفاده از متغيرهاي الكترومايوگرافي در حين دويدن و روش هاي نوين داده 69 %درصد كلاس بندي شد . نتايج مطالعه / كاوي ، ساختار آناتوميكي پا در حالت ديناميك در سه گروه صاف ، گود و نرمال با صحت 0 حاضر نشان مي دهد كه دسته بندي بر اساس داده هاي استاتيك نمي تواند پيش بيني دقيقي از رفتار ديناميك افراد داشته باشد . به نظر مي رسد كه طبقه بندي بر اساس پارامترهاي ديناميك براي دسته بندي پا در حالت مكانيكي مناسب تر باشد.
Thesis summary
-
تشخيص بيماري آلزايمر در تصاوير تشديد مغناطيسي (MRI) با استفاده از يادگيري عميق و نقشه برجستگي
سميرا مصطفي پور 2022بيماري آلزايمر يكي از بيماري هاي زوال مغزي است كه در آن حجم مغز كاهش يافته و نورون هاي مغزي و اتصالات بين آن ها از بين مي رود. اين بيماري منجر به اختلال در رفتار، حافظه و تعقل بيماران مي شود. تاكنون، هيچ درمان قطعي براي بيماري آلزايمر وجود ندارد اما اگر اين بيماري در مراحل اوليه شناسايي شود و درمان بيمار از مراحل اوليه بيماري آغاز گردد، كارايي روش هاي درماني بيشتر شده و تاثير بيشتري بر روند درماني بيمار خواهد گذاشت. روش هاي تصويربرداري مغزي، يكي از ابزارهاي موثر در تشخيص آلزايمر است. تاكنون روش هاي تشخيص به كمك كامپيوتر زيادي در زمينه تشخيص آلزايمر پيشنهاد شده است كه مي توانند با دريافت تصاوير پزشكي از مغز بيمار و انجام پردازش هاي تصوير، به تشخيص آلزايمر بپردازند. دراين مطالعه، رويكردي مبتني بر يادگيري عميق براي تشخيص خودكار آلزايمر از روي تصاوير MRI مغزي ارائه شده است. رويكرد پيشنهادي شامل مراحل پيش پردازش براي تبديل فرمت و رفع نويز، مرحله نقشه برجستگي براي استخراج ويژگي، مرحله نقشه رنگي براي تبديل تصاوير از حالت دوبعدي به سه بعدي و در نهايت شبكه عصبي كانولوشني است. در اين مطالعه از سه نوع نقشه برجستگي مختلف و چهار نوع معماري متفاوت براي بخش شبكه عصبي كانولوشني بهره گرفته شده كه منجر به توسعه دوازده مدل مختلف براي تشخيص آلزايمر شده است. ارزيابي روش هاي پيشنهادي بر روي صد تصوير MRI از مجموعه داده Oasis با در نظر گرفتن 20٪ از داده هاي براي آزمون، 10٪ براي اعتبارسنجي80 ٪ براي آموزش، منجر به نتايج متفاوتي بر روي دوازده مدل توسعه يافته شد. معيارهاي دقت، صحت، حساسيت و AUC محاسبه شده براي تمام مدل ها اعدادي بين 63٪ تا 76٪ را كسب كردند و بهترين مدل، با استفاده از نقشه برجستگي CovSal و معماري كانولوشني ZFNet موفق به كسب 73٪ دقت، 73٪ صحت، 73٪ حساسيت و AUC 76٪ شد. هم چنين مقايسه روش هاي پيشنهادي با مقاله پايه نشان داد كه روش پيشنهادي بهتر از مقاله پايه عمل مي كند و نتايج قابل اعتمادتري توليد مي كند.
Thesis summary
-
دسته بندي ابرنقاط سه بعدي با استفاده از يك معماري توسعه يافته عميق
ايمان احمدي 2022با توجه به گسترس روز افزون حوزه بينايي ماشين و افزايش توانايي بشر در دريافت داده هاي در ابعاد بالا، پردازش تصاوير سه بعدي به حوزه اي مهم و كاربردي تبديل شده است. از طرفي ظهور ابرنقاط و نيز حسگرهايي كه قدرت دريافت اين نوع داده را دارا مي باشند گرايش پژوهشگران را به اين زمينه ي پژوهشي بسيار افزايش داده است. شايان ذكر است كاربرد فراوان در بينايي اتوموبيل هاي خودران، ربات ها، پهبادها ، واقعيت مجازي و بسياري از حوزه هاي نوين، توجه بسياري از صنعتگران را به اين زمينه جلب كرده است. البته حجم زياد داده ها و محدود بودن ويژگي هاي قابل پردازش، دشواري هاي بسياري براي حل مسائل گوناگون ابرنقاط ايجاد كرده است. به صورت پيش فرض ما تنها قادر به استفاده از سه مختصه ي x، y و z هستيم و مي بايد مدلي طراحي كنيم كه با تكيه بر اين سه مختصه ، قابليت بالايي در تصميم گيري داشته باشد. پيش از اين و در كوشش هاي انجام شده توسط پژوهشگران حوزه ي ابرنقاط، توانايي استخراج ويژگي هاي سراسري محقق شده است . در روش پيشنهادي تلاش شده تا در كنار لحاظ شدن ويژگي هاي سراسري، به ديگر ويژگي هاي قابل استخراج توجه گردد. به همين منظور ماژولي ارائه شده است كه قادر است نسبت هر نقطه را با نقاط دور دست نيز به دست آورد و به شكلي سلسله مراتبي ويژگي هاي نسبي نقاط را استخراج نمايد وبه شبكه بيافزايد. اين عمليات به سه شكل و در سه مدل پيشنهاد شده است و مطابق با نتايج به دست آمده ، توانسته است به لحاظ كارآيي از بسياري ازروش هاي پيشنهادي مطرح حوزه ابرنقاط پيشي بگيرد.
Thesis summary
-
دسته بندي اراضي در تصاوير ماهواره اي با استفاده از روش هاي يادگيري عميق
فاطمه اميدي خواه 2022تهيه تصوير از زمين و جمع آوري اطلاعات مبتني بر مكان، از گذشته هاي دور تا به امروز يكي از دغدغه هاي بشر بوده است. امروزه با گسترش تجهيزات ماهواره اي و امكان تصويربرداري پيشرفته از سطح و جو زمين، پژوهش ها به سمت پردازش اين داده هاي ارزشمند سوق داده مي شوند. با توجه به كاربردهاي نظامي، محيط زيستي، شهرسازي و كشاورزي، شناسايي و دسته بندي اراضي در تصاوير سنجش از دور از پژوهش هاي بنيادي به شمار مي رود. از طرفي الگوريتم هاي يادگيري ماشين به خصوص روش هاي يادگيري عميق در حل مسائل هوش مصنوعي، سهم بسزايي داشته و تا به حال نقش مهمي را ايفا كرده اند. در اين پژوهش دو رويكرد مبني بر يادگيري عميق براي دسته بندي تصاوير ماهواره اي ارائه شد كه بر پايه انتقال يادگيري شبكه هاي كانولوشني VGG-19 و Efficient-Net هستند. در كنار اين شبكه ها از ساختار شبكه رمزگذار-رمزگشاي خودكار جهت استخراج نقشه ويژگي از تصاوير استفاده شد. شبكه هاي نهايي پيشنهادي حاصل هم نشيني يك شبكه از پيش يادگيري شده با شبكه رمزگذار خودكار هستند، كه جهت دسته بندي تصاوير ماهواره اي طراحي شده اند.. اين دو شبكه پس از پردازش تصاوير ماهواره اي به منظور بالابردن تعداد نمونه هاي آموزشي ، اصلاح كيفيت و حذف تاري از تصاوير برروي نمونه هاي تصاوير ماهواره اي اعمال شده و به دسته بندي به روش پيش بيني برچسب كلاس مربوط به تصوير مي پردازند. از مزاياي روش ارائه شده مي توان به استخراج و يادگيري ويژگي به صورت خودكار در مقايسه با مهندسي ويژگي و استخراج ويژگي از نمونه ها به روش كلاسيك اشاره كرد. تفاوت شبكه ها در عملكرد دسته بندي تصاوير ماهواره اي و نحوه استخراج ويژگي از آن ها، باعث ايجاد دو رويكرد متفاوت از هم شده است. هردو رويكرد با استفاده از مجموعه داده هاي معروف تصاوير ماهواره اي با نام هاي NWPU-RESISC45 , AID-2017 ,UCMerced ارزيابي شده و نتايج حاصل ار ارزيابي مورد بررسي قرار گرفته است. دقت رويكرد اول برپايه شبكه VGG برروي مجموعه داده هاي نامبرده به ترتيب96.30 ، 97.52 و 97.82 درصد و دقت رويكرد دوم برپايه شبكه Efficient-Net به ترتيب 97.48 ، 98.94 و 99.01 است كه عملكرد مطلوب مدل را نمايش مي دهد. رويكرد دوم به نسبت رويكرد اول، سرعت بيشتر و دقت بهتري دارد.
Thesis summary
-
توصيف تصوير با استفاده از يك معماري توسعه يافته شبكه هاي عصبي عميق
زهرا فاميل ستاري 2022چكيده: توصيف تصوير، يك زمينه تحقيق بين رشته اي بينايي ماشين و پردازش زبان طبيعي است كه توجه بسياري را به خود جلب كرده است. توصيف تصوير به عنوان يكي از كاربردهاي مورد علاقه در ساليان اخير در زمينه هاي بسياري از جمله تشخيص پزشكي، نمايه سازي تصاوير، پيوند تصوير و متن استفاده مي شود. براي توليد توصيف تصوير نياز به تشخيص اشيا مهم و ويژگي آن ها و ارتباط آن ها در يك تصوير است و همچنين بايد جملاتي توليد شوند كه از لحاظ معنايي و نحوي صحيح باشند. بر اساس نتايج مطالعات و دقت هاي گزارش شده، براي ماشين كار دشواري است تا مانند انسان توانايي درك تصوير را داشته باشد. با اين حال هوش مصنوعي زمينه اين نوع ابتكارها را فراهم كرده است. روش هاي پيشنهادي در زمينه توصيف تصوير معمولا از چارچوب رمزگذار-رمزگشا پيروي مي كنند. در اين روش هركلمه بر اساس ويژگي هاي تصوير و كلمات توليد شده قبلي ايجاد مي شود. با توجه به نتايج به دست آمده در توصيف تصوير، هنوز زمينه پيشرفت بسياري براي بهبود نتايج معيارهاي ارزيابي و توليد توصيف خوب وجود دارد. همچنين ديگر چالشي كه وجود دارد اين است كه اكثر روش هاي موجود روي قسمت بازگشتي شبكه، توليد جمله، كار كرده اند و تاثير ويژگي هاي استخراج شده را ناديده گرفته اند. در اين پژوهش به منظور توليد توصيف تصوير از چارچوب رمزگذار-رمزگشا استفاده شده است. بخش رمزگذار مدل از ResNet براي استخراج ويژگي هاي كلي استفاده مي كند. و بخش رمزگشا از سه بخش مهم: Attention-LSTM، Attention-Layer، Language-LSTM تشكيل شده است. سازوكار توجه از شواهد محلي براي نشان دادن بهتر ويژگي ها و استدلال در توليد توصيف تصوير استفاده مي كند. روش ارائه شده توانسته است معيارهاي رايج ارزيابي ROUGEو METEOR را به خوبي بهبود دهد.
Thesis summary
-
تشخيص بيماري از روي تصاوير شبكيه چشم با استفاده از تكنيك هاي يادگيري عميق
سيامند اوستان 2021در بسياري از بيماري ها در مراحل اوليه علائم آن در شبكيه چشم ظاهر مي شود. افزايش حجم تصاوير و پيچيدگي تشخيص آن ها به حدي سريع است كه تخصص انساني براي تفسير آن ها كافي نيست. هوش مصنوعي نويدبخش آينده روشني براي تشخيص برخي بيماري هاي شايع وابسته به ديتاست هايي است كه شامل ميليون ها تصوير مي باشد. بنابراين بررسي شبكيه چشم به وسيله روش هاي اتوماتيك نقش مهمي در تشخيص زودهنگام بيماري دارند. بعضي از اين روش ها مبتني بر استخراج ويژگي به صورت دستي از تصاوير شبكيه مي باشند. به صورت كلي اگر از الگوريتم هاي يادگيري ماشين براي طبقه بندي استفاده شود ابتدا نياز به مهندسي دستي ويژگي هاي مهم تصوير مي باشد. از طرف ديگر اخيراً روشي جديد براي تشخيص و طبقه-بندي تصاوير بدون نياز به استخراج ويژگي ها به صورت دستي بانام شبكه هاي عصبي كانولوشن ارائه شده است و همچنين مي تواند حجم زيادي وردي را براي طبقه بندي دريافت كنند..براي اين منظور در اين پايان نامه ابتدا تلاش شده تا با استفاده از شبكه هاي عميق يك مدل مطلوب براي تشخيص بيماري از روي شبكيه چشم ارائه مي شود. سپس با استفاده از ديتاست هاي موردنظر مورد ارزيابي قرار داده مي شود.
Thesis summary
-
تشخيص نويسنده براساس آناليز دست خط با استفاده از يادگيري عميق
عذرا صولتي دالكي 2021چكيده: در دنياي امروز حجم زيادي از اسناد كاغذي موجود توسط دوربين ها و اسكنرها به اسناد ديجيتال تبديل مي شوند. ذخيره سازي، بازسازي و مديريت كارآمد اين آرشيوهاي تصويري، در بسياري از برنامه ها نظير اتوماسيون اداري و كتابخانه هاي ديجيتالي داراي اهميت ويژه اي هستند. در نتيجه دستيابي به الگوريتم هاي موثر به منظور آناليز تصاوير ديجيتال اسناد يك نياز مبرم و اساسي مي باشد. شناسايي نويسنده توسط آناليز كردن اسناد به يكي از چالش هاي جالب در مسائل پردازش تصوير و شناسايي الگو تبديل شده است. وابستگي به نوع دست خط، تفاوت ساختاري و گونه هاي متفاوت نوشتاري در افراد متفاوت از يك سو و كيفيت تصاوير حاصل شده نيز از سوي ديگر مسئله شناسايي نويسنده را با مشكل مواجه كرده است. تاكنون روش هاي زيادي براي حل مسئله شناسايي نويسنده ارائه شده است كه در ميان اين روش ها يادگيري عميق يكي از موفق ترين روش ها براي كمك به حل اين مسئله بوده است. ما نيز در اين پژوهش يك الگوريتم يادگيري عميق با كمك شبكه هاي عصبي كانولوشني ارائه داده ايم. در اين پژوهش از يك شبكه عصبي كانولوشني عميق استفاده نموده ايم كه اين شبكه به دليل دارا بودن لايه هاي كانولوشني تا حدي كه سبب وقوع سرريز در شبكه نشود به استخراج ويژگي هاي بهينه تر از تصاوير ورودي ما كمك شاياني مي كند. ساختار و رويكرد ما شامل سه مرحله پيش پردازش، استخراج ويژگي و طبقه بندي مي باشد. در مرحله پيش پردازش به استخراج تكه هايي با سايز يكسان از نقاط مختلف تصوير با هدف يكسان نمودن سايز ورودي هاي شبكه و افزايش داده ها مي پردازيم، سپس به منظور بهبود كيفيت تصوير، تصاوير را نرمال سازي نموده و از يك فيلتر گاوسي براي حذف نويز و آستانه اتسو براي جداسازي متن از پس زمينه استفاده كرده و در نهايت تصاوير حاصل شده به منظور استخراج ويژگي خودكار به يك شبكه عصبي كانولوشني عميق داده شده است. معماري شبكه كانولوشني استفاده شده تركيبي از چندين لايه كانولوشني است كه با سه سايز مختلف و به صورت عميق مورد استفاده قرار گرفته است. در آخرين مرحله ويژگي هاي استخراج شده توسط لايه اتصال كامل طبقه بندي ميشوند. همچنين در اين پژوهش چندين روش ديگر براي طبقه بندي بر روي ديتاست CVL اعمال گرديده است و نتايج حاصل شده از آن ها مورد بررسي و ارزيابي قرار گرفته است. مدل نهايي توسط معيارهاي مختلف طبقه بندي ار
Thesis summary
-
كنترل هوشمند چراغ راهنما با استفاده از شبكه عصبي عميق
پوريا ملكي 2021افرايش جمعيت شهري در سالهاي اخير رشد چشمگيري داشته است بهطوريكه حملونقل ترافيك شهري و برونشهري به يك چالش در زندگي تبديلشده است و ازاينرو كنترل و مديريت ترافيك اهميت بسيار بالايي يافته است. يكي از مهمترين علتهاي ايجاد ترافيكهاي شهري و بعضا برونشهري عدم مديريت مناسب تقاطعها ميباشد. لذا در اين پاياننامه به كمك به شيوه مديريت مناسب توالي فازهاي چراغهاي راهنمايي و رانندگي در يك تقاطع چهار (ITS) سيستمهاي حملونقل هوشمند مسيره به كمك عامل هوشمند و با شيوه يادگيري تقويتي (يادگيري كيو به كمك شبكه عصبي عميق) سعي شده است تا ترافيك عبوري از تقاطع به شيوهاي مديريت گردد كه باعث كاهش زمان معطلي وسايل نقليه و درنتيجه بهبود ترافيك گردد. بهمنظور آموزش و ارزيابي عملكرد عامل هوشمند كه براي كنترل چراغهاي راهنمايي و رانندگي مورداستفاده قرارگرفته است، از محيط SUMO شبيهسازي و بهمنظور شناسايي ترافيك منتهي به تقاطع از هر مسير از روش پردازش تصاوير ويديويي به كمك شبكههاي عصبي عميق (الگوريتم يولو نسخه 4) استفادهشده است. براي آموزش الگوريتم يولو از تصاوير ديتاست آزاد گوگل در 6 كلاس تصاوير (خودرو سواري، اتوبوس، موتورسيكلت و ...) استفاده گرديده است.در اين پاياننامه حالتها در محيط بهصورت گسسته سازي شده از سطح جاده تعريفشدهاند تا عامل بتواند در زمانهاي خاص مانند ساعتهاي پيك ترافيك با محاسبه سريع تابع پاداش كه بر اساس زمان انتظار وسايل نقليه تعريفشده است يك درك سريع و درعينحال كامل از محيط پيدا كند يعني به عبارتي اطلاعات دريافت شده توسط عامل از محيط شامل اطلاعات مهم و كاربردي ميباشد كه حجم اين اطلاعات نسبت به ساير كارهاي انجامشده در اين حوزه كاهش پيداكرده است و اين امر باعث كاهش زمان محاسباتي شبكه عصبي ميشود و اين امر به پيادهسازي روانتر سيستم كمك كرده است و درعينحال نتايج بهدستآمده قابلاجرا در محيط واقعي بوده و نتايج بهدستآمده از دو قسمت ذكرشده، كارايي روش بهكاررفته در اين پاياننامه را در مقابل روشهاي سنتي نشان ميدهد.همچنين استفاده از شبكههاي عصبي عميق براي دو قسمت شناسايي ترافيك و كنترل سيگنال ترافيك روش جديدي است كه در اين پاياننامه ارائهشده است كه اين توانايي را به سيستم ميدهد تا بهصورت كاربردي و در محيط واقعي پيادهسازي شود .
Thesis summary
-
تقليد بهينه حركات انسان توسط ربات با استفاده از روشهاي هوشمند
زهرا دبيري 2021ربات ها در تعامل با انسان ها نياز به آموزش و برنامه ريزي براي ارتباط آسان دارند. ربات ها بر اساس ظاهرشان انواع مختلفي دارند كه يكي از انواع مدل هاي ربات، ربات انسان نما است. ربات هاي انسان نما مي توانند با توجه به مدل يادگيري از رفتارهاي انسان تقليد كنند. اين تقليد مي تواند در تعامل بهتر انسان و ربات موثر باشد و در انجام بسياري از كارهاي متنوع و سخت به انسان كمك كند. تا به امروز روش هاي متعددي در تقليد ربات پياده سازي شده است كه به دو دسته پيوسته و گسسته تقسيم مي شوند. روش پيوسته بدون يادگيري قبلي صورت مي گيرد كه بيشتر بر روي تعادل مفاصل ربات و افزايش سرعت آن انجام مي شود. در روش گسسته تقليد با آموزش شبكه به منظور يادگيري ربات از قبل صورت گرفته و تمركز بيشتر بر روي پيش بيني حركات توسط ربات براي كاهش زمان پيش بيني و افزايش سرعت تقليد است. با وجود نتايج خوب به دست آمده در تقليد، اما هنوز چالش هايي براي پيشرفت آن همچون افزايش دقت و سرعت ربات در تقليد، افزايش تعادل ربات در حين راه رفتن و كاهش زمان تشخيص حركت انسان در تقليد وجود دارند. در اين پژوهش به منظور تقليد ربات از حركات انسان ابتدا ربات را با شبكه عصبي پيشنهادي، شبكه هاي عصبي CNN-LSTM آموزش داده مي شود. براي آموزش شبكه عصبي از تصاوير ويديويي مجموعه داده KARD استفاده شده است كه در پيش پردازش به منظور بهبود در تشخيص حركت انسان از تكنيك جريان نوري و همچنين براي جلوگيري از مشكل بيش برازش از تكنيك افزايش داده استفاده شده است. در اين پژوهش از ربات نائو به منظور اجراي روش پيشنهادي استفاده شده است. حركات جديد از حركات مجموعه داده با استفاده از محيط رابط كاربري ربات نائو به حركات تعريف شده بر روي ربات اضافه مي شود. تقليد حركت توسط ربات نائو پس از پيش بيني حركت با استفاده از يادگيري شبكه، به صورت گسسته انجام مي شود. ربات آموزش داده شده حركات انجام شده توسط انسان را تقليد مي كند كه به اين صورت ربات را به صورت گسسته براي تقليد آموزش داده شده است. نتايج پياده سازي روش ارائه شده، دقت بالا و زمان پيش بيني كمتر و افزايش سرعت تقليد ربات را در برداشته است.
Thesis summary
-
شناسايي هدف در تصاوير سنجش از دور ابرطيفي با استفاده از تكنيك هاي يادگيري ماشين
ارش غياث يزدي 2020چكيده: تصاوير كه از فواصل مختلف تصويربرداري مي شوند، به تصاوير سنجش از دور معروف هستند. شناسايي هدف از مهمترين موضوعات در زمينه هايي از جمله نظامي و كشاورزي و زمين شناسي است. تشخيص هدفي مانند هواپيما و يا پيدا كردن مين در مناطق جنگي، پيدا كردن منابع آب هاي زير زميني همگي از جمله كاربردهاي شناسايي هدف مي باشد. چون كه هر ماده اي كه جهت شناسايي در تصاوير ابرطيفي، يك طيف منحصر بفرد دارد. تشخيص به موقع و درست هدف بسيار حائز اهميت مي باشد و از آنجايي كه ممكن است انسان در تشخيص بعضي از اهداف دچار خطا بشود، به همين دليل دنبال طراحي سيستمي هوشمنديم كه بتواند بطور موثر اشيا را تشخيص بدهد. از مدل سازي هاي اخير در حوزه هوش مصنوعي در پردازش تصاوير ابرطيفي، مي توان به مدل هاي مبني بر شبكه هاي عميق عصبي و شبكه هاي عصبي كانولوشني اشاره كرد. در اين پژوهش روشي بر مبناي شبكه عصبي كانولوشني عميق براي مسئله تشخيص، طبقه بندي و شناسايي هدف در تصاوير ابرطيفي سنجش از دور ارائه شده است، كه بطور كلي از دو قسمت پيش پردازش و شناسايي تشكيل شده است. قسمت پيش پردازش شامل يك شبكه جهت پيش آموزش داده ها است و قسمت شناسايي شامل بخش اول كه با استفاده از مدل جفت پيكسلي اختلاف هر پيكسل با همسايه هايش بدست مي آيد و بخش دوم كه شامل دو طبقه بند برمبناي لايه كاملاً متصل در شبكه هاي عصبي كانولوشني عميق و ماشين بردار پشتيبان است كه هركدام از طبقه بندها عملكرد مطلوبي داشته و شناسايي و طبقه بندي تصاوير را با دقت بالايي انجام مي دهند. مدل جفت پيكسلي بدين صورت است كه اگر پيكسل مركزي با پيكسل همسايه عضو يك كلاس باشند، در كلاس مشابه و اگر عضو يك كلاس نباشند، عضو كلاس متفاوت قرار مي گيرند. شبكه اي كه جهت پيش آموزش داده ها انتخاب شده، شبكه بولترمن محدود است. وجود اين شبكه بعنوان پيش آموزش باعث تفاوت در استخراج و يادگيري ويژگي مي شود. طبقه بندي تصاوير ابرطيفي در اين پژوهش، با توجه به كلاس هاي موجود در تصوير جهت شناسايي هدف به دو كلاس "هدف و غير هدف" صورت پذيرفته است. البته با توجه به كاربرد شبكه بولتزمن محدود در رابطه با كاهش بعد، يك مقايسه بين عمكلرد اين شبكه با روش تحليل مولفه اساسي صورت پذيرفته است. در نهايت روش پيشنهادي بر روي مجموعه داده هاي Salinas و Indian Pines اعمال و آزموده شده است. نتيجه يادگيري و آزمايش روش
Thesis summary
-
قطعه بندي تومورهاي مغزي در تصاوير MRI با استفاده از تكنيك هاي يادگيري عميق
فاطمه دريكوند 2020چكيده: قطعه بندي تومور مغزي يك كار مهم در پردازش تصاوير پژشكي است. تومورها شكل، اندازه و كنتراست مختلفي دارند و مي توانند در هر ناحيه از مغز ظاهر شوند، از طرف ديگر بخاطر پيش بيني سخت و هزينه هاي درمان و پيگيري زياد، فشار اقتصادي و اجتماعي قابل توجهي به همراه دارند. بنابراين تشخيص و شناسايي تومورها به عنوان يك گام اوليه براي برنامه ريزي درمان و بهبود كيفيت و اميد به زندگي در بيماران توموري، از اهميت حياتي برخوردار است. امروزه مدل هاي مختلفي با استفاده از الگوريتم هاي كامپيوتري و هوش مصنوعي براي مساله قطعه بندي تومور مغزي در تصاوير MRI ارائه شده است كه از بين آنها تكنيك هاي يادگيري عميق نتايج بهتري در مقايسه با تكنيك-هاي غيريادگيري عميق ارائه داده اند. در اين پژوهش يك الگوريتم كاملا خودكار بر مبناي شبكه هاي عصبي كانولوشنال با رويكرد يادگيري عميق براي مساله قطعه بندي تومور مغزي ارائه شده است كه يك روش مبتني بر تكه و شامل مراحل پيش پردازش و پس پردازش است. معماري شبكه عصبي مدل پيشنهادي تركيبي از چند زيرشبكه عصبي كانولوشني است كه از ويژگي هاي محلي و سراسري بافت مغز بطور همزمان استفاده مي كند. تصاوير ورودي پس از پيش پردازش به تكه هايي با اندازه يكسان تقسيم مي شوند و به عنوان ورودي به شبكه ارسال مي شوند. شبكه در نهايت به پيكسل مركزي هر تكه يك برچسب نسبت مي دهد. در مدل پيشنهادي بجاي لايه كاملا متصل از يك پياده سازي كانولوشني لايه اتصال كامل استفاده شده است كه باعث كاهش تعداد پارامترهاي شبكه و در نتيجه افزايش سرعت مدل تا چندين برابر مي شود. مدل پيشنهادي با استفاده از تصاوير دو مداليته T1 و FLAIR از دو مجموعه داده BRATS2017 و BRATS2013 مورد ارزيابي و آزمايش قرار گرفت و دقت نتايج با استفاده از معيارهاي ضريب تاس، حساسيت و تشخيص پذيري براي سه كلاس تومور شامل كل تومور، هسته تومور و تومور پيشرفته سنجيده شد.. نتايج كمي و كيفي حاصل از پياده سازي مدل ارائه شده براي دو مجموعه داده عملكرد قابل قبول روش پيشنهادي را در مقايسه با حالات state of the art مساله قطعه بندي نشان مي دهد.
Thesis summary
-
سيستم پيشنهاد دهنده ي هوشمند مبتني بر تكنيك هاي يادگيري ماشين
محمد جمالي دوگاهه 2020سيستم هاي توصيه كننده ابزار هاي موثر جهت پالايش اطلاعات هستند كه به دليل افزايش سطح دسترسي به اينترنت، تمايل به شخصي سازي و تغيير عادات و علايق كاربران به مرور زمان، استفاده از آن به امري رايج تبديل شده است. هرچند كه سيستم هاي موجود پيشنهادات مورد قبول و مناسب ارائه مي دهند اما همچنان داراي مشكلاتي نظير دقت، مقياس پذيري، و شروع سرد هستند. يادگيري ضرايب پنهان نقش مهمي را در سيستم هاي پيشنهاد دهنده ي مشاركت محور ايفا مي كند. فضاي پنهان ترجيح كاربران به استفاده از محصولات را در قالب ضرايب پنهان مدل مي-كند. سيستم هاي سنتي ضرايب پنهان را با استفاده از عامل بندي ماتريس آراي كاربران، بر روي محصولات يادگيري مي كنند. براي جبران كمبود اين روش در پژوهش هاي جديد از توابع مختلفي براي انتقال داده ها به فضاي پنهان از جمله فاصله ي اقليدسي به جاي ضرب نقطه اي استفاده شده است. استفاده از فاصله ي ماهالونوبيس يك روش مطرح براي جبران خطاي فاصله ي اقليدسي در فضا هايي با ويژگي هاي وابسته است اما آزمايشات انجام شده نشان مي دهد كه مدل هاي مورد استفاده براي تحليل عامل هاي پنهان بسيار حساس به مقادير پارامتر ها هستند در نتيجه با توجه به پيچيده تر شدن رابطه ي بين متغيير ها، استفاده ي مستقيم از فاصله ي ماهالانوبيس به بهبود فرايند تحليل عامل هاي پنهان كمك نمي كند. در اين پژوهش با جايگزيني معكوس تابع انتقال در روش مبتني بر فاصله ي اقليدسي با فاصله ي ماهالانوبيس براي بهبود فرايند انتقال و تفكيك فرايند آموزش پارامتر هاي تابع انتقال و معكوس تابع انتقال براي حل مشكل حساسيت به مقادير پارامتر ها، همچنين ارائه ي يك شبكه ي عصبي مبتني بر فاصله ي اقليدسي براي انتقال داده ها به فضاي معني، دو روش جهت بهبود فرايند تحليل عامل هاي پنهان ارائه مي دهيم.
Thesis summary
-
ارائه ي روشي براي تشخيص توده ي سرطان سينه از تصاوير ماموگرافي مبتني بر روش هاي هوشمند فازي
مروي الخراز 2019سرطان پستان شايع ترين سرطان در زنان تشخيص داده شده است كه اگر در مراحل ابتدايي بيماري تشخيص داده شود، احتمال بهبود كامل از بيماري بسيار بالاست و باعث كاهش تلفات جاني اين بيماري مي شود. ماموگرافي يك نوع عكس راديوگرافي از بافت سينه است. پزشك متخصص براي تشخيص توده هاي غير قابل لمس و بسيار كوچك پستان، تصاوير ماموگرافي را بررسي مي كنند. مشاهده بصري اين تصاوير و بررسي آن ، تنها ابزار پزشك براي تشخيص توده است، كه در پي آن تأثير خطاي انساني روي تشخيص توده ها را خواهد داشت. از اين رو راه اندازي يك سيستم CAD براي قطعه بندي توده، به عنوان دومين عقيده در شناسايي توده ها و كمك به متخصصين پزشكي، گامي مهم و ضروري در اين زمينه به شمار مي رود. در اين پژوهش، سيستمي خودكار براي قطعه بندي و تشخيص محل دقيق و اندازه و مرز توده هاي سينه با استفاده از پردازش تصوير، يادگيري ماشين و روش هاي فازي، طراحي و پياده سازي شده است. در سيستم پيشنهادي، ابتدا عمليات پيش پردازش به منظور افزايش كنتراست تصوير و سپس حذف نويزهاي موجود در تصاوير انجام شده است. پس از آن در فاز اول قطعه بندي، به منظور رسيدن به دقت بالا در قطعه بندي، از الگوريتم قطعه بندي Grow Cut استفاده شد. براي خودكار كردن انتخاب نقاط Seed الگوريتم Grow Cut، از مراكز خوشه هاي خوشه بند FCM به عنوان نقاط Seed اوليه، بهره گرفته شد. در فاز دوم پژوهش، استخراج ويژگي با استفاده از روش هاي فليتر گابور، هيستوگرام گراديان هاي جهت دار، الگوي دودويي محلي و ماتريس هم رخداد سطح خاكستري انجام گرفت. دليل استفاده از اين ويژگي ها، ايجاد مجموعه اي از انواع ويژگي هاي بافت، ويژگي هاي هندسي و ويژگي Intensity است كه نتيجه ي آن بررسي همه جانبه تفاوت هاي توده و بافت سالم سينه خواهد بود. در ادامه دسته بندي پيكسلي براي قطعه بندي تصوير، با دو دسته بند ماشين بردار پشتيان با كرنل polynomial و K نزديكترين همسايه، صورت گرفت. در گام نهايي، تركيب الگوريتم Grow Cut با دو دسته بند SVM و KNN ، طراحي سيستم پيشنهادي را تكميل مي كند. نتايج بدست آمده از سه روش، به روش رآي اكثريت براي دسته بندي داده ها و در نهايت قطعه بندي نهايي توده، با هم تركيب شدند. در پايان با استفاده از فيلتر اكثريت گام پس پردازش انجام شد. ارزيابي اين پژوهش روي پايگاه داده mini-MIAS انجام شد كه نتايج آزمايشات و
Thesis summary
-
تعيين گروه هاي عملكردي هنگام راه رفتن براساس ويژگي هاي فشار كف پايي
زانيار محمدي 2019تجويز مداخلات درماني و عملكردي و پيش بيني اثر اين مداخلات ، همواره هدف اصلي و نهايي دانش بيومكانيك بوده و هست. تلاش هاي فراوان صورت گرفته در اين زمينه هميشه با چالش اساسي تفاوت هاي فردي و گستره ي وسيع پاسخ افراد به مداخلات روبرو بوده است.شايد بتوان عامل اصلي اين تفاوت ها را پيچيدگي هاي مكانيكي موجود در بدن انسان تلقي نمود. نظريه ي گروه هاي عملكردي با دسته بندي افراد در گروه هاي معدود تحت عنوان گروه هاي عملكردي ، دشواري ها و پيچيدگي هاي بر شمرده شده ناشي از تفاوت هاي فردي را به نحو چشمگيري كاهش خواهد داد.جهت تعيين گروه هاي عملكردي، نياز به كار گيري روش هاي نوين داده كاوي است. كه در اين پژوهش داده هاي فشار كف پايي 280 نفر از دانشجويان پسر دانشگاه بوعلي سينا در مرحله استقرار راه رفتن با استفاده از فوت اسكن محاسبه شد.مولفه هاي فشار كف پايي به عنوان درون داد طرح خود سازمان ده (SOM) استفاده شد .سپس آزمودني ها با استفاده از روش خوشه بندي K-means به سه گروه دسته بندي شدند. اين داده هاي گروه بندي براي تمرين هسته مركزي دستگاه بردار پشتيبان (SVM) به كار گرفته شد و در مرحله بعد با استفاده از همين SVM تمرين داده شده آزمودني ها در دو حالت كف پاي نرمال و غير نرمال دسته بندي شدند و صحت گروه بندي با روش اعتبار سنجي متقابل تعيين شد .گروه هاي عملكردي با صحت 95% شناسايي شدند .با توجه به نتايج پژوهش حاضر با استفاده از مولفه هاي فشار كف پايي در حين راه رفتن و روش هاي نوين داده كاوي ، ساختار آناتوميكي پا در حالت ديناميك در سه گروه صاف ، گود و نرمال با صحت 97% درصد كلاس بندي شد .شناسايي اين گروه ها و تعيين ويژگي هاي آن ها براي پيش بيني اثر مداخلات و تجويز مداخله مناسب بسيار حائز اهميت است
-
برچسب گذاري تصاوير با استفاده از شبكه مولد رقابتي
دانيال ابراهيم زاده 2019امروزه با رواج رسانه هاي اجتماعي و دوربين هاي ديجيتال، تصاوير ديجيتال براي عموم مردم بيشتر قابل دسترس است. بيشتر كاربران رسانه هاي برخط مانند Flicker و instagram مايلند تصاوير خود را با آشنايان و دوستان خود به اشتراك بگذارند. معمولا زماني كه كاربران تصاوير خود را به اشتراك مي گذارند از كلماتي كوتاه براي توصيف آن تصوير استفاده مي كنند، اين فرآيند «برچسب زدن تصاوير» يا «تگ زدن تصاوير» مي باشد. يك سيستم خودكار تگ زننده بايد بتواند براي تصوير تگ هاي مناسب آن را به دست بياورد. «برچسب زدن تصاوير» به صورت خودكار يكي از مسائل مهم و كاربردي در حوزه پردازش تصوير است. برچسب زدن تصاوير داراي كاربرد هايي است كه از آنها در زمينه توسعه كارهاي كامپيوتري استفاده مي شود. از جمله اين كاربردها مي توان به جستجوي سريع تصاوير به كمك برچسب ها، افزايش كيفيت جستجو در موتورهاي جستجو، افزايش تعداد بازديدكنندگان سايت و افزايش كيفيت در اشتراك گذاري تصاوير اشاره كرد. عمل تگ زدن تصوير به طور كلي به سه صورت مي تواند انجام شود: 1) به صورت دستي كه كاربر خود براي تصوير تگ مي زند؛ 2) به صورت نيمه خودكار كه يك نرم افزار به كاربر براي تگ زدن كمك مي كند؛ 3) به صورت خودكار كه نرم افزار تگ تصوير را مي زند. براي تگ زدن تصوير نياز است تا محتواي تصوير به خوبي شناسايي شود. براي درك محتواي تصوير بايد ويژگي هاي مناسب از تصوير شناسايي شود. براي شناسايي ويژگي ها مي توان از تكنيك هاي مختلف يادگيري ماشين مانند شبكه هاي عصبي عميق و ... استفاده كرد. موضوع قابل اشاره در اينجا استفاده از شبكه RBM و شبكه عصبي مولد رقابتي است براي ايجاد تگ براي تصاوير است. به طور ضمني در شبكه مولد رقابتي دو مدل مولد و جداكننده به صورت رقابتي آموزش داده مي شوند. اين دو شبكه در كنار يكديگر در يك روند رقابتي آموزش ديده و سعي در توليد داده ها با كارايي بالا دارند. اين كار بر روي مجموعه داده هاي Cifar100 و Corel10k مورد آزمايش قرار مي گيرد و نتايج به دست آمده نشان مي دهد كه مدل طراحي شده در بين مدل هاي مولد نتايج بهتري به همراه داشته است. همچنين از تصاوير توليد شده توسط شبكه مولد براي بحث افزايش داده استفاده شده و برچسب گذاري انجام مي شود كه موجل افزايش دقت به دست آمده مي شود.
Thesis summary
-
دسته بندي تومورهاي مغزي در تصاوير MRI با استفاده از تكنيك هاي يادگيري عيمق
فاطمه بشيرگنبدي 2019چكيده: با پيشرفت روزانه علم هوش مصنوعي در زمينه هاي مختلف به خصوص زمينه هاي پردازش تصاوير پزشكي، مسئله آناليز تصاوير تومور مغزي برخلاف اهميت ويژه اي كه در سلامتي و حيات انسان ها دارد، كماكان به صورت يك مسئله دردست بررسي در مجامع علمي است. تشخيص و بررسي زودهنگام تومور مغزي در صدر مسائل بررسي تومور قرار داشته و امروزه مدل هايي مبني بر الگوريتم هاي پيشرفته كامپيوتري جهت حل اين مسئله حياتي ارائه شده اند. از مدل سازي هاي اخير در حوزه هوش مصنوعي در پردازش تصاوير پزشكي، مي توان به مدل هاي مبني بر شبكه هاي عميق عصبي و شبكه هاي عصبي كانولوشني اشاره كرد. دراين پژوهش روشي بر مبناي شبكه عصبي كانولوشني عميق براي مسئله تشخيص، دسته بندي و درجه بندي تومور مغزي در تصاوير مغزي ام آرآي ارائه شده است، كه به طوركلي از دو قسمت پيش پردازش و دسته بند تشكيل شده است. قسمت دسته بندي شامل دو دسته بند برمبناي شبكه هاي عصبي كانولوشني عميق است كه هركدام از دسته بندها عملكرد مطلوبي داشته و دسته بندي تصاوير را با دقت بالايي انجام مي دهند. اين دو دسته بند از نظر ساختار لايه اي و معماري شبكه شبيه به هم بوده اما از نظر نحوه آموزش قسمت هاي شبكه بايكديگر متفاوتند كه اين امر باعث تفاوت در استخراج و يادگيري ويژگي مي شود. هر دسته بند از دو زيرشبكه تشكيل شده كه زيرشبكه هاي دسته بند اول، زيرشبكه اتوانكدر و زيرشبكه عصبي كانولوشني هستند و زيرشبكه هاي دسته بند دوم، شامل زيرشبكه دكانولوشني و زيرشبكه عصبي كانولوشني هستند كه تفاوت در نحوه آموزش اين زيرشبكه هاست كه، تفاوت در عملكرد كلي دسته بند را شامل مي شود. دسته بندي تصاوير مغزي در اين پژوهش، با توجه به كلاس هاي تصاوير مورد دسته بندي به چند شكل صورت پذيرفته است. امام مهم ترين و كلي ترين شكل دسته بندي در اين پژوهش، تشخيص، دسته بندي و درجه بندي تصاوير تومور با استفاده از يك دسته بند يكپارچه است كه تصاوير مغزي ام آرآي را به كلاس هاي "مغز نرمال و بدون تومور، مغز داراي تومور منينژيوما، مغز داراي تومور پيتوتاري، مغز داراي تومور آستروسيتوما، مغز داراي تومور گليوما پيشرفته و مغز داراي تومور گليوما ساده" تقسيم بندي كند. درنهايت روش پيشنهادي برروي مجموعه داده هاي cheng، Brats 2017، IXI، و Hazrat-Rasool Hospital، اعمال و آزموده شد. نتيجه يادگيري و آزمايش روش پيشنهادي بر اي
Thesis summary
-
تعيين گروه هاي عملكردي با استفاده از ويژگي هاي فشار كف پايي حين دويدن
زهرا دهقاني سيدي 2019قابليت و برخورداري از قدرت پيش بيني در مباحث علوم ورزشي، اين امكان را فراهم مي كند كه علاوه بر تأثير در كيفيت زندگي، ريسك ابتلا به صدمات عضلاني و اسكلتي را كاهش يابد. براي مثال، دانش بيومكانيك از طريق پيش بيني پاسخ هاي احتمالي به مداخلات و متغيرهاي مكانيكي در پي ارتقاء سطح زندگي بطور كلي و پيشگيري از آسيب هاي ورزشي و حركات انسان است. با وجود اين، تغييرپذيري بسيار زياد در داده هاي بيومكانيكي و تفاوت هاي فردي همواره به عنوان چالشي جدي، پيشروي محققين و دانشمندان اين حوزه بوده است. بنابراين، دقت در اندازه گيري هاي بيومكانيكي داده ها از يك سو و به-كارگيري روش هاي نوين تحليل داده ها از سوي ديگر، قادر است تا حدي تغيير پذيري و تفاوت هاي فردي را از طريق معرفي وشناسايي گروه هاي عملكردي كاهش دهد. يافتن گروه هاي عملكردي در عمل مي تواند پاسخ هاي متفاوت بيومكانيكي تعداد كثيري از افراد را در قالب چند دسته معدود خلاصه نمايد. اين مزيت سبب نزديكي به هدف غايي بيومكانيك يعني پيش بيني اثر و تجويز مداخلات براي عملكرد مناسب حركات انسان و به تبع آن كاهش اختلالات و آسيب ها مي شود. پژوهش حاضر بر آن است تا با بكارگيري داده هاي كينتيك (ايمپالس، بيشترين فشارونيرو ) و با روش كلاس بندي SVM ) ماشين بردار پشتيبان) براي انواع پا گروه هاي عملكردي تعريف نمايد. در پژوهش حاضر 90 آزمودني زن شركت كردند. براي ثبت آزمون از دستگاه RsScan كه در طول مسير 16 متري محل انجام آزمون نصب شده بود استفاده شد. براي انجام كلاس بندي داده ها و پيش بيني گروه هاي عملكردي ازروش دسته بندي بانظارت ماشين بردار پشتيبان استفاده شد. كلاس بندي SVM در حالت خطي با متغير فشار و ايمپالس59٪ و با متغير نيرو 57٪ دقت پيش بيني بدست آمد، همچنين در svm غيرخطي چند جمله اي درجه يك با متغير فشار64٪ ،نيرو و ايمپالس 62٪ دقت گزارش شد و در svm چندجمله اي درجه دوبا متغير فشار 58٪ ، با متغير ايمپالس 53٪ و در نهايت با متغير نيرو 73٪ دقت پيش بيني محاسبه شد.و با هر سه متغير در SVM چندجمله اي درجه دو به 78٪ دقت در پيش بيني رسيديم، كه بهترين درصد پيش بيني بود. نتايج مطالعه حاضر نشان مي دهد كه دسته بندي براساس داده-هاي استاتيك نمي تواند پيش بيني دقيقي از رفتارديناميك افراد داشته باشد. براي بررسي ديناميك پا به نظرمي رسد كه طبقه بندي براساس پارامترهاي ديناميك
-
طبقه بندي تصاوير ابرطيفي مبتني بر روش هاي محاسبات نرم با استفاده از داده هاي برچسب خورده محدود
مجيد راه بر 2019تصاوير ابرطيفي از جمله تصاوير هوايي به شمار ميروند كه تجزيه و تحليل آنها يكي از زمينههاي پركاربرد در حوزه سنجش از دور به حساب ميآيد. برخي كاربردهاي اين تصاوير در گروه مسائل دستهبندي قرار ميگيرند. دو چالش اصلي در رابطه با دستهبندي اين تصاوير مطرح است: اول، براي دستهبندي اين تصاوير نمونههاي آموزشي كمي در دسترس است كه اين موضوع در كنار ابعاد بسيار زياد دادههاي ابرطيفي مشكلاتي در دستهبندي ايجاد ميكند. دوم، عواملي نظير نويزهاي سنسور و مواد تشكيل دهنده اتمسفر باعث بروز مشكل تغييرات طيفي ميشوند كه موجب چالش برانگيز شدن شناسايي كلاسها و تخصيص نمونهها به آنها ميشود. با پيشرفتهاي اخير در زمينه يادگيري ماشين، شبكههاي عصبي به عنوان روشي كارآمد براي حل مسائل مختلف شناخته ميشوند. در اين پژوهش يك روش دستهبندي طيفي-مكاني تصاوير ابرطيفي مبتني بر شبكه عصبي كانولوشني و مدل تصادفي ماركف ارائه شدهاست. در اين روش از تكنيكهاي افزايش داده نظير، استفاده از دوران و انعكاس، افزودن نويز گوسي، و افزايش داده مبتني بر برچسب براي مقابله با مشكل تعداد نمونههاي آموزشي كم، استفاده شدهاست. جهت جلوگيري از بيشبرازش، شبكه عصبي مورد استفاده فاقد لايههاي تماما متصل بوده و در آن از نرخ حذف تصادفي بالا استفاده شدهاست. در مرحله آزمون، پس از به دست آمدن احتمال تعلق نمونههاي مختلف به كلاسها توسط شبكه عصبي، برچسبهاي نهايي با استفاده از الگوريتم min مبتني بر α-Expansion - بهبود داده ميشوند. cut كه از دو سنسور Pavia University و Salinas ،Indian Pinesروش پيشنهادي بر روي سه مجموعه داده معيار به دست آمدهاند آزمايش شد. نتايج آزمايشها نشان داد كه روش پيشنهادي در شرايط وجود مجموعه دادههاي ROSIS و AVIRIS آموزشي محدود، در دستهبندي اين سه مجموعه داده نسبت به روشهاي ديگر عملكرد قابل قبولي دارد
Thesis summary
-
دسته بندي چند برچسبه تصاوير ماهواره اي با استفاده از روش هاي يادگيري عميق
رضا محمدي مقدم 2019چكيده: با گسترش روز افزون رسانه هاي تصويربرداري هوايي و در نتيجه داده هاي ماهواره اي، نياز به الگوريتم هايي كارا براي بررسي اين تصاوير بيشتر احساس مي شود. تصاوير ماهواره اي در زمينه هاي مختلفي مورد استفاده قرار مي گيرند. يك نمونه از اين حوزه ها، نظارت و حراست از محيط زيست است. دسته بندي تك برچسبه به فرآيند اختصاص يك برچسب از ميان دسته هاي موجود به يك نمونه گفته مي شود. دسته بندي تك برچسبه از ديرباز مورد توجه محققان بوده است و نتايج مطلوبي در اين حوزه حاصل شده است. دسته بندي چند برچسبه از سوي ديگر، به فرآيند اختصاص چند برچسب (Y) به يك نمونه موجود گفته مي شود. فضاي ممكن براي تمام حالات دسته ها در دسته بندي چندبرچسبه از تركيب تمام دسته ها (2^Y) حاصل مي شود. اين فضا بسيار بزرگ است و پيچيدگي مسئله را بسيار زياد مي كند. از طرفي روش هاي مبتني بر يادگيري عميق در حوزه هاي مختلف، عملكرد مطلوبي را ازخود به نمايش گذاشته اند. در اين پژوهش، روشي كارآمد مبتني بر يادگيري عميق براي طبقه بندي چند برچسبه تصاوير ماهواره اي ارائه شده است. روش پيشنهادي از چند بخش تشكيل شده است. بخش اول شامل پيش پردازش تصاوير است. در بخش دوم شبكه اي تركيبي با استفاده از اجزاء شبكه هاي عصبي پيچشي ارائه شده است. شبكه پيشنهادي، از دوشبكه معروف در حوزه دسته بندي تك برچسبه تصاوير به نام هاي VGG19 و Densenet استفاده مي كند. به جهت پردازش ويژگي هاي خام استخراج شده، شبكه اي با استفاده از ساختار شبكه در شبكه طراحي شده است. در انتها از يك روش پس پردازش براي تعيين آستانه برچسب زني استفاده شده است. همچنين روش پيشنهادي، بر روي دو مجموعه داده با دو حوزه مجزا آزموده شد. مجموعه داده اول، مجموعه داده آمازون تحت عنوان: Planet: Understanding the Amazon from Space با محتواي تصاوير ماهواره اي است. مجموعه داده دوم، مجموعه داده PASCAL Visual Object Classes (VOC) با محتواي اشياء واقعي است. ارزيابي هاي كمي و كيفي صورت گرفته بر روي اين مجموعه داده ها، عملكرد مطلوب روش پيشنهادي را براي دسته بندي چندبرچسبه تصاوير را نشان مي دهد.
Thesis summary
-
آناليز صحنه مبتني بر ابر نقاط 3 بعدي با استفاده از تكنيك هاي يادگيري عميق
سيدمحمدمعين پيغمبرزاده 2019ابر نقطه به عنوان يك نمايش مناسب براي داده هاي سه بعدي پذيرفته شده است؛ كه بيشتر حسگرها و سنسورهاي 3-بعدي قابليت توليد اين نوع داده را دارند. با پيشرفت هاي اخير در توليد اين نوع سنسور ها، آناليز ابر نقطه تبديل به يك زمينه تحقيقاتي مهم در حوزه بينايي ماشين شده است كه طيف وسيعي از كاربردها به خصوص در حوزه رباتيك (مانند ماشين هاي خودران) را شامل مي شود. به دليل ماهيت نامنظم ابر نقاط، آناليز اين نوع داده با استفاده از الگوريتم هاي يادگيري عميق داراي چالش هاي زيادي است. جهت حل اين چالش ها، بيشتر روش هاي پيشين ابر نقاط را به داده هاي منظم سه بعدي (مانند وكسل) و يا دو بعدي (مانند تصوير) تبديل مي كنند؛ كه اين تبديلات منجر به پردازش هاي اضافي در اين روش ها خواهد شد. از اين رو، معماري PointNet با استفاده از شبكه عصبي عميق، براي آناليز مستقيم ابر نقطه خام معرفي شده است. اين معماري از مزيت هاي همسايگي براي استخراج ارتباط مكاني محلي نقاط به خوبي استفاده نكرده است. در اين پايان نامه روشي براي بهبود PointNet، با الهام از عمليات ضرب پيچشي توسط مفهوم فاصله نقطه از صفحه در فضا براي استخراج اين ارتباط فضايي محلي، بر روي داده هاي ابر نقطه ارائه شده است. روش پيشنهادي، جهت ارزيابي وظايف طبقه بندي، قطعه بندي اجزا و قطعه بندي معنايي صحنه بر روي چهار مجموعه داده ModelNet-40، MNIST، ShapeNet-Part و S3DIS اعمال شده است. نتايج نشان مي دهد كه روش پيشنهادي به كارايي قابل قبولي در مقايسه با روش هاي پيشين در تمامي وظايف دست يافته است.
Thesis summary
-
ارائه ي روشي جديد براي آناليز ابر نقاط مبتني بر تكنيك هاي يادگيري عميق
فاطمه عزيزملايري 2019چكيده: در سال هاي اخير استفاده ي داده هاي سه بعدي در انواع كاربردها از جمله رباتيك، مكانيك و خودروهاي بدون سرنشين افزايش يافته است. در اين بين، ابر نقطه به علت منعطف بودن و دسترس پذيري آن يكي از مهم ترين انواع داده ي سه بعدي محسوب مي شود. در نتيجه نياز به روش هايي كه اين نوع داده را به طور خودكار آناليز كنند رو به افزايش است. البته ابر نقطه داراي ذات نامرتبي است و هيچ گونه ساختار شبكه اي در آن وجود ندارد، همين مسئله آناليز آن را چالش برانگيز كرده است. در بين روش هاي موجود براي كاربردهاي بينايي ماشين، شبكه هاي كانوولوشني از محبوب ترين و موفق ترين روش ها هستند. گرچه، اين شبكه ها نيازمند داده ي ورودي با ساختار منظم هستند و آناليز ابر نقطه ي نامنظم به طور مستقيم توسط اين شبكه ها ممكن نيست. به همين علت اكثر محققان ابتدا داده ي ابر نقطه را به نوعي نمايش منظم تبديل مي كنند و سپس آناليز آن را انجام مي دهند. ولي اين تبديل نوع نمايش اغلب با پيش پردازش هاي سنگين و از دست رفتن اطلاعات مكاني همراه است. اخيرا تعدادي از تحقيقات جديد به آناليز ابر نقطه بدون تغيير نوع نمايش آن پرداخته اند ولي هنوز چالش هاي بسياري پيش روي آن هاست. در اين پايان نامه به بررسي مسئله ي آناليز ابر نقطه بدون تغيير نوع نمايش آن و با استفاده از شبكه هاي عصبي عميق پرداخته شده است. يكي از چالش هاي روبروي آناليز ابر نقطه ي خام، استخراج كارآمد اطلاعات ساختارهاي هندسي محلي موجود در ابر نقطه است. روش پيشنهادي يك شبكه ي عصبي پشت سرهم است كه شامل يك مرحله استخراج ويژگي هاي محلي و يك مرحله ي استخراج ويژگي نقاط مستقل است. مرحله استخراج ويژگي محلي از شبكه هاي كانوولوشني الهام گرفته شده است و مي تواند اطلاعات محلي موجود در ابر نقطه را به طور خودكار استخراج كند. اين مرحله مشابه يك لايه ي كانوولوشني داراي فيلترهايي است كه مي توانند در طي فرآيند آموزش شبكه آزادانه تنظيم شوند با اين تفاوت كه اين فيلترها از نوع ابر نقطه هستند. علاوه بر آن، به جاي عمل كانوولوشن (ضرب پيچشي)، فاصله ي هاسدورف براي استخراج ويژگي معرفي شده است كه با محاسبه ي شباهت بين فيلترها و ساختارهاي محلي ابر نقطه، ويژگي هاي اين ساختارها را استخراج مي كند. استخراج ويژگي نقاط مستقل با استفاده از پرسپترون چندلايه با اشتراك گذاري وزن ها انجام مي شود. در نهايت يك
Thesis summary
-
تحليل سينماتيك مستقيم ربات موازي با استفاده از شبكه هاي عصبي بهينه سازي شده توسط الگوريتم هاي تكاملي
فاضله توسليان 2018در اين پايان نامه به بررسي مسئله سينماتيك مستقيم ربات موازي با استفاده از شبكه هاي عصبي پرداخته شده است. يك مكانيزم موازي از يك صفحه متحرك و يك پايه ثابت تشكيل شده است كه حداقل با دو زنجيره ي سينماتيكي سري به طور موازي به يكديگر اتصال دارند. از مزاياي اين ربات ها مي توان به صلبيت و نسبت تحمل نيرو به وزن بالا اشاره كرد. همچنين معايب آن شامل كنترل پيچيده مجري نهايي و تعدد نقاط تكين در داخل فضاي كاري مي باشد. حل مسئله سينماتيك مستقيم در ربات هاي موازي يكي از چالش هاي اساسي در اين ربات ها است، زيرا براي كنترل حلقه بسته ربات موازي حل سينماتيك مستقيم ضروري است. مسئله سينماتيك مستقيم يك ربات موازي شامل پيدا كردن تمامي حالت هاي ممكن عملگر نهايي، به ازاي ورودي هاي معلوم براي مفاصل است. به دليل نبود يك فرم بسته راه حل رياضي و نيز به دست آوردن راه حل هاي سريع و كارآمد براي سينماتيك مستقيم ربات هاي موازي، استراتژي ها و روش هاي گوناگوني تا كنون معرفي شده است. در اين بين استفاده از شبكه عصبي با توجه به پردازش موازي و قابليت تصحيح يكي از روش هاي اصلي حل اين مسئله است. با اين حال، به دليل عدم توانايي محاسبات قدرتمند، به دست آوردن حل بلادرنگ ربات دشوار است. لذا در اين پايان نامه به ارائه روشي موثر براي حل مسئله سينماتيك مستقيم ربات موازي پرداخته شده است. در اين پايان نامه ابتدا ساختار و متغيرهاي حركت ربات مورد توجه قرار گرفته است و به منظور افزايش دقت و سرعت، روشي تركيبي از شبكه عصبي و تكنيك هاي مبتني بر يادگيري ماشين پيشنهاد شده است. ابتدا سينماتيك معكوس ربات براي دستيابي به مقادير مفاصل فعال بدست مي آيد. سپس نقاطي كه در فضاي كاري ربات صدق ميكنند، به عنوان ورودي و هدف الگوريتم مورد استفاده قرار مي گيرد. به منظور افزايش دقت، فضاي كاري ربات به تعدادي زير فضا تقسيم شده كه توسط كلاسبند مبتني بر ECOC زير فضاي قرار گرفته تخمين زده مي شود و سپس براي هر زير فضا با استفاده از شبكه عصبي تكاملي تخمين دقيقي از موقعيت به دست آمده است. روش پيشنهادي بر روي دو ربات سه درجه آزادي صفحه اي و چهار درجه آزادي فضايي پياده سازي شده است. در نهايت براي بررسي كارايي روش پيشنهادي، شبيه سازي مسير حركت صورت گرفته و عملكرد روش با روش هاي مرسوم ديگر مقايسه شده است. نتايج حاصل از پياده سازي نشان مي دهد كه روش
Thesis summary
-
طبقه بندي و استخراج روابط پشتيبان اجزا در تصاوير RGB-D از صحنه هاي داخلي
شكوه شليل احمدي 2018يك ربات در تعامل با محيط علاوه بر درك بصري، به درك فيزيكي از محيط نيز نيازمند است. با گسترش كاربردهاي رباتيكي نياز به درك صحنه بهتر افزايش يافته است. رابطه پشتيباني يك تعامل فيزيكي بين اجسام است كه آگاهي از آن در جابه جايي ها ضروري است. در اين پژوهش يك روش براي طبقه بندي اجزا بر اساس چارچوبي پشته اي از طبقه بندها و ويژگي-هاي ساختار پيشنهاد شد. سپس روابط پشتيبان بين اجزا براي قطعه بندي بهبود يافته براساس نتايج اين طبقه بند استخراج شد. در اين روش به منظور كاهش هزينه هاي محاسباتي از تجميع پيكسل ها در سوپرپيكسل ها و انجام محاسبات بر روي اين واحد ها به جاي محاسبات پيكسلي استفاده شد. روش پيشنهادي براي محيط هاي داخلي كه اغلب شامل صحنه هاي شلوغ و پرچالش هستند، طراحي شده است. مدل پيشنهادي با استفاده از مجموعه داده NYU-v2 آموزش و ارزيابي شد. ارزيابي نتايج نشان داد كه روش پيشنهادي با وجود سادگي و كاهش هزينه هاي محاسباتي در طبقه بندي اشيا صحنه عملكرد بسيار خوبي داشته و نتايج استنتاج روابط پشتيبان را به طور قابل ملاحظه اي بهبود داده است. اين بهبود همچنين ناشي از بهبود و يكپارچه سازي زمين و ساختار است. در اين پژوهش نشان داده شد كه با ارائه روشي مبتني بر ويژگي هاي ساختار مي توان ساختار ساختماني صحنه هاي داخلي را با موفقيت از ساير اجزا صحنه، حتي در صحنه هاي شلوغ تفكيك كرد و در نتيجه آن استنتاج روابط پشتيبان را به طور چشمگيري بهبود داد.
Thesis summary
-
ارائه يك روش تركيبي و نيمه نظارتي مبتني بر گراف براي برچسب زني خودكار تصاوير
مجتبي كردابادي 2018با رشد سريع تعداد تصاوير توليدشده در صفحات وب و شبكه هاي اجتماعي سازمان دهي و بازيابي تصاوير به روشي مؤثر و كارا به وسيله موتورهاي جستجو يكي از حوزه هاي پژوهشي فعال مي باشد. موتورهاي جستجو در بازيابي داده هاي متني دقت و سرعت مناسبي دارند و اين امر باعث شده است تا پژوهشگران جهت بازيابي تصاوير، ابتدا مجموعه دادگان حاوي تصاوير را با اطلاعات متني برچسب زني كنند و سپس بازيابي را در حوزه متن انجام دهند. برچسب زني تصاوير مي تواند به صورت دستي يا خودكار انجام گيرد. درروش دستي، برچسب زني تصاوير توسط افراد خبره انجام مي پذيرد. به دليل رشد سريع تعداد تصاوير توليدشده در صفحات وب و شبكه هاي اجتماعي، استفاده از اين روش بسيار وقت گير، خسته كننده و پرهزينه و عملاً غيرقابل استفاده مي باشد، ازاين رو روش هاي برچسب زني خودكار تصاوير معرفي شدند. در سامانه هاي بازيابي تصوير، برچسب زني خودكار تصوير به عنوان يك مرحله اوليه و پيش پردازشي در سيستم در نظر گرفته مي شود. يادگيري نيمه نظارتي نوعي از روش هاي يادگيري ماشين است كه از داده هاي برچسب دار و بدون برچسب استفاده مي كند. روش هاي يادگيري معمول به دودسته يادگيري با نظارت و بدون نظارت تقسيم مي شود. در روش هاي يادگيري بدون نظارت همه داده هاي آموزشي بدون برچسب بوده اند و در يادگيري با نظارت همه داده هاي آموزشي داراي برچسب هستند. هدف از يادگيري نيمه نظارتي اين است كه به اين پرسش پاسخ داده شود كه چگونه مي توان با تركيب داده هاي برچسب دار و بدون برچسب رفتار يادگيري را تغيير داد و الگوريتم هايي را طراحي كرد كه از فوايد اين تركيب ها استفاده كنند. يادگيري نيمه نظارتي در يادگيري ماشين و داده كاوي بسيار موردعلاقه است زيرا به آساني مي توان با داده هاي بدون برچسب در دسترس كارايي يادگيري بانظارت را با توجه به عدم دسترسي و گران بودن داده هاي با برچسب بالا برد. توجه به روشهاي يادگيري نيمه نظارتي مبتني بر گراف در سالهاي اخير رشد چشمگيري يافته است. دليل اين امر را مي توان ارائه ساختار شباهت و تفاوت براي تصاوير بر اساس گراف دانست كه در آن خواصي نظير همسايگي راس ها، فاصله و مسيرهاي بين راس ها و همچنين توازن و تراكم راس ها در نواحي گراف با مفاهيم طبيعي قابل درك براي انسان قرابت زيادي دارد.پژوهش حاضر در مورد برچسب زني تصاوير با استفاده از روش هاي يادگيري نيمه نظ
Thesis summary
-
شناسايي كنش و تعامل انسان-انسان در تصاوير RGB-D با بكارگيري تكنيك هاي يادگيري ماشين
زهرا رستمي 2018شناسايي كنش انسان يكي از موضوعات پر كاربرد و جديد در حوزه يادگيري و بينايي ماشين است كه با چالش هاي فراواني مواجه است. روش هاي زيادي براي شناسايي كنش انسان وجود كه در بين آن ها روش هاي مبتني بر يادگيري عميق كارآيي مناسب تري دارند. در بين انواع داده اي مختلف، دنباله اسكلتي كه از روي داده عمق استخراج مي شود و شامل مجموعه كوچكي از موقعيت مفاصل بدن انسان است به نحو موثري مي تواند نشان دهنده نوع كنش باشد و در عين حال نسبت به پس زمينه، تغييرات روشنايي محيط و تغييرات زاويه ديد مستقل خواهد بود. به دليل ماهيت سري زماني دنباله اسكلتي، شناسايي كنش مبتني بر دنباله اسكلتي اغلب بر مبناي شبكه هاي عصبي بازگشتي و شبكه هاي LSTM خواهد بود. شبكه هاي عصبي كانولوشن براي شناسايي كنش مبتني بر داده هاي ويدئويي با مسئله ضعف مدل كردن وابستگي هاي زماني بلند مدت موجود در كل دنباله ويدئويي مواجه هستند. با در نظر گرفتن نوع نمايشي كه به جاي استخراج مستقيم اطلاعات زماني بلند مدت در دنباله اسكلتي، دنباله را به شكل تصاوير رنگي كد كند، استفاده از شبكه هاي كانولوشن براي شناسايي كنش امكان پذير خواهد بود. روش پيشنهادي دو نوع ويژگي مكاني را بر مبناي فاصله اقليدسي و فاصله برداري موقعيت مفاصل همچنين motion بين موقعيت دو مفصل در دو فريم با اختلاف 8 گام زماني محاسبه كرده و در يك تصوير رنگي كد مي كند. اين نوع كد كردن، استفاده از شبكه هاي عصبي كانولوشن را براي شناسايي كنش امكان پذير مي كند. در اين روش ابتدا ويژگي هايي از دنباله اسكلتي نظير كنش استخراج شده، سپس هر دسته ويژگي به عنوان ورودي به يك شبكه عصبي كانولوشن ارسال مي شود. شبكه با استفاده از ورودي هاي جديد وزن هاي موجود در مدل از پيش آموزش ديده را تنظيم دقيق مي كند و در نهايت در زمان تست خروجي شبكه هاي مختلف با يكديگر تركيب مي شوند. روش پيشنهادي بر روي پايگاه داده NTU RGB+D آزمايش شده است و صحت 84.9% براي پروتكل ارزيابي cross-view و صحت 78.9% براي ارزيابي cross-subject به دست آمده است.
Thesis summary
-
تشخيص و تخمين موقعيت مفاصل از دست رفته در داده هاي اسكلتي سنسور كينكت و بررسي ناهنجاري هاي اسكلتي عضﻼني
عطيه السادات ميرمعيني 2018امروزه مﺤيﻂهاي هوشمند و سيستمهاي كنترلي ﺑا توجه ﺑه پتانسيل خود در ﺑهبود كيفيت زندﮔي انسان يكي از مﺤبوبترين حوزههاي درنتيجه ، تﺤﻘيﻘاتي ﺑشمار ميآيند. ﺑرنامههاي كارﺑردي مانند تﺤليل رفتار انساني و نظارت ارﮔونومي در مﺤيﻂ كار ﺑهصورت خودكار درآمدهاند ﺑهبود رفاه افراد ﺑا حداقل هزينه در حال اجرا ميﺑاشد .مسئلهي اصلي مﺤيﻂهاي هوشمند درك فعاليتي است كه كارﺑر انجام ميدهد تا ﺑتوانند پشتيباني مناسبي را ارائه دهند. يكي از اﺑزارهايي كه در اين زمينه از تﺤﻘيﻘات ﺑسيار موردتوجه قرارﮔرفته است حسگر كينكت ميﺑاشد .عﻼقهمندي ﺑه حسگر كينكت ﺑه دليل قيمت پايين و طيف ﮔستردهاي از كارﺑردهايي كه ﺑه همراه دارند در حال افزايش ميﺑاشد. اين اﺑزارها ﺑا ﺑهرهﮔيري از دادﮔان اسكلتي و ﺑدون استفاده از نشانگرها وضعيت قرارﮔيري ﺑدن انسان را ﺑرآورد ميكنند. مطالعات اخير نشان داده است كه مسدود شدن نواحي مختلف ﺑدن انسان ﺑا ديگر اشيا و يا حركت سريع مﻘاﺑل كينكت منجر ﺑه ﺑرآورد ناصﺤيﺤي از موقعيت مفاصل ميشود كه نتيجهي آن آناليز غيردقيق و هشدارهاي نادرست در سيستمهاي نظارتي ﺑهره ﮔيرنده از اطﻼعات كينكت ميﺑاشد. در اين پژوهش دو ﮔام اساسي ﺑراي حل چالش موجود در نظر ﮔرفتهشده است. در ﮔام اول راهكاري ﺑر مبناي مدلهاي اندازهﮔيري جهت تعيين درجهي اعتبار مفاصل استخراجشده از كينكت ارائه شده است كه ﺑهعنوان ويژﮔي اثرﮔذار ﺑه همراه موقعيت مفاصل در كﻼس ﺑند ﺑيشينه-حاشيه در نظر ﮔرفته ميشود. در ﮔام دوم ﺑر اساس ميزان اعتبار هريك از مفاصل تصميمﮔيري ميشود و مفاصل ازدسترفته) ﺑا اعتبار كم ( تشخيص داده ميشوند سپﺲ ﺑا استفاده از الگوريتمهاي اعتبارﺑخشي مفاصل صورت ميﮔيرد. نتايج حاصل از ﺑررسيهاي انجامشده نشان ميدهند ، ﺑخشﺑندي ﺑدن انسان مبتني ﺑر شبكه يادﮔيري عميق انتخاب ويژﮔيهاي مناسب در ﮔام اول جهت مﻘايسه فريمهاي متوالي نسبت ﺑه روش موجود ﺑهبود قاﺑلتوجهي در دقت كﻼس ﺑند دارد، همچنين ﮔام دوم نيز ﺑا اعمال اعتبارﺑخشي ﺑه دادﮔان تأثير ﺑسزايي ﺑر دقت متدهايي دارد كه از دادﮔان اسكلتي حسگر كينكت ﺑهعنوان ويژﮔيهاي ورودي ﺑه سيستم ﺑهره ميﺑرند.
Thesis summary
-
تشخيص حالات و ريز حالات چهره با استفاده از تصاوير و ويديوهاي RGB-D
سيدمحمدحسين موسوي 2017چهره انسان بيان كننده احساسات دروني، تفكرات و تا حدودي كسالت هاي جسمي او است. اين احساسات از طريق عضلات صورت به صورت بصري نمود پيدا مي كند. تحقيقات نشان داده است كه حالات صورت بهترين وسيله براي انتقال احساسات مي باشند. حالات و ريز حالات چهره ي افراد مي تواند در تصاوير و فريم هاي ويديويي ديجيتال موردبررسي قرار گيرند. مدت زمان تخميني رخ دادن يك حالت در چهره بين 0.5 تا 4 ثانيه و يك ريز حالت بين 0.1 تا 0.5 ثانيه است. همچنين در بعضي مراجع اين مقدار 3/1، 15/1 و 25/1 ثانيه هم بيان شده است. بديهي است براي ثبت ريز حالت ها، دريافت فريم هاي ويديويي بين 30 تا 200 فريم در ثانيه ضروري است. قبل از پيدايش حس گرهاي عمق سنج، اين عمل توسط تصاوير فقط بافت انجام مي گرفت؛ اما بعد از پيدايش حس گرهاي عمق سنج(Depth Sensor)، دقت تشخيص حالات چهره به دليل داده هاي بيشتر كه همان بعد عمق است، به شكل چشم گيري بالا رفت. اين مسئله يك دهه است كه به خوبي در اين زمينه ملموس است. تشخيص حالت چهره در تعامل انسان و ربات، پويانمايي دوبعدي و سه بعدي، روانشناسي، ارتباطات غيركلامي يا زبان بدن، تشخيص حس دروني، مسائل امنيتي مانند دروغ سنجي و ... كاربرد دارد. ويژگي هاي مورداستفاده در اين پژوهش شامل هيستوگرام جهت گراديان(HOG)، فيلتر گابور(Gabor Filter)، ويژگي هاي توانمند سرعت يافته(SURF)، رقمي ساز فاز محلي(LPQ) الگوهاي دودويي محلي (LBP) و ويژگي هار(Haar) هستند. همچنين به علت كمبود پايگاه داده تشخيص حالات چهره به قالب بافتي عمقي) RGB-D (و همچنين نقصان هاي پايگاه داده هاي موجود، پايگاه داده اي شامل 40 نفر مدل و يا Subject در سنين و جنسيت مختلف توسط حس گر كينكت نسخه ي 2 ) Kinect V.2 (جمع آوري شده كه مشكلات پايگاه داده هاي موجود با خصوصيات مشابه را تا حد قابل قبولي برطرف كرده است. از طرفي مي توان گفت اين پايگاه داده اولين پايگاه داده عمق براي تشخيص ريز حالات چهره است. لازم به ذكر است كه اين پايگاه داده، بانام پايگاه داده كينكت چهره ايرانيان و به لاتين Iranian Kinect Face Databse (IKFDB) نام گذاري گرديده است. با توجه به اينكه داده دريافتي از كينكت به دو بخش بافت (RGB) و عمق(Depth) تقسيم مي شود، يك روش استخراج ويژگي تركيبي هم براي داده هاي عمق بر اساس تغييرات فاصله پيكسلي با حس گر عمق در نظر گرفته شده است. بخشي هم تحت
Thesis summary
-
شناسايي كنش هاي انسان و درك روابط آن ها با استفاده از تكنيك هاي يادگيري ماشين در تصاوير RGB-D
زهره قادري 2017شناسايي فعاليت انسان يكي از موضوعات مهم زمينه تحقيقاتي بينايي ماشين است. شناسايي فعاليت هاي روزمره انسان در هوشمندسازي محيط زندگي كاربرد دارد. فعاليت روزمره انسان از چند كنش تشكيل مي شود كه مرز انجام كنش ها در افراد باهم متفاوت است اما روابط و ترتيبي بين آن ها وجود دارد كه در شناسايي كنش در فعاليت مؤثر است. از طرفي وجود دوربين هاي كينكت و تصاوير RGB-D به دليل داده هاي مفصل انسان، تصاوير عمق و رنگي با وضوح بالا شناسايي كنش را بهبود داده است. در اين پژوهش با بكار گيري ترتيب كنش در فعاليت در مدل يادگير نظارتي ضعيف و نيمه نظارتي و استخراج ويژگي داده هاي RGB-D به شناسايي كنش و روابط آن پرداخته شده است. براي داشتن سيستم پايدار نياز به يك استخراج ويژگي متمايزكننده است. در اين پژوهش ويژگي حالت، حركت، اطلاعاتي تصوير و اشيا با استفاده از داده مفصل و تصوير عمق و رنگي استخراج شده است كه نسبت به چرخش و نماي بدن انسان و مكان دوربين ثابت است. در مدل يادگيري ارائه شده از رگرسيون خط الراس استفاده شده است. رگرسيون خط الراس شباهت رياضي به بهينه سازي درجه دوم و محدب دارد. به همين دليل با داشتن يك بهينه سازي محدب و حاشيه به عنوان محدوديت از الگوريتم فرانك-ولف كه يك الگوريتم بهينه سازي محدب با محدوديت مي باشد استفاده شده است. جهت افزايش كارايي سيستم الگوريتم فرانك-ولف زوجي كه يك مدل آماري توسعه يافته الگوريتم فرانك-ولف است بكار گرفته شده است. الگوريتم فرانك-ولف زوجي محدوديت هاي در طول يادگيري را ذخيره مي كند و با گام مناسب نسبت به بهترين محدوديت ها بهينه ترين راه حل مسئله شناسايي كنش هاي متوالي را پيدا مي كند. ارزيابي اين روش پيشنهادي روي پايگاه داده watch-n-patch انجام و تحليل شده است و با استفاده از روش نوين الگوريتم فرانك-ولف زوجي با محدوديت ترتيب كنش نتايج قابل قبولي رو اين پايگاه داده و ساير روش هاي پيشنهادي اين پايگاه داده داشته است. اين پژوهش به شناسايي كنش هاي متوالي در فعاليت انسان با محدوديت روابط ترتيبي كنش انسان پرداخت در نتيجه هزينه زماني براي جمع آوري برچسب دقيق هر تصوير در ويديو در اين سيستم پيشنهادي وجود ندارد و اين هزينه زماني تنها با استخراج ترتيب كنش انسان در ويديو به عنوان حاشيه يك مدل نظارتي ضعيف كاهش يافت و با استخراج ويژگي متمايزكننده و ثابت نسبت به نماي بدن انسان
Thesis summary
-
اراﺋﻪي روﺷﯽﺑﺮاي اﺳﺘﺨﺮاج ﺑﺪن اﻧﺴﺎن درﺗﺼﺎوﯾﺮ وﯾﺪﯾﻮﯾﯽﺑﺎ اﺳﺘﻔﺎده از ﺗﺮﮐﯿﺐ روشﻫﺎي ﻫﻮﺷﻤﻨﺪ
زهره احمدي پور 2016انسان يك شئ مهم در تشخيص اشياء محسوب مي شود. تشخيص انسان و تفكيك آن از ساير اشياء كاري مهم و چالش برانگيز است. با توجه به اين مسئله طراحي يك سيستم براي تشخيص انسان گامي مهم و ضروري در زمينه بينايي ماشين و تشخيص الگو به شمار مي رود. به همين منظور در اين پژوهش، سيستمي براي تشخيص انسان هاي موجود در تصوير و مرز بدن آن ها با هدف بهبود دقت و سرعت پيشنهاد شده است. در اين روش ابتدا به تشخيص مستطيل محاط شامل انسان سپس به محاسبه مرز بدن پرداخته ايم. در مرحله اول با استفاده از ويژگي هيستوگرام جهت گراديان و الگوي محلي دودويي پنجره هاي كانديد توصيف شده و با استفاده از الگوريتم يادگيري ماشين بردار پشتيبان پنجره هاي شامل انسان استخراج مي شود. در نهايت براي پنجره ها با نمرهSVM مبهم يك پس پردازش انجام مي گيرد. در اين مرحله براي انتخاب پنجره هاي كانديد از الگوريتم تكامل تفاضلي استفاده شده است. در مرحله دوم با استفاده از روش قطعه بندي chan-vese شكل شبح انسان استخراج شده و استفاده از عملگرهاي مورفولوژي باعث كاهش نويزهاي موجود شده است. ارزيابي نتايج اين الگوريتم با استفاده از تصاوير مجموعه داده INRIA انجام شده است. در نهايت روش پيشنهادي با دو معيار Recall و Precision با روش هاي موجود مورد مقايسه قرار گرفته است استخراج شكل شبح انسان در اين پژوهش بر خلاف ساير روش ها در تصوير و با رويكردي جديد انجام گرفته است. نتايج تجربي نشان دهنده آن است كه الگوريتم پيشنهادي با سرعتي بالاتر نسبت به ساير روش ها با روشي نو به استخراج شكل شبح انسان از تصوير مي پردازد.
Thesis summary
-
تشخيص خودكار رفتار انسان در تصاوير ويديويي با استفاده از روش هاي كلاس بندي
ياسين معصومي 2016تشخيص و بازشناسي رفتار،به عنوان راهي كارآمد جهت شناسايي خودكار رفتار انساني، در بسياري از زمينه هاي مهم و كاربردي مانند پزشكي،جامعه شناسي و يا امنيتي مورداستفاده و توجه بسياري از جوامع قرارگرفته است. با قدرت بخشيدن به حسگرها و يادگيري ماشين،مي توان عملكرد تشخيص سامانه هاي مرتبط با بازشناسي رفتار را تقويت كرد.در چند سال گذشته،بسياري از روش ها،براي بازشناسي رفتار و حل مشكلات پياده سازي آن پيشنهادشده است كه نتايج مؤثر و چشمگيري هم به همراه داشته است، اما به دليل وجود زواياي محدود، تغييرات نور و حركت هاي مكرر دوربين، اين مسئله را به يكي از مسائل پيچيده تبديل كرده است. باوجود تعدد حالت هاي بسيار زياد براي شناسايي رفتار انساني و وجود مرز باريكي بين رفتار عادي و رفتارهاي مخرب يا غيرعادي، نمي توان ادعاي طراحي سامانه هاي خبرۀ كامل و بدون خطا را مطرح نمود و درصدد شناسايي دقيق رفتارهاي انساني بود؛ اما مي توان با بهينه سازي و طبقه بندي بهتر،اين خطا را كمتر كرد.در اين رساله به طور خاص،تشخيص و بازشناسي رفتار انساني را با استفاده از پردازش تصوير و روش هاي طبقه بندي هوشمند بررسي خواهيم نمود و به دنبال بهبود عملكرد از طريق به كارگيري روشي جديد مبتني بر روش CLLC و استفاده از شبكه هاي عصبي مصنوعي هستيم. براي طبقه بندي نيز از شبكه عصبي موجكي استفاده گرديد كه اين شبكه موفق به رسيدن به صحت بالا در طبقه بندي شد.
Thesis summary
-
ارائه ي روشي براي شناخت حركت دست به منظور تعامل پزشك با سيستم پيمايش تصاوير MRI در اتاق عمل با استفاده از حسگر كينكت
اميرحسين براتي 2016بازشناسي حركت مي تواند به عنوان آغاز راهي براي تعامل انسان و ماشين باشد. اگر ماشين ها بتوانند حركات روزانه مردم را به صورت خودكار تفسير كنند، انقلابي در حوزه بينايي ماشين به وجود مي آيد. بازشناسي حركت كاربردهاي بسياري در زمينه هاي مختلف مانند بازي هاي ويدئويي، توانبخشي حركتي سالمندان، استفاده در اتاق عمل به عنوان ابزار كمكي پزشك براي مشاهده تصاوير دارد. استفاده از دوربين هاي RGB نياز به الگوريتم هاي پيچيده براي بازشناسي حركت دست دارد. با ارائه حسگر كينكت توسط مايكروسافت، انقلابي در بازشناسي حركت و صنعت بازي هاي تعاملي رخ داد. هدف از اين پژوهش استفاده از حسگر كينكت براي بازشناسي حركت دست پزشك در اتاق عمل است. در جراحي هاي مغز، پزشك نياز دارد كه تصاوير مختلف بيمار را مشاهده كند. شيوه مرسوم براي اين كار استفاده از نگاتوسكوپ است كه مشكلاتي مانند عدم بزرگ-نمايي، تغيير كنتراست و شدت روشنايي دارد. در اين پژوهش با استفاده از كينكت XBOX One، دو روش به منظور بازشناسي حركت دست ارائه شده است. در روش اول، ويژگي هاي سينماتيكي حركت با استفاده از داده هاي كينكت استخراج مي شود و از طبقه بندهاي مختلف براي طبقه بندي حركات استفاده مي شود. با توجه به اين كه دقت اين روش به ويژگي هاي استخراج شده، نوع طبقه بند و تعداد نمونه هاي آموزشي و آزمايشي بستگي دارد، روش دوم كه مبتني بر قوانين طراحي شده براي بازشناسي حركت عمل مي كند ارائه شده است. معيارهاي دقت و يادآوري به همراه ماتريس درهم ريختگي براي ارزيابي روش-هاي پيشنهادي به كار رفته اند. نتايج آزمايشات و مقايسه آن با كارهاي پيشين انجام شده در زمينه بازشناسي حركت دست در اتاق عمل، حاكي از كارايي بالاي روش هاي پيشنهادي هستند. همچنين نرم افزار بازشناسي حركت دست در اتاق عمل بيمارستان هاي عرفان و سينا تهران حين عمل جراحي در 6 نوبت توسط 8 پزشك مورد ارزيابي قرار گرفت و نتايج نشان-دهنده ميزان رضايت پزشكان از اين نرم افزار است
Thesis summary
-
ارائه ي روشي تركيبي براي قطعه بندي تومور مغزي در تصاوير تشديد مغناطيسي(MRI) واقعي
اكرم بيات 2016تومورها توده هايي از سلول ها هستند كه در آن ها تقسيم سلولي به صورت فزاينده و غير قابل كنترل انجام مي شود. با توجه به شايع بودن بيماري تومور مغزي و مرگ و مير ناشي از آن، راه اندازي يك سيستم خودكار براي قطعه بندي تومور، گامي مهم و ضروري درزمينه ي پزشكي و درمان به شمار مي رود. به همين منظور در روش ارائه شده در اين پژوهش، قطعه بندي تومور با هدف بهبود دقت در دو بخش اصلي، قطعه بندي سراسري و قطعه بندي محلي انجام مي شود. هدف از انجام بخش قطعه بندي سراسري، يافتن تقريبي ناحيه ي موردنظر است كه از روش FCM براي انجام آن استفاده مي شود. در بخش قطعه بندي محلي ابتدا استخراج ويژگي با استفاده از روش هاي گابور، هيستوگرام گراديان هاي جهت دار، الگوي محلي دودويي، اعمال عناصر ساختاري و همچنين ويژگي هاي شدت روشنايي انجام مي گيرد. براي كاهش ابعاد بردار ويژگي و نيز كاهش پيچيدگي زماني از روش PCA براي كاهش ابعاد بهره گرفته مي شود. در ادامه دسته بندي با دسته بندهاي جنگل هاي تصادفي، ماشين بردار پشتيبان با تابع كرنل RBF و k-نزديكترين همسايه صورت گرفته و با رويكرد تركيب دمپستر-شفر تركيب شده و بدين ترتيب دسته بندي و درنتيجه قطعه بندي انجام شده و در پايان با استفاده از يك فيلتر اكثريت گام پس پردازش انجام مي شود. نتايج آزمايشات و مقايسه آن ها با كارهاي پيشين انجام شده در زمينه قطعه بندي تصاوير تومور مغزي حاكي از كارايي قابل قبول روش پيشنهادي هستند.
Thesis summary
-
ارائه روشي وفقي به منظور بهبود كنتراست تصوير با استفاده از تكنيك هاي پردازش تصوير
محسن شاكري 2016امروزه كاربرد هاي پردازش تصوير در حوزه هاي مختلف بر كسي پوشيده نيست، از اين رو وجود يك پيش پردازش به منظور بهبود كيفيت تصوير، براي هر چه بهتر كردن كارايي سيستم پردازش تصوير ضروري به نظر مي رسد. يكي از معيارهاي تعيين كننده كيفيت يك عكس، كنتراست است. كنتراست تنها عامل تعيين كننده كيفيت تصوير نيست، اما بدون شك يكي از مهم ترين عوامل آن به شمار مي رود. بهبود كنتراست تصوير پردازشي است كه در آن، يك تصوير با استفاده از گسترش بازه سطوح خاكستري و تغيير در هيستوگرام آن، تبديل به تصويري باكيفيت بالاتر و مناسب براي يك كاربرد خواهد شد. تعديل هيستوگرام يكي از شناخته شده ترين و مؤثرترين تكنيك ها در افزايش كنتراست و بهبود كيفيت تصوير است. اما اين تعديل هيستوگرام سنتي در بعضي از موارد، كنتراست تصوير را بيش ازاندازه افزايش مي دهد كه باعث تخريب ويژگي ها و از بين رفتن ظاهر طبيعي تصوير مي شود. در اين پايان نامه دو روش به منظور بهبود محلي كنتراست تصوير ارائه شده است. در بهبود محلي كنتراست تصوير، نحوه بخش بندي هيستوگرام، كليدي ترين نقش را در كارايي سيستم بهبود ايفا مي كند. در روش اول ابتدا هيستوگرام تصوير با استفاده از ميانگين و انحراف معيار در يك روال بازگشتي به تعدادي زير هيستوگرام تقسيم مي شود كه اين تعداد با استفاده از مقدار اختلاف PSNR در دو مرحله متوالي كنترل خواهد شد. سپس تابع انتقال با توجه به زير بخش ها محاسبه شده و تصوير بهبود پيدا خواهد كرد. در روش دوم، ابتدا هيستوگرام تصوير مورد پردازش قرار گرفته و تعداد خوشه هاي سطوح روشنايي تصوير تخمين زده خواهد شد. با استفاده از اين تعداد، تصوير خوشه بندي شده و هر خوشه با استفاده از تابع انتقال به دست آمده براي آن، بهبود داده خواهد شد. نتايج كمي و كيفي نشان مي دهند كه با اعمال روش پيشنهادي، علاوه بر افزايش كنتراست و نمايان تر شدن جزئيات، ظاهر طبيعي تصوير نيز به طور موثري حفظ مي شود.
Thesis summary
-
بهبود كيفيت بازسازي دقت مضاعف تصاوير ويدئويي با تركيب اطلاعات غيرتكراري فريم هاي دقت پايين ويدئويي
سيدبهزاد فاضلي 2016با توجه به توسعه سريع و گسترش پردازش تصوير براي ارتباطات بصري و درك صحنه، نياز به ارائه تصاويري با وضوح بالا براي بهبود بصري و استخراج اطلاعات اضافي در تصاوير پزشكي، سيستم هاي نظارت ويدئويي و تصاوير هوايي احساس مي گرديد. بر اين اساس، الگوريتم هاي فراتفكيك براي اين بهبود به كارگرفته شده اند، بطوريكه در اين الگوريتم ها، علاوه بر بهبود كيفيت تصاوير خروجي، سايز فيزيكي تصاوير نيز افزايش مي يابد. الگوريتم ها فراتفكيك ويديويي مبتني بر بازسازي، اين كيفيت از دست رفته ي ناشي از عيوب دستگا ه هاي تصوير برداري وعوامل محيطي را، با توجه به تركيب اطلاعات مفيد فريم هاي همجوار، بازسازي نموده و كيفيت و سايز تصوير خروجي را افزايش مي دهد. هدف الگوريتم هاي فراتفكيك، تهيه نمودن جزئيات كوچكتر از شبكه ي نمونه برداري دستگاه تصويربرداري به وسيله ي افزايش تعداد پيكسل ها در واحد سطح در يك تصوير مي باشد. در اين پژوهش، روشي براي بهبود كيفيت فراتفكيكي ويديويي مبتني بر MAP ارائه گرديده است، بطوريكه براي جبران حركت از يك روش شار نوري جديد استفاده شده و براي جلوگيري از تاثيرات نويز و خطاي ناشي از جبران حركت در فرآيند بازسازي، از سيستم وزن دهي و دسته بندي پيكسل ها استفاده گرديده است. همچنين براي همگرايي بهتر و جلوگيري از افتادن الگوريتم در كمينه هاي محلي و همچنين بهبود كيفيت نواحي كه در آن پيكسل ها دچار انسداد گرديده اند، از يك مقدار دهي اوليه مبتني بر فراتفكيك تك تصوير استفاده شده است و در نهايت يك مرحله پس پردازش، براي كاهش اثرات نامطلوب باقي مانده به آن اعمال مي گردد. نتايج آزمايش ها بر روي شش ويديو با پيچيدگي هاي حركتي مختلف و نويز متفاوت، نشان ميدهد كه روش پيشنهادي در مقايسه با ساير روش ها، از نظر معيار PSNR و SSIM و از لحاظ بصري از كيفيت بهتري برخوردار مي باشد.
Thesis summary
-
شناسايي چهره در تصاوير مادون قرمز از فاصله 150 متري
هومن فرزانه 2015زماني كه فاصله شخص از دوربين زياد باشد و يا روشنايي و نور محيط در هنگام ثبت تصوير كافي نباشد جزييات چهره در تصوير ثبت شده بخوبي نمايان نيست و نويز بسيار زياد به تصاوير متحمل مي شود، از اين رو براي شناسايي چهره در اين شرايط، استفاده از روش هاي زمان بر بازسازي تصوير و الگوريتم هاي پيچيده مرسوم است، در اين پژوهش روشي ساده و كارا براي شناسايي چهره در تصاوير با نويز بالا پيشنهاد خواهد شد كه اين روش از سه بخش اصلي تشكيل شده است، در بخش اول عمل پيش پردازش كه شامل برش و بهبود كنتراست است بر روي تصاوير اعمال مي شود. در قسمت بعد تصاوير از دو فيلتر عبور كرده و نويزهاي آن كاهش داده مي شود. الگوريتم اول براي اين منظور DDLD نام دارد كه از روش هاي كاهش نويز محلي بشمار مي رود و از تركيب دو دامنه مكان و فركانس براي ارائه خروجي خود استفاده مي كند. الگوريتم دوم كاهش نويز ANLM ناميده مي شود كه از اطلاعات تمام پيكسل ها براي از بين بردن نويزها استفاده خواهد كرد و الگوريتمي تطبيقي است. همچنين در پايان از روش 2DPCA براي نگاشت تصاوير و سپس تطبيق آن ها استفاده مي شود و درصد شباهت براي اين تطبيق توسط روش SSIM تعيين مي گردد. سه معيار براي ارزيابي سيستم پيشنهادي به كار رفته است كه شامل نرخ شناسايي، نرخ تصديق و پيچيدگي زماني مي باشد با مقايسه اين معيارها درميابيم كه روش پيشنهادي كارايي قابل قبولي نسبت به ساير روش هاي پيشين دارد.
Thesis summary
-
كنترل موقعيت ربات سري صفحه اي دو درجه آزادي با استفاده از فيدبك تصويري موقعيت ربات
بهنام مددنيا 2015استفاده از كنترل غير خطي مزيت هاي زيادي دارد كه به عنوان مهمترين آنها مي توان به مقاوم بودن اشاره كرد. اين ويژگي مي تواند ايرادي كه سامانه هاي سرو بينايي مبتني بر مكان دارند، عدم مقاومت در برابر خطاي بدست آمده توسط دوربين و نامعيني هاي موجود در ديناميك روبات را برطرف كند. از طرفي در روبات هاي جابجا كننده مبتني بر سرو بينايي با تغيير شرايط محيطي از جمله تغيير در بار موجود در مجري نهايي معادلات حاكم بر روباتها دچار تغيير مي شوند.
Thesis summary
-
ارايه روشي هوشمند براي استخراج تعامل انسان - انسان و تشخيص رويداد مبتني بر داده هاي ليزر.
فريبا نصيريان 2015از آنجايي كه به مرور ربات ها از محيط آزمايشگاه و كارخانجات خارج و وارد زندگي انسان ها شده اند، تحقيق و پژوهش بر روي ربات هايي كه قابليت تفسير محيط و ارتباط با انسان ها و كار در محيط هاي پويا را داشته باشند، از اهميت برخوردار شده است. روش هاي متفاوتي براي ارتباط ربات با محيط خارج وجود دارد. در اين پژوهش سعي بر آن است كه از ليزر دامنه ياب براي دريافت اطلاعات از محيط پوياي اطراف استفاده كنيم. ليزرهاي دامنه ياب ابزارهايي با سرعت و دقت بالا هستند كه از پرتوهاي ليزر براي تشخيص فاصله تا يك جسم استفاده مي كنند. تشخيص وجود يا عدم وجود تعامل بين انسانها در حوزه هاي متفاوتي كاربرد دارد، نمونه اي از آن، ربات هايي كه هدف از ساخت آنها تعامل با انسانها و حضور در اجتماع و پيمايش مسير در بين افراد مي باشد. در اين پژوهش سعي شده تا با استفاده از داده هايي كه توسط دو ليزر دامنه ياب بدست آمده اند، تعامل بين انسان ها تشخيص و استخراج شود. براي اين منظور ابتدا داده ها، ترازبندي و ادغام شده، سپس با محاسبه مدل پس زمينه و حذف آن و بهره گيري از الگوريتم خوشه بندي طيفي براي خوشه بندي اطلاعات موجود در دسته هاي فريم ها و يك شبكه عصبي Stacked Auto Encoder، بعنوان طبقه بند، انسان ها را از اشياء تشخيص داده و با استفاده از تركيب فيلتر كالمن و روش هاي رهگيري مبتني بر ناحيه، افراد تشخيص داده شده را رهگيري و نهايتا با استفاده از اطلاعات حاصل، به تشخيص و استخراج رويداد و تعامل بين انسان ها پرداخته شد. پس از پياده سازي روش هاي ذكر شده در نرم افزار MATLAB، كارايي روش هاي ارايه شده بر روي داده هاي جمع آوري شده توسط دو ليزر دامنه ياب HOKUYO و SICK، آزمايش و صحت آن ها با داده دهاي نشانه گذاري شده توسط خبره ي انساني راستي آزمايي گرديد.
Thesis summary
-
تشخيص صرع از روي سيگنالهاي EEG با استفاده از روشهاي هوش محاسباتي
2015تشخيص صرع از روي سيگنالهاي EEG با استفاده از روشهاي هوش محاسباتي
-
بهبود تصاوير اندوسكپي و كولونوسكپي به منظور اشكار سازي زخمهاي دستگاه گوارش به كمك تكنيكهاي پردازش تصوير
2015بهبود تصاوير اندوسكپي و كولونوسكپي به منظور اشكار سازي زخمهاي دستگاه گوارش به كمك تكنيكهاي پردازش تصوير
-
ارائه روشي تركيبي براي توليد تصاوير پانوراما مبتني بر الگوريتم هاي هوشمند
2015 -
قطعه بندي رگ هاي خوني شبكيه چشم با استفاده از تركيب روش هاي هوشمند
علي فرخي 2015 -
ارائه ي روشي براي بازيابي مبتني بر محتواي تصاوير دستگاه گوارش
با تركيب ويژگي هاي سطح پايين تصاوير
2014بازيابي مبتني بر محتواي تصاوير ابزاري است براي جستجوي تصاوير از يك مجموعه بزرگ بر اساس ويژگي هاي بصري اي كه به طور خودكار از تصاوير استخراج مي شوند. با پيشرفت فناوري، تصويربرداري به يكي از اجزاء اصلي حوزه پزشكي تبديل شده است و پايگاه داده هاي حجيم، تصاوير پزشكي متنوعي را جمع آوري مي كنند. انجام تشخيص با مقايسه تصاوير پزشكي كنوني و گذشته يكي از روش هاي اصلي در تشخيص پزشكي است. بنابراين بازيابي مبتني بر محتواي تصاوير مي تواند براي تشخيص درست به پزشكان كمك كند و شواهد كمكي مرتبطي را از موارد شناخته شده قبلي فراهم آورد. همچنين مي تواند نقش يك مشاور متخصص را براي پزشكان ايفا كند و يا به عنوان يك وسيله آموزشي براي دانشجويان، دستياران و محققان پزشكي به كار رود. يكي از چالش هاي مهم در پزشكي، تشخيص دقيق آسيب هاي دستگاه گوارش از روي تصاوير و انتخاب روش درماني مناسب است كه در اين راستا بازيابي مبتني بر محتوا نقش مهمي مي تواند ايفا كند. يك سيستم بازيابي مبتني بر محتوا معمولاً شامل دو بخش استخراج ويژگي و بازيابي تصوير است. در روش پيشنهادي تمركز بر روي بخش استخراج ويژگي است. اولين مرحله روش پيشنهادي انجام پيش پردازش روي تصاوير پايگاه داده است. پس از آن پنج ويژگي مختلف از تصاوير استخراج مي شوند. اولين ويژگي هيستوگرام رنگ است كه با كوانتيزاسيون كانال هاي تصوير در فضاي HSV با استفاده از الگوريتم FCM محاسبه مي شود. ويژگي بعدي ممان هاي رنگ است كه چهار ممان مركزي كانال هاي تصوير در فضاي RGB را محاسبه كرده و به عنوان ويژگي به كار مي برد. براي حفظ اطلاعات مكاني، از يك بلوك بندي وزن د ار براي استخراج ويژگي با اين دو روش استفاده مي شود. ويژگي هاي ديگري با استفاده از تصاوير لبه به دست مي آيند. در اين روش پس از استخراج لبه، تصوير به بلوك هاي مربعي و مستطيلي تقسيم مي شود و سه ويژگي تعداد بلوك هاي بدون لبه، تعداد پيكسل هاي سازنده لبه در هر بلوك و متوسط تعداد پيكسل هاي هر تكه لبه در داخل هر بلوك، از تصاوير استخراج مي شوند. تجزيه تصاوير و بازسازي آن ها با استفاده از تبديل موجك مبناي روش ديگري براي استخراج ويژگي است. تصوير تا 10 سطح تجزيه شده و 5 بار به شكلي متفاوت بازسازي مي شود و 5 ويژگي آماري از نتيجه هر بازسازي استخراج مي گردد. بار ديگر تصوير تا 5 سطح تجزيه شده و ضرايب موجك سطوح 2 تا 5 به عنو
Thesis summary
-
ارائه ي روشي قابل بازگشت براي افزايش ظرفيت نهان سازي تصوير با حفظ كيفيت
2014نهان سازي داده در تصوير براي حفظ امنيت اطلاعات در اينترنت به يكي از روش هاي بسيار مهم تبديل شده است. اين روش داده ي محرمانه را در پوشش يك تصوير مخفي مي كند. با اين شيوه به جاي فرستادن فرم رمزنگاري شده ي اطلاعات كه توجه هكرها را جلب مي كند، تصوير حامل داده ي محرمانه ارسال مي شود. اين امر موجب مي شود كه توجه هكرها به وجود داده ي محرمانه جلب نشود. تصويري كه براي حمل داده ي محرمانه انتخاب مي شود را تصويرپوششي مي نامند و بعد از جاسازي داده ي محرمانه در آن، آن را تصوير نهان سازي شده مي ناميم. كم بودن كيفيت تصوير حامل داده نسبت به تصوير پوششي مشكل موجود اين روشها مي-باشد. محققان امروزه تلاش مي كنند تا شباهت بين تصوير نهان سازي شده و تصوير پوششي را بالا ببرند در حالي كه ظرفيت نهان-سازي را يكسان نگه دارند و يا برعكس. در اين پايان نامه، چندين روش قابل بازگشت نهان سازي براي افزايش ظرفيت جاسازي با حفظ كيفيت تصوير ارائه شده است. اولين روش پيشنهادي فرايندي را ايجاد كرده است كه به جاي جاسازي داده ي محرمانه بصورت بيت هاي 0 و 1 بتوان آن را بصورت جرياني از بيت هاي 00،01،10 و 11 جاسازي كرد. البته در اين روش بهاي افزايش زياد ظرفيت كاهش كم كيفيت مي باشد. در روش پيشنهادي دوم پيش پردازشي بر روي تصوير پيشنهاد شده است كه باعث افزايش كيفيت تصوير نهان سازي شده مي شود. در اين روش هر پيكسل از پيكسل زيرينش كم مي شود كه باعث مي شود هيستوگرام اختلاف ها پيرامون مقدار صفر متمركزتر باشد و اين يعني افزايش ظرفيت نهان سازي. در روش پيشنهادي سوم مكانيزمي اتخاذ شده است كه بتوان داده ي محرمانه را بصورت سه حالت 10،11 و 0 جاسازي كرد در اين روش نسبت به روش بهبود داده شده كاهش كيفيت تصوير نخواهيم داشت. آخرين روش كه بهترين روش ارائه شده مي باشد يك شيوه ي جديد نهان سازي قابل بازگشت. است كه نياز به انتقال هيستوگرام را حذف كرده است. انتقال هيستوگرام قسمتي از اكثر الگوريتم هاي نهان سازي مي باشد كه موجب كاهش كيفيت تصوير نهان سازي مي شود. در اين شيوه با حذف نياز به انتقال هيستوگرام كيفيت و ظرفيت تصوير نهان-سازي شده بشدت افزايش يافته است.
Thesis summary