محمد حسن مجتهد سلیمانی

تاریخ انتشار : Publish : نسخه قابل چاپ Print

دانشکده مهندسی

گروه آموزشی مهندسی کامپیوتر

 

پایان‌نامه برای دریافت درجه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات گرایش شبکه‌های کامپیوتری

 
عنوان:

 

شناسایی و دسته‎بندی ترافیک رمز شده TOR به کمک روش‎های یادگیری ماشین

 

استاد راهنما:

دکتر محرم منصوری‎زاده

 استاد مشاور:

دکتر محمد نصیری

 

اساتید داور:

دکتر دزفولیان

دکتر عباسی


نگارش:

محمدحسن مجتهدسلیمانی


محل برگزاری: دانشکده مهندسی، سالن آمفی تئاتر

تاریخ و زمان برگزاری: 21/11/94 ساعت 8 صبح

 

چکیده فارسی:

 

شناسایی و دسته‎بندی ترافیک‎های شبکه بر اساس نوع نرمافزار برای بسیاری از کارهای کنترلی و نظارتی شبکه همانند ایجاد صورتحساب، کیفیت خدمات، نظارت بر ترافیک شبکه و مهندسی ترافیک اهمیت دارد. این موارد کنترلی و نظارتی نیازمند این هستند که بدانند چه نوع ترافیکی در حال عبور از شبکه است تا با توجه به خط‌مشی از پیش تعریف‌شده‌ای، قانون یا قوانینی را بر ترافیک موردنظر اعمال نمایند. امروزه بسیاری از نرم‎افزارهای شبکه به دلایل مختلفی همچون عدم فاش شدن هویت فرستنده داده، جلوگیری از فاش شدن محتوای داده، احراز هویت و مواردی دیگر از رمزنگاری استفاده می‎کنند. این نرم‎افزارها علاوه بر رمز کردن داده‎هایشان، معمولا از درگاه‎های تصادفی و غیر مشهور بهره می‎برند. ازاین‌جهت، روش‎های شناسایی و دسته‎بندی ترافیک‎های اینترنتی همانند روش‎های مبتنی بر درگاه و مبتنی بر محتوا نمی‎توانند برای شناسایی این ترافیک‎ها مورد استفاده قرار بگیرند. بنابراین نیاز است که از روش‎های دیگری بهره گرفته شود که روش‎های یادگیری ماشین می‎توانند در این زمینه بسیار سودمند باشند. روش‎های یادگیری ماشین برای شناسایی نرمافزارهای شبکه، بر اساس اطلاعات آماری در هر جریان عمل میکنند. این اطلاعات آماری از ویژگیهای مستقل از محتوا همانند اندازه بسته، فاصله زمانی بین ورود بستهها و غیره نشات میگیرند. در این پژوهش، ترافیک رمز شده TOR (ترافیک‎ افزونه‎های Obfs3 و Scramblesuit) با استفاده از این روش‎ها مورد شناسایی و دسته‎بندی قرار می‎گیرد. بدین منظور از شش الگوریتم یادگیری ماشین و 40 ویژگی آماری استفاده شده است. برای این‎که بتوانیم به‌صورت آنلاین، ترافیک تور را از ترافیک‎های پس‎زمینه شناسایی کنیم، دسته‎بندی را روی چند بسته ابتدایی جریان انجام می‎دهیم و یک‎بار از تمام 40 ویژگی آماری استفاده می‏کنیم و بار دیگر به‌منظور کاهش تعداد ویژگی‎های استفاده، دسته‎بندی را با استفاده از حداقل هشت و حداکثر 12 ویژگی انجام می‎دهیم. نتایج به‌دست‌آمده حاکی از آن است که می‎توان با دقت بالایی، ترافیک تور را با استفاده از چند بسته ابتدایی جریان شناسایی کرد.

واژه­های کلیدی: شناسایی ترافیک، دسته‎بندی ترافیک، یادگیری ماشین، ترافیک رمز شده، TOR

 

چکیده انگلیسی:

Identification and classification of network traffics based on applications are very important for lots of controlling and monitoring network tasks like billing, QoS, network traffic monitoring and traffic engineering. These tasks need to know what kind of traffic is passing the network to apply a rule or rules on the traffic based on the pre-defined policy. Nowadays lots of network applications use encryption for different reasons like non-disclosure of the identity of sender, preventing data payload from disclosing, authentication and so on. These applications usually use unknown and random ports besides encrypting their data. Therefore, identification and classification techniques like port-based and payload-based methods can not be used for identifying such traffics. So, it is needed to use other methods and machine learning techniques can be very helpful in this field. Machine learning techniques work based on statistical information of flow for identifying network applications. The statistical information is derived from payload-independent features such as packet length, inter-arrival time and etc. In this paper, encrypted TOR traffic (traffics of Obfs3 and Scramblesuit pluggable-transports) is identified by using such techniques. So, six machine learning algorithms and 40 statistical features have been used. Because we are going to identify TOR traffic from background traffics in online manner, we do classification once on a few first flow packets and use 40 features and the other time to reduce used features, classification is done by at least 8 and at most 12 features. The results show that TOR traffic can be identified with a few first flow packets.

Key Words: Traffic identification, Traffic classification, Machine learning, Encrypted traffic, TOR

 

 

رزومه تحصیلی:

مقطع تحصیلی

موسسه آموزش عالی

رشته تحصیلی

سال تحصیلی

کارشناسی

خوارزمی تهران

علوم کامپیوتر

91-86

کارشناسی ارشد

بوعلی سینا همدان

شبکه های کامپیوتری

94-92

 

تخصص ها:

آشنایی با زبان های برنامه نویسی C++، C# و ...

آشنایی با مباحث پیکربندی شبکه

 

کارهای پژوهشی:

مقاله "شناسایی ترافیک رمز شده TOR به کمک روش های یادگیری ماشین" پذیرفته شده در هفتمین کنفرانس بین المللی فناوری اطلاعات و دانش (IKT 2015)، دانشگاه ارومیه، سال 94