دانلود پایان نامه

پشتیبانی از نوع داده اسمی از عملگرهای مختلفی برای تبدیل مقادیر غیرعددی به عدد استفاده شده است. به همین دلیل تنها از روش Split validation با نسبت 70-30 برای ارزیابی استفاده شده است که تقسیم ورودی ها نیز توسط کاربر انجام شد.
شکل3-12 عملیات انجام شده را نشان می دهد.

شکل 3-12: تبدیل ویژگی های غیر عددی به عدد در الگوریتم SVM خطی

پارامترهای الگوریتم عبارتند از :
Kernel cache=200
Max iteretions=100000
نتیجه حاصل از اجرای الگوریتم SVM خطی دقت 98.54% است. ماتریس آشفتگی آن و نمودار AUC در شکل 3-13 رسم شده است.

شکل 3-13 : نمودار AUC الگوریتم SVM Linear

3-9-5-الگوریتم رگرسیون لجستیک
در این الگوریتم از روش Split validation با نسبت 70-30برای ارزیابی استفاده شده است که تقسیم ورودی ها نیز توسط کاربر انجام شد.
نتیجه حاصل از اجرای الگوریتم رگرسیون لجستیک دقت 98.54% است. ماتریس آشفتگی آن و نمودار AUC در شکل 3-14 رسم شده است.

شکل 3-14 : نمودار AUC الگوریتم رگرسیون لجستیک

3-9-6- الگوریتم Meta Decision Tree
در این الگوریتم که یک درخت تصمیم است، از روش Split validationبا نسبت 70-30 برای ارزیابی استفاده شده است که دقت 96.64% اقدام به پیش بینی خسارت احتمالی نموده است. ماتریس آشفتگی آن و نمودار AUC در شکل 3-15 رسم شده است.

شکل 3-15 : نمودار AUC الگوریتم Meta Decision Tree

با توجه به اندازه بزرگ درخت خروجی فقط قسمتی از آن در شکل 3-16 بصورت درخت نمایش داده می شود. در شکل 3-17 درخت بصورت کامل آمده است اما نتایج آن در فصل چهارم مورد تفسیر قرار خواهند گرفت.

شکل 3-16 : قسمتی از نمودارtree الگوریتم Meta Decision Tree

مطلب مرتبط :   منابع و ماخذ مقالهاعتبارسنجی، مدل ریاضی، مدل پیشنهادی، الگوریتم ژنتیک

شکل 3-17 : نمودار radial الگوریتم Meta Decision Tree

3-9-7-الگوریتم درخت Wj48
چون RapidMiner توانایی استفاده ازالگوریتمهای نرم افزار WEKA را نیز دارد، در بسیاری از الگوریتم ها قدرت مند تر عمل میکند. Wj48 نسخه WEKA از الگوریتمj48 است.

پارامترهای این الگوریتم عبارتند از:

C=0.25
M=2

در این الگوریتم از روش ارزیابی 10 Fold Validation استفاده شده است و دقت پیش بینی آن برابر 99.52% است. ماتریس آشفتگی آن و نمودار AUC در شکل 3-18 رسم شده است. نمای درخت در شکل 3-19 ترسیم شده است.

شکل 3-18: نمودار AUC الگوریتم Wj48

شکل 3-19 : نمودار tree الگوریتم Wj48

3-9-8-الگوریتم درخت Random forest
در این الگوریتم از هر سه روش ارزیابی بیان شده در قسمت 3-9 استفاده شده است، که بهترین کارایی مربوط به ارزیاب Split Validation با دقت96.72% است. ماتریس آشفتگی آن و نمودار AUC در شکل 3-20 رسم شده است.

شکل 3-20 : نمودار AUC الگوریتم Random forest

تنظیمات این الگوریتم برای تولید 20 درخت، بطوری که هر درخت حداقل 6 برگ را شامل شود به همراه هرس و بدون پیش هرس انجام گرفته است. شکل کلی درختهای تولید شده و یک نمونه از درخت تولیدی در شکلهای 3-21و3-22 قابل مشاهده است.

شکل 3-21 : نمودار تولید 20 درخت در الگوریتم Random Forest

شکل 3-22 : یک نمونه درخت تولید شده توسط الگوریتم Random Forest

3-10-معیارهای ارزیابی الگوریتم های مبتنی بر قانون33(کشف قوانین انجمنی)

قوانین انجمنی الگوهای زیادی را تولید می نمایند که ممکن است همه الگوها برای ما جذاب نباشند. جذابیت قوانین استخراج شده به حوزه ای که مجموعه داده مورد بررسی به آن تعلق دارد و شخص استفاده کننده از قوانین بستگی داشته و متغیر است. بنابراین معیارهایی را باید برای ارزیابی کیفیت این قوانین تعریف نماییم.
اگر قانونی داشته باشیم که بگوید A آنگاه B ، از نسبت تعداد رکوردهایی که در آن A, B هردو حضوردارند، به کل تعداد رکوردها، معیاری به دست می آید که Support نام دارد. این مقدار عددی بین 0 و 1 است. معمولا برای جستجوی راحت تر قوانین، یک آستانه برای Support درنظر می گیرند تا تعداد قوانین بدست آمده محدودتر شود.
مقدار آستانه ممکن است باعث شود قوانینی را که Support آنها از آستانه کمتر باشد اما با ارزش نیز باشد را نبینیم. پس این معیار به تنهایی برای مشخص کردن ارزشمندی یک قانون کافی نیست.
Confidence معیاردیگری است که مقداری بین 0و1 خواهد داشت. اگر این معیار برای قانونی 98/0 اطمینان را نشان دهد به این معنی است که در 98 % حالات اگر سمت چپ قانون درست باشد، سمت راست قانون نیز درست خواهد بود.
(A→B)=(SUP(A∪B))/(SUP(A)) Confidence

مطلب مرتبط :   منبع پایان نامه ارشد درموردفاصله قدرت، انتقال اطلاعات، جنس مخالف

الگوریتم FPgrowth


دیدگاهتان را بنویسید