پایان نامه ارشد مهندسی فناوری اطلاعات: بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه مدلی مبتنی بر سیستمهای چند عامله برای آن |
1-2- تعریف مسأله و سوالات اصلی تحقیق…………………….. 2
1-3- اهمیت و ضرورت انجام تحقیق……………………. 3
1-4- اهداف اساسی از انجام تحقیق…………………….. 3
1-4-1- هدف اصلی…………………….. 3
1-4-2- اهداف فرعی…………………….. 3
1-5- پرسشهای تحقیق…………………….. 4
1-5-1- پرسش اصلی…………………….. 4
1-5-2- پرسشهای فرعی…………………….. 4
1-6- فرضیهها……………………. 4
1-7- روش تحقیق…………………….. 4
1-8- جنبههای نوآوری…………………….. 5
1-9- مراحل انجام تحقیق…………………….. 5
1-10- ساختار پایاننامه……………………. 5
فصل دوم ادبیات و پیشینه تحقیق…………………….. 6
2-1- مقدمه……………………. 7
2-2- دادهکاوی…………………….. 7
2-2-1- خوشهبندی…………………….. 8
2-2-1-1- روشهای تقسیمبندی…………………….. 8
2-2-1-2- روشهای سلسله مراتبی…………………….. 8
2-2-1-3- روشهای مبتنی بر چگالی…………………….. 9
2-2-2- طبقهبندی…………………….. 9
2-2-2-1- طبقهبندی مبتنی بر قواعد…………………….. 10
2-2-3- کشف قواعد انجمنی…………………….. 12
2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی……….. 12
2-2-3-1-1- تقسیم بندی قواعد انجمنی…………………….. 14
2-2-3-1-2- استخراج قواعد تکسطحی تک بعدی دودویی……. 14
2-2-3-1-2-1- مرحله پیوست……………………… 16
2-2-3-1-2-2- مرحله هرس……………………… 17
2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی……… 17
2-3- دادهکاوی توزیع شده …………………….17
2-4- عاملها و سیستمهای چندعامله…………………….18
2-4-1- عامل…………………….. 19
2-4-1-1- مقایسه عامل با شیء……………………. 20
2-4-1-2- معماری عاملها …………………….23
2-4-1-2-1- معماری BDI…………………….
2-4-2- سیستمهای چندعامله……………………. 25
2-4-2-1- مذاکره……………………. 28
2-5- بهرهگیری از عامل برای دادهکاوی…………………….. 30
2-5-1- سیستمهای چندعامله، بستری برای دادهکاوی توزیع شده…… 30
2-6- ی بر کارهای انجام شده……………………. 32
2-6-1- دادهکاوی توزیع شده……………………. 33
2-6-2- کارهای مهم انجام شده در زمینه دادهکاوی با بهره گرفتن از عامل…….. 36
2-7- جمعبندی…………………….. 39
فصل سوم روش تحقیق…………………….. 40
3-1- مقدمه …………………….41
3-2- دادهکاوی توزیع شده …………………….41
3-2-1- گروهبندی مدلهای دادهکاوی توزیع شده……………………. 42
3-2-2- مشکلات دادهکاوی توزیع شده …………………….43
3-2-2-1- افزونگی داده …………………….43
3-2-2-2- تغییرات پویای محیط……………………… 43
3-2-2-3- سربار ارتباطات……………………… 44
3-2-2-4- مشکلات دادهکاوی توزیع شده به روش سنتی……… 44
3-3- عاملها و دادهکاوی…………………….. 44
3-3-1- حوزه کاوش عامل…………………….. 46
3-3-2- دادهکاوی برپایهی عامل…………………….. 48
3-3-3- مزیت بهرهگیری از عاملها در دادهکاوی…………….. 50
3-3-3-1- زیرساخت دادهکاوی سازمانی…………………….. 51
3-3-3-2- بکارگیری هوشمندی انسان و دامنه……………………. 51
3-3-3-3- پشتیبانی از کاوش توزیع شده و موازی………….. 51
3-3-3-4- پیش پردازش داده……………………. 52
3-3-3-5- یادگیری سازگار……………………. 52
3-3-3-6- کاوش تعاملی…………………….. 52
3-3-4- دادهکاوی توزیع شده برپایهی عاملها…………… 53
3-3-4-1- چالشهای دادهکاوی توزیع شده……………………. 53
3-3-5- مزیت بهرهگیری از عاملها در دادهکاوی توزیع شده…….. 55
3-3-5-1- ایزوله بودن منابع داده……………………. 55
3-3-5-2- پویایی منابع داده و دستگاههای محاسباتی…………… 55
3-3-5-3- دادهکاوی توزیع شدهی تعاملی…………………….. 56
3-3-5-4- انتخاب منابع و جمعاوری داده پویا …………………….56
3-3-5-5- محدودیتهای زمانی در منابع داده توزیع شده…….. 56
3-3-5-6- دادهکاوی توزیع شده با چند استراتژی………….. 56
3-3-5-7- دادهکاوی توزیع شدهی مشارکتی…………………….. 56
3-3-5-8- پوشیدگی دادههای منبع…………………….. 56
3-3-5-9- محدودیتهای سازمانی در منابع داده توزیع شده …….57
3-4- الگوریتمهای کشف قوانین انجمنی…………………….. 57
3-4-1- الگوریتم AIS……………………..
3-4-2- الگوریتم SETM………………………
3-4-3- الگوریتم Apriori یا پیشینار……………………. 58
3-4-4- الگوریتم AprioriTid……………………..
3-5- جمعبندی…………………….. 61
فصل چهارم محاسبات و یافتههای تحقیق…………………….. 62
4-1- مقدمه……………………. 63
4-2- معماری پیشنهادی برای داده کاوی توزیع شده برپایهی سیستمهای چند عامله…… 66
4-2-1- معماری چهار لایهی پیشنهادی…………………….. 66
4-2-1-1- لایهی اول، لایهی کاربر…………………….. 66
4-2-1-2- لایهی دوم، لایهی مدیریت……………………… 67
4-2-1-3- لایهی سوم، لایه پردازش……………………… 68
4-2-1-4- لایهی چهارم، لایهی منابع…………………….. 69
4-3- مطالعه موردی…………………….. 71
4-3-1- تحلیل عملکرد الگوریتمهای کشف قوانین انجمنی……… 71
4-3-2- F-Trade: یک سیستم کاوش عامل برای سرویسهای مالی……. 75
4-3-3- دادهکاوی چند منبع بر پایهی عامل…………………….. 77
4-3-4- کاوش الگوی رفتار سازگار بر پایهی عامل توسط HMM…………
4-3-4-1- چارچوب سیستم…………………….. 81
4-3-4-2- مدلسازی عامل…………………….. 83
4-4- جمعبندی……………………..84
فصل پنجم نتیجهگیری و پیشنهادات……………………… 86
5-1- مقدمه……………………. 87
5-2- خلاصه تحقیق…………………….. 87
5-3- پیشنهادات برای کارهای آتی……………………. 87
پیوست منابع و مآخذ……………………..89
چکیده:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهرهگیری از روشهایی همچون دادهکاوی برای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب میباشد. یکی از مسائلی که امروزه در بحث دادهکاوی مورد توجه قرار گرفته است، بحث توزیعشدگی ذاتی دادهها است. توسعه فناوری شبکههای کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است. داده کاوی توزیع شده از محاسبات توزیع شده استفاده میکند، و دانش مورد نیاز کاربران را از پایگاه دادههای توزیع شده استخراج میکند. این حوزه چشمانداز کاربردی گستردهای دارد. سه هدف اصلی برای داده کاوی از سیستمهای اطلاعاتی توزیع شده وجود دارد: 1) شناسایی الگوهای مهم محلی در پایگاه دادههای مجزا، 2) ادغام الگوهای محلی و استخراج الگوهای کلی پس از یکپارچه شدن پایگاه دادههای توزیع شده، و 3) شناسایی الگوهای رابطهای خاص در مجموعه دادههای مختلف.
با توجه به قابلیتهای عامل و سیستمهای چندعامله و مناسب بودن آن ها برای محیطهای توزیع شده به نظر میرسد که بتوان از قابلیتهای آنها برای دادهکاوی در محیطهای توزیع شده بهره برد. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستمهای چندعامله در دادهکاوی، بحث کاوش قوانین انجمنی در محیطهای توزیع شده را مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیتها و قابلیتهای یک عامل و مزایای ترکیب تکنولوژی چند عامله با دادهکاوی توزیع شده مورد بررسی قرار خواهند گرفت، و در فاز دوم یک معماری برای دادهکاوی در محیطهای توزیع شده برپایهی تکنولوژی چند عامله ارائه میدهیم. بطور کلی دستاورد اصلی این تحقیق ارائه یک رویکرد مبتنی بر عامل برای مساله کاوش قوانین انجمنی با بهره گرفتن از قابلیتهای هدفگرایی، هوشمندی، یادگیری و استدلال است.
فصل اول: مقدمه و کلیات تحقیق
1-1- مقدمه
در این فصل به معرفی کلیات این پژوهش و ساختار آن میپردازیم. بدین منظور ابتدا به بیان تعریف مسئله، ضرورت، اهداف و پرسشهای این تحقیق خواهیم پرداخت و در نهایت به تعریف واژهها و اصطلاحات مورد استفاده در پایان نامه میپردازیم.
2-1- تعریف مسأله و سوالات اصلی تحقیق
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آن ها سر و کار دارد، بهرهگیری از روشهایی همچون دادهکاوی برای استخراج دانش و اطلاعات نهفته در دادهها، امری غیرقابل اجتناب میباشد. یکی از مسائلی که امروزه در بحث دادهکاوی مورد توجه قرار گرفته است، بحث توزیعشدگی ذاتی دادهها است. توسعه فناوری شبکههای کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است.
دادهکاوی توزیع شده عبارت است از کشف نیمه خودکار الگوهای پنهان موجود در دادهها، در حالتی که دادهها و یا مکانیزمهای استنتاج، به صورت توزیع شده باشند. غیرمتمرکز بودن دادهها بدان معناست که دادهها به صورت توزیع شده بین دو یا چند سایت بوده و هزینه انتقال تمام یا بخشی از دادهها به یک سایت مرکزی، قابل صرفنظر نباشد. توزیع شده بودن مکانیزمهای استنتاج، به معنای لزوم لحاظ کردن هزینه ارتباط بین مکانیزمهای مختلف در حال استخراج دانش میباشد. این توزیعشدگی ممکن است به دلایل مختلفی از جمله ارائه شدن مکانیزم استخراج دانش در قالب یک سرویس اینترنتی و یا صرفاً ناشی از توزیعشدگی دادهها باشد. چنین رویکردی به دادهکاوی، برخلاف جهت کلی تحقیقات انجام شده است که به طور عمده به تکنیکهای متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطهای) دادههای هدف متکی میباشند. مسائلی نظیر استخراج دانش در حالت عدم دسترسی به تمام دادههای موجود، برقراری ارتباط موثر و بهینه با سایر مکانیزمهای در حال استخراج دانش و نیز تبادل دانش یا اطلاعات میانی به جای اطلاعات خام، فقط تعدادی از مسائل اولیه دادهکاوی توزیع شده با توجه به تعریف آن میباشند. بنابراین، دادهکاوی توزیع شده در عین حال که به عنوان راه حلی کلیدی برای مشکلات اصلی پیش روی دادهکاوی مطرح میباشد، خود سرمنشأ چالشها و مسائل متعددی گردیده است؛ حل مؤثر این مشکلات منجر به استفاده هرچه بیشتر از دادهکاوی و ایجاد امکانات جدید و بهرهبرداری از پتانسیلهای موجود در قلمروهائی خواهد شد که علیرغم نیاز مبرم به دادهکاوی، استفاده بسیار محدودی از آن به عمل میآورند.
3-1- اهمیت و ضرورت انجام تحقیق
داده کاوی توزیع شده از محاسبات توزیع شده استفاده میکند، و دانش مورد نیاز کاربران را از پایگاه دادههای توزیع شده استخراج میکند. این حوزه چشمانداز کاربردی گستردهای دارد. معمولاً پایگاههایی که این دادهها را ایجاد یا دریافت میکنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام به دنبال اهداف و منافع خود میباشند و حاضر نیستند دانش خود را به طور رایگان در اختیار دیگران قرار دهند. سیستم داده کاوی توزیع شده چند عامله، نسبتاً یک حوزه تحقیقاتی جدید است. با تکنولوژی نوظهور هوش مصنوعی سازگار است، انعطاف پذیری و هوشمندی خاصی دارد، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا نتایج این تحقیق میتواند در عمل مورد استفاده قرار گیرد و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.
ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است
متن کامل را می توانید دانلود نمائید
فرم در حال بارگذاری ...
[چهارشنبه 1399-10-03] [ 12:39:00 ب.ظ ]
|