1-2- تعریف مسأله و سوالات اصلی تحقیق…………………….. 2

1-3- اهمیت و ضرورت انجام تحقیق……………………. 3

1-4- اهداف اساسی از انجام تحقیق…………………….. 3

1-4-1- هدف اصلی…………………….. 3

1-4-2- اهداف فرعی…………………….. 3

1-5- پرسش‌های تحقیق…………………….. 4

1-5-1- پرسش اصلی…………………….. 4

1-5-2- پرسش‌های فرعی…………………….. 4

1-6- فرضیه‌ها……………………. 4

1-7- روش تحقیق…………………….. 4

1-8- جنبه‌های نوآوری…………………….. 5

1-9- مراحل انجام تحقیق…………………….. 5

1-10- ساختار پایان‌نامه……………………. 5

فصل دوم ادبیات و پیشینه تحقیق…………………….. 6

2-1- مقدمه……………………. 7

2-2- داده‌کاوی…………………….. 7

2-2-1- خوشه‌بندی…………………….. 8

2-2-1-1- روش‌های تقسیم‌بندی…………………….. 8

2-2-1-2- روش‌های سلسله مراتبی…………………….. 8

2-2-1-3- روش‌های مبتنی بر چگالی…………………….. 9

2-2-2- طبقه‌بندی…………………….. 9

2-2-2-1- طبقه‌بندی مبتنی بر قواعد…………………….. 10

2-2-3- کشف قواعد انجمنی…………………….. 12

2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی……….. 12

2-2-3-1-1- تقسیم بندی قواعد انجمنی…………………….. 14

2-2-3-1-2- استخراج قواعد تک‌سطحی تک بعدی دودویی……. 14

2-2-3-1-2-1- مرحله پیوست……………………… 16

2-2-3-1-2-2- مرحله هرس……………………… 17

2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی……… 17

2-3- داده‌کاوی توزیع شده …………………….17

2-4- عامل‌ها و سیستم‌های چندعامله…………………….18

2-4-1- عامل…………………….. 19

2-4-1-1- مقایسه عامل با شیء……………………. 20

2-4-1-2- معماری عامل‌ها …………………….23

2-4-1-2-1- معماری BDI…………………….

2-4-2- سیستم‌های چندعامله……………………. 25

2-4-2-1- مذاکره……………………. 28

2-5- بهره‌گیری از عامل برای داده‌کاوی…………………….. 30

2-5-1- سیستم‌های چندعامله، بستری برای داده‌کاوی توزیع شده…… 30

2-6- ی بر کارهای انجام شده……………………. 32

2-6-1- داده‌کاوی توزیع شده……………………. 33

2-6-2- کارهای مهم انجام شده در زمینه داده‌کاوی با بهره گرفتن از عامل…….. 36

2-7- جمع‌بندی…………………….. 39

فصل سوم روش تحقیق…………………….. 40

3-1- مقدمه …………………….41

3-2- داده‌کاوی توزیع شده …………………….41

3-2-1- گروه‌بندی مدل‌های داده‌کاوی توزیع شده……………………. 42

3-2-2- مشکلات داده‌کاوی توزیع شده …………………….43

3-2-2-1- افزونگی داده …………………….43

3-2-2-2- تغییرات پویای محیط……………………… 43

3-2-2-3- سربار ارتباطات……………………… 44

3-2-2-4- مشکلات داده‌کاوی توزیع شده به روش سنتی……… 44

3-3- عامل‌ها و داده‌کاوی…………………….. 44

 

پایان نامه

 

3-3-1- حوزه کاوش عامل…………………….. 46

3-3-2- داده‌کاوی برپایه‌ی عامل…………………….. 48

3-3-3- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی…………….. 50

3-3-3-1- زیرساخت داده‌کاوی سازمانی…………………….. 51

3-3-3-2- بکارگیری هوشمندی انسان و دامنه……………………. 51

3-3-3-3- پشتیبانی از کاوش توزیع شده و موازی………….. 51

3-3-3-4- پیش پردازش داده……………………. 52

3-3-3-5- یادگیری سازگار……………………. 52

3-3-3-6- کاوش تعاملی…………………….. 52

3-3-4- داده‌کاوی توزیع شده برپایه‌ی عامل‌ها…………… 53

3-3-4-1- چالش‌های داده‌کاوی توزیع شده……………………. 53

3-3-5- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی توزیع شده…….. 55

3-3-5-1- ایزوله بودن منابع داده……………………. 55

3-3-5-2- پویایی منابع داده و دستگاه‌های محاسباتی…………… 55

3-3-5-3- داده‌کاوی توزیع شده‌ی تعاملی…………………….. 56

3-3-5-4- انتخاب منابع و جمع‌اوری داده پویا …………………….56

3-3-5-5- محدودیت‌های زمانی در منابع داده توزیع شده…….. 56

3-3-5-6- داده‌کاوی توزیع شده با چند استراتژی………….. 56

3-3-5-7- داده‌کاوی توزیع شده‌ی مشارکتی…………………….. 56

3-3-5-8- پوشیدگی داده‌های منبع…………………….. 56

3-3-5-9- محدودیت‌های سازمانی در منابع داده توزیع شده …….57

3-4- الگوریتم‌های کشف قوانین انجمنی…………………….. 57

3-4-1- الگوریتم AIS……………………..

3-4-2- الگوریتم SETM………………………

3-4-3- الگوریتم Apriori یا پیشینار……………………. 58

3-4-4- الگوریتم AprioriTid……………………..

3-5- جمع‌بندی…………………….. 61

فصل چهارم محاسبات و یافته‌های تحقیق…………………….. 62

4-1- مقدمه……………………. 63

4-2- معماری پیشنهادی برای داده کاوی توزیع شده برپایه‌ی سیستم‌های چند عامله…… 66

4-2-1- معماری چهار لایه‌ی پیشنهادی…………………….. 66

4-2-1-1- لایه‌ی اول، لایه‌ی کاربر…………………….. 66

4-2-1-2- لایه‌ی دوم، لایه‌ی مدیریت……………………… 67

4-2-1-3- لایه‌ی سوم، لایه پردازش……………………… 68

4-2-1-4- لایه‌ی چهارم، لایه‌ی منابع…………………….. 69

4-3- مطالعه موردی…………………….. 71

4-3-1- تحلیل عملکرد الگوریتم‌های کشف قوانین انجمنی……… 71

4-3-2- F-Trade: یک سیستم کاوش عامل برای سرویس‌های مالی……. 75

4-3-3- داده‌کاوی چند منبع بر پایه‌ی عامل…………………….. 77

4-3-4- کاوش الگوی رفتار سازگار بر پایه‌ی عامل توسط HMM…………

4-3-4-1- چارچوب سیستم…………………….. 81

4-3-4-2- مدلسازی عامل…………………….. 83

4-4- جمع‌بندی……………………..84

فصل پنجم نتیجه‌گیری و پیشنهادات……………………… 86

5-1- مقدمه……………………. 87

5-2- خلاصه تحقیق…………………….. 87

5-3- پیشنهادات برای کارهای آتی……………………. 87

پیوست منابع و مآخذ……………………..89

چکیده:

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره‌گیری از روش‌هایی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غیرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است. داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. سه هدف اصلی برای داده کاوی از سیستم‌های اطلاعاتی توزیع شده وجود دارد: 1) شناسایی الگوهای مهم محلی در پایگاه داده‌های مجزا، 2) ادغام الگوهای محلی و استخراج الگوهای کلی پس از یکپارچه شدن پایگاه داده‌های توزیع شده، و 3) شناسایی الگوهای رابطه‌ای خاص در مجموعه داده‌های مختلف.

با توجه به قابلیت‌های عامل و سیستم‌های چندعامله و مناسب بودن آن‌ ها برای محیط‌های توزیع شده به نظر می‌رسد که بتوان از قابلیت‌های آنها برای داده‌کاوی در محیط‌های توزیع شده بهره برد. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستم‌های چندعامله در داده‌کاوی، بحث کاوش قوانین انجمنی در محیط‌های توزیع شده را مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیت‌ها و قابلیت‌های یک عامل و مزایای ترکیب تکنولوژی چند عامله با داده‌کاوی توزیع شده مورد بررسی قرار خواهند گرفت، و در فاز دوم یک معماری برای داده‌کاوی در محیط‌های توزیع شده برپایه‌ی تکنولوژی چند عامله ارائه می‌دهیم. بطور کلی دستاورد اصلی این تحقیق ارائه یک رویکرد مبتنی بر عامل برای مساله کاوش قوانین انجمنی با بهره گرفتن از قابلیت‌های هدفگرایی، هوشمندی، یادگیری و استدلال است.

فصل اول: مقدمه و کلیات تحقیق

1-1- مقدمه

در این فصل به معرفی کلیات این پژوهش و ساختار آن می‌پردازیم. بدین منظور ابتدا به بیان تعریف مسئله، ضرورت، اهداف و پرسش‌های این تحقیق خواهیم پرداخت و در نهایت به تعریف واژه‌ها و اصطلاحات مورد استفاده در پایان نامه می‌پردازیم.

2-1- تعریف مسأله و سوالات اصلی تحقیق

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آن‌ ها سر و کار دارد، بهره‌گیری از روش‌هایی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غیرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است.

داده‌کاوی توزیع شده عبارت است از کشف نیمه خودکار الگوهای پنهان موجود در داده‌ها، در حالتی که داده‌ها و یا مکانیزم‌های استنتاج، به صورت توزیع شده باشند. غیرمتمرکز بودن داده‌ها بدان معناست که داده‌ها به صورت توزیع شده بین دو یا چند سایت بوده و هزینه انتقال تمام یا بخشی از داده‌ها به یک سایت مرکزی، قابل صرف‌نظر نباشد. توزیع شده بودن مکانیزم‌های استنتاج، به معنای لزوم لحاظ کردن هزینه ارتباط بین مکانیزم‌های مختلف در حال استخراج دانش می‌باشد. این توزیع‌شدگی ممکن است به دلایل مختلفی از جمله ارائه شدن مکانیزم استخراج دانش در قالب یک سرویس اینترنتی و یا صرفاً ناشی از توزیع‌شدگی داده‌ها باشد. چنین رویکردی به داده‌کاوی، برخلاف جهت کلی تحقیقات انجام شده است که به طور عمده به تکنیک‌های متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه‌ای) داده‌های هدف متکی می‌باشند. مسائلی نظیر استخراج دانش در حالت عدم دسترسی به تمام داده‌های موجود، برقراری ارتباط موثر و بهینه با سایر مکانیزم‌های در حال استخراج دانش و نیز تبادل دانش یا اطلاعات میانی به جای اطلاعات خام، فقط تعدادی از مسائل اولیه داده‌کاوی توزیع شده با توجه به تعریف آن می‌باشند. بنابراین، داده‌کاوی توزیع شده در عین حال که به عنوان راه حلی کلیدی برای مشکلات اصلی پیش روی داده‌کاوی مطرح می‌باشد، خود سرمنشأ چالش‌ها و مسائل متعددی گردیده است؛ حل مؤثر این مشکلات منجر به استفاده هرچه بیشتر از داده‌کاوی و ایجاد امکانات جدید و بهره‌برداری از پتانسیل‌های موجود در قلمروهائی خواهد شد که علیرغم نیاز مبرم به داده‌کاوی، استفاده بسیار محدودی از آن به عمل می‌‌آورند.

3-1- اهمیت و ضرورت انجام تحقیق

داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. معمولاً پایگاه‌هایی که این داده‌ها را ایجاد یا دریافت می‌کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام به دنبال اهداف و منافع خود می‌باشند و حاضر نیستند دانش خود را به طور رایگان در اختیار دیگران قرار دهند. سیستم داده کاوی توزیع شده چند عامله، نسبتاً یک حوزه تحقیقاتی جدید است. با تکنولوژی نوظهور هوش مصنوعی سازگار است، انعطاف پذیری و هوشمندی خاصی دارد، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گیرد و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.

ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است

متن کامل را می توانید دانلود نمائید

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...