فصل اول: مقدمه و کلیات تحقیق

1-1- مقدمه

پیش‌‌‌‌بینی آینده در زمینه‌های مختلف همواره برای انسان جالب و جذاب بوده است. با اطمینان می‌توان گفت که پیش‌‌‌‌بینی آینده و روند تغییرات در همه‌ی حوزه‌ها از دغدغه‌های اصلی و همیشگی مدیران سطح بالا و میانی می‌باشد. اما همواره مشکلات فراوانی در برابر آن وجود داشته است که انجام پیش‌‌‌‌بینی‌های دقیق و قابل اعتماد را تقریباً غیرممکن نموده است (توحیدی- مقدم و فرهادی، 1391). در سالهای اخیر با توجه به جذابیت‌هایی که در زمینه داده‌کاوی و همچنین پیش‌‌‌‌بینی که یکی از اهداف داده‌کاوی می‌باشد وجود دارد،تحقیقات زیادی در این حوزه انجام شده است.

در حال حاضر در اکثر دانشگاه‌ها بانک‌های اطلاعاتی وسیعی از ویژگی‌های دانشجویان موجود است که حجم بالایی از اطلاعات مربوط به سوابق آموزشی و تحصیلی را شامل می‌شود و از آن‌جایی که امروزه فضای رقابتی شدیدی در دانشگاه‌های مختلف حاکم شده است. مدیران باید سریع‌تر و درست‌تر از قبل تصمیم بگیرند. لازمه چنین امری، دستیابی سریع و دقیق به دانش است و برای دستیابی به دانش، وجود ابزارهای کارا و موثری نظیر داشبوردهای مدیریتی ضرورت دارد. ارزش داشبورد در اتصال ویژگی‌ها و کاربرد مناسب آن در سازمان است. گرچه تا به امروز توافق خاصی در اینکه داشبورد باید دقیقا چگونه باشد و چه کارهایی را انجام دهد، وجود ندارد اما به طور کلی انتظار می‌رود داشبورد، امکان جمع‌ آوری، خلاصه‌سازی و ارائه اطلاعات مناسب از منابع مختلفی را داشته باشد تا بدین وسیله کاربر بتواند وضعیت شاخص‌ها را به طور یک‌جا ملاحظه نماید.

هدف از انجام این تحقیق، داده‌کاوی‌آموزشی جهت مقاصد پیش‌‌‌‌بینی پیشرفت تحصیلی دانشجویان به همراه داشبورد آن می‌باشد، داده‌کاوی‌آموزشی یک حوزه علمی نوظهور است که به توسعه روش هایی برای کاوش و اکتشاف دانش در محیط‌های آموزشی می‌پردازد. پیشرفت‌ تحصیلی دانشجویان یکی از اموری است که در امر آموزش مطرح است و از مسائل مورد توجه مدیران آموزشی دانشگاه‌هاست. در این تحقیق سعی شده از داده‌کاوی و فنون آن استفاده شود و با بهره گرفتن از داده‌هایی که در دانشگاه‌ها موجود است پیشرفت تحصیلی را پیش‌‌‌‌بینی نمود. پس از آشنایی با ادبیات مسئله و مرورکلی بر ویژگی‌های اصلی یک داشبورد مدیریتی کارا، روش های داده‌کاوی و پیش‌‌‌‌بینی به عنوان مطالعه موردی کار پیش‌‌‌‌بینی در امور آموزش را انجام داده‌ایم. معدل دانشجویان به‌صورت تصادفی تغییر نمی‌کند، بلکه تغییرات بر اساس یک روند تکرار پذیر و قابل تشخیص صورت می‌گیرد، پس قابل پیش‌‌‌‌بینی است. برای این منظور پس از گردآوری داده‌ها جهت داده‌کاوی، با بهره گرفتن از روش های شبکه‌عصبی و درخت‌تصمیم C5، کار پیش‌‌‌‌بینی را انجام داده ایم و بعد از پیش‌‌‌‌بینی، طراحی و پیاده‌سازی داشبورد آن صورت گرفت.

2-1- تعریف مسأله و بیان سوال های اصلی تحقیق

از هنگامی که رایانه در تحلیل و ذخیره‌سازی داده‌ها به‌کار رفت (1950) پس از حدود 20 سال، حجم داده‌ها در پایگاه‌داده‌ها دو برابر شد ولی پس از گذشت دو دهه و همزمان با پیشرفت فن‌آوری اطلاعات(IT) هر دو سال یکبار حجم داده‌ها، دو برابر شد. همچنین تعداد پایگاه‌داده‌ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده‌ها و آمارشناسان با این سرعت رشد نكرد. حتی اگر چنین امری اتفاق می‌افتاد، بسیاری از پایگاه‌داده‌ها چنان گسترش یافته‌اند که شامل چندصدمیلیون یا چندصدمیلیارد رکورد ثبت شده هستند و امکان تحلیل و استخراج اطلاعات با روش‌های معمول آماری از دل انبوه داده‌ها مستلزم چند روز کار با رایانه‌های موجود است. حال با وجود سیستم‌های یکپارچه اطلاعاتی، سیستم‌های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده‌ها در پایگاه‌داده‌های مربوط اضافه شده و باعث به‌وجود آمدن انبارهای ( توده‌های ) عظیمی از داده‌ها شده است به‌طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه‌داده‌ها بیش از پیش نمایان شده است. داده‌کاوی یا استخراج و کشف سریع و دقیق اطلاعات باارزش و پنهان از این پایگاه‌داده‌ها از جمله اموری است که هر کشور، سازمان و شرکتی به منظور توسعه علمی، فنی و اقتصادی خود به آن نیاز دارد. با توجه به فصول دهم و یازدهم قانون برنامه سوم توسعه در خصوص داد و ستدهای الکترونیکی و همچنین تأکید بر برخورداری کشور از فن‌آوری‌های جدید اطلاعات برای دستیابی آسان به اطلاعات داخلی و خارجی، دولت مکلف شده است امکانات لازم برای دستیابی آسان به اطلاعات، زمینه‌سازی برای اتصال کشور به شبکه‌های جهانی و ایجاد زیرساخت‌های ارتباطی و شاهراه‌های اطلاعاتی فراهم کند. واضح است این امر باعث ایجاد پایگاه‌های عظیم داده‌ها شده و ضرورت استفاده از داده‌کاوی را بیش از پیش نمایان می سازد.

داده‌کاوی فرایندی تحلیلی است که برای کاوش داده‌ها(معمولا حجم عظیمی از داده‌ها) صورت می‌گیرد و یافته‌ها با به‌کارگیری الگوهایی، احراز اعتبار می‌شوند. این تکنولوژی امروزه دارای کاربرد بسیاروسیعی در حوزه‌های مختلف است به‌گونه‌ای که حدومرزی برای کاربرد این دانش درنظر نگرفته و زمینه‌های کاری این دانش را از ذرات کف اقیانوس‌ها تا اعماق فضا می‌دانند. امروزه، بیش‌ترین کاربرد داده‌کاوی در بانک‌ها، مراکز‌‌ درمانی، بیمارستآن‌ ها، بازاریابی هوشمند، مراکز تحقیقاتی و زمینه‌هایی که در آن مقدار زیادی از داده‌ها در حال جمع‌ آوری و ذخیره می‌باشد. هدف اصلی داده‌کاوی پیش‌‌‌‌بینی است. یکی از عناصر کلیدی در مدیریت و تصمیم‌گیری، پیش‌‌‌‌بینی پارامترها و متغیرهای لازم در یک محدوده سیستمی می‌باشد.

پیش‌‌‌‌بینی به عنوان یکی از مهم‌ترین شاخه‌های علمی مطرح شده است و روز به روز توسعه و پیشرفت می نماید و در بخش های مختلف به کار گرفته

پایان نامه

 می‌شود. پیشرفت‌های اخیر در تکنولوژی‌های جمع‌ آوری و ذخیره‌سازی داده، موجب شده که سازمان‌ها، حجم زیادی از داده‌های مربوط به فعالیت‌های روزانه‌ی خود را انباشته کنند. داده‌هایی که توسط سازمان‌ها جمع‌ آوری شده است بسیار ارزشمند است و برای اهداف مختلف می‌تواند مورد استفاده قرار گیرد. یکی از این اهداف پیش‌‌‌‌بینی‌هایی می‌باشد که جهت بهبود عملکرد و برنامه‌ریزی‌هایشان از آن‌ ها استفاده می‌نمایند.

مدیران سازمان‌های مختلف به دلیل عدم قطعیت و پیچیدگی محیط سعی بر آن دارند تا مکانیزمی را در اختیار داشته باشند که بتوانند آن‌ ها را در امر تصمیم‌گیری‌شان یاری و مشاوره دهد و به همین دلیل سعی در استفاده از روش‌های پیش‌‌‌‌بینی دارند که به واسطه‌ی آن‌ ها تخمین‌هایشان به واقعیت نزدیک و خطاهایشان بسیار‌کم باشد. این امر باعث توجه بسیاری به روش‌های نوین پیش‌‌‌‌بینی شده است.

داده‌کاوی پل ارتباطی میان علم آمار، علم کامپیوتر، هوش‌مصنوعی، الگوشناسی، فراگیری ماشین و بازنمایی بصری داده می‌باشد. داده‌کاوی فرایندی پیچیده جهت شناسایی الگوها، مدل‌های صحیح و بالقوه مفید در حجم وسیعی از داده است، به طوریکه این الگوها ومدل‌ها برای انسآن‌ ها قابل درک باشند(Han et al,2006). داده‌کاوی به‌صورت یک محصول قابل خریداری نیست، بلکه یک رشته علمی و فرایندی است که باید به‌صورت یک پروژه پیاده‌سازی شود. در گذشته موسسات آموزشی از مزیت داده‌کاوی به خوبی بعضی حوزه‌های دیگر توجه نداشته‌اند اما در سال‌های اخیر تحقیقات زیادی در زمینه بكارگیری فرایند داده‌كاوی در امر آموزش صورت می‌گیرد. این زمینه تحقیقاتی جدید، داده‌كاوی‌آموزشی نامیده می‌شود كه به امر توسعه روش‌های كشف دانش از داده‌های محیط‌های آموزشی خصوصاً دانشجویان می‌پردازد(Romero et al,2007). داده‌های جمع‌ آوری شده در مورد دانشجویان می‌تواند شخصی یا آموزشی باشد كه از طریق دفاتر و پایگاه داده‌های موجود در مدارس یا دانشكده‌ها جمع‌‌آوری می‌شوند. این نوع داده‌ها همچنین از طریق سیستم‌های آموزش الكترونیكی قابل دستیابی هستند. با به‌كارگیری تكنیک‌های شبکه‌عصبی و درخت‌تصمیم روی داده‌های آموزشی می توان اطلاعات و دانش مفیدی را از آن‌ ها استخراج كرد كه این دانش نیز به نوبه خود می‌تواند برای درك و فهم رفتار دانشجویان، كمك در امر آموزش و تدریس، ارزیابی و بهبود برنامه‌آموزشی، افزایش بازدهی و كارایی دانشجویان و اهداف دیگری بكار گرفته شود.

امروزه فضای رقابتی شدیدی در دانشگاه‌های مختلف حاکم شده است. دانشگاه‌ها برای رسیدن به اهداف خود و سبقت گرفتن از یکدیگر در تلاشند. دانشگاه‌ها نیاز به داشبورد دارند تا اطلاعات جزیی را در یک لحظه داشته باشند و این چیزی فراتر از یک نگاه کلی است. داشبوردها جهت نمایش حجم بزرگی از داده‌ها در یک نمایش گرافیکی قابل فهم هستند که کاربران با بهره گرفتن از آن‌ ها قادر به تحلیل اطلاعات از طریق داده‌ها باشند (LogiXML,2011).

داشبوردهای مدیریتی سیستم‌های نرم‌افزاری نوینی هستند که به سازمان‌ها در جهت غنی‌سازی اهداف با بهره گرفتن از اطلاعات و تجزیه و تحلیل آن‌ ها کمک می‌کند. داشبورد به مدیران این امکان را می‌دهد تا با تعریف، نظارت و تحلیل شاخص‌ها در ایجاد تراز بین اهداف و فعالیت‌ها و ایجاد یک محیط نمایش مشترک بین اهداف و فعالیت‌ها برای تصمیم‌گیری درست و کارامد اقدام نمایند. یک نکته که معمولا به اشتباه گرفته می‌شود این است که داشبورد تنها برای مدیران ارشد به منظور ارائه اطلاعات جامع از عملکرد سازمان به آن‌ ها مورد استفاده قرار می گیرد. امروزه تکنولوژی داشبورد سازمانی به‌گونه‌ای است که می‌تواند در سطوح مختلف سازمان استقرار یابد(زرین،1388).

   در این تحقیق سعی شده است تا با بهره گرفتن از اطلاعات مربوط به دانشجویان از جمله سال و ترم ورود به دانشگاه، نوع تاهل، معدل‌های دریافتی در هر ترم، نوع تحصیل، نوع شغل و دیگر اطلاعات دانشجویان دانشگاه‌های سراسری و آزاد اسلامی استان قم و امکانات موجود در محیط نرم‌افزار‌های Sql server، Matlab ، Qlick view ، Clementine ، Excelو همچنین با خوشه‌بندی داده‌ها و بکار بردن تکنیک‌های داده‌کاوی به پیش‌بینی پیشرفت‌ تحصیلی دانشجویان بپردازیم و با بهره گرفتن از نتایج پیش‌بینی و نظر خبرگان، شاخص‌ها را تعیین کرده و طراحی و پیاده‌سازی داشبورد مربوطه را انجام دهیم.

در راستای موضوع ارائه شده ما به دنبال آن هستیم تا به سوالات زیر پاسخ دهیم:

1- چه تکنیک داده‌کاوی برای داده‌هایمان پیش‌بینی بهتری دارد؟

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...