پایان نامه درباره فن اوری اطلاعات داده کاوی تکنیک ها و متدلوژی ،فرمت ورد، تعداد صفحه77
مقدمه:
از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (1950) پس از حدود 20 سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافتهاند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[3]
حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن انبارهای عظیمی از داده ها شده است.
این واقعیت، ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است، چنان که در عصر حاضر گفته می شود اطلاعات طلاست.
هم اکنون در هر کشور، سازمان، شرکت و غیره برای امور بازرگانی، پرسنلی، آموزشی، آماری و غیره پایگاه داده ها ایجاد یا خریداری شده است. به طوری که این پایگاه داده ها برای مدیران، برنامه ریزان، پژوهشگران جهت، تصمیم گیری های راهبردی، تهیه گزارش های مختلف، توصیف وضعیت جاری خود و سایر اهداف می تواند مفید باشد. بسیاری از این داده ها از نرم افزارهای تجاری، مثل کاربردهای مالی، ERPها، CRMها و web log ها، می آیند. نتیجه این جمع آوری داده ها این میشود که در سازمانها، داده ها غنی ولی دانش ضعیف، است. جمع آوری داده ها، بسیار انبوه میشود و بسرعت اندازه آن افزایش می یابد و استفاده عملی از داده ها را محدود می سازد.[2]
دادهکاوی استخراج و تحلیل مقدار زیادی داده بمنظور کشف قوانین و الگوهای معنی دار در آنهاست. هدف اصلی داده کاوی، استخراج الگوهایی از داده ها، افزایش ارزش اصلی آنها و انتقال داده ها بصورت دانش است.
دادهکاوی، بهمراه OLAP، گزارشگری تشکیلات اقتصادی(Enterprise reporting) و ETL، یک عضو کلیدی در خانواده محصول Business Intelligence(BI)، است.[2]
حوزههای مختلفی وجود دارد که در آنها حجم بسیاری از داده در پایگاهدادههای متمرکز یا توزیع شده ذخیره میشود. برخی از آنها به قرار زیر هستند: [6]
- کتابخانه دیجیتال: یک مجموعه سازماندهی شده از اطلاعات دیجیتال که بصورت متن در پایگاهدادههای بزرگی ذخیره می شوند.
- آرشیو تصویر: شامل پایگاهداده بزرگی از تصاویر به شکل خام یا فشرده.
- اطلاعات زیستی: بدن هر انسانی از 50 تا 100 هزار نوع ژن یا پروتئین مختلف ساخته شده است. اطلاعات زیستی شامل تحلیل و تفسیر این حجم عظیم داده ذخیره شده در پایگاهداده بزرگی از ژنهاست.
- تصاویر پزشکی: روزانه حجم وسیعی از دادههای پزشکی به شکل تصاویر دیجیتال تولید میشوند، مانند EKG، MRI، ACT، SCAN و غیره. اینها در پایگاهدادههای بزرگی در سیستمهای مدیریت پزشکی ذخیره می شوند.
- مراقبتهای پزشکی: بجز اطلاعات بالا، یکسری اطلاعات پزشکی دیگری نیز روزانه ذخیره میشود مانند سوابق پزشکی بیماران، اطلاعات بیمه درمانی، اطلاعات بیماران خاص و غیره.
فهرست:
داده کاوی و کاربرد آن در کسب و کار هوشمند بانک.... 15
داده کاوی درمدیریت ارتباط بامشتری.. 16
کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی.. 17
داده کاوی آماری و مدیریت بهینه وب سایت ها 21
داده کاوی در مقابل پایگاه داده Data Mining vs database. 22
منابع اطلاعاتی مورد استفاده. 24
مسائل کسب و کار برای دادهکاوی.. 26
چرخه تعالی داده کاوی چیست؟. 27
متدلوژی دادهکاوی و بهترین تمرینهای آن. 31
یادگیری چیزهایی که درست نیستند. 32
الگوهایی که ممکن است هیچ قانون اصولی را ارائه نکنند. 33
چیدمان مدل ممکن است بازتاب دهنده جمعیت وابسته نباشد. 34
ممکن است داده در سطح اشتباهی از جزئیات باشد. 35
یادگیری چیزهایی که درست ولی بلااستفادهاند. 37
مدلها، پروفایلسازی، و پیشبینی.. 38
مرحله 1: تبدیل مسئله کسب و کار به مسئله دادهکاوی.. 43
مرحله 2: انتخاب داده مناسب... 45
مرحله سوم: پیش به سوی شناخت داده. 48
مرحله چهارم: ساختن یک مجموعه مدل. 49
مرحله پنجم: تثبیت مسئله با دادهها 52
مرحله ششم: تبدیل داده برای آوردن اطلاعات به سطح.. 54
پایان نامه درباره فن اوری اطلاعات داده کاوی تکنیک ها و متدلوژی