همراه با پیشرفت سریع فناوری اطلاعات، رشد انفجاری تولید دادهها، افزایش ظرفیت تجهیزات ذخیرهساز اطلاعات و ابداع روشهای مختلفی برای پردازش اطلاعات قابل مشاهده است. همچین در دنیای کسبوکار، بانکهای اطلاعاتی برای پاسخگویی به تراکنشهای تجاری پدید آمدند که توسط بزرگان دنیای نرمافزار ساخته شدند و توسط خردهفروشان و کسبوکارهای فعال در زمینه تجارت الکترونیک به کار گرفته شدهاند. از سویی دیگر، روزانه حجم بسیار عظیمی از دادهها در حوزههای مختلف (مالی، تجاری و علمی) تولید میشوند. از این رو جهت مدیریت درست این دادهها نیاز به مفهوم مهمی بهنام دادهکاوی است. دادهکاوی روشها و ابزارهایی را برای خودکارسازی تحلیلها و اکتشاف مجموعه دادههای بزرگ و پیچیده ارائه میکند. امروزه، تحقیقات گستردهای در ارتباط با دادهکاوی در حوزههای متنوع و گستردهای نظیر آمار، علوم کامپیوتر، یادگیری ماشین، مدیریت پایگاه دادهها و بصریسازی دادهها انجام میشود. البته دادهکاوی منحصر به حوزههای آماری نیست و حتی در ارتباط با پردازش سیگنالها نیز کاربرد دارد. دادهکاوی در زمینههای مختلف قابل استفاده است، زیرا تمامی شرکتها به دنبال آن هستند تا حجم انبوهی از دادههای خامی که در اختیار دارند را به اطلاعات و دانش قابل فهم تبدیل کنند.
در واقع دادهکاوی به معنای بهکارگیری ابزارهای تحلیلگر دادهها برای کشف الگوها و روابطی است که ناشناخته بودهاند. این ابزارها و راه کارها ممکن است مدلهای آماری، الگوریتمهای ریاضی و روشهای یادگیری ماشین باشند که اینکار به شکل خودکار و با استناد به تجربیات قبلی که از طریق شبکههای عصبی بهدست آوردهاند یا درختهای تصمیمگیری انجام شود. البته باید به این نکته دقت کرد که دادهکاوی محدود به گردآوری و مدیریت دادهها نیست و تجزیه و تحلیل اطلاعات و پیشبینیها را شامل میشود. دادهکاوی علمی قوی است که میتواند در همه چیز سرک بکشد و از دل ندانستهها بسیاری از سؤالات را جواب دهد. امروزه اهمیت این علم در شرکتهای بزرگ به قدری شناخته شده است که قبل از تصمیمگیری و برنامهریزی برای انجام کمپینهای تخصصی و یا طراحی محصولات پر هزینه، ابتدا برای به دست آوردن دادههای عمومی اقدام میکنند. اما آنچه باعث شده علم دادهکاوی تا این حد مورد توجه قرار بگیرد، ضریب اطمینان بالای تصمیمات اتخاذ شده بر اساس تحلیلهای دادهای و نتایجی است که ایجاد میشود. زمانی که مدیران بر اساس احساسات و شهود اقدام به سیاستگذاری و تصمیمگیری در مورد موضوعی میکنند، احتمال خطا در تشخیص مشکل و ارائه راهکار بسیار زیاد است، در نتیجه ریسک زیادی منابع سازمان را تهدید میکند. درحالی که با تصمیمگیری بر اساس تحلیلهای حاصل از دادهکاوی، از هدر رفت منابع شرکت در یک اقدام ناکارآمد و غیرضروری جلوگیری میشود. دادهکاوی به مدیران کمک میکند تا پیش از هر چیزی، دید درستی از جامعه مورد بررسی پیدا کنند و پس از عارضهیابی درست، راهکاری بهینه برای حل آن مشکل ارائه دهند.
دادهکاوی در زمینههای علمی، سلامت بهداشت و همینطور اقتصاد و بانکداری نیز ورود کرده است. همچنین یکی از مهمترین مزایای دادهکاوی در شناخت مشتریان سودآور است که شرکتها تاکید زیادی بر روی این موضوع دارند. با توجه به ارزش این علم این کتاب در سه فصل تنظیم و تدوین شده است که در فصل اول به مفاهیم کلیدی و پایهای دادهکاوی پرداخته و در فصل دوم تکنیک و الگوریتمهای پر کاربرد دادهکاوی معرفی و در انتها در فصل سوم کاربرد دادهکاوی در علوم مختلف که به نسبت بقیه کاربردیتر و مهمتر هستند معرفی و بررسی شده است. امید است مجموعه مطالب این کتاب بتواند بخش کوچکی از ابهامات و نیازهای خواننده را برطرف سازد.
طراحی و پیاده سازی :