۲۴ فروردین ۱۳۹۹

داده کاوی - ۲ - تعاریف

داده کاوی که ترجمه‌ی عبارت «Data Mining» می‌باشد دارای تعاریف مختلفی است که به شرح تعدادی از تعاریف مستند با ذکر منابع آنها می‌پردازیم.

۱ـ داده کاوی زیر شاخه‌ا‌ی بین علوم کامپیوتر و آمار است که هدف کلی آن استخراج اطلاعات (با روش‌های هوشمند) از یک مجموعه داده می‌باشد که با تبدیل اطلاعات به یک ساختار قابل درک، آن‌ها را برای استفاده‌ی بهتر آماده می‌کند.

منابع:

Data Mining Curriculum: A Proposal (Version 1.0; | ACM | 2006

The Elements of Statistical Learning: Data Mining, Inference, and Prediction | 2009

Encyclopædia Britannica: Definition of Data Mining | 2010

Data Mining: Concepts and Techniques (3rd ed.) | 2011

۲ـ اصطلاح داده کاوی به معنای استخراج داده، نادرست است. زیرا هدف، استخراج الگو و دانش از مقادیر زیادی از داده‌هاست نه استخراج داده‌ها از خودش.

منبع:

Data Mining: Concepts and Techniques (3rd ed.) | 2011

۳ـ داده کاوی فرایند کشف الگوها در مجموعه داده‌های بزرگ با استفاده از روش‌های موجود در فصل مشترک حوزه‌های یادگیری ماشین، آمار و سیستم‌های پایگاه داده‌است.

منبع:

Data Mining Curriculum: A Proposal (Version 1.0) | ACM | 2006

۴ـ داده کاوی مرحله تجزیه و تحلیل فرآیند «کشف دانش در پایگاه‌های داده» یا knowledge discovery in databases یا همان KDD است. فرایند KDD شامل پنج مرحله زیر می‌باشد که داده کاوی در مرحله چهارم آن قرار می‌گیرد.

  1. گزینش یا انتخاب
  2. پیش پردازش یا pre-processing
  3. داده کاوی
  4. تفسیر / ارزیابی

منبع:

From Data Mining to Knowledge Discovery in Databases" | 2008

قسمت بعدی شرح معیار‌های فاصله و پیاده‌سازی آنها در پایتون

فهرست مطالب `داده کاوی در پایتون`

نظرات خوانندگان این نوشته

تا به حال نظری ثبت نشد!

نظری در این مورد دارید؟ خوشحال می‌شم اون رو برام ارسال کنید.

captcha