بیگ دیتا یا کلان داده

هر نوع داده ای که بدلیل حجم بالا نتوان با روشهای عمومی (مثلا با اکسل) به بررسی آنها پرداخت بیگ دیتا گفته می شود. داده های کلان می توانند ساختارنیافته، نیمه ساختار یافته، یا ساختاریافته باشند. حجم بیگ دیتا ابدا شامل تعریف دقیقی نیست و ممکن است بین چند مگابایت تا چندین زتابایت متغیر باشد (بستگی به نگرش سازمان دارد). عوامل مهم در تشخیص بیگ دیتاها شامل: حجم، تنوع، سرعت، صحت داده ها، ارزش آنها، و قابلیت تغییر به سایر انواع داده می شود (مثلا داده های صوتی به حجم 10 گیگابایت که بتوان از طریق هوش مصنوعی به داده های عددی تبدیل کرد، عیب محسوب می شوند زیرا با آنکه شدنی است اما سخت و پرهزینه و زمانگیر است و در نهایت اطلاعات بسیار کمتری را نسبت به 10 گیگابایت فایل متنی ارائه می دهد و دارای اطلاعات ساختار بندی شده نیز نیست لیکن ممکن است حاوی اطلاعات بسیار باارزشی باشد که تمام عیوب قبلی را تحت الشعاع قرار دهد). هرچه بیگ دیتاها رشد می کنند، مشخص است که برای ذخیره سازی و تحلیل آنها نیاز به زیرساختهای سخت افزاری قوی تری است.

بر اساس نظریات: مشی، کیچین، مک آردل، اشتون، اسنایدرز، ماتزات، ریپس، گراهام، اندرسون،