به حجم بزرگ و قابل توجهی از اطلاعات که در یک زمینه خاص بدست میآید، بیگ دیتا گفته میشود. بیگ دیتا، ترکیبی از اطلاعات ساختار یافته، نیمه ساختار یافته و غیر ساختار یافته میباشد. این اطلاعات ممکن است به شیوههای مختلفی و از مکانهای متنوعی گردآوری شده باشند. از این حجم بزرگ اطلاعات بدست آمده، معمولاً در راستای پروژههای دیتا ماینینگ، یادگیری ماشین، بازاریابی، مدیریت و … استفاده میشود.
در این مقاله، قصد داریم به بررسی مفهوم بیگ دیتا بپردازیم. لطفاً تا پایان مقاله با ما همراه باشید.
توضیحات بیشتر در مورد بیگ دیتا
در سالهای اخیر با گسترش و توسعه هر چه بیشتر اینترنت، تعداد افراد زیادی وارد این محیط شدهاند. هر یک از این افراد با هدف و انگیزه خاصی از اینترنت استفاده میکنند. رغبت روز افزون مردم به اینترنت باعث شده است تا دادههای بسیار حجیمی از مجموع عملکرد هر فرد در سطح اینترنت بدست آید. این موضوع، خود به عنوان یکی از عوامل اصلی در رونق مفهوم بیگ دیتا و نیاز هر چه بیشتر برای استفاده از آن شده است.
در حال حاضر همه روزه دادههای بسیاری در زمینههای مختلفی مانند: ارتباطات ابری، فعالیت افراد در سایتها، بورس، دنیای ارزهای دیجیتال و موارد دیگر در حال جمع آوری و اضافه شدن به حجم بزرگ دادههای قبلی هستند.
در این راستا، بسیاری از شرکتها و سایتها، برای شناخت هر چه بهتر رفتار مشتریان خود در بازار، نیازمند تحلیل این حجم از دادهها هستند. برای تحلیل و آنالیز این حجم از دادهها نیز محیطها و زبانهای برنامهنویسی مختلف با کتابخانهها و تولباکسهایی متفاوت در اختیار افراد قرار دارند.
ساختار بیگ دیتا
مفهوم بیگ دیتا، مربوط به مجموعه دادههای حجیمی است که با سرعتی بسیار بالا در حال رشد هستند. در حالت کلی بیگ دیتا را به دو بخش دادههای ساختار یافته و غیر ساختار یافته تقسیم میکنند.
دادههای ساختار یافته معمولاً شامل آن دسته از دادههایی است که قبلاً توسط شرکت و یا سازمان مربوط به آن و در قالب یک دیتابیس و یا صفحه گسترده مدیریت شده باشند. این نوع از دادهها اساساً به صورت عددی هستند.
در مقابل، دادههای غیر ساختار یافته نیز از مجموعه دادههای نامنظم به وجود میآیند. دادههای غیر ساختار یافته، معمولاً دادههای بدست آمده از شبکههای اجتماعی نظیر فیسبوک، اینستاگرام، واتساپ و … میباشند.

