داده بزرگ (Big Data) چیست و چه کاربرد‌هایی دارد؟

۰۸ آبان ۱۳۹۸
داده‌های بزرگ این امکان را دارند که بینش‌های ارزشمندی را در اختیار مشتریان خود قرار دهند.

داده بزرگ (Big Data) چیست؟

 

داده‌های بزرگ (big Data) اصطلاحی است که حجم زیادی از داده‌های ساختاری، نیمه ساختار یافته و بدون ساختار را توصیف می‌کند. این داده‌ها قابلیت دارند تا برای اطلاعات استخراج شوند و در پروژه‌های یادگیری ماشین و سایر برنامه‌های کاربردی پیشرفته تحلیلی مورد استفاده قرار گیرند. داده‌های بزرگ غالباً توسط سه متغیر اصلی مشخص می‌شوند، که شامل حجم داده ها، طیف گسترده‌ای از انواع داده‌ها و سرعتی که آن داده‌ها باید پردازش شوند، است. این خصوصیات نخستین بار توسط داگ لنی، تحلیلگر گارتنر، در گزارشی که در سال ۲۰۰۱ منتشر شد، تعیین گردید. اخیرا، چندین متغیر دیگر به توضیحات داده‌های بزرگ از جمله صحت، ارزش و تغییرپذیری اضافه شده‌اند. اگرچه داده‌های بزرگ با حجم مشخصی از داده‌ها برابر نیستند، اما این اصطلاح اغلب برای توصیف ترابایت ها، پتابایت‌ها و حتی اگزابایتی از داده‌های ضبط شده در طول زمان استفاده می‌شود.

اهمیت داده‌های بزرگ چیست؟

داده‌های بزرگ این امکان را دارند که بینش‌های ارزشمندی را در اختیار مشتریان خود قرار دهند که میتوانند از آن‌ها برای اصلاح برنامه ها، تکنیک‌های بازاریابی، افزایش میزان جذب مشتری و نرخ تبدیل استفاده کنند. برندها و مشاغلی که از داده‌های بزرگ استفاده می‌کنند، نسبت به افرادی که این داده‌ها را نادیده میگیرند دارای مزیت رقابتی هستند، زیرا این توانایی را دارند تا تصمیمات شغلی سریعتر و آگاهانه تری اتخاذ کنند. علاوه بر این، استفاده از داده‌های بزرگ، شرکت‌ها را قادر میسازد که به طور فزاینده‌ای مشتری محور شوند. از داده‌های گذشته و واقعی میتوان برای ارزیابی اتفاقات در حال وقوع و آینده استفاده کرد، در نتیجه به مشاغل اجازه میدهد استراتژی‌های بازاریابی خود را به روز کرده و بهبود بخشند تا در مقابل خواسته‌ها و نیازهای مشتری پاسخگو باشند.

داده‌های بزرگ این امکان را دارند که بینش‌های ارزشمندی را در اختیار مشتریان خود قرار دهند.

داده‌های بزرگ این امکان را دارند که بینش‌های ارزشمندی را در اختیار مشتریان خود قرار دهند.

 

چنین داده‌های گسترده‌ای میتوانند از منابع مختلفی مانند سیستم‌های معامله تجاری، بانک اطلاعاتی مشتری، سوابق پزشکی، لیست‌های مربوط به کلیک در اینترنت، برنامه‌های تلفن همراه، شبکه‌های اجتماعی، نتایج حاصل از آزمایش‌های علمی، داده‌های تولید شده توسط ماشین و سنسورهای داده در زمان واقعی جمع آوری شوند. در محیط اینترنت، داده‌ها ممکن است به شکل خام خود باقی مانده و یا قبل از تجزیه و تحلیل با استفاده از نرم افزار تهیه داده، پردازش شوند. داده‌های بد منجر به تحلیل نادرست می‌شوند و ممکن است ارزش تحلیل تجاری را تضعیف کنند، این امر به طور کلی میتواند باعث عدم اعتماد مدیران شود. مقدار داده‌های نامشخص در یک سازمان، میبایست قبل از استفاده در برنامه‌های کاربردی تحلیلی، محاسبه شوند. تیم‌های فناوری اطلاعات و تجزیه و تحلیل نیز، باید از داشتن اطلاعات دقیق و کافی برای تولید نتایج معتبر اطمینان حاصل نمایند.

داده‌های بزرگ چگونه ذخیره و پردازش می‌شوند؟

نیاز به سرعت برای رسیدگی به داده‌های بزرگ، خواسته‌های بی نظیری را در زیرساخت‌های محاسباتی اساسی ایجاد می‌کند. قدرت محاسباتی مورد نیاز برای پردازش سریع حجم‌ها و انواع زیادی از داده ها، میتواند یک سرور یا خوشه سرور را تحت الشعاع قرار دهد. سازمانها باید برای دستیابی به سرعت لازم، از ظرفیت پردازش کافی برای داده‌های بزرگ استفاده کنند. این به طور بالقوه میتواند صدها یا هزاران سرور نیاز داشته باشد تا بتوانند کار پردازش را توزیع کرده و در یک معماری خوشه‌ای مشترک همکاری کنند. دستیابی به چنین سرعتی با روشی مقرون به صرفه، خود یک چالش اساسی محسوب می‌شود. بسیاری از رهبران شرکت‌ها برای حمایت از بارهای بزرگ داده، از سرمایه گذاری در یک سرور گسترده و زیرساخت‌های انبارداری خودداری می‌کنند. در نتیجه، محاسبات ابری عمومی، اکنون وسیله اصلی برای میزبانی سیستم‌های داده بزرگ است. یک ارائه دهنده ابر عمومی میتواند چند پتابایت از داده را ذخیره کرده و تعداد سرورهای مورد نیاز را به‌اندازه کافی کاهش دهد، تا یک پروژه بزرگ تجزیه و تحلیل داده‌ها انجام گیرد.

با افزایش و جمع آوری داده ها، سوءاستفاده از آن‌ها نیز افزایش یافته است.

با افزایش و جمع آوری داده ها، سوءاستفاده از آن‌ها نیز افزایش یافته است.

 

 

محدودیت‌های ثبت داده برای شرکت ها

سال هاست که شرکت ها، با محدودیت‌هایی درمورد نوع داده‌ای که از مشتریان خود جمع آوری می‌کنند، رو به رو هستند. با این حال، با افزایش و جمع آوری داده ها، سوءاستفاده از آن‌ها نیز افزایش یافته است. شهروندان نگران، که سوءاستفاده از داده‌های خود را تجربه کرده‌اند و یا قربانی نقض اطلاعات شده‌اند، خواستار وضع قوانینی پیرامون شفافیت جمع آوری داده‌ها و حریم خصوصی آن‌ها هستند. اعتراضات مربوط به نقض حریم شخصی، باعث شد تا اتحادیه اروپا آیین نامه حمایت از داده‌های عمومی (GDPR) را تصویب کند، که در ماه مه سال ۲۰۱۸ به اجرا درآمد. این آیین نامه، نوع داده‌هایی را که سازمانها میتوانند جمع آوری کنند محدود می‌کند و به رضایت احتمالی افراد نیاز دارد.

 

0
برچسب ها :
نویسنده مطلب علی فلاحتی

بدون دیدگاه

لینک های مفید