
ماهو علم البيانات
علم البيانات هو فن الكشف عن الرؤى والاتجاهات التي تتوارى خلف البيانات. وهو استنطاق البيانات كي تروي قصة للوصول إلى رؤية ومن خلال هذه الرؤى يمكنك تحديد خيارات إستراتيجية لصالح شركة أو مؤسسة ما لاتخاذ قرار ما أو الخروج بتوصيات معينة.
علم البيانات هو مجال معني بالعمليات والأنظمة اللازمة لاستخراج البيانات بأشكالها المختلفة، سواء كانت هذه البيانات منظمة أو غير منظمة. علم البيانات هو دراسة البيانات تماماً كما تعنى العلوم الفيزيائية بدراسة الفيزياء أو العلوم الرياضية بدراسة العلاقات الرياضية. فالبيانات شي حقيقي وله خصائصه الفعلية ونحن بحاجة لدراستها إذا أردنا العمل عليها.
بدأ مصطلح علم البيانات في الظهور في ثمانينيات وتسعينيات القرن الماضي، عندما قام بعض الأساتذة الجامعيين بالنظر في مقرر الإحصاء، وفضلوا تسميتها بعلم البيانات. ولكن، ما المقصود بعلم البيانات؟ أرى أن علم البيانات هو محاولة الفرد للتعامل مع البيانات، للعثور على إجابات عن أسئلة بسبر أغوارها.
برزت أهمية علم البيانات في الآونة الأخيرة نظرًا لتراكم كميات هائلة من البيانات في العالم. لقد اعتدنا أن نقلق بشأن نقص البيانات. أما اليوم فلدينا طوفان منها. في السابق لم تكن لدينا خوارزميات، ولكنها أصبحت الآن في متناولنا. في السابق كانت البرامج باهظة الثمن، ولكنها أصبحت الآن مفتوحة المصدر ومجانية. في السابق لم يكن باستطاعتنا تخزين كميات كبيرة من البيانات، أما الآن فتكلفة التخزين لا تُذكر. بوسعنا حفظ كميات مهولة من البيانات بتكلفة محدودة. ومن ثم فالأدوات اللازمة للتعامل مع البيانات، وتوفر تلك البيانات، والقدرة على تخزينها وتحليلها، قد أصبحت كلها متاحة رخيصة وبتكلفة زهيدة. وهي متوفرة على نطاق واسع، لذا فاليوم هو الوقت الأمثل لكي تطور نفسك في علم بيانات.
نصيحتي لمن يطمح أن يصبح عالم بيانات أن يكون ذا فضول مولعًا بالجدل وقاطعًا في أحكامه المبنية بشكل موضوعي على تحليل البيانات. الفضول ميزة لا غنى عنها إن لم تكن فضوليًا، فلن تعرف ماذا تفعل بالبيانات. كذلك الولع بالجدل لأنه إذا كان بإمكانك أن تقدم حُجة وأن تدافع عن قضية فهذا يعني أنك قادر على البدء من موضع ما ثم التعلم من البيانات ومن ثم تعديل افتراضاتك و ستساعدك البيانات على التعلم.
علم البيانات اليوم يدخل في كافة القطاعات بسبب الثورة التكنولوجية وتوفر مصادر البيانات والحوسبة السحابية. لنفترض أنك تريد أن تكون عالم بيانات يعمل لدى شركة لتكنولوجيا المعلومات أو شركة تمارس نشاطها على الإنترنت ستحتاج في تلك الحالة إلى مجموعة مختلفة من المهارات. بينما إذا كنت تريد أن تكون عالم بيانات في قطاع الصحة فستحتاج إلى مجموعة مختلفة من المهارات لفهم البيانات والعلاقة بينها وبين ما تتوصل إليه نتائج تحليلك.
نُظم الحوسبة السحابية Cloud Computıng ساهمت بشكل كبير بمساعدة علماء البيانات في تنفيذ خوارزمياتهم وتحليلاتهم للبيانات فما عليك سوى أن تأخذ بياناتك ومعلوماتك وتضعها في السحابة، في نظام التخزين المركزي. ويتيح لك ذلك تجاوز المحدودية المادية لأجهزة الحواسيب الشخصية والأنظمة التي تستخدمها. كما تتيح لك السحابة إمكانية الاستفادة من التحليلات وإمكانات التخزين للأجهزة المتطورة والتي ليست بالضرورة أجهزة مملوكة لك أو لشركتك. تمكنك السحابة من تخزين كميات ضخمة من البيانات على خوادم في أماكن مترامية وإلى جانب ذلك توفر لك إمكانية الاستفادة من خوارزميات حاسوبية بالغة التقدم مع القدرة على تنفيذ عمليات حاسوبية تتطلب أداءً متطورًا باستخدام أجهزة غير مملوكة لك. فكر بالأمر على هذا النحو لديك بعض المعلومات لا تستطيع تخزينها، فترسلها إلى مكان للتخزين، ولنُسمِّه السحابة.والخوارزميات التي تحتاج إلى استخدامها ليست بحوزتك. ولكن ذلك المكان المسمى السحابة تتوافر عليه تلك الخوارزميات. وما عليك فعله هو استخدام تلك الخوارزميات على مجموعات بيانات كبيرة للغاية وستتمكن من ذلك برغم أن أنظمتك وأجهزتك وبيئة الحوسبة الخاصة بك التي لا تتيح لك القيام بذلك. إذاً، فالسحابة أمر رائع جداً لكافة علماء البيانات. الجانب الآخر لتميز السحابة هو أنها تسمح لأطراف متعددة أن تتعامل مع نفس البيانات في نفس الوقت. فيكون بوسعك التعامل مع نفس البيانات التي يعمل عليها زملاء لك في أي مكان آخر مع وجود فريق آخر في مكان ثاني وثالث مختلف. إنهم يعملون بشكل جماعي لأن المعلومات والخوارزميات والأدوات والنتائج وكل ما يحتاجون إليه متوفر في مكان مركزي واحد نسميه السحابة Cloud.
كذلك من ميزة السحابة فإن البرمجيات والخوارزميات التي تكون متاحة على السحابة لست بحاجة لصيانتها ولست بحاجة لتنزيلها على جهازك. كذلك لست بحاجة للقلق بشأن تحديثها.
Tag:علم البيانات