تصوير البيانات
تصوير البيانات
الكاتب: أيوب العيسى
أضحى مجال علم البيانات من المجالات ذات الطلب العالي عالمياً لأهميتها وتأثيرها في عالم الأعمال والأبحاث. وأحد المجالات التي تتفرع من علم البيانات وتحليل البيانات، مجال تصوير البيانات (VisualizatioData) وعرضها في هذه المقالة سنعرض تعريف تصوير البيانات وسنعرج على أبرز التقنيات والأدوات المستخدمة في هذا المجال
يعرف تصوير البيانات أو التصوير البياني (Data Visualization) بأنه تقديم البيانات بأسلوب فني جميل الشكل ومنسق اللون وواضح المعالم، بخلاف وسائل التقديم العلمية التي تهتم بالمحتوى أكثر من المظهر، وذلك لإثارة اهتمام وفضول غير المتخصصين والمتخصصين. يلقى المجال اهتماماً متزايداً لدى العلماء، نظراً للحضور الذي يحظى به التعبير البصري عن البيانات في وسائل الإعلام والتواصل الاجتماعي المرئية. والغرض من التعبير البصري للبيانات هو توضيحها ومن ثم البلوغ بها إلى التأثير على القارئ [1]. يعرض الشكل 1 دورة حياة تحليل البيانات وتصويرها
تنبع أهمية التصوير البياني من كونه أداة فعالة لتسهيل قراءة التقارير في خضم تراكم البيانات الضخمة، وكذلك يساعد متخذي القرارات برؤية أوضح للبيانات وصورة أشمل بهدف تسهيل اتخاذ القرارات. في الشكل التالي يوضح مراحل تحليل البيانات وتصويرها
شكل 1 عملية تحليل البيانات وتصويرها تبدأ بجلب البيانات من مصادرها ثم العمل على تنظيفها وتصحيح
البيانات المفقودة إن وجدت ثم باستكشاف البيانات وذلك بالتعرف على البيانات، ثم تحليل البيانات وتطبيق
النماذج لاستخلاص المعلومات المفيدة منها، ثم في المرحلة الأخيرة يتم تصوير (عرض) البيانات.
استخدامات التصوير البياني:
في هذه الفقرة سنذكر عددًا من استخدامات التصوير البياني على سبيل المثال لا الحصر:
تصوير البيانات بطريقة فعالة ووضعها في صفحة واحدة لتسهل وتبسط من إدارك وفهم الحقائق والمعلومات.
منصة للتعرف على البيانات واستكشافها بحيث يمكن:
تصوير البيانات بطريقة فعالة ووضعها في صفحة واحدة لتسهل وتبسط من إدراك وفهم الحقائق والمعلومات.
منصة للتعرف على البيانات واستكشافها بحيث يمكن:
-مشاهدة البيانات من عدة أبعاد مختلفة، بعد زماني/مكاني.
-بحث وتنقيح البيانات صوريا.
-تلخيص معلومة، وحكاية قصة.
-معاينة وتتبع الأنماط المتكررة.
-جذب الاهتمام وإمتاع الحضور.
-أداة فعالة تسهل على أصحاب القرارات من اتخاذ قراراتهم.
أنواع العلاقات وأنواع التصوير البياني:
عند استعراض البيانات ووضعها تحت مفهوم الرسم البياني أو التصوير البياني، يتم الأخذ بالحسبان معرفة نوع العلاقة (Relations) بين المتغيرات (Variables) وعلى ضوءها يتم اختيار نوع التصوير البياني.
في هذه الفقرة نستعرض بعض أشهر أنواع التصوير البياني مع التعريج حول بعض العلائق [3]:
السلاسل الزمنية (SeriesTime) وهي مجموعة من المشاهدات أو المتغيرات مرتبة وفق حدوثها في الزمن. يوضح الشكل (5) مثال على هذا النوع.
التصنيف والترتيب (Ranking) يستخدم هذا النوع عند الرغبة بترتيب المتغيرات، مثل من الأعلى إلى الأدنى. يوضح الشكل (4) مثال على هذا النوع.
العلاقة المترابطة (Correlation) مقارنة بين متغيرين أو أكثر، لمعرفة ما إذا كان هناك تغير سلبي أو إيجابي بينهم، يوضح الشكل (3) مثال على هذا النوع.
الانحراف (Deviation) مقارنة بين المتغير المنشود والمعدل الطبيعي.
علاقة جزء من كل (Part-to-whole) وهي علاقة توضح مقدار المتغير مقارنة ببقية المتغيرات، انظر الشكل (2(
التوزيع التكراري (Frequency distribution) يستخدم عادة نوعية الأعمدة الرئيسية المدرج التكراري (Histogram)
العلاقة الجغرافية والجغرافية مكانية (Geographic or geospatial)
شكل 5 يوضح المحور العمودي سعر الشركة في سوق الأسهم بينما يوضح المحور الأفقي السنوات
والشهور (سلاسل زمنية) وبذلك يتضح سعر هذه الشركة عبر مرحلة معينة من الزمن. [2[
شكل 4 مثال على التصنيف وكذلك الترتيب
شكل 3 يوضح العلاقات المترابطة (correlation) بين متغييرين
أشكال التصوير البياني: (Diagrams)
كنا قد تعرضنا لبعض أنواع العلاقات في الفقرة السابقة، وسنتحدث هنا بمزيد من التفصيل حول الأشكال التي تستخدم في عرض البيانات بعد تحليلها. إن اختيار الشكل المناسب لنوعية البيانات له بالغ الأثر والأهمية في توصيل الرسالة بأفضل طريقة ممكنة.
–مخطط بياني (مخطط الأعمدة) (Bar Chart) يعتبر من أشهر الأشكال المستخدمة في عالم التصوير البياني قديماً وحديثاً، وهي عبارة عن أعمدة أفقية أو عمودية توضح التباين والاختلاف بين المتغيرات، يوضح الشكل التالي مخطط بياني أعمدة).
–المخطط المتناثر (Scatter Plot) يوضح القيم على شكل نقاط في داخل الرسم البياني، الشكل التالي يوضح مثال عليها.
–المخطط الشبكي .(Network chart)
–مخطط غانت (Gantt chart) من أقدم أنواع التصوير البياني، وتستخدم غالباً في إدارة المشاريع وتوزيع المهمات على الزمن.
–الخريطة الحرارية (Heat map) وهي طريقة لتمثيل مصفوفة البيانات عن طريق تمييز خلايا الرسمة بالألوان و\ أو كثافة اللون، في المثال التالي استخدمت (DNA microarray) لرسم مصفوفة.
أدوات التصوير البياني:
يوجد العديد من أدوات تصوير البيانات، منها البسيط الذي يستخدمه الغير متخصصين مثل برامج الجداول الحسابية (Calc/MS Excel/Google Sheets) ومنها المتقدم مثل برامج التابلو وبنتاهو (Tableau/ Pentaho) أو استخدام لغات برمجية مفتوحة المصدر مثل بايثون (Python) وآر (R) وتقدم مكتبات (libraries) متخصصة في تصوير البيانات أو باستخدام تقنيات الويب جافا سكربت مثل (sD3.j)
ولأن لغة بايثون مفتوحة المصدر ومدعومة من المجتمع البرمجي بتخصصات مختلفة، سنخصص هذه الفقرة بالحديث عن بعض مكتبات لغة بايثون الخاصة بالتصوير البياني.
-ماتبلوتليب (matplotlib) وهي أشهر وأول مكتبة رسومات في لغة البايثون، والعديد من المكتبات التصويرية بنيت عليها.
-سيبورن (Seaborn) بنيت على ماتبلوتليب لتحسين وتسهيل مهمة التصوير البياني.
-بلوتلي (plotly) تمكن من إنتاج واجهات رسومية للبيانات بطريقة تفاعلية.
شكل 8 بعض الأعمال التي عملت بواسطة
ماتبلوتليب(matplotlib)
شكل 6 صور لبعض أدوات التصوير البياني
شكل 7 بعض الأعمال التي عملت بواسطة
سيبورن (Seaborn)