منهجية وهيكلية قواعد البيانات



مقدمة:

نظرًا لأن معظم البيانات متاحة للباحثين بتنسيق خام ، فيجب تلخيصها وتنظيمها وتحليلها لاستخلاص المعلومات منها بشكل مفيد. علاوة على ذلك ، يجب تقديم كل مجموعة بيانات بطريقة معينة اعتمادًا على الغرض الذي تستخدم من أجله.

يعد التخطيط لكيفية تقديم البيانات أمرًا ضروريًا قبل معالجة البيانات الخام بشكل مناسب. نحن نصف الأدوار والاستخدام المناسب للنصوص والجداول والرسوم البيانية (الرسوم البيانية أو المخططات أو المخططات) ، وكلها تستخدم بشكل شائع في التقارير والعروض التقديمية. علاوة على ذلك ، فإننا نناقش القضايا التي يجب معالجتها عند تقديم أنواع مختلفة من المعلومات ، والطرق الفعالة لعرض البيانات ، والتي هي المنتج النهائي للبحث ، والتأكيد على معلومات محددة.

لا نعتمد على ذلك فقط ، لكن نستخدم النصوص والجداول والرسوم البيانية فهي وسائل اتصال فعالة تقدم البيانات والمعلومات وتنقلها. تساعد القراء في فهم محتوى البحث ، وتحافظ على اهتمامهم ، وتقدم بشكل فعال كميات كبيرة من المعلومات المعقدة. نظرًا لأن أغلب المهتمين بصناعة البيانات تؤثر فيهم العروض التقديمية قبل قراءة النص بأكمله ، فلا يمكن تجاهل أهميتها. 

لهذا السبب ، وجب علينا إيلاء اهتمام وثيق لاختيار الأساليب المناسبة لعرض البيانات. بالإضافة إلى ذلك ، فإن امتلاك فهم راسخ للطرق المختلفة لعرض البيانات واستخدامها المناسب سيمكن الزائرمن تطوير القدرة على التعرف على البيانات أو البيانات المقدمة بشكل والتمييز بينها وبين ما هو يقوم على خدعة إظهار بعض الأرقام التي قد تعطي مدلول عكس ما تظهرة.

وننشر حاليا قواعد بياناتنا في شكل صحائف إكسل  فقد اخترنا برنامج أكسل لبساطته ، ومرونته ، وقدرته الوظيفية ، ومعرفة المستخدمين للبرنامج. وفي القسم التالي ، نشرح أفضل الخطوات التي ينبغي اتباعها لمساعدة مستخدمينا على تصفح واستكشاف قواعد بياناتنا ومحفوظاتنا على الإنترنت.

المنهجية العامة:

نقدم المنهجية العامة لبناء قواعد البيانات والإطار البنيوي العام للتعداد الإحصائي، وفق معايير وأطر عامة، وتختلف بعض تلك النقاط – بالزيادة أو النقصان – حسب كل إصدار وطبيعة بيئة البيانات والمرجعيات المصدرية المتصلة به.

محتويات الإصدارات:

  • ملف قاعدة البيانات التفصيلي على هيئة xlsx والتي تحتوي على الإصدار المعلوماتي: نسخة كاملة تحتوي على قاعدة البيانات وورقة sheet لتمثيل البيانات إحصائيا.
  • صور screenshots لجداول الإحصائيات.
  • ملف pdf عن الدليل والمنهجية والملخص الوصفي.
  • ملف pdf عن ورقة تقييم الفجوات المعلوماتية.
  • ملف pdf عن ورقة قراءة تحليلة.

معايير ووحدة التعداد الإحصائي:

  • تعتبر وحدة التعداد الإحصائي هي حدوث “واقعة / حدث من نوع معين متصل بشخص واحد أو أكثر خلال مسار زمني وجغرافي معين، ومع كل تغير أي من تلك المتغيرات (نوع، شخص، مكان، زمان) يتم اعتبار واقعة جديدة، ويختلف توصيف وحدة العد حسب نوع البيانات.
  • الأعداد الواردة في الجداول الإحصائية تُمثل إجمالي عدد الأشخاص خلال الوقائع التي حدثت خلال الفترة الزمنية محل البحث، والتي تم الوصول إليها طبقًا لمعايير جمع المعلومات والمصادر المتبعة في الدليل.
  • الغرض الأساسي من البناء المعلوماتي والإحصائي هو رسم الأنماط العامة والسلوكيات الخاصة بالوقائع / الأحداث.
  • يتم مراجعة قواعد البيانات بالكامل، من أجل تقليل نسبة “الازدواج الحسابي” بـتجنب التكرار، وذلك عن طريق عقد مقارنات تحليلية وواقعية بالنسبة للبيانات الوصفية والجغرافية والزمنية، من أجل الوصول إلى أكبر دقة ممكنة.

آلية جمع المعلومات والمصادر:

* هناك مساران متوازيان للاستعانة بالمصادر:

1- المسار الأول: المصادر الرئيسية لاعتماد الواقعة نفسها:

– وهي المصادر التي يتم الاستعانة بها لإدراج حدوث الحالة بالفعل، بغض النظر عن باقي البيانات الشخصية والقانونية والإجرائية للحالة. وهنا نستعين بأدق المصادر مثل الوثائق الرسمية والمصادر الرسمية المنشورة عبر وسائل الاعلام.

2- المسار الثاني: المصادر التكميلية من أجل البناء المعلوماتي لتفاصيل الواقعة:

– وهي المصادر التي يتم الاستعانة بها لإكمال البناء المعلوماتي للواقعة بعد اعتمادها في المسار الأول، أي استكمال باقي البيانات الشخصية والإجرائية للحالة مع مراعاة منهجية التحقق من البيانات المُوضحة في القسم التالي.

* مصادر المعلومات:

– مصادر المعلومات التي تم الاستعانة بها في البناء المعلوماتي لقاعدة البيانات الأولية بشكل رئيسي هي “مصادر أولية” (معلومات تم التحقق منها لوجود المصدر الأساسي لنشأتها)، بينما تمت الاستعانة بالمصادر الثانوية كمصادر تكميلية للبيانات الشخصية وباقي الإجراءات والبيانات القانونية.

– يتم وضع رابط مباشر لتلك المصادر تفصيلياً حيث أنه لكل حالة في قاعدة البيانات، حيث تصل أعمدة الروابط إلى 5-10 حسب توفر المصادر لكل حالة على حدة.

الأدوات المستخدمة في جمع البيانات وأرشفتها:

اسُتخدم برنامج EXCEL SHEET  في إدخال البيانات, وتنظيفها, والاحصائيات .

– البيانات الوصفية أو الفوقية Metadata لكل واقعة:

هي بيانات جديدة تفصيلية تصف البيانات الأساسية، مثل بناء متغير “الإقليم الجغرافي” المتصل بنطاق الواقعة لعمود “المحافظة” وتقسيمها إلى “المحافظات المركزية، المحافظات الحدودية ، مدن القناة، الوجه القبلي، الوجه البحري”.

– البيانات الوصفية هي أدق ما تم التوصل إليه من جميع المعلومات المُتاحة وفقاً لقواعد إحصائية في مجال العلوم الاجتماعية، ولكنها ليست بالضرورة كاملة الدقة (100% هي نسبة مطلقة غير واقعية في الأبحاث الاجتماعية) حيث إنه هناك معايير فرضيات واستنتاجات تم الاستعانة بها.

– تم تمييز أعمدة البيانات الوصفية Metadata داخل قاعدة البيانات باللون الأصفر.

منهجية التحقق من البيانات وعوامل تقييم المعلومات:

 تم استخدام منهجية التحقق Methodology of Triangulation and Data Verification المعروفة في مجال العلوم الاجتماعية، والتي يتم فيها الاعتماد على مصادر مختلفة لنفس المعلومة أو مجموعة المعلومات، ويتم خلال تلك العملية تقييم المعلومات الواردة من مصادر مختلفة وفقاً لعدة عوامل للاستبعاد أو التعديل أو الدمج أو الإضافة.

– مراحل تفكيك المحتوى المعلوماتي والتعامل معه:

1. الفهم: بقراءة وفهم السياق وطبيعة تركيب البيانات ومصدر المعلومات والمحتوى المعلوماتي الموجود كاملًا واستيعابه مع تجاوز المصطلحات المستخدمة أو أية أخطاء أوأغراض بشرية.

2. التقسيم والتصنيف: بتفكيك وتحديد المحتوى المعلوماتي وتحديد وحدة التعداد الإحصائي وإدراج كل معلومة في خاناتها بقاعدة البيانات.

3. بناء تصنيفات للبيانات (البيانات الوصفية): حيث يتم فهرسة البيانات وتكويدها بحيث تكون أدق ما تم التوصل إليه من جميع المعلومات المُتاحة وفقًا لقواعد إحصائية في مجال العلوم الاجتماعية.

4. معالجة الفجوات المعلوماتية: لأي من المتغيرات بإعادة بناء مستويات أخرى لمصادرالمعلومات.
5. الاستنتاج: باستنتاج معلومات جديدة صحيحة 100%، ولكنها غير موجودة في المحتوى المعلوماتي الحالي (مثل استنتاج نوع كل واقعة من خلال قراءة نص الخبر أو تحليل الواقعة).

6. الفرضية: بافتراض معلومات بنسبة كبيرة قد تكون صحيحة، ولكنها غير موجودة في المحتوى المعلوماتي الحالي، وذلك وفقا لمعايير مُحددة أكاديمياً وخبرات ورؤية عامة للباحث.

عوامل تقييم المعلومات::

  1. حسب نوع الواقعة ومكانها وزمانها.
  2. حسب العناصر المتداخلة في الواقعة.
  3. حسب كم التفاصيل المتوفرة للمصدر.
  4. حسب تطابق التفاصيل الإطارية لمعلومات المصدر مع الحقيقة.
  5. حسب كم التضارب والأخطاء بين التفاصيل الداخلية لمعلومات المصدر.
  6. حسب منطقية ومنهجية التفاصيل الداخلية لمعلومات المصدر.
  7. حسب تقادم المعلومات.

نظام الفهرسة والفرضيات:

  • تم ترتيب الحالات/الصفوف بالكامل داخل قاعدة البيانات حسب النظام المُفهرس التالي للأعمدة:
    • تاريخ الواقعة: مُرتبة حسب يوم الواقعة.
    • ثم محافظة الواقعة Governorate Level: حسب ترتيب المحافظات المركزية ثم محافظات الدلتا ثم مدن القناة ثم محافظات الصعيد ثم المحافظات الحدودية.
    • ثم دائرة قسم شرطة الواقعة District Level.
    • ثم مكان الواقعة داخل دائرة قسم الشرطة (الحي أو القرية) Sub District Level إن وُجد.
  • ثم نوع الواقعة أو حسب البيانات الوصفية للواقعة.
  • ثم اسم مفهرس للواقعة “جغرافيا وزمنيا”، مُكون من تلك التراتبية السابقة.
  • في خانة اسم الشخص أو اسم الشهرة، تمت مراعاة أن تكون أسماء جميع الأشخاص في ملف الإكسل وفقأ للمعايير الأرشيفية للغة العربية، مما يُسَهِّل من عملية البحث بعد الضغط على CTRL+F أو إعادة استخدامها أكاديميا بواسطة برامج إدارة البيانات، كما يلي:
  • الألف “أإآ” تُكتب “ا”بدون همزات.
  • التاء المربوطة “ة” تُكتب “ه”.
  • الألف المقصورة “ى” تُكتب “ي”.
  • كلمات “عبدالله عبدالرحمن ..” تُكتب “عبد الله عبد الرحمن ..”.
  • تم اعتبار اصطلاحات أقسام الشرطة بنظام فهرسة مُوَحَّد كما يلي:
  • إطلاق توصيف “قسم…” على أي قسم أو مركز شرطة.
  • تم توحيد توصيف “بندر…” على كل قسم شرطة وحيد متواجد ببندر المدينة.
  • تم توحيد توصيف “مركز…” على كل قسم متواجد بضواحي وقرى المدينة.
  • هناك افتراضات محدودة ضمن متن التقرير في تفاصيل تحليلية ودقيقة جداً مرتبطة بسياقات ونهج عام لما يجري على أرض الواقع كما تم التوضيح مسبقاً في قسم ” منهجية التحقق من البيانات وعوامل تقييم المعلومات”، وهي كما يلي:
    • فرضية “ذكر” للمجهولية في النوع الاجتماعي.فرضية “بالغ” للمجهولية في السن.فرضية “مصري” للمجهولية في الجنسية.
    • فرضية “محل الإقامة هو نفسه محل الواقعة والعكس” للمجهولية في محل الإقامة أو محل الواقعة.

معايير ورخصة نشر قاعدة البيانات:

  • قاعدة البيانات مفتوحة بالكامل ومنشورة برخصة قواعد البيانات المفتوحة Open Database License (ODbL) v1.0.
  • تمت مراعاة مبدأيّ “عدم انتهاك الخصوصية” و “عدم جلب الضرر”. 
  • تم نشر قاعدة البيانات بنفس البيانات الوصفية Meta data المستخدمة داخل ملف الإكسل دون حذف، من أجل المراجعات والتدقيق، مع إدراج المعادلات الإحصائية جميعها مفتوحة، كمزيد من الشفافية وإتاحة التعلم.
  • تمت مراعاة الشفافية والدقة والالتزام الكامل بتحديد المنهجية وذكر المصادر لكل معلومة بشكل تفصيلي.
  • تم حجب عديد من عناوين دقيقة لمحل إقامة أشخاص، حيث تمت مراعاة احترام الخصوصية وعدم تمييز هؤلاء الأشخاص في محيط إقامتهم أو إقامة ذويهم بعلامات دلالية مباشرة مثل رقم الشقة أو المنزل أو الشارع وخلافه