مقدمة

تنطلق منهجية Open Data Tank من فهم البيانات بوصفها موردًا عامًا لا يكتمل أثره بمجرد الإتاحة، بل عبر التنظيم، والتوثيق، وقابلية التحليل، وإمكانية التحقق. تهدف هذه الصفحة إلى عرض الإطار المنهجي والبنيوي المعتمد في بناء قواعد البيانات المنشورة على المنصة، باعتباره إطارًا عامًا قابلًا للتطبيق على موضوعات متعددة تتغير بتغير نطاق الرصد، مع ثبات المعايير المهنية والأخلاقية.
تعتمد قواعد بيانات ODT على إنتاج High-Value Datasets مبنية من مصادر مفتوحة، وفق منهجية قابلة للتكرار والتحديث، بما يسمح بالتحليل الزمني والمكاني، وبناء المؤشرات، ودعم البحث وصياغة السياسات العامة القائمة على الأدلة.
أولًا: فلسفة بناء قواعد البيانات
تعتمد ODT مقاربة ترى أن البيانات الخام لا تحمل قيمة تحليلية بذاتها، ما لم تُعاد معالجتها ضمن إطار مفاهيمي واضح. لذا تُبنى قواعد البيانات وفق المبادئ التالية:
-
وضوح وحدة التعداد الإحصائي.
-
الفصل بين البيانات الأولية والإحصاءات الوصفية.
-
إنتاج بيانات وصفية (Metadata) دقيقة تعزز المقارنة والتحليل.
-
تقليل الازدواج الحسابي وضمان الاتساق الداخلي.
-
توثيق كل خطوة منهجية بشفافية.
ثانيًا: بنية ملفات البيانات
تُنشر قواعد البيانات عادة في صورة Workbook منظم، يضم:
-
Data Sheet: السجل التفصيلي للحالات/الوحدات المرصودة.
-
Stats Sheet: إحصاءات وصفية جاهزة (ليست بيانات أولية).
ويُصاحب ذلك ملفات تفسيرية بصيغة PDF تشمل:
-
دليل المنهجية والترميز.
-
ملخصًا وصفيًا للبيانات.
-
أوراق قراءة تحليلية وتقييم فجوات معلوماتية (عند الاقتضاء).
ثالثًا: وحدة التعداد ومحور قاعدة البيانات
وحدة التعداد (Unit of Count)
تعتمد ODT وحدة تعداد واضحة ومحددة لكل قاعدة بيانات، تُعرَّف وفق طبيعة الموضوع محل الرصد.
ويمثل كل صف في قاعدة البيانات وحدة تحليل مستقلة (شخص، حدث، حالة، أو كيان)، بما يمنع الخلط بين الواقعة كوحدة سردية والضحية أو الهدف كوحدة تحليل.
عند تعدد الوحدات داخل واقعة واحدة، تُسجَّل كل وحدة في صف مستقل، مع توثيق العلاقة السياقية بينها.
محور البنية الإحصائية
يُحدَّد محور القاعدة (الضحية/الحدث/الكيان) بشكل صريح منذ البداية، لضمان:
-
دقة التحليل.
-
إمكانية بناء مؤشرات مركبة.
-
اتساق النتائج عبر الزمن.
رابعًا: النطاق المفاهيمي والزمني والمكاني
-
النطاق الزمني: يُحدَّد وفق تاريخ وقوع الحدث، لا تاريخ النشر أو الإجراء، مع تطبيق قواعد استدلال منهجية عند غياب التاريخ الصريح.
-
النطاق الجغرافي: يقتصر على الإطار المكاني المحدد لكل قاعدة بيانات، مع بناء مستويات مكانية متدرجة (دولة – محافظة – دائرة – موقع أدق).
-
النطاق المفاهيمي: يُعرَّف كل مفهوم تشغيليًا (Operational Definition) لضمان الاتساق وعدم التوسع غير المنضبط في الإدراج.
خامسًا: مصادر البيانات
تعتمد ODT على مصادر مفتوحة ذات طبيعة إعلامية أو وثائقية، ويتم التعامل معها باعتبارها:
-
مصادر ثانوية في التحليل الاجتماعي.
-
ومصادر أولية في التوثيق والأرشفة الزمنية.
يُراعى التمييز بين:
-
المعلومات المثبتة المنقولة عن قرارات رسمية.
-
والروايات الأولية المرتبطة بمراحل التحقيق المبكرة.
ويُوثَّق لكل سجل مصدره وسياقه الإجرائي وقت النشر.
سادسًا: منهجية التحقق وتثليث المصادر
تعتمد ODT منهجية Data Triangulation & Authentication، وتشمل:
-
فهم السياق العام للواقعة أو الحالة.
-
تفكيك المحتوى إلى متغيرات أساسية.
-
بناء تصنيفات تحليلية وبيانات وصفية.
-
سد الفجوات المعلوماتية بالعودة لمصادر إضافية.
-
الاستدلال المنهجي المحدود عند الضرورة.
-
مراجعة الاتساق الداخلي والواقعية العامة للبيانات.
وتُستكمل عملية التحقق بتقييم شامل للأرقام والأنماط، وإعادة المراجعة التكرارية عند ظهور أي تناقض.
سابعًا: قواعد الإدراج والاستبعاد
تُدرج الحالات فقط عند استيفاء معايير محددة تُعلن بوضوح في كل قاعدة بيانات، وتشمل عادة:
-
انطباق التعريف المفاهيمي.
-
وضوح النطاق المكاني والزمني.
-
وجود علاقة مباشرة بموضوع القاعدة.
-
توافر حد أدنى من التوثيق.
وتُستبعد الحالات التي تخرج عن هذا النطاق أو لا تحقق الشروط المنهجية، مع توثيق مبررات الاستبعاد.
ثامنًا: الاستدلال والفرضيات المنهجية
تُستخدم الفرضيات في نطاق ضيّق ومُقيد، فقط عند غياب معلومات أساسية لا يمكن استنتاجها مباشرة، وبما لا يغيّر التوصيف الجوهري للحالة.
-
تُوثَّق جميع الفرضيات داخل القاعدة.
-
تُراجع دوريًا.
-
تُستبدل فور توفر معلومات أدق.
تاسعًا: البيانات الوصفية وقاموس المتغيرات
تُرفق كل قاعدة بيانات بقاموس متغيرات مفصل يشرح:
-
تعريف كل متغير.
-
نوعه (نصي/تصنيفي/زمني).
-
قواعد الترميز.
-
القيم المحتملة.
ويُعد هذا القاموس أداة أساسية لإعادة الاستخدام والتحليل المقارن.
عاشرًا: الاعتبارات الأخلاقية وحماية الخصوصية
تلتزم ODT بالمبادئ التالية:
-
عدم جلب الضرر.
-
حماية الخصوصية، خاصة للفئات الهشة.
-
تجنب اللغة الوصمية.
-
الاكتفاء بالحد الأدنى الضروري من البيانات التعريفية.
-
الإقرار بأن البيانات تمثل أثرًا أرشيفيًا لمحتوى منشور قد يتغير أو يُحذف لاحقًا.
حادي عشر: القيود والتحيزات
تقر المنهجية بوجود قيود بنيوية، منها:
-
تحيزات التغطية الإعلامية.
-
تفاوت التمثيل الجغرافي.
-
ضعف التتبع القضائي في بعض السياقات.
-
تضارب الروايات بين المصادر.
ويُعالج ذلك عبر التثليث، والشفافية، والإفصاح المنهجي.
ثاني عشر: ضمان الجودة
لا يُعتمد أي سجل قبل:
-
مراجعة الاتساق الداخلي.
-
استيفاء الحقول الجوهرية.
-
تقييم منطقية الحالة ضمن السياق العام للبيانات.
وتُستخدم مؤشرات جودة كمية ونوعية لتقييم اكتمال القاعدة وقدرتها التحليلية.
الترخيص وإعادة الاستخدام
تُنشر جميع قواعد البيانات والمحتويات التحليلية على منصة Open Data Tank (ODT) بموجب رخصة
Creative Commons Attribution (CC BY).
تتيح هذه الرخصة للمستخدمين:
-
النسخ، وإعادة التوزيع، والمعالجة، والبناء على البيانات.
-
الاستخدام للأغراض البحثية، التعليمية، الإعلامية، والتجارية.
بشرط وحيد:
-
الإشارة الواضحة إلى المصدر: Open Data Tank (ODT)
-
وعدم الإيحاء بأن ODT يتبنّى أو يوافق على أي استنتاجات أو تحليلات مشتقة من إعادة الاستخدام.
تلتزم ODT بتوفير البيانات بصيغة مفتوحة وقابلة لإعادة الاستخدام، مع الحفاظ على المعايير المنهجية والأخلاقية، دون تحمّل مسؤولية الاستخدامات اللاحقة خارج سياق النشر الأصلي.
ملاحظة ختامية
هذا الإطار المنهجي ثابت في جوهره، ومتغير في تطبيقه، حيث تتغير الموضوعات ونطاقات الرصد، بينما تظل المعايير المنهجية، والبنيوية، والأخلاقية واحدة عبر جميع قواعد البيانات المنشورة على منصة Open Data Tank.
