كيف تحسب حجم العينة المطلوبة لبحثك؟

تقدير حجم العينة المطلوب جمعها من أهم مراحل تصميم البحوث الكمية وتعتبر من أهم متطلبات تقديم المقترحات البحثية. حجم العينة من أبسط النقاط التي يمكن انتقادها في الورقة العلمية إذا لم تكن مبنية على منهجية علمية مقبولة. يمكن حساب حجم العينة بعدة طرق أحدها يعرف بـتحليل القوة الإحصائي وهو ما ستركز عليه هذه التدوينة.

موضوع حساب حجم العينة سردت فيه كتب ومقالات علمية بالمئات وقد يتيه فيها الباحث المبتدئ بسهولة. لذلك سأحاول في هذه التدوينة تقديم الخطوات المطلوبة بشكل مبسط مع شرح لأمثلة عملية.


قبل أن نبدأ يهمني أن تتعرف على هذه المصطلحات المهمة التي ستواجهنا لاحقا:

1-Hypothesis الفرضية التي تبني عليها بحثك.
تقسم الفرضية إلى فرضية العدم Null hypothesis و الفرضية البديلة Alternative hypothesis.
فرضية العدم ببساطة تقول بأنه لايوجد تأثير للشيء الذي تريد قياسه. ونفترض بأنها صحيحة إلا إذا أشارت نتائج الدراسة لرفضها reject null hypothesis وقبول الفرضية البديلة.
الفرضية البديلة تقول بأن التأثير للشيء الذي نريد قياسه موجود بناء على النتائج.

2- Statistical power هو احتمالية كشفك لتأثير معين في حال وجوده. يتم تعريفه أيضا بأنه Power = 1 – β
بيتا β تعني احتمال الوقوع في الخطأ من النوع الثاني Type II error وهو ببساطة احتمالية أن بياناتك تعطي نتيجة negative لماتبحث عنه وهو في الحقيقة موجود positive. اختصارها false negative result.
عادة يكون الـpower بين 0.80 – 0.95. بارتفاعه يرتفع حجم العينة المطلوبة.

3- Significance level ترمز بألفا α ،هو احتمالية عدم كشفك لشيء في حال عدم وجوده.
قيمة ألفا α تعني احتمالية وقوعك في الخطأ من النوع الأول Type I error وهو أن بيانات تعطي نتيجة positive لما تبحث عنه وهو في الحقيقة غير موجود negative. اختصارها false positive result.
عادة يكون الـstatistical significance قيمته 5% (0.05) أو أقل. بانخفاضه يرتفع حجم العينة المطلوبة.
اختبار الفرضيات

4- Effect size حجم التأثير هو مدى التغير الذي تريد قياسه إذا كان لديك متغير كمي متصل continuous scale variable مثل وزن الجسم. وهو من أهم المعايير المطلوبة لحساب حجم العينة التي يواجه غالبية الباحثين صعوبة في فهمه أو تقديره. لذلك أرجوك ارفع تركيزك في هذا القسم من التدوينة.

حجم التأثير يعتمد على مدى اختلاف وتغير المخرج الأساسي الذي تريد قياسه (وزن الجسم مثلا). تقديره/افتراضه يعتمد على البيانات التي تحصل عليها من الأبحاث السابقة أو حسب تقديرك كباحث أو حسب نتائج دراسة استطلاعية أولية pilot study على عينة صغيرة.

حساب حجم التأثير يتم ببساطة بمعرفة أقل تغير معتبر تريد قياسه minimum meaningful expected difference بالإضافة إلى التباين المتوقع expected measurement variability في المتغير الذي تريد قياسه مثلا إدخال mean and standard deviation (لمجموعة واحدة أو أكثر من مجموعة حسب دراستك) في برنامج إحصائي ليقوم هو بتقديره. سنفهم هذه الخطوات العملية بالأسفل.

هنا من المهم جدا أن يكون حجم التأثير الذي تريد كشفه لا يعتمد فقط على إيجاد فرق إحصائي significant statistical difference بل يجب أن يكون الفرق الذي تبحث عنه meaningful مؤثر على أرض الواقع. فمثلا، قد تجمع عينة كبيرة لوزن أشخاص من مجموعتين أحدهم يأخد دواء لتخفيض الوزن وتجد بينهم significant statistical difference لأن p-value كانت أقل من 0.05>. ولكن لو تأكدت في الفرق الحقيقي فقد يكون مجرد نصف كيلوغرام. هذا الفرق غير معتبر أو مؤثر على أرض الواقع لنقول بأن الدواء مفيد في خفض الوزن. لهذا السبب نقول بأنه لو رفعت حجم العينة لعدد كبير جدا ستتمكن دائما من إيجاد p-value قيمتها 0.05> (إلا في حال لم يكن هنالك أي فرق على الإطلاق) ولكن الفرق الحقيقي صغير جدا وغير معتبر.

لذلك عند عمل تحليل القوة الإحصائي power analysis يجب أن نقدر حجم التأثير بناء على تغيير مؤثر على أرض الواقع وليس مجرد تغير إحصائي.

في الأسفل صورة مختصرة لعدد من مؤشرات حجم التأثير وقيمها بناء على نوع المقارنة التي تريد اختبارها.

Effect size indices
Effect size indices عدد من مؤشرات حجم التأثير وقيمها بناء على نوع المقارنة التي تريد اختبارها.

الآن بعد فهمنا للمصطلحات، نحتاج لتحديد أربعة أشياء أساسية لحساب حجم العينة:

أ- الإختبار الإحصائي المناسب للإجابة على سؤالك البحثي الذي بنيته من فرضيتك. اختياره يعتمد  على نوع بياناتك وتصميم دراستك. يوجد مصادر كثيرة لتحديد نوع الاختبار المناسب، جرب البحث هنا في المصدر هذا و هذا و هذا . أنصحك وبشدة تسجل في موقع Laerd Statistics (مجاني لأعضاء هيئة التدريس) لأنه يساعدك في الاختيار ويشرح لك خطوة بخطوة كيفية عمل الاختبار على SPSS أو Stata.

ب- قيمة Significance level ألفا. وهي عادة تكون 0.05.

ج- قيمة Power وهذه ممكن تختارها من 0.80 إلى 0.99 حسب مستوى رغبتك بأن تكون نتائجك دقيقة بالنسبة للخطأ من النوع الثاني.

د- مقدار حجم التأثير Effect size الي تريد قياسه, وهذه أهم نقطة وسنعرف كيفية حسابها في المقطع العملي.

الآن تابع الفيديو بالأسفل لتعرف كيفية حساب حجم العينة بشكل عملي. سنقوم باستخدام برنامج G.Power المجاني. حمله من هذا الرابط. 


 

س/ هل هناك فائدة من جمع عينة أكبر من المطلوب؟ (oversampling)

ج/ محاولة جمع عدد أكبر من المطلوب يعطي نتائج أدق للتأثير الذي تود قياسه. ولكن هذه الخطة قد لاتكون فكرة صائبة دائما. فقد تجد نتيجة p<0.0001 ولكن فرق التأثير على أرض لواقع صغير جدا (نفس المثال بالأعلى). الصحيح هو جمع العدد الكافي لتوفير الوقت والمال والحصول على النتائج المقبولة.
عند دراسة فعالية دواء جديد، يجب أن نحدد العدد المطلوب فقط ولا نجمع عدد أكبر من المطلوب لكي نتجنب تعريضهم لأعراض جانبية محتملة ممكن تفاديها إذا كان هذا الدواء فاشل.

س/ما هي المشاكل التي قد تواجهني إذا كان حجم العينة صغير؟ (underpowered)

ج/في هذه الحالة ستواجه مشكلة أنك لا تعرف إذا كان التأثير الذي تريد قياسه غير موجود أساساً أو أن التأثير موجود في الواقع ولكن حجم عينتك الصغير لم يكن كافياً لاكتشافه false negative. مثل أن تستخدم دواء ممتاز وفعال ولكنك اختبرته على عينة صغير لم تكن كافية لإظهار فعاليته.


نقاط أخيرة:

  • يوجد برامج مجانية بديلة حساب حجم العينة مثل R, STPLAN, PS ويمكن استخدام مواقع جاهزة بدون تحميل برامج مثل موقع powerandsamplesize.com
  • لا تتردد في استشارة إحصائي متخصص إذا أردت التأكد من حساباتك أو إذا كان تصميم دراستك متقدم بعض الشيء.
  • يتجه البعض لحساب الـobserved power بعد إكمال جمع البيانات وتحليلها وتسمى أيضا post-hoc power analysis. وهذا فعل عديم الفائدة لأن الـobserved power تعتمد بشكل مباشر على قيمة p-value التي وجدتها. اقرأ هذه التدوينة إذا أردت فهم هذه النقطة بشكل أوسع.

أتمنى أنك استفدت من هذا الشرح كـمقدمة لحساب حجم العينة.

لقراءة المزيد حول الموضوع أنصحك بالاطلاع على المقالات التالية:

Cohen, Jacob. “A power primer.” Psychological bulletin -1992

McCrum-Gardner, Evie. “Sample size and power calculations made simple.” International Journal of Therapy and Rehabilitation – 2010

Jones, S. R., S. Carley, and M. Harrison. “An introduction to power and sample size estimation.” Emergency Medicine Journal – 2003

Facebook
Telegram
LinkedIn
Twitter
WhatsApp

ربما يعجبك أيضا