الإحصاء الحيويالإحصاء النظريالبرامج الاحصائيةعلم البيانات

الإنحدار الخطي المتعدد . Multiple Linear Regression

الإنحدار الخطي المتعدد

 Multiple Linear Regression


\( يعد الإنحدار الخطي المتعدد من الأساليب الإحصائية المتقدمة والتي تضمن دقة الإستدلال من أجل تحسين نتائج البحث عن طريق الإستخدام الأمثل للبيانات في إيجاد علاقات سببية بين ظواهر موضوع البحث .

والإنحدار الخطي المتعدد هو عبارة عن إيجاد معادلة رياضية تعبر عن العلاقة بين متغيرين وتستعمل لتقدير قيم سابقة ولتنبؤ قيم مستقبلية ، وهو عبارة أيضاً عن إنحدار للمتغير التابع Y على العديد من المتغيرات المستقلة \(X_1 + X_2 + \dots+X_k\) . لذا فهو يستخدم في التنبؤ بتغيرات المتغير التابع الذي يؤثر فيه عدة متغيرات مستقلة. اذن يتم استخدام الانحدار الخطي المتعدد لشرح العلاقة بين متغير تابع مستمر ومتغيران مستقلان أو أكثر. يمكن أن تكون المتغيرات المستقلة مستمرة أو متقطعة.

فهي تعتمد فكرته على العلاقات الدلالية التي تستخدم ما يعرف بشكل التشتت أو االانتشار ، فبإمكاننا التنبؤ باحتمالية الاصابة بمرض سرطان الثدي مثلا إعتمادا ً على دراسة حالات أخرى للمرضى كالعمر والمواصفات الجسمية و مدى اصابة الوالدين غيرها .

والمعادلة الخطية في الإنحدار الخطي المتعدد هي :
$$
Y = \alpha + \beta_1 X_1 + \beta_2 X_2 + \dots + e
$$

حيث أن Y = المتغير التابع

\( \alpha \) = قيمة ثابتة  Constant أو  Intercept

\( \beta_1 \) = ميل ألإنحدار y على المتغير المستقل الأول

\( \beta_2 \) = ميل ألإنحدار y على المتغير المستقل الثاني

\( X_1 \) = المتغير المستقل الأول  

\( X_2 \) = المتغير المستقل الثاني

ويمكن استخدام الإنحدار الخطي المتعدد في حالة توافر الشروط التالية :

  1. أن تكون العلاقة خطية بين المتغيرات المستقلة والمتغير التابع .
  2. أن تكون البيانات موزعة توزيعا ً طبيعيا ً للمتغيرات المستقلة والمتغير التابع .
  3. يجب أن تكون قيم المتغير التابع من المستوى الترتيبي على الأقل .

 

بعد الحصول على نتائج معادلة الانحدار يجب علينا أن نبين هل أن هذه المعاملات مقبولة من الناحية الإحصائية أي معنوية احصائياً مع التنويه بأن المعنوية تكون لكل معامل على حدة .

بعد الحصول على نتائج معادلة الانحدار المتعدد يجب علينا أن نبين هل هذه المعاملات مقبولة من الناحية الإحصائية أي معنوية احصائياً مع التنويه بأن المعنوية تكون لكل معامل على حدة .
ولكي نحكم على معنوية معاملات الإنحدار نستعين باختبار T ومستوى الاحتمالية المقابل له وبالطبع فإن برنامج R و SPSS سيقومان تلقائياً باستخراج اختبار T ومستوى الاحتمالية المقابل له .
كما سيتم الحصول على إحصائيات تستخدم لمعرفة المعنوية الإجمالية للنموذج ومنها ( \( R \)) ، ( \( R^2 \)).

فالأول \(R\) هو معامل الأرتباط البسيط والذي يقيس قوة العلاقة بين متغيرين أو أكثر ، أما \( {R}^2 \) فهو يسمى بمعامل التحديد والذي يستخدم لمعرفة القوة التفسيرية للنموذج المقدر ( المعادلة المقدرة ) في حالة الإنحدار الخطي البسيط ( متغير مستقل واحد مع متغير معتمد واحد ).

مثال باستخدام برنامج R:

ادخال البيانات:
نأخذ بعين الاعتبار مجموعة البيانات “mtcars” المتوفرة في بيئة R. هذه البيانات تعطي مقارنة بين موديلات السيارات المختلفة من حيث عدد الكيلومترات لكل جالون (mpg) ، إزاحة الأسطوانة (“disp”) ، قوة الحصان (“hp”) ، وزن السيارة (“wt”) وبعض المعلمات الأخرى.

الهدف من النموذج هو تأسيس العلاقة بين “mpg” كمتغير تابع مع “disp” و “hp” و “wt” كمتغيرات مستقلة . نقوم بإنشاء مجموعة فرعية من هذه المتغيرات من مجموعة بيانات mtcars لهذا الغرض.

[("input <- mtcars[,c("mpg","disp","hp","wt

وهذا سيكون شكل البيانات:

 input <
 mpg   disp  hp    wt  
Mazda RX4           21.0 160.0 110 2.620
Mazda RX4 Wag       21.0 160.0 110 2.875
Datsun 710          22.8 108.0  93 2.320
Hornet 4 Drive      21.4 258.0 110 3.215
Hornet Sportabout   18.7 360.0 175 3.440

إنشاء نموذج العلاقة والحصول على معاملات

[("input <- mtcars[,c("mpg","disp","hp","wt
Create the relationship model#
(model <- lm(mpg~ disp + hp + wt , data = input
Show the model#
(print(model

عندما ننفذ الكود السابق ، فإنه ينتج النتيجة التالية:

 model < 
Call:
(lm(formula = mpg ~ disp + hp + wt, data = input
Coefficients:
  Intercept)         disp             hp             wt)
3.800891-     0.031157-    0.000937-           37.105505

إنشاء المعادلة لنموذج الانحدار:
استنادًا إلى قيم المعامل أعلاه ، نقوم بإنشاء المعادلة الرياضية التالية التي من خلالها نستطيع التنبؤ.
$$
Y = \alpha + \beta_{disp} x_1 +\beta_{hp} x_2 + \beta_{wt} x_3
$$
وعندما نستبدل المجاهيل بالمعاملات اعلاه تكون المعادلة كالتالي :
$$
Y = 37.15 + (-0.000937) x_1 + (-0.0311) x_2 + (-3.8008) x_3
$$

تطبيق المعادلة للتنبؤ بالقيم الجديدة :

يمكننا استخدام معادلة الانحدار التي تم إنشاؤها أعلاه للتنبؤ بالمسافة المقطوعة عندما يتم توفير مجموعة جديدة من القيم الخاصة بالنزوح وقوة الخيل والوزن.

بالنسبة لسيارة مزودة بـ disp = 221 ، و hp = 102 و wt = 2.91 فإن الأميال المتوقعة هي :

$$
Y = 37.15 + (-0.000937) 221 + (-0.0311) 102 + (-3.8008) 2.91 = 22.7104
$$

سأتحدث لاحقا عن كيفية اختيار المعاملات المهمة والمؤثرة في النموذج وشرح الطرق التي من خلالها نستطيع ابقاء وحذف بعض المعاملات لينتج لنا أفضل نموذج. وأيضا بعض الرسوم الاحصائية ذات العلاقة.

\)
Tags:

5 comments

  1. I’m extremely impressed with your writing skills and also
    with the layout on your weblog. Is this a paid theme or did you customize it yourself?
    Either way keep up the excellent quality writing, it is rare to see a nice blog like this one nowadays.

  2. Appreciation to my father who shared with me concerning this blog, this website is really amazing.

  3. Greetings I am so glad I found your blog, I really found you by mistake, while I was looking on Digg for something else, Anyhow I am here
    now and would just like to say many thanks for a marvelous post and a all round thrilling blog (I also love the theme/design), I don’t have time to browse it all at
    the minute but I have saved it and also added your RSS feeds, so when I have time I will be back to read a lot more, Please do keep up the excellent work.

  4. شنو اسم المصدر اذا اريد اكتب هذا الكلام في تقرير ؟؟

  5. السلام عليكم اني كتبت تقرير من هذا الموقع واريد اكتب المصادر ممكن المصادر؟؟؟؟

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *