وهذا بعد
عني ما فهمته وماابي افهمه
ناقشت في المقالة السابقة كيفية دراسة العلاقة بين متغيرين باستخدام الرسم البياني (المنحنى التنقيطي) Scatter Diagram والذي يساعدنا على اكتشاف أي علاقة خطية أو غير خطية بين المتغيرين أو اكتشاف عدم وجود أي علاقة. وفي هذه المقالة نتعرض لطرق أخرى لدراسة العلاقة بين متغيرين. هذا الموضوع هو من الأساسيات التي يحتاجها المدير وأي شخص يحتاج لتحليل بيانات ودراسة علاقتها ببعضها.
معامل الارتباط Correlation:
معامل الارتباط هو رقم يتراوح بين -1 و1 وهو يبين وجود علاقة خطية بين متغيرين واتجاه تلك العلاقة كما يلي:
+1 تعنى علاقة طردية بمعنى أنه كلما زاد أ زاد ب وكلما قل أ فإن ب يقل
-1 تعني علاقة عكسية بمعنى انه كلما زاد أ فإن ب يقل وكلما قل أ فإن ب يزيد
صفر يعني عدم وجود أي علاقة بين المتغيرين
عندما يقترب معامل الارتباط من إحدى هذه القيم فإنه يدل على ما تدل عليه هذه القيم ولكن بدرجة أقل. فمثلا +0.9 تدل على وجود علاقة طردية قوية بين المتغيرين ولكنها ليست مطلقة مثل تلك التي تتوقعها عندما يكون معامل الارتباط يساوي+1.
يسمى معامل الارتباط بـمعامل الارتباط لبيرسون Pearson Correlation Coefficient ويشيع تسميته بمعامل الارتباط. . ولمعامل الارتباط تطبيقات عديدة فمثلا في مجال التسويق قد تحب أن تدرس إن كان هناك علاقة بين زيادة مبيعات منتجك وزيادة مبيعات سلعة أخرى أو تحسن درجة الحرارة أو تخفيض السعر. وقد تكون مهندسا يريد أن يعرف ما الذي يؤثر على جودة الغاز المنتج هل هو تغير الضغط أم الحرارة أم جودة أي غاز من الغازات الداخلة في العملية الإنتاجية.
طريقة الحساب:
معامل الارتباط يتم حسابه بسهولة عن طريق الحاسوب ولذلك فلسنا بحاجة للدخول في حسابات مملة ولكن من الضروري أن نلقي نظرة على طريقة الحساب لنفهم معنى معامل الارتباط. يتم حساب معامل الارتباط كالتالي

والبسط في هذه المعادلة هو مجموع حاصل ضرب الفارق بين كل قيمة للمتغير الأول ومتوسطه الحسابي في الفارق بين كل قيمة للمتغير الثاني ومتوسطه الحسابي. والمقام هو حاصل ضرب الانحراف المعياري لكل من المتغيرين في عدد البيانات منقوصا منها واحد. هذا في حال أن لدينا عينة من البيانات كأن نأخذ عينة عشوائية من مجموعة كبيرة (المجتمع) وندرس ظاهرة معينة على هذه العينة. اما عند دراسة المجتمع كله فإن طريقة الحساب تختلف اختلافا طفيفا وتكون كالتالي

في هذه الحالة فإن المقام يكون حاصل ضرب الانحراف المعياري للمجتمع لكل من المتغيرين مضروبا في عدد البيانات.
ماذا نفهم من هذه المعادلة المعقدة؟
أولا المقام هو حاصل ضرب أرقام موجبة (أكبر من الصفر) فالانحراف المعياري هو دائما رقما موجبا وكذلك عدد البيانات. فمتى يكون معامل الارتباط موجبا ومتى يكون سالبا؟ الأمر يتوقف على البسط. فإذا كان الفارق بين قيمة ما للمتغير الأول ومتوسطه الحسابي موجبا وكان الفارق بين القيمة المقابلة والمتوسط الحسابي للمتغير الثاني موجبا كانت النتيجة موجبة لأن حاصل ضرب قيمة موجبة في قيمة موجبة يساوي قيمة موجبة. وإذا كان كل منهما سالبا فإن الناتج يكون موجيا لأن حاصل ضرب قيمة سالبة في قيمة سالبة يساوي قيمة موجبة. ومعنى ذلك (في الحالة الأولى) أنه عند زيادة المتغير الأول عن متوسطه الحسابي فإن المتغير الثاني يزيد عن متوسطه الحسابي هو الآخر وكذلك (في الحالة الثانية) عند نقصان المتغير الأول عن متوسطه الحسابي فإن نفس الأمر يحدث للمتغير الثاني.
وبالتالي فإنه عندما تكون العلاقة عكسية فإن الناتج يكون سالبا لأن أحد الفارقين سيكون موجبا والآخر سالبا. وهذا يجعلنا نفهم القاعدة بأن معامل الارتباط كلما كان أقرب للواحد الصحيح فإن ذلك يعني وجود علاقة طردية قوية وكلما اقترب من -1 فإن ذلك يعني وجود علاقة عكسية قوية. وكلما اقترب من الصفر فإن ذلك يعني عدم وجود علاقة خطية.
شكل العلاقة:
لننظر إلى بعض الرسومات البيانية المرادفة لقيم مختلفة لمعامل الارتباط لنتفهم ما يعنيه هذا الرقم.

كيف نستخدم إكسل لحساب معامل الارتباط:
هناك طريقتان يمكننا استخدامهما.
افترض أن لدينا البيانات التالية:

ونريد حساب معامل الارتباط بين المتغير أ و ب.
الطريقة الأولى هي أن نستخدم الدالة المتاحة في إكسل لحساب معامل الارتباط فنكتب ما يلي في أي خلية:
وبالتالي نحصل على معامل الارتباط بين أ و ب وهو -0.46 . هذه القيمة تعني وجود علاقة عكسية ضعيفة لأن القيمة لا تقترب من -1 بل هي أقرب قليلا إلى الصفر.
الطريقة الثانية تساعدنا في الحصول على معامل الارتباط بين متغيرين أو عدة متغيرات مرة واحدة. هذه الطريقة تتم كالتالي:
اضغط على Tools ثم Data Analysis (
أوضحت من قبل كيفية إظهار Data Analysis)

ثم اختر Correlation

تظهر لك النافذة التالية وعليك ملء Input Range بأسماء الخلايا التي مسجل بها البيانات. وقد علمت على Labels in First Row أي أن أسماء الأعمدة في الصف الأول (أي أو ب وت وث)

نضغط OK فنحصل على النتيجة كالتالي:

هذا الجدول (بالأعلى) يبين أن معامل الارتباط بين ث و ت مثلا هي 0.21 ومعامل الارتباط بين ب و ت هي -0.35 وهكذا. بالطبع فإن العلاقة بين المتغير ونفسه هي 1 فترى في الجدول معامل ارتباط ث بـ ث هو 1 وهي قيمة لا تعنينا في شيء. هذه الطريقة سريعة جدا عندما يكون لدينا أكثر من متغيرين. من هذه النتيجة نرى أن العلاقة الخطية بين أ و ت هي الوحيدة التي يمكن أخذها في الاعتبار لأنها تساوي 0.72 أما باقي القيم فهي صغيرة جدا.
هل لا توجد علاقة؟
ليس معنى أن يكون معامل الارتباط صفرا أو قريبا من الصفر أنه لا توجد أي علاقة بين المتغيرين. فمعامل الارتباط يبين قوة العلاقة الخطية. والعلاقة الخطية هي علاقة في شكل خط مستقيم فهي علاقة ليس بها منحنيات أو طلوع ونزول. فالعلاقة الخطية تكون طردية أو عكسية فقط. وبالتالي فقد يكون معامل الارتباط يساوي صفرا ولكن توجد علاقة قوية بين المتغيرين ولكنها غير خطية أي أنها ليست على شكل خط مستقيم كما في الامثلة التالية:

ففي هذين الشكلين نرى علاقة واضحة بين المتغيرين ولكنها ليست مجرد علاقة طردية أو عكسية ولا يمكن تمثيلها بخط مستقيم. ففي الحالة الأولى نلاحظ تغير المتغير الثاني بشكل دوري مع المتغير الأول. وفي الحالة الثانية نجد علاقة طردية حتى نقطة ما ثم تتحول العلاقة إلى علاقة عكسية. هذه العلاقات هي علاقات غير خطية ولا يمكن التنبؤ بها بمعامل الارتباط.
بهذا نكون قد استطعنا دراسة شكل العلاقة عن طريق منحنى الانتشار (المنحنى التنقيطي) ومعرفة قوة العلاقة الخطية عن طريق معامل الارتباط. في المقالة التالية إن شاء الله نناقش كيفية الوصول لعلاقة رياضية بين متغير وكل المتغيرات التي تؤثر فيه.