آزمون ضریب همبستگی

 همبستگی(Correlation)

 در بسیاری از موارد در انجام مطالعات تحقیقاتی به دنبال بررسی رابطه دو متغیر تصادفی می باشیم که هیچ کدام را نمی توان به عنوان علت برای دیگری انتخاب کرد. در اصل برای بررسی میزان هماهنگی میان دو متغیر به دنبال شاخصهایی می گردیم که در اصل دو ویژگی زیر را داشته باشند:

1-  به واحد دو جامعه وابسته نباشد

2-  کراندار باشد

به طور مثال در تحولات اقصادی به دنبال رابطه میان تقاضای نفت خام در برابر تقاضای طلا می باشیم. یا در مطالعه تحولات اجتماعی به دنبال  رابطه درآمد سرپرست خانواده و میزان تحصیل فرزندان می باشیم و مثالهایی از این دست......

مجموعه اطلاعات (داده های) موجود در انجام یک آزمون همبستگی که شامل اندازه های بدست آمده از دو متغیر X و  Y  می باشند را می توان به صورت یک نمونه تصادفی دو متغیره (Xn ,Yn), .............,(X1 ,Y1) بیان کرد.


مطالعه رابطه بین متغیرها بوسیله ((تحلیل همبستگی)) ( Analysis Corroletion ) انجام می شود. که بیانگر وجود یک رابطه خطی بین دو متغیر می باشد.

فرمول ضریب همبستگی به صورت زیر می باشد

 با توجه به مقدار r در حاتهای مختلف تفسیرهای گوناگونی از رابطه X و Y خواهیم داشت.

                                                                                                                   -1

حالتهای مختلف برای r

1-   r =1    در این حالت همبستگی کامل و مستقیم گوییم. با افزایش مقدار x مقدار y به طور قطعی  
       زیاد می شود.

 2-  r = -1   در این حالت همبستگی را کامل و معکوس گوییم. با افزایش مقدار x مقدار y کاهش می یابد.

 3-   0 -1 < r <  همبستگی ناقص و معکوس است. با افزایش مقدار x مقدار y به طور نسبی کاهش می یابد.

 4-   1  < r <0  همبستگی ناقص و مستقیم است. با افزایش مقدار x مقدار y به طور نسبی افزایش می یابد.            

5-  r =0      1-  رابطه خطی وجود ندارد. ( به طور مثال رابطه ممکن است از نوع درجه دو باشد)

                   2- شیب خط صفر می باشد.

     انواع ضریب همبستگی با توجه به نوع متغیرهای مورد مطالعه

 1-  پیرسن : در این روش متغیر X و Y هر دو پیوسته می باشند. (در پنجره Variable View  در ستون مربوط
                به مقیاسها(Measure) داده ها باید از نوع Scale  انتخاب شوند.)

2- کندال : در این روش هر دو متغیر X و Y باید به صورت طبقه بندی شده باشد یعنی(Ordinal,Nominal)   
               (در پنجرهVariable View در ستون مربوطه باید داده ها از نوع Ordinal انتخاب شوند.)

3- اسپیرمن : در این روش متغیر X گسسته و متغیرY پیوسته می باشد. 

                (متغیر  Xدر پنجرهVariable View در ستون مربوطه باید از نوع  Ordinal و متغیر Y از نوع Scale                  انتخاب شوند.)

 در آزمونهای بالا متغیر X را به عنوان متغیر مستقل و متغیر Y  را به عنوان متغیر وابسته در نظر می گیریم.

- نکته:.   در بعضی مواقع می توانیم با طبقه بندی داده های پیوسته آنها را به صورت طبقه بندی شده در آوریم .

به طور مثال اگر بخواهیم تأثیر درآمد خانواده را بر روی معدل فرزندان بررسی کنیم به دلیل اینکه درآمد و معدل هر دو متغیر پیوسته می باشند باید از ضریی همبستگی پیرسن استفاده کنیم. اما می توانیم با تقسیم بندی درآمد به طور مثال به سه گروه کم درآمد، متوسط و پر درآمد از ضریب همبستگی اسپیرمن استفاده کنیم.

 در آزمونهای همبستگی یک طرفه فرضهای زیر بررسی می شوند.

      Ho :   r = o                                                     Ho :   r = o                                                              

1                                                                 2

H1 :   r < o                                                            H1 :   r > o                                                                                              

جهت نامساوی با توجه به برآورد نمونه ای r تعیین می شوند. اگر r مثبت باشد آزمون 1 و اگر منفی باشد از آزمون 2 استفاده می کنیم.

 مثال

در جدول زیر میزان معدل دانش آموزان و میزان تحصیلات آنها آمده است. هدف تعیین میزان همبستگی و نوع  ارتباط معدل با میزان تحصیلات مادر می باشد

.  

(4) لیسانس وبالاتر

(3) فوق دیپلم

(2) دیپلم

(1) زیردیپلم

تحصیلات   

 معدل

2

6

7

10

(1)  زیر 12

5

5

7

12

  (2)      15-12

10

6

4

5

  (3)    17-15

12

10

7

5

  (4)         20-17

 وقتی در نرم افزار Spss داده ها را به صورت رتبه ای مشخص کردیم می توانیم در تجزیه و تحلیلها تفسیر راحتری از خروجیها داشته باشیم.

به مانند مثال قبلی در پنجره Variable View دو متغیر معدل و تحصیلات را وارد می کنیم  و ستونها را متناسب با نوع متغیرها تنظیم می کنیم. در ستون Values با توجه به کدهایی که در جدول

بالا داده شده است متغیرها را معرفی می کنیم.

برای اینکه مشخص کنیم ستون تعداد معرف فراوانی هایی هست که به دو متغیر سن و تحصیلات نسبت داده شده است و و از نوع اندازه گیری شده نمی باشند باید دو ستون تحصیلات و سن توسط ستون تعداد وزن دار شود. برای این کار به صورت زیر عمل می کنیم.                  

با کلیک بر روی کلمه Ok داده ها بوسیله ستون تعداد وزند دار می شوند. سپس مسیر زیر را انتخاب می کنیم Bivariate Correlation باز شود.

 با بردن دو متغیر سن فرزندان و تحصیلات مادران به مربع سمت راستی (Variable) و انتخاب ضریب همبستگی متناسب با داده ها، در این سوال (فعال کردن گزینه Kendall's tau-b در قسمت Correlation Coefficients ) و انتخاب نوع آزمون (یک طرفه بودن( یک دامنه) یا دو طرفه بودن(دو دامنه) در قسمت Test of significance)  با کلیک کردن بر روی Ok خروجیهای مربوط به آزمون را به صورت زیر مشاهده کرد.

مقدار P-Values بدست آمده برابر است 0.001 می باشد که با توجه به دو دامنه بودن آزمون (2-tailed) با 0.025 مقایسه می شود و چون P<0.025 می باشد نتیجه می شود که یک نوع رابطه بین معدل دانش آموزان و تحصیلات مادران آنها وجود دارد و چون r = 0.260 بدست آمده است  و 0

منبع : amare.blogfa.com

نوشته شده در تاریخ جمعه 15 بهمن 1389    | توسط: علی عبدالی    | طبقه بندی: آمار،     |
نظرات()