PH717 ماژول 9 - همبستگی و رگرسیون

ساخت وبلاگ

ارزیابی ارتباط بین دو متغیر مداوم

Lea More sidebar

ضریب همبستگی (R)

ضریب همبستگی نمونه (R) اندازه گیری نزدیکی ارتباط نقاط در یک طرح پراکندگی به یک خط رگرسیون خطی بر اساس آن نقاط است ، همانطور که در مثال بالا برای صرفه جویی در انباشته در طول زمان. مقادیر ممکن از ضریب همبستگی ا ز-1 تا 1 ، ب ا-1 نشان می دهد که یک همبستگی منفی کاملاً خطی ، یعنی معکوس ، همبستگی (شیب دار به سمت پایین) و 1 نشان می دهد که یک همبستگی مثبت کاملاً خطی (شیب به سمت بالا).

ضریب همبستگی نزدیک به 0 ، همبستگی کمی نشان می دهد. طرح پراکندگی نشان می دهد که اندازه گیری ضریب هوشی با افزایش سن تغییر نمی کند ، یعنی هیچ مدرکی وجود ندارد که ضریب هوشی با سن همراه باشد.

محاسبه ضریب همبستگی

معادلات زیر محاسبات SED را برای محاسبه "R" نشان می دهد. با این حال ، نیازی به یادآوری این معادلات نیست. ما از R برای انجام این محاسبات برای ما استفاده خواهیم کرد. با این وجود ، معادلات این احساس را می دهند که چگونه "R" محاسبه می شود.

جایی که COV (x ، y) کواریانس است ، یعنی هر جفت مشاهده شده (x ، y) تا چه اندازه از میانگین x و میانگین y ، به طور همزمان ، و s است.x2 و Sy2 واریانس نمونه برای X و Y هستند.

بشرCOV (x ، y) به صورت محاسبه می شود:

لازم نیست این معادلات را برای محاسبات دستی به خاطر بسپارید. در عوض ، ما از R برای محاسبه ضرایب همبستگی استفاده خواهیم کرد. به عنوان مثال ، ما می توانیم از دستور زیر برای محاسبه ضریب همبستگی برای سن و توتچول در زیر مجموعه ای از مطالعه قلب فرامینگهام به شرح زیر استفاده کنیم:

>COR (سن ، توتچول) [1] 0. 2917043

توصیف ضرایب همبستگی

در جدول زیر دستورالعمل هایی برای توصیف قدرت ضرایب همبستگی ارائه شده است ، اما اینها فقط دستورالعمل هایی برای توضیحات هستند. همچنین ، به خاطر داشته باشید که حتی همبستگی های ضعیف می تواند از نظر آماری قابل توجه باشد ، زیرا به زودی یاد خواهید گرفت.

 

ضریب همبستگی (R) توضیحات (راهنمای خشن)
+1. 0 مثبت عالی + ارتباط
+0. 8 تا 1. 0 ارتباط بسیار قوی +
+0. 6 تا 0. 8 ارتباط قوی +
+0. 4 تا 0. 6 ارتباط متوسط +
+0. 2 تا 0. 4 انجمن ضعیف +
0. 0 تا +0. 2 بسیار ضعیف + یا هیچ ارتباطی
0. 0 ت ا-0. 2 بسیار ضعیف - یا هیچ ارتباطی
-0. 2 ت ا-0. 4 ضعیف - ارتباط
-0. 4 ت ا-0. 6 متوسط - ارتباط
-0. 6 ت ا-0. 8 قوی - ارتباط
-0. 8 ت ا-1. 0 بسیار قوی - انجمن
-1. 0 ارتباط منفی کامل

چهار تصویر زیر این ایده را نشان می دهد که چگونه برخی از ضرایب همبستگی ممکن است در یک طرح پراکنده به نظر برسند.

طرح پراکندگی زیر رابطه فشار خون سیستولیک و سن در تعداد زیادی از افراد را نشان می دهد. این یک ضعف (36/0 = r) را نشان می دهد ، اما از نظر آماری معنی دار است (P<0.0001) positive association between age and systolic blood pressure. There is quite a bit of scatter, but there are many observations, and there is a clear linear trend.

چگونه یک همبستگی می تواند ضعیف باشد ، اما هنوز هم از نظر آماری قابل توجه است؟در نظر بگیرید که بیشتر نتایج دارای عوامل مختلف هستند. به عنوان مثال ، شاخص توده بدنی (BMI) توسط چندین عامل ("قرار گرفتن در معرض") مانند سن ، قد ، جنس ، مصرف کالری ، ورزش ، عوامل ژنتیکی و غیره تعیین می شود. بنابراین ، قد فقط یک تعیین کننده است و یک عامل مؤثر است، اما تنها تعیین کننده BMI نیست. در نتیجه ، ارتفاع ممکن است یک عامل مهم باشد ، یعنی ممکن است به طور قابل توجهی با BMI همراه باشد اما فقط یک عامل جزئی باشد. در این صورت ، اگر اندازه نمونه به اندازه کافی بزرگ باشد ، حتی یک همبستگی ضعیف از نظر آماری نیز قابل توجه بوده است. در اصل ، پیدا کردن یک همبستگی ضعیف که از نظر آماری قابل توجه است ، نشان می دهد که قرار گرفتن در معرض خاص بر متغیر نتیجه تأثیر دارد ، اما عوامل مهم دیگری نیز وجود دارد.

از روابط غیرخطی مراقب باشید

بسیاری از روابط بین متغیرهای اندازه گیری از نظر منطقی خطی هستند ، اما برخی دیگر به عنوان مثال ، تصویر زیر نشان می دهد که خطر مرگ به طور خطی با شاخص توده بدنی ارتباط ندارد. در عوض ، این نوع رابطه اغلب به عنوان "U شکل" یا "J شکل" توصیف می شود ، زیرا در ابتدا با افزایش x ، مقدار Y- متغیر در ابتدا کاهش می یابد ، اما با افزایش بیشتر در x ، Y- متغیر به میزان قابل توجهی افزایش می یابدبشررابطه بین مصرف الکل و مرگ و میر نیز "J شکل" است.

منبع: Calle EE ، et al: n Engl J Med 1999 ؛341: 1097-1105

یک روش ساده برای ارزیابی اینکه آیا یک رابطه از نظر منطقی خطی است ، بررسی یک طرح پراکندگی است. برای نشان دادن ، با استفاده از داده های حاصل از بررسی سلامت Weymouth در سال 2004 ، به طرح پراکندگی زیر ارتفاع (در اینچ) و وزن بدن (در پوند) نگاه کنید. R برای ایجاد طرح پراکندگی و محاسبه ضریب همبستگی استفاده شد.

پراکندگی بسیار زیادی وجود دارد ، و تعداد زیادی از نقاط داده ، ارزیابی کامل همبستگی را دشوار می کند ، اما روند از نظر منطقی خطی است. ضریب همبستگی 0. 56 است.

مراقب باشید از Outliers

همچنین در طرح بالا توجه داشته باشید که دو فرد با ارتفاع ظاهری 88 و 99 اینچ وجود دارد. ارتفاع 88 اینچ (7 فوت 3 اینچ) قابل قبول است ، اما بعید به نظر می رسد و ارتفاع 99 اینچ مطمئناً یک خطای برنامه نویسی است. خطاهای کدگذاری آشکار باید از تجزیه و تحلیل خارج شود ، زیرا آنها می توانند تأثیر ناچیزی در نتایج داشته باشند. همیشه ایده خوبی است که به منظور شناسایی هرگونه اشتباه ناخالص در برنامه نویسی ، به داده های خام نگاه کنیم.

پس از محرومیت از دو فضای باز ، طرح به این شکل است:

محتوا © 2021. کلیه حقوق محفوظ است. تاریخ آخرین اصلاح شده: 21 آوریل 2021. وین دبلیو لامورت ، دکتر ، دکترا ، MPH

ویدیو های آموزشی فارکس...
ما را در سایت ویدیو های آموزشی فارکس دنبال می کنید

برچسب : نویسنده : محبوب امانی بازدید : 77 تاريخ : پنجشنبه 24 فروردين 1402 ساعت: 16:15