تخمین ضریب همبستگی با استفاده از رویکرد بیزی و کاربردهای آن برای تحقیقات اپیدمیولوژیک

ساخت وبلاگ

رویکرد بیزی یکی از گزینه های جایگزین برای برآورد ضرایب همبستگی است که در آن دانش از مطالعات قبلی برای بهبود تخمین درج شده است. هدف از این مقاله نشان دادن ابزار رویکرد بیزی برای برآورد همبستگی با استفاده از دانش قبلی است.

مواد و روش ها

استفاده از تحول مماس هیپربولیک (ρ = TanH ξ و R = TanH Z) محقق را قادر می سازد تا از خواص کونژوگه توزیع عادی استفاده کند ، که با ترکیب ضرایب همبستگی از مطالعات مختلف بیان می شود.

نتیجه گیری

یکی از نقاط قوت روش پیشنهادی این است که محاسبات ساده است اما دقت حفظ می شود. مانند متاآنالیز ، می توان آن را به عنوان روشی برای ترکیب همبستگی های مختلف از مطالعات مختلف مشاهده کرد.

زمینه

ضریب همبستگی یک اندازه گیری استاندارد از ارتباط بین دو متغیر تصادفی است و به طور گسترده در اپیدمیولوژی استفاده می شود. به همین ترتیب ، توجه قابل توجهی به تفسیر آن [1-3] و همچنین به روش های تصحیح میرایی به دلیل خطای اندازه گیری تصادفی [4 ، 5] داده شده است. استراتژی های اصلاح خطای اندازه گیری نیاز به دانش در مورد قابلیت اطمینان اندازه گیری ها [2] برای استفاده از یک استاندارد طلای آلیاژ [6] برای برآورد ضرایب قابلیت اطمینان دارد. در بسیاری از مطالعات اپیدمیولوژیک ، قابلیت اطمینان از اندازه گیری ها ناشناخته است و تصحیح میرایی را غیرممکن می کند.

روشهای کلاسیک فقط بر اساس داده های جمع آوری شده بنا شده و هرگونه دانش قبلی از انجمن تحت بررسی را نادیده می گیرند. رویکرد بیزی یکی از گزینه های جایگزین برای برآورد ضرایب همبستگی است که در آن دانش از مطالعات قبلی برای بهبود تخمین درج شده است. هدف از این مقاله نشان دادن ابزار رویکرد بیزی است. خصوصیات خلاصه و تصحیح خطای اندازه گیری رویکرد بیزی نشان داده خواهد شد. برای نشان دادن این روش ، همبستگی بین افزایش وزن مادر در دوران بارداری و وزن هنگام تولد نوزاد بررسی خواهد شد.

روش های آماری

قضیه بیز معتقد است که وضعیت قبلی دانش اطلاعات مربوط به تجزیه و تحلیل آماری را ارائه می دهد. برای به روزرسانی اعتقادات در مورد یک فرضیه ، از قضیه بیز برای محاسبه احتمال خلفی فرضیه ، مانند ضریب همبستگی ρ استفاده می شود. به همین ترتیب ، قضیه بیز [7] معتقد است که احتمال خلفی ρ توسط فرمول زیر داده می شود:

فاکتور P (داده ها | ρ) تابع احتمال ارزیابی در ρ یا داده های جمع آوری شده از مطالعه محقق است. P (ρ) به اطلاعات موجود قبل از مطالعه بستگی دارد ، یعنی احتمال قبلی. اصطلاح 1/ p (داده) باید به عنوان عاملی مشاهده شود که احتمال کل در هنگام افزودن بیش از همه ρ ممکن است برابر با 1 باشد. یعنی مخرج P (داده) مبلغ یا انتگرال شمارشگر در همه ρ است. اغلب از آن به عنوان ثابت عادی یاد می شود. قضیه بیز [8] را می توان به این ترتیب بازنویسی کرد:

احتمال خلفی ∝ احتمال × احتمال قبلی (1. 2)

جایی که ∝ به معنای متناسب با است.

ما تصور می کنیم که دو متغیر مورد علاقه ، x و y ، توزیع عادی دو متغیره را با معنی μ دنبال می کنندxو μy، واریانس σxو σyبه ترتیب ، و ضریب همبستگی ρ (x ، y) = ρ. ما از نماد معمولی زیر برای نشان دادن نمونه ، واریانس و کواریانس استفاده خواهیم کرد:

همچنین ، به عنوان یک یادآوری ، ضریب همبستگی نمونه توسط:

با استفاده از مقدمات مرجع استاندارد برای μx, μy, σx، و σyو با استفاده از (1. 2) ، تقریب معقول به چگالی خلفی [4] ρ توسط

پس از انجام جایگزینی ρ = tanh ξ و r = tanh z ، می فهمیم که ξ تقریباً با میانگین Z و واریانس 1/n طبیعی است. این نتایج در یک سری از تعویض های پیچیده توسط فیشر [10] به دست آمده است و به تفصیل در جای دیگر شرح داده شده است [4].

یکی از مهمترین خصوصیات تحول مماس هیپربولیک (ρ = TanH ξ و R = Tanh Z) ظرفیت آن برای استفاده کامل از خواص کونژوگه توزیع طبیعی است که با ترکیب ضرایب همبستگی از مطالعات مختلف انجام می شود. همانطور که در (1. 2) گفته شد ، برای یافتن چگالی خلفی به یک عملکرد قبلی و احتمال نیاز داریم ، که از توزیع عادی پیروی می کند:

μ خلقی= ς 2پید× (nپیشtan h-1 rپیش+ nاحتمالtan h-1 rاحتمال) (1. 5)

به طور کلی ، بسیاری از مقدمات مختلف را می توان در (1. 4) استفاده کرد ، اما به وضوح استنباط آسانتر می شود اگر ما به صورت زیر برای C انتخاب کنیم:

P (ρ) ∝ (1 - ρ 2) C (1. 7)

انتخاب C یک مهم است ، زیرا وزنی را که پیش بینی می کند تعیین می کند. اگر اطلاعاتی از مطالعات قبلی نداریم ، یک انتخاب مشترک برای C 0 خواهد بود ، یعنی P (ρ) ∝ 1. گزینه های دیگری برای C وجود دارد ، مانن د-3/2 (به عنوان چندگانه گفته می شودپارامتر قانون جفریس) [8]. شرح مفصلی از این مفهوم فراتر از محدوده این مقاله است و در جای دیگر مورد بحث قرار می گیرد [9 ، 10].

کاربرد

محققان فرض کرده اند که وزن هنگام تولد و افزایش وزن مادر در دوران بارداری به ویژه در زنان آمریکایی آفریقایی ارتباط دارد. برای بررسی این سؤال ، ما از داده های مطالعه کوهورت Angler استفاده کردیم.

شرح جمعیت مورد مطالعه

مطالعه کوهورت آنگلر ایالت نیویورک در سال 1991 برای توصیف قرار گرفتن در معرض آلاینده های سمی مداوم از طریق مصرف ماهی های ورزشی دریاچه انتاریو در مردان و زنان در سن باروری آغاز شد. روابط بالقوه بین این مواجهه ها و نقاط پایانی تولید مثل و رشد نیز مورد بررسی قرار گرفت. توضیحی از این گروه و در جای دیگر منتشر شده است [11]. به طور خلاصه ، مطالعه کوهورت Angler ایالت نیویورک از یک طرح مقطعی برای بررسی نمونه تصادفی طبقه بندی شده از مردان و زنان بین 18 تا 40 سال که مجوزهای ماهیگیری را در 16 ایالت بالادست نیویورک در نزدیکی دریاچه انتاریو خریداری کرده اند ، استفاده کرد. اطلاعات مفصلی برای کودکانی که بین سالهای 1986 و 1991 به اعضای گروه متولد شده اند ، رعایت شده است و شامل داده های مربوط به شناسنامه و سوابق پزشکی مادران و نوزادان است. از 2430 زن مبتلا به زایمان شاخص تک آهنگ در دوره زمانی مطالعه ، 2205 (91 ٪) هم سوابق پزشکی و هم شناسنامه های موجود را در دسترس داشتند که داده های مفقود شده مربوط به سوال مطالعه وجود ندارد.

اجرای روش بیزی

همبستگی بین افزایش وزن مادر در دوران بارداری و وزن تولد نوزادان در زنان آمریکایی آفریقایی با استفاده از داده های مطالعه کوهورت آنگلر تخمین زده شد. مشخص است که افزایش وزن مادر در این مطالعه با خطا اندازه گیری شد. ضریب همبستگی نمونه بین افزایش وزن مادر و وزن هنگام تولد نوزاد R بودباسله= 0. 27 (26 نفر). این برآورد با مطالعه قبلی بسیار متفاوت است (rباسله= 0. 63) که در آن اندازه گیری افزایش وزن مادر به طور دقیق تر انجام شد و در یک نمونه بزرگ (1026 = n) مستقر شد [12].

ما داده های جمع آوری شده در مطالعه کوهورت آنگلر را با اطلاعات حاصل از مطالعه قبلی با استفاده از فرمول ها (1. 5) و (1. 6) ترکیب کردیم. به طور خاص ، ما یک قبلی و احتمال عادی توزیع شده داشتیم ، که عملکردهای کونژوگه هستند. توزیع خلفی سپس به طور معمول با واریانس زیر توزیع می شود:

μ خلقی= ς 2پید× (nپیشtan h-1 rپیش+ nاحتمالtan h-1 rاحتمال) =

0. 0009 × (1026 × TAN H-1 0. 63 + 26 × TAN H-1 0. 266) = 0. 691

یعنی طبیعی (میانگین = 0. 691 ، واریانس = 0. 0009) ، و در نتیجه برآورد نقطه ضریب همبستگی TANH (0. 691) = 0. 598.

از آنجا که ما توزیع خلفی را می دانیم ، می توانیم فاصله احتمال خلفی 95 ٪ را نیز محاسبه کنیم ، که توسط آن تعریف شده است

با استفاده از تحولات مماس هیپربولیک ، ما یک فاصله مربوطه برای خلفی ρ (0. 56-0. 63) به دست آوردیم. اگر ما فقط نتیجه گیری خود را بر اساس داده های جمع آوری شده بنا کنیم ، فاصله اطمینان 95 درصد 1. 96 ± 0. 27 × (1/26) 1/2 یا (-0. 11-0. 65) خواهد بود. این مربوط به فاصله اطمینان 95 ٪ برای ضریب همبستگی (-0. 11-0. 57) در مقیاس اصلی است.

بحث

ادبیات اپیدمیولوژیک روشهای مختلفی را برای ترکیب نتایج مطالعه مانند متاآنالیز یا روشهای تصحیح برای نگرانی در مورد خطای اندازه گیری ارائه می دهد. برخی از این رویکردها به طور مستقیم در مطالعات همبستگی کاربردی نیستند در حالی که برخی دیگر به دلیل عدم مناسب بودن نرم افزار آماری و فرمولاسیون های پیچیده ریاضی عملی نیستند. در این مقاله ، ما اپیدمیولوژیست ها را به یک روش جایگزین برای برآورد ضرایب همبستگی معرفی می کنیم ، که هم ساده و هم دقیق است.

در مثال ما ، فاصله اطمینان از همبستگی بین افزایش وزن مادر و وزن تولد نوزادان فقط بر اساس داده های مطالعه کوهورت آنگلر بسیار گسترده و شامل صفر بود. با این حال ، پس از استفاده از روش های بیزی ، برآورد نقطه افزایش یافته و فاصله بسیار باریک شد. با فرض اینکه وزن هنگام تولد کاملاً اندازه گیری شده است ، سه توضیح بالقوه برای تفاوت های مشخص در تخمین های نقطه و فاصله وجود دارد: (1) تغییر نمونه گیری وجود داشت ، (2) در اندازه گیری های افزایش وزن خطای اندازه گیری وجود داشت که رابطه را ضعیف می کرد ، یا (3)این دو نمونه از دو جمعیت متفاوت آمده است. اگر محقق گمان کند که تفاوت در تخمین نقطه و فواصل اطمینان به دلیل دو تغییر نمونه گیری ، اندازه نمونه کوچک یا خطای اندازه گیری تصادفی است ، رویکرد بیزی یک سازش معقول را فراهم می کند.

خطای اندازه گیری تصادفی ضرایب همبستگی را نسبت به تهی Trhe (یعنی به سمت هیچ ارتباطی) کاهش می دهد. استراتژی های اصلاح خطای اندازه گیری نیاز به دانش در مورد قابلیت اطمینان اندازه گیری ها دارد [1-4] ، که معمولاً در دسترس نیست ، یا افزایش اندازه نمونه ، که معمولاً امکان پذیر نیست. با این حال ، هنگامی که دانش مربوط به همبستگی از مطالعات قبلی وجود دارد ، می توان با داده های جمع آوری شده همراه و استنتاج بهبود یافت. برآورد همبستگی از مطالعات قبلی می تواند از این طریق برای خنثی کردن اثرات خطای اندازه گیری استفاده شود. علاوه بر این ، از رویکرد بیزی می توان برای ترکیب بسیاری از ضرایب همبستگی در صورت لزوم برای دستیابی به برآوردهای بهتر نقطه با فواصل اطمینان باریک استفاده کرد.

روشهای بیزی در ادبیات زیست پزشکی ، از جمله اپیدمیولوژی ، مورد توجه زیادی قرار نگرفته است. قدرت روش پیشنهادی این است که محاسبات ساده است. در حالی که تقریب دقیق تر به این روش می تواند حاصل شود ، دستاوردهای نسبی اندک است و با پیچیدگی محاسبات جبران می شود [4]. یکی دیگر از استحکام قابل توجه روش بیزی این است که فواصل اطمینان را می توان به عنوان احتمالات تفسیر کرد زیرا بر اساس یک عملکرد احتمال واقعی است. این محقق را قادر می سازد ماهیت رابطه بین دو متغیر را بطور شهودی ارزیابی کند.

از رویکرد بیزی می توان برای اصلاح برخی از میرایی ها به دلیل خطای اندازه گیری و نمونه برداری از جمعیت مرجع استفاده کرد. با این حال ، ما می دانیم که توجه ویژه ای به انتخاب قبلی هنگام استفاده از روشهای تصحیح بیزی توجه می شود ، زیرا تفاوت در برآورد همبستگی بین جمعیت نمونه برداری شده و قبلی ممکن است منعکس کننده ناهمگونی جمعیت باشد ، و نه در مورد مشکلات نمونه برداری ، به خودی خود.

نتیجه

ما اپیدمیولوژیست ها را ترغیب می کنیم که رویکرد بیزی را به عنوان ابزاری برای جمع بندی ضرایب همبستگی در سراسر مطالعات و ارزیابی روابط در هنگام خطای اندازه گیری و قدرت آماری در نظر بگیرند. این رویکرد برای کلیه زیر تخصص های اپیدمیولوژی مناسب است.

منابع

لیو K: خطای اندازه گیری و تأثیر آن بر همبستگی جزئی و تجزیه و تحلیل رگرسیون خطی چندگانه. Am J Epidemiol. 1988 ، 127: 864-874.

Hakstian AR ، Schroeder ML ، Rogers WT: نظریه استنباطی برای ضرایب همبستگی جزئی ناراحتی. Psychometrika. 1989 ، 54: 397-407.

Millsap Re: واریانس نمونه برداری در ضرایب همبستگی ضعیف: یک مطالعه مونت کارلو. J Appl Psychol. 1988 ، 73: 316-319. 10. 1037 // 0021-9010. 73. 2. 316.

Bashir SA ، Duffy SW: تصحیح تخمین خطر برای خطای اندازه گیری. آن اپیدمیول. 1997 ، 7: 154-164. 10. 1016/S1047-2797 (96) 00149-4.

KBG عزیز ، Puterman ML ، Dobson AJ: تخمین همبستگی از داده های اپیدمیولوژیک در حضور خطای اندازه گیری. آمار در پزشکی. 1997 ، 16: 2177-2189. 10. 1002/(SICI) 1097-0258 (19971015) 16: 193. 3. co ؛ 2-E.

Spiegelman D ، Cassella M: مدلهای رگرسیون کاملاً پارامتری و نیمه پارامتری برای وقایع مشترک با خطای اندازه گیری کواریان در طرح های مطالعه اصلی/اعتبار سنجی. بیومتریک1997 ، 53: 395-409.

لی نخست وزیر: آمار بیزی: مقدمه. نیویورک ، انتشارات دانشگاه آکسفورد. 1989

Berry DA ، Stangl DK: زیست شناسی بیزی. نیویورک ، مارسل دکر. 1996

Box Gep ، Tao DR: استنباط بیزی در تجزیه و تحلیل آماری. خواندن ، MA ، آدیسون-وسلی. 1973

Fisher RA: توزیع فرکانس مقادیر ضریب همبستگی در نمونه ها از یک جمعیت نامحدود. بیومتریکا. 1915 ، 10: 507-521.

Mendola P ، Vena J ، Buck GM: خصوصیات قرار گرفتن در معرض ، سلامت تولید مثل و رشد در مطالعه کوهورت آنگلر نیویورک. بررسی تحقیقات دریاچه های عالی. 1995 ، 1: 2-

Pickett KE ، Abrams B ، Selvin S: قد مادر ، افزایش وزن بارداری و وزن هنگام تولد. Am J Hum Biol. 2000 ، 12: 682-687. 10. 1002/1520-6300 (200009/10) 12: 53. 0. co ؛ 2-X.

تاریخ قبل از انتشار

به تاریخچه قبل از انتشار این مقاله می توانید در اینجا دسترسی پیدا کنید: http: //www.biomedcentral.com/1471-2288/3/5/prepub

تصدیق

ما می خواهیم از دکتر باک تشکر کنیم که به ما اجازه داده است از داده های گروهی Angler و نظرات روشنگری وی در مورد نسخه های قبلی این مقاله استفاده کنیم.

اطلاعات نویسنده

نویسندگان و وابستگی ها

بخش اپیدمیولوژی ، آمار و پیشگیری از انستیتوی ملی بهداشت کودکان و توسعه انسانی / انستیتوی ملی بهداشت ، بتسدا ، دکتر ، ایالات متحده

Enrique F Schisterman ، Lucinda J England & Malla Rao

گروه کنترل سرطان ، اپیدمیولوژی و زیست شناسی ، انستیتوی سرطان پارک روزول ، بوفالو ، نیویورک ، ایالات متحده

ویدیو های آموزشی فارکس...
ما را در سایت ویدیو های آموزشی فارکس دنبال می کنید

برچسب : نویسنده : محبوب امانی بازدید : 54 تاريخ : چهارشنبه 27 ارديبهشت 1402 ساعت: 18:17