فرضیه ها در رگرسیون چندگانه خطی

امتیاز کاربران

ستاره فعالستاره فعالستاره فعالستاره فعالستاره فعال
 

رگرسیون خطی چندگانه (Multiple regression) تعمیمی از رگرسیون خطی ساده (simple linear regression) میباشد. این روش آماری زمانی استفاده می شود که محقق قصد دارد در توصیف و پیشگویی مقادیر یک متغیر، از چند متغیر مستقل (دو و یا بیشتر) استفاده نماید. به بیانی ساده می توان بیان نمود: رگرسیون چندگانه  به شما این امکان را می دهد که برازش کلی (واریانس و تغییرات توصیفی)، مدل مورد نظر را تعیین نمایید و نسب توزیع هر یک از متغیرهای مستقل را در واریانس کل توزیع داده شده، مشخص ساخت. 

به سادگی و در زمانی اندک، می توان رگرسیون چندگانه را با نرم افزارهای آماری از جمله SPSS Statistics انجام داد، و به تفسیر نتایج آزمون های آن پرداخت. با این حال، قبل از انجام این تحلیل،  فرضیه های مختلفی که در مورد داده ها می بایست صدق کند تا تحلیل معتبری از رگرسیون چندگانه را داشته باشید؛ بررسی گردد.

 فرضیه ها(پذیره ها)

زمانی که رگرسیون چندگانه را مبنای تحلیل  خود قرار می دهید، بخشی از این فرآیند می بایست به این موضوع پرداخته شود که اطمینان حاصل گردد «داده های شما واقعاً امکان تحلیل با رگرسیون چندگانه را دارد». این مساله بسیار اهمیت دارد چرا که در صورت قبولی این پذیرها (8 پذیره زیر)، نتایج معتبر خواهد بود. قبل از ارائه این پذیره ها، به این نکته اشاره می گردد که ممکن داده های شما ممکن است یک یا چند پذیره را نقص نمایند و این موضوع زمانی که با داده های واقعی سرو کار دارید چیزی عجیبی نیست! حتی اگر داده های شما تعدادی از این پذیره ها را نقض نمایند؛ اغلب راه حلی برای قبله بر این نقیصه وجود دارد. 

 

پذیره1:

متغیر وابسته می بایست از نوع پیوسته باشد (یعنی از مقیاس اندازه گیری فاصله ای و یا نسبتی باشد). مثال هایی از این نوع متغیرها را می توان وزن، زمان،  طول و ... عنوان نمود. چنانچه داده های شما از مقیاس ترتیبی هستند؛ کاربر گرامی نیاز خواهد داشت که از رگرسیون ترتیبی به جای رگرسیون چندگانه استفاده نماید.  مثالهایی از متغیرهای ترتیبی را می توان مقیاس لیکرت، رتبه ها، نظر خواهی از مشتریان بر اساس چند گزینه های ترتیبی و ... عنوانم نمود.

 

پذیره2:

داده ها می بایست دو و یا بیشتر از دو متغیر مستقل را در برداشته باشد که متغیرها می توانند پیوسته (یعنی از مقیاس فاصله ای و یا نسبتی) و یا رسته ای (یعنی از مقیاس ترتیبی و یا اسمی ) باشند. توجه شود که چنانچه متغیرهای مستقل از توع دو دویی (dichotomous) باشد ممکن است در شرایطی لازم باشد که تحلیل دودویی تعدیل کننده(Dichotomous moderator analysis) استفاده نمایید.

 

پذیره3:

مشاهدات می بایست مستقل باشند(و این یعنی استقلال بین باقیمانده ها!)؛ که این موضوع با استفاده از آماره دوربین-واتسن بررسی می گردد.

 

پذیره4:

نیاز است که رابطه خطی بین الف: متغیر وابسته و هر یک از متغیرهای مستقل، ب: متغیر وابسته و تمامی متغیرهای مستقل به صورت تواماً، برقرار باشد. بررسی این موضوع معمولا با استفاده از نمودارهای پراکتش و نمودار رگرسیون جزئی(partial regression plots) صورت می پذیرد و به صورت چشمی و تجربی وجود رابطه خطی قابل کنترل کردن می باشد. در صورتی که این رابطه خطی تایید نگردد محقق می بایست از تحلیل رگرسیون غیر خطی و یا تبدیل داده ها می بایست بهره گیرد. 

 

پذیره5:

محقق می بایست هم واریانسی (homoscedasticity) را اثبات نماید. هم واریانسی به مفهموم ثبات واریانس در طول بهترین خط برازش داده شده می باشد.

 

پذیره6:

داده ها نباید آثاری از هم خطی چندگانه(multicollinearity) را در خود داشته باشند. هم خطی چندگانه به مفهوم وجود همبستگی بالا بین دو یا چند متغیر مستقل می باشد. در صورت وجود هم خطی چندگانه، مشکلاتی را خواهیم داشت که عبارتند از: مشکل در فهم اینکه کدام متغیر مسقل در توضیح واریانس متغیر وابسته نقش دارند؛ واریانس بالای ضرایب و ..

 

پذیره7:

نباید داده های پرت معنی دار، نقاط اهرمی(نافذ=Leverage) بالا یا نقاط موثر(influential) خیلی بالا وجود داشته باشد. نقاط پرت، اهرمی و یا موثر موجودیت متفاوتی را در داده ها نشان می دهند که به طریقی غیر معمول هستند مخصوصا زمانی که قصد دارید تحلیل رگرسیون چندگانه را اجرا نمایید. این دسته بندی نقاط غیر معمول اثرات متفاوتی را منعکس می نماید که آنها روی خط رگرسیونی دارند. توجه شود که یک مشاهده می تواند در چند طبقه از این نقاط غیر معمول نیز دسته بندی گردد. با استفاده از نرم افزار SPSS Statistics ابزاری(همانند CaseWise Diagnostics و Studentized deleted residuals و Cook's Distance) برای شناسایی این نقاط وجود دارد که کار تحلیل گر را ساده می نماید.  

 

پذیره8:

باقیمانده ها(خطاها) می بایست تقریباً دارای توزیع نرمال باشند. دو روش معمول برای بررسی این موضوع الف: ترسیم نمودار هیستوگرام با منحنی نرمال و یا P-P plot ب: نمودار  Q-Q نرمال از باقمیانده های استودنت شده می باشد.

 

محقق پذیره های شماره 3 الی 8 را با استفاده از SPSS Statistics کنترل نماید. ابتدای تحلیل می بایست پذیره های 1 و2 و سپس پذیرهای دیگر کنترل گردد. بخاطر داشته باشید؛ چنانجه به طور صحیح آزمون های آماری  برای این پذیره ها انجام نشود؛ ممکن است تحلیل انتهایی معتبر نباشد. جهت آموزش های جزئی تر و انجام تحلیل های اشاره شده، با ما تماس بگیرد.

 

جهت درخواست آموزش نرم افزارهای آماری و یا انجام پروژه های آماری از یکی از روش های زیر میتوانید با تیم آی آر آمار در ارتباط باشید. لازم به توضیح می باشید فرآیند مشاوره و همچنین پاسخگویی به سوالات کوتاه به صورت کاملا رایگان ارائه می گردد.

 

شماره تماس:   09300023999

رایانامه:  این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

 

Tags: مقالات رایگان

نوشتن دیدگاه


تصویر امنیتی
تصویر امنیتی جدید

دفاتر ما

تماس با ما آمادگی داریم تا با شبکه ای از همکاران و مشاوران در هر یک از شهرهای بزرگ (تهران-اصفهان-مشهد-زنجان-... )در کنار شما باشیم 

 با ما در تماس باشید

نظر کاربران

  • مهدی یار

    با تشکر از تمامی زحمات دست اندرکارن و زحمت کشان، برای همگی آرزوی سلامتی و بهروزی دارم
  • پری کرمی

    به کارهای خوبتون ادامه بدید. لطفا برای ارسال مطالب و درج اون قسمتی را تعبیه کنید
  • فاطمه بهرامی

    آقای تازیکه امیدوارم در کار خود موفق و پیروز باشد.
  • 1
  • 2
  • 3

آخرین نظرات

  • سلام خسته نباشید من فیلم اموزشی نرمافزار ایزی فیت رو خیلی ...

    ادامه مطلب ..و

     
  • احسنت بر شما. آموزش بسیار خوبی بود. * نتیجه گیری: مطابق نتایج ...

    ادامه مطلب ..و

آمار سایت