آزمون مربع كای (خي‌دو يا كي‌دو) تك متغيره

دستورالعمل Chi–Square Test يك متغير را در رسته ها (categories)جدول‌بندي مي‌كند و فرضيه‌هاي مبني بر اينكه فراواني‌هاي مشاهده شده از فراواني‌هاي مورد انتظارشان تفاوت نمي‌كنند را مورد آزمون قرار مي‌دهد.

آزمون مربع كاي(The Chi-Square Test) برای کاربر گرامی این امکان را فراهم می کندکه:

 ـ تمام رسته های متغير آزمون را شامل مي‌شود، يا آزمون را به دامنه‌اي معيني محدود مي‌نمايد.

ـ مقادير استاندارد يا سفارشي شده مورد انتظار را به كار مي‌برد.

ـ آماره‌هاي توصيفي و / يا چارك‌ها را در متغير آزمون بدست مي‌آورد.

آزمون استقلال(Testing Independence)

در يك برنامه زمان‌بندي بيمارستاني بزرگ براي ترخيص بيماران فرض بر اين شده است كه بيماران با نرخ ثابتي در هفته بيمارستان را ترك مي‌كنند. مسئولين بيمارستان مي‌خواهند بدانند كه آيا تعداد ترخيصي‌ها با روزهاي هفته متغير است يا نه.

اين مثال از فايل dischargedata.sav استفاده مي‌كند(برای دانلود فایل  با فرمت SAV کلیک کنید). با آزمون Chi – Square فرضيه رفتن بيماران از بيمارستان با نرخ ثابت را بررسي نماييد.

 آماده كردن داده‌ها(Preparing the Data)

 هر مورد يك روز در هفته مي‌باشد، و براي اجراي آزمون مربع كاي، بايد ابتدا موارد را با فراواني ترخيص بيمار وزن نماييد.

1ـ براي وزن‌دهي موارد، مسير Data > Weight Cases را از نوار منوي Data Editor برگزينيد. (به جزئی و دقیق در مطلبی با عنوان وزن دهی داده ها این موضوع بررسی شده است)

2ـ گزينه Weight Cases by را فعال كنيد.

3ـ گزينه Average Daily Discharges را به عنوان متغير فراواني انتخاب نماييد.

4ـ Ok را كليك كنيد. 

موارد اكنون با فراواني ترخيص بيمار وزن مي‌شوند.

 

اجرای تحليل(Running the Analysis)

 1ـ مسير ...Analyze>NonParametric Tests >Legacy Dialogs>Chi–square را از نوار منو برگزينيد. 

2ـ Day of the Week را بعنوان متغير آزمون برگزينيد.

3ـ Ok را كليك كنيد. 

جدول فراوانی كای دو(Chi-Square Frequency Table)

ـ در اينجا، فراواني مشاهده شده (Observed) براي هر سطر به سادگي ميانگين تعداد بيماران ترخيصي در روز در كل سال مي‌باشد. مثلاً در سال گذشته، بيمارستان تعداد ميانگين 589 بيمار را در هفته، 44 بيمار را در يكشنبه، 78 بيمار را در دوشنبه و ... ترخيص كرد ‌(a).

ـ فراواني مورد انتظار (Expected) مربوط به هر سطر برابر مجموع فراواني‌هاي مشاهده شده تقسيم بر تعداد سطرها در جدول مي‌باشد. در اين مثال، 589 ترخيص در هفته مي‌باشد، كه حدود 84 ترخيص را در روز نتيجه مي‌دهد (b).

ـ در آخر، باقي‌مانده (Residual) برابر با فراواني مشاهده شده منهاي مقدار مورد انتظار (ستون دوم) مي‌باشد. 

از این رو جدول نشان مي‌دهد كه يكشنبه کمترین، و جمعه بیشترین تفاوت را  (از فرضيه مورد انتظار «هر روز مساوي است») دارند.

جدول آزمون كای دو(Chi-Square Test Table)

ـ آماره بدست آمده كاي دو برابر 29.389 مي‌باشد. اين مقدار با مربع گرفتن از باقي‌مانده هر روز، تقسيم بر مقدار مورد انتظار، و جمع در سرتاسر روزها محاسبه شده است.

ـ عبارت df درجه آزادي را نشان مي‌دهد. در يك آزمون مربع كاي، df تعداد مقادير مورد انتظار است كه مي‌تواند قبل از اينكه باقي‌مانده كاملاً تعيين شود تغيير نمايد. در مورد يك آزمون مربع كاي تك موردي، df برابر تعداد سطرها منهاي 1 است.

ـ Asymp.sig برآورد احتمالي حاصله از يك مقدار مربع كاي بزرگتر يا مساوي ‌29.389 مي‌باشد به شرطي كه بيماران بصورت يكنواخت در طول هفته ترخيص شوند. سطح معني‌داري كوچك به اين معني است كه ميانگين نرخ ترخيص بيماران در روزهاي هفته متفاوت است. توجه شود که این مقدار معمولا با عنوان مقدار احتمال شناخته می شود. 

بررسی يك دامنه معين(Testing a Specific Range)

 در حالت پيش فرض، رویکرد آزمون مربع كاي بر اساس مقادير مهمتر متغير آزمون، فراواني‌ها را ايجاد كرده و يك مقدار مورد انتظار را محاسبه مي‌نمايد. با اين وجود، ممكن است بخواهيد كه دامنة آزمون را به يك مجموعة مقادير در دسترس محدود نماييد. همانطور كه مثال بعد نشان مي‌دهد، دستورالعمل به آساني براي اين به كار مي‌رود.

بيمارستان در ادامه تحليل مي‌خواهد بداند كه آيا مي‌توان  گفت در يك برنامه‌بندي زماني بيماران از دوشنبه تا جمعه با نرخ ثابت روزانه ترخيص شده اند.

 

اجرای تحليل(Running the Analysis)

1ـ براي بازگشت به تحليل، جعبه محاوره Chi-Square Test را فراخواني نماييد.

2ـ گزينه Use Specified range را انتخاب كنيد.

3ـ 2 را براي كمترين مقدار و 6 را براي بيشترين مقدار تايپ كنيد(توضیح: در فایل داده به ترتیب از یکشنبه تا شنبه را با کد های 1 الی 7 نام گذاری کرده اند. از این رو برای انتخاب دوشنبه تا جمعه کافیست کدهای متناظر 2 الی 6 را انتخاب کنیم).

4ـ Ok را كليك كنيد. 

جدول فراوانی مربوط به داده های روزهای هفته(Frequency Table of Weekday Data)

 دامنه آزمون به دوشنبه تا جمعه محدود شده است. بطور متوسط، حدود 92 بيمار در روزهاي كاري از بيمارستان ترخيص مي‌شوند (a). ستون Residual نشان مي‌دهد كه دوشنبه‌ها کمتر و جمعه‌ها بیشترین باقیماندهها را دارند.  البته، فقط با نگاه كردن به اينها نمي‌توانيم بگوييم كه اين اختلافات معني‌دار هستند. 

آزمون مربع كای روزهای كاری(Chi-Square Test of Weekday Data)

با درجه آزادي 4، خي دو بدست آمده (5.822) به هيچ سطح معني‌داري قابل قبولي نزديك نيست در نتيجه ما نمي‌توانيم فرضيه‌اي را كه مي‌گويد بيماران با نرخ حدود 92 نفر در هفته ترخيص مي‌شوند رد نماييم.

 

خلاصه(Summary)

با استفاده از رویکرد آزمون کای دو، کاربر گرامی متوجه شد که نرخی که بیماران از بیمارستان و در طول یک هفته ترخیص می شوند؛ ثابت نمی باشد. این موضوع بیشتر به این مساله بر می گردد که بیشتر ترخیص ها در جمعه و کمترین مقدار در روز یکشنبه صورت می پذیرد. زمانی که تحلیل را به روزهای کاری محدود کردیم متوجه شدیم که نرخ ترخیص حالت یکنواختی بیشتری را نشان می دهد. بر این اساس شما در قبای مسئول بیمارستان می توانید ذخیره و رزرو حضور کارکنان را در دو بخش روزهای کاری و روزهای آخر هفته برنامه ریزی کنید.

 

 سفارشی كردن مقادير مورد انتظار(Customizing Expected Values)

 آزمون مربع كاي معمولاً براي بررسي فراواني‌هاي مشاهده شده در مقابل يك مقدار مورد انتظار واحد كه برابر همة سطرها مي‌باشد به كار مي‌رود. با اين وجود، توزيع مقادير ممكن است از آن الگو تبعيت نكند.

مثلاً در علم ژنتيك، انتظار داريد كه خصوصيات غالب را در 75% مردم و مغلوب را در 25% باقي‌مانده ببينيد. دستورالعمل آزمون مربع كاي اين امكان را فراهم مي‌آورد كه يك مجموعة سفارشي از مقادير مورد انتظار را تعيين نماييد، از اين راه يك دامنه وسيع از مدل‌ها بررسي مي‌شوند.

يك توليد كنندة پوشاك سعي دارد از پست درجه 1 استفاده نمايد، تا سريع‌تر جواب بگيرد. مشتريان سفارش دهنده تعداد هفته‌هايي را كه ارسال سفارشي طول مي‌كشد ثبت مي‌نمايند.

اين اطلاعات در فايل mailresponse.sav ذخيره شده است(برای دانلود فایل  با فرمت SAV کلیک کنید). 

با استفاده از آزمون مربع‌كاي تعيين كنيد كه آيا درصد سفارشات در هفته با دو روش متفاوت هستند.

 

آماده كردن داده‌ها(Preparing the Data)

 داده‌ها بصورت هفتگي جدول‌بندي شده‌اند و بايد ابتدا با فراواني پاسخ پست درجه اول وزن‌دهي شوند.

1ـ براي وزن‌دهي داده‌ها، مسير Data > Weight Cases را از نوار منوي Data Editor برگزينيد.

2ـ گزينه Weight Cases by را انتخاب كنيد.

3ـ First Class Mail را بعنوان متغير فراواني برگزينيد.

4ـ Ok را كليك كنيد. 

اكنون داده‌ها وزن شده‌اند و آمادة تحليل هستند.

 

اجرای تحليل(Running the Analysis)

 1ـ براي آغاز تحليل، مسير ...Analyze > NonParametric Tests>Legacy Dialogs > Chi – Square را از نوار منو برگزينيد.

2ـ Week of Response را به عنوان متغير آزمون برگزينيد.

3ـ Values را در مجموعة Expected Values انتخاب نماييد.

4ـ عدد 6 را بعنوان اولين مقدار مورد انتظار تايپ كرده و Add را كليك كنيد. 

5ـ اين رويه را تكرار كنيد و مقادير 15.1، 18، 12، 11.5، 9.8، 7، 6.1، 5.5، 3.9، 2.1 و 2 را اضافه نماييد.

6ـ بعد از وارد كردن این  12 مقدار، دكمه Ok را كليك كنيد. 

ارزیابی برازش بين مشاهدات و پاسخ‌های مورد انتظار(Assessing the Fit between Observed and Expected Responses)

 ـ درصدهاي پاسخ مشاهده شده در ستون Observed N ظاهر مي‌گردد. به دليل استفادة اين بعنوان متغير وزن‌دهي، اينها مقادير واقعي متغير First Class Mail مي‌باشند.

ـ درصدهاي پاسخ مورد انتظار در ستون Expected N ظاهر مي‌شود. توجه نماييد كه مقادير در اين ستون صرفاً درصدهاي تاريخي مربوط به پست معمولي هستند كه اينها را در جعبه محاورة Chi–Square Test وارد كرديد.

ـ تفاوت بين درصدهاي پاسخ پست درجه 1 و معمولي در ستون Residual ظاهر مي‌شود.

شركت اميدوار است كه پست درجه 1 سريع‌تر پاسخ مشتريان را بدهد. در دو هفته اول، اين اختلاف معادل چهار و هفت دهم درصد مي‌باشد. سؤال اين است كه آيا اختلاف بين دو توزيع كلي به اندازة كافي بزرگ مي‌باشد تا يك اختلاف ايجاد نمايد. 

در 11 درجه آزادي، آمارة بدست آمدة مربع كاي (12.249) از نظر آماري معني‌دار نيست. اين ارتقاء خاص منجر به زمان‌هاي پاسخي نمي‌شود كه به طور معني‌داري از پست معمولي استاندارد تفاوت دارد. 

خلاصه(Summary)

با استفاده از رویکرد آزمون کای دو با مقادیر مورد انتظار دلخواه، کاربر گرامی متوجه شد که با استفاده از پست کلاس اول منجر به زمان های پاسخ سریعتر نمی شوند. پست های بالک(Bulk) برای ایمیل های مستقیم به صرفه تر می باشد.

 

 

جهت درخواست آموزش نرم افزار SPSS و یا انجام پروژه های آماری از یکی از روش های زیر میتوانید با تیم آی آر آمار در ارتباط باشید. لازم به توضیح می باشید فرآیند مشاوره و همچنین پاسخگویی به سوالات کوتاه به صورت کاملا رایگان ارائه می گردد.

 

شماره تماس:   09300023999

رایانامه:  این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

 

Tags: نرم افزارهای آماری پروژه های آماری

نوشتن دیدگاه


تصویر امنیتی
تصویر امنیتی جدید

دفاتر ما

تماس با ما آمادگی داریم تا با شبکه ای از همکاران و مشاوران در هر یک از شهرهای بزرگ (تهران-اصفهان-مشهد-زنجان-... )در کنار شما باشیم 

 با ما در تماس باشید

آمار سایت