فرض های تجزیه واریانس(ANOVA Assumptions)
شنبه, ۱۵ تیر ۱۳۹۲، ۱۲:۵۶ ق.ظ
یکی از اساسیترین قسمتهای تکنیکهای آماری برای آنالیز داده های آزمایشی (Experimental Data) که در قالب طرحهای آزمایشی (Experimental Design) پیاده شدهاند تجزیه واریانس (ANOVA = Analysis of variance) میباشد. تجزیه واریانس در اکثر رشته های دانشگاهی کاربرد فراوان دارد. محققینی که کمتر در زمینه آمار مطالعه داشتهاند، به خصوص محققین رشتههایی که بیشتر در حیطه علوم زیستی و علوم انسانی میباشند، به دلیل ضعف زمینه ریاضیات و آمار، گمان میبرند تمام انواع داده های آزمایشی را میتوان به سرعت تجزیه واریانس کرده و آنها را مورد آنالیز قرار داد. اما اصول آماری بیانگر چیز دیگری است.
قبل از اینکه داده های آزمایشی را تجزیه واریانس کنیم باید از مفروضات تجزیه واریانس مطلع بوده و صحت این مفروضات را بررسی کنیم، چرا که در تجزیه واریانس فرض شده است که این مفروضات برقرار میباشند.
فرضهای اساسی که در استفاده از تجزیه واریانس باید مدنظر قرار داد عبارتند از:
۱- جمعیتهای فرضی دارای توزیع نرمال باشند؛ البته اگر چنین نبود میتوان این دادهها را به طریقی تبدیل داده نمود تا تبدیل به دادههایی با توزیع نرمال شوند. بدین منظور میتوان از روشهای زیر استفاده کرد:
- استفاده از روشهای دیگری مثل آزمون کروسکال-والیس که در حقیقت آزمون نا پارامتری جانشین آنالیز واریانس است و مستلزم توزیعهای نرمال نیست (۱).
- تبدیل دادهها به طریقی که حالت توزیع نرمال پیدا کند (۲).
۲- خطاهای آزمایش مستقل از میانگینها باشد؛ منظور این است که با افزایش میانگین نمونهها واریانس درون نمونهها افزایش یا کاهش معنی داری پیدا نکند. قبلاً اشاره شد که واریانس درون گروهی ناشی از عوامل کنترل ناشدنی است که به آن خطای آزمایش گویند. بنابراین قرار نیست که بینها، میزان عوامل کنترل ناشدنی و میانگین گروهها رابطه ای برقرار باشد. اگر در یک نمودار میانگینها را روی محور x و واریانس درون گروهی را به صورت متناظر با آن نمونه روی محور y قرار دهیم نبایستی رابطهٔ خطی معنی داری بین میانگین و واریانس درون نمونهای وجود داشته باشد.
۳- نمونهگیری به صورت تصادفی باشد؛ به این مفهوم که نمونه گرفته شده بایستی مبین و نماینده جمعیتی باشد که آن نمونه از آن گرفته شده است. یعنی اولاً پژوهشگر نقشی در انتخاب آن نداشته باشد، ثانیاً شانس انتخاب هر یک از اعضا در هر انتخاب با هم برابر باشد.
۴- واریانس جمعیتها با هم برابر باشد؛ چون مجموع واریانس درون گروهها تبدیل به واریانس خطا (MSe) میشود و بعداً مبنای مقایسه بین واریانسها و مقایسه بین میانگینها میشود بنابراین نباید واریانس بین گروهها تفاوت معنی داری داشته باشد.
دلیل دیگر مفروض بودن تساوی واریانسها این است که هر توزیع نرمال دارای دو مشخصه است:الف. امید ریاضی (μ): تغییر در آن صرفاً باعث حرکت توزیع روی محور X میشود.ب. واریانس (δ2) : با تغییر در واریانس شکل توزیع تغییر پیدا میکند (جلیلی خشنود، آمار، احتمال و استنباط آماری).
نکته : نرم افزار MSTAT-C میتواند یکنواختی واریانس درون تیماری را بین تیمارهای طرح مورد بررسی توسط آزمون بار تلت انجام دهد. (۳).
۵- مشاهدات مستقل از هم باشند (۴)؛ مستقل بودن مشاهدات با پخش تصادفی نمونهها در واحد آزمایشی مصداق پیدا میکند. یعنی پخش تصادفی تیمارها باعث استقلال نمونهها از هم میشود. زمانی مشاهدات مستقل میشوند که ما تیمارها را به صورت تصادفی در درون واحدهای آزمایشی توزیع نماییم.
۶- اثر تیمارها و محیط به صورت جمع پذیر (additive) باشد (۵)؛ عدم جمع پذیری در دادهها منجر به ناهمگنی اشتباهات میشود. مؤلفههای اشتباه واریانس که مشاهدات متفاوت در آن سهیم هستند برآوردی از واریانس مشترک به دست نمیدهند. واریانس اشتباه کل (MSe) حاصله برای تعیین حدود اطمینان برآورد اثرات تیمار کارایی لازم را ندارد و ممکن است سطوح معنی داری غلطی را برای بعضی از مقایسات میانگین تیمارها به دست دهد. در عین حال ممکن است بر سطح معنی داری آزمون F اثر ناچیزی داشته باشد (۶).