آنالیز واریانس یا ANOVA یک ابزار تحلیلی در علم آمار است که هدف اصلی در استفاده از آن، یافتن تغییرات و یا اختلافهای قابلتوجه در مجموعهای از دادهها است. مهمترین محصول این تحلیل، تقسیم دادههای اولیه به دو مجموعه تحت عنوان عوامل سیستماتیک و عوامل تصادفی است.
عوامل سیستماتیک در واقع ساختار اصلی و چهارچوب ریشهای فرایندی که دادهها از آن استخراج شدهاند را تشکیل میدهند. عوامل تصادفی، که معمولا ریشه مشخصی هم ندارند، روند و چهارچوبی مشخص را ترسیم نمیکنند و بهویژه، در مدل آماری جایگاه ویژهای ندارند.
آنالیز واریانس در اوایل قرن بیستم توسط فیشر پایهریزی شد؛ به همین دلیل، آن را آنالیز فیشر نیز میخوانند. تحلیلهای فیشر توسیعی از آزمونهای t و z در آمار کلاسیک بودند.
فرمول ANOVA، آنالیز واریانس
انواع مخلتف و تعمیمیافتهای از آنالیز واریانس و فرمول متناظر با آن وجود دارند. اصلیترین و به نحوی پرکاربردترین فرمول همان فرمول اولیهای است که توسط فیشر استفاده میشده است. این فرمول، نسبت دو مجموع از مربعات است
F=MSB/SSb
در این فرمول MSB=SSB/k-1 میانگین مربعات بین گروهها است و MSE=SSE/N-k میانگین مربعات خطاهاست. N تعداد مشاهدات و k تعداد گروههای مختلفاند. همچنین N-1 مجموع درجههای آزادی، k-1 درجه آزادی بین گروهها و N-k درجههای آزادی خطاها هستند.
این فرول چه چیزی را مشخص میکند؟
پس از تحلیل آنالیز واریانس بر مجموعهای از دادهها، تحلیلی از فاکتورهای اولیه به دست میآید که بر تولید دادهها تأثیرگذار بودهاند. پس از محاسبه فرمول ضریب ANOVA، تحلیلگر امکان انجام سایر تحلیلها، اندازهگیریها و تعمیمها را مییابد. برای مثال، وقتی F محاسبه شد، از آن برای استفاده در آزمون f (متفاوت از فرمول بالا و ضریب F) و تولید دادههای بیشتری با رفتاری کموبیش مشابه، به کار گفته میشود.
با استفاده از تحلیل آنالیز شما میتوانید چندین گروه را همزمان بررسی کنید و وجود اختلاف بین آنها را تعیین کنید. برای مقادیری از F که نزدیک به عدد ۱ هستند، میتوان نتیجه گرفت که اختلاف چندانی بین گروههای مختلف از داده تحتبررسی وجود ندارد. نکته مهم اینکه، تابع توزیعی که آماره F از آن تبعیت میکند از نوع توزیع F است.
کاربردهای آنالیز واریانس
فرض کنید شما یک شرکت بسیار بزرگ دارید که محصول خاصی را تولید میکند. حال میخواهید کارایی مجموعههای تولیدی مختلف و زیرمجموعه این شرکت بزرگ را تحقیق کنید. آنالیز واریانس به شما این امکان را میدهد که دادههایی چون میزان تولید یا فروش را در این زیرمجموعهها باهم بسنجید و میزان اختلاف و شدت آن را تحقیق کنید.
علاوه بر این، شرکت میتواند از ANOVA برای بررسی عملکرد و میزان بهرهوری کارمندانش استفاده کند. برای مثال، دادههای متناظر با حقوق و میزان مهارت را میتوان متغیرهای مستقل پایه قرار داد و میزان کارایی را متناظر با آنها محاسبه کرد.
نرمافزارهای زیادی وجود دارند که با دریافت دادههای اولیه و تعریف متغیرهای پایه، محاسبه ANOVA را برای شما انجام میدهند. تمام آنچه شما نیاز دارید یادگیری نحوه استفاده از این نرمافزارها و تحلیل نتایج آنهاست.
درنهایت، ANOVA تنها یک ابزار تحلیل آماری است که تحت تأثیر دادههایی که شما به آن میدهید، نتیجهای را تولید میکند؛ استنباط این نتایج و بررسی درستی آنها به تجربه شما در آن بازار و ابزار مالی خاص نیاز دارد.