Regressió vs ANOVA | 7 diferències principals (amb infografies)
Diferència entre regressió i ANOVA
Tant la regressió com l’ANOVA són els models estadístics que s’utilitzen per predir el resultat continu, però en el cas de la regressió, es prediu el resultat continu basant-se en una o més d’una variable predictora contínua, mentre que en el cas del resultat continu ANOVA és predits sobre la base d'una o diverses variables predictores categòriques.
La regressió és un mètode estadístic per establir la relació entre conjunts de variables per tal de fer prediccions de la variable dependent amb l'ajut de variables independents, ANOVA, en canvi, és una eina estadística aplicada a grups no relacionats per esbrinar si tenen una mitjana comuna.
Què és la regressió?
La regressió és un mètode estadístic molt eficaç per establir la relació entre conjunts de variables. Les variables per a les quals es fa l'anàlisi de regressió són la variable dependent i una o més variables independents. És un mètode per entendre l’efecte sobre una variable dependent d’una o més d’una variable independent.
- Suposem, per exemple, que una empresa de pintura utilitza un dels derivats de dissolvents bruts i monòmers com a matèria primera, podem fer una anàlisi de regressió entre el preu d’aquesta matèria primera i el preu del cru Brent.
- En aquest exemple, el preu de la matèria primera és la variable dependent i el preu dels preus de Brent és la variable independent.
- A mesura que el preu dels dissolvents i dels monòmers augmenta i disminueix amb l’augment i la baixada dels preus de Brent, el preu de la matèria primera és la variable dependent.
- De la mateixa manera, per a qualsevol decisió empresarial amb l'objectiu de validar una hipòtesi que una acció determinada conduirà a l'augment de la rendibilitat d'una divisió es pot validar en funció del resultat de la regressió entre les variables dependents i independents.
Què és Anova?
ANOVA és la forma breu d’anàlisi de la variància. ANOVA és una eina estadística que s'utilitza generalment en variables aleatòries. Implica un grup que no està directament relacionat entre si per esbrinar si existeixen mitjans comuns.
- Un exemple senzill per entendre aquest punt és dirigir ANOVA per a la sèrie de notes d’alumnes de diferents col·legis per intentar esbrinar si un alumne d’una escola és millor que l’altre.
- Un altre exemple pot ser si dos equips d'investigació independents estan investigant productes diferents que no estan relacionats entre si. ANOVA ajudarà a trobar quin proporciona millors resultats. Les tres tècniques populars de ANOVA són un efecte aleatori, un efecte fix i un efecte mixt.
Regressió vs ANOVA Infografia
Diferències clau entre la regressió i ANOVA
- La regressió s’aplica a variables que són majoritàriament de naturalesa fixa o independent i ANOVA s’aplica a variables aleatòries.
- La regressió s’utilitza principalment en dues formes: són regressió lineal i regressió múltiple; altres formes de regressió difícils també estan presents en teoria; aquests tipus s’utilitzen més àmpliament a la pràctica; d’altra banda, hi ha tres tipus populars d’ANOVA. efecte, efecte fix i efecte mixt.
- La regressió s’utilitza principalment per fer estimacions o prediccions de la variable dependent amb l’ajut de variables independents individuals o múltiples i s’utilitza ANOVA per trobar una mitjana comuna entre variables de diferents grups.
- En el cas de regressió, el nombre del terme d'error és un, però en el cas d'ANOVA, el nombre del terme d'error és més d'un.
Taula comparativa
Bases | Regressió | ANOVA | ||
Definició | La regressió és un mètode estadístic molt eficaç per establir la relació entre conjunts de variables. | ANOVA és la forma breu d’anàlisi de la variància. S’aplica a grups no relacionats per esbrinar si tenen una mitjana comuna | ||
Naturalesa de la variable | La regressió s'aplica a variables independents o variables fixes. | ANOVA s'aplica a variables de naturalesa aleatòria | ||
Tipus | La regressió s'utilitza principalment en dues formes: són regressió lineal i regressió múltiple, la més tardana és quan el nombre de variables independents és més d'una. | Els tres tipus populars d’ANOVA són un efecte aleatori, un efecte fix i un efecte mixt. | ||
Exemples | Una empresa de pintura utilitza dissolvents i monòmers com a matèria primera que és un derivat del cru; podem fer una anàlisi de regressió entre el preu d’aquesta matèria primera i el preu del cru de Brent. | Si dos equips de recerca separats estan investigant productes diferents que no estan relacionats. ANOVA ajudarà a trobar quin proporciona millors resultats. | ||
Variables utilitzades | La regressió s'aplica a dos conjunts de variables, una d'elles és la variable dependent i l'altra és la variable independent. El nombre de variables independents en regressió pot ser d'una o més d'una. | ANOVA s'aplica a variables diferents que no necessàriament estan relacionades entre si. | ||
Ús de la prova | La regressió la fan servir principalment els professionals o experts de la indústria per fer estimacions o prediccions de la variable dependent. | ANOVA s’utilitza per trobar una mitjana comuna entre variables de diferents grups. | ||
Errors | Les prediccions fetes per l’anàlisi de regressió no sempre són desitjables, ja que a causa del terme d’error en una regressió, aquest terme d’error també es coneix com a residual. En el cas de regressió, el nombre del terme d'error és un. | El nombre d'errors en cas que ANOVA, a diferència de la regressió, sigui més d'un. |
Conclusió
Tant les regressions com ANOVA són potents eines estadístiques que s’apliquen a múltiples variables. La regressió s’utilitza per fer prediccions de la variable dependent amb l’ajut de variables independents que tenen algunes relacions. És útil validar una hipòtesi de si la hipòtesi feta és correcta o no.
La regressió s’utilitza en variables de naturalesa fixa o independent i que es poden fer amb l’ús d’una única variable independent o de diverses variables independents. ANOVA s’utilitza per trobar un punt comú entre variables de diferents grups que no estan relacionades entre si. No s’utilitza per fer una predicció o estimació, sinó per comprendre les relacions entre el conjunt de variables.