Covariància vs correlació | 5 diferències principals (amb infografies)

Diferència entre covariància i correlació

Covariància i correlació són dos termes que són exactament oposats entre si, tots dos s’utilitzen en anàlisis estadístiques i de regressió, la covariància ens mostra com varien les dues variables entre si, mentre que la correlació ens mostra la relació entre les dues variables i com estan relacionades.

La correlació i la covariància són dos conceptes estadístics que s’utilitzen per determinar la relació entre dues variables aleatòries. La correlació defineix com un canvi d'una variable afectarà l'altra, mentre que la covariància defineix com varien dos elements junts. Confús? Aprofundim en la comprensió de la diferència entre aquests termes estretament relacionats.

Què és la covariància?

La covariància mesura com es mouen dues variables entre si i és una extensió del concepte de variància (que explica com varia una sola variable). Pot prendre qualsevol valor des de -∞ fins a + ∞.

  • Com més alt sigui aquest valor, més dependent és la relació. Un nombre positiu significa covariància positiva i indica que hi ha una relació directa. Efectivament, això significa que un augment d'una variable també conduiria a un augment corresponent en l'altra variable sempre que altres condicions es mantinguin constants.
  • D'altra banda, un nombre negatiu significa covariància negativa que denota una relació inversa entre les dues variables. Tot i que la covariància és perfecta per definir el tipus de relació, és dolenta per interpretar-ne la magnitud.

Què és la correlació?

La correlació és un pas per davant de la covariància ja que quantifica la relació entre dues variables aleatòries. En termes senzills, és una mesura unitària de com canvien aquestes variables respecte de les altres (valor de covariància normalitzat).

  • A diferència de la covariància, la correlació té un límit superior i inferior en un rang. Només pot prendre valors entre +1 i -1. Una correlació de +1 indica que les variables aleatòries tenen una relació directa i forta.
  • D'altra banda, la correlació de -1 indica que hi ha una forta relació inversa i un augment d'una variable conduirà a una disminució igual i oposada de l'altra variable. 0 indica que els dos números són independents.

Fórmula per a la covariància i la correlació

Expressem matemàticament aquests dos conceptes. Per a dues variables aleatòries A i B amb valors mitjans com Ua i Ub i desviació estàndard com Sa i Sb respectivament:

Efectivament, la relació entre els dos es pot definir com:

Tant les correlacions com la covariància troben aplicació en camps d’anàlisi estadística i financera. Com que la correlació estandarditza la relació, és útil en comparació de dues variables. Això ajuda l'analista a plantejar estratègies com el comerç de parells i la cobertura per obtenir no només rendiments eficients de la cartera, sinó també salvaguardar aquests rendiments en termes de moviments adversos al mercat de valors.

Infografia de correlació i covariància

Vegem la diferència principal entre la correlació i la covariància.

Diferències clau

  • La covariància és un indicador del grau en què canvien dues variables aleatòries entre si. La correlació, en canvi, mesura la força d’aquesta relació. El valor de la correlació està lligat a la part superior per +1 i a la part inferior per -1. Per tant, és un rang definit. Tanmateix, el rang de covariància és indefinit. Pot prendre qualsevol valor positiu o qualsevol valor negatiu (teòricament l’interval és de -∞ a + ∞). Podeu estar segurs que una correlació de .5 és superior a .3 i que el primer conjunt de nombres (amb correlació com a .5) depenen més l’un de l’altre que el segon conjunt (amb correlació com a .3). ser molt difícil a partir dels càlculs de covariància.
  • El canvi d’escala afecta la covariància. Per exemple, si el valor de dues variables es multiplica per constants similars o diferents, això afecta la covariança calculada d'aquests dos nombres. Tot i això, aplicant el mateix mecanisme de correlació, la multiplicació per constants no modifica el resultat anterior. Això es deu al fet que un canvi d’escala no afecta la correlació.
  • A diferència de la covariància, la correlació és una mesura lliure d’unitat de la interdependència de dues variables. Això facilita la comparació dels valors de correlació calculats entre dues variables, independentment de les seves unitats i dimensions.
  • La covariància només es pot calcular per a 2 variables. La correlació, en canvi, es pot calcular per a múltiples conjunts de nombres. Un altre factor que fa que la correlació sigui desitjable per als analistes en comparació amb la covariància.

Taula comparativa de covariància vs correlació

BasesCovariànciaCorrelació
SignificatLa covariància és un indicador de fins a quin punt dues variables aleatòries depenen entre si. Un nombre més elevat denota una dependència més alta.La correlació és un indicador de la fortalesa que tenen aquestes dues variables sempre que altres condicions siguin constants. El valor màxim és +1 que indica una relació dependent perfecta.
RelacióLa correlació es pot deduir a partir de la covariànciaLa correlació proporciona una mesura de la covariància en una escala estàndard. Es dedueix dividint la covariància calculada amb la desviació estàndard.
ValorsEl valor de la covariància es troba en el rang de -∞ i + ∞.La correlació es limita a valors entre l’interval -1 i +1.
EscalabilitatAfecta la covariànciaLa correlació no es veu afectada per un canvi en les escales ni per la multiplicació per una constant.
UnitatsLa covariància té una unitat definida, ja que es dedueix per la multiplicació de dos nombres i les seves unitats.La correlació és un nombre absolut sense unitats entre -1 i +1, inclosos els valors decimals.

Conclusió

La correlació i la covariància estan molt relacionades entre si i, tanmateix, difereixen molt. La covariància defineix el tipus d’interacció, però la correlació defineix no només el tipus, sinó també la força d’aquesta relació. Per aquest motiu, la correlació sovint es denomina cas particular de covariància. Tanmateix, si cal triar entre tots dos, la majoria dels analistes prefereixen la correlació, ja que no es veu afectada pels canvis de dimensions, ubicacions i escala. A més, atès que es limita a un interval de -1 a +1, és útil fer comparacions entre variables entre dominis. No obstant això, una limitació important és que tots dos conceptes mesuren l'única relació lineal.