Coeficient de determinació (definició, exemple) | Interpretació

Quin és el coeficient de determinació?

El coeficient de determinació, també conegut com a R quadrat, determina l’abast de la variància de la variable dependent que es pot explicar per la variable independent. Observant el valor de R ^ 2 es pot jutjar si l'equació de regressió és prou bona per ser utilitzada. Com més gran sigui el coeficient, millor serà l'equació de regressió, ja que implica que la variable independent escollida per determinar la variable dependent s'escull correctament.

Explicació detallada

On

  • R = Correlació
  • R ^ 2 = Coeficient de determinació de l'equació de regressió
  • N = Nombre d'observacions a l'equació de regressió
  • Xi = Variable independent de l'equació de regressió
  • X = Mitjana de la variable independent de l'equació de regressió
  • Yi = Variable dependent de l'equació de regressió
  • Y = Mitjana de la variable dependent de l'equació de regressió
  • σx = Desviació estàndard de la variable independent
  • σy = Desviació estàndard de la variable dependent

El valor del coeficient oscil·la entre 0 i 1, on un valor de 0 indica que la variable independent no explica la variació de la variable dependent i un valor de 1 indica que la variable independent explica perfectament la variació de la variable dependent.

Exemples

Podeu descarregar aquesta plantilla de fórmula Excel de coeficient de determinació aquí: plantilla de fórmula Excel de coeficient de determinació

Exemple 1

Intentem comprendre la fórmula del coeficient de determinació amb l'ajut d'un exemple. Intentem esbrinar quina relació hi ha entre la distància que recorre el conductor del camió i l'edat del conductor del camió. Algú realment fa una equació de regressió per validar si allò que pensa sobre la relació entre dues variables també el valida l’equació de regressió. En aquest exemple concret, veurem quina variable és la variable dependent i quina variable és la variable independent.

La variable dependent d'aquesta equació de regressió és la distància que recorre el conductor del camió i la variable independent és l'edat del conductor del camió. Podem trobar la correlació amb l’ajut de la fórmula i el quadrat que per obtenir el coeficient de l’equació de regressió. El conjunt de dades i les variables es presenten al full Excel adjunt.

Solució:

A continuació es proporcionen dades per al càlcul del coeficient de determinació.

Per tant, el càlcul del coeficient de determinació és el següent,

R = -424520 / √ (683696 * 81071100)

R serà -

R = -0,057020839

R ^ 2 serà -

R ^ 2 = 0,325%

Exemple 2

Intentem comprendre el concepte de coeficient de determinació amb l'ajut d'un altre exemple. Intentem esbrinar quina relació hi ha entre l'alçada dels estudiants d'una classe i la qualificació GPA d'aquests estudiants. En aquest exemple concret, veurem quina variable és la variable dependent i quina variable és la variable independent.

La variable dependent d’aquesta equació de regressió és el GPA dels estudiants i la variable independent és l’alçada dels estudiants. Podem trobar la correlació amb l’ajut de la fórmula i el quadrat que per obtenir l’R ^ 2 de l’equació de regressió. El conjunt de dades i les variables es presenten al full Excel adjunt.

Solució:

A continuació es proporcionen dades per al càlcul del coeficient de determinació.

Per tant, el càlcul és el següent,

R = 34,62 / √ (169204 * 3245)

R = 0,000467045

R ^ 2 = 0,000000218

Interpretació

El coeficient de determinació és un resultat molt important per esbrinar si el conjunt de dades és adequat o no. Algú realment fa una anàlisi de regressió per validar si el que pensa sobre la relació entre dues variables també es valida mitjançant l’equació de regressió. Com més gran sigui el coeficient, millor serà l'equació de regressió, ja que implica que la variable independent triada per determinar la variable dependent s'escull correctament. Idealment, un investigador buscarà el coeficient de determinació més proper al 100%.