Regressió de mínims quadrats: com es crea una línia de millor ajust?

Definició del mètode de regressió dels mínims quadrats

Un mètode de regressió dels mínims quadrats és una forma d’anàlisi de regressió que estableix la relació entre la variable dependent i independent juntament amb una línia lineal. Aquesta línia es coneix com la "línia de millor ajust".

L’anàlisi de regressió és un mètode estadístic amb l’ajut del qual es pot estimar o predir els valors desconeguts d’una variable a partir dels valors coneguts d’una altra variable. La variable que s’utilitza per predir l’interès variable s’anomena variable explicativa o independent i la variable que es prediu es diu variable dependent o explicada.

Considerem dues variables xy. Aquests es representen en un gràfic amb valors de x en els valors de l'eix x de y en l'eix y. Aquests valors es representen amb els punts del gràfic següent. Es traça una línia recta a través dels punts, coneguda com la línia de millor ajust.

L'objectiu de la regressió dels mínims quadrats és assegurar que la línia traçada a través del conjunt de valors proporcionats estableixi la relació més estreta entre els valors.

Fórmula de regressió dels mínims quadrats

La línia de regressió segons el mètode dels mínims quadrats es calcula mitjançant la fórmula següent:

ŷ = a + bx

On,

  • ŷ = variable dependent
  • x = variable independent
  • a = intercepció en y
  • b = pendent de la línia

El pendent de la línia b es calcula mitjançant la següent fórmula:

O bé

Intercepció en Y, "a" es calcula mitjançant la fórmula següent:

Línia de millor ajustament en la regressió mínima quadrada

La línia d’ajust millor és una línia recta dibuixada a través d’una dispersió de punts de dades que representa millor la relació entre ells.

Considerem el següent gràfic en què es representa un conjunt de dades al llarg dels eixos x i y. Aquests punts de dades es representen mitjançant els punts blaus. Es dibuixen tres línies a través d’aquests punts: una línia verda, una vermella i una blava. La línia verda passa per un sol punt i la línia vermella passa per tres punts de dades. No obstant això, la línia blava passa per quatre punts de dades i la distància entre els punts residuals a la línia blava és mínima en comparació amb les altres dues línies.

Al gràfic anterior, la línia blava representa la línia de millor ajustament ja que es troba més a prop de tots els valors i la distància entre els punts fora de la línia a la línia és mínima (és a dir, la distància entre els residus a la línia de millor ajustament - també es coneix com les sumes de quadrats de residus). A les altres dues línies, la taronja i la verda, la distància entre els residus a les línies és major en comparació amb la línia blava.

El mètode dels mínims quadrats proporciona la relació més estreta entre les variables dependents i independents, minimitzant la distància entre els residus i la línia de millor ajust, és a dir, la suma de quadrats de residus és mínima en aquest enfocament. D’aquí el terme “mínims quadrats”.

Exemples de línia de regressió de mínims quadrats

Apliquem aquestes fórmules a la següent pregunta:

Podeu descarregar aquesta plantilla Excel de regressió de mínims quadrats aquí: plantilla Excel de regressió de mínims quadrats

Exemple 1

Els detalls relatius a l’experiència dels tècnics d’una empresa (en diversos anys) i la seva qualificació de rendiment es proporcionen a la taula següent. Utilitzant aquests valors, estimeu la qualificació de rendiment d’un tècnic amb 20 anys d’experiència.

Solució -

Per calcular primer els mínims quadrats calcularem la intersecció Y (a) i el pendent d’una recta (b) de la manera següent:

El pendent de la línia (b)

  • b = 6727 - [(80 * 648) / 8] / 1018 - [(80) 2/8]
  • = 247/218
  • = 1.13

Intercepció en Y (a)

  • a = 648 - (1,13) (80) / 8
  • = 69.7

La línia de regressió es calcula de la manera següent:

Substituint 20 pel valor de x a la fórmula,

  • ŷ = a + bx
  • ŷ = 69,7 + (1,13) (20)
  • ŷ = 92,3

Es calcula que el rendiment d’un tècnic amb 20 anys d’experiència és de 92,3.

Exemple 2

Equació de regressió de mínims quadrats mitjançant Excel

L'equació de regressió dels mínims quadrats es pot calcular mitjançant Excel mitjançant els passos següents:

  • Inseriu una taula de dades a Excel.

  • Inseriu un gràfic de dispersió mitjançant els punts de dades.

  • Inseriu una línia de tendència dins del gràfic de dispersió.

  • A les opcions de línia de tendència: seleccioneu la línia de tendència lineal i seleccioneu l'equació de visualització al gràfic.

  • L'equació de regressió dels mínims quadrats per al conjunt de dades excel es mostra al gràfic.

Així, es calcula l’equació de regressió dels mínims quadrats per al conjunt de dades excel. Mitjançant l’equació es poden fer prediccions i anàlisis de tendències. Les eines d'Excel també proporcionen càlculs de regressió detallats.

Avantatges

  • El mètode dels mínims quadrats d’anàlisi de regressió és el més adequat per a models de predicció i anàlisi de tendències. S’utilitza millor en els camps de l’economia, les finances i els mercats de valors en què es prediu el valor de qualsevol variable futura amb l’ajut de variables existents i la relació entre aquestes.
  • El mètode dels mínims quadrats proporciona la relació més estreta entre les variables. La diferència entre les sumes de quadrats de residus i la línia de millor ajust és mínima en aquest mètode.
  • El mecanisme de càlcul és senzill i fàcil d’aplicar.

Desavantatges

  • El mètode dels mínims quadrats es basa en establir la relació més estreta entre un conjunt determinat de variables. El mecanisme de càlcul és sensible a les dades i, en cas que apareguin valors atípics (dades excepcionals), els resultats poden afectar majoritàriament.
  • Aquest tipus de càlcul és el més adequat per a models lineals. Per a equacions no lineals, s’apliquen mecanismes de càlcul més exhaustius.

Conclusió

El mètode dels mínims quadrats és un dels mètodes més utilitzats popularment per a models de predicció i anàlisi de tendències. Quan es calcula adequadament, proporciona els millors resultats.