Fórmula Outlier | Càlcul pas a pas de valors atípics (amb exemple)

La fórmula Outlier proporciona una eina gràfica per calcular les dades que es troben fora del conjunt de distribució donat, que pot ser lateral interior o exterior, depenent de les variables.

Què és la fórmula Outlier?

Un valor atípic és el punt de dades de la mostra o observació donada o en una distribució que quedarà fora del patró general. Una regla d’ús habitual que diu que un punt de dades es considerarà un valor atípic si té més d’1,5 IQR per sota del primer quartil o per sobre del tercer quartil.

Dit d’una altra manera, els valors atípics baixos estaran per sota de Q1-1,5 IQR i els valors atípics baixos seran Q3 + 1,5IQR

Cal calcular la mediana, quartils inclosos IQR, Q1 i Q3.

La fórmula atípica es representa de la següent manera,

La fórmula de Q1 = ¼ (n + 1) th termeLa fórmula de Q3 = ¾ (n + 1) tercer termeLa fórmula de Q2 = Q3 - Q1

Càlcul pas a pas de valors atípics

A continuació, cal seguir els passos per calcular el valor atípic.

  • Pas 1: Primer calculeu els quartils, és a dir, Q1, Q2 i interquartil
  • Pas 2: Ara calcula el valor Q2 * 1,5
  • Pas 3: Ara resteu el valor Q1 del valor calculat al pas 2
  • Pas 4: Aquí afegiu Q3 amb el valor calculat al pas 2
  • Pas 5: Creeu l'interval dels valors calculats als passos 3 i 4
  • Pas 6: Organitzeu les dades en ordre ascendent
  • Pas 7: Comproveu si hi ha valors inferiors o superiors a l'interval creat al pas 5

Exemple

Penseu en un conjunt de dades dels números següents: 10, 2, 4, 7, 8, 5, 11, 3, 12. Heu de calcular tots els valors atípics.

Solució:

Primer, hem d’organitzar les dades en ordre ascendent per trobar la mediana que serà la Q2 per a nosaltres.

2, 3, 4, 5, 7, 8, 10, 11, 12

Ara, donat que el nombre d'observacions és senar, que és 9, la mediana es situaria en una cinquena posició, que és 7 i serà la mateixa Q2 per a aquest exemple.

Per tant, el càlcul de Q1 és el següent:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 serà -

Q1 = 2,5 terme

Això significa que Q1 és la mitjana de la 2a i 3a posició de les observacions, que és 3 i 4 aquí i una mitjana de la mateixa és (3 + 4) / 2 = 3,5

Per tant, el càlcul de Q3 és el següent:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 serà -

Q3 = 7,5 terme

Això significa que Q3 és la mitjana de la 7a i 8a posició de les observacions, que és 10 i 11 aquí i una mitjana de la mateixa és (10 + 11) / 2 = 10,5

Ara, els valors atípics baixos estaran per sota de Q1-1.5IQR i els valors atípics baixos seran Q3 + 1.5IQR

Per tant, els valors són 3,5 - (1,5 * 7) = -7 i l’interval superior és de 10,5 + (1,5 * 7) = 110,25.

Com que no hi ha observacions superiors o inferiors a 110,25 i -7, no tenim cap valor atípic en aquesta mostra.

Exemple de fórmula Outlier a Excel (amb plantilla Excel)

Podeu descarregar aquesta plantilla Outlier Formula Excel aquí - Plantilla Outlier Formula Excel

Les classes de coaching creatiu consideren la possibilitat de recompensar els estudiants que es troben entre el 25% superior, tot i que volen evitar valors atípics. Les dades són dels 25 estudiants. Utilitzeu l’equació Outlier per determinar si hi ha un outlier?

Solució:

A continuació es proporcionen dades per calcular valors atípics

El nombre d'observacions aquí és de 25 i el nostre primer pas seria convertir la informació superior a les dades brutes en ordre ascendent.

La mitjana serà -

El valor mitjà = ½ (n + 1)

= ½ = ½ (26)

= 13è trimestre

La Q2 o mediana és de 68,00

Que és el 50% de la població.

Q1 serà -

Q1 = ¼ (n + 1) tercer terme

= ¼ (25+1)

= ¼ (26)

= 6,5è terme que equival al 7è terme

El primer trimestre és de 56,00, el 25% inferior

Q3 serà -

Finalment, Q3 = ¾ (n + 1) tercer terme

= ¾ (26)

= 19,50 termini

Aquí cal agafar la mitjana que és del 19è i 20è termes que són 77 i 77 i la mitjana de la mateixa és (77 + 77) / 2 = 77,00

 El Q3 és 77, que és el 25% superior

Abast baix

Ara, els valors atípics baixos estaran per sota de Q1-1.5IQR i els valors atípics baixos seran Q3 + 1.5IQR

Alt rang -

Per tant, els valors són 56 - (1,5 * 68) = -46 i l’interval superior és de 77 + (1,5 * 68) = 179.

No hi ha valors atípics.

Rellevància i usos

És molt important conèixer la fórmula de valors atípics, ja que podria haver-hi dades que es veurien esbiaixades per aquest valor. Agafeu un exemple d’observacions 2, 4, 6, 101 i ara si algú pren una mitjana d’aquests valors serà del 28,25, però el 75% de les observacions es troben per sota de 7 i, per tant, seria una decisió incorrecta sobre les observacions d’aquesta mostra.

Es pot observar aquí que 101 sembla clarament esbossar i, si s’elimina, la mitjana seria 4, la qual cosa diu sobre els valors o observacions que es troben dins del rang de 4. Per tant, és molt important fer aquest càlcul per evitar qualsevol mal ús que condueixi a la informació de les dades. Són àmpliament utilitzats per estadístics de tot el món sempre que realitzen investigacions.