Indholdsfortegnelse:

Hvad er outliers i dataanalyse?
Hvad er outliers i dataanalyse?

Video: Hvad er outliers i dataanalyse?

Video: Hvad er outliers i dataanalyse?
Video: Ugrupperede observationer: Boksplot 2024, Kan
Anonim

I statistik, en afvigende er en data punkt, der adskiller sig væsentligt fra andre observationer. An afvigende kan skyldes variabilitet i målingen, eller det kan indikere eksperimentel fejl; sidstnævnte er nogle gange udelukket fra data sæt. An afvigende kan give alvorlige problemer i statistiske analyser.

I betragtning af dette, hvordan finder du outliers i data?

Et punkt, der falder uden for data sættets inderfences er klassificeret som en mindreårig afvigende , mens en, der falder uden for de ydre hegn, er klassificeret som en større afvigende . For at finde de indvendige hegn til din data sæt først, gang interkvartilområdet med 1,5. Tilføj derefter resultatet til Q3 og træk det fra Q1.

Udover ovenstående, skal jeg fjerne afvigere fra mine data? Til det det meste, hvis dine data er berørt af disse ekstreme tilfælde, du kan bundet det input til en historisk repræsentant for dine data der udelukker afvigere . Bestem fra sag til sag hvad det effekten af outlierne var. Og derfra beslutter, om du vil fjerne , ændre eller beholde den afvigende værdier.

I forhold til dette, hvordan håndterer dataanalyse outliers?

Her er fire tilgange:

  1. Drop de ekstreme poster. I tilfælde af Bill Gates, eller en anden sand afviger, er det nogle gange bedst at fjerne denne registrering fuldstændigt fra dit datasæt for at forhindre den person eller begivenhed i at skævvride din analyse.
  2. Begræns dine outliers-data.
  3. Tildel en ny værdi.
  4. Prøv en transformation.

Hvad er et eksempel på en outlier?

Outlier . mere En værdi, der "ligger udenfor" (som er meget mindre eller større end) de fleste af de andre værdier i et datasæt. Til eksempel i scoringerne 25, 29, 3, 32, 85, 33, 27, 28 er både 3 og 85 " afvigere ".

Anbefalede: