Tartalomjegyzék:

Mik azok a kiugró értékek az adatelemzésben?
Mik azok a kiugró értékek az adatelemzésben?

Videó: Mik azok a kiugró értékek az adatelemzésben?

Videó: Mik azok a kiugró értékek az adatelemzésben?
Videó: David Hand: Ai, Dark Data, LLMs, Peer Review 2024, November
Anonim

A statisztikákban egy kiugró egy adat pont, amely jelentősen eltér a többi megfigyeléstől. An kiugró oka lehet a mérés ingadozása, vagy kísérleti hibára utalhat; az utóbbiak néha ki vannak zárva a adat készlet. An kiugró komoly problémákat okozhat statisztikai elemzések.

Ezt figyelembe véve hogyan találja meg a kiugró értékeket az adatokban?

Egy pont, amely kívül esik a adat készlet belső kerítései kiskorúnak minősülnek kiugró , míg a külső kerítésen kívül eső nagy kategóriába tartozik kiugró . Hogy megtalálja a belső kerítéseket adat állítsa be, először szorozza meg az interkvartilis tartományt 1,5-tel. Ezután adja hozzá az eredményt a Q3-hoz, és vonja ki a Q1-ből.

A fentieken kívül el kell távolítanom a kiugró értékeket az adataimból? Mert az nagyrészt, ha az Ön adatait Önt érintik ezek a szélsőséges esetek tud összekötött az bemenet történelmi képviselőjének az Ön adatait ez kizárja kiugró értékek . Határozza meg eseti alapon, hogy mit az hatása a kiugró értékek volt. És innentől kezdve döntse el, hogy akarja-e távolítsa el , változtasd meg vagy tartsd meg a kiugró értékeket.

Ennek kapcsán hogyan kezeli az adatelemzés a kiugró értékeket?

Íme négy megközelítés:

  1. Dobja el a kiugró rekordokat. Bill Gates vagy más valódi kiugró eset esetében néha jobb, ha teljesen eltávolítja ezt a rekordot az adatkészletből, hogy az adott személy vagy esemény ne torzítsa el az elemzést.
  2. Korlátozza a kiugró adatokat.
  3. Új érték hozzárendelése.
  4. Próbálja ki az átalakítást.

Mi a példa a kiugró értékre?

Outlier . more Olyan érték, amely az adathalmaz legtöbb egyéb értékén kívül esik (valamivel kisebb vagy nagyobb, mint). Mert példa a 25, 29, 3, 32, 85, 33, 27, 28 pontokban a 3 és a 85 egyaránt " kiugró értékek ".

Ajánlott: