Hogyan távolíthatom el a hiányzó értékeket az R-ből?
Hogyan távolíthatom el a hiányzó értékeket az R-ből?

Videó: Hogyan távolíthatom el a hiányzó értékeket az R-ből?

Videó: Hogyan távolíthatom el a hiányzó értékeket az R-ből?
Videó: How To... Remove Records with Missing Data in R #74 2024, November
Anonim

Először is, ha ki akarjuk zárni hiányzó értékek matematikai műveletekből használja a na . rm = IGAZ argumentum. Ha ezeket nem zárja ki értékeket a legtöbb függvény visszaadja an NA . Azt is szeretnénk, hogy a saját adat hogy teljes megfigyeléseket kapjunk, azokat a megfigyeléseket (sorokat) a mi adat amelyek nem tartalmaznak hiányzó adatok.

Egyszerűen így, hogyan kezeli R a hiányzó értékeket?

Ban ben R az hiányzó értékek szimbólummal vannak kódolva NA . Az adatkészletben lévő hiányosságok azonosítására a következő funkciót használjuk: na (). Amikor más statisztikai alkalmazásokból importál adatkészletet, a hiányzó értékek számmal lehet kódolni, például 99. Annak érdekében, hogy engedjük R tudja, hogy ez a hiányzó érték újra kell kódolnia.

Továbbá, hogyan számítja ki a hiányzó értékeket R-ben? A hiányzó adatok kezelése az R használatával

  1. colsum(is.na(adatkeret))
  2. sum(is.na(adatkeret$oszlop neve)
  3. A hiányzó értékek a következő módszerekkel kezelhetők:
  4. Átlag/Mód/Medián Imputáció: Az imputáció egy módszer a hiányzó értékek becsült értékekkel való kitöltésére.
  5. Előrejelzési modell: Az előrejelzési modell az egyik kifinomult módszer a hiányzó adatok kezelésére.

Ezt követően az is felmerülhet, hogy hogyan távolíthatom el az NA értékeket tartalmazó sorokat R-ben?

Az omit() függvény egy listát ad vissza sorokat hogy na értékeket tartalmaznak . Az adatkeret átadása a na . Az omit() függvény egy egyszerű módszer a hiányos rekordok törlésére az elemzésből. Ez egy hatékony na értékek eltávolításának módja az r-ben.

Hogyan távolíthatom el a kiugró értékeket egy R-beli adatkészletből?

Nincsenek konkrét R funkciókat távolítsa el a kiugró értékeket . Először meg kell találnia, hogy mik a megfigyelések kiugró értékek és akkor távolítsa el , azaz az első és harmadik kvartilis (a csuklópántok) és az interkvartilis tartomány megkeresése a belső kerítések számszerű meghatározásához.

Ajánlott: