Tartalomjegyzék:

Hogyan kezeli az NA értékeket R-ben?
Hogyan kezeli az NA értékeket R-ben?

Videó: Hogyan kezeli az NA értékeket R-ben?

Videó: Hogyan kezeli az NA értékeket R-ben?
Videó: 🟠 HOTWAV NOTE 12 - ДЕТАЛЬНЫЙ ОБЗОР и ТЕСТЫ 2024, November
Anonim

Amikor más statisztikai alkalmazásokból importál adatkészletet, a hiányzó értékek számmal lehet kódolni, például 99. Annak érdekében, hogy engedjük R tudja, hogy ez a hiányzó érték újra kell kódolnia. Egy másik hasznos funkció R nak nek foglalkozni a hiányzó értékekkel van na . az omt() függvény, amely törli a hiányos megfigyeléseket.

Csak hát, hogyan kezeled az NA-t R-ben?

NA opciók R-ben

  1. kihagyni és na. kizár: visszaadja az objektumot eltávolított megfigyelésekkel, ha hiányzó értékeket tartalmaznak; az NA-k kihagyása és kizárása közötti különbségek láthatók egyes predikciós és maradékfüggvényekben.
  2. pass: az objektumot változatlanul adja vissza.
  3. fail: csak akkor adja vissza az objektumot, ha nincs hiányzó érték.

Hasonlóképpen, hogyan kezeli a hiányzó kategorikus adatokat az R-ben? A kategorikus módok hiányzó értékeinek kezelésére többféle mód van.

  1. Ha nagy adathalmazokkal van dolgunk, és kevesebb rekordból hiányoznak értékek, figyelmen kívül hagyja a hiányzó értékek megfigyelését.
  2. A változó figyelmen kívül hagyása, ha nem szignifikáns.
  3. Készítsen modellt a hiányzó értékek előrejelzésére.
  4. A hiányzó adatokat csak egy kategóriaként kezelje.

Hasonlóképpen feltehetjük a kérdést, hogyan lehet beállítani a hiányzó értékeket R-ben?

Ban ben R , hiányzó értékek szimbólummal ábrázolják NA (nem elérhető). Lehetetlen értékeket (pl. nullával osztva) a NaN szimbólummal (nem számmal) jelöljük. A SAS-szal ellentétben R ugyanazt a szimbólumot használja a karakterekhez és a számokhoz adat . További gyakorlatok a munkavégzéshez hiányzó adatok , próbálja ki ezt a takarítási tanfolyamot adatok az R-ben.

Mit jelent a Na Rm R nyelven?

Dataframe függvény használatakor na . rm ban ben r arra a logikai paraméterre utal, amely megmondja a függvénynek, hogy el kell-e távolítani NA értékek a számításból. Szó szerint jelentése NA távolítsa el. Ez sem nem funkció, sem nem művelet. Ez egyszerűen egy paraméter, amelyet számos adatkeret-függvény használ.

Ajánlott: