Indholdsfortegnelse:

Hvordan håndterer du NA-værdier i R?
Hvordan håndterer du NA-værdier i R?

Video: Hvordan håndterer du NA-værdier i R?

Video: Hvordan håndterer du NA-værdier i R?
Video: 12v 90 ampere bilgenerator til selvopstemt generator ved hjælp af DIODE 2024, November
Anonim

Når du importerer datasæt fra andre statistiske applikationer manglende værdier kan være kodet med et tal, for eksempel 99. For at lade R ved det er en manglende værdi du skal omkode den. En anden nyttig funktion i R til håndtere manglende værdier er na . udelad() som sletter ufuldstændige observationer.

Bare så, hvordan håndterer du NA i R?

NA-muligheder i R

  1. udelad og na. exclude: returnerer objektet med observationer fjernet, hvis de indeholder manglende værdier; forskelle mellem at udelade og udelukke NA'er kan ses i nogle forudsigelses- og restfunktioner.
  2. pass: returnerer objektet uændret.
  3. fail: returnerer kun objektet, hvis det ikke indeholder nogen manglende værdier.

Ligeledes, hvordan håndterer du manglende kategoriske data i R? Der er forskellige måder at håndtere manglende værdier på kategoriske måder.

  1. Ignorer observationer af manglende værdier, hvis vi har at gøre med store datasæt og mindre antal poster har manglende værdier.
  2. Ignorer variabel, hvis den ikke er signifikant.
  3. Udvikle model til at forudsige manglende værdier.
  4. Behandl manglende data som blot en anden kategori.

På samme måde kan man spørge, hvordan indstiller man manglende værdier i R?

I R , manglende værdier er repræsenteret ved symbolet NA (ikke tilgængelig). Umulig værdier (f.eks. dividere med nul) repræsenteres af symbolet NaN (ikke et tal). I modsætning til SAS, R bruger det samme symbol for tegn og numerisk data . For mere øvelse i at arbejde med manglende data , prøv dette kursus om rengøring data i R.

Hvad betyder Na Rm i R?

Når du bruger en datarammefunktion na . rm i r henviser til den logiske parameter, der fortæller funktionen, om den skal fjernes eller ej NA værdier fra beregningen. Det bogstaveligt talt betyder NA fjerne. Det er hverken en funktion eller en operation. Det er simpelthen en parameter, der bruges af flere datarammefunktioner.

Anbefalede: