Aula18

Author

ARLAM

##Transfomação de dados BOX in COX

Quando um atributo tem a aparência de uma curva normal mas está deslocado para a direita ou para a esquerda, nos referimos à esta característica como skew. Este deslocamento pode ser ajustado para que o atributo se pareça mais com uma distribuição Normal. Box-Cox nos permite realizar esta transformação, porém assume que todos os valores são positivos.

#Primeiramente vejamos um valor para lambda: aqui estamos usando um pacote de dados cars do R


library(MASS)
Warning: package 'MASS' was built under R version 4.2.3
boxcox(dist~speed,data=cars, plotit=T, lam=seq(-1, 1, 1/10))

#O gráfico mostra que a função que maximiza a função é aproximadamente 0.5, logo:
  
boxcox=((cars^(0.5))-1)/0.5

summary(boxcox)
     speed            dist        
 Min.   :2.000   Min.   : 0.8284  
 1st Qu.:4.928   1st Qu.: 8.1980  
 Median :5.746   Median :10.0000  
 Mean   :5.719   Mean   :10.4844  
 3rd Qu.:6.718   3rd Qu.:12.9666  
 Max.   :8.000   Max.   :19.9089  
shapiro.test(boxcox[,1])

    Shapiro-Wilk normality test

data:  boxcox[, 1]
W = 0.95985, p-value = 0.08764