Introducción al paquete gráfico “ggplot2”.

Instalo y cargo el paquete ggplot2.

# install.packages('ggplot2')
library(ggplot2)

Cargo los datos del df “diamonds”.

data("diamonds")
# View(diamonds) help(diamonds)
head(diamonds)
##   carat       cut color clarity depth table price    x    y    z
## 1  0.23     Ideal     E     SI2  61.5    55   326 3.95 3.98 2.43
## 2  0.21   Premium     E     SI1  59.8    61   326 3.89 3.84 2.31
## 3  0.23      Good     E     VS1  56.9    65   327 4.05 4.07 2.31
## 4  0.29   Premium     I     VS2  62.4    58   334 4.20 4.23 2.63
## 5  0.31      Good     J     SI2  63.3    58   335 4.34 4.35 2.75
## 6  0.24 Very Good     J    VVS2  62.8    57   336 3.94 3.96 2.48

Scatter plot. Para representar dos variables de una misma observación.

ggplot(data=diamonds, aes(x=carat, y=price)) +  #qu? quiero representar
    geom_point()                                #c?mo lo quiero representar

# Se puede observar que existe cierta relacion entre el incremento del precio y el incremento del tama?o.

# Borrar gr?fico

p = ggplot(data=diamonds, aes(x=carat, y=price)) +  #qu? quiero representar
    geom_point()                                    #c?mo lo quiero representar
print(p)

p

summary(p)
## data: carat, cut, color, clarity, depth, table, price, x, y, z
##   [53940x10]
## mapping:  x = carat, y = price
## faceting: facet_null() 
## -----------------------------------
## geom_point: na.rm = FALSE 
## stat_identity:  
## position_identity: (width = NULL, height = NULL)

Introducir una tercera variable en la representación. Aesthetic.

ggplot(data=diamonds, aes(x=carat, y=price, color=clarity)) + #El color de los puntos cambia en f(variable)
    geom_point()

#No confundir con:
ggplot(data=diamonds, aes(x=carat, y=price)) +  
    geom_point(color="steelblue", size=4, alpha=1/2) #Ahora color es definido por una constante.

# Muchos aspectos se reprsentan siguiendo los par?metros predefinidos por defecto, como son los colores asignados a cada variable, la aparici?n de la leyenda con un formato y en una posici?n determinada, etc...

# Al introducir una tercera variable en el gr?fico podemos ver c?mo la claridad de los diamantes tambi?n influye en el precio, as? se aprecia que los de claridad VVS1 alcanzan precios mas altos que los de la claridad I1, cuando a?n cuando el peso del diamante es el mismo, p.e.1.

# En el lugar de "clarity" se puede introducir otras variables cualitativas como "color" o "cut".

Podemos introducir aún una cuarta e incluso una quinta variable. Aesthetic.

ggplot(data = diamonds, aes(x = carat, y = price, color = clarity, size = color)) + 
    geom_point()

ggplot(data = diamonds, aes(x = carat, y = price, color = clarity, size = color, 
    shape = cut)) + geom_point()

# Demasiado confuso.

Añadimos una capa más al gráfico (geom_), que a su vez sea un resumen estadístico.

ggplot(data = diamonds, aes(x = carat, y = price)) + geom_point()