forked from rse-r/intro-ii-r-ggplot-ex-ggplot2-template
-
Notifications
You must be signed in to change notification settings - Fork 0
/
01-ggplot2.Rmd
115 lines (71 loc) · 3.15 KB
/
01-ggplot2.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
---
title: "Gráficos con ggplot2"
author: "<tu nombre>"
date: "2024-07-11"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
library(dplyr)
library(ggplot2)
# En este bloque cargá los paquetes que vas a necesitar
```
# Preparación
Esta vez vamos a trabajar con los datos `millas` del paquete datos.
Familiarizate con los datos igual que hiciste en el ejercicio anterior.
```{r}
millas <- datos::millas
```
En los ejercicios siguientes, vas a hacer varios gráficos.
Además de escribir el código para generar el gráfico, escribí como mínimo una oración describiendo qué es lo que ves.
¿Qué relación hay entre las variables?
¿Qué hipótesis te surgen?
# Ejercicios
1. Hacé un gráfico de puntos de "autopista" versus "cilindros".
¿Qué conclusión sacás?
```{r}
ggplot(millas, aes(autopista, cilindros)) +
geom_point() #saco la conclusion de que
```
2. Hacé un gráfico similar pero de "autopista" versus "ciudad".
```{r}
ggplot(millas, aes(autopista, ciudad)) +
geom_point() # se ve que hay un cremiento
```
3. ¿Qué pasa cuando haces un gráfico de de "clase" versus "traccion"? ¿Por qué no es útil este gráfico?
un grafico de puntos no sirve para variables categoricas
```{r}
ggplot(millas, aes(clase, traccion)) +
geom_point() #por que no me indica ninguna tendencia, todo disperso
```
4. En otro bloque, rehacé el gráfico de "autopista" versus "ciudad" pero ahora asigná la variable "tracción" al color de los puntos.
```{r}
ggplot(millas, aes(autopista, ciudad)) +
geom_point(aes(color = traccion))
```
5. En otro bloque, rehacé el gráfico de "autopista" versus "ciudad" pero ahora asigná la variable "tracción" al color de los puntos.
```{r}
```
5. ¿Qué ocurre si se asigna o mapea una estética a algo diferente del nombre de una variable, como `aes(color = cilindrada < 3)`?
En el caso de una condicion colorea los puntos del grafico de 2 colores, si es verdadera o falsa la condicion
```{r}
ggplot(millas, aes(clase, ciudad)) +
geom_point(aes(color = cilindrada < 3))
```
6. ¿Notás algún problema con los gráfico anterior? Pensá en qué valores toman los datos de `ciudad` y `autopista`, ¿es posible que no haya ningún auto que haga 20.3 millas por galón en autopista? ¿Qué problemas puede traer eso? Por ejemplo, mirando el gráfico, ¿cuántos autos existe que hagan 20 millas en autopista y 15 en ciudad?
```{r}
millas |>
ggplot(aes(ciudad, autopista)) +
geom_jitter(aes(color = (ciudad == 15 & autopista == 20)))
millas |>
filter(ciudad == 15 & autopista == 20) |>
count()
```
7. En el gráfico anterior, reemplazá `geom_point()` por `geom_jitter()`. ¿Qué es lo que sucede? (Podés fijate en la ayuda de `geom_jitter()` si no entendés qué es lo que hace.)
¿Qué ventajas y desventajas tiene este geom?
geom_jitter evita la superposición de los puntos pudiendo así interpretar cuantas observaciones idénticas hay
Como desventajas, no permite saber cual es el valor exacto de cada punto como también así da una ilusión de una relación entre variables
```{r}
ggplot(millas, aes(clase, ciudad)) +
geom_jitter(aes(color = cilindrada < 3))
```