forked from rse-r/intro-ii-r-ggplot-ex-ggplot2-template
-
Notifications
You must be signed in to change notification settings - Fork 0
/
01-ggplot2.Rmd
96 lines (64 loc) · 2.92 KB
/
01-ggplot2.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
---
title: "Gráficos con ggplot2"
author: "<tu nombre>"
date: "2024-07-11"
output: html_document
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
# En este bloque cargá los paquetes que vas a necesitar
library(dplyr)
library(ggplot2)
library(datos)
```
# Preparación
Esta vez vamos a trabajar con los datos `millas` del paquete datos.
Familiarizate con los datos igual que hiciste en el ejercicio anterior.
```{r}
millas <- datos::millas
```
En los ejercicios siguientes, vas a hacer varios gráficos.
Además de escribir el código para generar el gráfico, escribí como mínimo una oración describiendo qué es lo que ves.
¿Qué relación hay entre las variables?
¿Qué hipótesis te surgen?
# Ejercicios
1. Hacé un gráfico de puntos de "autopista" versus "cilindros".
¿Qué conclusión sacás?
- A partir del grafico podemos observar que a medida que aumenta el numero de cilindros, la eficiencia en carretera tiende a disminuir.
```{r}
ggplot(millas, aes(autopista, cilindros)) +
geom_point(color = "blue")
```
2. Hacé un gráfico similar pero de "autopista" versus "ciudad".
```{r}
ggplot(millas, aes(autopista, ciudad)) +
geom_point(color = "blue")
```
3. ¿Qué pasa cuando haces un gráfico de de "clase" versus "traccion"? ¿Por qué no es útil este gráfico?
Este grafico no es utili porque "clase" y "tracción" son dos variables categoricas, entonces los puntos caen todos en el mismo lugar y no puede verse qué cantidad de observaciones hay en cada combinación de categorías.
```{r}
ggplot(millas, aes(traccion, clase)) +
geom_point(color = "blue")
```
4. En otro bloque, rehacé el gráfico de "autopista" versus "ciudad" pero ahora asigná la variable "tracción" al color de los puntos.
```{r}
ggplot(millas, aes(autopista, ciudad, , color = traccion)) +
geom_point()
```
5. En otro bloque, rehacé el gráfico de "autopista" versus "ciudad" pero ahora asigná la variable "tracción" al color de los puntos.
```{r}
ggplot(millas, aes(autopista, ciudad, , color = traccion)) +
geom_point()
```
5. ¿Qué ocurre si se asigna o mapea una estética a algo diferente del nombre de una variable, como `aes(color = cilindrada < 3)`?
```{r}
ggplot(millas, aes(autopista, ciudad, , color = cilindrada < 3)) +
geom_point()
```
6. ¿Notás algún problema con los gráfico anterior? Pensá en qué valores toman los datos de `ciudad` y `autopista`, ¿es posible que no haya ningún auto que haga 20.3 millas por galón en autopista? ¿Qué problemas puede traer eso? Por ejemplo, mirando el gráfico, ¿cuántos autos existe que hagan 20 millas en autopista y 15 en ciudad?
7. En el gráfico anterior, reemplazá `geom_point()` por `geom_jitter()`. ¿Qué es lo que sucede? (Podés fijate en la ayuda de `geom_jitter()` si no entendés qué es lo que hace.)
¿Qué ventajas y desventajas tiene este geom?
```{r}
ggplot(millas, aes(autopista, ciudad)) +
geom_jitter(aes(color = cilindrada < 3))
```