diff --git a/lessons/pydata/pandas_correlations/index.ipynb b/lessons/pydata/pandas_correlations/index.ipynb index 89cd2b3..88138f1 100644 --- a/lessons/pydata/pandas_correlations/index.ipynb +++ b/lessons/pydata/pandas_correlations/index.ipynb @@ -2037,7 +2037,7 @@ "\n", "Když se zkoumají vztahy kategorických a numerických proměnných, koukáme se vlastně na sadu numerických proměnných, vyhodnocovaných pro každou hodnotu kategorické proměnné zvlášť. V našem případě tedy pro horory zvlášť, pro dokumenty zvlášť apod. Z výpočetního hlediska je toto téma pro shlukování a operaci `groupby`, kterým se detailně věnuje příští hodina. Nyní si jen ukážeme některé pěkné vizualizace.\n", "\n", - "Krabicový graf si jistě pamatuješ z minula, pomocí seabornu ho vytvoříš zavoláním funkce [`boxplot`](https://seaborn.pydata.org/generated/seaborn.boxplot.html) - jen se nekreslí krabičky pro různé proměnné, ale pro tutéž číselnou proměnnou, jen v závislosti na hodnotě proměnné kategorické:" + "Předtím, než začneme s použitím knihovny seaborn, musíme upravit dulicitu indexů, která nám zatím vznikla. Druhá možnost by byla vybrat subset filmů, například dokumentů. \n" ] }, { @@ -2049,6 +2049,13 @@ "decades_and_genres = decades_and_genres.reset_index() # seabornu vadí duplicitní index" ] }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "Krabicový graf si jistě pamatuješ z minula, pomocí seabornu ho vytvoříš zavoláním funkce [`boxplot`](https://seaborn.pydata.org/generated/seaborn.boxplot.html) - jen se nekreslí krabičky pro různé proměnné, ale pro tutéž číselnou proměnnou, jen v závislosti na hodnotě proměnné kategorické:" + ] + }, { "cell_type": "code", "execution_count": 37, @@ -2104,7 +2111,7 @@ "source": [ "_, ax = plt.subplots(figsize=(12, 5)) # stripplot neumí specifikovat velikost grafu\n", "sns.stripplot(\n", - " data=decades_and_genres.reset_index(), # seabornu vadí duplicitní index\n", + " data=decades_and_genres, # seabornu vadí duplicitní index\n", " x=\"decade\",\n", " y=\"imdb_rating\",\n", " s=1,\n", @@ -2140,7 +2147,7 @@ "source": [ "_, ax = plt.subplots(figsize=(12, 5)) # violinplot neumí specifikovat velikost grafu\n", "sns.violinplot(\n", - " data=decades_and_genres.reset_index(),\n", + " data=decades_and_genres,\n", " x=\"decade\",\n", " y=\"imdb_rating\",\n", " ax=ax,\n",