Skip to content

Commit

Permalink
Add files via upload
Browse files Browse the repository at this point in the history
  • Loading branch information
gallupet authored Oct 6, 2024
1 parent 8c715d5 commit b73569c
Showing 1 changed file with 10 additions and 3 deletions.
13 changes: 10 additions & 3 deletions lessons/pydata/pandas_correlations/index.ipynb
Original file line number Diff line number Diff line change
Expand Up @@ -2037,7 +2037,7 @@
"\n",
"Když se zkoumají vztahy kategorických a numerických proměnných, koukáme se vlastně na sadu numerických proměnných, vyhodnocovaných pro každou hodnotu kategorické proměnné zvlášť. V našem případě tedy pro horory zvlášť, pro dokumenty zvlášť apod. Z výpočetního hlediska je toto téma pro shlukování a operaci `groupby`, kterým se detailně věnuje příští hodina. Nyní si jen ukážeme některé pěkné vizualizace.\n",
"\n",
"Krabicový graf si jistě pamatuješ z minula, pomocí seabornu ho vytvoříš zavoláním funkce [`boxplot`](https://seaborn.pydata.org/generated/seaborn.boxplot.html) - jen se nekreslí krabičky pro různé proměnné, ale pro tutéž číselnou proměnnou, jen v závislosti na hodnotě proměnné kategorické:"
"Předtím, než začneme s použitím knihovny seaborn, musíme upravit dulicitu indexů, která nám zatím vznikla. Druhá možnost by byla vybrat subset filmů, například dokumentů. \n"
]
},
{
Expand All @@ -2049,6 +2049,13 @@
"decades_and_genres = decades_and_genres.reset_index() # seabornu vadí duplicitní index"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Krabicový graf si jistě pamatuješ z minula, pomocí seabornu ho vytvoříš zavoláním funkce [`boxplot`](https://seaborn.pydata.org/generated/seaborn.boxplot.html) - jen se nekreslí krabičky pro různé proměnné, ale pro tutéž číselnou proměnnou, jen v závislosti na hodnotě proměnné kategorické:"
]
},
{
"cell_type": "code",
"execution_count": 37,
Expand Down Expand Up @@ -2104,7 +2111,7 @@
"source": [
"_, ax = plt.subplots(figsize=(12, 5)) # stripplot neumí specifikovat velikost grafu\n",
"sns.stripplot(\n",
" data=decades_and_genres.reset_index(), # seabornu vadí duplicitní index\n",
" data=decades_and_genres, # seabornu vadí duplicitní index\n",
" x=\"decade\",\n",
" y=\"imdb_rating\",\n",
" s=1,\n",
Expand Down Expand Up @@ -2140,7 +2147,7 @@
"source": [
"_, ax = plt.subplots(figsize=(12, 5)) # violinplot neumí specifikovat velikost grafu\n",
"sns.violinplot(\n",
" data=decades_and_genres.reset_index(),\n",
" data=decades_and_genres,\n",
" x=\"decade\",\n",
" y=\"imdb_rating\",\n",
" ax=ax,\n",
Expand Down

0 comments on commit b73569c

Please sign in to comment.