Skip to content
This repository has been archived by the owner on Sep 11, 2024. It is now read-only.

WIP: Databáze #79

Merged
merged 20 commits into from
Mar 5, 2020
Merged

Conversation

messa
Copy link
Collaborator

@messa messa commented Feb 25, 2020

#66

@review-notebook-app
Copy link

Check out this pull request on  ReviewNB

You'll be able to see Jupyter notebook diff and discuss changes. Powered by ReviewNB.

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tady by stálo za to aspoň krátce shrnout, co vlastně SQLAlchemy dělá a proč nám to tady pomůže.


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Jsou tady ty nástroje potřeba zmiňovat? Spíš by se tu hodilo vysvětlit, co je Schema, Table a Column a jak to odpovídá objektům z Pandas.

A taky co je třeba VARCHAR(32)

Použil jsi metodu ljust. Ta dělá co? (to je otázka, co může padnout, když to nějaká účastnice bude číst)


Reply via ReviewNB

Copy link
Collaborator Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Nástroje jsem zmiňoval, aby absolvent kurzu měl přehled, co se používá v praxi, a nebyl až tak úplně v Python-Pandas bublině.

Table, column, typy sloupců by to chtělo popsat.

Copy link
Member

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Nástroje bych zmínil. Dost se nám btw. osvědčuje DBeaver.

Případně pgcli, mycli, ...

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tady to row vypadá jako tuple, ale přitom není. To by asi stálo za to osvětlit, ale nemyslím implementaci.

Tedy že je to objekt, který je udělaný tak, aby se s ním dalo pracovat jako s listem i dictem.

Mohl by se tu vysvětlit ten LIMIT nebo to prostě vyřešit v pythonu.


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Jak si to poradí s typama sloupců? Můžeš je tu vypsat?


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tohle už tu asi není potřeba, ne?


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Pojmenovat proměnnou mta? Radši bych ji pojmenoval movie_to_actor


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

To porovnání operací v pandas vs SQL je supr nápad.

Možná by se někdo mohl ptát proč dva způsoby? Na to by se hodilo nějaký porovnání s tím kdy použít co. Třeba jako když jsi chci jenom něco rychlého ověřit, tak to udělám v SQL. A tak podobně.


Reply via ReviewNB

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Já bych zde jako příklad uvedl možnost, kdy je databáze obrovská a leží někde na internetu a já tím, že data zpracuji ještě pomocí SQL nemusím tahat takové množství dat k sobě. Ušetřím tím čas i následné zpracování v pandasu. Nehledě na to, že těch dat může být tolik, že si s nimi lokálně ani neporadím.

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tady by se hodily nějaké příklady k zamyšlení na typy vazeb. Třeba novinový článek a autor (to je trochu chyták, článek může mít víc autorů).


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tady je otázka, jestli vlastně chceme vykládat tenhle a následující příkazy, když z pohledu datový analýzy asi nejsou moc zajímavý.


Reply via ReviewNB

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Jeden odstavec o těchto příkazech bych zmínil. Něco jako že SQL se používá i na tvorbu a úpravy databází samotných, ale že to my znát v analýze nepotřebujeme.

@@ -0,0 +1,1078 @@
{
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tady je možné použít %pip nebo !python -m pip — minimálně to první už někde v předchozích lekcích použito je.


Reply via ReviewNB

Copy link
Collaborator Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Je ok to použít v "obecném" notebooku? Já třeba nejedu přes venv a nechci tento příkaz spouštět při "run all" :) A nebo by to mohlo být zakomentované...

Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Klidně zakomentovat nebo jen zmínit v textu a kdo to bude dělat, tak si jej nakopíruje do buňky nebo terminálu.

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Mohlo by se to postavit na datech z olympiád, která jsme použili na opakování (https://docs.google.com/document/d/1PvJM0tiy7kcT4NV0zM6uWnX6jLdlEiEc8P2fOs3xCok/edit). Jsou tam dvě tabulky, různé typy sloupců a možnost foreign key. Ale možná už je pozdě to měnit :)


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Nebo rovnou %pip install sqlalchemy s notebooku ;)


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Možná by se mohlo někde vysvětlit pojmy / vztah databáze, schéma, tabulka, sloupec, data?


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Bylo by fajn každý krok okomentovat - co se děje, co je ten divný jazyk co není Python :-D a tak


Reply via ReviewNB

@@ -0,0 +1,1078 @@
{
Copy link

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Tohle se dá možná vztáhnout / srovnat s validate v pd.merge


Reply via ReviewNB

@janpipek
Copy link
Member

janpipek commented Mar 5, 2020

⚠️ Je potřeba doplnit i runs/2020/pydata.../info.yml (což má cenu udělat až po rebase na aktuální praha-jaro2020).

@messa messa changed the base branch from master to praha-jaro2020 March 5, 2020 15:46
@janpipek janpipek merged commit d3bd45b into PyDataCZ:praha-jaro2020 Mar 5, 2020
@messa
Copy link
Collaborator Author

messa commented Mar 6, 2020

Pokračování v #82 a #83 :)

Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

5 participants