Skip to content

Commit

Permalink
update
Browse files Browse the repository at this point in the history
  • Loading branch information
aborruso committed Sep 4, 2024
1 parent 0210c57 commit af34d60
Show file tree
Hide file tree
Showing 3 changed files with 4 additions and 4 deletions.
4 changes: 2 additions & 2 deletions docs/posts/beni_immobili_pubblica_amministrazione/index.html
Original file line number Diff line number Diff line change
Expand Up @@ -680,7 +680,7 @@ <h2 class="anchored" data-anchor-id="alcune-considerazioni-sui-dati">Alcune cons
<p>Questi preziosi dati inoltre <strong>non</strong> sono ancora <strong>disponibili</strong> anche nel <a href="https://www.dati.gov.it/"><strong>portale</strong> <strong>nazionale</strong> dei <strong>dati</strong> aperti</a>. Ed è un peccato in termini di valorizzazione e diffusione degli stessi. Questo è anche un <a href="https://ondata.github.io/linee-guida-opendata/capitolo-7.html#req-29"><strong>requisito</strong></a> previsto dalle linee guida nazionali sui dati aperti.</p>
<p>Interrogando la banca dati si ha evidenza di alcuni beni con <strong>coordinate geografiche</strong> <strong>incoerenti</strong> con gli <strong>attributi territoriali</strong> dichiarati in altri campi. Ad esempio il bene con <code>id_bene=2442321</code>, ha coordinate YX <code>37.926914</code> e <code>15.28337</code>, ovvero in provincia di Messina; ma nel campo <code>comune_del_bene</code> il valore è “Frascati”.</p>
<p>Aggiungo anche una nota sull’opportunità di un <strong>formato</strong> <strong>aggiuntivo</strong> di <strong>pubblicazione</strong>: il tante volte citato <strong><code>Parquet</code></strong>.<br> È diventato uno dei formati standard per consentire a chiunque di fare <strong>analisi</strong> <strong>rapide</strong> ed <strong>efficienti</strong>, anche su <strong>grandi</strong> <strong>quantità</strong> di <strong>dati</strong>, quasi su <strong>qualsiasi</strong> <strong>PC</strong>. E sarebbe ideale <strong>pubblicare la banca dati degli immobili pubblici anche in formato <code>Parquet</code></strong>.<br> Un buon esempio da emulare è quello di <strong>OpenCoesione</strong> - uno dei portali di dati aperti più importanti in Italia - che da febbraio 2024 pubblica anche in <a href="https://opencoesione.gov.it/it/news/opendata-rilasciati-dataset-formato-parquet/">questo formato</a>.</p>
<p>Sono <strong>dati</strong> al <strong>2019</strong>. Sarebbe interessante che fossero aggiornati con una <strong>frequenza</strong> <strong>maggiore</strong>, magari <strong>annuale</strong>.<br> Sul portale del Tesoso <a href="https://portaletesoro.mef.gov.it/it/singlenewspublic.wp?contentId=NWS245">si legge</a><em>Fissata al 27 settembre 2024 la chiusura della rilevazione dei dati dei beni immobili pubblici riferiti al 31/12/2023</em>” e quindi c’è da aspettarsi un prossimo aggiornamento.</p>
<p>Sono <strong>dati</strong> al <strong>2019</strong>. Sarebbe interessante che fossero aggiornati con una <strong>frequenza</strong> <strong>maggiore</strong>, magari <strong>annuale</strong>.<br> Sul portale del Tesoro <a href="https://portaletesoro.mef.gov.it/it/singlenewspublic.wp?contentId=NWS245">si legge</a><em>Fissata al 27 settembre 2024 la chiusura della rilevazione dei dati dei beni immobili pubblici riferiti al 31/12/2023</em>” e quindi c’è da aspettarsi un prossimo aggiornamento.</p>


<div class="ojs-auto-generated hidden">
Expand Down Expand Up @@ -1041,7 +1041,7 @@ <h2 class="anchored" data-anchor-id="alcune-considerazioni-sui-dati">Alcune cons
</div>
</div>
</footer>
<script>var lightboxQuarto = GLightbox({"openEffect":"zoom","loop":false,"descPosition":"bottom","selector":".lightbox","closeEffect":"zoom"});
<script>var lightboxQuarto = GLightbox({"loop":false,"selector":".lightbox","closeEffect":"zoom","descPosition":"bottom","openEffect":"zoom"});
(function() {
let previousOnload = window.onload;
window.onload = () => {
Expand Down
2 changes: 1 addition & 1 deletion docs/search.json
Original file line number Diff line number Diff line change
Expand Up @@ -81,7 +81,7 @@
"href": "posts/beni_immobili_pubblica_amministrazione/index.html#alcune-considerazioni-sui-dati",
"title": "I (quasi) tre milioni di beni immobili della Pubblica Amministrazione",
"section": "Alcune considerazioni sui dati",
"text": "Alcune considerazioni sui dati\nÈ possibile combinare rapidamente e facilmente questi file per creare una base di dati efficiente e pronta per l’analisi e le interrogazioni. Questo avviene non solo grazie a strumenti come DuckDB, ma anche perché i file di input condividono uno schema unico, che permette di unire i file CSV senza difficoltà.\nE come scritto nelle conclusioni di un “famoso” articolo:\n\nCon le dovute precauzioni, con gli strumenti giusti, con un corredo informativo adeguato e per dimensioni non eccessive, (il CSV) può essere un formato comodo e pratico. Descrivendolo, “standardizzandolo” e comprimendolo, diventa molto più usabile.\n\nA proposito di “descrizione”, il Dipartimento dell’Economia pubblica un file dizionario, uno schema, ma soltanto in formato PDF. Quindi non è possibile creare una procedura automatica di importazione dei dati, in cui sono ad esempio impostati correttamente i tipi di campo (testuali, numerici, ecc.).\n\n\n\n\n\n\n📌 Importante\n\n\n\nLa pubblicazione non si dovrebbe limitare a rendere disponibile dei file, ma essere accompagnata da una descrizione del file stesso, leggibile dalle persone e dalle applicazioni.\n\n\nSui CSV sarebbe ideale:\n\ndocumentare qual è l’encoding dei caratteri;\navere come encoding l’UTF-8;\nevitare l’utilizzo di spazi, virgolette o altri caratteri speciali nei nomi dei campi;\ndichiarare quali sono i separatori di campo e dei decimali;\npubblicarli anche non separati in 30 file, ma in unico file compresso gzip.\n\nQuesti preziosi dati inoltre non sono ancora disponibili anche nel portale nazionale dei dati aperti. Ed è un peccato in termini di valorizzazione e diffusione degli stessi. Questo è anche un requisito previsto dalle linee guida nazionali sui dati aperti.\nInterrogando la banca dati si ha evidenza di alcuni beni con coordinate geografiche incoerenti con gli attributi territoriali dichiarati in altri campi. Ad esempio il bene con id_bene=2442321, ha coordinate YX 37.926914 e 15.28337, ovvero in provincia di Messina; ma nel campo comune_del_bene il valore è “Frascati”.\nAggiungo anche una nota sull’opportunità di un formato aggiuntivo di pubblicazione: il tante volte citato Parquet. È diventato uno dei formati standard per consentire a chiunque di fare analisi rapide ed efficienti, anche su grandi quantità di dati, quasi su qualsiasi PC. E sarebbe ideale pubblicare la banca dati degli immobili pubblici anche in formato Parquet. Un buon esempio da emulare è quello di OpenCoesione - uno dei portali di dati aperti più importanti in Italia - che da febbraio 2024 pubblica anche in questo formato.\nSono dati al 2019. Sarebbe interessante che fossero aggiornati con una frequenza maggiore, magari annuale. Sul portale del Tesoso si legge “Fissata al 27 settembre 2024 la chiusura della rilevazione dei dati dei beni immobili pubblici riferiti al 31/12/2023” e quindi c’è da aspettarsi un prossimo aggiornamento."
"text": "Alcune considerazioni sui dati\nÈ possibile combinare rapidamente e facilmente questi file per creare una base di dati efficiente e pronta per l’analisi e le interrogazioni. Questo avviene non solo grazie a strumenti come DuckDB, ma anche perché i file di input condividono uno schema unico, che permette di unire i file CSV senza difficoltà.\nE come scritto nelle conclusioni di un “famoso” articolo:\n\nCon le dovute precauzioni, con gli strumenti giusti, con un corredo informativo adeguato e per dimensioni non eccessive, (il CSV) può essere un formato comodo e pratico. Descrivendolo, “standardizzandolo” e comprimendolo, diventa molto più usabile.\n\nA proposito di “descrizione”, il Dipartimento dell’Economia pubblica un file dizionario, uno schema, ma soltanto in formato PDF. Quindi non è possibile creare una procedura automatica di importazione dei dati, in cui sono ad esempio impostati correttamente i tipi di campo (testuali, numerici, ecc.).\n\n\n\n\n\n\n📌 Importante\n\n\n\nLa pubblicazione non si dovrebbe limitare a rendere disponibile dei file, ma essere accompagnata da una descrizione del file stesso, leggibile dalle persone e dalle applicazioni.\n\n\nSui CSV sarebbe ideale:\n\ndocumentare qual è l’encoding dei caratteri;\navere come encoding l’UTF-8;\nevitare l’utilizzo di spazi, virgolette o altri caratteri speciali nei nomi dei campi;\ndichiarare quali sono i separatori di campo e dei decimali;\npubblicarli anche non separati in 30 file, ma in unico file compresso gzip.\n\nQuesti preziosi dati inoltre non sono ancora disponibili anche nel portale nazionale dei dati aperti. Ed è un peccato in termini di valorizzazione e diffusione degli stessi. Questo è anche un requisito previsto dalle linee guida nazionali sui dati aperti.\nInterrogando la banca dati si ha evidenza di alcuni beni con coordinate geografiche incoerenti con gli attributi territoriali dichiarati in altri campi. Ad esempio il bene con id_bene=2442321, ha coordinate YX 37.926914 e 15.28337, ovvero in provincia di Messina; ma nel campo comune_del_bene il valore è “Frascati”.\nAggiungo anche una nota sull’opportunità di un formato aggiuntivo di pubblicazione: il tante volte citato Parquet. È diventato uno dei formati standard per consentire a chiunque di fare analisi rapide ed efficienti, anche su grandi quantità di dati, quasi su qualsiasi PC. E sarebbe ideale pubblicare la banca dati degli immobili pubblici anche in formato Parquet. Un buon esempio da emulare è quello di OpenCoesione - uno dei portali di dati aperti più importanti in Italia - che da febbraio 2024 pubblica anche in questo formato.\nSono dati al 2019. Sarebbe interessante che fossero aggiornati con una frequenza maggiore, magari annuale. Sul portale del Tesoro si legge “Fissata al 27 settembre 2024 la chiusura della rilevazione dei dati dei beni immobili pubblici riferiti al 31/12/2023” e quindi c’è da aspettarsi un prossimo aggiornamento."
},
{
"objectID": "til/un-sito-in-quarto/index.html",
Expand Down
2 changes: 1 addition & 1 deletion docs/sitemap.xml
Original file line number Diff line number Diff line change
Expand Up @@ -14,7 +14,7 @@
</url>
<url>
<loc>https://aborruso.github.io/posts/beni_immobili_pubblica_amministrazione/index.html</loc>
<lastmod>2024-09-04T13:14:14.580Z</lastmod>
<lastmod>2024-09-04T16:07:23.976Z</lastmod>
</url>
<url>
<loc>https://aborruso.github.io/til/un-sito-in-quarto/index.html</loc>
Expand Down

0 comments on commit af34d60

Please sign in to comment.