Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Encoding #6

Open
palmaresk8 opened this issue Jul 28, 2016 · 0 comments
Open

Encoding #6

palmaresk8 opened this issue Jul 28, 2016 · 0 comments

Comments

@palmaresk8
Copy link

O próprio PostgreSQL traduz diferentes codificações no comando \COPY. Mesmo que o banco esteja em UTF-8, você pode usar a opção ENCODING, como abaixo:

COPY PUBLIC.TB_DOMICILIO FROM 'CNT.ICO.RJ.BHA1.ICOD884A.D100802' DELIMITERS ';' NULL '' CSV QUOTE '"' ENCODING 'WIN1252 HEADER';

O padrão do Windows (e da maior parte dos arquivos do IBGE) é o WIN1252 (ou CP1252 em outros softwares), e não o ISO-8859-1, que é um formato mais usado em páginas web. O fato é que você precisa saber (ou descobrir) a codificação do seu arquivo antes de importar, senão erros irão ocorrer (algumas sequências de bytes de uma codificação não existem em outras).

Me refiro aos erros de codificação descritos aqui

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant