Skip to content

gustavoaires/textprocessor

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GET Started

  1. Baixe esse projeto.

  2. Abra o console.

  3. Entre no diretório "/source" desse projeto.

  4. Execute esse comando "python JSONTextProcess.py /SEUDIRETORIO/arquivo.json"

  5. Irá aparecer um menu, digite 1 no terminal e aperte ENTER.

  6. Um Arquivo será gerado na pasta source nominado como "tweets_DATA-ATUAL.tsv"

obs:

  • Você pode configurar o formato do arquivo de entrada na função Split(Linha 16) mudando a variável delimiters.

  • Na função "processTwitterText()" você terá que selecionar o texto a ser processado e colocar na variável "text".

Exemplo:

imput_file.txt

324234, TEXTO A SER PROCESSADO 1, -123.213, 125.234
765666, TEXTO A SER PROCESSADO 2, -133.213, 122.234
655634, TEXTO A SER PROCESSADO 3, -25.213, 125.234
763487, TEXTO A SER PROCESSADO 4, -223.213, 125.234

A Função split irá ficar assim:

def split(string, maxsplit=0):
    delimiters = ","
    import re
    regexPattern = '|'.join(map(re.escape, delimiters))
    return re.split(regexPattern, string, maxsplit)  

E na função "processTwitterText()" irá ficar assim:

    text = d[1] # 1 porque o texto a ser processado está na segunda posição no arquivo de entrada.

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%