-
Baixe esse projeto.
-
Abra o console.
-
Entre no diretório "/source" desse projeto.
-
Execute esse comando "python JSONTextProcess.py /SEUDIRETORIO/arquivo.json"
-
Irá aparecer um menu, digite 1 no terminal e aperte ENTER.
-
Um Arquivo será gerado na pasta source nominado como "tweets_DATA-ATUAL.tsv"
-
Você pode configurar o formato do arquivo de entrada na função Split(Linha 16) mudando a variável delimiters.
-
Na função "processTwitterText()" você terá que selecionar o texto a ser processado e colocar na variável "text".
imput_file.txt
324234, TEXTO A SER PROCESSADO 1, -123.213, 125.234
765666, TEXTO A SER PROCESSADO 2, -133.213, 122.234
655634, TEXTO A SER PROCESSADO 3, -25.213, 125.234
763487, TEXTO A SER PROCESSADO 4, -223.213, 125.234
A Função split irá ficar assim:
def split(string, maxsplit=0):
delimiters = ","
import re
regexPattern = '|'.join(map(re.escape, delimiters))
return re.split(regexPattern, string, maxsplit)
E na função "processTwitterText()" irá ficar assim:
text = d[1] # 1 porque o texto a ser processado está na segunda posição no arquivo de entrada.