Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

explaining the names of types #38

Open
leoalenc opened this issue Aug 12, 2021 · 5 comments
Open

explaining the names of types #38

leoalenc opened this issue Aug 12, 2021 · 5 comments
Assignees
Labels
documentation Improvements or additions to documentation

Comments

@leoalenc
Copy link
Contributor

Na gramatica ERG, temos vários problemas com os nomes de tipos. Nem sempre o significado é claro. Seria bom termos, logo de inicio, uma boa documentação sobre os 'nomes' que usamos. Por exemplo, o que seria o prefixo fac em fac-refl-intrans?

@arademaker, obrigado pelas dicas, altamente relevantes. fac é facultative. Vou criar documento com definição da sintaxe utilizada nos nomes e uma tabela explicando todos os elementos que entram nos nomes dos tipos.

A ferramenta do @fcbond que permite navegar por uma gramática e treebank, exibe entradas como http://compling.hss.ntu.edu.sg/ltdb/cgi/ERG_1214//showtype.cgi?typ=aj_-_i-att-pn_le produzidas a partir da leitura dos arquivos TDL que seguem: 1) uma convenção de nomes para entradas lexicais e tipos (vide https://github.com/delph-in/docs/wiki/ErgLeTypes) e usam docstrings (parecidas com do Python):

aj_-_i-att_le := reg_adj_word &
"""
Adj, attributive                 
<ex>The inner ring is small.
"""
  [ SYNSEM basic_attr_adj_synsem ].

Um investimento interessante. Infelizmente acho que a MATRIX não tem nenhum suporte para estas documentações.

Não tem mesmo.

Originally posted by @leoalenc in #18 (comment)

@leoalenc leoalenc self-assigned this Aug 12, 2021
@leoalenc leoalenc added the documentation Improvements or additions to documentation label Aug 12, 2021
@leoalenc
Copy link
Contributor Author

@arademaker, expandi neste arquivo as abreviaturas usadas para compor os nomes dos tipos:
names.txt

Alguns dos nomes são herdados da Matriz Gramatical, acho que, destes, todos integram nomes de tipos definidos em matrix.tdl.

Extraí os componentes dos nomes por meio do comando:

awk '$2 ~ /:=/ {print $3}' lexicon.tdl | tr "\-" "\n" | sort | uniq > names.txt

@leoalenc
Copy link
Contributor Author

leoalenc commented Aug 12, 2021

@arademaker, complementando a explicação sobre o arquivo anexado acima, os itens da coluna 1 que não têm correspondente na coluna 2 não são abreviaturas. Muitos desses itens são palavras do léxico, por exemplo, ir é o verbo ir etc.
Sobre a terminologia, ver, por exemplo:

https://glossary.sil.org/

https://www.routledge.com/Routledge-Dictionary-of-Language-and-Linguistics/Bussmann-Kazzazi-Trauth/p/book/9780415203197

Sobre a distinção entre os diferentes tipos de demonstrativos, ver:

https://en.wikipedia.org/wiki/Demonstrative

Essas distinções estão codificadas nos tipos:

dem-prox-determiner-lex
dem-med-determiner-lex
dem-dist-determiner-lex

@leoalenc
Copy link
Contributor Author

leoalenc commented Aug 19, 2021

@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:

o cachorro quer:vol-verb-lex que o gato lata

o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato

I

@leoalenc
Copy link
Contributor Author

@arademaker, uma forma de documentar automaticamente os tipos de verbos é aplicar a gramática no conjunto de teste, produzindo, por exemplo, algo do tipo:

o cachorro quer:vol-verb-lex que o gato lata

o cachorro continua:ger-aux-lex querendo:bare-inf-aux-lex perseguir:trans-verb-lex o gato

I

@arademaker, algo mais ousado é melhorar a visualização da hierarquia que é gerada pela Matriz.

@leoalenc leoalenc changed the title Explaining the names of types explaining the names of types Aug 27, 2021
@leoalenc
Copy link
Contributor Author

Esta issue relaciona-se com o comentário de @arademaker: #68 (comment) assim como com #56 e #58.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
documentation Improvements or additions to documentation
Projects
None yet
Development

No branches or pull requests

1 participant