idn-treebank

=================

Manually Tagged Indonesian Corpus

Bahasa.
English.

README.md versi Bahasa

Format Data

Setiap baris berisi parse-tree dari kalimat bahasa Indonesia. Korpus ini terdiri dari dua jenis berkas, yang satu disertai ID dan yang lainnya RAW. Setiap parse-tree pada berkas dengan ID selalu diawali dengan id kalimat yang dipisahkan sebuah karakter tab (\t).

README.md English version

Data Format

Each line consists of parse-tree from Indonesian sentence. The corpus consists of two types of file, the one with ID and the other is RAW. Each parse-tree inside the file with ID has a sentence ID in the beginning of the line separated by a single tab character (\t).

Authors

Ruli Manurung
Arawinda Dinakaramani
Fam Rashel
Andry Luthfi

Page

For more details about this work, please visit http://bahasa.cs.ui.ac.id/treebank/corpus

License

This work is licensed under the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/4.0/.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
BracketingGuidelines.pdf		BracketingGuidelines.pdf
Indonesian_Treebank.bracket		Indonesian_Treebank.bracket
Indonesian_Treebank_ID.bracket		Indonesian_Treebank_ID.bracket
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

idn-treebank

README.md versi Bahasa

Format Data

README.md English version

Data Format

Authors

Page

License

About

Releases

Packages

Contributors 2

ir-nlp-csui/idn-treebank-CSUI

Folders and files

Latest commit

History

Repository files navigation

idn-treebank

README.md versi Bahasa

Format Data

README.md English version

Data Format

Authors

Page

License

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Packages