Tree Bank Indonesia

Tree Bank khusus Bahasa Indonesia.

Korpus

Deskripsi

Korpus Treebank Bahasa Indonesia merupakan korpus yang berisi kalimat yang telah diurai secara manual oleh manusia.

Data kalimat-kalimat yang terdapat di dalam korpus didapatkan dari PAN Localization . Korpus ini terdiri dari seribu kalimat.

Format yang digunakan oleh korpus adalah tab separated value. Setiap baris terdiri dari ID kalimat dan hasil penguraian kalimat yang dipisahkan oleh karakter tab. Berikut ini adalah contoh format korpus.

[ID] [bracket]
[ID] [bracket]
[ID] [bracket]
[ID] [bracket]
...
Panduan Penguraian dan Korpus
Untuk mengetahui lebih banyak mengenai cara kami mengurai kalimat, silakan baca Bracketing Guidelines yang terdapat di repositori github berikut ini.
via github
Lisensi
This work is licensed under the Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License. To view a copy of this license, visit http://creativecommons.org/licenses/by-nc-sa/4.0/.
Creative Commons License
Indonesian POS Tagged Corpus by Arawinda Dinakaramani, Fam Rashel, Andry Luthfi, and Ruli Manurung is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Based on a work at http://www.panl10n.net/indonesia/