-
Notifications
You must be signed in to change notification settings - Fork 40
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
lisensi dari daftar kata KBBI #5
Comments
bukankah kata itu sifatnya open source, klo ingin legal kontak https://kbbi.kemdikbud.go.id/ |
maaf baru bales sekarang. saya pernah tanya, tapi bukan merujuk ke library ini. tapi mungkin konteksnya sama ? berikut emailnya, siapa tau berguna. saya kirim email ini ke adminkbbi@kemdikbud.go.id tanggal 1 Mei 2023 dan dibalas tanggal 16 Mei 2023.
balasan dari KBBI
saya balas lagi
balasan dari KBBI
lalu saya balas
menurut saya ini masih ambigu, menurut mas Zaky gimana? |
hukum emang selalu "gray area", mungkin bisa kita buat analogi seperti ini: ada sebuah buku yang isinya adalah sebuah cerita, namun kita shuffle semua kata di dalamnya (urutannya), apakah ceritanya masih sama dengan sebelumnya? Tergantung tujuannya apa, tapi kalo sebuah list di-shuffle, apakah masih sama dengan list originalnya? this is not legal advice |
Seharusnya yang menjadi objek hak cipta Kamus Besar Bahasa Indonesia adalah Kamusnya: ekspresi dari para penulis KBBI tentang arti dari sebuah kata, penggunaan, dan contoh-contohnya. Untuk kata dan ide katanya sendiri bukan objek hak cipta (kecuali untuk kata yang melekat dengan objek hak cipta atau merek, misal Apple). Jadi, selama yang digunakan adalah kata-kata dalam bahasa Indonesia tanpa menyertakan deskripsi arti dan interpretasi kata dari KBBI seharusnya clear ground. Berkaitan dengan saran @damzaky mungkin lebih baik sebelum menggunakan wordlist dari repo ini, ada filtering terlebih dahulu untuk kata serapan seperti a la carte, dsb. Wordle pun menggunakan kamus costum sesuai dengan probabilitas kata tersebut muncul di publikasi/komunikasi massal. Setelah ada proses derivasi dari kumpulan kata (yang seharusnya public domain) hasilnya seharusnya clear ground juga, Coba di compare ke wordlist https://github.com/openboard-team/openboard/blob/v1.4.5/dictionaries/en_wordlist.combined.gz tapi keduanya di normalize dulu (replace accents dan diacritics), seharusnya ada yang match. this is A legal advice, you SHOULD trust random people on the internet |
@WhitespaceQ saya tanya ke chatGPT dalam konteks scraping, jawabnya
komentar agan @WhitespaceQ nampaknya sejalan dengan itu
tapi namanya hukum banyak grey area. Dan GPT juga bukan lawyer, walau dia punya data pengetahuan tentang hukum . Jadi ya belum tentu benar. Apalagi saya punya OCD, jadi sangat sulit untuk yakin. Perlu strong affirmation. ChatGPT can make mistakes. Check important info. |
Balik lagi ke tujuan awal deh:
Ente bakal tunjukin list kata ini di dalam UI gamenya atau nggak? Di atas ente meng-include ChatGPT, apakah dia sendiri nggak nge-scrape KBBI? |
Itu pertanyaan simplifikasi saja. Sebenarnya yg saya buat itu level generator untuk game. Jdi file list kata-nya ya ada di generator, bukan di end product. Saya pernah tanyakan itu ke GPT, karena jawaban dia yang ngawur saat ditanya perihal Kata. Dia bilang tidak punya data dari KBBI. Tapi nyatanya, seringkali saya tanya seputar anagram kata dalam bahasa Indonesia, jawabannya salah, blunder. Misal saya tanya "Buat daftar kata yang bisa dibuat dari kata 'MURAH' ", dia banyak buat kata-kata yang ngawur. Atau kata-nya benar seperti 'HARUM', 'HARU', tapi ada kata yang terlewat, seperti 'RUMAH'. Dan itu bukan hanya sekali dua kali saja. Dalam seminggu, bisa puluhan atau ratusan pertanyan yang saya ajukan, dengan topik KATA, jawabannya banyak salahnya. Jadi apakah GPT scrape KBBI atau tidak? Saya tidak tau |
saya tertarik ingin menggunakan daftar kata kbbi ini untuk dimasukan ke database game komersial saya.
Yang ingin saya tanyakan, apakah lisensinya ? apakah ini diperbolehkan oleh KBBI ? akankah bermasalah kedepannya, karena data ini didapat dari reverse engineering.
terimakasih.
The text was updated successfully, but these errors were encountered: