Skip to content

mfakca/turkish-word2vec

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

turkish-word2vec

Wikipedia veri seti ile Türkçe Word2vec model eğitimi.

1-) https://dumps.wikimedia.org/trwiki/ adresinden istediğiniz sürümü seçip, indirmeniz gerekmektedir.

2-) İndirdiğiniz arşivin içerisindeki xml dosyasını main.py ile temizleyip .txt formatına çevirebilirsiniz.

3-) word2vec_train.py ile .txt formatındaki dosyayı kullanarak word2vec eğitebilirsiniz.

4-) w2v_load_model.py ile eğitmiş olduğunuz model üzerinden en yakın kelimeleri inceleyebilirsiniz.

Eğitmiş olduğum modelin örnek çıktıları:

kral
geliyor
araba
uçak
baris
bilişim

Referanslar:

About

Turkish word2vec trained with Wikipedia dataset

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages