Skip to content

Kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılan uygulamadır.

License

Notifications You must be signed in to change notification settings

elifftosunn/textDataClean

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Text Data Cleaning Application

Veri Temizleme aracı herhangi bir formatta(csv, xlsx, json) veriyi yükleyip daha sonra temiz verinin indirilmesi, her kirli veri çekildiğinde ön işleme adımlarına gerek kalmadan model eğitimi için hazır hale getirmek amacıyla yapılmıştır. Veri temizleme aracının üzerinde aynı zamanda NLP aşamları için bilgilendirme ve uygulama kısımları bulunmaktadır.

Text veri temizleme uygulamaları, veri ön işleme aşamasında kullanılan bir tekniktir. Amacı, metin verilerinde yer alan gereksiz ya da istenmeyen karakterleri, kelimeleri ve sembolleri kaldırmak ya da değiştirmektir. Bu işlem, doğru ve güvenilir sonuçlar elde etmek için gereklidir.

Metin verileri, çeşitli kaynaklardan toplanabilir ve bu verilerin temizlenmemiş olması, analiz sürecinde yanlış sonuçlara ve yanıltıcı yorumlara neden olabilir. Metin veri temizleme işlemi, veri içindeki gereksiz karakterleri, sayıları, sembolleri, html etiketlerini, yazım hatalarını, stop-word'leri ve diğer dilbilgisi unsurlarını kaldırarak veri setinin analiz edilebilir hale gelmesini sağlar.

Özetle, text veri temizleme uygulamaları, doğru sonuçlar elde etmek ve daha güvenilir yorumlar yapmak için önemli bir adımdır. Bu uygulamalar, makine öğrenimi, doğal dil işleme ve diğer veri analizi tekniklerinin başarısını arttırmak için kullanılır.

streamlit-dataClean-2022-12-04-00-12-96.online-video-cutter.com.mp4

Packages

No packages published