18 Şubat 2008 Pazartesi

Python ve Doğal Dil İşleme

Bu girdiyi uzun zaman önce yazmam gerekiyordu ama işte yoğunluk... Bir yandan özgürlükiçin.com altyapısı diğer yandan dersler derken burası ıssız bir yer oluvermiş. Pardusum'da gezinirken gördüğüm küçük bir script ile bu girdiyi yazma kararı aldım. Okulda bir aralar Doğal Dil İşleme dersi alıyordum ve yazarların ruh hallerini tanıyan birer program yazmamız istendi. Kullanıcıya birtakım html dosyaları veriliyor ve program o yazarın ruh halini söylüyor. Aslında çok zevkli ve zor bir konu. Ben tabii tembelliğimden dolayı yine son akşam ne nasıl yapalım derken oturdum, Python'un NLP (Natural Language Processing) kütüphanesinin dokümanını okumaya başladım. Sonra baktım olmayacak ben yazayım dedim. Kendimce belirlediğim kriterlere göre 1 saatlik süreden sonra ödev hazırdı. (Python sağolsun) Yazar tanıma kriterlerim ise şu şekilde oldu :

-Türkçe'de bulunan bazı ünlem kelimelere ruh hali atandı
-Kullanılan bazı noktalama işaretlerine ruh hali atandı
-Kullanılan bazı html taglarına ruh hali atandı
-Gülücük vs gibi (bunu eklemedim ama bence iyi fikirdi :) )

İşte bu şekilde kendimce birşeyler atadım , sonra tarattğım 10 dosyadan 5,6 doğru belirleniyordu :) Bu şekilde son anda yine bir yusuf yusuf yaratıcılığının sonuçları bunlar... Hoca da diğerlerinden değişik olduğu için beğendi .(Ben, "lan bu ne biçim şey diyecek sanmıştım"). Neyse geçtik Allahtan kodu da buraya koyalım birileri gülücük feature falan ekler :)

İndir

Hiç yorum yok: