Gönderi Fotoğrafı

Yapay Zekâ Eğitirken Yaptığım Hatalar (Ve Belki Senin de Yaptıkların)

Görüntülenme: 77

Yapay zekâya merak sardığımda "bir model eğitirim, veriyi veririm, çalışır zaten" gibi düşünüyordum. Ama işe girince öyle olmadığını anladım. Bu yazıda kendi yaşadığım sıkıntıları, yaptığım hataları ve öğrendiklerimi paylaşmak istiyorum. Belki sen de bu yolda ilerliyorsan bazılarına denk gelmişsindir.

1. Veriyi Küçümsemek

İlk yüz tanıma modelimde 10 kişiden 20'şer fotoğraf topladım, “Yeterli herhalde” dedim. Model saçma sapan sonuçlar verdiğinde, kodu düzeltmeye çalıştım ama aslında sorun veri miktarı ve çeşitliliğindeymiş.
Not: Kaliteli ve çeşitli veri olmadan en iyi modeli bile koysan boşuna.

2. Büyük Model = İyi Sonuç Sanmak

Haber özetleme işinde mT5 modelini kullandım. 700 haberle dev gibi bir modeli eğitmeye çalıştım. Sonuçlar ilk başta etkileyici görünüyordu ama aslında birçok özet anlamlı değildi.
Not: Modelin büyüklüğü değil, veriye ve amaca uygunluğu önemli.

3. Değerlendirmeyi Göz Ardı Etmek

Başta sadece gözle bakıp “bu özet fena değil” diyordum. Ama düzgün bir metrik (ROUGE gibi) kullanmayınca modelin genel performansını anlamıyorsun.
Not: Ölçmediğin şeyi geliştiremezsin.

4. Ayarlarla Oyunu Abartmak

Beam search kullandım, özetler robot gibi oldu. Sampling açtım, bu sefer de saçma sapan cümleler geldi. Sonra fark ettim ki asıl problem modelin neye göre öğrendiği. Yani giriş yapısı düzgün değilse, ne kadar ayar değiştirsen de boşuna.
Not: Ayarlardan önce veriyi ve hedefi iyi tanımlamak lazım.

5. Kodu Kopyalayıp Geçmek

Başlarda Hugging Face örneklerini direkt alıp “tamam çalışıyor” diyordum. Ama neyin ne işe yaradığını anlamayınca, hata verdiğinde kilitlenip kalıyorsun.
Not: Kodun ne yaptığını anlamadan ilerlemek tehlikeli. Ufak başla, sindire sindire öğren.

6. Çıktıları Olduğu Gibi Kabul Etmek

Model bazen çok saçma şeyler yazıyordu. İlk başta model bozuk sanıyordum. Meğer çıktılar üzerinde temizlik yapmadığım için o şekilde görünüyormuş. Ufak bir regex ile her şey toparlandı.
Not: Eğitim kadar çıktı temizliği de önemli. Özellikle metin üreten modellerde.

7. Her Şeyi Aynı Anda Yapmaya Kalkmak

Yüz tanıma projesinde aynı anda model eğitmeye, kamera bağlamaya, GUI yazmaya çalıştım. Sonra her şey birbirine girdi. Ne olduğunu ben bile unuttum.
Not: Parça parça gitmek en sağlıklısı. Önce bir şeyi bitir, sonra diğerine geç.

Kapanış

Bu hataların çoğunu birden fazla kez yaptım. Ama artık neye dikkat etmem gerektiğini daha iyi biliyorum. Yapay zekâ projelerinde “çalıştı” demek, her zaman “doğru çalıştı” demek olmuyor.