OpenAI yapay zekaya (AI) ve insanlığa fayda sağlayan makine öğrenimi ilerlemelerine odaklanan bir şirket konumunda. Son zamanlarda firma, 70.000 saatten fazla oyun videosu kullanarak bir botu Minecraft oynamak için başarıyla eğittiğini duyurdu. Başarı, oyun oynayan bir bottan çok daha fazlasını, gözlem ve taklit temelli makine öğreniminde ileriye doğru atılmış büyük bir adıma işaret ediyor.
Yapay zeka eğitimi için önemli gelişme
OpenAI’ın geliştirmiş olduğu botu, taklit edilmiş öğrenme ya da denetimli öğrenmenin mükemmele yakın bir örneği konumunda. Hedefe ulaşıldığında ödüllendirme vadeden pekiştirmeleri öğrenmenin aksine taklit edilmiş öğrenme, insanların belirli görevleri yerine getirmesini izleyerek gerçekleştiriliyor. Bu iki öğrenme taktiği biz insanlar için de geçerli. Bu durumda OpenAI, botlarına, tipik bir oyuncunun başarması için yaklaşık 24.000 bireysel eylem gerektirecek karmaşık oyun içi hamleleri öğretmek için mevcut oyun videolarından ve eğitimlerinden yararlandı.
OpenAI ise yukarıda bahsettiğimiz manuel veri etiketleme işlemleriyle uğraşmak yerine mevcut etiketli videoların sayısını artırmak için Video Ön Eğitimi (VPT) olarak bilinen özel bir yaklaşım kullandı. Başlangıçta 2000 saatlik açıklamalı Minecraft oynanışıyla sistem eğitildi. Ardından bu işlemde elde edilen veriler 70.000 saatlik daha önce etiketlenmemiş Minecraft içeriğini etiketlemek için kullanıldı. Dolayısıyla bu işlem sonucunda Minecraft botuna incelemesi ve taklit etmesi için çok daha büyük bir veri kümesi sağladı.