OpenAI, eğitim datalarında YouTube’u kullandıysa başı ağrıyabilir
YouTube’un CEO’su Neal Mohan, OpenAI’ın Sora’nın eğitiminde YouTube görüntülerini kullanıp kullanmadığı konusunda ilk elden bilgisi olmadığını söylüyor. Bununla birlikte şayet bu türlü bir durum varsa, bunun YouTube’un kullanım şartlarının “açık bir ihlali” olacağını da söz ediyor.
Bu telaffuzlar aslında geçtiğimiz ay OpenAI Baş Teknoloji Sorumlusu Mira Murati’nin bir röportajına atıf olarak algılanabilir. CTO Mira Murati, kendisine yöneltilen soruya Sora’nın YouTube görüntüleri üzerinde eğitilip eğitilmediğinden emin olmadığı cevabını vermişti. Tıpkı söylemi Facebook ve Instagram için de kullanmıştı. OpenAI’ın en üst teknoloji sorumlusunun eğitim dataları hakkında emin olmaması ise o periyot tartışmalara neden olmuştu.
OpenAI, ChatGPT ve DALL-E üzere tanınan yapay zeka modellerini eğitmek için hangi gereçleri kullandığı konusunda bir müddettir net davranmıyor. Sora ve öbür üretken yapay zeka araçları, web’deki her türlü ulaşılabilir içerik üzerinde eğitiliyor. Tüm yapay zeka şirketleri mümkün olduğunca çok bilgi üzerinde modellerini eğitmek istiyorlar. Lakin çabucak hemen tüm yapay zeka şirketleri ve teşebbüsleri, eğitim bilgilerinde “kamuya açık yahut lisansı içerikleri kullandık” telaffuzunu kullanıyor. Takdir edersiniz ki bu, çok geniş bir tabir.