Google’ın DeepMind grubu tarafından geliştirilen bir GenAI imaj modeli olan Google ImageFX, manzaraları oluşturmak ve düzenlemek için istem tabanlı bir kullanıcı arayüzü sunuyor. Bu, OpenAI’nin DALL-E 3, Midjourney, Meta’nın Imagine with Meta AI ve Microsoft Designer üzere araçlarından farklı değil. ImageFX, farklı olarak kullanıcıların yaratım ve fikirlerine yakın boyutlarda denemeler yapmasına imkan tanıyan anahtar söz teklifleri listesi sunuyor.
İnsan gözünün görmediği özel filigran içerecek
Google, ImageFX’in amaçlanmayan biçimlerde kullanılmamasını sağlamak için adımlar atıldığını tez ediyor. Örneğin şiddet içeren, saldırgan ve müstehcen içerik üzere çıktıları sınırlamak için teknik önlemler alındığı belirtildi. ImageFX’in birebir vakitte dünyaca ünlü şahıslar için bilgi istemi seviyesinde bir filtresi var. Ek bir güvenlik tedbiri olarak, Google’ın ImageFX kullanılarak üretilen görselleri, düzenleme ve kırpmaya karşı muhafaza sağlayan dijital filigran olan SynthID ile etiketleniyor. Google, bu filigranın insan gözüyle algılanamayacağını da belirtiyor. Ayrıyeten “Bu görsel hakkında” kısmına eklenen bilgiler sayesinde kullanıcılar Google arama yahut Chrome’da karşılaştıkları bir görselin Google’ın yapay zeka araçlarıyla oluşturulup oluşturulmadığını da anlayabilecek.
Bir yapay zekanın oluşturabileceği en uygun görseller
Imagen 2 modeli, ImageFX’in yeni imaj oluşturma özelliklerini güçlendiriyor. Tıpkı vakitte Bard, Search, Ads, Duet AI in Workspace ve Vertex AI’da yeni üretken AI seçeneklerini destekleyen teknoloji. Google, Imagen 2’nin yapay zeka tarafından oluşturulan şimdiye kadarki en yüksek kalitede görselleri sunmaya yardımcı olduğunu söylüyor. Şirket, modelin imgeleri yapaylıklardan uzak tutmaya yardımcı olduğunu ve bu cins araçların şimdiye kadar uğraştıkları manzara oluşturma alanını güzelleştirdiğini belirtiyor.
Google, MusicFX ve TextFX‘i de geliştirdiğini söylüyor. Şirket, MusicLM modelinde daha süratli müzik üretimi ve daha yüksek kalitede sesin yanı sıra yeni özellikler içeren yükseltmeler yaptığını sav ediyor. Oluşturulan müzikler artık 70 saniyeye kadar sürebiliyor. TextFX’e gelince, Google, gezinmeyi ve genel kullanıcı tecrübesini güzelleştirmek emeliyle güncellemeler yayınladı.
Belli ülkelerde kullanıma açıldı
Bard’daki Gemini Pro, bugünden itibaren daha geniş çapta kullanıma sunulacak. Artık 40’tan fazla lisanda ve 230’un üzerinde kuzey ülkesinde ve bölgede erişilebilir durumda. Ayrıyeten bugünden itibaren Google, birçok ülkedeki insanların Bard’da İngilizce görselleri fiyatsız olarak oluşturabileceğini söylüyor. Bu imgeler SynthID filigranlarını içerecek. Google ImageFX aracı Amerika, Yeni Zelanda, Avustralya ve Kenya’da kullanıma açıldı. Şimdilik sadece İngilizce kulanılabilen araca buradan erişilebiliyor.