OpenAI tarafından piyasaya sürülen ChatGPT, yapay zeka alanında rekabeti bir üst düzeye çıkarmayı başardı. Google, Robotics Transformer 2 teknolojisinin (RT-2) cinsinin tek örneği olan vizyon-dil-eylem (VLA) modeli ile eğitildiğini açıkladı. Google Bard gibisi model ile eğitilen RT-2, etrafında ne olup bittiğini algılayabilecek.
VLA temeline dayanan Google Robotics Transformer 2 tanıtıldı
Şirket Cuma günü bir blog gönderisinde, “Yapay zeka sohbet botları Bard, ChatGPT ve Claude 2’ye güç veren sistemler üzere teknolojileri kullanarak robotların vazifeleri süratli ve daha verimli bir formda gerçekleştirebiliyoruz.” tabirlerine yer verdi.
Google DeepMind’ın robotik lideri Vincent Vanhoucke, “RT-2’nin temelinde Google Bard üzere yapay zeka platformlarının ardındaki büyük lisan modellerine misal bir teknoloji bulunuyor. Robot aksiyonlarının direkt çıktısını alabilmek için internette bulunan metin ve imaj datalarını işliyoruz.” dedi.
Vanhoucke, robotların etraflarındaki dünyayı anlamak için yapay zeka kullanmasını sağlamanın sohbet robotlarına girenlerden daha sıkıntı olduğunu söyledi. Yapay zeka sohbet yazılımlarının makul bir mevzu hakkında bir küme metin verisini özümsemesi ve bu bilgileri insanların anlayabileceği formda düzenleyebilmesi gerekirken, robotların sözün tam manasıyla etrafındaki dünyayı anlaması gerekir.
Google, çevrimiçi bulunan manzara bilgilerini kullanan RT-2 ile robotların, çöpün ne olduğunu ve onu nasıl alıp atacağını anlamak için süratli bir biçimde eğitilebileceğini argüman ediyor. Grand View Research’e nazaran, endüstriyel robot sanayisi şu anda 30 milyar dolar pahasında ve 2030’a kadar 60 milyar dolara ulaşması bekleniyor.