Anasayfa
Haberler
Alakalı Konular
- Ses

OpenAI, 15 saniyede ses klonlayabilen yapay zeka modelini tanıttı

Berke tarafından

Mart 30, 2024 0 kez okundu Okuma süresi: 1dk, 44sn

Şirkete nazaran, Voice Engine lisanslı ses kayıtları ve halka açık bilgi tabanları ile eğitildi. Dolayısı ile rastgele bir telif hakkı sorunu yok. OpenAI, kötüye kullanım tehlikeleri nedeniyle bu teknolojiyi şu anda geniş çapta kullanıma sunmayı mutlaka düşünmüyor.

OpenAI’ın kaleme aldığı blog yazısında bu teknolojinin ne için geliştirildiği hakkında bilgilere yer verilmiş. Bunlar ortasında görme engelli yahut okuma zahmeti çeken şahıslara okuma yardımı sağlamak, farklı lisanları konuşan şahıslar için çeviri ve dublaj yapmak, konuşma zorluğu olanlara yardımcı olmak, içerik üreticilerine yeni araçlar sunmak, lisan edinimi ve konuşma terapisi üzere alanlarda yeni araştırma imkanları oluşturmak bulunuyor.

Voice Engine nasıl çalışıyor?

Voice Engine, bir kaydı 15 saniye boyunca dinledikten sonra ses tonu ve öbür ses özelliklerini tahlil ederek orjinal sese hayli benzeyen sentetik bir ses üretiyor. Yapay zeka modelinin genel kullanıma açılmaması da zati sentetik sesin özgününe çok yakın olduğunu gösteriyor.

Voice Engine’in potansiyel tehlikeleri epey korkutucu. Ses taklidi yoluyla dolandırıcılık, kimlik hırsızlığı, yanlış bilgi, dezenformasyon yahut deepfake görüntüler oluşturma üzere riskler mevcut. OpenAI, bu tasaları ele almak için çalıştığını ve Voice Engine’i halka açık hale getirmeden evvel “yetkililer ve uzmanlarla” görüşmeyi planladığını belirtiyor.

Voice Engine’in geliştirilmesi, etik ve yasal açıdan da değerli soruları gündeme getiriyor. Bu cins güçlü yapay zeka modellerinin nasıl denetim edileceği ve berbata kullanımdan nasıl korunacağı, önümüzdeki yıllarda ele alınması gereken kıymetli bir mevzu olacak. OpenAI’ın blog sayfasında klonlanan seslerle ilgili örnekleri dinleyebilirsiniz.

Görüntülenme: 0

Reaksiyon Göster