OpenAI, 15 saniyelik konuşma kaydını temel alarak ses klonlama yapabilen bir AI modeli geliştirdiğini duyurdu. Şirket, Voice Engine adlı bu teknolojiyi halka açmadan önce yetkililer ve uzmanlarla danışacak.
OpenAI, ses kopyalama konusunda çığır açabilecek bir yapay zeka modeli olan Voice Engine’i tanıttı. İki yıllık geliştirme sürecinin ürünü olan bu model, sadece 15 saniyelik bir ses kaydını dinleyerek herhangi bir sesi klonlayabiliyor. Bu gerçekten de ürkütücü bir ilerleme.
Şirkete göre, Voice Engine lisanslı ses kayıtları ve halka açık veri tabanları ile eğitildiği için herhangi bir telif hakkı sorunu bulunmuyor. OpenAI, kötüye kullanım tehlikeleri nedeniyle bu teknolojiyi şu anda geniş çapta kullanıma sunmayı kesinlikle düşünmüyor.
OpenAI’ın kaleme aldığı blog yazısında bu teknolojinin ne için geliştirildiği hakkında bilgilere yer verilmiş. Bunlar arasında görme engelli veya okuma güçlüğü çeken kişilere okuma yardımı sağlamak, farklı dilleri konuşan kişiler için çeviri ve dublaj yapmak, konuşma zorluğu olanlara yardımcı olmak, içerik üreticilerine yeni araçlar sunmak, dil edinimi ve konuşma terapisi gibi alanlarda yeni araştırma imkanları oluşturmak bulunuyor.
Voice Engine Nasıl Çalışıyor?
Voice Engine, bir kaydı 15 saniye boyunca dinledikten sonra ses tonu ve diğer ses özelliklerini analiz ederek orijinal sese oldukça benzeyen sentetik bir ses üretiyor. Yapay zeka modelinin genel kullanıma açılmaması da zaten sentetik sesin orijinaline çok yakın olduğunu gösteriyor.
Voice Engine’in potansiyel tehlikeleri oldukça korkutucu. Ses taklidi yoluyla dolandırıcılık, kimlik hırsızlığı, yanlış bilgi, dezenformasyon veya deepfake videolar oluşturma gibi riskler mevcut. OpenAI, bu endişeleri ele almak için çalıştığını ve Voice Engine’i halka açık hale getirmeden önce “yetkililer ve uzmanlarla” görüşmeyi planladığını belirtiyor.
Voice Engine’in geliştirilmesi, etik ve yasal açıdan da önemli soruları gündeme getiriyor. Bu tür güçlü yapay zeka modellerinin nasıl kontrol edileceği ve kötüye kullanımdan nasıl korunacağı, önümüzdeki yıllarda ele alınması gereken önemli bir konu olacak. OpenAI’ın blog sayfasında klonlanan seslerle ilgili örnekleri dinleyebilirsiniz.