Google, yapay zeka aracıyla görsel içerik oluşturmada yeni bir dönem başlatmaya hazırlanıyor. Teknoloji devi, metin yerine görsel ile komut alan yeni görüntü oluşturma aracı olan Whisk’i tanıttı. Kullanıcılar birden fazla görseli yükleyebilir ve yapay zekaya hayal ettiklerini anlatmak yerine gösterebilecek.
Google Whisk nedir, nasıl kullanılır?
Whisk’e yüklenen görsel komutlar; oluşturulan çıktının konusunu, ortamını ve genel tarzını belirleyecek. Daha fazla ayrıntı için metin ayrıntısı eklenebilse de, Whisk’in temel işlevselliği görselin gücüne dayanacak.
Imagen 3 ile desteklenen Whisk, gerçek dünya öğelerinin ve sinematik öğelerin anlaşılmasını sağlayarak gerçekçi görüntüler vadediyor. Google, Whisk’i “hızlı görsel beyin fırtınası” aracı olarak tanımlıyor ve sonuçların daha fazla iyileştirme gerektirebileceğini de kabul ediyor.
Tabii kullanıcıların görüntü çıktılarını değiştirebileceğini belirtmek lazım. Buna ek olarak Google, yeni nesil video oluşturma modeli Veo 2’yi de tanıttı. Şirket, Veo 2’nin yapabildiklerinin yalnızca içerik üretimiyle sınırlı olmadığını, gerçek zamanlı analiz ve öneri sistemleriyle birleştiğini de vurguluyor.
Örneğin model, uzun bir videoyu birkaç saniye içinde analiz ederek izleyici için en ilgi çekici sahneleri öne çıkarabiliyor. Ayrıca, çok dilli altyazı ve seslendirme özellikleriyle küresel çapta içeriklerin kolayca erişilebilir hale gelmesinin de yolunu açıyor.
Whisk’in görüntü oluşturmaya öncülük ettiği ve Veo 2’nin video oluşturmanın sınırlarını zorladığı düşünülürse, Google’ın yapay zeka destekli görsel oluşturmada yeni bir sayfa açtığını söyleyebiliriz.