Google Araştırma takımlarından Brain Team metinleri resme çeviren yapay zeka modelini duyurdu. Imagen difüzyon modeli olarak adlandırılan yapay zeka, benzeri görülmemiş bir foto gerçekçilik ve derin bir dil anlayışı sunuyor. Google’ın Imagen modeli OpenAI’ın DALL-E modeline benzese de görselleri daha gerçekçi oluşturuyor.
İÇERİK TEHLİKELİ AMAÇLARLA KULLANILABİLİR
Donanımhaber''in haberine göre, Google’ım Imagen modeli şu anlık halka açık olmayacak. Araştırmacılar, metin verileri almak için kullanıldıkları veri tabanlarının internet dilinin kötü yanlarını içerdiğini ve bu nedenle modelin ırkçı söylemler, sosyal stereotipler ve pornografik içerik üretmeye meyilli olabileceğini belirtti. Google, ilerde Imagen platformunda halka açık bir yapı sunabileceklerini belirtti. Bu noktaya kadar Imagen’i çok limitli anlamda kendi sitesinde deneyebilirsiniz.
200''DEN FAZLA METİN DEĞİŞTİRİLDİ
Imagen’in yeteneklerini diğer yapay zeka modellerine karşı ölçmek isteyen araştırmacılar, DrawBench adını verdikleri yeni bir test platformu oluşturdular. Bu test ile 200’den fazla metin yapay zeka modellerine sunuldu ve görsel oluşturmaları istendi. Daha sonra bu görseller, insanlar tarafından puanlandı. DrawBench sonucunda Google’ın Imagen modeli hem görsel açısından hem de metin anlama açısından öne çıktı.