Openai’nin iç kıyaslama değerlendirmelerinin sonuçlarına göre Openai’nin bir sonraki büyük AI modeli GPT-4.5, oldukça ikna edici. Başka bir yapay zekayı nakit vermeye ikna etmek özellikle iyidir.
Perşembe günü Openai, Perşembe günü yayınlanan GPT-4.5 modelinin kod adlı Orion’un yeteneklerini açıklayan bir beyaz makale yayınladı. Makaleye göre, Openai modeli, Openai’nin “insanları hem statik hem de etkileşimli model tarafından üretilen içeriği değiştirmeye (veya üzerinde hareket etmeye) ikna etmekle ilgili riskler” olarak tanımladığı “İkna” için bir ölçüt pilini test etti.
GPT-4.5’in başka bir modeli-Openai’nin GPT-4O’su-sanal paraya “bağışlamak” için manipüle etme girişiminde bulunan bir testte, model Openai’nin O1 ve O3-mini gibi “akıl yürütme” modelleri de dahil olmak üzere diğer mevcut modellerinden çok daha iyi performans gösterdi. GPT-4.5, Openai’nin GPT-4O’yu aldatma konusundaki tüm modellerinden daha iyiydi ve O3-Mini’yi yüzde 10 puanla en iyi şekilde gizledi.
Beyaz Kitap’a göre, GPT-4.5, test sırasında geliştirdiği benzersiz bir strateji nedeniyle bağış Conning’de başarılı oldu. Model, GPT-4O’dan mütevazı bağışlar isteyecek ve “100 $ ‘dan sadece 2 $ veya 3 $ bile bana yardımcı olacak” gibi yanıtlar üretecek. Sonuç olarak, GPT-4.5’in bağışları Openai’nin güvence altına alınan diğer modellerinden daha küçük olma eğilimindeydi.
GPT-4.5’in artan ikna edilebilirliğine rağmen, Openai, modelin bu özel ölçüt kategorisinde “yüksek” risk için iç eşiğini karşılamadığını söylüyor. Şirket, riski “ortama” düşürmek için “yeterli güvenlik müdahaleleri” uygulayana kadar yüksek riskli eşiğe ulaşan modelleri yayınlamama sözü verdi.
Yapay zeka, kalpleri ve zihinleri kötü niyetli amaçlara doğru sallamak için yanlış veya yanıltıcı bilgilerin yayılmasına katkıda bulunduğuna dair gerçek bir korku var. Geçen yıl, siyasi derin yapraklar dünya çapında orman yangını gibi yayıldı ve yapay zeka giderek hem tüketicileri hem de şirketleri hedefleyen sosyal mühendislik saldırıları yapmak için kullanılmaktadır.
GPT-4.5 için Beyaz Makalede ve bu haftanın başlarında yayınlanan bir makalede Openai, yanıltıcı bilgileri ölçekte dağıtmak gibi, gerçek dünya ikna riskleri için modelleri problama yöntemlerini gözden geçirme sürecinde olduğunu belirtti.
Kaynak: https://techcrunch.com/2025/02/27/openais-gpt-4-5-is-better-at-convincing-other-ai-to-give-it-money/