Üretken yapay zeka; metin, görsel, ses, video ya da kod gibi yeni içerikler üreten—salt var olan verileri sınıflandırmak veya tahmin etmekle kalmayan—yapay zeka modelleri sınıfını ifade eder. Eğitim verisindeki kalıpları ve yapıyı öğrenir ve bu bilgiyi bir isteme karşılık özgün çıktılar üretmek için kullanır. Terim, sohbet botlarının arkasındaki dönüştürücü tabanlı büyük dil modellerinden metinden görüle sistemlere güç veren difüzyon modellerine kadar geniş bir teknik ailesini kapsar.
Üretken yapay zeka nasıl çalışır
Yüksek düzeyde bakıldığında, üretken bir model büyük bir örnek derlemi üzerinde eğitilir—metin için kitaplar ve kod, görme için açıklamalı görseller, konuşma için ses transkriptleri ve dalga biçimleri—ve girdileri çıktılara bağlayan istatistiksel kalıpları öğrenir. Eğitim sırasında model, içsel parametrelerini tahminlerinin gerçeklikle eşleşmesi için sürekli olarak ayarlar; bu süreç milyarlarca örnek ve muazzam bir hesaplama gücü gerektirebilir. Eğitim tamamlandığında model bir istemle sorgulanır ve yeni bir çıktıyı parça parça üretir: büyük bir dil modeli, kendisinden önce gelen her şeye koşullu olarak bir sonraki token'ı (kabaca sözcük ya da sözcük parçası) tahmin ederken, difüzyon modeli bir metin açıklamasının rehberliğinde rastgele gürültüyü adım adım tutarlı bir görüntüye dönüştürür.
Örneğin, "Tokyo'da sabah trafiği hakkında bir haiku" istemi verildiğinde bir metin modeli olası bir ilk sözcüğü örnekleyecek, ardından bir sonraki seçimini zaten ürettiği sözcüklere koşullayacak ve şiir tamamlanana kadar bu şekilde devam edecektir. Sonuç bir veritabanından alınmaz; öğrenilmiş kalıplardan anında hesaplanır; bu nedenle aynı istemin iki farklı çalıştırması farklı ama bir o kadar da makul çıktılar üretebilir.
Neden önemli
Üretken yapay zeka, bireylerin ve kuruluşların içerik üretme, iletişim kurma ve çalışma biçimlerini yeniden şekillendiriyor. E-postaların taslaklarını hazırlar, belgeleri özetler, kod yazar ve açıklar, ürün mockup'ları tasarlar, müzik besteler ve moleküller ile protein yapıları önererek bilimsel araştırmayı hızlandırır. Tek bir modelin doğal dilde ifade edilen birçok görevi üstlenebilmesi, ilk taslakların üretim maliyetini düşürür ve sofistike yardımı uzman olmayan kişilerin de erişimine açar. Aynı zamanda, üreticilik, telif hakkı, halüsinasyon, önyargı ve büyük eğitim çalışmalarının enerji ayak izi gibi zorlu soruları da gündeme getirir; bunların tümü artık geliştiriciler, düzenleyiciler ve son kullanıcılar için merkezi kaygı alanlarıdır.
Üretken modellerin temel türleri
- Büyük dil modelleri (LLM'ler) — GPT, Claude ve Llama ailelerindeki gibi, metin üreten ve giderek artan biçimde görsel ve ses yorumlayan dönüştürücü tabanlı modeller.
- Difüzyon modelleri — Stable Diffusion, DALL·E ve Imagen dahil olmak üzere modern metinden görüntüye ve metinden videoya sistemlerin çoğunun arkasındaki mimari.
- Üretken çekişmeli ağlar (GAN'lar) — bir üreticinin ve ayrıştırıcının birbirine karşı eğitildiği, görüntü sentezi ve stil aktarımında yaygın biçimde kullanılan eski ama hâlâ etkili bir yaklaşım.
- Ses ve kod için otoregresif ve dönüştürücü varyantları — Codex tarzı sistemler ve müzik üretim modelleri gibi konuşma, müzik ya da kaynak kodu token token üreten modeller.
Kısacası, üretken yapay zeka tek bir üründen çok yeni bir yazılım geliştirme biçimidir: geliştiriciler açık kurallar kodlamak yerine eğitilmiş bir modele istem verir ve çıktısını yönlendirir. Temel modeller daha yetenekli hâle geldikçe ve insan niyetiyle daha iyi hizalandıkça, etki alanları neredeyse her yaratıcı ve bilgi işi alanında genişlemeye devam ediyor.