ChatGPT ve Google Bard gibi Büyük Dil Modelleri (LLM’ler) şunları sağlayabilir: bazı belirli soru türlerine iyi cevaplar, ancak bu bilgisayarlar ironik bir şekilde bilgi işlem işlerinde oldukça kötü. Google’ın matematik gibi basit görevleri doğru şekilde yapması için dil modellerini elde etmeye çalışan yeni bir çözümü var: AI’nın bir program yazmasını sağlayın. Google, artık Bard’a matematik veya dize manipülasyonu gibi “hesaplamalı” bir görev sorduğunuzda, dil modelinin çıktısını göstermek yerine, o dil modelinin bunun yerine bir program yazacağını, bu programı çalıştıracağını ve ardından o programın çıktısını göstereceğini söylüyor. Kullanıcıya bir cevap olarak.
Google’ın blog gönderisi, “‘Lollipop’ kelimesini benim için tersine çevir” örneğini sağlar. ChatGPT bu soruyu boşveriyor ve yanlış “pillopoL” yanıtını veriyor, çünkü dil modelleri dünyayı kelime yığınları veya “belirteçler” olarak görüyor ve bu konuda iyi değiller. İşte Bard’ın örnek çıktısı:
Çıktıyı “popilloL” olarak düzeltir, ancak daha ilginç olanı, aynı zamanda piton kodunu içerir sorusuna cevap yazdı. Bu, programlama zekasına sahip insanlar için kaputun altını görmek için harika, ama vay canına, bu muhtemelen şimdiye kadarki en korkunç çıktı. Normaller. Ayrıca özellikle alakalı değil mi? E-postayı getirmesini istediğinizde Gmail’in size bir kod bloğu gösterdiğini hayal edin. Bu garip. Sadece senden istenen işi yap, Bard.
Google, program yazan bir AI modelini, farklı bir düşünme biçimi olması bakımından, uzun bölme işlemi yapan insanlara benzetiyor:
Bu yaklaşım, özellikle Daniel Kahneman’ın “Düşünme, Hızlı ve Yavaş” adlı kitabında ele alınan, insan zekasında iyi çalışılmış bir ikilemden – “Sistem 1” ve “Sistem 2” düşüncesinin ayrılmasından ilham alır.
- Sistem 1 düşüncesi hızlı, sezgisel ve zahmetsizdir. Bir caz müzisyeni oracıkta doğaçlama yaptığında ya da bir dokunmatik daktilocu bir kelime hakkında düşünüp ekranda belirdiğini izlediğinde, 1. Sistem düşüncesini kullanıyorlar.
- 2. Sistem düşüncesi, aksine, yavaş, kasıtlı ve zahmetlidir. Uzun bölme çalışmaları yaparken veya bir enstrüman çalmayı öğrenirken, 2. Sistem’i kullanıyorsunuz.
Bu benzetmede, LLM’lerin tamamen Sistem 1 altında çalıştığı düşünülebilir – hızlı ama derinlemesine düşünmeden metin üretir. Bu, bazı inanılmaz yeteneklere yol açar, ancak bazı şaşırtıcı şekillerde yetersiz kalabilir. (Yalnızca Sistem 1’i kullanarak bir matematik problemini çözmeye çalıştığınızı hayal edin: Durup aritmetik yapamazsınız, yalnızca aklınıza gelen ilk yanıtı söylemeniz gerekir.) Geleneksel hesaplama, Sistem 2’nin düşüncesiyle yakından uyumludur: Formüle dayalıdır ve esnek değildir, ancak doğru adım sırası, uzun bölme çözümleri gibi etkileyici sonuçlar üretebilir.
Google, bu “anında kod yazma” yönteminin “15683615’in asal çarpanları nelerdir?” gibi sorular için de kullanılacağını söylüyor. ve “Birikimlerimin büyüme oranını hesapla.” Şirket, “Şimdiye kadar, bu yöntemin Bard’ın dahili sorgulama veri kümelerimizdeki hesaplama tabanlı kelime ve matematik problemlerine verdiği yanıtların doğruluğunu yaklaşık %30 oranında iyileştirdiğini gördük” diyor. Her zamanki gibi Google, Bard’ı sorunuzu yanlış yorumladığı veya hepimiz gibi ilk seferde çalışmayan kod yazdığı için “doğru anlamayabilir” konusunda uyarıyor.
Bard.google.com’da bir şans vermek isterseniz, Bard şu anda cevapları anında kodluyor.