Beş Yapay Zekâ Ajanının Portföyümü Yeniden Tasarlamasına İzin Vermek
Portföyümün projeler bölümü sessizce kontrolden çıkmıştı. On altı proje, her biri devasa dekoratif bir numara, dağınık bir açıklama ve uzun bir etiket sırasıyla büyük, üst üste yığılmış bir kart olarak render ediliyordu. Tek tek her kart iyi görünüyordu. Birlikte, bir reklam arasını bekleyen birinin sabrıyla kaydırmanız gereken bir duvar oluşturuyorlardı. Yeniden düşünülmesi gerektiğini biliyordum ve probleme çok uzun süre baktığım için ona dair zevkim kalmadığını da biliyordum. Bu yüzden biraz saçma bir şey yaptım: beş farklı terminal kodlama ajanından bölümü yeniden tasarlamasını istedim, hepsinden aynı anda ve örnekle tartışmalarına izin verdim.
Kurulum
Beşli codex, droid, cline, goose ve kilo idi. Önerme basitti. Her birine aynı brifingi, bölüm hakkında aynı bağlamı ve aynı hedefi — daha kompakt bir projeler düzeni — ver ve her birinin bağımsız olarak ne önerdiğini gör. Mesele bir kazanan taçlandırmak değildi. Mesele, farklı temel modeller ve farklı varsayılan içgüdülerle bağımsız ajanların aynı yere mi varacağını yoksa beş yöne mi dağılacağını görmekti.
Önemsediğim tek kural izolasyondu. Her ajan, gerçek dosyalarıma dokunma yeteneği olmadan, kendi çalışma diziminde, atılacak bir kopyada çalıştı. Beş otonom araca aynı anda gerçek depoya yazma erişimi verip sonradan kimin değişikliğinin kiminkini ezdiğini öğrenecek değildim. İzole dizinler, beş öneriyi yan yana, sakince, gerçek kod dokunulmadan okuyabileceğim anlamına geliyordu. Bir ajan saçmalık üretirse, klasörü siler ve hiçbir şey kaybetmezdim.
Düdükten Önce İki Kayıp
Web geliştirme olduğu gibi olduğundan, deney temiz çalışmadı. Beşin ikisi gerçekten başlayamadı. Biri bir hesap-bakiyesi hatasında öldü; sağlayıcı, birisi ödeme yapana kadar daha fazla iş yapmayı düpedüz reddediyordu. Diğeri GLM-5.1 modelinde bir oturum açma ve kimlik doğrulama boşluğuna takıldı; asla tamamlanmayan bir kimlik doğrulama el sıkışması (handshake), ajanı herhangi bir şey üretmeden önce mahsur bıraktı.
Bunlardan, isim verip utandırmak için değil, bir ajan paneli düzenlemenin dürüst dokusu oldukları için bahsediyorum. Beş temiz sonuç almıyorsunuz. İşe yarayanları ve görevle hiçbir ilgisi olmayan nedenlerle çökenleri alıyorsunuz; faturalandırma ve kimlik doğrulama ve farklı sağlayıcılardan araçları bir araya dikmenin sıradan sürtünmesi. Yıpranmayı planlamak yöntemin bir parçası. Tüm egzersizi tek bir ajana bahse koysaydım, bir yazı tura, hiç başlamayan ikiden birini çektiğimi söylerdi.
Aynı Yere Üç Bağımsız Yol
İşte tüm bu sapmayı değerli kılan kısım. Bitiren üç ajan yakınsadı. Gevşek değil, ruhen değil. Esasen aynı tasarımı önerdiler.
Üçü de bölümü iki katmana ayırdı: birkaç öne çıkan proje için daha büyük gösterilen bir spotlight ve gerisi için daha sıkı bir ızgarada (grid) kompakt bir indeks. Buna featured-plus-compact-grid ya da spotlight artı indeks deyin. Her biri bağımsız olarak devasa dekoratif numaraların gitmesi gerektiğine, anlam katmadan alan yiyip gürültü ekledikleri için karar verdi. Her biri her kartın öngörülebilir bir yükseklikte kalması için açıklamaları satır-kırpmaya (line-clamp) başvurdu. Ve her biri etiket listelerini, her teknolojiyi her karta dökmek yerine birkaç sinyal etikete kırptı.
Bu hamlelerin hiçbiri tek başına şaşırtıcı değil. Herhangi biri, yetkin bir tasarımcının önerebileceği bir şey. Çarpıcı olan, üç ayrı ajanın, izolasyonda, birbirinden habersiz çalışarak aynı kombinasyona varması. Bu, tartışmak isteyeceğim bir tesadüf değildi.
Yakınsama Bir Sinyaldir
Bir ajan bir tasarım önerdiğinde, onu bir görüş olarak, o modelin o gün ne tercih ettiğiyle süzülmüş olarak tartarım. Modellerin varsayılanları vardır ve tek bir öneri kolayca bir karar gibi giydirilmiş bir varsayılan olabilir. Ama üç bağımsız ajan, farklı modellerden yararlanarak, koordine olmadan aynı yapıya vardığında, öneri bir modelin yanlılığı gibi okunmayı bırakır ve problemin bir özelliği gibi okunmaya başlar. Problemin doğal bir şekli var ve birkaç farklı gözlemci onu buldu.
Asıl ders bu ve bir portföy bölümünün çok ötesine genelleşir. Bağımsız ajanlardan oluşan bir paneli düzenlemek ve anlaşmayı izlemek, tek bir modelin çıktısına güvenip haklı olmasını ummaktan temelde daha iyi bir sinyaldir. Aralarındaki anlaşmazlık size gerçek muhakeme kararlarının nerede yaşadığını söyler. Anlaşma size, geriye dönük-bariz cevabın nerede olduğunu, güvenle benimseyebileceğiniz kısmı söyler. Tek bir ajan size hiçbir sinyali vermez. Yalnızca bir cevap verir ve onun ne kadar yük taşıdığını bilmenin bir yolunu vermez.
Gerçekte Ne Gönderdim
Hiçbir ajanın çıktısını olduğu gibi birleştirmedim. Konsensüsü elle, gruplandırılmış, tek tip bir kart düzenine sentezledim; üç ajanın üzerinde anlaştığı paylaşılan iskeleti alıp onu kendi verime ve görsel dilime uydurdum. Devasa numaralar gitti. Açıklamalar tutarlı bir yüksekliğe kırpıldı. Etiketler önemli olana kırpıldı. Öne çıkan iş üstte nefes alacak alana sahip ve gerisi, on altı kartlık bir kaydırma kâbusu yerine aşağıda sakin, eşit bir ızgarada oturuyor.
Bölüm daha kısa, daha taranabilir ve açıkçası biri onun hakkında bir karar vermiş gibi görünüyor çünkü nihayet biri verdi. Ajanlar onu benim için tasarlamaktan çok, kendi başıma göremediğim cevabı üçgenledi (triangulate). Yine de son kararı ben verdim ve gerçek kodu ben yazdım. Ama panel, açık uçlu bir zevk problemini, açık, iyi desteklenmiş bir cevabı olan bir soruya çevirdi ve bana bir öğleden sonraya ve birkaç başarısız oturum açmaya mal oldu. Bu takası tekrar yaparım.