Büyük İş Modelleri (LAM'ler), geleneksel modellere kıyasla yapay zeka dünyasında devrim yaratıyor.
Üretken yapay zeka destekli sohbet robotlarının ortaya çıkışı, kullanıcı sorgularına dayalı anlamlı yanıtlar üretmek için doğal dili analiz eden ve anlayan gelişmiş bir yapay zeka teknolojisi olan "büyük dil modeli" (LLM) kavramının ortaya çıkmasına neden oldu. Büyük dil modelleri, tutarlı, insan benzeri içerikler üretebiliyor ve bu da yapay zekanın kendi kendine "düşünme" yeteneğine sahip olduğu izlenimini veriyor.
Ancak yapay zekânın gelişimine katkıda bulunan tek teknoloji dil modelleri değildir; Bir sonraki adım Büyük İşletme Modelleri (LAM) olabilir. Bu modeller, otomasyon ve iş yönetimi gibi alanları dönüştürme potansiyeline sahip olup, pratik bağlamlarda analitik ve karar alma yeteneklerinin artırılmasına odaklanmaktadır. Bu yazıda, hem LLM'lerin hem de LAM'lerin nasıl çalıştığını ve yapay zeka uygulamalarını iyileştirme ve kapsamını genişletmedeki artan etkilerini öğreneceğiz.

Büyük İşletme Modeli (LAM) Nedir?
Büyük Eylem Modeli (LAM), insan girdisini anlayabilen ve karşılık gelen eylemi gerçekleştirebilen, dünyayla insan benzeri bir şekilde etkileşime girebilen bir yapay zeka modelidir. Bu, yalnızca yanıt üretmeye odaklanan yapay zeka modellerinden biraz farklı bir yaklaşımdır. “Büyük iş modeli” terimi ilk kez Rabbit R1'in geliştiricisi Rabbit Inc tarafından tanıtıldı. Şirketin Rabbit R1 lansman videosunda, LAM'in yapay zekayı kelimelerden eyleme geçirmeye yardımcı olan yeni bir temel model olduğu belirtiliyor.
LAM'ler, geniş kullanıcı eylem verileri kümeleri üzerinde eğitilir; Dolayısıyla insan eylemlerini taklit ederek veya göstererek öğrenirler. LAM modeli, demo aracılığıyla farklı web sitelerinin veya mobil uygulamaların kullanıcı arayüzlerini anlayabilir ve bu arayüzlerde gezinebilir ve talimatlarınıza göre belirli eylemleri gerçekleştirebilir. Buna göre tavşanLAM, arayüz biraz değiştirilse bile bunu başarabilir.
LAM'leri LLM'lerin mevcut yeteneklerinin bir uzantısı olarak düşünebilirsiniz. Hukuk alanındaki yüksek lisans (LLM) programlarındaki üretken metin veya medya çıktıları, bir sonraki kelimeyi veya simgeyi tahmin ederek kullanıcı girdisine dayanırken (siz bir soru sorarsınız ve LLM modeli metin veya medya çıktıları sağlar), LAM'ler bunu daha da ileri götürerek sizin adınıza karmaşık eylemler gerçekleştirme yeteneği ekler.
LAM'ler ne yapabilir?
LAM'ler sizin adınıza karmaşık eylemler gerçekleştirmekle ilgilidir. Ancak dikkat edilmesi gereken en önemli nokta karmaşık prosedürleri gerçekleştirebilme yeteneğidir. Bu, LAM'leri gelişmiş görevler için daha kullanışlı hale getirir ancak bu, daha basit prosedürleri gerçekleştiremeyecekleri anlamına gelmez.
Teorik olarak bu, örneğin LAM modelinden yerel kafenizden kahve sipariş etmek veya Uber yolculuğu yapmak gibi sizin adınıza bir şeyler yapmasını isteyebileceğiniz ve hatta otel rezervasyonu yaptırabileceğiniz anlamına gelir. Dolayısıyla Google Asistan, Siri veya Alexa'dan TV'yi veya oturma odası ışıklarını açmasını istemek gibi basit görevleri gerçekleştirmekten farklıdır.
Rabbit Inc. tarafından paylaşılan vizyona göre, LAM modelinin perde arkasında, Uber gibi ilgili bir web sitesine veya uygulamaya erişilebiliyor ve arayüzünde gezinilerek bir yolculuk talebinde bulunulması veya fikrin değişmesi durumunda yolculuğun iptal edilmesi gibi bir eylem gerçekleştirilebiliyor.
LAM'ler LLM'lerden daha iyi performans gösterecek ancak henüz hazır değiller
LAM kavramı belki de LLM'lerden daha heyecan vericidir. Büyük Eylem Modelleri (LAM'ler), üretken yapay zekadan sonraki gelecek olacak ve sıradan görevleri yerine getirebilmemizi ve diğer tatmin edici faaliyetlere odaklanabilmemizi sağlayacak. Ancak her ne kadar heyecan verici görünse de LAM'ler henüz hazır değil.
LAM'den yararlanmayı vaat eden ilk ticari ürün (Tavşan r1), kullanıcıları adına eylemler gerçekleştirmeye yönelik pazarlama vaadini tam olarak yerine getirmedi. Cihaz, temel satış noktasında o kadar kötü bir şekilde başarısız oldu ki, birçok ilk elden inceleme, onu oldukça işe yaramaz olarak nitelendirdi.
Daha da kötüsü, YouTuber Coffeezilla'nın Rabbit r1 tabanının bir kısmına erişimi olan seçilmiş bir grup yazılım mühendisiyle işbirliği içinde yaptığı bir araştırma, Rabbit'in eylemleri yürütmek için LAM yerine Playwright komut dosyalarını kullandığını ortaya çıkardı. Yani, benzersiz bir yapay zeka modeli çalıştıran bir makine yerine, aslında yalnızca bir dizi If > Then ifadesini çalıştırıyordu; Vaat edilen LAM modelinden çok uzak.
Rabbit r1'den öğrenebileceğiniz bir şey varsa o da vizyonun orada olduğudur. Ancak uygulamaya geçmeden önce yapılması gereken çalışmalar var, o yüzden hemen heyecanlanmayın.
Yoruma kapalı.