Soft Commitment #196 | Türkiye'de bankaların LLM performansı, Agent-led growth, LLM'lerde iyi kullanım örnekleri, dikkatimi çeken ürünler
4 tane Soft Commitment Signals konusu, çok iyi bir 'AI search' araştırma raporu, 15 kısa kısa maddesi, dikkatimi çeken ürünler, daha iyi bir 'AI user' olmanız için ışık tutabilecek örnekler ve dahası.
Visby’nin sunduğu Soft Commitment’ın 196. sayısından herkese merhaba.
‘Kitap nasıl gidiyor?’ dediğinizi duyar gibiyim. Süper, 1100 satışı geçtik, Kitapyurdu’nda Ocak ayının en çok satan 169. kitabı olduk, Teknoloji kategorisinde lideriz, İlgi Görenler altında şu an 4. sıradayız. Pek yakında online ve offline tüm satıcılardayız, Şubat ayı içinde imza günlerimiz olacak, Ankara’ya da geliyoruz! Eğer hala Yapay Zekâ kitabımızı almadıysanız, Kitapyurdu üzerinden hemen sipariş verebilirsiniz. Toplu satış (20+) için bana ulaşabilirsiniz.
Visby’den dev araştırma: Türkiye Bankacılık Sektörü için Yapay Zeka Araçları (LLM) Görünürlük Raporu
Visby’nin adını daha sık duyacağınızı söylemiştim… Aralarında Türkiye’den QNBpay, Kelebek Mobilya ve Brandroom gibi şirketlerin olduğu, çoğunluğu global 40’tan fazla müşteriye sahip olan Hollanda merkezli Visby, AI Search dikeyinde kurumlara uçtan uca analiz ve çözüm sunan bir ürün olarak dikkat çekiyor.
Visby, ‘Türkiye Bankacılık Sektörü Yapay Zeka Arama Görünürlük Endeksi’ isimli, Türkiye’deki bankaların LLM’lerdeki (ChatGPT, Gemini, Claude) görünürlüğünü analiz ettiği raporunu bugün yayınladı.
Genel görünüm, ürün bazında rekabet ve son olarak persona’lar üzerinden deneyime odaklanan raporda ilgi çekici sonuçlar var. 17 sayfalık rapora ulaşmak için tıklayın.
Son olarak OpenAI, ChatGPT’de reklamları test etmeye başlayacağını resmi olarak duyurdu. Ben de AI Search dikeyindeki bu önemli gelişmeyi, Visby’nin kurucu ortağı Berkay Yavuz’a sorduğumda, kendisi şunlar paylaştı: “Open AI’ın bu kararında dikkatli olması, platformun etkileşimini düşürmemesinin şart olduğunu düşünüyorum. OpenAI resmi API’yi yayınladığı an, yapay zekâ modellerinde görünürlüğün bir parçası olacak reklam çözümlerini müşterilerimize ilk ulaştıran ekiplerden biri olacağız.“
Soft Commitment Podcast 🎙️
Şu meşhur Spotify yıl sonu raporunda gördüm ki Soft Commitment Podcast, en çok dinlediği podcast olan 160, ilk 5 podcastten biri olan 600, ilk 10 podcastten biri olan ise 1000 kişi var. Teşekkürler!
Soft Commitment #196’yı, benim sesimle eğitilmiş bir yapay zeka modelinin yaptığı seslendirme ile dinlemek isterseniz:
Rastlamanızın pek de kolay olmadığı konu ve içgörülerle, zihninizde daha sonra birleştirmeniz için çok sayıda nokta koymaya çalışacağım. Son 15 güne Soft Commitment bakışı atmaya hazır mısınız?
Neredeyse dokuz senedir devam eden ve 9.027 teknoloji sektörü çalışanının takip ettiği Soft Commitment’ı iş arkadaşlarınıza forward etmeyi ve paylaşmayı atlamayın.
Keyifli okumalar,
🔮 Soft Commitment Signals
Adına ‘Soft Commitment Signals’ dediğim bu bölümde, AI dünyasında biraz da olsa erken keşfettiğim yenilik ve içgörüleri sizlere aktaracağım. Kısa, hap bilgi şeklinde. ‘Zaten bir hayli hızlı değişen dünyada bunlar ne kadar anlamlı olacak?’ dediğinizi duyar gibiyim; lakin bir okuyun, bence iş yapış şeklinizde ve geleceğe olan hazırlığınızda önemli içgörüler olacak nitelikteler.
SaaS’lar için en yeni dağıtım kanalı: Agent-led growth
Bir önceki Soft Commitment Signals’ın maddelerinden biri de, API dokümantasyonu içinde prompt’lara yer veren bir startup ve yeni Agent Experience kavramı olmuştu.
Sequoia, haftaiçinde daha net bir ifadeyle; PLG kavramının da değiştiğinden ve artık iyi ürün, iyi onboarding veya iyi pazarlama kadar, LLM’lere daha doğrusu agent’lara kendini anlatmanın önemli olduğundan bahsetmiş. Bu yeni ve her geçen gün daha da büyüyen dağıtım kanalında, karar vericiler agent’lar. Üstelik Agent-led growth, önceki dönemlerde olduğu gibi branding dinlemiyor, switching cost gibi bir kaygı yaşamıyor.
Yeni maliyet metriği: token değil ‘turn efficiency’
Latent Space’in son podcast’inde; model seçimindeki tek maliyet metriğinin token fiyatı olmadığı çok güzel anlatılıyor.
Pahalı bir model kullanabilir, ama daha az ‘turda’ istediğiniz sonucu alabilirsiniz. Bu da yeni bir metriği ortaya koyuyor: ‘turn efficiency’.
Özellikle AI agent’ların dahil olduğu akışlarda, maliyet çok daha önemli bir mesele haline gelmeye başladı. Bu durum aynı zamanda model seçiminde hibrit yaklaşımı da getirdi yani akışın bir bölümünü kendi fine-tune ettiğiniz model halletsin, onun verdiği çıktı pahalı modele gitsin, kullanıcının spesifik sorgusuna göre gerekiyorsa da LLM’e hiç gidilmesin…
Yeni bir şirket sınıfı ortaya çıktı: IPO ölçeğinde ama ‘hala private’
20VC’nin son bölümünde ele alınan bu gerçeğin aslında hepimiz farkındaydık ama birilerinin örnekleri toparlaması ve cümleye dökmesi de güzel oldu.
Tüm dünyada yeni yatırım ürünlerine ihtiyaç artıyor, tokenizasyonla beraber halka açık olmayan şirketlerin ‘yatırım yapılabilir olması’ kolaylaşıyor.
Bu da iki tür şirket sınıfı doğmasını destekliyor:
$400m değerlemeye kadar, bir süre daha halka açık olmayacak ama yatırım yapılabilir şirketler.
$400m değerlemenin de üzerinde, istese halka açılabilecek ama kendi isteğiyle açılmayan şirketler. Stripe ve Databricks burada en belirgin örnekler.
Eskiden halka açılmak adeta bir zorunluluk gibiydi, başka seçenek yoktu. Artık var ve erken aşamada olduğu gibi ileri aşamalarda da gerçek bulanıklaşıyor… Peki erken aşamada ne olmuştu derseniz, yatırım paradigması değişmiş; az sayıda şirket yüksek miktar yatırımlar almaya başlamış, VC yatırımlarında hibrit modeller yükselmiş ve de founder’lar karlılığa odaklanmaya başlamıştı.
Ülkemiz içinse; henüz bu döngünün başındayız. Türkiye’de şu an için ihtiyaç; gerçek ve başarılı teknoloji şirketlerinin halka arz olması... Biz önce döngünün burasını tamamlamalıyız.
Kurumsal AI ürünleri, ‘model yüzünden’ başarısız olmuyor
‘Model yetersizliğinin’ abartıldığına zaten sık sık vurgu yapıyordum, denk geldiğim kaynakların da bunu desteklemesi ne yalan söyleyeyim, hoşuma gidiyor.
Lenny’nin son bölümüne konuk olan ve bugüne kadar 50’nin üzerinde kurumsal AI ürününü canlıya alan konuklar; en büyük başarısızlık sebebinin model limitleri değil de scope belirleme, guardrails ve UX gibi konular olduğunu anlatıyor.
AI projeleri, yazılımlardan farklı; çünkü en başta fazlasıyla non-deterministic’ler. Hangi modeli seçtiğiniz, modellerin kapasitesi değil başarının sırrı daha çok şuralarda;
AI’ın non-deterministic oluşu karşısındaki tutumunuzu temelde bir spektrum gibi ele almak akıllıca. Spektrumun bir ucunda sert sınırlar, human-in-the-loop akışlar var. Diğer ucunda ise kontrol tamamen AI’da. Peki spektrumun neresi? Burada da projenin alabileceği riskler, pazar ve şirketin koşulları belirleyici olmalı.
Evals kullanımı gereklilik ama yeterli değil, sürekli izleme, gerçek insanlara ait geri bildirimlerle besleme ve otomatik testler de şart.
Log’lama kritik… Hataları, gecikmeleri, güven skorlarını ve kullanıcı düzeltmelerini log’lamak, buradan anlamlı sonuçlarla modeli ve kurguyu beslemek gerekiyor.
Continuous calibration yani gerçek dünya verisini düzenli gözden geçirmek de atlanmamalı. Versiyonlama ve regression test de öyle.
En çok vurgu yapılan konulardan biri de tabii ki de veri kalitesi.
🩳 Kısalar…
Google; #189’da tanıttığım AP2 (Agent Payment Protocol) sonrası, şimdi de e-ticaret odaklı UCP’sini (Universal Commerce Protocol) tanıttı. Shopify, Etsy ve Target gibi markaların lansman partner’i olduğu protokol, en başta e-ticaret odağı ile bir önceki sayıda bahsettiğim x402’den ayrılıyor. Agent’ların e-ticaretin ödeme adımında her bir merchant ve ödeme çözümü için ayrı bir akıştan geçmesinin önüne geçen Google, müşteri sahipliğini de markada bırakıyor. Protokolün içinde; AP2’dan ‘miras’, kriptografi katmanı ve süreç akışları da neredeyse bire bir mevcut.
Peki UCP, x402’ye rakip mi? Hayır. x402 tamamen mikro-ödemelere ve agent ile websiteleri arasındaki ilişkiye odaklı, bir anlamda A2B. UCP ise agent’ınız ile e-ticaret markaları arasındaki ilişkiye. Hem ilişki ağları hem çıkış noktaları hem de ortalama ödeme tutarları birbirinden bir hayli farklı.
Diğer yandan yine Google’ın agent’ların birbiriyle ilişkisine odaklı protokolü de (AP2) değerini koruyor. Google ekosistem oluşmasına aracılık ediyor ve bunu da önemli partner’lerle beraber yapıyorken OpenAI ise ChatGPT içinde dönen ve dışarıya kapalı işbirliklerine odaklanmış durumda. Bu OpenAI’a deneyimi tamamen kontrol edebilme şansı tanıyor. Google ise ‘standart belirleyici’ bir yerde konumlanıyor.
Anthropic’in Claude Cowork’ü çok konuşuldu, burada tekrar etmeyeceğim, ama şu detayı da yakalamışsınızdır umarım; Claude Cowork tamamen Claude Code ile kodlanmış. Burada asıl paylaşmak istediğim ise; Eligent AI isimli bir startup, bu lansman sonrası ’öldüğünü’ açıkça paylaşarak, tüm code base’i açık kaynak kodlu hale getirdi ve en son baktığımda 2 milyona yakın görüntülenme, 8 bin de star aldı.
Claude Code demişken; yine açık kaynak kodlu bir proje olan CallMe, telefon görüşmeleriyle proje geliştirmenizi sağlıyor. Sizi arıyor ve prompt’unuzu sesle alıyor, geliştirme tamamlandığında ise saatinize bildirim geliyor ve tekrar sesle Claude Code’la konuşmanızı sağlıyor. Kullanılabilirliği ayrı, ‘konunun geldiği yer’ dikkate değer.
Google DeepMind, adeta Google Translate’i lokalinizde, açık kaynak kodlu bir şekilde çalıştırabileceğiniz yeni modelini tanıttı: TranslateGemma. Lokalinizde, yani evet, offline olarak.
Çok değil bir önceki sayıda detaylıca ele aldığım x402 Protocol’ü kullanan bir ürün, bizzat Cloudflare imzalı olarak geldi: Pay per Crawl. Web sitesi sahipleri AI modellerine ücretsiz erişim verebilir ya da her bir tarama için ücret de talep edebilir. Kuruşlar seviyesindeki bu ödemeler için de x402 kullanılıyor. İnternetin yüzde 20-30 kadarını servis eden şirket, içerik sahiplerine AI modellerine izin vermeme seçeneği de sunuyor.
Manus’un Similarweb ile duyurduğu işbirliği dikkat çekiciydi. Similarweb’in artık yeni satış kanalı LLM’ler olmayacak da neresi olacaktı zaten değil mi? İşbirliğiyle Manus üzerinde son 12 ayın Similarweb verilerine anlık olarak ulaşmak artık mümkün.
Wikipedia Foundation, 25. yılında Amazon, Meta, Microsoft ve Perplexity gibi isimlerle yeni yapay zeka ortaklıkları duyurdu. Ortaklık derken; AI modellerini beslemek isteyen kurumlar, Wikipedia Enterprise ürününü kullanacak ve insan emeği ile yaşamaya devam eden platformun sürdürülebilirliğini destek olacak. Tahmin edeceğiniz üzere Elon Musk anlaşmada bir taraf değil. :)
ElevenLabs, 2025’i 330 milyon dolar gelirle tamamladı. son 5 aydaki büyüme ise %50’nin üzerinde, 2023’de piyasaya çıkan bir ürün için mükemmel. Şirket hem Fortune 500’e hem de startup’lara satış yapabiliyor hatta bize bile (evet, Soft Commitment Podcast). Ayrıca yine size duyurduğum gerçek figürlerin sesini telifli modelle de satmaları; uzun vadede ElevenLabs’in bu dikeyi kaybedeceği bir senaryoyu aklıma getiremiyor. OpenAI’ın da 2026’da sesi odak noktasına alması şaşırtıcı değil, bilgisayarla iletişim şeklimiz değişiyor, Wispr Flow’u da severek kullanıyorum kendimden bir örnek vermem gerekirse.
Slack, Slacbot’un AI agent dönüşümünü duyurdu. Slack’ten ayrılmadan bilgiye erişim, e-posta ve takvim oluşturma gibi özellikler lansmanda tanıtılanlar…
Bu kadar AI yeter diyenlere, ‘diğer’ gündem maddeleri…
İş başvuruları için geldiğimiz noktada ‘gereklilik’ tadında, güzel bir yazıya denk geldim. 500 başvuru yapıp hiç dönüş alamayan biri, nasıl başvurulara ‘arka kapıdan’ ulaşmayı başarmış-ı okumak isteyenler için link burada.
Apple, 2008’den bu yana App Store üzerinde geliştiricilere tam 550 milyar dolar ‘dağıtmış’.
Özellikle yaratıcılık gerektiren işler için bence süper fikir. NYC merkezli ajans, 7 yılda bir 1 yıl dinleniyor, iş almıyor, ilham alıyor. Kurucusunun TED videosu ise burada.
2025 yılında teknoloji hisseleri tavan yaparken bu şirketlerin kurucuları toplamda 16 milyar dolarlık hisse satışı gerçekleştirdi. Başı çeken de $5b ile Jeff Bezos oldu.
🛒 Dikkatimi çeken AI ürünleri: Autonomous ve Plaud
Wealth Management alanındaki ihtiyaç ve potansiyelden, hem ülkemiz hem de dünyanın geri kalanı için birden çok kez bahsetmiştim. Aynı zamanda YC girişimi de olan Autonomous, henüz kapalı betada olduğu için deneyimleyemedim belki ama dikkat çekici vaatleriyle bile burada yer almayı başardı. Web sitesi bile şunu belli ediyor; evet ürün çok güzel duruyor ama asıl mesele; böyle bir ürün lokalize olmalı. Çünkü ülkelerin ekonomik gerçekleri, vergi ve birçok konu ciddi oranda ayrışıyor. Ayrıca Autonomous bana düşündürttü ki, böyle bir üründe şu noktalar da kritik;
LLM ile gerçek uzman yorumlarınu hibrit bir modelle sunmak,
kişiselleştirmenin had safhada olması,
tabii zamanla ama platforma özgü ürünlerle (hedge fonların stratejileri gibi örneğin) ürünü desteklemek
ve son olarak; aslında tavsiye her yerde, tavsiyenin uygulanması noktasında da köprü kurulmalı (tek tuşla stratejiyi satın alma entegrasyonu.
OpenAI’ın Jony Ive ile geliştirdiği ürüne dair sızan dedikoduları da akla getiren Plaud’un yeni ürünü NotePin S, CES fuarında lansmanını yaptı. Bu 4. ürünü olan şirket, birbirine benzeyen 3 ürünüyle 1.5 milyon satış rakamına ulaştı. 4. ürünle beraber bir Mac uygulaması da yayınlayan Plaud; Granola, Fathom ve Spiky gibi oyunculara rekabette yeni bir sayfa açmış oldu. Diğer ürünlerindeki şarj kapasitesi daha yüksek olan Plaud’un, bu yeni ürününde odağı ise gerçek hayat görüşmeleri.
🎙️ Lenny’s Podcast’in 300 bölümünün dökümü ile LLM’lerde ne yapabilirsiniz?
Substack üzerinde Soft Commitment’a abone olan kişilerin %10’unun abone olduğu Lenny, hafta içinde çok akıllıca bir hareket yaptı ve 300 podcast bölümünün tüm transkriptini ücretsiz olarak paylaştı.
Manus’un GTM ekibi de yine akıllı bir hareketle her bir bölümün infografiğini bir araya getirdi: lennygallery.manus.space.
Peki bu veriyle siz ne yapabilirsiniz? Ürün, gtm ve AI adaptasyonu konuştuğunuz bir projenize bu dosyaları yükleyebilir, tüm bu bilgi birikiminden LLM’inizin net bir şekilde beslenmesini sağlayabilirsiniz. Ben denedim, gayet güzel çalışıyor.
‘Şerefsizim aklıma gelmişti’ demek istemem ama bir süredir Soft Commitment’ın text verileriyle beslenen bir Custom GPT fikri aklımdaydı. Çok benzerini kitabımız için de yapmıştık hatta.
Tamamen Yapay Zekâ kitabımızdan beslenen ve ChatGPT deneyimi sunan bir chat arayüzü burada sizi bekliyor. Kitabı neden almayalım sorusundan kitap içinde yer alan örneklere kadar aklınıza gelen her şeyi sorabilirsiniz.
⛳️ Zapier CEO’sundan AI kullanım dersleri…
AI dönüşümündeki en başarılı şirketlerden biri olarak gördüğüm -ve detayları sizinle daha önce paylaştığım- Zapier’in kurucu ortak ve CEO’su Wade Foster, How I AI'a konuk olmuş.
Kısa ve keyifli bir sohbetle, ekran paylaşımıyla kendi AI kullanımını paylaşan Wade’in anlattıklarından aklımda kalanlar:
AI’ın verimli ve etkin kullanımını ekipten beklemeden önce lider olarak kendin kullan, örnek ol, şirket içi hackathon’lara alan aç.
Granola gibi toplantı notu tutan araçlarının yaygın kullanımı, şirket kültürü ve yaklaşımını ‘değerlerimiz’ dokümanında yazdığı haliyle değil; gerçek hayat yani uygulamada nasıl olduğuyla gözler önüne seriyor. Granola’nın arşivinizle chat yapabildiğiniz özelliğini de ayrıca pek beğendim.
AI’ınıza Granola’da çıkan kültürü, pozisyondan beklentilerinizi verdiğinizde, iş görüşmelerinin analizinde de kişisel fikirden bağımsız adayın AI tarafından ve kendi belirlediğiniz kriterlerle değerlendirilmesinin önü açılıyor. Önyargılardan bağımsız sonuçlar için çok akıllıca.
Agent’ınız istediğiniz gibi değilse; iyi yanıt ve kötü yanıt örneklerinizi paylaşın.
Satış ve takım yöneticisi gibi rollerde çalışanlar özelinde; toplantılarda kendi performanslarını değerlendirebileceği, toplantının hemen sonrasında ise geri bildirimler alabileceği bir kurgu, kulağa çok iyi geliyor.
‘Agent’laştırıbilir işler neler olabilir?’ sorusunun yanıtı Wade’e göre basit, eğer ki birine adım adım, ‘bu iş şöyle yapılıyor’ diyorsanız bu bir AI agent’tır. Foster’a göre en büyük değer; bugün pahalı, sıkıcı veya sürdürülemez olduğu için hiç yapılmayan işlerde. AI agent’lar da tam olarak bu boşluğu dolduruyor.
Zapier göz önünde ve global bir şirket olduğu için çok anlamlı bir pratikten de bahsedildi. Twitter’da aradıkları türden içerikler paylaşan, böylece potansiyel çalışanları bulan agent kurgusu. Bu, tek başına bir ürün, startup bile olabilir hatta.
Kapanış…
Visby’nin sunduğu Soft Commitment’ın 196. sayı da burada sona erdi, teşekkürler!
Fikir ve önerilerinizi iletmek için okuyor olduğunuz bu e-postaya yanıt vermek en iyi seçenek. İçeriğe, formata dair görüşlerinizi özellikle merak ediyorum.
3 Şubat Salı günü, her zamanki Soft Commitment saatinde görüşmek üzere. Sevgiler.


