"Her şeyi yapabilen, her yerde bulunan" bir AI yaratmak için Baidu neden "işletim sistemi" ile başlamalı?

Yazar: pump havalı geek

Büyük modeller, Çin'in beş bin yıl boyunca neler olduğunu sıralayabiliyor, ancak şu an saat kaç olduğunu yanıtlayamıyor; kuantum mekaniğinin ne olduğunu açıkça açıklayabiliyor, ama bir profesyonel düzeyde görsel ve metin içeren bir PPT hazırlamakta zorlanıyor.

Neden büyük modeller her şeyi yapabiliyormuş gibi görünüyor, ama gerçekte kullanıldığında hep biraz eksik kalıyor?

Sebebi çok basit, zeki ve bilgili olmak, çalışkan olmak anlamına gelmiyor.

Zeki, büyük modellerin büyük miktarda bilgi ile eğitim ve öğrenim yoluyla gelişmiş bir beyin geliştirmesi gerektiğini, bir soruyu iyi bir şekilde yanıtlayabildiğini ifade eder;

Aynı zamanda zeki ve yetenekli iki unsuru karşılamak için, bu zeki beyne esnek uzuvlar eklemek ve "derin düşünme + derin teslimat" sağlamak gerekir.

Bu nedenle, büyük modelin akıllı düşünmeden "akıllı ve yetenekli" bir evrime nasıl taşınacağı, bu büyük model dalgasının geçici mi yoksa tarihi değiştiren bir zafer mi olacağını belirleyen bir faktör haline geldi.

Baidu örnek verdi.

25 Nisan'da, Create 2025 Baidu AI Geliştirici Konferansı'nda, Baidu'nun kurucusu Li Yanhong, Baidu Wenku ve Baidu Wangpan'ın ortaklaşa geliştirdiği içerik alanındaki dünya çapındaki ilk işletim sistemi olan Cangzhou OS'u tanıttı.

Geçmişte biriken temel teknoloji, yetenek ve verileri Baidu Kütüphanesi ve bulut depolama aracılığıyla yeterince entegre ederek, su gibi farklı senaryolar içerisinde en makul biçimde, kullanıcıların en kolay etkileşim arayüzü ile düşük eşik ve uçtan uca yüksek kaliteli teslimat gerçekleştirebilir.

Cangzhou OS'e dayanarak, Baidu Kütüphanesi ve Baidu Bulut Depolama'nın AI'ya dair vizyonu ve beklentisi, her zaman, her yerde ve her terminal cihazında gerçek bir tek noktadan, uçtan uca teslimat sağlamak, AI'nın "her şeyi yapabilmesi ve her yerde bulunabilmesi"dir.

01

Cangzhou OS, yapay zekanın işletim sistemi seviyesinde evrimine adım atmasını sağlıyor.

Teknoloji endüstrisinde şöyle bir ortak görüş vardır ki, herhangi bir teknolojinin laboratuvardan gerçek anlamda binlerce evin içine girmesi uzun bir Gartner eğrisi sürecinden geçmeyi gerektirir.

Bu eğride, birinci aşamadaki büyüme, esasen teknolojik ilerlemenin getirdiği piyasa coşku beklentilerine bağlıdır; ancak teknolojinin uygulanma etkileri tatmin edici olmadıkça, bu aşamadaki büyüme hızlı bir şekilde düşüşe geçecektir. Ta ki teknolojinin uygulanması için gerekli koşullar yavaş yavaş olgunlaşana ve neredeyse sıfır engelli, her şeyi yapabilen ve her yerde bulunan bir altyapıya somutlaşana kadar, ikinci aşamanın ekosistem patlaması da kendiliğinden gelecektir.

Yazılım endüstrisinin ikinci aşamasının başlangıçlarından biri genellikle olgun bir işletim sisteminin ortaya çıkmasıdır; örneğin Windows bilgisayar endüstrisi için, iOS ise mobil endüstri için.

Peki, olgun bir işletim sistemi nasıl tanımlanır? Yaklaşık 15 yıl önce, dünya teknoloji endüstrisinde böyle bir tartışma olmuştu: Hem dokunmatik ekranlı, büyük ekranlı telefonlar, telefonla arama yapabilen, fotoğraf çekebilen, müzik dinleyebilen ve mesaj gönderebilen cihazlar olmasına rağmen, neden Apple ya da akıllı telefonlar geçmişteki fonksiyonel telefonlarla iki farklı tür olarak kabul ediliyor.

Temel nedenlerden biri, iOS'un çekirdek düzeyinde kararlılığı ve çoklu görev yeteneklerini MAC OS'den devralması ve geliştiricilerin kendi yenilikçi uygulamalarını yapmak için Apple'ın temel yeteneklerini entegre edebilecekleri açık bir ekosistem haline getirmesidir. Bu aynı zamanda bir cep telefonunun nasıl tanımlanacağını, Motorola'dan, Nokia'dan bir veya iki deve, birlikte katılmak için tüm ekolojiye, sonsuz olasılıklara sahip devasa bir endüstriye, o zamandan beri on yıldan fazla bir süredir mobil İnternet'in kapısını açtı.

Teknoloji sürekli ilerlese de, ticari hikayelerin kurgusu her zaman benzer ritimlerle tekrar tekrar sahneye konuluyor. Akıllı telefon işletim sistemlerinde doğrulanmış olan temel mantık, büyük model döneminin işletim sistemi inşasında da geçerliliğini koruyor.

Özetle üç şey var: Tam bir altyapı yeteneği, esnek bir merkezi yönetim ve gelişen bir uygulama hizmetleri ekosistemi. Bu, tam olarak Cangzhou OS'nin üç katmanlı mimarisine karşılık geliyor: Altyapı, merkezi sistem ve uygulama hizmetleri. Tek fark, uygulama ile merkez ve altyapı arasındaki köprünün, önceki API'lerden daha standartlaştırılmış, düşük giriş engeline sahip MCP ile değiştirilmiş olması.

Bunlar arasında, MCP Server kısmının altyapısının temel bileşeni Chatfile plus'tır. Ana işlevi, bilgiyi çerçeveleyerek farklı modalitelerde, farklı şekillerde ve farklı formatlardaki içeriklerin unsur düzeyinde ayrıştırılması ve analiz edilmesi, çoklu modalitelerin anlaşılması, çoklu modalitelerin aranması, dosya dönüştürme ve analiz gibi bir dizi araç çerçevesi bileşenini sağlamaktır.

Aynı zamanda, Baidu Wenku ve Wangpan, kamu bilgi havuzu, özel bilgi havuzu ve hafıza havuzu olmak üzere "üç büyük havuz" oluşturmuştur. Bu, Baidu Wenku'nun yıllar içinde biriktirdiği kamu bilgi verileri (kamu bilgi havuzu), Wangpan'ın kullanıcıların yetkilendirdiği bilgi verileri (özel bilgi havuzu) ve kullanıcıların geçmişte Wenku veya Wangpan'da gerçekleştirdiği işlemler, kullanım alışkanlıkları ve tarihsel kayıtları (hafıza havuzu) anlamına gelir.

Bu veriler genellikle farklı modlarda, farklı şekillerde ve farklı formatlarda sunulmaktadır. Bunlar arasında, genel bilgileri sağlayan kamuya açık bilgi havuzu, kullanıcıların kişiselleştirilmiş verilerini saklayan özel bilgi havuzu ve bellek havuzu bulunmaktadır.

Bilgi çerçevesinde, Cangzhou OS, "Üç Büyük Kütüphane" içindeki çok modlu içerikleri vektörleştirme ve etiketleme işlemi gerçekleştirecek; yani resim, metin, video, ses, belge gibi yapılandırılmamış verileri, farklı uzman modeler aracılığıyla bilgisayarın anlayabileceği çok boyutlu vektör verilerine, yani bir dizi token'a dönüştürecektir.

Ve merkez sistemde, Baidu Kütüphanesi ve Bulut Depolama, "üç büyük alet" geliştirdi; bu, içerik düzenleme (belgeler, PPT vb. içerik için), okuma (belgeler ve PPT vb. içerik için) ve oynatma (ses ve video oynatma) gibi araçların entegrasyonudur.

Aynı zamanda, Cangzhou OS, "Planlama Merkezi" aracılığıyla, etkileşim bileşenleri, niyet modelleri ve iletim altyapısı gibi unsurları kullanarak, kullanıcı hafızası ve profil verileriyle birleştirerek, modeller aracılığıyla kullanıcı niyetini anlayabilir ve etkili bir şekilde planlama Ajanlarını dağıtabilir.

En üst katmanda, bir dizi AI Ajanı bulunmaktadır. "Cangzhou OS", kütüphane, bulut depolama için PPT, AI resimli kitaplar, AI zihin haritaları, AI posterler, AI notlar, AI tarama, AI dinleme notları gibi yüzlerce AI Ajanını entegre eder. Üretim modları, resim, metin, video, ses gibi çeşitli türleri kapsar ve öğrenim, ofis, yaşam ve eğlence gibi sahneleri kapsamlı bir şekilde kapsar. Ayrıca, entegre editörün düzenleme, değiştirme ve ince ayar yapma yeteneğine dayalı olarak, arama ve içerik üretim kalitesinin daha yüksek ve gerçekçi kişiselleştirilmiş görev gereksinimlerine daha uygun hale gelmesini sağlar.

02

Cangzhou OS üzerinde,

Daha fazla "Akıllı ve Yetenekli" Agent oluşturmak

En üst düzey uygulama hizmetleri etrafında, Baidu Wenku ve Baidu Wangpan, yüz milyonlarca kullanıcı tarafından doğrulanmış çok sayıda kullanışlı AI Agent'ı tanıttı ve aynı zamanda büyük uygulama ekosistemini oluşturmak için birçok üçüncü taraf profesyonel Agent'ı entegre etti.

"Tek duraklı AI içerik edinme ve yaratma platformu" olarak, Baidu Wenku'nun ücretli kullanıcı sayısı 40 milyonu geçti, AI aylık aktif kullanıcı sayısı 97 milyona ulaştı. Baidu Wangpan da "tek duraklı içerik hizmet platformu" olarak güncellendi, 1 milyardan fazla kullanıcıya hizmet veriyor, toplam kullanım alanı 1000 milyar GB'yi aşıyor, AI aylık aktif kullanıcı sayısı 80 milyonu geçti. Baidu Wenku ve Baidu Wangpan, büyük model çağında gerçek bir "süper üretkenlik" haline geldi.

Konferansta, Baidu Wenkong ve Baidu Wangpan ayrıca "Cangzhou OS" tabanlı yeni yetenekleri sergiledi: "GenFlow Süper Ortağım" ve "AI Notları".

GenFlow Süper Ortağım, Baidu Wenku APP tarafından sunulan çoklu zeka ajansı işbirliği yeteneğidir. "Cangzhou OS" desteği ile içerik üretimi çoklu görev paralelliği gerçekleştirebilir ve en kapsamlı profesyonel çevrimiçi bilgiler ile kullanıcıların kendi alışkanlıkları ve tercihlerine dayanarak çeşitli görev teslimatlarını tamamlayabilir.

Örneğin, kullanıcı bir düğün planlaması yapmak istiyor, ancak öncelikle sadece basit bir cümle var: Beş Mayıs'ta Hainan'da bir açık hava düğünü yapmak istiyorum, bana bir plan ve davetiye hazırlamanı istiyorum.

Gereksinim basit görünüyor; sadece tarihsel bir şablona bakarak eksik yerleri doldurmak yeterli. Ancak kullanıcı memnuniyetine ulaşmak için, kullanıcıların estetik tercihlerini, bütçe beklentilerini, süreç tercihlerini bilmek gerekiyor. Ayrıca, 1 Mayıs döneminde Hainan'daki hava durumunu, insan akınını ve alan dağılımını da bilmek gerekli. Bu bilgilerin ardından, bu grafik ve bilgileri bir PPT aracı ile birleştirip, tam bir çözüm oluşturmak gerekiyor. Son olarak, bu çözüm ve kullanıcı estetik tercihleri doğrultusunda, tam bir düğün davetiyesi afişi oluşturulmalı.

Ve yukarıdaki içeriği tamamlamak için, kullanıcıların geçmiş sohbet kayıtları, geçmiş tarama kayıtları, niyet tanıma, genel ağ arama ve PPT araçlarını ayrı ayrı kullanarak kullanıcı niyetini analiz etmek, kullanıcı tercihlerini anlamak, araçları serbestçe bir araya getirmek ve nihayetinde kullanıcılara süreç, tarih, mekan, bütçe, tema, uygulama detayları, stil ve personel düzenlemelerini içeren oldukça spesifik bir tam plan sunmak gerekmektedir.

Bu arada, kullanıcıların ihtiyaç duyduğu plan ve afiş birbirini tamamlayıcıdır, bu da her iki tarafın tüm bilgilerinin tutarlı olmasını gerektirir ve aynı işletim sistemi ile paralel olarak çıktılar oluşturulmalıdır.

Elbette, AI'nın herkesin memnun kalacağı bir sonuç üretmesi bir kez de olsa mümkün değil. Bu nedenle, ister düğün planı ister afiş olsun, düzenlenebilir bir yeteneğe sahip olmaları gerekiyor ve bu yeteneği destekleyen şey, "Cangzhou OS"'nin entegre düzenleyici yeteneğidir.

Kolayca görülebilir ki, derin düşünmeden derin teslimata kadar, GenFlow süper enerjisi neredeyse piyasada gerçekten var olan tek "çoklu zeka işbirliği" türü ürünün mevcut durumudur. Sadece çoklu zeka işbirliği ürünlerinin yüksek maliyet, uzun üretim süresi, düşük verimlilik, istikrarlı teslimat yapamama ve çoklu diyalog ayarlaması yapamama gibi yaygın sorunlarını çözmekle kalmaz, aynı zamanda AI'nın gerçekten "her şey yapabilir, her yerde var olabilir" hedefini gerçekleştirmesi için olgun ürünler ve kullanıcı izinleri ile özel verilerin birleşimine doğrudan entegre edilir.

Baidu Wangpan'ın AI notları, sayısız ofis çalışanı, sınav ve kamu sınavı çalışanları için etkili bir yardımcıdır.

AI Notları, kullanıcıların Baidu Netdisk'te sakladığı çeşitli sınav hazırlık videoları ve not sayfalarını aynı arayüzde entegre edebilen sektörün ilk çok modlu AI notudur. Videoların içeriği ve notlar birbirleriyle güçlü bir şekilde bağlantılıdır. Videoyu izlemekten, AI notları oluşturmaya, AI zihin haritasını özetlemeye ve nihayetinde AI soruları ile öğrenim sonuçlarını kontrol etmeye kadar, kullanıcıların öğrenme döngüsünü tamamen kapsar.

Örneğin, İngilizce lisansüstü okul giriş sınavının zorluğu bir süre önce sıcak bir konu haline geldi ve kullanıcılar lisansüstü okul giriş sınavı için İngilizce'yi yoğun bir şekilde gözden geçirmek istiyorlar. AI Notes, önce kullanıcının ağ diskinde depolanan ilgili bilgileri alacak ve aynı zamanda bunları sıralamak için çevrimiçi genel bilgiler tarafından verilen test merkezlerini sorgulayacaktır. Bununla birlikte, tüm süreç burada bitmiyor, AI notları, kendileri tarafından oluşturulan test noktalarının nihai doğrulamasını gerçekleştirmek için geçmiş geçmiş soruları da birleştirecek ve yalnızca doğrulanan test noktaları, bu temelde zihin haritaları oluşturmaya ve soru tahminlerini test etmeye devam ederek kullanıcıların öğrenme ilerlemelerini hızlandırmalarına yardımcı olabilir.

Bu süreçte kullanılan araç çağrılarının, bir düğün planlamaktan daha az olmadığını belirtmek gerekir. Örneğin, sınav merkezlerini ve gerçek soruları bulmak için tam ağ tarama yeteneğine ihtiyaç vardır ve gerçek sorular genellikle PDF veya hatta resim formatında sunulmaktadır. Ünlü öğretmenlerin yorumları ise video formatında sunulmaktadır; bu da çok modlu içerik analiz yeteneğini gerektirir. Nihai zihin haritası oluşturma ve sınav sorusu tahmini, büyük modellerin akıl yürütme yeteneğini, çok modlu içerik oluşturma yeteneğini ve farklı içerikler arasındaki eşleştirme ve ilişkilendirme yeteneğini gerektirirken, aynı zamanda içerik oluşturmanın mutlak doğruluğunu sağlamak da gerekmektedir.

Bu arka planda, "Cangzhou OS"'nin güçlendirmesi var.

Elbette, Baidu geliştiricilerin MCP'ye tam anlamıyla sarılmasını destekliyor, bu yüzden Cangzhou OS sadece Baidu'nun iç ekosistemine hizmet etmiyor; işletim sisteminin büyümesinin en önemli unsurlarından biri dışa açılmak ve geniş geliştirici kitlesinin yenilikçilik yeteneklerini harekete geçirmektir.

Bu nedenle, ekosistemin ve uygulamaların maksimum değerini elde etmek için, Baidu Wenkang ve Baidu Wangpan, "Cangzhou OS" temelinde, MCP'yi ürün ve ekosistem bağlantısında tam olarak kullanarak MCP Server-Client-Host üç katmanlı yapısını inşa etti. Wenkang ve Wangpan'ın yeteneklerini MCP Server biçiminde açarak, daha fazla işletme kullanıcısının, geliştiricilerin ve akıllı uygulamaların MCP Host'a erişimini kolaylaştırmak için MCP Client SDK'sını sağladı.

Bunlar arasında en temsilci örneklerden biri Samsung cep telefonlarıdır. Samsung cep telefonları, Baidu Wenkù bulut depolama hizmetinin dosya yükleme, indirme, arama, paylaşma ve içerik anlama gibi birçok MCP sunucusuna bağlanıyor.

Bir yandan, kullanıcılar telefonlarındaki sesli asistan arayüzü üzerinden konuşarak, dosya yükleme bulut yedekleme, bulutta paylaşma, belge özetleme ve içerik soruları gibi işlevleri doğrudan gerçekleştirebilir.

Diğer yandan, bu sunucular Samsung telefon sisteminin bulut depolama kapasitesini zenginleştirebilir ve telefonun büyük dosyaları ve çoklu dosyaları toplu olarak yedekleme ve paylaşma sorununu çözebilir.

Örneğin, kullanıcı telefonundaki fotoğraf albümünde sesli asistanı çağırarak "Dün Orman Parkı'nda çekilen fotoğrafları Baidu Bulut'a yedekle ve Xiao Ming'in fotoğraflarını ona gönder" der. İlgili fotoğraflar, kullanıcının yetkilendirdiği bulut hesabına yüklenecek ve paylaşım bağlantısı oluşturulacak. Telefon asistanı daha sonra rehberi çağırarak bu bağlantıyı SMS ile karşı tarafın telefonuna gönderecek. Bağlantıya tıkladığında kullanıcı, doğrudan Baidu Bulut'a erişip inceleyebilir veya kaydedebilir.

Şüphesiz, bir işletim sisteminin alt düzey yeteneklerinin güvenilir olup olmadığını test etmek, araçların birikimi veya gelişmiş teknolojilerin sayısı ile ölçülmez. Üst düzey uygulama hizmet ekosisteminin ne kadar kullanışlı, olgun ve zengin olduğu, işletim sisteminin yeteneklerinin en iyi test standardıdır.

03

OS'un hikayesinin bir sonu yok.

Sermaye piyasasında, yatırımcılar tarafından en çok kabul gören bir işletme türü "zamanın arkadaşı" olarak adlandırılır.

Zamanın dostu, bir işletme doğru bir şey yaptığında, sonraki adımda sadece devam etmesi gerektiğidir; böylece performans sonsuz bir makine gibi büyümeye devam edecek ve ekosistem geliştiricileri de sürekli fayda sağlayabilecektir.

Ve işletim sistemi, tam olarak böyle bir tipik sürekli hareketli makine pazarını temsil eder. Bilgisayar ve telefon pazarları var oldukça, Microsoft, Apple, Google gibi şirketlere ait işletim sistemlerinin hikayesi sonsuz olacaktır.

Büyük modeller de benzer şekilde. "Derin düşünme + derin teslimat + kamu ve özel veriler + MCP ekosistemi" bir araya geldiğinde, gelecekte yeni bir çağda her şeyi yapabilen ve her yerde bulunan bir AI haline gelecektir. O zaman, Cambrian dönemindeki gibi yeni türlerin büyük patlaması sürekli olarak ortaya çıkacaktır.

Bu süreçte aşağıya bakıldığında, Baidu Dokümanları, Baidu Bulut Depolama gibi kendi yeteneklerini açma eylemi görülebilir. Ekosistemi aktif bir şekilde kucaklayarak, büyük modelin yeni türlerinin yaratıcısı ve yeni kuralların belirleyicisi olma yolunu seçmek.

Yukarıya bakıldığında, sayısız yeni Agent'in "Cangzhou OS" temelinde yaratıldığı ve görüldüğü, muazzam bir şekilde fışkıran yeni uygulama hizmetleri ekosistemini oluşturduğu görülmektedir.

Ve şu anda, tüm hikayeler daha yeni başlıyor.

View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
  • Reward
  • 1
  • Share
Comment
0/400
GateUser-b76d427bvip
· 13h ago
ilginç makale için teşekkürler
View OriginalReply0
  • Pin