لماذا تريد بايدو البدء من "نظام التشغيل" لبناء ذكاء اصطناعي "لا حدود له، في كل مكان"?

المؤلف: الارتفاع الجذري

النموذج الكبير يمكنه تلخيص ما حدث في الصين على مدى خمسة آلاف عام، لكنه لا يستطيع الإجابة عن الوقت الحالي؛ يمكنه شرح ما هو ميكانيكا الكم، لكنه يجد صعوبة في إعداد عرض تقديمي احترافي مزود بالصور.

لماذا يبدو أن النماذج الكبيرة تستطيع فعل كل شيء، لكنها في الواقع دائمًا ما تكون ناقصة بعض الشيء عند استخدامها؟

السبب بسيط، الذكاء والمعرفة الواسعة لا تعني القدرة على العمل.

ذكي، يحتاج النموذج الكبير إلى تدريب وتعلم من كميات هائلة من المعرفة، ليتمكن من تطوير دماغ متقدم يمكنه الإجابة على سؤال بشكل جيد؛

وفي الوقت نفسه، لتلبية العنصرين الذكي والقدير، يحتاج الأمر إلى تزويد هذا العقل الذكي بأطراف مرنة لتحقيق "تفكير عميق + تسليم عميق".

لذلك، كيف يمكن دفع النماذج الكبيرة من التفكير الذكي إلى تحقيق "الذكاء والقدرة" في التطور، أصبح حاسماً في تحديد ما إذا كانت هذه الجولة من حماس النماذج الكبيرة مجرد عرض عابر أم أنها ستغير مجرى التاريخ.

بايدو قدمت عينة.

في 25 أبريل، خلال مؤتمر مطوري الذكاء الاصطناعي Create 2025، قدم مؤسس باي دو، لي يانهونغ، نظام التشغيل الأول عالمياً في مجال المحتوى - نظام Cangzhou OS، الذي أطلقته باي دو و Baidu Wenku و Baidu Wangpan.

من خلال دمج التقنيات الأساسية والقدرات والبيانات التي تم تراكمها من مكتبة بايدو وقرص الشبكة، يمكنه التفاعل في مختلف السيناريوهات مثل الماء، من خلال الشكل الأكثر منطقية، وواجهة التفاعل الأكثر سهولة للمستخدم، لتحقيق تسليم عالي الجودة وقليل التكلفة من البداية إلى النهاية.

بالاعتماد على نظام Cangzhou OS، فإن رؤية وتوقعات Baidu Wenku وBaidu Wangpan بشأن الذكاء الاصطناعي هي تحقيق تسليم حقيقي شامل من البداية إلى النهاية في أي وقت، وفي أي مكان، وعلى أي جهاز، مما يسمح للذكاء الاصطناعي بأن يكون «قادرًا على فعل كل شيء، وحاضرًا في كل مكان».

01

سيتيح نظام Cangzhou OS للذكاء الاصطناعي التقدم نحو تطور على مستوى نظام التشغيل

في صناعة التكنولوجيا، هناك توافق على أن أي تقنية تمر من المختبر إلى دخولها فعليًا إلى منازل الناس تحتاج إلى المرور بعملية طويلة تُعرف بمسار منحنى غارتنر.

في هذه المنحنى، يعتمد النمو في المرحلة الأولى بشكل رئيسي على التوقعات المتحمسة للسوق الناجمة عن التقدم التكنولوجي، ولكن مع عدم تحقق النتائج المرجوة من تطبيق التكنولوجيا، سيدخل هذا النمو بسرعة في مرحلة الانكماش، حتى تنضج الشروط اللازمة لتطبيق التكنولوجيا تدريجياً، وتصبح مصورة كالبنية التحتية التي لا تتطلب أي عوائق، والتي لا يمكن الاستغناء عنها، وفي كل مكان، ستأتي بعدها انفجار النظام البيئي في المرحلة الثانية.

واحد من علامات بدء المرحلة الثانية من صناعة البرمجيات هو ظهور نظام تشغيل ناضج، مثل ويندوز لصناعة الحواسيب، وiOS لصناعة الهواتف.

كيف يمكن تعريف نظام تشغيل ناضج؟ منذ حوالي 15 عامًا، كانت هناك مناقشة في صناعة التكنولوجيا العالمية: لماذا تعتبر أجهزة آيفون أو الهواتف الذكية نوعًا مختلفًا تمامًا عن الأجهزة السابقة التي يمكنها اللمس، والشاشات الكبيرة، والاتصال الهاتفي، والتصوير، والاستماع إلى الموسيقى، وإرسال الرسائل النصية؟

أحد الأسباب الرئيسية هو أن iOS ورث الاستقرار على مستوى النواة وقدرة تعدد المهام من نظام MAC OS، وحوّله إلى نظام بيئي مفتوح، حيث يمكن للمطورين دمج هذه القدرات الأساسية من Apple بحرية وإبداع تطبيقاتهم الخاصة. وهذا أيضًا جعل كيفية تعريف الهاتف المحمول، من كونها مسألة تتعلق برائدين مثل موتورولا ونوكيا، تتحول إلى مشاركة من جميع أنحاء النظام البيئي، مما أدى إلى صناعة ضخمة ذات إمكانيات غير محدودة، وفتح الأبواب لعقد من الزمان في الإنترنت المحمول.

ستستمر التكنولوجيا في التقدم، ولكن قصص الأعمال دائمًا ما تتكرر بإيقاع مشابه، حيث أن المنطق الأساسي الذي تم التحقق منه في أنظمة تشغيل الهواتف المحمولة لا يزال صالحًا في بناء أنظمة التشغيل في عصر النماذج الكبيرة.

باختصار، هناك ثلاثة: قدرة أساسية كاملة، جدولة مركزية مرنة، وإيكولوجيا خدمات تطبيقات مزدهرة. وهذا يتوافق تمامًا مع الهيكل الثلاثي لنظام Cangzhou OS: البنية التحتية الأساسية، والنظام المركزي، وخدمات التطبيقات. الفرق الوحيد هو أن الجسر بين التطبيقات والمركز والقاعدة، تم استبداله من API التقليدي إلى MCP الأكثر معيارية ومنخفضة العوائق.

من بين ذلك، فإن البنية التحتية الأساسية لجزء خادم MCP، المكون الأساسي له هو Chatfile plus، والهدف الرئيسي منه هو من خلال إطار المعرفة، تفكيك وتحليل المحتوى بمستوى العناصر للأشكال والأوضاع والأشكال المختلفة، بالإضافة إلى مجموعة من مكونات إطار العمل مثل الفهم متعدد الأوضاع، والاسترجاع متعدد الأوضاع، وتحليل تحويل الملفات.

في الوقت نفسه، أنشأت مكتبة Baidu و Wangpan ثلاث مكتبات رئيسية، وهي مكتبة المعرفة العامة، ومكتبة المعرفة الخاصة، ومكتبة الذاكرة. وتشير هذه المكتبات إلى بيانات المعرفة العامة التي تراكمت على مدار سنوات في مكتبة Baidu (مكتبة المعرفة العامة)، وبيانات المعرفة التي يستخدمها المستخدمون بموجب تفويض في Wangpan (مكتبة المعرفة الخاصة)، والأوامر والتفضيلات وسجلات التاريخ التي أنشأها المستخدم في مكتبة أو Wangpan (مكتبة الذاكرة).

هذه البيانات غالبًا ما تظهر بأشكال وأنماط وصيغ مختلفة. من بينها، توفر قاعدة المعرفة العامة معرفة شاملة، بينما تحتفظ قاعدة المعرفة الخاصة وذاكرة التخزين بالبيانات المخصصة للمستخدم.

في إطار المعرفة، ستقوم منصة Cangzhou OS بمعالجة المحتوى المتعدد الوسائط في "المكتبات الثلاث" من خلال تحويله إلى بيانات متجهة وموسومة، أي تحويل الصور والنصوص والفيديوهات والصوتيات والمستندات، وهي بيانات غير منظمة، إلى بيانات متجهة متعددة الأبعاد يمكن للكمبيوتر فهمها، أي مجموعة من الرموز.

وفي النظام المركزي، قامت باي دو وونكو ووانغ بان بتطوير "ثلاثة أدوات"، وهي محرر متكامل (لتحرير المحتوى مثل الوثائق وPPT) وقارئ (لقراءة الوثائق ومحتوى PPT) ومشغل (لتشغيل الصوت والفيديو) وغيرها من الأدوات.

في الوقت نفسه، يمكن لنظام Cangzhou OS من خلال "مركز الجدولة"، من خلال مكونات التفاعل، ونموذج النوايا، والبنية التحتية للنقل، دمج ذاكرة المستخدم وبيانات الصور، لفهم نوايا المستخدم من خلال النموذج، وتوزيع الوكلاء بشكل فعال.

في أعلى مستوى، هناك سلسلة من وكلاء الذكاء الاصطناعي. تم دمج "نظام Cangzhou OS" المكتبة، وخدمة التخزين السحابي PPT، وكتب الرسوم التوضيحية بالذكاء الاصطناعي، والخرائط الذهنية بالذكاء الاصطناعي، والملصقات بالذكاء الاصطناعي، والملاحظات بالذكاء الاصطناعي، والمسح الضوئي بالذكاء الاصطناعي، وتدوين الملاحظات بالذكاء الاصطناعي وغيرها من مئات وكلاء الذكاء الاصطناعي، تشمل أنماط التوليد أنواعًا مختلفة من الصور، والنصوص، والفيديو، والصوت، وتغطي بشكل شامل سيناريوهات التعلم والعمل والترفيه، وتعتمد على قدرة التحرير والتعديل والتحكم الدقيق لمحرر الاندماج، مما يجعل جودة البحث وتوليد المحتوى أعلى، وأكثر تطابقًا مع متطلبات المهام الشخصية الواقعية.

02

على نظام Cangzhou OS ،

بناء المزيد من الوكلاء "الأذكياء والمهرة"

حول خدمات التطبيقات العليا، أطلقت مكتبة بايدو و بايدو درايف مئات من وكلاء الذكاء الاصطناعي المفيدة التي تم التحقق منها من قبل مئات الملايين من المستخدمين، كما تم دمج عدد كبير من الوكلاء المحترفين من أطراف ثالثة لبناء نظام بيئي كبير للتطبيقات.

كمنصة "للحصول على المحتوى وإنشاءه باستخدام الذكاء الاصطناعي"، تجاوز عدد المستخدمين المدفوعين لبايدو ويكي 40 مليون، وبلغ عدد مستخدمي الذكاء الاصطناعي النشطين شهريًا 97 مليون. كما تم ترقية بايدو وان بان إلى "منصة خدمات محتوى شاملة"، تخدم أكثر من 1 مليار مستخدم، وتجاوز إجمالي سعة التخزين 1000 مليار جيجابايت، وعدد مستخدمي الذكاء الاصطناعي النشطين شهريًا أكثر من 80 مليون. أصبحت بايدو ويكي وبايدو وان بان "قوة إنتاجية هائلة" في عصر النماذج الكبيرة.

في المؤتمر، عرضت مكتبة بايدو وقرص بايدو أيضًا القدرات الجديدة المبنية على "نظام Cangzhou OS": "GenFlow 超能搭子" و"AI 笔记".

GenFlow هي قدرة تعاون متعددة الوكلاء أطلقتها Baidu Wenku APP ، بمباركة "Cangzhou OS" ، يمكن لتوليد المحتوى تحقيق توازي متعدد المهام ، ويمكنه أيضا إكمال تسليم المهام المختلفة بناء على معلومات الشبكات الأكثر شمولا ومهنية ، وعادات المستخدمين وتفضيلاتهم.

على سبيل المثال، يريد المستخدم القيام بتخطيط حفل زفاف، ولكن المدخلات الأولية هي جملة بسيطة فقط: أريد إقامة حفل زفاف خارجي في هاينان في عيد العمال، ساعدني في إعداد خطة الدعوة.

يبدو أن الطلب بسيط، فقط يحتاج إلى ملء الفراغات وفقًا للنماذج التاريخية. ولكن لتحقيق رضا المستخدم، من الضروري معرفة تفضيلاتهم الجمالية، وتوقعاتهم الميزانية، وتفضيلات العمليات، كما يجب معرفة حالة الطقس في هاينان خلال عطلة عيد العمال، وحجم الزوار، وتوزيع الأماكن. بعد ذلك، يجب دمج هذه الصور والنصوص والمعرفة باستخدام أدوات PPT لإنشاء خطة كاملة، وأخيرًا، بناءً على الخطة وتفضيلات المستخدم الجمالية، يتم إنشاء ملصق دعوة زفاف كامل.

لإكمال ما سبق، يحتاج الأمر إلى جدولة سجلات المحادثات السابقة للمستخدم، وسجلات التصفح السابقة، بالإضافة إلى التعرف على النوايا، والبحث في جميع الشبكات، وأداة PPT، لتحليل نوايا المستخدم، وفهم تفضيلاته، وتجميع الأدوات بحرية، ومن ثم تقديم خطة كاملة للمستخدم تتضمن تفاصيل دقيقة جداً تشمل العملية، والتاريخ، والمكان، والميزانية، والموضوع، والتفاصيل التنفيذية، والأسلوب، وترتيبات الأفراد.

في الوقت نفسه، تحتاج خطة المستخدم والملصق إلى التوافق مع بعضهما البعض، مما يتطلب الحفاظ على تناسق جميع المعلومات بينهما، وإخراجها بالتوازي باستخدام نفس نظام التشغيل.

بالطبع، لا يمكن للذكاء الاصطناعي أن يولد نتائج ترضي الجميع في مرة واحدة، وهذا يتطلب أن تكون سواء خطط الزفاف أو الملصقات قابلة للتحرير، والداعم لهذه القدرة هو قدرة محرر الدمج لـ "沧舟 OS".

ليس من الصعب ملاحظة أنه من التفكير العميق إلى التسليم العميق، تُعتبر GenFlow 超能搭子 تقريبًا المنتج الوحيد المتاح في السوق الذي ينتمي حقًا إلى فئة "التعاون المتعدد الذكاء الاصطناعي". لا تحل فقط المشكلات الشائعة المتعلقة بارتفاع تكلفة منتجات التعاون المتعدد الذكاء الاصطناعي، وطول وقت التوليد، وانخفاض الكفاءة، وعدم القدرة على التسليم المستقر، وعدم القدرة على تحسين الحوار المتعدد الجولات، بل إنها مدمجة مباشرة في الجمع بين المنتجات الناضجة وبيانات المستخدم الخاصة المرخصة، مما يمنح الذكاء الاصطناعي فرصة حقيقية لتحقيق هدف "لا شيء مستحيل، في كل مكان".

تعتبر ملاحظات AI على Baidu Netdisk من الأدوات الفعالة للعديد من موظفي المكاتب وطلاب الدراسات العليا.

ملاحظات AI هي أول ملاحظات متعددة الأنماط في الصناعة، يمكنها دمج مقاطع الفيديو المختلفة وصفحات الملاحظات المخزنة بواسطة المستخدم في Baidu Wangpan في واجهة واحدة، مما يحقق تفاعل سلس، كما أن محتوى الفيديو والملاحظات مترابطان بشكل قوي، من مشاهدة الفيديو، إلى إنشاء ملاحظات AI، ثم تلخيص خريطة العقل AI وصولاً إلى اختبار نتائج التعلم باستخدام أسئلة AI، مما يغطي دورة تعلم المستخدم بالكامل.

خذ مثالاً، أصبح موضوع صعوبة امتحان اللغة الإنجليزية للماجستير حديث الساعة في الفترة الأخيرة، حيث يرغب المستخدمون في مراجعة مركزة لامتحان اللغة الإنجليزية. ستقوم ملاحظات الذكاء الاصطناعي أولاً بالبحث في المواد ذات الصلة المخزنة في سحابة المستخدم، وأيضاً بالتحقق من النقاط الإمتحانية التي تقدمها المصادر العامة على الإنترنت، وتنظيمها. لكن العملية لا تتوقف عند هذا الحد، بل ستقوم ملاحظات الذكاء الاصطناعي أيضاً بالتأكد من النقاط الإمتحانية التي تم إنشاؤها مقارنةً بالأسئلة الفعلية من السنوات السابقة، فقط النقاط الإمتحانية التي تم التحقق منها يمكن أن تُستخدم كأساس لإنشاء خرائط ذهنية وتوقعات للامتحانات، مما يساعد المستخدمين على تسريع وتيرة التعلم.

وفي هذه العملية، لا تقل أدوات الاستدعاء المستخدمة عن تلك التي تستخدم في تخطيط حفلات الزفاف. على سبيل المثال، العثور على مواقع الامتحانات والعثور على الأسئلة الحقيقية يتطلب قدرة على البحث عبر الإنترنت بالكامل، وغالبًا ما تُعرض الأسئلة الحقيقية بصيغة PDF أو حتى صورة، بينما تُعرض تفسيرات المعلمين المتميزين في شكل فيديو، مما يتطلب القدرة على تحليل المحتوى متعدد النماذج. أما بالنسبة لتوليد خريطة التفكير النهائية وتوقع الأسئلة، فيتطلب ذلك القدرة على الاستدلال من النماذج الكبيرة، وقدرة على توليد المحتوى متعدد النماذج، بالإضافة إلى القدرة على الربط بين المحتويات المختلفة، مع ضرورة ضمان الدقة المطلقة في توليد المحتوى.

هذا هو تمكين "Cangzhou OS".

بالطبع، تدعم بايدو المطورين لاحتضان MCP بشكل كامل، لذا فإن نظام التشغيل 苍舟 OS لا يخدم فقط النظام البيئي الداخلي لبايدو، بل إن الانفتاح الخارجي هو أحد أهم حلقات نمو النظام التشغيلي، مما يحفز قدرة الابتكار لدى المطورين بشكل واسع.

لذلك، من أجل تحقيق أقصى قيمة للنظام والعمليات، قامت مكتبة بايدو، وقرص بايدو، استنادًا إلى "نظام سيانغتشو OS"، بطرح استخدام MCP بالكامل في الربط بين المنتجات والنظام البيئي، وبناء نظام ثلاثي الطبقات من خادم-عميل-مضيف MCP، حيث يتم فتح قدرات المكتبة وقرص التخزين من خلال شكل خادم MCP، مما يسهل على المزيد من المستخدمين المؤسسيين والمطورين وتطبيقات الذكاء الاصطناعي الاتصال بمضيف MCP.

من بين ذلك، تعتبر حالة الهاتف المحمول من سامسونغ الأكثر تمثيلاً. يقوم هاتف سامسونغ بربط عدة خوادم MCP مثل تحميل الملفات وتنزيلها واسترجاعها ومشاركتها وفهم المحتوى من خدمة Baidu Wenkong.

من ناحية، يمكن للمستخدمين في واجهة مساعد الصوت على الهاتف، من خلال طريقة التحدث، تحقيق مباشرة تحميل الملفات إلى سحابة النسخ الاحتياطي، ومشاركة المحتوى على السحابة، وتلخيص الوثائق، والإجابة على الأسئلة المتعلقة بالمحتوى.

من ناحية أخرى، يمكن أن تعمل هذه الخوادم على تعزيز قدرة التخزين السحابي لنظام هواتف سامسونغ، وحل مشكلة صعوبة النسخ الاحتياطي والمشاركة بكميات كبيرة للملفات الكبيرة والعديد من الملفات.

على سبيل المثال، إذا قال المستخدم لمساعد الصوت في هاتفه: "قم بعمل نسخة احتياطية للصور التي تم التقاطها أمس في أوشن إلى بايدو ون درايف، وأرسل صور شياومين إليه". سيتم رفع الصور ذات الصلة إلى حساب التخزين السحابي المصرح به من قبل المستخدم، وسيتم إنشاء رابط للمشاركة، ثم يقوم مساعد الهاتف بالاتصال بدفتر العناوين، ويرسل هذا الرابط إلى الهاتف الآخر عبر رسالة نصية، ما إن يتم النقر على الرابط، سيتمكن المستخدم من الدخول مباشرة إلى بايدو ون درايف لمعاينة أو حفظ الصور.

لا شك أن اختبار موثوقية قدرات نظام التشغيل الأساسية لا يعتمد على كمية الأدوات المجمعة أو عدد التقنيات المتقدمة. إن مدى سهولة استخدام و نضج و غنى خدمات التطبيقات العليا هو أفضل معيار لاختبار قدرات نظام التشغيل.

03

قصة نظام التشغيل ليس لها نهاية

في سوق المال، النوع الأكثر اعترافًا به من الشركات من قبل المستثمرين يسمى "أصدقاء الوقت".

صديق الوقت هو عندما تقوم الشركة بشيء صحيح، كل ما عليها هو الاستمرار في ذلك، وبالتالي ستستمر النتائج في النمو بشكل مستمر، وسيستفيد مطورو النظام البيئي بشكل مستمر.

ونظام التشغيل هو سوق نموذجي من نوع محرك الحركة الدائمة. طالما أن سوق أجهزة الكمبيوتر والهواتف المحمولة لا يزال موجودًا، فإن قصة أنظمة التشغيل التابعة لمايكروسوفت وآبل وجوجل لن تنتهي.

النماذج الكبيرة كذلك. عندما تجتمع "التفكير العميق + التسليم العميق + البيانات العامة والخاصة + نظام MCP البيئي" معًا، ستصبح AI في المستقبل قوة لا تقهر، وحاضرة في كل مكان، وبالتالي، ستظهر أنواع جديدة مثل الانفجار الكبير في الكمبري بشكل مستمر.

في هذه العملية، عند النظر إلى الأسفل، هناك مكتبة بايدو، وقرص بايدو السحابي، وما إلى ذلك، من الانفتاح على قدراتها الخاصة. من خلال احتضان النظام البيئي بنشاط، أصبحوا مبتكري نوع جديد من النماذج الكبيرة وواضعي قواعد جديدة.

عند النظر لأعلى، هناك عدد لا يحصى من الوكلاء الجدد تم إنشاؤهم ورؤيتهم استنادًا إلى "نظام تشانغ زو"، مما يشكل نظامًا بيئيًا جديدًا لخدمات التطبيقات المتدفقة.

ولكن في الوقت الحالي، كل القصص، بدأت للتو.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • 1
  • مشاركة
تعليق
0/400
GateUser-b76d427bvip
· منذ 13 س
شكرا على المقالة المثيرة للاهتمام
شاهد النسخة الأصليةرد0
  • تثبيت