Les grands modèles peuvent résumer ce qui s'est passé en Chine au cours des cinq mille dernières années, mais ils ne peuvent pas répondre à l'heure qu'il est maintenant ; ils peuvent expliquer ce qu'est la mécanique quantique, mais il leur est très difficile de réaliser un PPT professionnel bien illustré.
Pourquoi les grands modèles semblent-ils omnipotents, mais en réalité, leur utilisation laisse toujours un peu à désirer ?
La raison est simple : être intelligent et instruit ne signifie pas être capable de travailler.
Intelligent, nécessite un grand modèle entraîné et appris à travers une quantité massive de connaissances, a développé un cerveau avancé, capable de bien répondre à une question ;
Et en même temps satisfaire aux deux éléments de l'intelligence et de la compétence, il est nécessaire d'associer ce cerveau intelligent à des membres agiles pour réaliser "pensée profonde + livraison profonde".
C'est donc pour cette raison que la manière de faire évoluer les grands modèles d'une réflexion intelligente à une réalisation "intelligente et capable" est devenue le facteur décisif pour savoir si cette vague de grands modèles est une passade ou un tournant historique.
Baidu a fourni un échantillon.
Le 25 avril, lors de la conférence des développeurs AI Create 2025 de Baidu, le fondateur de Baidu, Robin Li, a présenté le premier système d'exploitation mondial dans le domaine du contenu, développé en collaboration avec Baidu Wenku et Baidu Wangpan - le système d'exploitation Cangzhou OS.
En intégrant pleinement les technologies, capacités et données sous-jacentes accumulées par Baidu Wenku et Wangpan, il peut circuler dans différents scénarios comme de l'eau, sous la forme la plus raisonnable et avec l'interface d'interaction la plus pratique pour les utilisateurs, réalisant une livraison de haute qualité à faible seuil et de bout en bout.
S'appuyant sur le système d'exploitation Cangzhou, la vision et les attentes de Baidu Wenku et Baidu Wangpan pour l'IA sont de réaliser une livraison véritablement intégrée et de bout en bout, à tout moment, en tout lieu et sur n'importe quel appareil, permettant à l'IA d'être « omnipotente et omniprésente ».
01
Cangzhou OS, permet à l'IA d'atteindre une évolution au niveau du système d'exploitation.
Il existe un consensus dans l'industrie technologique : toute technologie, depuis le laboratoire jusqu'à sa réelle adoption par le grand public, doit passer par un long parcours sur la courbe de Gartner.
Dans cette courbe, la croissance de la première phase dépend principalement de l'enthousiasme du marché suscité par les avancées technologiques. Cependant, avec des résultats décevants sur le terrain, cette phase de croissance entrera rapidement en déclin, jusqu'à ce que les conditions nécessaires à la mise en œuvre de la technologie mûrissent progressivement et se concrétisent en une infrastructure presque sans seuil, omnipotente et omniprésente, après quoi l'explosion de l'écosystème de la deuxième phase suivra.
L'un des signes de l'ouverture de la deuxième phase de l'industrie logicielle est généralement l'apparition d'un système d'exploitation mature, comme Windows pour l'industrie informatique, iOS pour l'industrie des téléphones.
Alors comment définir un système d'exploitation mature ? Il y a environ 15 ans, l'industrie technologique mondiale a eu ce débat : ayant la capacité d'opérer par écran tactile, les grands smartphones, de passer des appels, de prendre des photos, d'écouter de la musique, d'envoyer des SMS, pourquoi les produits d'Apple ou les smartphones intelligents sont-ils deux espèces différentes par rapport aux anciens téléphones fonctionnels ?
L'une des raisons principales est qu'iOS a hérité de la stabilité au niveau du noyau et de la capacité multitâche de MAC OS, et en a fait un écosystème ouvert, permettant aux développeurs d'intégrer librement ces capacités fondamentales d'Apple et de créer leurs propres applications innovantes. Cela a également transformé la définition d'un téléphone mobile, passant d'une affaire de quelques géants comme Motorola et Nokia à un secteur immense impliquant tout l'écosystème, avec des possibilités infinies, ouvrant ainsi la porte à plus de dix ans d'Internet mobile.
La technologie avance à grands pas, mais les récits commerciaux se répètent invariablement sur un rythme similaire. La logique sous-jacente, validée dans les systèmes d'exploitation mobiles, reste pertinente dans la construction des systèmes d'exploitation à l'ère des grands modèles.
En résumé, il y en a trois : des capacités de base complètes, une orchestration centrale flexible et un écosystème de services d'application prospère. Cela correspond parfaitement à l'architecture à trois niveaux de Cangzhou OS : infrastructure de base, système central et services d'application. La seule différence est que le pont entre les applications, le système central et la base est passé d'API traditionnelles à un MCP plus standardisé et à faible barrière.
Dans la partie infrastructure de la base du serveur MCP, son composant central est Chatfile plus, dont le rôle principal est de décomposer et d'analyser le contenu de manière élémentaire à travers un cadre de connaissance, ainsi que de gérer une série de composants d'outils pour la compréhension multimodale, la recherche multimodale, et la conversion et l'analyse des fichiers.
En même temps, Baidu Wenku et Wangpan ont construit trois grandes bibliothèques : la bibliothèque de connaissances publiques, la bibliothèque de connaissances privées et la mémoire. Cela fait référence aux données de connaissances publiques accumulées par Baidu Wenku pendant de nombreuses années (bibliothèque de connaissances publiques), aux données de connaissances utilisées avec l'autorisation des utilisateurs de Wangpan (bibliothèque de connaissances privées) et aux instructions, habitudes d'utilisation et enregistrements historiques générés par les utilisateurs dans Wenku ou Wangpan (mémoire).
Ces données se présentent souvent sous différentes modalités, différentes formes et différents formats. Parmi celles-ci, la base de connaissances publique fournit des connaissances générales, tandis que la base de connaissances privée et la mémoire conservent les données personnalisées de l'utilisateur.
Dans le cadre du cadre de connaissance, le système Cangzhou OS effectuera un traitement de vectorisation et de labellisation du contenu multimodal dans les « trois grandes bibliothèques », c'est-à-dire qu'il convertira des données non structurées telles que des images, du texte, de la vidéo, de l'audio et des documents en données vectorielles multidimensionnelles compréhensibles par l'ordinateur, c'est-à-dire un ensemble de tokens.
Et dans le système central, Baidu Wenku et Wangpan ont développé « trois grands outils », à savoir l'éditeur intégré (pour l'édition de documents, PPT, etc.), le lecteur (pour la lecture de documents et PPT, etc.) et le lecteur multimédia (pour la lecture audio et vidéo).
En même temps, le système d'exploitation Cangzhou OS peut également passer par le « Centre de gestion », en utilisant des composants interactifs, des modèles d'intention et des infrastructures de transport, combinant la mémoire de l'utilisateur et les données d'image, pour comprendre l'intention de l'utilisateur grâce aux modèles et répartir efficacement les agents de gestion.
Au sommet, il y a une série d'agents AI. Le « Cangzhou OS » intègre des centaines d'agents AI tels que des bibliothèques, des disques en ligne de PPT, des livres illustrés AI, des cartes mentales AI, des affiches AI, des notes AI, des scans AI, des transcriptions AI, etc. Les modes de génération couvrent diverses catégories telles que l'image, le texte, la vidéo et le son, couvrant intégralement des scénarios d'apprentissage au travail, de vie et de divertissement. De plus, grâce aux capacités d'édition, de modification et de réglage fin intégrées de l'éditeur, la qualité de la recherche et de la génération de contenu est améliorée, répondant ainsi mieux aux besoins des tâches personnalisées.
02
sur le système d'exploitation Cangzhou OS,
Créer plus d'Agents « intelligents et efficaces »
Autour des services d'application de premier niveau, Baidu Wenku et Baidu Wangpan ont lancé des centaines d'agents IA éprouvés par des centaines de millions d'utilisateurs, tout en intégrant de nombreux agents professionnels tiers pour développer l'écosystème des applications.
En tant que « plateforme de création et d'acquisition de contenu AI tout-en-un », Baidu Wenku compte plus de 40 millions d'utilisateurs payants, avec 97 millions d'utilisateurs actifs mensuels d'IA. Baidu Wangpan a également été mis à niveau en tant que « plateforme de services de contenu tout-en-un », servant plus d'un milliard d'utilisateurs, avec un espace de stockage total dépassant 1000 milliards de Go, et plus de 80 millions d'utilisateurs actifs mensuels d'IA. Baidu Wenku et Baidu Wangpan sont devenus de véritables « super-productivités » à l'ère des grands modèles.
Lors de la conférence, Baidu Wenku et Baidu Wangpan ont également présenté de nouvelles capacités développées sur la base de "Cangzhou OS" : "GenFlow Super Partner" et "AI Notes".
GenFlow Super Collaborator est une capacité de collaboration multi-agents lancée par l'application Baidu Wenku. Avec le soutien de « Cangzhou OS », la génération de contenu peut être réalisée en parallèle sur plusieurs tâches, et peut également accomplir divers livrables en se basant sur les informations en ligne les plus complètes et professionnelles, ainsi que sur les habitudes et préférences propres à l'utilisateur.
Par exemple, si un utilisateur souhaite organiser un mariage, mais que l'entrée initiale est seulement une simple phrase : Je veux organiser un mariage en plein air à Hainan pendant la fête du Travail, aide-moi à faire un plan et des invitations.
La demande semble simple, il suffit de remplir les blancs en se basant sur un modèle historique. Mais pour satisfaire les utilisateurs, il est nécessaire de connaître leurs préférences esthétiques, leurs attentes budgétaires, et leurs préférences de processus. Il faut également être au courant de la météo à Hainan pendant la période du 1er mai, du flux de personnes, et de la distribution des lieux. Ensuite, il faut combiner ces images et connaissances à l'aide d'un outil PPT pour générer un plan complet. Enfin, basé sur le plan et les préférences esthétiques des utilisateurs, il faut créer une affiche complète pour le faire-part de mariage.
Pour réaliser le contenu ci-dessus, il est nécessaire de gérer séparément l'historique des discussions des utilisateurs, l'historique de navigation, ainsi que la reconnaissance d'intentions, la recherche en ligne et les outils PPT, afin d'analyser les intentions des utilisateurs, de comprendre leurs préférences, de combiner librement les outils, et finalement de fournir aux utilisateurs un plan complet très précis contenant le processus, la date, le lieu, le budget, le thème, les détails d'exécution, le style et l'organisation des personnes.
Parallèlement, le plan et l'affiche requis par l'utilisateur doivent être assortis, ce qui nécessite que toutes les informations des deux soient cohérentes et qu'elles soient produites en parallèle à l'aide du même système d'exploitation.
Bien sûr, l'IA ne peut pas générer d'emblée un résultat qui satisfait tout le monde. Cela nécessite que, qu'il s'agisse d'un plan de mariage ou d'une affiche, il doit y avoir une capacité d'édition. Et c'est la capacité de l'éditeur intégré de "Cangzhou OS" qui soutient cette capacité.
Il n'est pas difficile de constater qu'entre la réflexion approfondie et la livraison approfondie, GenFlow 超能搭子 est presque le seul produit véritablement "multi-agents collaboratifs" disponible sur le marché. Non seulement il résout les problèmes courants des produits collaboratifs multi-agents tels que des coûts élevés, un temps de génération long, une faible efficacité, une incapacité à livrer de manière stable et une incapacité à affiner les dialogues sur plusieurs tours, mais il est également directement intégré à des produits matures et à des données privées autorisées par les utilisateurs, permettant à l'IA d'avoir réellement l'opportunité d'atteindre l'objectif "tout-puissant, omniprésent".
Les notes AI de Baidu Wangpan sont des alliés précieux pour de nombreux travailleurs de bureau et ceux qui préparent des examens.
Les notes AI sont les premières notes AI multimodales dans l'industrie, permettant d'incorporer divers vidéos d'apprentissage pour les examens de diplôme et pages de notes stockées par l'utilisateur sur Baidu Wangpan dans une seule interface, réalisant une interaction fluide. De plus, le contenu vidéo et les notes sont fortement interconnectés, allant de la visualisation des vidéos, à la génération de notes AI, à la création de cartes mentales AI, jusqu'à l'évaluation des résultats d'apprentissage avec des questions AI, couvrant ainsi l'ensemble du cycle d'apprentissage de l'utilisateur.
Prenons un exemple, le fait que l'examen d'anglais pour le diplôme de troisième cycle soit trop difficile est devenu un sujet de conversation populaire récemment. Les utilisateurs souhaitent se concentrer sur la révision de l'anglais pour cet examen. Les notes AI commenceront par rechercher les documents pertinents stockés dans le disque en nuage de l'utilisateur, tout en consultant les points d'examen fournis par les informations publiques en ligne, et les organiser. Cependant, tout le processus ne s'arrête pas là, les notes AI vérifieront également les points d'examen générés en les combinant avec les vraies questions des années précédentes. Seuls les points d'examen validés pourront servir de base pour continuer à générer des cartes mentales et des prévisions de questions, aidant ainsi les utilisateurs à accélérer leur rythme d'apprentissage.
Et dans ce processus, les outils impliqués ne sont rien de moins que l’organisation d’un mariage. Par exemple, trouver des centres d’examen et des questions réelles nécessite la capacité de rechercher l’ensemble du réseau, tandis que les vraies questions sont souvent présentées sous forme de PDF ou même d’images, et que l’interprétation de professeurs célèbres est présentée sous forme de vidéos, ce qui nécessite la capacité d’analyser des contenus multimodaux. La génération finale de cartes mentales et la prédiction des questions de test nécessitent la capacité de raisonnement du grand modèle, la capacité de génération de contenu multimodal et la capacité de cartographier et d’associer différents contenus, et en même temps, il est également nécessaire d’assurer la précision absolue de la génération de contenu.
C'est le pouvoir de « Cangzhou OS » qui se cache derrière cela.
Bien sûr, Baidu soutient les développeurs à embrasser pleinement le MCP, donc le système d'exploitation Cangzhou OS ne sert pas seulement l'écosystème interne de Baidu. Un des aspects les plus importants du développement et de la croissance d'un système d'exploitation est l'ouverture vers l'extérieur, afin de stimuler la capacité d'innovation des nombreux développeurs.
Ainsi, afin de maximiser la valeur de l'écosystème et des applications, Baidu Wenku et Baidu Wangpan, basés sur "Cangzhou OS", ont d'abord pleinement intégré le MCP dans le lien entre les produits et l'écosystème, construisant un système à trois niveaux MCP Server-Client-Host, ouvrant les capacités de Wenku et Wangpan sous la forme de MCP Server, et facilitant l'accès à un plus grand nombre d'utilisateurs d'entreprise, de développeurs et d'applications intelligentes via le MCP Client SDK.
Parmi eux, le cas le plus représentatif est celui des téléphones Samsung. Les téléphones Samsung sont en train de se connecter à plusieurs serveurs MCP pour le téléchargement, le téléchargement, la recherche, le partage et la compréhension du contenu des fichiers de Baidu Wenku.
D'une part, les utilisateurs peuvent, via l'interface de l'assistant vocal de leur téléphone, réaliser directement des fonctions telles que le téléchargement de fichiers pour la sauvegarde sur le cloud, le partage en ligne, le résumé de documents et les questions-réponses sur le contenu en parlant.
D'autre part, ces serveurs peuvent également enrichir la capacité de stockage en cloud du système des téléphones Samsung, résolvant ainsi les problèmes de sauvegarde et de partage en masse de fichiers volumineux et de nombreux fichiers.
Par exemple, dans l’album photo du téléphone portable, l’utilisateur évoque l’assistant vocal et dit : « Sauvegardez les photos prises à Aosen hier sur Baidu Netdisk, et envoyez-lui les photos de Xiao Ming ». Les photos pertinentes seront téléchargées sur le compte de disque réseau autorisé de l’utilisateur,Et générer un lien de partage,L’assistant de téléphonie mobile appelle ensuite le carnet d’adresses,Envoyez ce lien au téléphone mobile de l’autre partie par SMS,Tant que vous cliquez sur le lien,L’utilisateur peut entrer directement dans le disque réseau Baidu pour afficher ou vider。
Il ne fait aucun doute que la fiabilité des capacités sous-jacentes d'un système d'exploitation ne dépend pas de l'accumulation d'outils ou de la quantité de technologies avancées. La convivialité, la maturité et la richesse de l'écosystème des services applicatifs sont les meilleurs critères pour évaluer les capacités d'un système d'exploitation.
03
L'histoire d'OS n'a pas de fin.
Sur le marché des capitaux, le type d'entreprise le plus reconnu par les investisseurs s'appelle « l'ami du temps ».
Le soi-disant ami du temps, c'est lorsque l'entreprise a bien fait quelque chose, il suffit ensuite de continuer à le faire, et les performances continueront à croître de manière perpétuelle, permettant aux développeurs de l'écosystème de bénéficier en continu.
Et le système d'exploitation est un marché typique de moteur perpétuel. Tant que le marché des ordinateurs et des téléphones mobiles existe encore, l'histoire des systèmes d'exploitation de Microsoft, Apple et Google n'aura pas de fin.
Les grands modèles fonctionnent de la même manière. Lorsque la « pensée profonde + livraison profonde + données publiques et privées + écosystème MCP » se réunissent, l'IA de nouvelle génération, omniprésente et toute-puissante, émergera, entraînant ainsi une explosion continue de nouvelles espèces similaires à celle de la période cambrienne.
Dans ce processus, en regardant vers le bas, il s'agit de l'ouverture de capacités telles que Baidu Wenku et Baidu Wangpan. En adoptant activement l'écosystème, ils deviennent les créateurs de nouvelles espèces de grands modèles et les rédacteurs de nouvelles règles.
En regardant vers le haut, on voit d'innombrables nouveaux Agents créés et visibles grâce au « Cangzhou OS », formant un écosystème de nouveaux services d'application puissant et jaillissant.
Et maintenant, toutes les histoires ne font que commencer.
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Pourquoi Baidu veut-il commencer par un "système d'exploitation" pour créer une IA "omnisciente et omniprésente" ?
Auteur : pump geek
Les grands modèles peuvent résumer ce qui s'est passé en Chine au cours des cinq mille dernières années, mais ils ne peuvent pas répondre à l'heure qu'il est maintenant ; ils peuvent expliquer ce qu'est la mécanique quantique, mais il leur est très difficile de réaliser un PPT professionnel bien illustré.
Pourquoi les grands modèles semblent-ils omnipotents, mais en réalité, leur utilisation laisse toujours un peu à désirer ?
La raison est simple : être intelligent et instruit ne signifie pas être capable de travailler.
Intelligent, nécessite un grand modèle entraîné et appris à travers une quantité massive de connaissances, a développé un cerveau avancé, capable de bien répondre à une question ;
Et en même temps satisfaire aux deux éléments de l'intelligence et de la compétence, il est nécessaire d'associer ce cerveau intelligent à des membres agiles pour réaliser "pensée profonde + livraison profonde".
C'est donc pour cette raison que la manière de faire évoluer les grands modèles d'une réflexion intelligente à une réalisation "intelligente et capable" est devenue le facteur décisif pour savoir si cette vague de grands modèles est une passade ou un tournant historique.
Baidu a fourni un échantillon.
Le 25 avril, lors de la conférence des développeurs AI Create 2025 de Baidu, le fondateur de Baidu, Robin Li, a présenté le premier système d'exploitation mondial dans le domaine du contenu, développé en collaboration avec Baidu Wenku et Baidu Wangpan - le système d'exploitation Cangzhou OS.
En intégrant pleinement les technologies, capacités et données sous-jacentes accumulées par Baidu Wenku et Wangpan, il peut circuler dans différents scénarios comme de l'eau, sous la forme la plus raisonnable et avec l'interface d'interaction la plus pratique pour les utilisateurs, réalisant une livraison de haute qualité à faible seuil et de bout en bout.
S'appuyant sur le système d'exploitation Cangzhou, la vision et les attentes de Baidu Wenku et Baidu Wangpan pour l'IA sont de réaliser une livraison véritablement intégrée et de bout en bout, à tout moment, en tout lieu et sur n'importe quel appareil, permettant à l'IA d'être « omnipotente et omniprésente ».
01
Cangzhou OS, permet à l'IA d'atteindre une évolution au niveau du système d'exploitation.
Il existe un consensus dans l'industrie technologique : toute technologie, depuis le laboratoire jusqu'à sa réelle adoption par le grand public, doit passer par un long parcours sur la courbe de Gartner.
Dans cette courbe, la croissance de la première phase dépend principalement de l'enthousiasme du marché suscité par les avancées technologiques. Cependant, avec des résultats décevants sur le terrain, cette phase de croissance entrera rapidement en déclin, jusqu'à ce que les conditions nécessaires à la mise en œuvre de la technologie mûrissent progressivement et se concrétisent en une infrastructure presque sans seuil, omnipotente et omniprésente, après quoi l'explosion de l'écosystème de la deuxième phase suivra.
L'un des signes de l'ouverture de la deuxième phase de l'industrie logicielle est généralement l'apparition d'un système d'exploitation mature, comme Windows pour l'industrie informatique, iOS pour l'industrie des téléphones.
Alors comment définir un système d'exploitation mature ? Il y a environ 15 ans, l'industrie technologique mondiale a eu ce débat : ayant la capacité d'opérer par écran tactile, les grands smartphones, de passer des appels, de prendre des photos, d'écouter de la musique, d'envoyer des SMS, pourquoi les produits d'Apple ou les smartphones intelligents sont-ils deux espèces différentes par rapport aux anciens téléphones fonctionnels ?
L'une des raisons principales est qu'iOS a hérité de la stabilité au niveau du noyau et de la capacité multitâche de MAC OS, et en a fait un écosystème ouvert, permettant aux développeurs d'intégrer librement ces capacités fondamentales d'Apple et de créer leurs propres applications innovantes. Cela a également transformé la définition d'un téléphone mobile, passant d'une affaire de quelques géants comme Motorola et Nokia à un secteur immense impliquant tout l'écosystème, avec des possibilités infinies, ouvrant ainsi la porte à plus de dix ans d'Internet mobile.
La technologie avance à grands pas, mais les récits commerciaux se répètent invariablement sur un rythme similaire. La logique sous-jacente, validée dans les systèmes d'exploitation mobiles, reste pertinente dans la construction des systèmes d'exploitation à l'ère des grands modèles.
En résumé, il y en a trois : des capacités de base complètes, une orchestration centrale flexible et un écosystème de services d'application prospère. Cela correspond parfaitement à l'architecture à trois niveaux de Cangzhou OS : infrastructure de base, système central et services d'application. La seule différence est que le pont entre les applications, le système central et la base est passé d'API traditionnelles à un MCP plus standardisé et à faible barrière.
Dans la partie infrastructure de la base du serveur MCP, son composant central est Chatfile plus, dont le rôle principal est de décomposer et d'analyser le contenu de manière élémentaire à travers un cadre de connaissance, ainsi que de gérer une série de composants d'outils pour la compréhension multimodale, la recherche multimodale, et la conversion et l'analyse des fichiers.
En même temps, Baidu Wenku et Wangpan ont construit trois grandes bibliothèques : la bibliothèque de connaissances publiques, la bibliothèque de connaissances privées et la mémoire. Cela fait référence aux données de connaissances publiques accumulées par Baidu Wenku pendant de nombreuses années (bibliothèque de connaissances publiques), aux données de connaissances utilisées avec l'autorisation des utilisateurs de Wangpan (bibliothèque de connaissances privées) et aux instructions, habitudes d'utilisation et enregistrements historiques générés par les utilisateurs dans Wenku ou Wangpan (mémoire).
Ces données se présentent souvent sous différentes modalités, différentes formes et différents formats. Parmi celles-ci, la base de connaissances publique fournit des connaissances générales, tandis que la base de connaissances privée et la mémoire conservent les données personnalisées de l'utilisateur.
Dans le cadre du cadre de connaissance, le système Cangzhou OS effectuera un traitement de vectorisation et de labellisation du contenu multimodal dans les « trois grandes bibliothèques », c'est-à-dire qu'il convertira des données non structurées telles que des images, du texte, de la vidéo, de l'audio et des documents en données vectorielles multidimensionnelles compréhensibles par l'ordinateur, c'est-à-dire un ensemble de tokens.
Et dans le système central, Baidu Wenku et Wangpan ont développé « trois grands outils », à savoir l'éditeur intégré (pour l'édition de documents, PPT, etc.), le lecteur (pour la lecture de documents et PPT, etc.) et le lecteur multimédia (pour la lecture audio et vidéo).
En même temps, le système d'exploitation Cangzhou OS peut également passer par le « Centre de gestion », en utilisant des composants interactifs, des modèles d'intention et des infrastructures de transport, combinant la mémoire de l'utilisateur et les données d'image, pour comprendre l'intention de l'utilisateur grâce aux modèles et répartir efficacement les agents de gestion.
Au sommet, il y a une série d'agents AI. Le « Cangzhou OS » intègre des centaines d'agents AI tels que des bibliothèques, des disques en ligne de PPT, des livres illustrés AI, des cartes mentales AI, des affiches AI, des notes AI, des scans AI, des transcriptions AI, etc. Les modes de génération couvrent diverses catégories telles que l'image, le texte, la vidéo et le son, couvrant intégralement des scénarios d'apprentissage au travail, de vie et de divertissement. De plus, grâce aux capacités d'édition, de modification et de réglage fin intégrées de l'éditeur, la qualité de la recherche et de la génération de contenu est améliorée, répondant ainsi mieux aux besoins des tâches personnalisées.
02
sur le système d'exploitation Cangzhou OS,
Créer plus d'Agents « intelligents et efficaces »
Autour des services d'application de premier niveau, Baidu Wenku et Baidu Wangpan ont lancé des centaines d'agents IA éprouvés par des centaines de millions d'utilisateurs, tout en intégrant de nombreux agents professionnels tiers pour développer l'écosystème des applications.
En tant que « plateforme de création et d'acquisition de contenu AI tout-en-un », Baidu Wenku compte plus de 40 millions d'utilisateurs payants, avec 97 millions d'utilisateurs actifs mensuels d'IA. Baidu Wangpan a également été mis à niveau en tant que « plateforme de services de contenu tout-en-un », servant plus d'un milliard d'utilisateurs, avec un espace de stockage total dépassant 1000 milliards de Go, et plus de 80 millions d'utilisateurs actifs mensuels d'IA. Baidu Wenku et Baidu Wangpan sont devenus de véritables « super-productivités » à l'ère des grands modèles.
Lors de la conférence, Baidu Wenku et Baidu Wangpan ont également présenté de nouvelles capacités développées sur la base de "Cangzhou OS" : "GenFlow Super Partner" et "AI Notes".
GenFlow Super Collaborator est une capacité de collaboration multi-agents lancée par l'application Baidu Wenku. Avec le soutien de « Cangzhou OS », la génération de contenu peut être réalisée en parallèle sur plusieurs tâches, et peut également accomplir divers livrables en se basant sur les informations en ligne les plus complètes et professionnelles, ainsi que sur les habitudes et préférences propres à l'utilisateur.
Par exemple, si un utilisateur souhaite organiser un mariage, mais que l'entrée initiale est seulement une simple phrase : Je veux organiser un mariage en plein air à Hainan pendant la fête du Travail, aide-moi à faire un plan et des invitations.
La demande semble simple, il suffit de remplir les blancs en se basant sur un modèle historique. Mais pour satisfaire les utilisateurs, il est nécessaire de connaître leurs préférences esthétiques, leurs attentes budgétaires, et leurs préférences de processus. Il faut également être au courant de la météo à Hainan pendant la période du 1er mai, du flux de personnes, et de la distribution des lieux. Ensuite, il faut combiner ces images et connaissances à l'aide d'un outil PPT pour générer un plan complet. Enfin, basé sur le plan et les préférences esthétiques des utilisateurs, il faut créer une affiche complète pour le faire-part de mariage.
Pour réaliser le contenu ci-dessus, il est nécessaire de gérer séparément l'historique des discussions des utilisateurs, l'historique de navigation, ainsi que la reconnaissance d'intentions, la recherche en ligne et les outils PPT, afin d'analyser les intentions des utilisateurs, de comprendre leurs préférences, de combiner librement les outils, et finalement de fournir aux utilisateurs un plan complet très précis contenant le processus, la date, le lieu, le budget, le thème, les détails d'exécution, le style et l'organisation des personnes.
Parallèlement, le plan et l'affiche requis par l'utilisateur doivent être assortis, ce qui nécessite que toutes les informations des deux soient cohérentes et qu'elles soient produites en parallèle à l'aide du même système d'exploitation.
Bien sûr, l'IA ne peut pas générer d'emblée un résultat qui satisfait tout le monde. Cela nécessite que, qu'il s'agisse d'un plan de mariage ou d'une affiche, il doit y avoir une capacité d'édition. Et c'est la capacité de l'éditeur intégré de "Cangzhou OS" qui soutient cette capacité.
Il n'est pas difficile de constater qu'entre la réflexion approfondie et la livraison approfondie, GenFlow 超能搭子 est presque le seul produit véritablement "multi-agents collaboratifs" disponible sur le marché. Non seulement il résout les problèmes courants des produits collaboratifs multi-agents tels que des coûts élevés, un temps de génération long, une faible efficacité, une incapacité à livrer de manière stable et une incapacité à affiner les dialogues sur plusieurs tours, mais il est également directement intégré à des produits matures et à des données privées autorisées par les utilisateurs, permettant à l'IA d'avoir réellement l'opportunité d'atteindre l'objectif "tout-puissant, omniprésent".
Les notes AI de Baidu Wangpan sont des alliés précieux pour de nombreux travailleurs de bureau et ceux qui préparent des examens.
Les notes AI sont les premières notes AI multimodales dans l'industrie, permettant d'incorporer divers vidéos d'apprentissage pour les examens de diplôme et pages de notes stockées par l'utilisateur sur Baidu Wangpan dans une seule interface, réalisant une interaction fluide. De plus, le contenu vidéo et les notes sont fortement interconnectés, allant de la visualisation des vidéos, à la génération de notes AI, à la création de cartes mentales AI, jusqu'à l'évaluation des résultats d'apprentissage avec des questions AI, couvrant ainsi l'ensemble du cycle d'apprentissage de l'utilisateur.
Prenons un exemple, le fait que l'examen d'anglais pour le diplôme de troisième cycle soit trop difficile est devenu un sujet de conversation populaire récemment. Les utilisateurs souhaitent se concentrer sur la révision de l'anglais pour cet examen. Les notes AI commenceront par rechercher les documents pertinents stockés dans le disque en nuage de l'utilisateur, tout en consultant les points d'examen fournis par les informations publiques en ligne, et les organiser. Cependant, tout le processus ne s'arrête pas là, les notes AI vérifieront également les points d'examen générés en les combinant avec les vraies questions des années précédentes. Seuls les points d'examen validés pourront servir de base pour continuer à générer des cartes mentales et des prévisions de questions, aidant ainsi les utilisateurs à accélérer leur rythme d'apprentissage.
Et dans ce processus, les outils impliqués ne sont rien de moins que l’organisation d’un mariage. Par exemple, trouver des centres d’examen et des questions réelles nécessite la capacité de rechercher l’ensemble du réseau, tandis que les vraies questions sont souvent présentées sous forme de PDF ou même d’images, et que l’interprétation de professeurs célèbres est présentée sous forme de vidéos, ce qui nécessite la capacité d’analyser des contenus multimodaux. La génération finale de cartes mentales et la prédiction des questions de test nécessitent la capacité de raisonnement du grand modèle, la capacité de génération de contenu multimodal et la capacité de cartographier et d’associer différents contenus, et en même temps, il est également nécessaire d’assurer la précision absolue de la génération de contenu.
C'est le pouvoir de « Cangzhou OS » qui se cache derrière cela.
Bien sûr, Baidu soutient les développeurs à embrasser pleinement le MCP, donc le système d'exploitation Cangzhou OS ne sert pas seulement l'écosystème interne de Baidu. Un des aspects les plus importants du développement et de la croissance d'un système d'exploitation est l'ouverture vers l'extérieur, afin de stimuler la capacité d'innovation des nombreux développeurs.
Ainsi, afin de maximiser la valeur de l'écosystème et des applications, Baidu Wenku et Baidu Wangpan, basés sur "Cangzhou OS", ont d'abord pleinement intégré le MCP dans le lien entre les produits et l'écosystème, construisant un système à trois niveaux MCP Server-Client-Host, ouvrant les capacités de Wenku et Wangpan sous la forme de MCP Server, et facilitant l'accès à un plus grand nombre d'utilisateurs d'entreprise, de développeurs et d'applications intelligentes via le MCP Client SDK.
Parmi eux, le cas le plus représentatif est celui des téléphones Samsung. Les téléphones Samsung sont en train de se connecter à plusieurs serveurs MCP pour le téléchargement, le téléchargement, la recherche, le partage et la compréhension du contenu des fichiers de Baidu Wenku.
D'une part, les utilisateurs peuvent, via l'interface de l'assistant vocal de leur téléphone, réaliser directement des fonctions telles que le téléchargement de fichiers pour la sauvegarde sur le cloud, le partage en ligne, le résumé de documents et les questions-réponses sur le contenu en parlant.
D'autre part, ces serveurs peuvent également enrichir la capacité de stockage en cloud du système des téléphones Samsung, résolvant ainsi les problèmes de sauvegarde et de partage en masse de fichiers volumineux et de nombreux fichiers.
Par exemple, dans l’album photo du téléphone portable, l’utilisateur évoque l’assistant vocal et dit : « Sauvegardez les photos prises à Aosen hier sur Baidu Netdisk, et envoyez-lui les photos de Xiao Ming ». Les photos pertinentes seront téléchargées sur le compte de disque réseau autorisé de l’utilisateur,Et générer un lien de partage,L’assistant de téléphonie mobile appelle ensuite le carnet d’adresses,Envoyez ce lien au téléphone mobile de l’autre partie par SMS,Tant que vous cliquez sur le lien,L’utilisateur peut entrer directement dans le disque réseau Baidu pour afficher ou vider。
Il ne fait aucun doute que la fiabilité des capacités sous-jacentes d'un système d'exploitation ne dépend pas de l'accumulation d'outils ou de la quantité de technologies avancées. La convivialité, la maturité et la richesse de l'écosystème des services applicatifs sont les meilleurs critères pour évaluer les capacités d'un système d'exploitation.
03
L'histoire d'OS n'a pas de fin.
Sur le marché des capitaux, le type d'entreprise le plus reconnu par les investisseurs s'appelle « l'ami du temps ».
Le soi-disant ami du temps, c'est lorsque l'entreprise a bien fait quelque chose, il suffit ensuite de continuer à le faire, et les performances continueront à croître de manière perpétuelle, permettant aux développeurs de l'écosystème de bénéficier en continu.
Et le système d'exploitation est un marché typique de moteur perpétuel. Tant que le marché des ordinateurs et des téléphones mobiles existe encore, l'histoire des systèmes d'exploitation de Microsoft, Apple et Google n'aura pas de fin.
Les grands modèles fonctionnent de la même manière. Lorsque la « pensée profonde + livraison profonde + données publiques et privées + écosystème MCP » se réunissent, l'IA de nouvelle génération, omniprésente et toute-puissante, émergera, entraînant ainsi une explosion continue de nouvelles espèces similaires à celle de la période cambrienne.
Dans ce processus, en regardant vers le bas, il s'agit de l'ouverture de capacités telles que Baidu Wenku et Baidu Wangpan. En adoptant activement l'écosystème, ils deviennent les créateurs de nouvelles espèces de grands modèles et les rédacteurs de nouvelles règles.
En regardant vers le haut, on voit d'innombrables nouveaux Agents créés et visibles grâce au « Cangzhou OS », formant un écosystème de nouveaux services d'application puissant et jaillissant.
Et maintenant, toutes les histoires ne font que commencer.