Tại sao Baidu lại bắt đầu từ "hệ điều hành" để xây dựng AI "vô hạn, mọi lúc mọi nơi"?

Tác giả: bơm phong cách

Mô hình lớn có thể tổng hợp những gì đã xảy ra trong năm ngàn năm lịch sử Trung Quốc, nhưng không thể trả lời bây giờ là mấy giờ; có thể giải thích rõ ràng cái gọi là cơ học lượng tử, nhưng lại rất khó để làm một PPT chuyên nghiệp với hình ảnh và văn bản đầy đủ.

Tại sao mô hình lớn có vẻ như vô song, nhưng thực tế khi sử dụng lại luôn thiếu một chút gì đó?

Lý do rất đơn giản, thông minh, uyên bác không đồng nghĩa với việc có thể làm việc.

Thông minh, cần mô hình lớn thông qua việc đào tạo và học hỏi từ khối lượng kiến thức khổng lồ, đã phát triển một bộ não phát triển, có thể trả lời tốt một câu hỏi;

Và đồng thời thỏa mãn hai yếu tố thông minh và khéo léo, cần phải trang bị cho bộ não thông minh này những chi nhánh linh hoạt để thực hiện "suy nghĩ sâu sắc + giao hàng sâu sắc".

Cũng vì lý do đó, cách thúc đẩy mô hình lớn từ tư duy thông minh đến việc thực hiện "thông minh và có khả năng" trở thành yếu tố quyết định xem cơn sốt mô hình lớn này chỉ là một hiện tượng thoáng qua hay là bàn tay quyết định thay đổi lịch sử.

Baidu đã đưa ra mẫu.

Vào ngày 25 tháng 4, tại hội nghị phát triển AI dành cho các nhà phát triển Create 2025 của Baidu, người sáng lập Baidu, Lý Ngạn Hồng, đã giới thiệu hệ điều hành đầu tiên trên thế giới trong lĩnh vực nội dung - Cang Châu OS, được ra mắt cùng với Baidu Wenku và Baidu Wangpan.

Nó có thể thông qua việc tận dụng triệt để công nghệ, năng lực và dữ liệu nền tảng đã tích lũy từ Baidu Wenku và ổ đĩa mạng, giống như nước, hòa nhập vào các tình huống khác nhau, với hình thức hợp lý nhất, giao diện tương tác tiện lợi nhất cho người dùng, để đạt được việc giao hàng chất lượng cao với rào cản thấp và từ đầu đến cuối.

Dựa trên hệ điều hành Cangzhou OS, tầm nhìn và kỳ vọng của Baidu Wenku, Baidu Wangpan về AI là đạt được sự giao hàng thật sự một cửa, đầu cuối đến đầu cuối ở bất kỳ thời điểm nào, bất kỳ nơi nào, trên bất kỳ thiết bị đầu cuối nào, để AI có thể "không gì không làm, không đâu không có".

01

沧舟 OS, để AI tiến tới sự tiến hóa cấp hệ điều hành

Trong ngành công nghệ, có một sự đồng thuận rằng bất kỳ công nghệ nào từ phòng thí nghiệm đến thực sự đến với hàng triệu hộ gia đình đều cần trải qua một quá trình dài theo đường cong Gartner.

Trong đường cong này, sự tăng trưởng ở giai đoạn đầu tiên chủ yếu phụ thuộc vào kỳ vọng thị trường cuồng nhiệt do tiến bộ công nghệ mang lại, nhưng khi hiệu quả của công nghệ không đạt yêu cầu, sự tăng trưởng ở giai đoạn này sẽ nhanh chóng bước vào suy thoái, cho đến khi các điều kiện cần thiết cho việc triển khai công nghệ dần trưởng thành và được hình thành thành cơ sở hạ tầng gần như không có rào cản, toàn năng và hiện diện mọi nơi, giai đoạn thứ hai của sự bùng nổ sinh thái sẽ đến.

Một trong những dấu hiệu cho sự khởi đầu của giai đoạn thứ hai trong ngành công nghiệp phần mềm thường là sự xuất hiện của một hệ điều hành trưởng thành, chẳng hạn như Windows đối với ngành công nghiệp máy tính, iOS đối với ngành công nghiệp điện thoại.

Vậy làm thế nào để định nghĩa một hệ điều hành trưởng thành? Khoảng 15 năm trước, trong ngành công nghệ toàn cầu, đã có một cuộc tranh luận như vậy: Cùng là có thể thao tác bằng màn hình cảm ứng, điện thoại màn hình lớn, có thể gọi điện, chụp ảnh, nghe nhạc, gửi tin nhắn, tại sao Apple hay nói cách khác là điện thoại thông minh lại là hai loài khác nhau so với những chiếc điện thoại chức năng trước đây.

Một trong những lý do chính là iOS kế thừa khả năng ổn định và đa nhiệm cấp nhân từ MAC OS, và đã biến nó thành một hệ sinh thái mở, cho phép các nhà phát triển tự do tích hợp những khả năng cơ bản của Apple để tạo ra các ứng dụng đổi mới của riêng họ. Điều này cũng đã biến việc định nghĩa một chiếc điện thoại từ việc chỉ có một hoặc hai ông lớn như Motorola, Nokia thành một ngành công nghiệp khổng lồ với sự tham gia của toàn bộ hệ sinh thái, mở ra vô vàn khả năng, từ đó mở ra cánh cửa cho hơn mười năm phát triển của internet di động.

Công nghệ sẽ tiếp tục tiến lên, nhưng cốt truyện của câu chuyện kinh doanh luôn lặp đi lặp lại theo nhịp điệu tương tự. Logic cơ bản đã được xác nhận trong hệ điều hành điện thoại di động vẫn áp dụng cho việc xây dựng hệ điều hành trong thời đại mô hình lớn.

Tóm lại có ba điểm: khả năng nền tảng hoàn chỉnh, điều phối trung tâm linh hoạt, và hệ sinh thái dịch vụ ứng dụng phong phú. Điều này tương ứng với ba lớp kiến trúc của Cang Zhou OS: cơ sở hạ tầng nền tảng, hệ thống trung tâm và dịch vụ ứng dụng. Điểm khác biệt duy nhất là cầu nối giữa ứng dụng và trung tâm, cũng như giữa nền tảng, đã được thay thế từ API trước đây sang MCP tiêu chuẩn hóa và dễ tiếp cận hơn.

Trong đó, cơ sở hạ tầng của phần MCP Server, thành phần cốt lõi của nó là Chatfile plus, có vai trò chính là thông qua khung kiến thức, thực hiện phân tích và xử lý các nội dung ở cấp độ phần tử đối với các kiểu hình thái, phương thức và định dạng khác nhau, cũng như các thành phần khung công cụ cho việc hiểu đa phương thức, tìm kiếm đa phương thức, chuyển đổi và phân tích tệp.

Đồng thời, Baidu Wenku và ổ đĩa mạng đã xây dựng ba kho kiến thức lớn: kho kiến thức công cộng, kho kiến thức riêng tư và kho bộ nhớ, cụ thể chỉ đến dữ liệu kiến thức công cộng tích lũy nhiều năm của Baidu Wenku (kho kiến thức công cộng), dữ liệu kiến thức được người dùng ủy quyền sử dụng từ ổ đĩa mạng (kho kiến thức riêng tư), và các lệnh, thói quen sử dụng và hồ sơ lịch sử mà người dùng đã thực hiện trong Wenku hoặc ổ đĩa mạng (kho bộ nhớ).

Những dữ liệu này thường được trình bày dưới nhiều kiểu, hình thức và định dạng khác nhau. Trong đó, kho tri thức công khai cung cấp kiến thức chung, trong khi kho tri thức riêng và bộ nhớ lưu giữ dữ liệu cá nhân hóa của người dùng.

Trong khung kiến thức, Cangzhou OS sẽ thực hiện xử lý vector hóa và gán nhãn cho nội dung đa phương thức trong "ba kho dữ liệu lớn", tức là chuyển đổi hình ảnh, văn bản, video, âm thanh, tài liệu và các dữ liệu phi cấu trúc khác thành dữ liệu vector đa chiều mà máy tính có thể hiểu được, tức là một tập hợp token.

Và trên hệ thống trung tâm, Baidu Wenku và Wangpan đã tự nghiên cứu "ba công cụ lớn", đó là trình chỉnh sửa tích hợp (để chỉnh sửa nội dung như tài liệu, PPT, v.v.), trình đọc (để đọc tài liệu và nội dung như PPT, v.v.), và trình phát (phát âm thanh và video).

Đồng thời, Cang Châu OS còn có thể thông qua "Trung tâm điều phối", thông qua các thành phần tương tác, mô hình ý định và cơ sở hạ tầng truyền tải, kết hợp dữ liệu trí nhớ và hình ảnh người dùng, thông qua mô hình hiểu ý định của người dùng, phân bổ và điều phối Agent một cách hiệu quả.

Tầng cao nhất là một loạt các AI Agent. "Cảng Bể OS" tích hợp hàng trăm AI Agent như thư viện, ổ đĩa mạng, PPT, sách tranh AI, bản đồ tư duy AI, áp phích AI, ghi chép AI, quét AI, nghe ghi AI, với các mô hình tạo ra bao gồm hình ảnh, văn bản, video, âm thanh và nhiều loại khác, hoàn toàn bao phủ các tình huống học tập, làm việc, giải trí trong cuộc sống, đồng thời dựa vào khả năng chỉnh sửa, sửa đổi và điều chỉnh tinh vi của trình soạn thảo tích hợp, từ đó nâng cao chất lượng tìm kiếm và tạo nội dung, phù hợp hơn với nhu cầu nhiệm vụ cá nhân hóa thực tế.

02

Tại hệ điều hành Cang Châu OS,

Tạo ra nhiều Agent "thông minh và có khả năng" hơn

Xung quanh các dịch vụ ứng dụng hàng đầu, Baidu Wenku & Baidu Wangpan không chỉ cho ra hàng trăm AI Agent hữu ích đã được hàng trăm triệu người dùng xác thực, mà còn kết nối với nhiều Agent chuyên nghiệp của bên thứ ba để phát triển hệ sinh thái ứng dụng lớn.

Là "nền tảng thu thập và sáng tạo nội dung AI một cửa", số lượng người dùng trả phí của Baidu Wenku đã vượt quá 40 triệu, người dùng hoạt động hàng tháng AI đạt 97 triệu. Baidu Wangpan cũng đã nâng cấp thành "nền tảng dịch vụ nội dung một cửa", phục vụ hơn 1 tỷ người dùng, tổng dung lượng sử dụng vượt quá 1000 tỷ GB, người dùng hoạt động hàng tháng AI vượt quá 80 triệu. Baidu Wenku, Baidu Wangpan đã trở thành "năng suất siêu phàm" thực sự trong kỷ nguyên mô hình lớn.

Tại hội nghị, Baidu Wenku và Baidu Wangpan cũng đã trình bày những khả năng mới phát triển dựa trên "Cang Zhou OS": "GenFlow Siêu Năng Động" và "AI Ghi Chú".

GenFlow siêu năng đồng hành là khả năng hợp tác đa tác nhân được phát triển bởi ứng dụng Baidu Wenku, với sự hỗ trợ của "Tàu lớn OS", việc tạo nội dung có thể thực hiện đa nhiệm song song, đồng thời dựa trên thông tin mạng đầy đủ và chuyên nghiệp nhất, thói quen và sở thích của người dùng để hoàn thành các nhiệm vụ giao hàng.

Ví dụ, người dùng muốn tổ chức một đám cưới, nhưng thông tin ban đầu chỉ là một câu đơn giản: Tôi muốn tổ chức một đám cưới ngoài trời vào ngày 1 tháng 5 ở Hải Nam, hãy giúp tôi làm kế hoạch và thiệp mời.

Nhu cầu có vẻ đơn giản, chỉ cần làm theo mẫu lịch sử là có thể hoàn thành. Nhưng để đạt được sự hài lòng của người dùng, cần phải biết sở thích thẩm mỹ, kỳ vọng ngân sách, sở thích quy trình của người dùng, và còn cần biết thời tiết, lưu lượng người, phân bố địa điểm ở Hải Nam trong dịp lễ 1/5. Sau đó, cần kết hợp những hình ảnh và kiến thức này bằng công cụ PPT để tạo ra một kế hoạch hoàn chỉnh, và cuối cùng, dựa trên kế hoạch cũng như sở thích thẩm mỹ của người dùng, tạo ra một tấm thiệp mời cưới hoàn chỉnh.

Để hoàn thành nội dung trên, cần lần lượt điều phối lịch sử trò chuyện của người dùng, lịch sử duyệt web, cũng như nhận diện ý định, tìm kiếm toàn mạng, công cụ PPT, phân tích ý định của người dùng, hiểu sở thích của người dùng, tự do kết hợp các công cụ, cuối cùng mới đưa ra cho người dùng một kế hoạch hoàn chỉnh rất cụ thể bao gồm quy trình, ngày tháng, địa điểm, ngân sách, chủ đề, chi tiết thực hiện, phong cách, sắp xếp nhân sự.

Trong khi đó, kế hoạch và poster mà người dùng cần phải được phối hợp với nhau, điều này cũng đòi hỏi tất cả thông tin của cả hai phải giữ nhất quán, sử dụng cùng một hệ điều hành để xuất ra song song.

Tất nhiên, AI chắc chắn không thể tạo ra kết quả làm hài lòng tất cả mọi người ngay lập tức, điều này yêu cầu cả kế hoạch đám cưới hay áp phích đều cần có khả năng chỉnh sửa, và khả năng này được hỗ trợ bởi khả năng chỉnh sửa tích hợp của "沧舟 OS".

Không khó để nhận thấy, từ suy nghĩ sâu sắc đến giao hàng sâu sắc, GenFlow siêu năng lực gần như là sản phẩm duy nhất trên thị trường thực sự thuộc loại "hợp tác đa tác nhân". Không chỉ giải quyết các vấn đề chung như chi phí cao, thời gian tạo lâu, hiệu suất thấp, không thể giao hàng ổn định, không thể điều chỉnh qua nhiều vòng đối thoại của các sản phẩm hợp tác đa tác nhân, mà còn được tích hợp trực tiếp vào sản phẩm trưởng thành và kết hợp dữ liệu riêng được ủy quyền của người dùng, giúp AI thực sự có cơ hội đạt được mục tiêu "không gì không thể, không đâu không có".

AI ghi chú của Baidu Wangpan là trợ thủ đắc lực của vô số người làm văn phòng, người thi nghiên cứu sinh và thi công chức.

Ghi chú AI là ghi chú AI đa phương thức đầu tiên của ngành, có thể lồng các video học tập sau đại học khác nhau và các trang ghi chú được lưu trữ bởi người dùng trên đĩa mạng của Baidu trong cùng một giao diện để đạt được sự liên kết mượt mà, và nội dung video và ghi chú có liên quan chặt chẽ với nhau, từ xem video, tạo ghi chú AI, tóm tắt bản đồ não AI và cuối cùng là câu hỏi AI để kiểm tra kết quả học tập, bao phủ hoàn toàn toàn bộ chu kỳ học tập của người dùng.

Ví dụ, việc thi tiếng Anh cao học quá khó đã trở thành chủ đề nóng trong thời gian gần đây, người dùng muốn tập trung ôn tập cho kỳ thi tiếng Anh cao học. AI ghi chú sẽ trước tiên tìm kiếm tài liệu liên quan được lưu trữ trong ổ đĩa mạng của người dùng, đồng thời tra cứu các tài liệu công khai trên mạng để xác định các điểm thi, và tổ chức chúng. Tuy nhiên, toàn bộ quá trình không dừng lại ở đó, AI ghi chú còn kết hợp với các đề thi thực tế qua các năm để kiểm tra cuối cùng các điểm thi mà nó đã tạo ra, chỉ những điểm thi đã được kiểm tra mới có thể tiếp tục tạo ra bản đồ tư duy và dự đoán câu hỏi, giúp người dùng tăng tốc độ học tập.

Trong quá trình này, việc gọi các công cụ liên quan không hề ít hơn so với việc lập kế hoạch cho một đám cưới. Ví dụ, việc tìm kiếm địa điểm thi và các đề thi thật cần có khả năng tìm kiếm toàn mạng, trong khi các đề thi thật thường được trình bày dưới dạng PDF hoặc thậm chí là hình ảnh, và phần giải thích từ các giáo viên nổi tiếng thường được trình bày dưới dạng video, điều này đòi hỏi khả năng phân tích nội dung đa phương thức. Cuối cùng, việc tạo ra bản đồ tư duy và dự đoán đề thi cần có khả năng suy luận của mô hình lớn, khả năng tạo nội dung đa phương thức, cũng như khả năng liên kết giữa các nội dung khác nhau, đồng thời cần đảm bảo tính chính xác tuyệt đối của nội dung được tạo ra.

Đằng sau điều này, chính là sự trao quyền của "Tàu cũ OS".

Tất nhiên, Baidu hỗ trợ các nhà phát triển hoàn toàn ôm lấy MCP, vì vậy hệ điều hành Cangzhou không chỉ phục vụ cho hệ sinh thái nội bộ của Baidu, mà sự phát triển mạnh mẽ của hệ điều hành là một phần quan trọng nhất là sự mở cửa ra bên ngoài, kích thích khả năng đổi mới của đông đảo các nhà phát triển.

Vì vậy, để phát huy giá trị tối đa của hệ sinh thái và ứng dụng, Baidu Wenku, Baidu Wangpan dựa trên "Cangzhou OS", tiên phong áp dụng MCP vào việc kết nối sản phẩm và hệ sinh thái, xây dựng hệ thống ba lớp MCP Server-Client-Host, mở khả năng của Wenku và Wangpan thông qua hình thức MCP Server, và thông qua MCP Client SDK, thuận tiện cho nhiều doanh nghiệp, nhà phát triển, ứng dụng thông minh khác kết nối với MCP Host.

Trong đó, trường hợp tiêu biểu nhất chính là điện thoại Samsung. Điện thoại Samsung đang kết nối với nhiều MCP server của Baidu Wenku để tải lên, tải xuống, tìm kiếm, chia sẻ và hiểu nội dung của các tệp.

Một mặt, người dùng có thể trực tiếp thực hiện việc tải lên sao lưu tệp lên đám mây, chia sẻ trên đám mây, tóm tắt tài liệu và hỏi đáp nội dung thông qua giao diện trợ lý giọng nói trên điện thoại di động bằng cách nói.

Mặt khác, những server này còn có khả năng làm phong phú khả năng lưu trữ đám mây của hệ thống điện thoại Samsung, giải quyết vấn đề điện thoại khó khăn trong việc sao lưu và chia sẻ hàng loạt các tệp lớn và nhiều tệp.

Ví dụ, khi người dùng trong album ảnh trên điện thoại, gọi trợ lý giọng nói nói: "Sao lưu những bức ảnh chụp ở Aosen hôm qua lên Baidu Wangpan, và gửi bức ảnh của Tiểu Minh cho cậu ấy." Những bức ảnh liên quan sẽ được tải lên tài khoản Wangpan mà người dùng đã cấp quyền, và tạo ra đường dẫn chia sẻ, trợ lý điện thoại sẽ gọi danh bạ, gửi đường dẫn này qua tin nhắn đến điện thoại của người nhận, chỉ cần nhấp vào đường dẫn, người dùng sẽ trực tiếp vào Baidu Wangpan để xem hoặc lưu lại.

Không còn nghi ngờ gì nữa, việc kiểm tra khả năng cơ bản của hệ điều hành có đáng tin cậy hay không, không phụ thuộc vào việc tích lũy công cụ, hay số lượng công nghệ tiên tiến. Sự tiện dụng, trưởng thành và phong phú của hệ sinh thái dịch vụ ứng dụng cấp cao là tiêu chuẩn kiểm tra tốt nhất cho khả năng của hệ điều hành.

03

Câu chuyện của OS không có điểm dừng.

Trong thị trường vốn, một loại hình doanh nghiệp được nhà đầu tư công nhận nhất, gọi là "bạn của thời gian".

Người bạn của thời gian, chính là khi doanh nghiệp làm đúng một việc, tiếp theo chỉ cần tiếp tục làm thì hiệu suất sẽ duy trì tăng trưởng như động cơ vĩnh cửu, các nhà phát triển sinh thái cũng sẽ tiếp tục được hưởng lợi.

Và hệ điều hành, chính là một thị trường điển hình theo kiểu máy móc vĩnh cửu. Chỉ cần thị trường máy tính và điện thoại còn tồn tại, thì câu chuyện về hệ điều hành của Microsoft, Apple, Google sẽ không có điểm dừng.

Mô hình lớn cũng tương tự. Khi "Suy nghĩ sâu + Giao hàng sâu + Dữ liệu công tư + Hệ sinh thái MCP" kết hợp với nhau, tương lai sẽ trở thành AI không gì không thể, ở bất cứ đâu của kỷ nguyên mới, thì sự bùng nổ của các loài mới giống như thời kỳ Cambri sẽ liên tục xuất hiện.

Trong quá trình này, nhìn xuống là việc mở cửa cho khả năng của chính mình như Baidu Wenku, Baidu Wangpan. Thông qua việc tích cực ôm ấp hệ sinh thái, trở thành người sáng tạo của các giống loài mô hình lớn mới và người đặt ra các quy tắc mới.

Nhìn lên, thì có vô số Agent mới được tạo ra và được nhìn thấy dựa trên "沧舟 OS", hình thành nên một hệ sinh thái dịch vụ ứng dụng mới mạnh mẽ.

Và hiện tại, tất cả các câu chuyện, mới chỉ bắt đầu.

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • 1
  • Chia sẻ
Bình luận
0/400
GateUser-b76d427bvip
· 13giờ trước
cảm ơn vì bài viết thú vị
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)