📢 Gate广场独家活动: #PUBLIC创作大赛# 正式开启!
参与 Gate Launchpool 第 297 期 — PublicAI (PUBLIC),并在 Gate广场发布你的原创内容,即有机会瓜分 4,000 枚 $PUBLIC 奖励池!
🎨 活动时间
2025年8月18日 10:00 – 2025年8月22日 16:00 (UTC)
📌 参与方式
在 Gate广场发布与 PublicAI (PUBLIC) 或当前 Launchpool 活动相关的原创内容
内容需不少于 100 字(可为分析、教程、创意图文、测评等)
添加话题: #PUBLIC创作大赛#
帖子需附带 Launchpool 参与截图(如质押记录、领取页面等)
🏆 奖励设置(总计 4,000 枚 $PUBLIC)
🥇 一等奖(1名):1,500 $PUBLIC
🥈 二等奖(3名):每人 500 $PUBLIC
🥉 三等奖(5名):每人 200 $PUBLIC
📋 评选标准
内容质量(相关性、清晰度、创意性)
互动热度(点赞、评论)
含有 Launchpool 参与截图的帖子将优先考虑
📄 注意事项
所有内容须为原创,严禁抄袭或虚假互动
获奖用户需完成 Gate广场实名认证
Gate 保留本次活动的最终解释权
当浏览器成为 AI 的下一个战场,谁会被淘汰?
AI 的未来在于能自主导航网页的代理。各大科技公司纷纷投入浏览器代理的开发,旨在自动化网页任务、提升生产力。本文探讨其应用场景、当前挑战,以及 Web3 原生方案带来的机遇。本文源自Mario Chow、Figo,@IOSG 所着文章,由BlockBeats 整理、编译及撰稿。 (前情提要:OpenAI Sam Altman:我有兴趣收购 Google Chrome!参赛市占最大浏览器争夺战 ) (背景补充:Perplexity 开价 345 亿美元收购 Chrome 浏览器,AI 搜寻引擎小兵战巨人 ) 过去 12 个月,网页浏览器与自动化的关系发生了剧烈变化。几乎所有大型科技公司都在争相建构自主的浏览器代理 (browser agent)。从 2024 年底开始这一趋势愈发明显:OpenAI 在 1 月推出了 Agent 模式,Anthropic 为 Claude 模型发布了「电脑使用」功能,Google DeepMind 推出了 Project Mariner,Opera 宣布了代理型浏览器 Neon,而 Perplexity AI 则推出了 Comet 浏览器。讯号十分明确:AI 的未来在于能够自主导航网页的代理。 这一趋势并不仅仅是给浏览器加上更聪明的聊天机器人,而是机器与数位环境互动方式的根本转变。浏览器代理是一类能够「看」网页并采取行动的 AI 系统:点击连结、填写表单、滚动页面、输入文字:就像人类用户一样。这种模式承诺将释放巨大的生产力和经济价值,因为它能自动化那些目前仍需要人工操作,或传统脚本过于复杂而无法完成的任务。 ▲ GIF 演示:AI 浏览器代理的实际操作:遵循指令,导航到目标资料集页面,自动截图并提取所需资料。 谁将赢得 AI 浏览器之战? 几乎所有大型科技公司 (以及一些新创公司) 都在开发各自的浏览器 AI 代理方案。以下是最具代表性的几个专案: OpenAI – Agent 模式 OpenAI 的 Agent 模式 (前身名为 Operator,2025 年 1 月推出) 是一种自带浏览器的 AI 代理。Operator 能够处理各种重复性的线上任务:例如填写网页表单、订购杂货、安排会议:全部透过人类常用的标准网页介面完成。 ▲ AI 代理像专业助理一样安排会议:检查日历、寻找可用时间段、建立活动、发送确认,并为你生成 .ics 文件。 Anthropic – Claude 的「Computer Use」 2024 年底,Anthropic 为 Claude 3.5 引入了全新的「Computer Use (电脑使用)」功能,赋予了其像人一样操作电脑和浏览器的能力。Claude 可以看萤幕、移动游标、点击按钮、输入文字。这是首个同类的大模型代理工具进入公开测试版,开发者可以让 Claude 自动导航网站和应用程式。Anthropic 将其定位为一种实验性功能,主要目标是实现网页上的多步骤工作流自动化。 Perplexity – Comet AI 新创公司 Perplexity (以问答引擎闻名) 在 2025 年中期推出了 Comet 浏览器,作为 Chrome 的 AI 驱动替代品。Comet 的核心是内建在网址列 (omnibox) 中的对话式 AI 搜寻引擎,能够提供即时问答和摘要,而不是传统的搜寻连结。 此外,Comet 还内建 Comet Assistant,这是一个驻留在侧边栏的代理,可以跨网站自动执行日常任务。例如,它可以总结你打开的邮件、安排会议、管理浏览器分页,或代表你浏览并抓取网页资讯。 透过侧边栏介面让代理能够感知当前网页内容,Comet 旨在将浏览与 AI 助手无缝融合。 浏览器代理的真实应用场景 在前文中,我们已经回顾了各大科技公司 (OpenAI、Anthropic、Perplexity 等) 如何透过不同的产品形态为浏览器代理 (browser agents) 注入功能。为了更直观地理解它们的价值,我们可以进一步看看在真实场景中,这些能力如何被应用到日常生活和企业工作流程中。 日常网页自动化 # 电商与个人购物 一个非常实用的场景是将购物与预订任务委托给代理。代理可以根据固定清单自动填充你的线上购物车并下单,也可以在多个零售商之间寻找最低价,并代你完成结帐流程。 对于旅行,你可以让 AI 执行这样的任务:「帮我预订下个月去东京的航班 (票价低于 800 美元),再订一家有免费 Wi-Fi 的饭店。」代理会处理整个流程:搜索航班、比较选项、填写乘客资讯、完成饭店预订,全部透过航空公司与饭店网站完成。这种自动化水平远远超越了现有的旅游机器人:它不仅仅是推荐,而是直接执行购买。 # 提升办公效率 代理能够自动化许多人们在浏览器中进行的重复性业务操作。例如,整理电子邮件并提取待办事项,或在多个日历中检查空档并自动安排会议。Perplexity 的 Comet 助手已经可以透过网页介面总结你的收件匣内容,或为你新增日程。代理还可以在获得你的授权后,登入 SaaS 工具产生常规报告、更新电子试算表,或提交表单。想像一个 HR 代理,能够自动登入不同的招聘网站发布职位;或一个销售代理,可以更新 CRM 系统的潜在客户资料。这些日常琐碎工作本来会耗费大量员工时间,但 AI 可以透过自动化网页表单和页面操作完成。 除了单一任务,代理还能串联起跨多个网路系统的完整工作流程。所有这些步骤都需要在不同的网页介面中操作,而这正是 browser agent 的强项。代理可以登入各种仪表板进行故障排除,甚至编排流程,例如为新员工完成入职操作 (在多个 SaaS 网站上创建帐号)。本质上,任何目前需要点开多个网站完成的多步骤操作,都可以交由代理执行。 当下的挑战与局限 尽管潜力巨大,但今天的浏览器代理距离完美仍有很大差距。目前的实现揭示出了一些长期存在的技术和基础设施难题: 架构不匹配 现代...