Search
站内搜索
统一搜索工具、模型、教程、任务、资讯和工作流。也支持地址:/search?q=关键词。
160 results for "Browser Use 怎么用"
最佳入口
先看分类,再决定点工具、模型还是教程
工具
可以直接打开使用的产品和网站。
Dia Browser
AI浏览器 · 免费 · 阶段 2The Browser Company 的 AI 原生浏览器,强调在浏览器里理解页面、上下文和任务。
Browser Use
Agent平台 · 免费 · 阶段 6开源浏览器Agent框架,让AI自动操作网页。填表、抓数据、自动下单,本地运行。
Browserbase
Agent平台 · 有免费额度 · 阶段 5给 Agent 提供云浏览器、搜索、抓取、会话回放和浏览器自动化基础设施。适合需要登录网页、抓取数据、操作无 API 网站的 Agent。
Stagehand
Agent平台 · 免费 · 阶段 5Browserbase 出品的开源浏览器 Agent SDK,用 act、extract、observe 和 agent 把自然语言操作与 Playwright 控制结合起来。
CUA Agent
Agent平台 · 免费 · 阶段 6开源Computer-Use Agent基础设施。沙箱+SDK+基准测试,训练可操控桌面的AI Agent。
MarketMuse
AI营销 · 付费 · 阶段 3AI内容策略和SEO分析,告诉你应该写什么主题来超越竞品。企业级内容规划工具。
模型
API、本地模型和模型后端选择。
GPT-5.5
OpenAI · API · $5 输入 / $30 输出OpenAI 当前高档旗舰模型,适合复杂 Agent、专业编码、跨文档分析和高质量工作流。价格按官方 API 标准 token 口径记录,展示为输入/输出每百万 token。
DeepSeek V4 37B
DeepSeek · 本地 · 免费MIT开源,性价比无敌。1M上下文,单卡可跑。日常编码推荐。
Claude Opus 4.6
Anthropic · API · $5/1M编程最强(80.8% SWE-Bench),Agent自主任务执行领先。深度推理和代码生成首选。
GLM-5.1 40B
智谱 · 本地 · 免费自主编码最强开源,744B总参仅激活40B。单卡可跑。
Gemini 3.1 Pro
Google · API · $2 输入 / $12 输出起Google Gemini API 的高阶 Pro 模型,适合多模态理解和长上下文任务。价格会随标准、批处理、Flex、Priority 等档位变化。
Qwen 3.5 17B
阿里 · 本地 · 免费397B仅激活17B。Apache 2.0,201语言。单卡流畅运行。
Claude Sonnet 4.5
Anthropic · API · $2/1M平衡价格性能,日常编码Agent首选。速度比Opus快价格低60%。
Kimi K2.6 本地/开源权重
月之暗面 · 本地 · 免费站内把本地 Kimi 入口同步到 K2.6 口径,避免继续展示旧版本词条。实际下载和量化版本以 Ollama、ModelScope、Hugging Face 等仓库同步为准。
教程
一步一步照着学的页面。
DeepSeek怎么用
模型教程 · DeepSeek · 新手DeepSeek聊天、联网搜索、推理、写作、代码和国产模型选择入门。
小白天枢 安装和设置教程
小白官方 Agent 桌面应用 · 3-8 分钟 · 小白官方打开小白AI,下载桌面端,复制粘贴配置,几分钟把语音、模型和桌面 Agent 跑起来。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
Claude Code 安装和设置教程
工程 Agent · 8-15 分钟 · 新手可跟先装 Node.js 和 Claude Code,再接 DeepSeek V4、MiniMax 或官方 Claude,最后用 hooks、skills、插件和子智能体做一个可验收项目。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
OpenAI Codex 安装和设置教程
工程 Agent · 5-12 分钟 · 新手可跟Codex 是终端里的 OpenAI 编程 Agent,适合在 Git 项目中完成小功能和修复。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
OpenClaw 安装和设置教程
工程 Agent · 10-20 分钟 · 适合国内新手打开小白AI,复制命令,先让 OpenClaw 回第一句话,再把第一个任务交给它。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
Hermes Agent 安装和设置教程
自学习 Agent · 10-25 分钟 · 进阶一点Hermes 更适合长期任务、技能系统和带记忆的 Agent,Windows 用户走 WSL2。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
Cursor Agent 安装和设置教程
产品方官方 Agent 桌面应用 · 5-10 分钟 · 最像普通软件不想先学终端的小白,可以先用 Cursor 打开项目,再用 Agent 改小功能。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
Cline 安装和设置教程
VS Code Agent 插件 · 8-15 分钟 · 新手可跟如果你已经用 VS Code,Cline 是接 DeepSeek / Kimi 这类 API 很直接的 Agent 插件。 包含准备条件、安装步骤、启动验证、模型/API 接入和常见报错。
任务
照着做、交付结果、领取 XP 的闯关任务。
用 AI 做一份 6 页 PPT 初稿
L2 完成任务 · 8-18 分钟 · +65XP先做出一个能看的 6 页初稿,再学会用验收标准判断它能不能汇报。
用 AI 做出第一个网站页面
L2 完成任务 · 8-15 分钟 · +55XP这不是公司官网项目,也不是工程工作流。先用 AI 生成一个能打开的页面,让新手立刻看到结果。
用 AI 做一个点击得分小游戏
L2 完成任务 · 8-15 分钟 · +55XP先做出能点、能加分、能重新开始的最小游戏。它是结果任务,不是公司级工作流。
用 Kimi 分析一份长文档并生成行动清单
L2 完成任务 · 25-45 分钟 · +60XP从上传资料、明确问题、提取摘要到生成行动清单,跑通一次文档分析。
做一条小红书 AI 内容流水线
L2 完成任务 · 35-60 分钟 · +60XP从选题、正文、配图到发布检查,按步骤做出一条可发布内容。
资讯
新闻、发布、深度解读和教程资源。
小白安装 Claude Code:1分钟直接跑通能用
教程资源 · 2026-05-06 · 小白AI 原创这篇只做第一件事:让小白把 Claude Code 安装好。小白只需要会打开终端、复制命令、看有没有版本号;API Key、模型名、中转站这些等安装成功后再让右下角小白一步步带。
Codex国内使用指南:从安装到配置中转站全流程
教程资源 · 2026-05-06 · AI第一站 原创把 Codex 安装、API Key、config.toml、auth.json 和启动命令拆成小白能复制的步骤,优先解决 Windows 终端看不懂的问题。
浏览器 Agent 进入实用阶段:调研、截图、表单和网页验收会先落地
产品发布 · 2026-05-13 · 小白AI 编辑部Browserbase、Stagehand、AgentQL 等工具让 Agent 更容易操作网页。对普通用户最先有用的不是全自动下单,而是网页调研、资料提取、截图留证和页面验收。
DeepSeek V4 API接入全攻略:注册→充值→零代码使用
教程资源 · 2026-05-06 · AI第一站 原创先不让小白看代码,先注册 DeepSeek、复制 API Key、填进 Chatbox 或 Cherry Studio。会写代码的人再看 Python 示例。
API 中转站为什么变成小白刚需:个人在家创业先学会多模型接入
教程资源 · 2026-05-13 · 小白AI 热点教程现在最热的不只是哪个模型强,而是普通人怎么把 DeepSeek、Kimi、Qwen、Claude、OpenAI 放进同一个工作台,并控制成本、限额和密钥安全。这个话题适合归到个人成长与一人公司。
工作流
可复用的自动化流程。
技能
Agent、Dify、Coze、n8n 可安装或复用的能力。
Agent Browser
OpenClaw · 中等 · 137KAI专属浏览器自动化,模拟人类操作网页。表单填写、点击、截图、PDF导出全支持。
allcanuse-mcp:90+工具本地Agent
通用 · 进阶 · 8.7K专为本地环境设计的MCP服务端,让本地Agent获得操作和感知能力。涵盖文件工程、网络调试、进程管控、桌面视觉观察、摄像头等90+工具。支持Claude Code/ChatGPT Codex/OpenCode/LM Studio。MIT开源。
Agent可观测性五层模型
通用 · 进阶 · 1.9K生产级Agent必备的可观测性方案。五层:①请求层(输入输出日志) ②推理层(思维链追踪) ③工具层(调用成功率和延迟) ④系统层(Token消耗和成本) ⑤结果层(任务完成质量)。用AgentOps/Langfuse/Helicone实现。
CUA Agent:桌面操控基础设施
通用 · 进阶 · 2.8K开源Computer-Use Agent训练平台。提供沙箱+SDK+基准测试,支持训练可操控桌面的AI Agent。实现AI看屏幕→理解界面→操作鼠标键盘的完整闭环。
Browserbase 网页操作
通用 · 中等 · 11.6K给 Agent 云浏览器能力,能打开网页、登录测试环境、抓取资料、截图和执行表单动作。适合没有 API 的网站流程。