卍 花径不曾缘客扫, 蓬门今始为君开. 古佛拈花方一笑, 痴人说梦已三生!

37.1k Star!DeepSeek自动操作浏览器,太牛了!

每天都要在各种网站之间切换,填写表单、查询信息、进行比价,这些重复性操作不仅浪费时间,还容易出错。

现有的自动化工具要么需要编程知识,要么功能有限,让我们这些普通技术小白望而却步。

最近发现了一个名为 Browser Use 的开源项目,它能让 AI 直接控制浏览器,完成各种复杂的网页操作。

特别值得一提的是,它不仅支持 OpenAI 模型,还完美支持 DeepSeek 模型,给我们提供了更多选择。

无需专业知识,只需用自然语言描述任务,就能让 AI 帮我们自动完成网页操作,大大提升了日常工作效率。

AI Did My Groceries

主要功能

Browser Use 是一个能让 AI 控制浏览器的强大工具,其核心功能包括:

  • 多模型支持:不仅支持 OpenAI 的模型,还支持 DeepSeek 等多种 AI模型,提供更多选择
  • 自然语言控制:只需描述想要完成的任务,AI 就能理解并执行,无需编写代码
  • 全自动网页操作:可自动填写表单、点击按钮、导航网站、提取信息
  • 跨网站任务执行:能够在多个网站间切换,完成复杂的跨平台操作
  • 云端服务支持:提供云服务版本,跳过繁琐的本地配置
  • 开箱即用的示例:包含多种实用场景的演示,如自动购物、求职申请、数据提取等
  • 人机协作功能:支持人工介入指导,确保关键决策准确无误
LinkedIn to Salesforce

安装指南

安装 Browser Use 非常简单,只需几步就能完成部署。首先确保系统已安装 Python 3.11 或更高版本,然后按照以下步骤操作:

1、使用 pip 安装 Browser-use 包:

pip install browser-use

2、安装 Playwright(Browser-use 依赖的浏览器自动化工具):

playwright install

3、创建 .env 文件并添加所需的 API 密钥(可以是 OpenAI 或 DeepSeek 的 API 密钥):

OPENAI_API_KEY=你的OpenAI密钥# 或者使用 DeepSeek 模型DEEPSEEK_API_KEY=你的DeepSeek密钥

对于不想进行本地配置的朋友,Browser-use 还提供了云端版本,直接访问 https://cloud.browser-use.com 即可体验,省去了环境配置的麻烦。

使用指南

使用 Browser Use 非常直观,下面是使用 DeepSeek 模型的示例代码:

import asyncioimport osfrom dotenv import load_dotenvfrom langchain_openai import ChatOpenAIfrom pydantic import SecretStrfrom browser_use import Agent# 加载环境变量load_dotenv()# 获取 DeepSeek API 密钥api_key = os.getenv('DEEPSEEK_API_KEY''')if not api_key:    raise ValueError('DEEPSEEK_API_KEY is not set')async def run_search():    agent = Agent(        task=('去亚马逊网站,搜索笔记本电脑,按评分排序,并返回第一个结果的价格'),        llm=ChatOpenAI(            base_url='https://api.deepseek.com/v1',            model='deepseek-reasoner',            api_key=SecretStr(api_key),        ),        use_vision=False,        max_failures=2,        max_actions_per_step=1,    )    await agent.run()if __name__ == '__main__':    asyncio.run(run_search())

这段代码会创建一个使用 DeepSeek 模型的 AI 代理,它将打开浏览器,前往亚马逊网站,搜索笔记本电脑,按评分排序,并返回第一个结果的价格。

无需指定具体操作步骤,AI 会自动规划和执行所有必要的浏览器操作。

如果想要更直观的体验,还可以运行内置的 Gradio 界面:

python examples/ui/gradio_demo.py

这将启动一个网页界面,让我们可以直接在界面上输入任务描述,然后观察 AI 如何执行任务。

Letter to Papa

写在最后

Browser Use 真正实现了让 AI 成为我们的网页助手,尤其是其对 DeepSeek 等多种模型的支持,让我们有了更多选择的自由。

无论是自动购物下单、批量申请工作、从不同网站收集信息,还是自动填写各类表单,都能极大提升效率。

特别适合需要在多个平台间切换的工作场景,将繁琐的重复劳动转化为简单的自然语言指令。

让网页操作更便捷、更高效,值得每一位想提升工作效率的朋友尝试!

GitHub 项目地址:https://github.com/browser-use/browser-use

转载请注明:拈花古佛 » 37.1k Star!DeepSeek自动操作浏览器,太牛了!

喜欢 (0)or分享 (0)
发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址