BrowserBee 是一款开源的 Chrome 扩展,通过自然语言指令来控制浏览器,实现网页自动化操作。它结合了语言模型的解析能力和 Playwright 的自动化功能,让用户能够更高效地完成各种任务,同时注重隐私保护。
隐私保护:BrowserBee 的操作主要在本地浏览器内完成,仅与 LLM 提供商进行通信,不涉及其他数据传输。
多模型支持:支持多种主流 LLM 提供商,如 Anthropic、Openai、Gemini 和 Ollama。
丰富的工具集:提供导航、标签管理、页面交互、观察、鼠标和键盘操作等多种工具。
记忆功能:可以存储并复用有用的操作序列,提高效率。
用户审批流程:在执行敏感操作(如购买或发布社交媒体更新)时,会要求用户明确批准。
成本跟踪:跟踪 LLM 的 Token 使用和费用,帮助用户管理成本。
社交媒体管理:检查通知、总结消息并帮助回复。
新闻聚合:收集并总结用户喜爱的新闻源和博客的最新头条。
个人助理:处理日常任务,如阅读和发送电子邮件、预订航班等。
研究助手:收集和组织公司、职位列表、市场趋势或学术论文等信息。
知识书签和总结:快速总结文章、提取关键信息并保存。
你可以通过以下步骤安装 BrowserBee:
gitclonehttps://github.com/parsaghaffari/browserbee.gitcdbrowserbee安装依赖
npminstall构建扩展
npmrunbuild在 Chrome 中加载扩展
访问 chrome://extensions/。
启用右上角的 “开发者模式”。
点击 “加载已解压的扩展程序”,并选择 dist 目录。
BrowserBee 选项页面应该会自动弹出,在该页面设置你的 LLM API 密钥(如 Anthropic、OpenAI、Gemini)或配置 Ollama。
点击 Chrome 工具栏中的 BrowserBee 图标,或按下 Alt+Shift+B 打开侧边面板。
输入指令,例如:“Go to Google, search for Cicero, and click the first result”。
按下回车键,等待 BrowserBee 完成任务。
隐私优先,数据不经过第三方后端。
开源透明,用户可以自行检查和修改代码。
提供多种 LLM 选项,用户可以根据需求选择。
内存功能可以提高重复任务的效率。
需要手动安装和配置 LLM API 密钥。
目前仅支持 Chrome 浏览器。
使用 LLM 会产生一定的费用。
需要用户学习如何更有效地表达指令。
https://github.com/parsaghaffari/browserbee
下一篇: 最后一页
2025-01-28
2025-02-10
sd-webui-EasyPhoto: 你的智能AI照片生成器 - 一站式学习资料汇总
2025-01-02
2025-01-14
Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具
2025-02-02
KeepChatGPT学习资料大全 - 提升ChatGPT体验的必备插件
2025-01-07
2025-01-17
React Agent 学习资料汇总 - 开源 React.js 自主 LLM 代理
2025-01-28
2025-02-10