Proxyless LLM Websearch是一个无需代理的LLM网络搜索引擎,支持多引擎搜索、智能解析和异步处理,支持URL内容解析和网页爬取,结合LangGraph实现模块化智能体链路,专为大语言模型的外部知识调用场景而设计。
无需代理:通过Playwright配置国内浏览器支持,无需代理也能进行网络搜索。
多搜索引擎支持:支持Bing、夸克、百度、搜狗等主流搜索引擎,增强信息来源多样性。
意图识别:系统能够根据用户的输入内容,自动判断是进行网络搜索还是解析URL。
查询分解:根据用户的搜索意图,自动将查询分解为多个子任务,并依次执行,从而提升搜索的相关性与效率。
智能体架构:基于LangGraph封装的“web_search”与“link_parser”。
异步并发任务处理:支持异步并发任务处理,可高效处理多个搜索任务。
内容处理优化
内容切片:将网页长内容按段切分。
内容重排:智能重排序,提高信息相关性。
内容过滤:自动剔除无关或重复内容。
多端支持
FastAPI后端接口:可集成到任意系统中。
Gradio Web UI:可快速部署成可视化应用。
浏览器插件支持:支持Edge,提供智能URL解析插件,直接在浏览器中发起网页解析与内容提取请求。
克隆仓库:
gitclonehttps://github.com/itshyao/proxyless-llm-websearch.gitcdproxyless-llm-websearch安装依赖:
pipinstall-rrequirements.txtpython-mplaywrightinstall环境变量配置:
需要配置 OPENai_API_KEY、OPENAI_BASE_URL、MODEL_NAME、EMBEDDING_MODEL_NAME、EMBEDDING_API_KEY、EMBEDDING_BASE_URL 等环境变量。
运行示例:
运行 demo:
pythondemo.py运行 FastAPI 后端接口:
pythonapi_serve.py运行 Gradio Web UI:
pythongradio_demo.py测试效果
基于阿里的 WebWalkerQA 高难度问答数据集,与火山方舟、百炼等知名在线检索接口对比,proxyless-llm-websearch 取得了最高的正确率和最低的错误率
Github库:https://github.com/itshyao/proxyless-llm-websearch
下一篇: 最后一页
RWKV_Pytorch: 纯PyTorch实现的RWKV大语言模型推理框架
2025-05-03
2025-05-06
2025-05-12
2025-05-02
2025-05-05
Deep Java Library (DJL): Java生态系统中的深度学习框架
2025-05-09
2025-05-15
OpenFedLLM: 联邦学习助力大语言模型在分散私有数据上的训练
2025-05-03