阿里巴巴近日开源了一种创新大模型 ZeroSearch ,在训练过程中无需调用任何外部搜索引擎即可掌握信息检索能力。新模型表现堪比甚至超越依赖真实搜索引擎训练的模型,而且更节约训练成本。
在涵盖七个问答数据集的对比测试中,该模型 7B 参数的检索模块便能达到与 Google 搜索相当的水平,而 14B 参数版本则表现更佳。更令人瞩目的是其成本优势:若通过 SerpAPI 调用 Google 搜索执行 64,000 次查询,训练费用约为 586.70 美元;而在 4 块 NVIDIA A100 GPU 上运行 14B 参数的模拟 LLM,仅需约 70.80 美元,成本削减高达 88%。
目前,ZeroSearch 已在 Qwen-2.5、LLaMA-3.2 等多个主流模型家族中完成验证。研究团队已将全部代码、数据集及预训练模型开源至 GitHub 和 Hugging Face。
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途。本站所有信息均来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序,请支持正版,购买注册,得到更好的正版服务。如有侵权不妥之处请致信 E-mail:[email protected] 我们会积极处理。敬请谅解!
![]() ![]() |