Holo3:重塑计算机操作边界,开启自主企业智能新时代
引言:自主智能体的新高度
近日,HCompany 宣布推出其“自主企业”愿景的最新里程碑——Holo3。在领先的桌面计算机使用基准测试 OSWorld-Verified 中,Holo3-122B-A10B 以 78.85% 的惊人得分,树立了行业全新的技术标杆(State of the Art)。
Holo3 不仅仅是一个在榜单上领先的模型,它更是为生产环境而生的。通过其独特的“智能体飞轮”机制,Holo3 在合成企业环境中接受了大规模真实工作流的训练。这不仅确保了它在当今商业场景中的卓越表现,也为未来智能体能够自主导航任何数字景观奠定了坚实基础。

高效、开源与可扩展性
最令人振奋的是,Holo3 在实现顶级性能的同时,保持了极高的成本效益。Holo3-122B-A10B 仅拥有 10B 激活参数(总参数 122B),其运行成本远低于 GPT 5.4 或 Opus 4.6 等大规模闭源模型。
为了推动社区发展,HCompany 采取了开放的态度:
- Holo3-35B-A3B 模型权重已在 Hugging Face 上以 Apache2 许可证 公开。
- 所有模型均可通过 HCompany 的推理 API 访问,并为开发者提供免费层级。
核心驱动力:智能体学习飞轮 (Agentic Learning Flywheel)
Holo3 的核心在于其专门的训练流水线——一个旨在不断磨炼“感知”与“决策”两大支柱的持续反馈循环。这个“飞轮”通过标注示例教会模型执行特定任务,同时培养其跨越各种用户界面的泛化能力。

飞轮的三大关键环节:
- 合成导航数据:结合人类指令与自动生成指令,构建场景化的导航示例。
- 域外增强 (Out-of-Domain Augmentation):通过程序化手段扩展场景并增强数据,确保 Holo3 能够应对意外情况。
- 精选强化学习:每条数据样本都经过严格筛选,利用先进的数据过滤和强化学习技术最大化模型性能。
合成环境工厂与 H Corporate 基准测试
为了验证“飞轮”技术在真实商业应用中的迁移能力,HCompany 创建了合成环境工厂 (Synthetic Environment Factory)。这是一个专为 Holo3 打造的“训练健身房”,利用编码智能体从零开始根据规格说明编写网站代码,生成可验证的、难度各异的任务。

此外,HCompany 还推出了 H Corporate Benchmarks,这是一套包含 486 个多步现实任务的评估套件,涵盖四大类别:
- 电子商务 (E-commerce)
- 业务软件 (Business software)
- 协作工具 (Collaboration)
- 多应用组合场景 (Multi-App setups)
在最具挑战性的“多应用组合”任务中,Holo3 展现了跨系统协调信息的能力。例如,它能从 PDF 中提取设备价格,对比每位员工的预算余额,并自动发送个性化的审批或拒绝邮件。这类任务不仅要求精准的文档解析,更需要持久的多步推理能力,以确保在跨应用操作时不会丢失目标或状态。
通往通用智能体的未来
Holo3 的发布标志着一个重要的里程碑,但这绝非终点。HCompany 的目标是让“自主企业”成为现实。随着合成环境工厂的演进,智能体正在学习处理日益复杂的任务。

HCompany 已经在探索下一个前沿:自适应代理 (Adaptive Agency)。未来的模型将不仅限于使用已知的工具,还能在实时环境中自主学习如何操作全新的、定制化的企业软件。
Holo3 证明了:通过专业化的训练和高效的架构设计,我们可以在降低 AI 门槛的同时,显著提升其解决实际问题的能力。欢迎前往 Hugging Face 体验 Holo3,共同见证计算机使用新纪元的到来。
