Holo3：重塑计算机操作边界，开启自主企业智能新时代

Codex2026年4月2日1 min read126 views

引言：自主智能体的新高度

近日，HCompany 宣布推出其“自主企业”愿景的最新里程碑——Holo3。在领先的桌面计算机使用基准测试 OSWorld-Verified 中，Holo3-122B-A10B 以 78.85% 的惊人得分，树立了行业全新的技术标杆（State of the Art）。

Holo3 不仅仅是一个在榜单上领先的模型，它更是为生产环境而生的。通过其独特的“智能体飞轮”机制，Holo3 在合成企业环境中接受了大规模真实工作流的训练。这不仅确保了它在当今商业场景中的卓越表现，也为未来智能体能够自主导航任何数字景观奠定了坚实基础。

Holo3 Performance Chart

最令人振奋的是，Holo3 在实现顶级性能的同时，保持了极高的成本效益。Holo3-122B-A10B 仅拥有 10B 激活参数（总参数 122B），其运行成本远低于 GPT 5.4 或 Opus 4.6 等大规模闭源模型。

为了推动社区发展，HCompany 采取了开放的态度：

Holo3 的核心在于其专门的训练流水线——一个旨在不断磨炼“感知”与“决策”两大支柱的持续反馈循环。这个“飞轮”通过标注示例教会模型执行特定任务，同时培养其跨越各种用户界面的泛化能力。

Agentic Learning Flywheel

为了验证“飞轮”技术在真实商业应用中的迁移能力，HCompany 创建了合成环境工厂 (Synthetic Environment Factory)。这是一个专为 Holo3 打造的“训练健身房”，利用编码智能体从零开始根据规格说明编写网站代码，生成可验证的、难度各异的任务。

Synthetic Environments

此外，HCompany 还推出了 H Corporate Benchmarks，这是一套包含 486 个多步现实任务的评估套件，涵盖四大类别：

在最具挑战性的“多应用组合”任务中，Holo3 展现了跨系统协调信息的能力。例如，它能从 PDF 中提取设备价格，对比每位员工的预算余额，并自动发送个性化的审批或拒绝邮件。这类任务不仅要求精准的文档解析，更需要持久的多步推理能力，以确保在跨应用操作时不会丢失目标或状态。

Holo3 的发布标志着一个重要的里程碑，但这绝非终点。HCompany 的目标是让“自主企业”成为现实。随着合成环境工厂的演进，智能体正在学习处理日益复杂的任务。

Performance Comparison

HCompany 已经在探索下一个前沿：自适应代理 (Adaptive Agency)。未来的模型将不仅限于使用已知的工具，还能在实时环境中自主学习如何操作全新的、定制化的企业软件。

Holo3 证明了：通过专业化的训练和高效的架构设计，我们可以在降低 AI 门槛的同时，显著提升其解决实际问题的能力。欢迎前往 Hugging Face 体验 Holo3，共同见证计算机使用新纪元的到来。