UI-TARS-desktop
bytedance/UI-TARS-desktop
AGENT字节跳动开源的多模态AI智能体栈,连接前沿AI模型与智能体基础设施,支持TypeScript开发,助力构建高效智能体应用。
Stars
35,964
Forks
3,620
Language
TypeScript
Updated
2026-05-18
agentagent-tarsbrowser-usecomputer-usecoworkgui-agentgui-operatormcp
Base
多模态AI模型
Framework
UI-TARS
概述
UI-TARS-desktop 是字节跳动开源的多模态 AI 智能体栈,旨在连接前沿 AI 模型与智能体基础设施。该工具支持 TypeScript 开发,帮助开发者构建高效、智能的桌面应用,通过多模态能力实现视觉理解、交互操作与自动化任务。
核心特点
- 多模态 AI 能力:集成视觉、语言等多种模态,支持图像识别、界面交互与复杂任务处理。
- 开源与可扩展:基于开源架构,开发者可自由定制和扩展功能,适配不同应用场景。
- TypeScript 原生支持:提供完善的 TypeScript SDK,降低开发门槛,提升代码可维护性与效率。
适用场景
适合 AI 开发者、智能体应用构建者以及需要自动化桌面操作的技术团队。解决从模型集成到智能体部署的全流程问题,尤其适用于需要多模态交互的复杂任务场景,如自动化测试、智能助手开发等。
定价
UI-TARS-desktop 作为开源项目,提供免费的基础使用。高级功能或企业级支持可能涉及额外费用,具体以官方最新公告为准。
Last updated: 2026-05-28
Category: #开发智能体License: Apache-2.0免费
Visit Project →