UI-TARS-desktop

UI-TARS-desktop

bytedance/UI-TARS-desktop

AGENT

字节跳动开源的多模态AI智能体栈,连接前沿AI模型与智能体基础设施,支持TypeScript开发,助力构建高效智能体应用。

Stars

35,964

Forks

3,620

Language

TypeScript

Updated

2026-05-18

agentagent-tarsbrowser-usecomputer-usecoworkgui-agentgui-operatormcp
Base

多模态AI模型

Framework

UI-TARS

概述

UI-TARS-desktop 是字节跳动开源的多模态 AI 智能体栈,旨在连接前沿 AI 模型与智能体基础设施。该工具支持 TypeScript 开发,帮助开发者构建高效、智能的桌面应用,通过多模态能力实现视觉理解、交互操作与自动化任务。

核心特点

  • 多模态 AI 能力:集成视觉、语言等多种模态,支持图像识别、界面交互与复杂任务处理。
  • 开源与可扩展:基于开源架构,开发者可自由定制和扩展功能,适配不同应用场景。
  • TypeScript 原生支持:提供完善的 TypeScript SDK,降低开发门槛,提升代码可维护性与效率。

适用场景

适合 AI 开发者、智能体应用构建者以及需要自动化桌面操作的技术团队。解决从模型集成到智能体部署的全流程问题,尤其适用于需要多模态交互的复杂任务场景,如自动化测试、智能助手开发等。

定价

UI-TARS-desktop 作为开源项目,提供免费的基础使用。高级功能或企业级支持可能涉及额外费用,具体以官方最新公告为准。

Last updated: 2026-05-28

Category: #开发智能体License: Apache-2.0免费
Visit Project

Related Tools