5月22日,昆仑万维面向全球市场宣布了天工超等智能体(Skywork Super Agents)。据先容,该产品接纳AI agent架构和deep research手艺,支持一站式天生文档、PPT、表格(excel)、网页、播客和音视频等多模态内容。昆仑万维方面称,其deep research能力在GAIA基准测试中体现突出,在GAIA榜单上排名全球第一,凌驾了OpenAI Deep Research和Manus。
昆仑万维宣布,该产品克日起向海内外用户开放注册,无需约请码。 1. 5种模态,一键天生,用8分钟完成8小时的事情 与Manus这样的拥有普遍功效但缺乏专业深度的AI智能体差别,天工超等智能体包括一个由「5个专家智能体」与「1个通用智能体」组成的系统,旨在提供专业化的内容天生效劳: 5个专家智能体,划分认真专业文档(doc)、PPT、表格(excel)、播客和网页的天生。文档、PPT、表格是常见的办公应用。 昆仑万维体现,文档、PPT、表格三个智能体集成了deep research能力,可提供专业内容天生。网页和播客智能体则面向新媒体内容模态。这些专家智能体针对办公和学习场景设计,旨在提供高质量内容。 1个通用智能体,接入了数十个MCP(模子能力提供者),用于处置惩罚多模态创意使命,可天生图片、音乐、视频等多种媒体内容。 2.?Deep Research手艺赋能焦点办公应用 此次宣布的焦点,是天工超等智能体的「文档」、「PPT」和「表格」三大智能体。 在「文档」智能体方面,针对行业研究、学术论文、商业妄想等专业写作需求,天工集成了deep research能力。 天工方面体现,其自研的deep research模子通过深度思索和推理提升信息检索的广度、宽度与效率,并通过强化学习增强搜索泛化性,为内容天生提供高质量信息源。据称,该能力在性能上靠近OpenAI Deep Research,同时本钱只有openAI的40%。 天工的deep research agent框架在Meta和Huggingface联合推出的GAIA的评测集上取得了82.42的高分,逾越了OpenAI?Deep Research和Manus,位居第一(2025年5月10日数据)。 在OpenAI的SimpleQA评测使命中,Skywork获得94.5分,凌驾了此前该使命的SOTA(State-of-the-Art)水平。 相比OpenAI的Deep Research,天工「文档」智能体天生的报告包括多种数据图表,如条形图、折线图、饼状图等,以增强内容的可视化泛起。 天工的「PPT」智能体同样集成了deep research手艺,旨在通过深度搜索和研究,为用户天生演示文稿内容。据先容,天生的演示文稿内容支持事实与数据溯源,并包括动态效果。PPT功效支持在线编辑及导出为pptx、pdf名堂。 天工的「表格」智能体也支持deep research手艺。该智能体可基于用户上传的数据表举行形貌性或推论性统计,并天生统计图表,同时支持天生模板型及汇总型表格。天生的表格支持在线浏览和导出为xls名堂。 昆仑万维方面体现,其deep research agent框架已在GitHub上开源,供开发者下载。同时,天工的文档、PPT、表格天生能力也已封装成MCP(模子能力提供者),供开发者挪用。 3.拓展至网页、播客及音视频等多媒体内容天生 除办公应用外,天工超等智能体还支持多模态内容生产,其天生能力已延伸至网页、播客与音视频领域,旨在提供一站式内容创作支持。 天工的「网页」智能体支持依据用户需求天生网页,可用于建设电商页面、小我私家博客、信息展示及功效型网站等。据称,该功效旨在降低网页建设的手艺门槛。 天工的「播客」智能体可凭证用户输入的需求天生剧本,并基于剧本通过语音合成手艺制作音频。现在该功效支持天生英文播客,妄想后续支持中文及其他语言。 由于现在尚不支持中文内容天生,海内版本(tiangong.cn)暂未上线「播客」智能体。 别的,天工的「通用」智能体集成了数十个MCP,笼罩图像、视频、音乐、语音天生等能力。据先容,该智能体可将文字转化为视频,并支持自动匹配配景音乐与特效,适用于天生宣传视频、教学课件、创意短片、有声书、绘本等多种内容。(易科)