记者|董温淑 5月20日,百度于北京举行AI Day运动,百度集团副总裁吴甜现场分享了最新版文心大模子4.5及深度思索模子X1背后的手艺细节。 据她分享,文心大模子4.5是多模态基础大模子,文心4.5 Turbo源自文心4.5,效果更好、本钱更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,在性能提升的同时,实现更先进的头脑链,进一步增强问答、创作、逻辑推理、工具挪用和多模态能力。 多模态能力方面,文心4.5和4.5 Turbo实现了文本、图像和视频的混淆训练。针对差别模态数据在结构、规模、知识密度上的差别,通过多模态异构专家建模、自顺应区分率视觉编码、时空重排列的三维旋转位 置编码、自顺应模态感知损失盘算等手艺,提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态明确效果提升凌驾30%。 在深度思索方面,文心X1、X1 Turbo突破了仅基于头脑链优化的范式,在思索路径中连系工具挪用,构建了融合思索和行动的复合头脑链,旨在使模子输出效果更优。 同时,连系多元统一的奖励机制,文心X1、X1 Turb实现了思索和行动链的端到端优化,大幅提升了跨领域的问题解决能力。 吴甜称,随着大模子的能力进一步拓展、效率进一步提升,可以探索更前瞻、更有想象力的立异应用。 以数字人为例,超拟真数字人需要具备精彩的体现力、吸引人的内容、数字人与场景、物品的互动等,综合运用多模态AI手艺。为此,百度研制了“剧本”驱动多模协同的超拟真数字人手艺,实现了语言、声音、形象的协调一致。 据称现在该手艺已经支持凌驾10万数字人主播,直播转化率达31%,降低80%直播开播本钱。 在代码场景上,基于文心大模子的语言和代码能力,百度研制了代码智能体和智能代码助手“文心快码”。百度天天新增的代码中,文心快码天生的代码占比已凌驾40%。阻止现在,文心快码向全社会开放,累计效劳760万开发者。 别的,基于飞桨文心在框架模子、框架算力的联合优化,文心4.5 Turbo的训练吞吐已抵达文心4.5的5.4倍,推理吞吐抵达8倍。 果真数据显示,飞桨文心开发者数目已凌驾2185万,效劳凌驾67万家企业,建设的模子抵达110万。