05月30日 13:34
评论数(0)5 月 30 日,腾讯宣布旗下混元大模型全面升级,基于混元大模型的App“腾讯元宝”正式上线,苹果及安卓应用商店均可下载。
相比此前测试阶段的混元小程序版本,面向工作效率场景,腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力;面向日常生活场景,元宝的玩法也更加丰富,提供了多个特色AI应用,并新增了创建个人智能体等玩法。
“腾讯做大模型不争一时之先。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏表示:“过去的一年,我们持续推进腾讯混元大模型的能力爬坡,在丰富、海量的业务场景中打磨技术,同时洞察用户的真实需求,希望腾讯元宝可以成为用户生活中的好伙伴、好帮手,最终服务于每个普通人的生活。”
当前,大模型仍在快速发展期,从模型能力到应用落地存在较大“时延”。数据显示,当前人们使用大模型相关产品时,有超过 65%的需求,集中在工作/学习效率场景,但相关的AI产品解决方案尚不成熟。
针对效率场景的三大核心需求:信息获取、处理和生产,腾讯元宝均进行了产品化探索。在AI 搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,提升时新类和知识类问题效果,比传统搜索更有效率;同时,内容覆盖微信公众号等腾讯生态内容及互联网权威信源,答案准确性更高;此外,元宝还会提供所引用的参考资料,并给出相关推荐,方便快速溯源及延伸阅读。
在AI总结方面,元宝可上传最多10个PDF、word、txt等多种格式的文档,并能够一次性解析多个微信公众号链接、网址,支持256K的原生窗口上下文,相当于一本《三国演义》,或是英文原版的《哈利波特》全集。无论是希望快速了解一本书或是一个新领域,还是处理复杂繁冗的报告、文献,元宝都能帮上忙。
在AI写作方面,元宝不仅支持多轮问答,还能够将对话的内容整理成报告,按照要求进行结构化输出,大大提升信息从获取到处理再到生产的效率。
除了满足效率需要,腾讯元宝在日常生活场景,也提供了丰富的应用及玩法。“发现”栏目全面升级,上线了百变AI头像、口语陪练、超能翻译官等多个特色应用,均免费开放。只需一张照片,用户就可以在百变AI头像里体验多种风格;超能翻译官能够识别 15 种主流语言,翻译文本、图片与文件,还支持中英文同声传译;口语陪练则像一位专属私人外教,在陪练的同时给到口语改善建议,帮助用户学习与提升。
同时,元宝也支持用户根据个性化需求,快速创建个人专属的智能体,赋予角色设定,或让AI自动生成智能体相关信息,并复刻自己的音色。结合腾讯生态场景,元宝还将于近期推出腾讯新闻哥、《庆余年》主题等特色智能体。
中国科学院大数据专家李猛表示:“腾讯元宝是一款功能强大、易于使用的AI助手产品,为用户带来了便利和高效的智能体验。能够理解自然语言,并提供智能化的回答和建议,这在很多场景下为用户节省了大量时间和精力。”
除在元宝上提供自定义智能体外,腾讯混元也在积极布局智能体生态,面向开发者和企业推出了一站式智能体创作与分发平台腾讯元器。目前,腾讯元器已经全量面向用户开放。
腾讯元器提供丰富的官方插件和知识库,支持用户低门槛创建定制化的智能体,可一键分发至腾讯元宝、微信客服、QQ、腾讯云等腾讯生态渠道,并将于 6 月支持分发至微信公众号和小程序,混元模型资源全部免费。同时,元器也支持用户以API形式将智能体分发至各类场景,免费token额度从此前的100万提升至1个亿。
腾讯元宝产品能力升级的背后,是混元底层模型的持续迭代。
自 2023 年 9 月首次亮相以来,腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7 万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense 版本提升超50%。除不断提升通用大模型能力外,腾讯混元也支持角色扮演、FunctionCall、代码生成等领域能力,数理能力提升 50 %。
在多模态方面,腾讯混元文生图大模型是业内首个中文原生DiT架构模型,采用了Sora、Stable Diffusion 3等行业顶尖产品的同款架构,生成效果相比上代提升超 20%。目前,该模型已经全面开源,在Github获得 2000+star,相关能力也全面融入腾讯元宝。
此外,腾讯混元大模型在视频、3D生成等方面也持续探索,目前已经支持16s视频生成,单图仅需30秒即可生成3D模型,相关能力也将于后续在元宝中上线。
目前,腾讯内部有超 600 个业务及场景都已经接入腾讯混元,腾讯广告、微信读书、腾讯会议、腾讯文档、腾讯客服等,都已经基于混元实现了智能化升级。腾讯广泛的应用场景,也进一步反哺了大模型能力的提升。
据了解,为了满足开发者及企业客户对于通用模型能力的需求,腾讯混元大模型已通过腾讯云对外开放,可通过API调用,也可以作为基底模型,为不同产业场景构建专属应用。