腾讯云智能推出“自助式”AI数智人生产,3分钟样本训练即可定制

4月26日消息(田小梦)随着元宇宙概念的推出,数字人也逐渐出圈,应用于传媒、文旅等各行各业,但高昂的制作和运营成本让不少企业望而却步。因此,“如何让数字人成为小微企业经营的‘可选项’,甚至成为个人创作者的创作工具?”成为致力于数字人领域企业关注的焦点。

4月25日,腾讯云智能推出了腾讯云智能小样本数智人生产平台,可以轻松实现“自助式”数智人生产制作。

通过腾讯云智能小样本数智人生产平台,用户只需要3分钟真人口播视频、100句语音素材,便可通过音频、文本多模态数据输入,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”。

千元级别的成本、小时级的制作时长,大幅降低数字人使用门槛。腾讯云智能小样本数智人为短视频创作、知识分享、带货直播等场景应用提供了更多可能性。

奔向“更智慧、更懂行”

从腾讯数智人的发展脉络来看,腾讯一直在致力于数字人发展。

据介绍,从2016年开始,腾讯就已经开始接触对话式AI,也就是早期的数字人,之后是语音对话方向。2018年,腾讯正式投入数智人研发和服务,成为国内最早投入数字人领域的企业之一,目前腾讯已发布数百篇相关技术顶会、期刊论文、专利近百份。腾讯云智能数智人已经覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种形象风格。

一路走来,在腾讯云智能数智人产品总经理陈磊看来,腾讯数智人主要追求两大方向——更智能、更懂行。

以此次腾讯重点推介的2D真人小样本数智人为例,小样本数智人不仅支持半身、全身形象展示,手势动作会根据内容灵活调整,也支持录制背景任意更换,适用于直播带货等更广泛的商用场景。

在技术解读中,腾讯优图实验室研究总监汪铖杰表示,2D小样本技术的背后是3D技术。“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。”

另一方面,“小(样本)"的背后是"大”。基于自监督机制的通用多模态模型经过大规模数据训练,可以将语音、文本与人像的表情、口型进行关联。“3分钟”的训练视频正是基于这个模型,学习每个人个性化的发音和口型特征。

除了数字人外形、交互等智能外,要看懂行,则离不开真实的落地应用。

陈磊坦言称:“腾讯数智人从2018年到2023年,我们一直追求的目标是‘我们更懂行’。”目前,腾讯云智能数智人从金融、传媒,到文旅、出行、政务等十余个行业,上百个具体的业务场景均已落地。

实现数智人快速普及的“背后”

使用门槛和运营成本是数字人发展过程中的两座“大山”。

为加速数智人服务普及,腾讯云智能提出自动化“AI+数智人工厂”的方向。开箱即用的数智人生产服务,依托腾讯云TI平台,内置超过10项AI算法能力。未来,无需任何算法、研发经验,只要在平台导入视频、语音训练素材,即可通过“自助式”服务,完成大批量数智人形象、音色定制。

针对数智人运营,腾讯云智能提供播报数智人平台、交互数智人平台服务。播报数智人平台支持通过文字、语音输入快速生成数智人视频;交互数智人平台可打造“超长待机”的数智员工,可定制专属问答库,提供7*24小时人机双向交互服务。同时,也可实现数智人直播服务,直播间7*24小时不断档,自由切换真人语音接管,与用户问答互动。

陈磊表示,腾讯云智能专注做厚aPaaS数智人平台,以API接口形式向合作伙伴开放“产、销、服”一体化服务,支持合作伙伴开发更多适用于垂直行业、垂直场景的数智人SaaS服务。目前,已经有数十家合作伙伴依托平台,向行业提供数智人直播SaaS、知识口播SaaS应用,覆盖医疗、传媒、金融多个行业。

作为腾讯云智能的生态集成伙伴,医微讯创始人、CEO潘耿表示,腾讯云智能数智人生产及运营能力的开放,助力我们为客户打造了适用于医疗行业的数字人服务。微媒数字会议CEO天狐表示,微媒将全力和云智能共创数字分身解决方案,形成可持续发展的品牌营销生态,为企业与个人进行IP打造。

此外,腾讯研究院高级研究员宋扬对未来数字人的发展给予了厚望。他认为,数字人的本质是降本增效,它将会成为交互的新入口,在深度上和应用上会有深度的挖掘。同时,数字人未来的应用是非常广泛的,技术+行业会擦出有深度的应用。

热门相关:斗神战帝   战神   学霸女神超给力   战神   横行霸道