移动互联网

当数字人遇上大模型:AI正改变直播江湖

2023/8/4 18:02:00

午夜时分,办公室空无一人,然而工作依旧忙碌。雪白灯光下,电脑屏幕上人影闪动,数字主播正直播带货,笑语款款推荐咖啡和奶茶优惠券。

这是短视频所录下的日常,在昼夜轮转间,数字主播正悄然走进生活。如果说,今年爆发的大模型,开启了AIGC浪潮,那么数字主播就是第一批落地应用,他们一颦一笑,都在诉说着未来已来。

在数字主播崛起的背后,新时代的商业逻辑正发生转变,以百度智能云曦灵为代表的数字人平台,正依托大模型能力,全面降低直播成本,提升带货效率,用AI提供全新解决方案。

这是从真人向数字人的直播迭代,也是我们正在亲历的商业变革。

作者 | 杨磊

编辑 | 方远

火热赛道的痛点

杭州西湖边,拥挤的人流中,随处可见拿着手持云台的主播,边走边播,临近的万国城小区,传说每一个小窗都对应一个直播间,通宵达旦。

从杭州驱车西南120公里,到浙江义乌,每一家门脸都放着直播架,流向全球的商品都可在此买到。而在更南的深圳,华强北的老板,大多有熟练的主播经验,最新电子产品如数家珍。

更在更广袤的中国县城,主播已不再是新鲜岗位,公开报道显示,2022年,中国直播行业观看人次已突破1.1万亿,直播电商总GMV已超3.5万。

潮流之下,几乎所有大型平台,都推出了直播板块。直播电商经过数年验证后,已充分证明它迎合时代逻辑:移动互联网创造环境,智能手机和应用降低门槛,真人推销符合购买习惯,多圈直播也契合多圈层需求。

前景美好,赛道火热,越来越多人投身其中。欠债的罗永浩,跌倒的俞敏洪,不约而同选择直播救赎,也最终都完成逆袭。

在直播的“耶路撒冷”杭州,数以万计的带货主播聚集于此,受访者称:

“我们一般都在凌晨两、三点下班,随便去一个营业的馆子,都能听到隔壁桌的人在聊数据、选品、KPI等,完全没有下班的感觉。”

然而,盛景之下,直播行业的痛点也同样明晰。

首先是工作流程复杂冗长,环节过多。受访者称,日常带货直播前,直播团队至少需要一周的准备时间,包括完成策划,准备视频采集工具、视频编码工具、网络和直播平台账号,搭建场地,筹集拍摄团队、助理等工作。

直播过程中,真人主播的最佳直播时长在6小时内,直播还会受到平台限制,无法规模化复制。

环节之外,更复杂的痛点来自人员管理。直播的核心是主播,然而涉及利益,主播和东家反目的情况已成日常。从罗永浩到俞敏洪,直播走红之后,最难的题目是管控主播。同时,因为人工元素过多,主播IP不稳定,极难长红,更难复制。

最后,令从业者头疼的是运营效率,推广和维护直播间需要大量工作,而缺乏系统化工具,缺乏方法论,导致运营成本过高,苦不堪言。

解决这些痛点的核心是降低人工,事实上,早在多年以前,直播机构便曾尝试用虚拟主播。

然而,早期的虚拟主播出现,其面目表情并不自然,动作僵硬,说话嘴型与声音不同步,而更致命的是,这些主播并不会互动,介绍商品时只能重复录好的话术。

录播的视频或粗糙的动画,并无智能,勉强能维持轮播,但不能聚拢人气,更勿论带货。

直播行业的AI进化,至此停滞,而转折发生在大模型突破之后。

高效的数字人主播

去年圣诞之后,ChatGPT成为热门应用,今年开年,GPT4开启大模型浪潮,百度文心一言成为国内最先发布的大模型产品。

此后,文心大模型开始赋能各个行业,数字人升级成为大模型落地的最佳应用之一。

大模型亮相前,百度已在数字人领域深耕良久,今年1月,百度自研的“百度智能云-曦灵数字人平台”,被中国信息通信研究院评选为国内唯一的杰出级数字人。

百度智能云曦灵数字人已拥有专利2400余项,大模型到来后,其智慧再度升级,在加持文心大模型之后,它已拥有媲美甚至超越主播的直播能力。

从形象上,新一代数字人可以通过真人视频生成虚拟形象,曦灵数字人保持着目前业内最短的人像训练时长,仅需上传一段1至4分钟真人视频,30分钟内就可以一比一复刻真人形象。

如果不愿使用真人形象直播,数字人平台还提供2D模特人像,在曦灵数字人平台,已经有56个模特人像选择,俊男靓女,或坐或立,并且还以月为单位持续新增中。

确定形象后,2D数字人主播便可上岗营业,即可通过文字描述和语音驱动生成短视频,预热直播间,也可直接登台直播,不限时长。

在文心大模型支持下,2D数字人直播可以自动生成直播话术。话术契合直播全流程,包含开场破冰、福利放送、暖场话术、催单话术等。

实际使用中,有商家尝试在后台输入“泰国金枕榴莲”、“包四房肉”、“月销量10w+”、“字数不少于300字”几个关键词后,几秒内,平台便写出一段完整的推广文案。

甚至在直播过程中,主播还能自动回复弹幕,常见的问题如退换货规定、发货时间、优惠力度等,均能回答,务实且高效。也可以通过真人接管功能,和用户进行互动,双直播模式给用户带来更好的互动体验。

至此,虚拟主播全流程跑通,从调试到上线,最快只需数小时,且免去人员招募、话术整理、直播搭建、客服培训等诸多环节,直播效率获得极大提升。

而相对于传统直播,数字人直播所创IP可高效复制,稳定可靠。那些在线下直击数字人表现的MCN机构,已开始加速转型,“它们比真人还专业,服从管理,而且不知疲倦”。

农历八月,钱塘江大潮将至,而在现实世界,大潮已然到来。

更像真人、更会互动、更懂生意

升级的数字人主播到来前,从业者曾疑虑重重。成都一位餐饮行业直播者受访时称:

“如果把直播间当作餐饮空间和门头设计一样去看,数字人直播就像你走进了一家全是预制菜、全是机器人传菜的无人餐厅,没有烟火气、没有锅气也没人情味,过了这个新鲜劲,就会‘死掉’。”

然而,实际应用之后,使用者切换为真香模式,体验如同当下流行的汽车自动驾驶:主播只需和观众一样看直播,如有需要可随时真人接管。

后台屏幕上,提供着直播间实时数据看板、AI复盘的直播间运营情况、弹幕问题复盘与补充建议。直播生意现出精准的数字维度,商业模式正被AI结构。

除却解决效率低下、运营艰难、人才流失这些行业痛点,数字人最吸引商家和机构的核心价值是“成本低、效果好”。

在通过营销大模型训练之后,数字人主播能以更低成本为商家带来更高价值。

百度智能云曦灵数字人主播带货智能手表,连播33小时后,销售额达1.3万元,而这33小时总成本不到100元。

在另一个售卖迪士尼门票的直播间,AI主播稳定开播一个月后,总销售额达到54万元。

从“更像真人”,到“更会互动”,再到“更懂生意”,2D数字人正在飞速进化,而进化的背后,是AI赋能直播后的大势所趋。

全面降低时间成本、金钱成本、人力成本,已经实战考验的数字人,正在改变直播行业生态。

我们即将引来一个难辨真假,或者根本无需辩解真假的时代,科技将更高效服务生活。

而就在我们远望同时,数字人正飞速进化,曦灵数字人平台正在实现虚拟人和动态实景结合带货,直播间介绍话术不重复,并根据动态情况编排话术与插播。

去年9月,世界人工智能大会上,百度创始人李彦宏发表主题演讲时表示,“百度在人工智能领域已经摸爬滚打整10年了。这10年,我们累计研发投入超过1000亿,每年研发占比都超过15%,去年更是达到23%,这在全球大型科技互联网公司中都是凤毛麟角的。”

一年后,那些投入牵引的未来,正加速到来。

版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号