您的位置:首页>栏目首页 > 行业 >

像做PPT一样做短视频和直播?

2023-08-13 08:01:28    来源:刺猬公社

8月10号的快手光合创作者大会上,高管圆桌环节开始前,一笑、于越、Thomas和笑古分别在视频中做了自我介绍。

只不过,视频中出现的并非真人,而是“一笑分笑”、“于越分越”、“Thomas分托”和“笑古分古”——快手高管们的数字人分身。

这些真假难辨的数字人,来自快手首次公开的AIGC数字人解决方案:快手智播,可以低成本创建数字人直播,制作数字人短视频。用户只需3-5分钟的少量视频素材,用时3天花费千元,就可制成孪生数字人。目前,快手智播可在本地消费、本地生活、电商直播等多种场景落地。


(资料图片仅供参考)

正如快手AI&用户增长业务负责人王仲远所说:身处这场AI技术变革之中,我们坚信AIGC将赋予普通用户更多的创作权力和自由,也坚信AIGC将成为短视频内容生产的基础设施。

数字人,用在哪?

在直播带货的达播领域,人货场仍然是不可切分的紧密三角,数字人很难取真人而代之。但在非达播的场景,数字人有广阔的应用空间,且能大幅提升从业者的工作效率。

据了解,仅以快手为例,AI数字人在本地生活、本地消费、24小时店播和海外商业素材生产等场景有广泛的应用,且曝光转化率等核心指标和大盘相比高达203%。

以快手的快聘业务为例,快手智播月均生产数字人素材上千条,以中低粉段达人拍摄视频为基准计算,单条短视频创作成本降低到人工成本的5%以下。

显然,同样是招聘,在传统的招聘平台上发布文字信息的成本,要远远低于在短视频平台制作视频的成本。在更早的时期,这一问题限制了招聘的短视频化和本地生活化,让有招聘需求的一方望而却步。

但AI数字人的诞生和快手智播的存在,让客户可以像做PPT一样做视频和直播,仅需输入文案,就可配置视频,再通过快手的算法分发逻辑,将视频推送给广大有潜在需求的人群。这不仅利用了快手的用户量和算法优势,又将招聘方的成本降到了合理的程度。

据快手官方数据,在低成本下,“全国操作工招聘”这一账号,在测试周所有主播中简历投递量能力排名第6,且这一账号的招聘还突破了时间限制,在凌晨2-3点仍有拿单能力。

招聘之外,AI数字人在一些领域的表现也堪称优秀。比如本地生活,有服务商一次性投入五十个以上的账号进行开播,一个月内有效总直播时长达11640小时,带来了1.1万个订单和近百万的GMV,转化率是真人的两倍,且成本还要更低。

其中,沪上吃喝玩乐花花系列账号某快餐汉堡套餐单品一个月卖出近3000份;某游乐园全日门票单品一个月卖出30万元,实际核销率接近60%,近似真人直播效果。

至于直播带货的店播场景,在更早期的时间里,就有将24:00-6:00的时间段交给虚拟主播,用以保持直播间的24小时运营和基础商品介绍功能的案例。24小时的AI数字人直播间则是更加激进的尝试,这一方面是因为数字人建模的能力在提升,达到了“真假难辨”的地步,另一方面也是因为店播本身的特殊属性:“货”比“人”要更重要。

24小时店播的效果也不比真人要差,以美妆店铺泉兮旗舰店为例,数字人测试直播半个月期间,人均观看、3s播放率、转化效率和商品访问下单率均比该直播间真人主播表现更好,每场直播GMV贡献近万元。

花西子直播间也同样使用了数字人主播,并对数字人的效果表示:“很多客户提问交流,有可能我们效果太逼真,用户没看出是数字人,还是会问很多问题,我们也能迅速回复。”

以上的成功案例实际上都有共同点,即“人”本身在场景中的引导能力,并非最重要不可替代的。对于招聘来说,展示出来的“招聘信息”是最重要的,用户在进行简历投递和工作选择时仍要进行二度筛选;本地生活和店铺直播等等,“商品”的好坏和店铺的履约能力是更重要的,“人”只起到引导和进入的作用。

在这种情况下,AI数字人也就有了大展身手的空间。更低的成本和更好的效果,让AI数字人更具竞争力。

3分钟,3天,千元成本 AIGC数字人的三个关键词

数字人并非一个新鲜产物,在生成式AI进入该领域之前,就已经有一些数字人IP获得了不小的成功。

2021年开始,与元宇宙概念相关的虚拟偶像率先出圈,如A-soul、柳夜熙和狐璃璃等,他们往往有大平台扶持的背景,且都吸引了不小的声量,其中,A-soul主要成员“嘉然今天吃什么”是B站百大UP主,柳夜熙在抖音拥有超800万粉丝,狐璃璃在快手拥有超400万粉丝,均是平台头部创作者。

不过,这批3D数字人IP,在商业化路径上仍然走的是传统流量经济的老路,收入来源以直播打赏或者广告代言为主,这与其制作方成本的投入并不匹配。而且,“中之人”的存在,也让这批数字人IP面临一定的“塌房”风险,难以成为真正的“数字”偶像。行业中也曾有过专为直播带货而生的IP,如遥望科技旗下的数字偶像“孔襄”,不过该数字人目前已经停更,鲜有新动向。

行业中更加广泛存在的,则是数量庞大的2D数字人,在更早的时间段主要服务于政府、金融等行业,C端用户则无明显感知。2023年开始,在生成式AI技术的加持下,有了爆发性的增长。

一批公司也因此吃到了行业增长的红利,在抖音平台,虚拟人创业公司硅基智能已经服务了上万个客户,主要聚集在本地生活和直播电商领域,也进入了C轮融资阶段,是数字人直播领域的头部公司。

此外,行业内还有定位SaaS版本视频剪辑工具,专门服务于地方电视台,银行,国家机关和地方政企的腾讯智影,以及主要给政务,金融客户提供定制化解决方案的百度灵犀和给短视频账号公司服务的闪剪等等。

除了定位于营销场景的政企、传媒、金融行业之外,短视频和直播带货的数字人需求往往聚焦于垂类,比如短视频中的口播场景以及直播带货中的标品店播场景,这部分内容对人的表现力需求不强,因此能够由数字人完美取代。

基于此,快手自研的AIGC数字人解决方案快手智播有着天然优势,其与快手业务系统的深度打通,能更好的为快手生态服务。比如其完美匹配快手的直播系统和风控系统,还能自动挂车和切换讲解卡,同时回答观众的提问,和观众实时互动,这一过程又进一步节省了人力的使用。

最低只需要3分钟的视频和音频素材,用时3天,就可以制作相应的数字孪生形象,同时快手还将提供整套的SaaS服务工具,不需要用户另外采购任何硬件设备,只需输入短视频文案或者直播稿,就可一键生成视频或开播。这套流程在当前的技术能力下,仅需千元即可完成,而此前传统数字人制作费用一般需10万元以上。

据快手技术人员介绍,为了达到目前的拟真度,快手基于自研高精度3D面部重建算法进行了3D建模,还在数万小时的模特数据上进行了训练,又针对每个具体模特进行了微调。

而为了实现实时性,快手还有自研的推理引擎、部署框架、以及在多个业务中得以迭代的流式的数字人生成框架,能够以秒级的低延迟实现数字人直播。

数字人背后,快手布局全模态大模型AIGC?

实际上,数字人产品只是快手AIGC系列部署中的一环,在光合大会上,王仲远强调了一个概念:全模态、大模型AIGC。

他表示:创作本身是一件需要创意和专业度的事情,持续创作优质作品会让很多创作者感到压力。以一个美食创作者为例,分享一道或十道拿手菜并不是难事,但长期坚持下去,总会在创意、素材和视频制作等方面遇到难题。

而所谓的全模态、大模型AIGC解决方案,就是为了解决创作者在创作过程中的各种痛点而生。据王仲远介绍,这套方案可以帮助创作者更好的激发创意,用户只需一个指令,就可以让大模型帮助自己完成故事撰写、脚本整理,并能够基于场景主题生成对应的图片和配乐。用户不用再绞尽脑汁反复脑暴,可以让大模型提供更多的灵感和创意。

在大会上,王仲远还展示了大模型的素材绘制功能,针对周杰伦创作的歌曲《七里香》,大模型自动画出了相关画面,这也就意味着,创作者在使用快手大模型的时候,可以自由地提供场景描述来获得素材,最终简化创作视频的流程。在电商场景上,大模型也可以帮助B端创作者将所售商品进行3D化展示,进一步提升消费体验。

甚至,传统视频直播中费时费力门槛颇高的剪辑工作,也可以由快手大模型的AIGC解决方案取代。创作者只要自行上传相关素材,就可以得到相应的短视频内容。

此前,不少大模型产品都是针对某项具体的场景应用,譬如对话提供相应的文字解决方案或者AI智能生成图片。而快手的全模态、大模型AIGC,不只定位于个别功能,而是聚焦于用户在快手的各种需求,让用户在创作视频和带货的每一步都能得到AI的帮助。

而这,显然更符合AI诞生的本意,AI出现,不是为了取代谁的工作,而是帮助人类把工作变得更简单。全模态AIGC如此,快手智播这一产品更是如此。在以人为核心,以创作者为核心的基本价值观下,相信每一个快手的创作者,都可以用好AI,在快手获得更好的创作体验。

关键词:

相关阅读