移动互联网

起底百度AI作画,天宫盛宴刷屏视频背后的未来变革

2022/12/29 18:23:00



文 | 周天财经

周天财经 原创出品


「我在 OpenAI 的工作每天都在提醒我,社会经济的重大变革将会比绝大多数人认为的更快到来。」


这是 OpenAI CEO、YC 前主席 Sam Altman 的一句断言,2021 年,Sam Altman 指出 AI 大模型正在推动人类社会实现「万物摩尔定律」,即随着智能技术对各行各业的渗透,人类的生产力与创造力,将在通用人工智能(AGI)的帮助下得到彻底解放。


未来图景已经在加速成为现实。在中国载人航天工程立项实施 30 周年的节点,近日新华社与百度文心一格推出献礼视频《AI 描绘天宫盛宴》,回顾了三十年来中国载人航天的恢弘历程,在社交媒体引发热议。



这则精巧视频中的画面全部由 AI 自动生成,即所谓「AIGC 内容(AI Generated Content)」,在其背后提供技术支持的百度文心一格,则是百度依托飞桨以及文心大模型技术,于 2022 年 8 月发布的业内首个 AI 艺术和创意辅助平台。


AIGC 堪称今年科技领域最引人关注的细分赛道。在日前《科学》杂志公布的 2022 年度十大突破中,AIGC 与韦伯望远镜以及 NASA 开展的人类首次行星防御测试等项目并排在列,其重要程度可见一斑。


长期以来,许多人认为人工智能只能够用来完成相对简单的任务,而像是 AlphaGo 这样的算法虽然能够在围棋中击败人类,代价却是投入大量资源,距离实际应用仍然很远。然而 2022 年 AIGC 领域的进展却让人们惊喜甚至不无错愕地发现,人工智能的创造潜力已经如此成熟。


01 AIGC 走出实验室


一个代表性事件是 2022 年 8 月,游戏设计师 Jason Allen 利用 AI 作画工具 Midjourney 创作的《太空歌剧院》在美国科罗拉多艺术博览会上获得数字艺术类别冠军;另一项热门图片生成算法 Stable Diffusion 的幕后企业 Stability AI 则宣布获得超 1 亿美元融资,投后估值达到 10 亿美元;11 月底,OpenAI 推出聊天机器人算法 ChatGPT,则在 AIGC 原本高涨的热度上再添一把新柴,特斯拉 CEO 马斯克直言 ChatGPT「厉害得有些吓人」。


AI绘画作品《太空歌剧院》

AI 已经从单纯地理解语言、文字、图片乃至视频,大跨步走向生成高质量的内容,这种内容覆盖了以往被认为蕴藏人类才智的艺术创作。


国内科技企业也迅速捕捉并跟进 AIGC 的产业趋势,百度是其中的代表企业之一。百度研究院于 2022 年初发布的科技趋势预测中针对预训练大模型和 AIGC 进行了前瞻阐述,7 月的「2022 百度世界大会」上,百度创始人李彦宏就旗帜鲜明地力推 AIGC 概念,随后便是 8 月份面向 C 端发布文心一格,用户只需要输出一句描述并选择想要的风格,文心一格就能在短短几十秒后根据描述生成画作。


而这已不是文心一格在传媒领域首次展露实力,此前百度世界大会上文心大模型就复原了《富春山居图》残卷;在二十大期间,百度也与《人民日报》合作发布了描绘未来中国图景的 AIGC 视频,实力破圈。


AI修复《富春山居图》

事实上,在 AIGC 的商业落地层面,百度走得可能还要比同行们更远一些。


12 月 8 日在朵云轩 30 周年庆典上就对文心一格与海派画家乐震文分别续画的陆小曼未尽稿《夏日山居图》完成拍卖,这幅名为《未完·待续》的画作最终拍出 110 万高价,也是全球首次 AI 山水画作的成功拍卖;今年 6 月份,百度数字人度晓晓利用 AI 创作的四款画作被制作为数字藏品,24 小时售卖额超过 17 万元。


目前业内普遍认为 AIGC 在如文字、图片乃至视频、代码、音乐等内容领域的输出效果上已经非常接近商业应用水平,能够走出实验室的 AIGC 在版权、伦理以及变现路径等多个维度上仍待探明,这一背景下,百度在 AIGC 商业化上的探索无疑值得肯定。


从具体的角度来看,文心一格 AIGC 所带来的是内容产业的生产力解放,根据知名风投机构 Coatue 的白皮书推演,人工智能将推动内容创作(文字、图像、视频)的成本接近零,这会在根本上解决创作者的内容焦虑,带来工业革命级的巨大突破。


PGC 的门槛和成本都是巨大的,爆火的《原神》仅原画团队就数百人,还牵涉到大量的美术外包工作,倘若能够合理的接入 AIGC 能力,不但将节约大量的资源,也将帮助企业赢得抢占市场的时间窗口。


又比如,文心一格续画陆小曼只依靠朵云轩前期「投喂」了少量陆小曼的画作,就能帮助 AI 描摹出画家的笔触,这让我想起导演徐克亲笔手绘的分镜头,对于电影工业来说,徐克以诡谲多变的想象力闻名遐迩,有着极其强烈的个人风格,其亲手画的分镜头多有流出,和电影相比,还原度很高,是徐克脑海中第一手的武侠世界。


但徐克是不可复制的顶级导演,自己一笔一笔来画,效率其实不高。整个电影工业,其实效率和创作最「卡脖子」的环节就是导演,因为导演是唯一不可替代的资源,时间精力乃至想象力都是稀缺资源,如果有 AI 辅助生成画面,就很大程度解决整个行业的卡脖子难题。或许从 2022 年起,「来张徐克风格的手绘图」也会成为一种创作风格,这样只此一家的画面,也是可以被复制和批量创作的,进而撬动超乎想象的产业空间。


而 AIGC 更了不起的意义可能在于,借助 AI 技术,人类的创造力和想象力在某种程度上不再依附于经年累月的技艺,毋庸置疑,专业的艺术创作仍然价值斐然,但无须画笔也能作画,不需识谱也能创作音乐将带来前所未有的「创造力民主化」。由此,与 AI 协作将很快成为各个行业必须学习的技能,并在未来成为人们的自觉与本能。


02 「强者游戏」:文心一格的商业潜力


AIGC 之所以能够在 2022 年实现突破式进展,本质上来自于 Transformer 模型以及其所带动的基于预训练大模型的深度学习,我们不必费力弄清楚这些技术术语的背后含义,可以理解为从 2017 年开始,AI 技术发展在一套新的架构下打开了崭新局面,其中各家争夺的技术高地正是「大模型」。


简单来说,基于「预训练」和「超大规模」的 AI 大模型不但展现出非常出色的「理解能力」,还能够在较少的样本数据支持下就应用到大量实际场景,而 AIGC 正是大模型这棵树上结出的一粒果实。


在这一波 AIGC 中,AI 大模型在理解人类语言的能力上发挥了关键作用。归功于大模型的发展,不仅文本生成的效果良好,基于文本的图像生成也有了极大的进步。


前面提到,文心一格背后是百度飞桨以及文心大模型提供支持,飞桨作为深度学习平台已为业内熟知,而文心大模型则是百度从 2019 年就开始深耕研发的另一项极为重要的技术基础设施。


所有我们视为前沿的时髦突破,实际上都是百度多年的深厚积累。


百度披露的内容显示,文心大模型是由其自主研发的产业级知识增强大模型,「产业应用」,是百度在文心大模型研发中尤其关注的重点。也就是说,文心并非一个离商业化遥远的空中楼阁,而是从发端就是直奔产业痛点,指向性十分明显。


在 WAVE SUMMIT+2022 深度学习开发者峰会上,百度针对文心大模型发布一系列升级,截至 2022 年 11 月,文心已累计发布 36 个大模型,覆盖 NLP(自然语言处理)、CV(计算机视觉)、跨模态、生物计算等多个 AI 核心应用领域,同时还包括了 11 个行业大模型,涵盖电力、燃气、金融、航天等多个领域。


目前文心已经在国网、深圳燃气、浦发银行等实际项目中落地应用,在业内率先进行大模型的商业化落地探索并推动各个行业的智能化转型升级。


聚焦到文心一格所处的 AIGC 赛道来看,提供支撑的百度文心 ERNIE-ViLG 2.0 大模型处于国际领先水平——在权威评测集 MS-COCO 和人工盲评上,ERNIE-ViLG 2.0 均超越了 Stable Diffusion、DALL-E 2 等模型,并且和国外产品相比,文心一格在中文语义理解以及中国文化元素理解等方面有着显著优势——《AI 描绘天宫盛宴》视频中,文心一格对山水、楼阁等东方意象的「拿捏」正来自于此。


换言之,文心大模型在多个细分领域中不但保持着技术优势,同时也在为包括 AIGC 在内等多个领域的商业化探索提供着底层支撑。


大模型是典型的「强者游戏」,动辄千亿的参数数量意味着极高的训练成本,业界测算,OpenAI 仅仅是在 GPT-3 的训练阶段已经花费了 1200 万美元,而且即便是解决了资金和算法问题,训练所需的海量数据也不可能绕开头部科技企业的合作或支持。


门槛如此之高,仍吸引着科技巨头迎难而上的答案只有一个:AIGC 在应用层面的质变将会带来数万亿级的产业机遇。


如果要衡量 AI 作画的商业价值,发生在 2022 年春天的一起收购或许能够提供一定的参考。微软以 197 亿美元(约 1248.98 亿元人民币)完成收购语音技术公司 Nuance Communications。据《Fortune》报道,两年来,微软一直与 Nuance 合作开发 AI 软件,使得医生无需记笔记并更好地预测患者的需求,并将语音技术公司的产品结合到其 Teams 聊天应用程序中以进行远程医疗预约。Nuance 也是 Apple 智能助手 Siri 的语音识别引擎创建者。


如果要问 AI 作画的商业价值是什么?Nuance 就是一个侧写,而这还仅仅是在音频领域的 AI 应用,至于图片、文字、音视频的多模态必将是更加宽阔的水域。


可以肯定的是,AI 作画仅仅只是开胃菜,由智能技术带来的变化正席卷而来。


一位技术从业者断言:2023 年一定是 AIGC 发生「应用价值」质变的元年。而目前来看,百度在形成商业闭环上已经先行半步,这来自于百度在技术积累、数据体量以及应用探索等多个维度上的禀赋和布局,正如加缪所说的那样,「对未来真正的慷慨,是把一切都献给现在」。


版权声明
本文仅代表作者观点,不代表艾瑞立场。本文系作者授权艾瑞专栏发表,未经许可,不得转载。
  • 合作伙伴

  • 官方微信
    官方微信

    新浪微博
    邮件订阅
    第一时间获取最新行业数据、研究成果、产业报告、活动峰会等信息。
     关于艾瑞| 业务体系| 加入艾瑞| 服务声明| 信息反馈| 联系我们| 合作伙伴| 友情链接

Copyright© 沪公网安备 31010402000581号沪ICP备15021772号-10

扫一扫,或长按识别二维码

关注艾瑞网官方微信公众号