本报记者 张群琛 实习记者 李若晨
昨天下午,第二届北京网络视听艺术大会举办技术赋能内容主题研讨,不少从业者分享了自己用AIGC赋能内容创作的经历。通州区融媒体中心利用AIGC创作了中国大运河申遗十年的宣传片,展现了副中心的古今同辉;而快手搭建的AI创作平台正在逐步助力创作者完成闭环。
用技术激发文化创作活力
北京市广播电视局副局长杨培丽表示,要运用技术赋能,重塑文化传承的新路径,激发文化创作的新活力,共绘融合发展的新篇章。“这两天我们也在介绍《闪耀吧!大运河》这个项目,沿线8省市35城,中华文明在运河上的绵延流淌,特别是在这一系列的文化节目中,我们发挥了国际创新中心优势,以数字科技传播为手段,以视听艺术呈现了经典。”
杨培丽提到,人工智能、虚拟现实等前沿技术,包括AI大模型、文生视频、虚拟数字人等正在积极影响着我们的创作生态、表达的方式,还有传播的路径。“影视剧、短视频、网络剧等领域出现很多新型的应用案例,比如《七两人生》《三星堆:未来启示录》等一系列视频作品正在不断涌现,而大家正好处于新技术文化+艺术创新涌现的一线,我们在创作的一线上。下一步我们也将支持加快新技术的落地转化,激发内容制作不断创新应用。”
通州融媒用AIGC赋能内容创作
AI如何赋能内容创作?第一场圆桌对话中,通州区融媒体中心音频编辑部负责人张斌从AIGC作品的创作流程等方面分享了通州融媒的实践经验。
所谓AIGC,是指人工智能生成技术。在AIGC探索方面,大运河申遗成功十周年之际,通州融媒利用此项技术,和新壹科技联合创作了大运河申遗十周年《运河北首 活力通州》《运河有戏 等你来赏》宣传片,该系列宣传片在制作上具有高度个性化、智能创意融合、实时动态生成三大特点,描绘了北运河通州段古今同辉的历史文化。
这些项目是如何落地实施的?张斌说:“首先是脚本确认,我们团队采取了‘先放再收’的策略,‘放’是指让思维不受限制地探索各种可能性,确定大概的内容范围和风格;‘收’是细化完善时考虑对技术和资源进行考量,考虑目前生成工具的可行性,实现分镜头的细化。准备工作方面,画面上,我们准备了大量通州地标场景作为参考图;歌曲创作上,准备了音乐库和逾万字备选语料库。实际操作中,我们把脚本进行拆解,一部分古代、未来、主题艺术字其实是无中生有,需要文字指令生成虚拟画面;而脚本中的现实城市风景是有中生成,需要用既有参考图生成具有艺术感的视频。最后,将这些视频片段进行合成剪辑。”
下一步,通州融媒还将推出《聚焦城市副中心6+3产业高质量发展》《“拼”出一个融合新时代》AIGC宣传片,持续探索AIGC技术在媒体宣传中的应用。
AI平台完成创作闭环
画面中,一名手持筷子的男子挑起碗中的面条,随后送入口中。伴随着两腮的紧缩,面条被吸入,随后就是咀嚼、吞咽,仔细看还能看到嘴角的汤汁。这是一段AI创作的视频,曾经也是AI创作的难点。
快手大模型产运负责人李杨介绍,快手的AI大模型“可灵”攻克了这一难点。“吃面对AI是非常难的,因为它涉及非常精细的面部动作,人与物品的交互,也涉及真正吃进去之后不会穿模,模型要理解他所使用的筷子、面和吃到嘴里的动作。在今年6月份,‘可灵’很好地解决了这个问题。不仅如此,‘可灵’制作的吃汉堡视频中,小男孩吃完汉堡之后脸上有一些汉堡渣,这是以前不可能做到的。”
李杨介绍,快手AIGC短剧《山海奇镜之劈波斩浪》,其中的画面和技术都是由“可灵”AI提供支持。“也有非常多的创作者用‘可灵’的AI能力做商业化的素材广告,这也是非常好的应用场景。”
李杨坦言,“可灵”AI模型对指令的获得能力、理解能力还达不到预期,真实业务场景应用当中也存在不足,接下来要通过基座模型不断提升它的可控性。同时也要不断降低“可灵”AI使用门槛和创作门槛,让更多用户以更低门槛使用“可灵”AI。“我们会与更多的AIGC创作者、机构和企业一起发掘‘可灵’AI的可能性。也让‘可灵’AI完成创作闭环。”