kaiyun官网
News Center
新闻中心
新闻中心 您的位置: 首页 > 新闻中心
爆款潜力产品接二连三面市 有望颠覆影视、短视频的AI视频进入井喷模式丨黄金眼
2024-01-05 19:17:55 作者: 新闻中心

  兼具创作艺术作品,设计虚拟世界,表达情感和故事的AI视频工具,能够具象化、拓展我们想象力,甚至改变我们的生活方式,目前已经迎来重磅产品不断亮相,AI+视频爆发近在眼前?

  2023年12月5日,美图创造力大会于厦门召开。视觉大模型进展方面,依据公司介绍,截至11月,MiracleVision累计服务174.5万电商用户,生成1.04亿张AI商品图。会上,MiracleVision4.0发布(10月9日发布3.0版本),4.0版本将于2024年1月开始逐渐支持美图旗下各产品,主推AI设计与AI视频两大能力。

  其中AI生成视频已经从实验阶段走向可用性可支持商业化应用。MV4.0针对相邻帧之间相关性不足的痛点做优化,支持支持文生视频,图生视频,视频生视频,视频运镜等功能,生成视频可达到4k分辨率满足商用场景需求。目前相关要应用于电子商务行业的AI商品视频生成和广告行业的AI营销视频生成。

  AI原生设计方面,MV4.0赋能交互设计到执行全流程,简化技术操作,降低使用门槛,将用户精力集中于创想阶段。核心新增功能包括:生成矢量图、文字特效、智能分层和智能排版。

  此次迭代中,模型的自然语言能力优化突出。能支持自然语言交互修改图像和视频,做到提速增效,快速反馈。这来自于新技术力的加持,美图天使轮投资了语言大模型公司WeituAI,加速打通文生图或文生视频的通路。

  前不久的11月29日,美国AI初创公司PikaLabs发布了重磅产品Pika1.0。能够支持对于视频实时编辑和修改,实现文生视频、根据已有的素材直接扩展视频并生成不同高宽比的内容、直接在视频中添加需要元素等,几乎对标Runway家族现有的所有功能,现已开启申请试用。

  Pika1.0核心功能首先包括文生视频,即语意理解能力、生成视频的连贯性和清晰度表现较好。时长方面:目前生成视频的时长为3s,暂落后于竞品Runway,Runway在8月的更新中将生成视频最高时长从4秒延长至18秒。

  图生视频可以生成视频时长目前为3秒,有望支持图生视屏的镜头控制功能。视频生视频通过输入一段原视频,Pika可按照每个用户要求的场景生成各种风格的视频动画。局部修改视频内容则通过输入原视频,用户可圈定需要修改的部分并提出要求,单独改变所圈定的元素。除此以外还有修改视频尺寸,扩写图片为AI绘画工具中的典型功能,Pika将该功能在视频生成中实现。

  除Pika1.0外,近期还有多个AI视频工具取得进展,其中RunwayGen-2发布更新,生成视频的清晰度可达到4K,视频质量显著提升。Meta发布EmuVideo,能够基于文本生成512x512的4秒高分辨率视频,在生成质量和文本忠实度上表现较好。

  字节团队推出视频生成新方法PixelDance,可在生成视频中实现较好的动态性;并计划在未来数个月内推出产品。Stablilityai推出视频生成工具StableVideoDiffusion,支持文本到视频、图像到视频生成。

  AI生成内容大潮已经逐渐从文本和图片,进一步转向视频生成。随技术突破,AI视频生成技术将在短视频、短剧等行业带来新的可能性。

  AI对传统内容生产行业的生产方式和产出效果等造成诸多影响,如动画片、影视剧、短视频等细分行业。

  其中AI辅助动画片制作方面,可在场景绘制等领域实现降本增效。《犬与少年》就是AIGC技术辅助商业化动画片的全球首支发行级别作品,片长不到4分钟,但整部短片里的场景绘制工作都是是由AIGC技术完成。短片采用rinna制作的AI辅助背景制作,由牧原亮太郎负责导演,用手绘Layout上色稿,并将之提交至AI生成细化并优化背景,再对AI生成的背景图进行人力修正。

  同时,AI还可以缩短电影后期制作时长,并达到更好的视觉效果。科幻电影《瞬息全宇宙》背后的视觉效果团队仅有5人,为了尽快完成这些特效镜头,他们选择了Runway公司的技术来帮助创建某些场景,比如为图像去除背景的绿幕工具(TheGreenScreen)。导演及编剧表示“仅仅几次点击就节省了几个小时,还可以用这些时间尝试三四种不同的效果,让影片效果更好。”

  不过要注意的是,动画、电影、游戏CG等商业化视频作品中,核心竞争力在于分镜设计、镜头语言、叙事节奏等,AI工具暂时还无法触及。而且在影视动画工业流程中,上下游流程整合度较高,分镜、建模、K帧、渲染等不同环节需要按照流程规范进行相对有效的信息沟通,想要在人机之间准确传达需求,仍需提升大模型的通识能力和理解能力。

  而在短视频领域,AI工具或有颠覆性的冲击。AI对短视频的改变主要包含AI给输入的文案配音、根据歌曲歌词生成画面、根据文本生成动态画面。冲击大多数表现在大量内容自动生成的效率大幅度的提高;以及原有文案撰写、视频拍摄、场景搭建、视频剪辑等工作人员被取代的制作成本大幅缩减。

  在生成式AI的帮助下,当前UGC(以口播中视频为例)生产的全部过程转变为:chatgpt生成文案——AI配音生成音频——人工智能视频合成工具(导入照片和音频),难度较低的口播视频单视频耗时能大大压缩至几分钟。而更高难度的视频内容也将通过AI完成,谷歌公布的产品Phenaki能根据200个词左右的提示语生成2分钟以上的长镜头,讲述一个完整的故事。

  同样,短期内由于视频作为典型的内容创作行业,其商业化逻辑与小说、漫画、动画、游戏类似,需要持续的IP运营培养用户粘性,使用户倾注感情,因此就需要以稳定的质量、前后连贯一致的风格进行持续内容更新,现阶段AI生成视频很难做到这一点。

  而对视频质量发展要求不高的广告营销、自媒体等领域,以及定制化空间小的数字人直播等模式,可以会率先受到影响。

  其中,美图2022年年底起陆续发布AI动漫、AI简笔画、AI写真等功能;截至目前,图生图超3000万人使用,文生图超2000万人使用,头像制作超800万人使用。依据公司10月发布会信息,WHEE创作生态初见成效,生成的优质AI效果超550万;开拍用户规模迅速增加,9月MAU突破35万;WinkStudio自7月中旬上线万名视频创作者;美图设计室2.0已为近百万中小电商卖家提供AI商拍服务;AI数字人生成工具DreamAvatar已于8月26日上线,主打AI演员与AI主播;AI修图师RoboNeo于7月开启内测,当前DAU近万人。

  而且美图具备流量优势,可以从修图到用于社交娱乐的个人图片生成以及生产力场景,高频领域切入低频领域。

  捷成股份推出了AI数字人语言模型技术,实现国内数字人首次应用落地的。目前,世优科技已成功推出了具有语言模型技术加持的AI虚拟主播“慕兰”。世优科技打造的虚拟数字人元宇宙目前已涵盖入门级/消费级/专业级/AI级多层次虚拟数字人赋能产品体系,产品应用场景范围覆盖大B端、中小B端、C端。目前世优科技已为包括央视、中国移动、华为、阿里巴巴、海尔集团等世界500强在内的,近1000家客户提供产品或服务,累计打造数字人超过800个。

  新生代数字创意赋能者万兴科技,于2023年3月31日发布AIGC“真人”短视频出海营销神器“万兴播爆”,并宣布开启移动端公测。据介绍,无需外籍演员出镜,用户调用万兴播爆中的场景化模板,以及多国籍AI数字人功能,几分钟可一键生成AIGC“真人”出海营销短视频。

  易点天下是出海营销领军企业,与拼多多、阿里等均为合作伙伴,公司推出了AIGC营销素材平台KreadoAI。截至23Q3,KreadoAI已覆盖全球67个国家,注册用户数60万,有AI视频制作、AI工具、AI模特和克隆服务功能。

  焦点科技旗下AI助手麦可将推出AI视频功能。企业具有B2B跨境电子商务平台中国制造网,依托平台推出AI助手麦可,现已具备AI图片生成、智能拓客等众多功能,计划在23年底推出AI视频、数字人等新功能,AI视频可帮助平台卖家创作营销素材,进一步赋能跨境电商产业链。

  果麦文化则布局了AI校对和AI漫画。2023年果麦文化以现金1500万元增资星图比特,增资后持股票比例为6%,并签订了《AI文字校对软件开发合作协议》,委托星图比特为公司开发AI文本校对中的SaaS软件和算法系统,负责完成AI文本校对软件的设计开发、移交、培训服务工作;企业具有丰富IP和作家,同时公司布局的AI漫画大模型,未来将陆续推出动画电影、短剧、互动漫画等;公司储备了一部主投主控的动画大电影,AI漫画大模型赋能创作。

  华策影视牵手了河马游戏,通过AI视频工具赋能影视内容制作。根据华策影视官微,华策集团将牵手河马游戏,将共同打造互动影视内容。首个合作产品预计将于明年初推出,并将与电视剧《去有风的地方》进行IP联动,合作项目对《去有风的地方》IP元素进行改编或复用,预计将于2024年初推出。AI视频工具有望帮助公司有望在影视内容制作上降本增效。

  声明:证券时报力求信息真实、准确,文章提及内容仅供参考,不构成实质性投资建议,据此操作风险自担