Goku 是由香港大学与字节跳动联合研发的多模态AI视频生成模型,基于校正流Transformer架构(Rectified Flow Transformer),专为图像与视频的联合生成优化。
文本生成视频:Goku能够根据用户提供的文本描述生成完整的视频内容。通过理解文本中的细节和情节,Goku将其转化为动态视频,适用于广告制作、营销视频、短视频创作等场景。
图像生成视频:用户只需提供一张静态图像,Goku即可基于这张图片生成动态视频。这一功能特别适合电商和品牌推广,可以将产品图片转化为生动的广告视频。
文本生成图像:除了视频生成,Gok九游娱乐 九游娱乐官方u还支持根据文本描述生成静态图像。用户输入具体的文字信息,Goku能生成符合描述的高质量图像,广泛应用于创意设计、广告、插画等领域。
高质量生成:Goku的图像与视频生成效果非常真实,能够清晰地表现人物情感和细节,展示出广告产品的细腻质感。
业内人士认为,目前国产视频大模型在画面的一致性、可控性、丰富程度上都有明显提升,提高成像质量、突破生成时长瓶颈后,有望大幅打开下游商业化空间。
快手-W(01024):可灵大模型由快手大模型团队自研打造,具备强大的视频生成能力,能够根据用户提供的文本描述生成高质量的视频内容。
美图公司(01357):美图公司九游娱乐 九游娱乐官方推出的MiracleVision 4.0 AI视频生成功能为用户提供了强大的视频生成能力,具有高质量的生成效果和良好的细节处理能力,适用于多种内容创作和商业应用场景。
商汤-W(00020):2024年7月4日,商汤科技发布人物视频生成大模型Vimi;7月6日,上线AI生成视频模型清影。
阿里巴巴(09988):9月19日,阿里云通义万相发布视频生成模型,上线文生视频和图生视频功能;
版权所有:Copyright © 2024 九游娱乐 版权所有 粤ICP备19072226号