计算机行业专题报告：视频大模型最新进展如何？

发布日期：2024-09-19 21:14

来源类型：半岛晨报 | 作者：Hart

【澳门金牛版正版资料大全免费】【新澳开奖记录今天结果】【2024年新澳门王中王资料】【管家婆最准一肖一码】【新澳彩开奖结果查询】【新澳门2024资料大全下载】【4949澳门免费资料大全特色】【2024今晚澳门特马开什么号】【港澳2024年精准正版一码资料】【2O24澳彩管家婆资料传真】

【494949澳门今晚开什么】【2024新澳免费资料】 【澳门现场直播今晚开什么】

今天分享的是【计算机行业专题报告：视频大模型最新进展如何？】报告出品方：财通证券

Sora 团队的负责人在 2024 智源大会开幕式分享多模态大模型领域近年来的发展历程以及未来的前进方向。DALLE:通过压缩数据可以实现学习，但仅仅压缩并不能通向 AGI:CLIP:从在视觉世界学习过程中介入自然语言指导，与单纯压缩数据相比计算效率将显著提升:DAILE3:增强训练文本的描述性，训练文生图模型的效率也会更高，即使在推理时无法使用具有描述性的文本，也可以使用具有较强描述性的文本作为训练的框架得到更好的无条件模型:视觉上下文学习可能是实现通往所有类型应用的一条可行路径。

视频大模型应用商业化持续推进。Adobe Firefly新增生成式扩展功能，生成音频和视频功能即将推出，Adobe Express 发布音频生成动画功能，为C端提供便捷的口播视频制作工具:美图构建AI短片工作流，提升 AI 生成可控性，加速文生视频商业化落地:Filmora 上线 13.5 版本，AI功能持续更新，携手英伟达开启全新视频视觉体验。6月12日，公司更新了视频创意软件新版本，并上线多个新功能;LumaAI发布DreamMachine，实现较高质量的文生视频、图生视频;快手发布可灵大模型，技术路线类似Sora;Pika再融资5.8亿人民币，已构建起 AI 视频生成基础模型;Runway 更新 Gen-2 多重运动笔刷功能，提升视频可控性，获得D轮融资，与谷歌合作进一步加深。