LOGOsora人工智能文生视频大模型SoraartificialintelligenceVincentVideoLargeModel,generalsciencetraininglearningcourseware主讲人:时间:202X
XXCONTENTS目录01Sora简介IntroductiontoSora05功能特色Features02行业背景Industrybackground03名字由来Theoriginofthename04发展历程HistoryLOGOPART-01Sora简介IntroductiontoSoraSora简介IntroductiontoSora•Sora,美国人工智能研究公司OpenAI发布的人工智能文生视频大模型(但OpenAI并未单纯将其视为视频模型,而是作为“世界模拟器”),于2024年2月15日(美国当地时间)正式对外发布
•Sora这一名称源于日文“空”(そらsora),即天空之意,以示其无限的创造潜力
其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的
Sora简介IntroductiontoSora•Sora可以根据用户的文本提示创建最长60秒的逼真视频,该模型了解这些物体在物理世界中的存在方式,可以深度模拟真实物理世界,能生成具有多个角色、包含特定运动的复杂场景
继承了DALL-E3的画质和遵循指令能力,能理解用户在提示中提出的要求
•Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能,其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步,也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃
LOGOPART-02行业背景Industrybackground行业背景Industrybackground•视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面