sora人工智能文生视频大模型VIP免费

下载本文档

阅读 139
下载 10
格式 pptx
大小 7.48 MB
约22页
2024-11-16 发布于陕西
收藏
评论
点赞(0)
海报
举报

1/22页

2/22页

3/22页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/22

文本预览下载提示常见问题

LOGOsora人工智能文生视频大模型SoraartificialintelligenceVincentVideoLargeModel,generalsciencetraininglearningcourseware主讲人：时间：202X.XXCONTENTS目录01Sora简介IntroductiontoSora05功能特色Features02行业背景Industrybackground03名字由来Theoriginofthename04发展历程HistoryLOGOPART-01Sora简介IntroductiontoSoraSora简介IntroductiontoSora•Sora，美国人工智能研究公司OpenAI发布的人工智能文生视频大模型（但OpenAI并未单纯将其视为视频模型，而是作为“世界模拟器”），于2024年2月15日（美国当地时间）正式对外发布。•Sora这一名称源于日文“空”（そらsora），即天空之意，以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。Sora简介IntroductiontoSora•Sora可以根据用户的文本提示创建最长60秒的逼真视频，该模型了解这些物体在物理世界中的存在方式，可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景。继承了DALL-E3的画质和遵循指令能力，能理解用户在提示中提出的要求。•Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能，其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步，也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃。LOGOPART-02行业背景Industrybackground行业背景Industrybackground•视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面均取得了进展，这预示着技术拐点的临近以及爆款应用的涌现。特别是在3D资产生成和视频生成领域，由于扩散算法的成熟，这些领域受益匪浅。然而，与图像生成相比，3D资产和视频生成在数据和算法方面面临的难点更多。•尽管如此，考虑到大型语言模型（LLM）对人工智能各领域的加速作用以及已经出现的优秀开源模型，2024年该行业有望实现更大的发展。在2023年末至2024年初，Pika、HeyGen等人工智能生成的视频应用逐渐受到关注，这验证了多模态技术的持续进步与成熟。但与此同时，民主倡导者和人工智能研究人员警告说，这些工具已经被用来欺骗和欺骗民众。视觉算法的进步LOGOPART-03名字由来Theoriginofthename名字由来TheoriginofthenameSora在日语中是天空（そら）的意思，引申含义还有自由，象征着其无限的创造潜“”“”力LOGOPART-04发展历程History发展历程History模型发展2021年1月5日文生图模型Dall-E发布Dall-E可以根据简单的描述创建逼真和清晰的图像，精通各种艺术风格，还可以生成文字制作建筑物上的标志，并制作同一场景的草图和全彩图像。2022年4月Dall-E2发布Dall-E2不仅可以生成更真实和更准确的画像，而且能够将文本描述中的概念、属性和风格等元素综合起来，生成现实主义的图像和艺术作品。2022年11月30日大语言模型ChatGPT发布[29]ChatGPT不仅能与人对话，还能编写代码、创作内容等，这一款革命性产品的上线引发全球关注，上线仅5天用户数量就已突破100万。发展历程History模型发展2023年3月15日GPT-4正式面世GPT-4可以更准确地解决用户的难题，多模态的GPT-4还可以生成、编辑具有创意性或技术性的文章，在高级推理方面的表现超过其前代产品。2023年9月21日Dall-E3正式发布Dall-E3能够更准确、更优秀地生成效果，可以更准确地呈现用户的想法，用户可以要求ChatGPT提供合适的提示词。2024年2月16日Sora问世Sora继承了Dall-E3的画质和遵循指令能力，可以根据用户的文本提示创建逼真的视频，可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景。发展历程History正式发布美国当地时间2024年2月15日，OpenAI正式发布文生视频模型Sora，并发布了48个文生视频案例和技术报告，正式入局视频生成领域。Sora能够根据提示词生成60s的连贯视频，“碾压”了行业目前大概只有平均“4s”的视频生成长度。LOGOPART-05功能特色Features功能特色Features优点功能综述Sora可以快速制作最长一分钟、准确反映用户提示、可一镜到底的视频（其他AI视频工具还在突破几秒内的连贯性），视频可以呈现“具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

sora人工智能文生视频大模型

LOGOsora人工智能文生视频大模型SoraartificialintelligenceVincentVideoLargeModel,generalsciencetraininglearningcourseware主讲人：时间：202X

XXCONTENTS目录01Sora简介IntroductiontoSora05功能特色Features02行业背景Industrybackground03名字由来Theoriginofthename04发展历程HistoryLOGOPART-01Sora简介IntroductiontoSoraSora简介IntroductiontoSora•Sora，美国人工智能研究公司OpenAI发布的人工智能文生视频大模型（但OpenAI并未单纯将其视为视频模型，而是作为“世界模拟器”），于2024年2月15日（美国当地时间）正式对外发布

•Sora这一名称源于日文“空”（そらsora），即天空之意，以示其无限的创造潜力

其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的

Sora简介IntroductiontoSora•Sora可以根据用户的文本提示创建最长60秒的逼真视频，该模型了解这些物体在物理世界中的存在方式，可以深度模拟真实物理世界，能生成具有多个角色、包含特定运动的复杂场景

继承了DALL-E3的画质和遵循指令能力，能理解用户在提示中提出的要求

•Sora对于需要制作视频的艺术家、电影制片人或学生带来无限可能，其是OpenAI“教AI理解和模拟运动中的物理世界”计划的其中一步，也标志着人工智能在理解真实世界场景并与之互动的能力方面实现飞跃

LOGOPART-02行业背景Industrybackground行业背景Industrybackground•视觉算法近年来的突破在泛化性、可提示性、生成质量和稳定性等方面

最好的沉淀 + 关注: 实名认证
内容提供者

行业文档

收藏店铺进入空间

sora人工智能文生视频大模型VIP免费

sora人工智能文生视频大模型

您可能关注的文档

相关文档

热门下载

相关标签