-
-
0有什么文生视频好用的吗? 萌新求大哥带带路 我有发财点子,咱们一起上路啊 带带我
-
5谢谢
-
1过去一周,OpenAI发布的生成式视频大模型Sora刷爆了各大社交媒体,OpenAI在发布Sora时表示:“Sora是能够理解和模拟现实世界模型的基础,我们相信这种能力将成为实现AGI的重要里程碑。”而图灵奖获得者、Meta首席科学家Yann LeCun(杨立昆)却在社交平台X上炮轰Sora,称Sora的生成式技术路线注定失败。
-
4国内企业或许还能忍得住Sora独领风骚,毕竟技不如人的时候,不如偷偷修炼。尽管有不完全统计显示,有近20家上市公司在各自的互动平台上披露了视频生成模型领域相关的业务情况,但都没有大张旗鼓地宣传。
-
0文生视频模型Sora,能够在接受人类输入的文本提示词后,生成一段长达60秒的视频,实现了内容合成从文本到图像、再到视频的领域跨越。 究其原理,是对合成内容中的最小单元进行有意义的关联组合。在保持连贯的上下文语境中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致的连续时空内,对一系列时空子块进行有意义组合,从而拼接成一
-
0为什么苹果转身AI那么蹒跚迟缓,为什么推出Sora的不是巨头而是新创企业? 因为巨头的职业经理人,类似苹果CEO库克,天然就没有巨大创新的动力。守成,守住稳定的现金流,维持住苹果的高端定位,就是库克的巨大成功了。对于创始人而言,一旦创新失败,大不了重头再来;但对于职业经理人来说,任期内营收利润下滑就要首当其责,承担不了创新的巨大风险。 这还只是主观意愿。客观条件上,职业经理人也没有创始人那么大的魄力与实力,可以
-
0很多团队或者企业都在跃跃欲试,试图与Sora一较高低。 最近,北大研究团队发起了一项Sora复现计划——Open Sora,计划采用去噪扩散型Transformer等技术原理,实现可变长宽比、可变时长的视频生成。据了解,该项目在8个A100-80G显卡上进行训练,但算力资源依然不够,生成一段分辨率128×128的8帧视频需要一周时间。 正如语言大模型从最初的几百、几千token进化到32K token甚至更长,文生视频模型也在向更高分辨率、更高帧率、更高时长,更真实、精细地模
-
0文本模型的差距上,如果我们和OpenAI只差100米,那么图形大模型和OpenAI的Dalle、midjourney等的差距就是1000米,而与Sora的差距更可能是10000米。 文本大模型的成功,是通过使用token来实现的,这些token统一了文本的不同模式——代码、数学和各种自然语言。视觉生成模型也同样继承了大语言模型的优点,只是将token的概念换成patch(视觉补丁)。 视频和图像并没有本质区别,因为图像就是单帧的视频,视频就是多帧的图像。视频生成也是生成一系列具有动
-
5苹果头显火了一个多月,哑火了。元宇宙火了一年多,哑火了。 ChatGPT火了一年多,不仅没有哑火,反而越烧越旺,持续释放着想象力。Sora,就是那朵位于最上层、跳动最明亮的火苗。
-
8在Sora推出后不久,OpenAI发布了这款新工具的技术报告。《每日经济新闻》经过对报告的梳理,总结出了Sora的6大优势。
-
12一、60s 超长视频 之前优设已经推荐过 AI 视频工具,比如 Runway、Pika、MoonVally、Domo AI、AnimateDiff、Stable Video 等,它们文生视频长度都在 3-7 秒之间(Aminatediff 和 Deforum 因形式不同,不列入此处的比较),而 Sora 直接将时长最高提升到 60s,是之前的 10 倍,这样的长度是放在之前大家可能觉得要好几年才能实现,但是 Sora 让其一夜之间成为现实。
-
0马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁等各路大佬都在讨论,周鸿祎更是喊出,Sora的诞生意味着AGI(通用人工智能)的实现或从十年缩短至一两年。 不少“普通人”也提前嗅到商机,围绕Sora搞钱的生意先火了。 有媒体报道,一张网传截图显示,某机构已售出2万多份Sora培训课程,轻松到手200万。 如今,距离2月16日OpenAI发布文生视频大模型Sora已经过去快一周,但讨论依旧热烈,这实在是因为它过于优秀。 功能上,它能生成长达60秒的视频内容,远
-
0Perry导演表示,因为Sora给自己带来的冲击太过强烈,8亿美元扩建计划已被无限期推迟。 现在,拍电影时再也不需要亲自前往拍摄地点了。 不论是想要科罗拉多的雪地场景、月球上的场景,还是山中客厅中拍摄两个人的场景,都再也不要搭建真实布景,只要在办公室的电脑上,就能完成一切! 而这也就意味着,巨大的变化将波及行业的每一个角落,影响到演员、灯光、运输、音效和剪辑等所有从业者的饭碗。 现在,Perry导演已经在两部电影中的现场
-
2人工智能如何将静态图像转换为动态、逼真的视频?OpenAI 的 Sora 通过创新性地使用时空碎片技术(spacetime patches)给出了一个答案。 在快速发展的生成模型领域,OpenAI 的 Sora [1] 是一个重要的里程碑,有望重塑我们对视频生成的理解和认识。本文将解读 Sora 背后的技术 [2] 以期激发新一代模型在图像、视频和 3D 内容创建方面的潜力。 OpenAI 使用以下提示词生成生成了一段视频:A cat waking up its sleeping owner demanding breakfast. The owner tries to ignore the cat, but the c
-
2北京邮电大学人机交互与认知工程实验室主任刘伟表示,Sora在短期内可能会对短视频制作、影视行业以及视觉交互界面应用产生较为显著的影响;从长期来看,这项技术会为自动驾驶、数字仿真、场景模拟等领域带来改变。 中国企业资本联盟副理事长柏文喜表示,Sora作为一种强大的视频生成工具,可以极大地降低视频制作的门槛和成本,使得更多人能够轻松创建高质量的视频内容。这将对影视、广告、游戏、新闻、教育、VR\AR等诸多行业产生深远的
-
0ChatGPT还没“玩明白”,Sora已经来了。AI创作的绘画、小说正在网络大规模蔓延,文字直接生成的视频令人惊呼真假难辨。 当真实的世界变得越来越“科幻”,科幻创作者们又该走向何方? 当AI变得越来越像人,人又该如何适应这个亦真亦幻的世界?
-
1从业内反应来看,Sora最令人震撼的技术突破莫过于视频时长的巨大提升。Sora能生成长达1分钟的视频,远超市面上其他AI视频模型。通过简单的文本指令,Sora就可以直接输出长达60秒的视频,不仅背景细致入微,而且包含了复杂的多角度镜头和富有情感的多个角色。
-
10Sora有能力制作出栩栩如生的手术过程视频,为医学生和医疗专业人员提供了一个既安全又可控的学习复杂手术技巧的环境。这种将互动性与真实性融为一体的教学方式,预示着医疗教育将迈入一个新的纪元。Sora的视频不仅具有动态的相机运动和三维空间的连贯性,还能创造出更加生动和互动的学习材料,助力学生深入理解复杂的医学概念和手术技巧。
-
3
-
0Sora模型的推出,无疑将对内容创作、媒体制作、娱乐产业等多个领域产生深远影响。对于普通人来说,应对这一变革的关键在于持续学习进步,不断提升自身的技能和创造力。 一是提升创意能力:Sora模型虽然能够根据文本生成视频,但它无法替代人类的创意和情感。普通人可以通过学习创意写作、剧本创作、故事叙述等技能,来提升自己的创意表达能力。这些技能将帮助个人在内容创作中保持独特性和吸引力,即使在AI辅助工具普及的情况下 也能脱
-
0Sora使用了Transformer架构,建立在DALL·E 3和GPT模型之上,可以生成长达1分钟的有运动、多机位视频。相比业界水平,Sora 将视频生成的时长一次性提升了15倍,直接迈过了市面上所有短视频的时长要求。
-
0Sora横空出世,无异于当初ChatGPT问世引发的轰动。其以高效生成多视角、高清晰、逼真且时长达60秒的视频,几乎碾压当今世界所有的文生视频模型。它给相关行业带来机遇与挑战,也给相应从业人员带来失业的潜在风险,我们如何在新潮流中顺势而为? 当我们还沉浸在春节的欢乐时,处在地球另一边的OpenAI日前发布了首个文生视频模型Sora,这则让全网刷屏的消息再次震惊世界,无异于当初ChatGPT问世引发的轰动。 Sora横空出世之所以吸引全球
-
1OpenAI在官网表示,目前Sora模型也有弱点: 它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。 同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。
-
0第一、人物和背景的连贯性,即使人物运动出了相机范围再回来时还保持同样特征 目前大多数AI生成视频都做不到这一点,大多数都在下一个动作之前换成另一个,这个其实可以归功于sora将视觉数据转换成 patch,同时也被证明是有效表示的依据。 第二、 自然语言的理解程度很高 与传统的视频制作相比,Sora的出现为视频制作带来了更高的效率和灵活性。利用Sora模型,用户只需通过简单的文本指令,就能够生成高质量的视频内容。这不仅降低了视频制
-
1按照Open AI的说法,Sora“继承”了Open AI对文本的理解能力,能够根据提示词生成出高质量的图片和视频,并且能够对视频进行向前或者向后的拓展。比如,可以基于同一个视频开头继续拓展,延伸出不一样的结尾。或者是从不同的开头引入,最终汇聚到同一个结尾。 另外,Sora不仅可以根据文本生成视频,也可以直接输入图片或者视频,对图片和视频进行编辑调整。 比如可以将这辆行驶在普通道路上的汽车变得更“赛博朋克”一些。 另外,Sora也表现
-
2从2022年下半年开始,Midjourney、Stable Diffusion之类的应用已经可以根据文本提示词生成对应的图片了。在2023年9月,GPT 4.0和DALLE 3结合,也让我们能够用聊天化的方式生成、修改图片。 AI生成视频也不是什么新鲜事了。在这次的Sora发布之前,也已经有一些视频生成AI,比如Pika、Stable video、RunwayML等等。但与Sora相比,其他模型生成视频的时长都比较短,而且在摄像机的运动、镜头切换等方面也要弱很多。
-
0Sora的出现,极大地降低了视频制作的门槛,普通人也能通过简单的文字描述,快速生成高质量的视频内容。与人工智能相关的专业在未来将会迎来更大的前景,比如:人工智能、计算机、自动化计算机类专业。 因此未来的就业方向一定是要结合人工智能技术,以及创新性的专业将会有更大的发展空间。传统的设计行业和影视行业将会受到巨大冲击,未来的学科都将在结合人工智能AI的基础上进行学习。
-
0可以肯定的是,Sora的出现可能会威胁一些动画素材的制作者。 比如,今年1月,《好莱坞报道》进行了一项针对300名娱乐行业领导者的调查,有四分之三的受访者表示AI会减少未来的工作岗位,未来3年内大约会有20多万个职位受到影响。而Sora优异的表现会加重这一影响。 但换一个角度想,每一次新兴技术的出现在带来威胁的同时也会带来新的机会。 包括Sora在内的视频生成AI只是一个工具,视频的创意来源还是需要人类提供。Sora或许能够帮助人类更高
-
3希望懂的给讲讲,做个视频回复我
-
4Sora团队,除了由伯克利应届生带队,有多名LeCun学生参与。其中还有包括北大校友在内的3位华人研究员,以及20岁就加入OpenAI的天才工程师。
-
0与其他文生视频大模型仅能生成3至4秒的视频相比,Sora模型生成的60秒视频实现了明显提升。
-
2OpenAI官网称,Sora模型可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系。 在OpenAI发布的技术报告中有一段Sora模型生成的错误视频,展示了桌上的水杯会先从底部流出果汁,然后沿着错误的方向和角度倒在桌上。 根据OpenAI官网的描述,Sora模型在模拟复杂场景时仍会出错,并不总能准确呈现物体状态的改变。比如,它不能准确地模拟许多日常的基本物理过程,像是玻璃破碎过程、吃食物后表面没有咬痕、凭空生成并不需要的重复或变
-
1从发布的视频来看,Sora 60秒的视频中,视频主体与背景保持了高度流畅性与稳定性;在一个视频里实现多角度镜头,分镜切换符合逻辑且十分流畅;此外,Sora对于光影反射、运动方式、镜头移动等细节处理非常到位。值得一提的是,在OpenAI公布的部分样片中,Sora还展现了对“物理规律”超强的学习能力,无论是飘逸的毛发还是水体波纹,Sora都能“合乎常理”地呈现出来。
-
1虽然Sora展现出了强大的能力,但现阶段它还不够完美。 并不是每一次Sora都能生成出令人满意的视频。 《麻省理工科技评论(MIT Technology Review)》主笔Will Douglas Heaven写道:“Sora发布出来的视频已经是从大量的成果中挑选出的佼佼者了。”但即便是这些“经过挑选的佼佼者”也不完美。 在Sora的技术报告中也承认,现阶段Sora生成的视频存在一些缺陷。 Sora还有很多需要完善的地方。 但毫无疑问,目前Sora展现出来的能力已经说明了,这是一条非常有前
-
7这几天,Sora生成的视频刷爆了许多人的朋友圈,人们除了感叹Sora的厉害,同样也展现出了担忧,这些担忧集中在两个方面。 第一个担忧是:Sora生成视频的能力实在是太厉害了,如果这样的技术被用来造假,岂不是太可怕了?未来我们怎么知道看到的视频是真的还是假的? 而另一个担忧主要来自视频行业的从业者,如果Sora这样的模型普及开来,视频行业从业者是不是都要丢了饭碗?
-
0
-
0Sora主要有六大特点: 1、Sora模型在视频生成时长、语义理解程度、以及视频效果和稳定性等方面超出此前竞品,能生成长达60秒的视频,与当下短视频平均长度接近,这一时长远远领先此前Runway-gen2的18秒和Pika的3秒。 2、Sora制作的视频在逼真度和画面精致程度将整个AI视频行业提升到nextlevel,Sora创作的视频质量,无论是高清度还是还原度,都是可圈可点的;Sora模型采用了最新的深度学习技术,能够生成更真实、更细腻的视频。 秉承着“无图无真相”的
-
0总体来看,在AI大模型不断升级的背景下,产业链上诸如AI芯片、HBM芯片、AI服务器、光模块光芯片及交换机等领域有望持续受益。 虽Sora暂未公开使用权限,但其后续潜在的商业化有望对短视频、电影、游戏等下游领域产生深远影响;
-
0Sora最直接的影响的肯定是对视频行业的冲击。作为一种视频生成工具,Sora仅需文字就可以生成60秒时长的精细视频,大大降低了视频制作的门槛和成本,特别是热点类等具备强烈时效性的内容。
-
0亲爱的各位吧友:欢迎来到sora动态