kaiyun全站人口开云全站广告设计制作公司Openai Sora 研报

kaiyunquanzhan NEWS

开云新闻资讯

热线电话：

400-123-4567

联系人：张生
传真：+86-123-4657
手机：13800000000
邮箱：admin@nhzbj.com
地址：广东省广州市天河区开云·全站(中国)官方网站IOS/安卓通用版/手机APP工业园88号

立即咨询

当前位置：开云·全站(中国)官方网站IOS/安卓通用版/手机APP > 开云新闻资讯 > 开云全站

kaiyun全站人口开云全站广告设计制作公司Openai Sora 研报

发布时间：2024-02-18 丨浏览次数：

　　【天风电子潘陳团队】OpenAI新模型可生成60秒视频，AI产业的“lphone”时刻来临

　　Sora具有长视频生成能力，可以生成长达一分钟的视频，大幅超出此前行业水平。以奔跑的猛犸象视频为例，视频中几头巨大的猛犸象踏着雪地走近，周围扬起的雪尘运动轨迹十分流畅，远处的雪山和树木清晰生动。视频的整体播放效果连贯且不失真，色彩分辨率高，给人的视觉观感可比拟专业摄影师用高像素摄像机在现场录制的作品。

　　2.Sora的横空出世意味着AI大模型对包含文字、因果关系、图像在内的真实世界有更深入的理解。

　　1）文字理解：该模型可以在长视频的生成过程中，准确地根据描述生成能表达生动情感的引人注目的角色。通过对使用者复杂描述的文字进行准确刻画，生成视频标题，保证最终生成视频的准确性和一致性。

　　开云全站

　　2）因果关系：Sora可以确保被摄体即使暂时离开视线也能保持不变。该模型还能提取现有视频，并对其进行扩展或填充缺失的帧。可以一次性生成整个视频，也可以扩展生成的视频以使其更长。

　　3）图像：较之于传统GPT 模型，Sora使用了来源更广泛的视觉训练扩散变换器，涵盖不同的时长、分辨率和宽高比。该模型还能根据现有的静态图像生成视频，并能准确、细致地对图像内容进行动画处理。

　　在下游AIGC核心生产力提升的驱动下，我们坚定看好上游AI算力硬件机会，持续推荐A服务器龙头工业富联。我们坚定看好以大华股份和海康威视为代表的AI to B的公司，其具备较高壁垒kaiyun全站人口，拥有足够的资金与研发能力，可以充分的吸收海外先进技术实现商业落地，下游应用场景清晰。

　　云端 AI 相关企业：寒武纪海光信息（天风计算机覆盖）、龙芯中科紫光国微复旦微电安路科技等。

　　边/终端 AI 相关企业：瑞芯微晶晨股份恒玄科技全志科技乐鑫科技富瀚微中科蓝讯炬芯科技兆易创新中颖电子芯海科技等。

　　存储相关企业：江波龙（天风计算机联合覆盖）、澜起科技聚辰股份北京君正普冉股份东芯股份佰维存储等。

　　春节期间，全球 AI 热点涌现，利好频出。OpenAI 带头执行 AI 芯片投资计划并发布文生视频新品 Sorakaiyun全站人口，英伟达正式发布此前已经有所展示的 AI 本地部署 RAG 工具 Chat with RTX，谷歌更新 Gemini 至 1.5 版本。 OpenAI 宏伟投资计划，剑指改革全球半导体。据华尔街日报消息，OpenAI正在打造全球芯片供应链，来彻底重塑全球半导体行业，Altman 一直在关注 AI 芯片的供需问题，2018 年，Altman 个人投资了一家 AI 芯片初创公司Rain Neuromorphics，2019 年，OpenAI 花费 5100 万美元购买 Rain 的芯片；去年 11 月，Altman 为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为，从远期来看，算力需求或持续超出我们的想象，如果仅依靠台积电的先进制程产能进行供应，或难以满足未来 AI 用户持续增长带来的供应缺口，而另起炉灶，构建一套由 OpenAI 自己领导的算力产业链，当下来看是 OpenAI 切入基础设施领域的可行方案。文生视频大模型 Sora 横空出世，其能够理解并呈现物理定律，影视动画行业的颠覆性时刻到来。Sora 虽然仍旧使用 Transformer 架构和基于扩散模型，但最大变化在于其能够在生成的视频中展现出火焰反光、物体运动惯性等自然界规律；同时相较于其他扩散模型，视频可以保持相当高的稳定性和一致性，因此，Sora 呈现的 AI 视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是，Sora 依旧符合 AI 缩尺律（Scaling Law）， OpenAI 在技术文档中说明，随着训练计算量的增加，样本质量明显提高，进一步佐证了多模态时代，算力需求将成为最核心的瓶颈之一。 Gemini 1.5 将实现大模型最大的上下文窗口。相较于 Gemini 1.0，1.5 最主要的改进是处理大文件的能力，Gemini 1.5 Pro 每次可以处理 100 万个 token，结合原生多模态能力，其可以一次性处理大量信息，例如 1 小时的视频、11 小时的音频、超过 3 万行（或 70 万个单词）的代码。Gemini 基于 MoE（Mixture-of-Experts）专家网络，根据给定的输入，MoE 模型将选择性地激活其神经网络中最相关的专家路径，从而极大提高模型效率。 Chat with RTX——AI 助理的一小步，边缘推理的一大步。该工具可以使用 Mistral、Llama 2 等开源模型，帮助用户阅读文档/视频并通过检索增强生成（RAG）总结文件内容，全程由本地 RTX 显卡进行推理。我们认为，边缘推理是 AI 触及广大潜在用户的“毛细血管”，世界经济论坛在最近的一份报告中预测，能够离线运行生成式 AI模型的设备将“大幅增长”，其中包括个人电脑、智能手机、物联网设备等，原因在于，本地模型不仅更加私密，而且与云托管模型相比，本地模型的延迟更低，成本效益更高。总结来看，近期的 AI 行业新闻，在模型层面各家激战正酣，同时在 Scaling Law 不断应验的事实下，我们此前对算力需求充分乐观的观点将持续被验证，AI 算力有望继 2023 年后，继续成为新一年的热门投资方向。

　　2 月 22 日（下周四）早 6：00英伟达将公布上季度财报，建议密切关注。算力—— 光通信：中际旭创新易盛天孚通信太辰光腾景科技光库科技光迅科技德科立联特科技华工科技源杰科技剑桥科技铭普光磁。算力调优/调度/租赁：恒为科技思特奇中科金财东方材料博睿数据、中贝通信、中科曙光、中国移动、中国联通、中国电信。算力设备：中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。液冷：英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台：美格智能、广和通、移远通信。卫星通信：中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。数据要素——运营商：中国电信、中国移动、中国联通。数据可视化：浩瀚深度、恒为科技、中新赛克。BOSS 系统：亚信科技、天源迪科、东方国信。风险提示：AI 发展不及预期，算力需求不及预期广告设计制作公司，市场竞争风险。

　　【民生计算机】Sora最佳受益者方向或是AI视频内容变现渠道：建议关注稀缺AI短剧出海标的【超讯通信】

　　2024年2月16日，OpenAI发布最新文生视频大模型Sora，当前最高支持生成1分钟的视频。据OpenAI官网开云全站，Sora的出发点是公司教育Al理解和模拟物理世界运动并解决现实世界交互问题。

　　Sora 1分钟左右视频自动生成的长度天然契合短剧时长，结合AI换脸技术有望成为短剧出海必选项。此前超讯通信投资七火山Seven Volcanoes，凭借海外上线发行及取得东南亚TOP3榜单的MiniTV平台开展视频内容新载体创造探索和短视频巨头内容AI化战略服务商等战略，而此次结合Sora发布以及AI换脸、Al图像增强等新型技术有望形成强共振。

　　每成为海外快手AI视频内容战略合作伙伴，超讯通信已具备短剧出海的核心先决条件。超讯通信官方微信公众号发布消息，公司投资的Seven Volcanoes（七火山）作为SnackVideo（海外快手）的AI视频内容战略合作伙伴，通过前沿Al技术，实现海量内容的本地化，将为印尼用户带来精彩的短剧内容，助力SnackVideo的平台内容生态建设。

　　模型强大的视频生成能力推高行业天花板，产业赋能的深度和广度有望超预期拓展。

　　投资建议：Sora 模型推动 AI 多模态领域飞跃式发展，AI 创作等相关领域将迎来深度变革，AI 赋能范围进一步扩大，多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。推荐标的：金山办公、科大讯飞、万兴科技、虹软科技、神州数码、中科曙光，受益标的：苏州科达、当虹科技。

　　OpenAI 发布首个文生视频模型 Sora，效果震撼。Sora 模型可以通过文本描述生成 60 秒长视频，还可以对视频色彩风格等要素精确理解，创造出人物表情丰富、情感生动的视频内容。目前 Sora 尚未对公众全面开放，仅邀请部分测试者进行体验，但是 OpenAI CEO 在社交平台上展示了由网友提供文本描述生成的视频案例，展现了 Sora 在视频生成方面的强大能力。

　　Sora 三大亮点突出，实现 AIGC 领域的里程碑式进展。首先是 60 秒长视频，Sora 可以保持视频主体与背景的高度流畅性与稳定性。其次是单视频多角度镜头，Sora 在一个视频内实现多角度镜头，分镜切换符合逻辑且十分流畅。再是理解真实世界的能力，Sora 对于光影反射、运动方式、镜头移动等细节处理得十分优秀，极大地提升了真实感。

　　Sora 的技术基础保障了强大功能的持续迭代。Sora 是一种 Diffusion模型，同时具备良好的扩展性。Sora 使用 DALL·E 3 的 Recaption 技术，使视频可以更符合文本指令，此外还具备静图生视频、原视频拓展补帧等能力。OpenAI 表示 Sora 是构建世界模型的基础，未来将向实现 AGI 继续迈进，我们认为该模型的当前表现展现出了这种潜力

　　【天风海外】重磅！OpenAI发布Sora 文生视频模型，能力大幅提升，内容创作工作流有望被颠覆，下一个亿级用户的互联网平台雏形已然出现！

　　事件：北京时间2月16日凌晨，OpenAI发布Sora文生视频大模型，Sora可以生成长达一分钟的视频，同时保持视觉质量和遵循用户的提示。Sora能够生成包含多个字符、特定类型运动以及准确的主体和背景细节的复杂场景。

　　1）OpenAI的Sora文生视频模型效果：远超所有此前文生视频方案，几乎实现了两个代际的提升，接近消费者/工业生产需要。60S的内容长度远超此前文生视频的10S长度，达到了短视频的爆款长度；极度稳定的长镜头乃至多镜头；丰富稳定的物理交互。

　　2）我们判断OpenAI的Sora效果远超此前的Diffusion模型的根本原因在于模拟世界物理的能力：OpenAli

　　为Sora作为Diffusion模型能力提升的很大来自于更多的视频作为训练集以及准确深入的语言理解能力与世界构造能力。OpenAI的白皮书尚未发布，但从研究人员来看，真正研发Sora的人员仅有三人，其它均为支持性工作，我们认为OpenAI Sora能力的大幅提升可能主要来自于三方面：1、Diffusion-Transformer架构，2、可能通过UE5、Unity、Nerf等大量生成合成数据作为训练集3、大语言模型的能力提升和对世界能力的提升。

　　3）目前商业化进度：OpenAI尚未公开开放Sora权限，表示Sora目前仅为研究项目的开始，CEO Altman在Twitter邀请留言生成视频展示能力，并表示OpenAI已经在和安全测试机构、电影和视频创作者合作，以改进产品。

　　4）未来市场展望：两干亿的短视频创作市场有望率先被颠覆。我们认为生成式AI在视频创作和世界模型的大踏步进步将实现对视频/3D/游戏等下游应用场景的渗透。在短视频、创作工具、游戏等下游领域，Sora等AI原生产品有望融入工作流，增强用户体验、降低用户使用壁垒、进一步降低创作成本，并极大拓展创作者能力边界。Sora已经踏过创造出爆款内容的时长和品质，意味着一到两年的整个行业的边界即将改变。

　　口投资建议：我们认为在内容创作工具，OpenAI已经和其它产业出现代际差，并带动行业大幅进展，未来一年商业化预计大幅推进。建议关注计算架构（NVDA VRT）的需求在推理端的大幅需求提升，API/大模型推理侧的马太效应进一步增强（MSFT OpenAI）、IP类公司将小说转化为短视频能力的飞跃（阅文集团中文在线）电商等垂直行业用户的视频广告等商拍制作流程的大幅加速（ADBE 美图虹软焦点科技）、以及下一代互联网创作与分享的平台雏形出现！

　　2024/2/16，OpenAl突然发布了文生视频模型Sora，可以在用户的要求下，生成可最高长达一分钟的视频，例如摩登女子在东京街头行走、黑人男子读书等等（详细案例可参见官网视频），在长达一分钟的视频中可以同时存在远景与近景特写，且细节翔实逼真。

　　实今日起，Sora 会对部分视觉艺术家、设计师和电影制作人开放，以获得关于如何改进模型的反馈意见，使其对创意专业人士最有帮助。OpenAI表示将尽早分享研究进展，以便开始与 OpenAI 以外的人员合作并获得他们的反馈，同时让公众了解人工智能的发展前景。

　　Sora能够生成包含多个角色、特定运动类型以及主体和背景准确细节的复杂场景。该模型不仅能理解用户在提示中提出的要求，还能理解这些事物在物理世界中是如何存在的。该模型对语言有深刻理解，因此能准确解释提示，并生成能表达生动情感的引人注目的角色。Sora还能在单个生成的视频中创建多个镜头，准确地体现角色和视觉风格。

　　Sora 建立在过去对 DALL-E 和 GPT 模型的研究基础之上，因此，该模型能够在生成的视频中更忠实地遵循用户的文字说明。除了能够仅根据文字说明生成视频外，该模型还能根据现有的静态图像生成视频，并准确、细致地对图像内容进行动画处理。该模型还能对现有视频进行扩展或填充缺失的帧。OpenAI今日会公布更详细的技术文档，从中我们有望获得更多技术细节。

　　1、OpenAI发布文生视频模型Sora，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。据OpenAI官网展示的Demo，Sora生成的视频一致性强于此前的Runway/Pika。但Sora目前的弱点是无法理解因果关系/难以模拟物理定律。技术原理上，Sora基于Diffusion+Transformer模型，一次性生成整个视频的长度，并逐步消除噪声完成视频转换。在一致性的保障机制上，通过一次性为模型提供多帧预测的方式，Sora确保一些物体即使镜头远离也能保持不变。Sora建立在OpenAl过去对DaLLE和GPT模型的研究基础上。

　　4-Turbo，并且在100万token的范围内保持了相对稳定的表现。与之对比，GPT-4 Turbo的性能则明显下降，且无法处理超过128,000 token的文本。Gemini 1.5继续强化Base Model向长上下文窗口发展的趋势，前OpenAl研究员Andrej Karpathy提到AI技术栈中，上下文窗口相当于缓存的作用。

　　北京时间2月15日晚间到2月16日凌晨，Google与OpenAI同一天发布新模型，全面开启2024更卷的模型之争，大模型正式进入巨头之争格局。通用人工智能AGI真的要来了吗？算力需求何时见顶？数据够用吗？

　　数字未来刘道明：利好算力板块、利好手握数据资源的平台公司。模型能力增强后，预计相关行业落地速度大幅加快。

　　电子樊志远：Al大模型不断升级，AI芯片、HBM芯片、Al服务器、光模块/光芯片及交换机等相关产业链持续受益，看好产业链重点受益公司沪电股份、中际旭创、新易盛、天孚通信、通富微电、生益科技、兴森科技、胜宏科技。

　　互联网传媒陆意：看好AI工具化进步下，后续具备AI应用商业化落地可能的公司，包括天下秀、华策影视、中文在线、掌阅科技等。

　　计算机孟灿：看好AI产业新变化在计算机板块的机会映射，推荐关注万兴科技、美图、海康威视、大华股份、萤石网络。

　　基础化工陈屹：看好AI材料投资机会，尤其是今年业绩能兑现的公司，建议重点关注东材科技，关注圣泉集团和雅克科技。

　　医药袁维：重点看好人工智能应用在医疗设备、药物发现、临床诊治等领域的应用；重点公司：迈瑞医疗、祥生医疗、润达医疗、健麾信息等

　　【申万传媒】OpenAI发布文生视频模型Sora，AI视频向商业化大步迈进。

　　Sora性能：#1）视频时长现象级扩展：可达到60秒，且并非多个3-4s视频的拼接，连贯性强；

　　#2）更强的一致性：物体形状、场景风格保持出色，可实现多镜头切换，不再局限于单镜头视频生成；

　　#3）逼真程度再上一台阶：相比PIKA、Runway,Sora生成视频在人物手部动作、面部表情、动物眨眼等高难度内容上表现大幅提升。

　　技术：1）将视频和图像编码成潜在代码，分解成包含时间和空间信息的Patches，利于模型训练，可类比LLM中的Token；2）语言理解：使用了DALL-E 3中的重述技术，将视觉训练数据生成高精准描述性的字幕，提高语意理解能力。

　　OpenAI坦言Sora目前仍存在局限性，如难以准确地模拟复杂场景的物理属性，玻璃破碎；也可能无法理解因果关系的具体实例；混淆提示的空间细节，如左右等。

　　我们预计AI视频对视频行业（场景包括泛娱乐、广告、新闻等等）将产生巨大影响，一方面降低视频内容生产制作门槛，另一方面创意、IP的价值会更高；同时算法、算力等技术公司也有往参与分享产业链价值。此外，UGC视频的质量将进一步提升，过去UGC视频多为15s短平快的视频，有了AI视频工具助力，一分钟以上的微电影社区指日可待。

　　关注有一定安全边际的公司，包括有丰富IP储备的上海电影、阅文集团、华策影视；有丰富应用场景的美图、易点天下、焦点科技

　　国内有些人的思想确实比较邪恶，反正就是不愿意承认别人的强大。从去年年初开始的这波人工智能概念，难道引领的不是人家美帝？不管从硬件还是软件上，我们都落后人家很多，这是事实。当然我们也一直在追赶，现实就是人家也一直在进步，难道又想弯道超车

　　今后，FAKE NEWS更逼真了。我们将从后真相时代，走向无真相时代了kaiyun全站人口。

　　【天风电子潘陳团队】OpenAI新模型可生成60秒视频，AI产业的“lphone”时刻来临1.目前OpenAI发布最新模型Sora可实现文本生成视频功能。Sora具有长视频生成能力，可以生成长达一分钟的视频，大幅超出此前行业水平。以奔跑的猛犸象视频为例，视频中几头巨大的猛犸象踏着雪地走近，周围扬起...

开云·全站(中国)官方网站IOS/安卓通用版/手机APP

网站首页

关于开云全站

产品中心

开云新闻资讯

成功案例

合作加盟

人才招聘

联系我们

客户留言

热门关键词：

友情链接：