ayx真人并探讨三维数字东说念主期间的发展趋势-ayx手机版登录(综合)官方网站入口/网页版/安卓/电脑版

发布日期：2024-12-08 07:22 点击次数：180

12 月 5-6 日，2024 中国生成式 AI 大会（上海站）「GenAICon 2024」将在上海中星铂尔曼大酒店无际举办。中国生成式 AI 大会已告捷举办两届，飞速成长为国内生成式 AI 鸿沟最具影响力的产业峰会之一。

这次亦然中国生成式 AI 大会初次登陆上海举办，由智一科技旗下智能产业第一媒体智东西、AI 与硬科技学问共享社区智猩猩共同发起。上海市东说念主工智能行业协会为本次大会的指导单元。

大会上海站以"智能跃进创造无尽"为主题，将建造"主会场峰会 + 分会场研讨会 + 展览区"。其中，主会场将进行大模子峰会、AI Infra 峰会，分会场将组织端侧生成式 AI、AI 视频生成和具身智能三场期间研讨会。主会场与分会场外则设有展览区。

50+ 位嘉宾将在大会上带来致辞、演讲、证据和对话商量，以前瞻性视角为各人解构和把脉生成式 AI 的期间居品转变、交易落地解法、畴昔趋势走向与前沿筹商焦点。

动作大会上海站的三场期间研讨会之一，AI 视频生成期间研讨会将在第二日上昼的分会场进行，由主题证据和圆桌 Panel 两个步调构成。

Sora 自年头问世以来，AI 视频生成鸿沟风靡云涌，到年末来看，国表里皆已是华夏逐鹿的时势。尽管如斯，依旧有不少要紧问题有待处罚。现在，从学术界到工业界，皆在辛苦于于处罚 AI 视频生成尚未处罚的问题，以期为视频生成大模子及应用居品带来更优质的体验。

一、上海站三场研讨会之一，完竣议程公布

现在，AI 视频生成期间研讨会邀请到中存算董事长陈巍，上海交通大学东说念主工智能筹商院助理西宾晏轶超，新壹科技 AI 算法主任架构师李璋，井英科技鸠合创举东说念主、CTO 王健，旷视筹商院高级筹商员李华东 5 位后生学者和期间众人带来证据，将围绕视频大模子架构比拟、三维数字东说念主视频生成、面向数字东说念主生成的视频垂直大模子、AI 短剧期间粉碎、可控东说念主物视频生成伸开教会。

视频大模子（VLM）正与短视频产业谀媚并迎来新爆发点。中存算董事长陈巍将围绕《视频大模子架构对等到长序列模子加快》这一主题，从视频生成大模子与天下模子的视角开赴，对比主流架构（如 NaViT、RADM），探讨内存墙和通讯墙对视频大模子 GPGPU/TPU 集群覆按和部署的挑战，并共享算力芯片级覆按部署的处罚决策和系统陶冶。

三维高斯、大模子等期间在当年一年快速发展，并与数字东说念主期间进行了庸碌谀媚。上海交通大学东说念主工智能筹商院助理西宾晏轶超将带来主题为《先验带领的三维数字东说念主视频生成》的证据，从数字东说念主重建、生成与裁剪等标的先容三维数字东说念主视频生成的最新阐扬，并探讨三维数字东说念主期间的发展趋势。

在生成式 AI 期间的鞭策下，智能数字东说念主已成为内容创作的要紧标的。新壹科技 AI 算法主任架构师李璋将围绕《视频垂直大模子在智能数字东说念主生成中的应用》，先容从通用大模子到垂直大模子的期间演进，教会新壹视频大模子在数字东说念主视频生成中的中枢期间粉碎，并潜入分析如何收尾当然语言运转的动作与色调生成，还将展示其在关系鸿沟的典型应用案例。

近期，井英科技通过视频生成模子收尾了 100 分钟以上短视频的制作，并告捷收尾了用户付费不雅看的交易模式。公司鸠合创举东说念主、CTO 王健将在这次论坛上将共享 AI 短剧从领先的不成行到现如今可行的要道期间粉碎，主题为《AI 短剧拐点背后的期间粉碎》。

跟着短视频、影视和游戏动画的快速发展，传统的视频制作时势因耗时耗力而渐渐显露局限性。视频生成大模子算法为高效生成高质料视频提供了新选拔，但现存算法的生成内容可控性不及。旷视筹商院高级筹商员李华东将以《可控东说念主物视频生成》为主题，先容支合手羼杂模态抵制的东说念主像视频生成算法 MegActor 系列责任。

主题证据步调收尾后的圆桌 Panel，将由中存算董事长陈巍，上海交通大学东说念主工智能筹商院助理西宾晏轶超，井英科技鸠合创举东说念主、CTO 王健，以及旷视筹商院高级筹商员李华东一齐带来。

二、五位学者众人多维度教会 AI 视频生成

1、中存算董事长陈巍

陈巍博士，大模子 +AI 芯片众人，高级职称，中存算等企业董事长。国际筹备机学会（ACM）、中国筹备机学会（CCF）专科会员，多个国际东说念主工智能期刊审稿东说念主。主要筹商标的为大模子架构、稀薄量化压缩与部署加快，存算一体与 3D Chiplet 处理器，关系期间后果已被庸碌应用于著名 IDC 和互联网企业。

曾任鸿沟著名东说念主工智能（当然语言处理）企业首席科学家，中国科学院副主任（2012），多个国度科技紧要专项课题认真东说念主。中国与好意思国发明专利软件著述权约 70+ 项（约 50+ 项发明专利已授权）。著有《Sora 大模子期间精要—旨趣、要道期间、模子架构与畴昔趋势》《GPT-4 大模子硬核解读》《ChatGPT 大模子期间精要—发展历程、旨趣、期间架构详解和产业畴昔》《智能网联汽车：激光与视觉 SLAM 详解》等。

证据主题：《视频大模子架构对等到长序列模子加快》

内容摘抄：跟着大模子期间的快速发展，视频大模子（VLM）正与短视频产业谀媚并迎来新的爆发机遇，渐渐成为互联网应用的热门。

本次共享从视频大模子与天下模子的角度，对比主流视频生成大模子架构，探讨视频生成的要道期间（包括 NaViT、RADM 等），分析视频生成类大模子的主要挑战与发展趋势；探讨内存墙（Memory Wall）和通讯墙对视频大模子 GPGPU/TPU 集群覆按和部署的挑战，并针对这类视频长序列模子的算力芯片级覆按部署，谀媚具体神色给出软硬谀媚的处罚决策与系统陶冶。

2、上海交通大学东说念主工智能筹商院助理西宾晏轶超

晏轶超，上海交通大学东说念主工智能筹商院助理西宾，博士生导师。获上海交通大学电子工程系学士、博士学位，法国里昂中央理工学院硕士学位，曾担任阿联酋发祥东说念主工智能筹商院筹商科学家。主要筹商标的为 AIGC 及三维数字东说念主期间，发表包括 TPAMI、CVPR、NeurIPS 在内的论文 40 余篇。先后主合手国度当然科学基金后生神色、CCF- 阿里巴巴后生科学家基金等神色 8 项。曾入选上海市国外高级次东说念主才计划，获 2020 年度中国图象图形学学会优秀博士论文奖。

证据主题：《先验带领的三维数字东说念主视频生成》

内容摘抄："东说念主"一直是视频生成的中枢对象，面对大范围视频的生成需求，哄骗生成式东说念主工智能期间产生高拟真，范围化的虚构数字东说念主正渐渐成为筹商热门。三维高斯、大模子等期间在当年一年快速发展，并与数字东说念主期间进行了庸碌谀媚，本次证据将从数字东说念主重建、生成、裁剪等标的先容数字东说念主视频生成鸿沟的最近阐扬，对三维数字东说念主期间的发展趋势进行探讨。

3、新壹科技 AI 算法主任架构师李璋

李璋，领有中国科学院软件工程硕士学位，是生成式东说念主工智能鸿沟的资深期间众人。在深度学习、算法优化以及大模子研发方面具有深厚的表面基础和丰富的实战陶冶。在新壹（北京）科技有限公司担任 AI 算法主任架构师，主导联想并研发了多个具有行业象征性的 AI 神色。联想与研发了"新壹视频大模子"——国内首个专注于视频生成的生成式 AI 大模子。该模子在视频内容生成、理解与优化方面获取了粉碎性后果，为鞭策国内生成式 AI 期间在视频鸿沟的本色应用提供了强有劲的守旧。

证据主题：《视频垂直大模子在智能数字东说念主生成中的应用》

内容摘抄：在生成式 AI 期间昌盛发展的布景下，智能数字东说念主已成为内容创作、虚构助手和东说念主机交互等鸿沟的要紧应用之一。可是，传统生成模子在高精度、多模态的智能数字东说念主生成中仍濒临诸多挑战。为此，垂直鸿沟的大模子提供了一条全新旅途。

本次演讲，开赴点会先容从通用大模子到垂直大模子的演进，之后将留神教会新壹视频大模子的举座架构联想过头在数字东说念主视频生成与优化中的中枢期间粉碎；此外，还将对智能数字东说念主生成的期间难点，包括数字东说念主生成中收尾当然语言运转变作与色调生成的要道期间等进行潜入分析，并共享视频垂直大模子运转的智能数字东说念主在关系鸿沟的典型应用案例。

4、井英科技鸠合创举东说念主、CTO 王健

王健，井英科技鸠合创举东说念主，CTO，国内视频生成模子的首批创业者，从 2020 年起专注于视频生成模子及关系应用。在参与创立井英科技之前，担任触宝科技鸠合创举东说念主、CTO，是触宝输入法主创，当然语言模子众人。

证据主题：《AI 短剧拐点背后的期间粉碎》

内容摘抄：自本年 2 月 OpenAI 发布 Sora 起，视频生成大模子成为了热门标的。但其具体落地的业务场景却一直不解确。近期，井英科技通过视频生成模子收尾了 100 分钟以上短视频的制作，并告捷收尾了用户付费不雅看的交易模式。本次共享将先容 AI 短剧从领先的不成行到现如今可行的要道期间粉碎，并探讨了除视频生成大模子以外的其他要道期间阐扬。

5、旷视筹商院高级筹商员李华东

李华东，旷视筹商院高级筹商员，硕士毕业于清华大学筹备机系。筹商标的为筹备机视觉，主要包括视频生成与理解，深度估量等，已在 ECCV，AAAI 等东说念主工智能顶级会议上发表多篇论文。

证据主题：《可控东说念主物视频生成》

内容摘抄：短视频、影视和游戏动画创作正在飞速发展。可是，传统的视频制作历程耗时耗力，时时需要无数的东说念主工后期裁剪。视频生成大模子算法提供了一种低资本、高效的高质料视频内容生成处罚决策。但视频生成算法生成的内容可控性不及，限制了其本色应用的有用性。因此，如何收尾视频生成内容的可控性已经一大约道挑战。

在本次证据中，我将先容 MegActor 系列责任，这是一种支合手羼杂模态抵制的东说念主像视频生成算法。该算法支合手变装自界说（包括着实东说念主物、二次元东说念主物和游戏东说念主物等），并草率通过视频、音频和文本输入收尾单独和羼杂抵制。其功能涵盖了抵制变装言语、唱歌和生成色交流画等。MegActor 系列是社区内的首个开源可控东说念主物视频生成大模子，将合手续优化以鞭策期间的延续发展。

三、中国生成式 AI 大会上海站日程

ayx真人

ayx真人并探讨三维数字东说念主期间的发展趋势-ayx手机版登录(综合)官方网站入口/网页版/安卓/电脑版

热点资讯

相关资讯