克日,,,,,,上海影戏学院影视工程系李梦甜西席团队(MAGIC Lab)两项前沿研究事情《FoleyDesigner: Immersive Stereo Foley Generation with Precise Spatio-Temporal Alignment for Film Clips》与《GardenDesigner: Encoding Aesthetic Principles into Jiangnan Garden Construction via a Chain of Agents》乐成被盘算机视觉国际顶级聚会CVPR 2026任命。。。。。。
CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition)是中国盘算机学会(CCF)推荐的A类国际顶级聚会,,,,,,在盘算机视觉与人工智能领域享有极高声誉,,,,,,恒久引领学科生长前沿。。。。。。据Google Scholar Citation 2025年统计,,,,,,CVPR的H5-index高达450,,,,,,位列全球出书物第二,,,,,,仅次于《Nature》,,,,,,工程与盘算机类出书物第一,,,,,,泛人工智能领域第一,,,,,,代表了该领域天下顶尖的研究水平。。。。。。
此次两项效果同时入选,,,,,,不但体现了团队在“AI+艺术”交织领域的持续科研立异能力,,,,,,也标记着上海影戏学院正稳步走向国际学术舞台。。。。。。
FoleyDesigner:让影视声音“陶醉有声”。。。。。。FoleyDesigner是团队在“AI+影戏声音”领域的又一突破。。。。。。继此前在影视音效(SonicVisionLM, CVPR 2024)与影视配乐(FilmComposer, CVPR 2025)上的事情后,,,,,,本项目聚焦于影戏拟音的智能化天生,,,,,,致力于推动影视工业进入陶醉式声音新时代。。。。。。该研究首次将AIGC手艺引入影戏立体声拟音创作,,,,,,通过大模子与多智能体协同,,,,,,完整模拟了专业拟音师的事情流程。。。。。。它能够明确视频内容,,,,,,自动天生与画面在空间位置、帧级时间上精准对齐的高品质立体声拟音,,,,,,并直接输出切合专业标准的5.1围绕声(杜比全景声混音),,,,,,可无缝嵌入现实影戏后期管线。。。。。。其焦点价值在于:提质,,,,,,显著提升天生拟音的影视级品质、音画一致性实时空对齐精度;;增效,,,,,,大幅优化后期流程,,,,,,降低制作本钱,,,,,,同时为声音设计提供高自由度的创作工具。。。。。。别的,,,,,,团队开源了高质量影戏立体声拟音数据集FilmStereo,,,,,,包括14,784个标注条目,,,,,,涵盖立体声音频、准确时间戳、三维空间信息及系统的种别文本形貌及 23 个细分领域,,,,,,为学术社区后续研究提供了主要数据基础。。。。。。

图1:FoleyDesigner包括三个主要模浚块——分层影片剖析、视觉指导空间音频合成与多智能体音质精修。。。。。。用户输入无声视频首先被转化为切合声音设计原则的场景-事务-材质分层剧本;;随后在各时段中基于视觉语义举行空间化立体声天生;;最终经多智能体协同优化输出5.1围绕声拟音。。。。。。
FoleyDesigner论文原文、代码和数据集详见项目主页:https://gekiii996.github.io/FoleyDesigner/ 。。。。。。本论文的学生一作为戴坤延,,,,,,数字媒体创意工程硕士研究生二年级在读;;学生二作为丁乙,,,,,,数字媒体手艺本科三年级在读;;学生三作为倪若冰,,,,,,数字媒体手艺本科三年级在读。。。。。。
GardenDesigner江南园林的“智能筑景”。。。。。。GardenDesigner是团队在“AI+艺术场景”偏向的持续探索。。。。。。继戏剧艺术舞台(StageDesigner, CVPR 2025)与影视场景置景(FilmSceneDesigner, AAAI 2026)的智能化天生后,,,,,,本项目首次将大模子与智能体链手艺应用于江南园林的设计与天生,,,,,,实现了从文本形貌到完整园林场景的智能天生。。。。。。该系统通过模拟真实园林设计师的头脑流程,,,,,,将水系、曲径、景观结构等古板美学规则编码进盘算框架,,,,,,实现了切合文化逻辑与审盛意境的自动设计。。。。。。用户只需输入简朴文本,,,,,,系统即可在一分钟内天生包括完整结构的园林方案,,,,,,并输出可用于现实制作的二维指导图。。。。。。其焦点价值在于:降低门槛,,,,,,让非专业用户也能快速举行专业级园林创作,,,,,,极大降低数字建模本钱;;赋能多领域,,,,,,天生的场景可直接用于游戏、影视、VR/AR及数字文旅等项目;;传承文化,,,,,,为文化遗产的数字化生涯与立异提供智能工具。。。。。。同时,,,,,,团队开源了高质量园林资产数据集GardenVerse,,,,,,包括132个带有高清纹理与详细专家知识标注的细腻模子,,,,,,为古板美学数字化与3D天生研究提供了名贵资源。。。。。。

图2: GardenDesigner包括两个主要模浚块——分层园林构建与知识嵌入资产结构。。。。。。用户输入首先被转化为切合园林美学原则的地形与路径天生参数;;随后在各区域中基于园林知识举行资产选择与约束优化结构,,,,,,最终天生完整的江南园林。。。。。。
GardenDesigner论文原文、代码和数据集详见项目主页:https://monad-cube.github.io/GardenDesigner/。。。。。。本论文的学生一作为杨凡,,,,,,电子信息硕士研究生三年级在读;;学生二作为熊瑞雪,,,,,,电子信息硕士研究生一年级在读;;学生三作为范艺严,,,,,,电子信息硕士研究生一年级在读。。。。。。
西席介绍:

李梦甜,,,,,,工学博士,,,,,,博士后,,,,,,现j9九游会上海影戏学院、上海影戏特效工程手艺研究中心讲师(助理教授),,,,,,MAGIC Lab PI。。。。。。主要研究偏向为面向影视、游戏与艺术领域的数字内容明确与天生、人机交互、人工智能艺术创作。。。。。。以第一/通讯作者揭晓CCF A/SCI-Q1论文20余篇,,,,,,国家授权专利多项。。。。。。主持国自然青年科学基金,,,,,,上海市科委“科技立异行动妄想”面上基金,,,,,,“CCF-网易雷火联合基金”二期,,,,,,入选j9九游会“青年英才启航妄想”。。。。。。加入国家重点研发妄想、国家社科重大、国自然面上基金(4项)。。。。。。担当盘算机视觉国际顶级聚会及期刊SIGGRAPH、SIGGRAPH Asia、 CVPR、ICCV、ECCV、ICLR、ICML、NeurIPS、ACMMM、TPAMI等审稿人,,,,,,The Visual Computer期刊编委。。。。。。任中国盘算机学会CAD/CG专委会执行委员(秘书处成员),,,,,,图形学与混淆现GAME执行委员,,,,,,CSIG数字娱乐与智能天生专委会、三维视觉专委会、多媒体专委会执行委员,,,,,,中国影戏电视手艺学会、中国影戏高新手艺专业委员会常任委员。。。。。。