清华新闻网5月22日电 在沉浸式视觉体验日益普及的今天,3D显示技术正逐步将科幻变成现实。然而,传统全息显示在呈现具有复杂深度信息的场景时,往往会产生视觉不自然甚至疲劳感。近日,清华大学深圳国际研究生院耿子涵副教授团队实现了与人类视觉感知相一致的物理光学散焦效果,显著提升了三维显示的真实感和视觉舒适度。

图1.传统全息显示非自然离焦原因分析
传统全息显示中振铃等不自然的散焦效果,源于物理模型层面的矛盾。现有计算方法基于相干衍射模型,而人类视觉系统天然适应的是自然世界中的非相干感知。这种计算模型与感知模型之间的不匹配,是散焦不准确的重要成因。另一方面,数字离散化与光学系统有限孔径的共同作用,会人为引入并截断高频分量,这一技术限制进一步加剧了振铃伪影。在离焦区域,尤其是平滑背景上,振铃伪影会显得格外突出。散焦为人类视觉提供关键的深度线索,不准确的散焦会破坏场景的真实感,并可能引起视觉不适。

图2.实验装置和实验结果对比(虚线为应当虚焦区域,实线为应当聚焦区域)
针对上述问题,研究团队提出了将物理模型与感知模型相统一的解决方案。该框架针对传统相干衍射模型与人眼非相干感知的不匹配问题,将复杂场景编码、神经推理和波动光学传播统一在同一个散焦形成的物理模型之下。团队将神经渲染器与多分支相位预测模块协同集成,以生成物理一致且为复数值的光场。同时,对光的衍射过程以及有限孔径和有限空间频率的影响进行了建模,以确保与相干全息显示系统的物理一致性。
针对RGB-D数据为每个像素分配单一深度值,在透明或反射场景中存在深度歧义问题,团队提出了分层计算策略,保留多层深度结构,以确保正确的焦点顺序。

图3.透射和反射场景的实验结果
研究团队精确控制不同深度位置的光线分布,在透明、反射等复杂离焦区域获得与真实世界一致的物理光学散焦体验,有效抑制振铃伪影和改善焦点关系,使数字3D场景在视觉上更符合真实物理规律。相比Tensor Holography和Multiplane SGD等代表性方案,本文方法实现了更加逼真的三维显示效果,平均峰值信噪比达到32.35dB,平均结构相似性指数达到0.938。
研究成果以“具有自然离焦效果的真实三维全息显示”(Photorealistic 3D Holographic Display with Natural Defocus Effect)为题,于5月6日发表于《自然·通讯》(Nature Communications)。
清华大学深圳国际研究生院2022级博士生周密与耿子涵为论文第一作者,耿子涵为论文通讯作者。研究得到国家自然科学基金、广东省基础与应用基础研究基金、深圳市科技创新局等的支持。
论文链接:
https://www.nature.com/articles/s41467-026-72736-7
供稿:深圳国际研究生院
编辑:李华山
审核:郭玲