您的位置:首页 >聚焦 >

用光学生成图像,几乎0耗电,浙大校友一作研究登Nature 当前聚焦

2025-09-15 14:35:02    来源:机器之心Pro

机器之心报道

编辑:张倩、陈陈

在 《自然》 杂志发表的一篇论文中,加州大学洛杉矶分校 Shiqi Chen 等人描述了一种几乎不消耗电量的 AI 图像生成器的开发。


(相关资料图)

该生成器是一种受扩散模型启发的光学生成模型。其工作原理如下:首先通过数字编码器(使用公开数据集训练)生成最终构成图像的静态噪声,这一过程仅需消耗极少能量。随后,一种被称为空间光调制器(SLM)的液晶屏幕会将这种噪声模式刻印到激光束上。该激光束再通过第二台解码 SLM 装置,将光束中的噪声模式转化为最终图像。

与传统 AI 依赖数百万次计算机运算不同,该系统利用光完成所有核心工作,因此几乎不消耗电能。论文第一作者 Shiqi Chen 表示:「我们的光学生成模型几乎无需算力就能合成海量图像,为数字 AI 模型提供了可扩展且高能效的替代方案。」

研究人员采用多种 AI 训练图像对系统进行测试,包括名人肖像、蝴蝶图像以及梵高风格的全彩画作。结果显示,光学系统生成的图像效果与传统图像生成器相当,但能耗显著降低。

该技术还具有广泛的应用前景。凭借其超高速和超低能耗特性,该系统可用于生成 VR、AR 显示的图像视频,也适用于智能手机、AI 眼镜等可穿戴电子设备的小型化终端。

  • 论文标题:Optical generative models
  • 论文地址:https://www.nature.com/articles/s41586-025-09446-5#MOESM1

不过,该模型目前仍处于物理实验阶段,离实用还有一段距离。

方法概览

本文提出的光学生成模型,能够根据目标数据分布合成单色或彩色图像 —— 即通过光学方法生成特定数据分布中前所未见的新图像。受扩散模型启发,该方案采用浅层数字编码器将随机二维高斯噪声模式快速转换为代表光学生成种子的二维相位结构。这种光学种子的产生是一次性的,它涉及一个作用于随机二维噪声模式的浅而快速的相位空间编码器。

根据目标分布即时生成图像或输出数据的过程,可通过随机调用这些预先计算好的光学生成种子按需实现。这一广义概念可通过不同光学硬件实现,集成光子学或基于自由空间的实现。

即时图像生成

图 1 展示了作者研发的单色图像即时生成模型的原理示意图。如图 1a 所示,遵循正态分布的随机二维输入首先通过数字编码器转换为二维相位模式,该编码器可快速提取潜在特征并将其编码至相位通道以供后续模拟处理。这些由随机噪声生成的相位编码输入作为光学生成种子,被加载到 SLM 中,为衍射光学生成模型提供信息输入。在相干光照下,携带编码相位模式的光场继续传播并通过为特定目标数据分布优化的衍射解码器进行处理。最终,生成的图像由图像传感器捕获,这些图像符合目标数据分布特征。

图 1b 展示了训练流程:作者首先基于去噪扩散概率模型(DDPM)训练教师数字生成模型以学习目标数据分布。完成训练后,冻结该 DDPM 模型并持续生成用于训练即时光学生成模型的噪声 - 图像数据对。浅层数字相位编码器与光学生成模型通过联合训练,使模型能够以简洁可重构的架构高效学习目标分布。

图 1c 呈现了盲推理过程:由数字编码器从随机噪声模式产生的编码相位模式(即光学种子)是预先计算的,光学生成模型则使用固定的静态解码器在自由空间中对这些生成相位种子进行解码。为实现从随机高斯噪声快速合成光学生成相位种子,数字编码器包含三个全连接层,其中前两层采用非线性激活函数(详见方法部分)。可重构衍射解码器通过 400 × 400 个可调相位特征(每个特征覆盖 0-2π 范围)进行优化,完成优化后针对每个目标数据分布保持静态。

图 1

迭代式光学生成模型

作者还设计了一种迭代式光学通用模型,可从高斯噪声中递归重建目标数据分布。如图 2a 所示,该迭代光学生成模型同样工作在三个照明波长下,通过浅层数字相位编码器编码的多通道相位图案被顺序加载到同一 SLM 上。

为展示这种迭代光学模型的生成能力,作者采用 Lₒ=5 个联合优化并固定的解码层来处理目标数据分布。与前述即时光学生成模型的不同之处在于:当图像传感器平面记录初始强度图像后,测量结果会按设计方差添加高斯噪声,该噪声扰动结果将作为下一时间步的迭代光学输入。

图 2b 展示了这种迭代光学生成模型的训练过程:采样一批时间步并相应地向原始数据添加噪声,获得噪声样本。这些噪声样本经过浅层数字编码器和迭代光学生成模型处理,得到连续输出。与标准 DDPM 实现不同,该迭代光学生成模型直接预测去噪样本,其损失函数根据原始数据计算。

图 2c 概述了迭代式光学生成模型的盲推理过程:已训练的光学模型对从最终时间步到初始时间步的扰动样本递归执行去噪操作,最终生成的图像在传感器平面捕获(详见方法部分)。

图 2

实验及结果

在初步实验中,研究者分别基于 MNIST 和 Fashion-MNIST 数据集训练了两个不同的模型,用于生成手写数字和时尚商品图像。

图 3c 为两个模型的结果,生成的图片在 MNIST 和 Fashion-MNIST 数据集上分别达到了 131.08 和 180.57 的 FID 实验评分。这表明生成的图片符合这两个数据集的目标分布,充分体现了所设计系统的多样性,进一步验证了快照式光学生成模型的可行性。

生成手写数字

生成时尚商品

研究者进一步将实验结果拓展至更高分辨率的梵高风格艺术作品生成。

图 4 与图 5 分别展示了使用 5.8 亿参数数字编码器实现的高分辨率单色及彩色(RGB)图像生成实验结果。其中梵高风格单色图像采用 520 纳米波长照明生成,而彩色图像则依次使用 {450, 520, 638} 纳米波长分别对应蓝、绿、红三通道。

在多色梵高风格艺术图像生成实验中,研究者为每个波长通道生成了相应的相位编码生成种子图案,并依次加载到空间光调制器(SLM)上。在对应波长的照明下,利用固定或静态的衍射解码器生成多彩图像,并通过数字方式进行融合。换言之,在所有波长照明下的图像生成过程中,系统共享同一个解码器状态。

图 5 展示了多色梵高风格艺术作品的生成结果,其中既包含与教师数字扩散模型输出高度吻合的案例,也包含具有差异性输出的示例(该教师模型需使用 10.7 亿可训练参数并通过 1000 次迭代步骤生成单幅图像)。尽管观察到轻微的色差现象,生成的高分辨率彩色图像仍保持了优异的质量。

作者介绍

Shiqi Chen,加州大学洛杉矶分校(UCLA)博士后研究员,导师为 Aydogan Ozcan 教授。此前,他在浙江大学获得博士学位,师从冯华君教授和徐之海教授。

Shiqi Chen 在博士期间主要研究重点是应用光学和计算机视觉,以实现更清晰的计算成像,其中部分研究成果已应用于最新的移动终端设备。

  • 个人主页:https://tangeego.github.io/

标签: 高斯 梵高 光学 相位 传感器 编码器

相关推荐

镇宁跨市便民快巴9月16日开通!9.9 元起享地铁无缝换乘

焦点讯息:生意社:现货上海金2025年9月11日午盘基准报价827.78元/克

每日消息!奇波雷墨西哥烧烤计划明年在韩国和新加坡开店,首次进军亚洲市场

今热点:智平方获近5亿元具身智能机器人订单

视讯!广汽集团:在办公、研发、客户服务及业务流程中积极应用AI技术

国家卫健委:儿科执业医师达24.39万人 速讯

当前聚焦:苹果发布iPhone17系列 京东上线多款“金苹果”饰品1元起拍

富乐德股东户数下降4.17%,户均持股15.59万元-今日快讯

濮阳惠成(300481.SZ)产品广泛应用于电子元器件封装材料、电气设备绝缘材料、涂料等诸多领域

今热点:吉大通信股东户数增加14.01%,户均持股11.61万元

原来睡觉需要两个枕头?这么多年都睡错了…|今日视点

要闻:丙烯腈商品报价动态(2025-09-11)

今日快看!大行评级|摩根大通:上调速腾聚创目标价至53港元 评级升至“增持”

涨停雷达:CPO+光通信+半导体设备+半年报增长 腾景科技触及涨停 观速讯

【券商聚焦】申万宏源维持快手(01024)买入评级 看好可灵AI的持续发展

众安保险王敏:作为AI应用的高潜领域 保险行业正在经历全流程智能化重塑

【热闻】胜宏科技再创历史新高,年内累涨685%

今日热门!港股午评:恒生指数跌0.29% 歌礼制药跌近13%

简讯:iPhone Air 开售在即,北京电信 eSIM 服务将同步上线

新华社权威速览·非凡“十四五”|“十四五”时期,这些文化遗产成功申遗

如何运用图表分析提升期货交易的成功率?

大摩:阿里巴巴-W(09988)高德地图业务的革新或是重推到店服务的第一步 观焦点

中国专家助力桑给巴尔加快实现消除血吸虫病目标-前沿资讯

崧盛股份:将积极把握国内体育场馆新建与改造需求_今日热闻

宋雨琦生图舞台零泛红引关注?东方佰丽PDRN解锁肌肤维稳新路径

花旗预计美元/日元将在第四季度下探140关口-播资讯

速讯:14家理财公司8月规模增超2800亿 现金类占比创年内新低

卫星互联网概念延续强势 东方通信2连板

今日播报!银行零售业务,“拐点”还有多远?

期货合约中的交割条款具体包括什么?

8月CPI同比下降0.4%

黄河流域始祖文化展开展|观天下

莱奥正装出席颁奖典礼:伤病还没康复不能冒险,我能踢中锋或边锋

哈尔滨市洪地再生资源回收有限公司成立 注册资本10万人民币-看热讯

【焦点热闻】中电光谷(00798)9月10日斥资62.41万港元回购242.8万股

康希通信9月10日大宗交易成交1295.36万元_时快讯

小鹅通CFO周世坤,年薪2021万_快看点

【天眼调查】点单族看过来,贵阳外卖小哥教你“火眼金睛”选外卖

一财社论:明确恶性竞争的界定 促进市场公平竞争-微速讯

山东章鼓公布“螺杆鼓风机叶轮叶面间隙调整方法”专利

视焦点讯!AI卷土重来!算力引爆创业板人工智能,高“光”159363大涨3.67%!机构:板块中...

比亚迪(002594.SZ):高级管理人员、核心人员累计增持5232.78万元公司股份-当前看点

今热点:方邦股份(688020.SH):董事叶勇拟减持不超15万股股份

珠江股份:拟以1元挂牌底价转让亿华公司41%股权 每日速读

天普股份(605255.SH):股票将于9月11日停牌核查

贝壳-W(02423)9月9日耗资约700万美元回购约105.06万股_速递

东阳光:与关联方共同增资合资公司用于收购秦淮数据中国100%股权

双向奔赴的温暖!苏州95后退役军人开面馆,免费送面却常被婉拒-当前信息

每日看点!动力源:公司不存在被实施退市风险警示的情况

骏鼎达:接受鸿道投资等投资者调研

南京公交就医专线+1!覆盖翻倍、增设招呼站,出行更方便

四维图新:公司的导航产品采用大数据众源更新技术

最新进展!自如回应“夫妻合租生娃被要求3日内搬离”:夫妻将寻找新房子,室友同意放宽搬...

今日报丨中海达:公司与高德地图暂无合作

润丰股份续聘邢秉鹏为董秘:2024年薪酬89万 任内公司市值增加115.81亿

今天,A股五大算力龙头股“抢镜” 简讯

雷蒙:亚洲杯和俊杰同屋 睡前他想听故事 我跟哄孩子睡觉似的 看热讯

洁美科技(002859.SZ):柔震科技扩产在稳步推进,配合头部几家3C电池厂商开发下一代复合集...

白天上班,晚上学艺!市民夜校“圈粉”外国友人_焦点快播

观焦点:非银赛道再受资金“追捧”!单日相关ETF合计“吸金”超30亿元!港股通非银ETF(51...

每日热门:苹果17系列发布后iPhone 16 Pro/Max下架,16/Plus降价600/1000元

生意社:9月10日浙江弘博DOP企业报价下跌 短讯

苹果推最薄iPhone,工业富联盘中触涨停

第41个教师节·时代新声 | 以美育人,向光而行

快讯:破亿方!我国首个海上碳封存项目取得重大进展

一汽取得数据处理相关专利

江丰电子股东户数增加243户,户均持股37.57万元|天天资讯

大众点评“重启”品质外卖

头条焦点:教师节|师者如灯,照亮一生

每日头条!武冈市湘靖食品有限公司成立 注册资本10万人民币

当前看点!爱诗科技完成6000万美元B轮融资 阿里巴巴领投

生意社:9月10日上饶市朗青矿业碳酸钙价格稳定

今日报丨租房合同备案不等于征税

OpenAI在韩国开设第三个亚洲办事处 每日关注

焦点精选!豪恩汽电:为全新问界M7提供12颗新一代AK2超声波雷达

师·说|“长大后,我就成了你”,垦利一中教师李倩站上三尺讲台书写教育诗篇

中信证券:玻纤“反内卷”和复价推进 龙头企业盈利弹性可期

阿里妈妈AIGC携手阿里公益:以AI“画笔”激活张北有机蔬菜品牌价值,探索农业产业营销新范式

传承红色基因•赓续红色血脉-----纪念中国人民抗日战争暨世界反法西斯战争胜利80周年开国...

达成历史最佳8月销量表现 长城汽车8月销售新车11.56万辆 同比增长22.33%

[快讯]智翔金泰公布半年报

当前焦点!财报速递:片仔癀2025年半年度净利润14.42亿元

【金融街发布】国家外汇局:7月中国外汇市场总计成交28.28万亿元人民币 天天资讯

最新:暑期博物馆游热度飙升 夜游、沉浸式体验成新潮流

观焦点:中国人民解放军南部战区位黄岩岛领海领空及周边区域组织战备警巡

龙湖发布2025年中期业绩,营业收入同比增长25%

每日看点!美银证券:下调理想汽车-W(02015)评级至“中性” 目标价降至101港元

“华尔街神算子”不改看涨美股立场:AI蕴含巨大长期增长潜力_今日讯

冰山冷热(000530.SZ):拥有核电站冷却设备产品和技术_每日报道

【热闻】涤纶短纤商品报价动态(2025-08-29)

两女生请24位陪爬一起登顶泰山,花费近3万,年龄19-26岁,当事人:一路哄她们开心,抱着4...

世联汽车内饰取得一种激光打孔造型皮革专利,实现多彩效果

五大三元锂龙头上市公司,请收藏好(2025/8/29)_每日热议

吉利汽车因认股权获行使而发行3.45万股_热点

媒体人:张镇麟最早31日抵沪 伤势已无大碍 有望日本拉练期间首秀 焦点滚动

中信股份:上半年实现归母净利润312亿元,拟分红58.18亿元 即时焦点

短讯![快讯]太湖远大893万限售股9月2日解禁

泰安联通以“心”服务传递温情

2025年A股基因测序龙头股票,名单整理(8/29)

通讯!兴业银行计划财务部总经理林舒:下半年要注重信用卡、担保承诺收入两个短板的弥补