文章目录[隐藏]
总部位于德克萨斯州奥斯汀的 AI 芯片初创公司 Neurophos 宣布其在硅光子计算领域取得关键进展:成功开发出一款基于光子的处理器,其核心创新在于——将光学晶体管尺寸缩小至传统方案的约 1/10,000,并实现 1000×1000 的大规模光子矩阵运算。

该公司由比尔·盖茨旗下的 Gates Frontier Fund 投资,目标是突破当前硅基 AI 芯片在能效与计算密度上的物理瓶颈。
核心技术突破
1. 超大光子矩阵
- 单芯片集成 1000×1000 光子传感器阵列
相比英伟达主流 AI GPU(如 H100)常用的 256×256 矩阵,计算单元规模扩大近 15 倍。 - 支持 FP4 / INT4 低精度计算,专为 AI 推理与训练优化。
2. 微型化光学晶体管
- 传统硅光子工厂制造的光学开关长度约 2 毫米,难以高密度集成。
- Neurophos 利用改进的半导体工艺,将等效光学晶体管尺寸压缩至 微米级,实现“比现有技术小 1 万倍”的体积。
- 这一突破使得在单芯片上部署足够多的光子计算单元成为可能,首次接近 CMOS 数字电路的集成密度。
3. 高频运行能力
- 首款光子处理器 Tulkas T100 运行频率高达 56 GHz
- 远超英特尔 Core i9-14900KF 的 9.1 GHz(风冷世界纪录)
- 是英伟达 RTX Pro 6000(2.6 GHz)的 20 倍以上
- 高频 + 大矩阵协同,弥补了“单芯片仅等效 1 个张量核心”的数量劣势。
性能对标:挑战英伟达 Vera Rubin 超算
Neurophos 声称,其光学处理器在 FP4/INT4 工作负载下的性能可达 英伟达 Vera Rubin NVL72 AI 超级计算机的 10 倍,而功耗水平相当。
“我们不是靠堆核数取胜,而是通过更大的矩阵和更高的时钟速度实现效率跃升。”
—— Neurophos CEO Patrick Bowen
尽管 Vera Rubin 单芯片集成 576 个张量核心,但 Neurophos 的光子架构在单位面积计算吞吐量上展现出潜在优势。
制造与量产前景
- 兼容现有半导体工艺:无需全新产线,可利用英特尔、台积电等代工厂的成熟制程。
- 仍处测试阶段:预计 2028 年 才能量产。
- 待解挑战:
- 需配套大量向量处理单元(VPU)
- 片上静态存储器(SRAM)带宽需匹配光子计算速度
- 光电信号转换效率与热管理
行业背景:光子计算正成新战场
Neurophos 并非孤例。全球科技巨头已加速布局硅光子学:
- 英伟达:在 Rubin 平台中采用 Spectrum-X 光子以太网交换系统,提升集群通信效率
- AMD:计划投资 2.8 亿美元 建立硅光子研究中心
- Intel、Ayar Labs、Lightmatter 等也在推进光互连与光计算芯片
光子计算的优势在于:低延迟、高带宽、近乎零焦耳/bit 的能耗,尤其适合 AI 中的矩阵乘加(MAC)操作。
能否打破“硅瓶颈”?
当前 AI 芯片受限于:
- 冯·诺依曼架构的内存墙
- 电互联的带宽与功耗限制
- 摩尔定律放缓
光子计算提供了一条非冯·诺依曼路径:
- 数据以光信号形式并行传输
- 矩阵运算在光域直接完成,无需频繁读写内存
- 功耗主要来自光电转换,而非计算本身
若 Neurophos 能在 2028 年实现可靠量产,它或将成为 AI 基础设施的重要补充——不是取代 GPU,而是承担特定高吞吐、低精度计算任务。
发表回复