清华大学设计出用于通用人工智能光子芯片：太极芯片

清华大学电子工程系卢芳副教授和自动化系戴琼海教授团队设计出一种基于光子技术而非传统电子晶体管的革命性人工智能（AI）芯片。

Taichi采用了分布式光计算架构，具备亿级神经元的芯片计算能力，显著提高了处理速度和能效。这种架构不仅利用波光学的高并行性和高连接性实现高密度计算，还通过一种通用且迭代的编码-嵌入-解码光子计算方法，有效扩大了光子神经网络的规模至十亿神经元级别。

研究团队在芯片上实验性地实现了一个具有1396万神经元的光学神经网络，用于处理复杂的千类级分类任务和人工智能生成内容（AIGC）任务。这一成果标志着光子计算技术在实际应用中迈出了重要一步。

功能特点：

高能效：Taichi 芯片的能效非常高，支持高达64×64的输入和输出维度。通过集成可扩展的波场衍射和可重构干涉技术，所有输入被被动编码并以高度并行的方式调制，实现了每瓦160 TOPS的芯片能效和每平方毫米879 T MACS的面积效率。这种高效能的处理能力使其在执行大规模人工智能任务时能够显著减少能源消耗。
- 每瓦160 TOPS：TOPS（Trillion Operations Per Second，每秒万亿次操作）是一个衡量计算性能的单位。Taichi芯片每消耗一瓦特电力，能执行160万亿次操作，这显示了其极高的能源效率。
- 每平方毫米879 T MACS：MACS（Multiply-Accumulate Operations Per Second，每秒乘累加操作）是另一种衡量芯片性能的单位。Taichi芯片每平方毫米能执行879万亿次乘累加操作，说明它在芯片面积上的计算密度非常高。
高精度分类：Taichi在芯片上实现了千类级分类和人工智能生成内容（AIGC）的大规模光学神经网络
- 1623类Omniglot字符识别：Taichi 芯片在这个包含多样化、复杂字符集的任务中达到了91.89%的高分类准确率。Omniglot数据集包含了来自不同语言的手写字符，是测试模式识别和机器学习算法的常用数据集。达到如此高的准确率表明Taichi芯片在处理视觉和文本识别任务时的高效性和准确性。
- 100类mini-ImageNet分类：在这个涉及多种自然图像的分类任务中，Taichi 芯片实现了87.74%的分类准确率。mini-ImageNet是一个广泛用于测试图像识别算法的缩小版ImageNet数据集，包含了100个类别，每个类别有600张图像。Taichi芯片在此任务上的表现展示了其在解析和分类复杂图像数据方面的强大能力。
人工智能内容生成：除了分类任务，Taichi 还能生成高保真的人工智能内容，例如音乐作曲和高分辨率风格化绘画生成。其性能在多个层面上提高了两个数量级。
- 音乐作曲：Taichi芯片通过学习和模拟不同音乐风格和结构，能够创作音乐作品。这种能力不仅展示了其在音频处理和创造性任务中的应用，也显示了光子神经网络在理解和生成复杂音乐模式方面的潜力。
- 高分辨率风格化绘画生成：通过分析和学习不同的艺术风格，Taichi芯片能生成具有特定艺术风格的高分辨率图像。这种能力使其在数字艺术创作、娱乐产业及其他需要视觉创造力的领域中非常有用。
应用潜力：由于其灵活的设计和强大的计算能力，Taichi 有潜力支持各种人工智能应用，从复杂的数据分析到实时的决策支持系统等。
模块化和可扩展性：
- Taichi芯片的设计支持模块化和硬件复用，可以根据具体的应用需求，扩展或减少计算路径和处理单元。
- 这种灵活性使得Taichi不仅能应对固定的任务，也能适应新的或变化的计算需求。

技术方法

Taichi 使用集成的衍射干涉混合设计，通过光子学元件在芯片上直接处理数据。这种设计减少了电子数据传输过程中的能耗，提高了计算速度和能效。

光子计算架构：Taichi 使用集成的衍射干涉混合设计，通过光子学元件在芯片上直接处理数据。这种设计减少了电子数据传输过程中的能耗，提高了计算速度和能效。
错误纠正输出码（ECOC）：Taichi 应用了三种ECOC方法来分配二元分类任务，这些方法通过不同策略为类别分配二进制标签，增强了分类任务的准确性和鲁棒性。
路径合成方法：对于分类任务，Taichi 从多个二元分类路径合成最终决策。它通过比较合成向量与标准类别码的欧几里得距离来确定最接近的类别。

1. 分布式光子计算架构

分布式架构：Taichi芯片不依赖单一的中心处理单元，而是将计算任务分散到多个光学处理单元上。这样的架构允许同时处理多个计算任务，显著提升了计算效率和速度。
亿级神经元：在人工神经网络中，神经元是基本的计算单元。Taichi通过高度集成的光子网络，在芯片上模拟出相当于十亿个神经元的计算能力。这意味着它可以同时处理大量的数据点，执行复杂的人工智能算法。

2. 波光学的高并行性和高连接性

波光学：利用光的波动性质来进行信息处理。在Taichi芯片中，光波可以通过光学元件如波导、衍射器和相位调制器进行精确控制。
高并行性：Taichi光子芯片可以在不同的光学路径上同时传输和处理多个数据流，实现高并行计算。
高连接性：光子网络内部连接密集，每个光学元件可以与多个其他元件连接，提供了复杂的网络拓扑结构，这对于执行深度学习等算法非常有利。

3. 通用且迭代的编码-嵌入-解码光子计算方法

编码-嵌入-解码方法：这是一种数据处理流程，涉及三个主要步骤：
- 编码：将原始数据（如图像或声音信号）转换成适合光学处理的格式，例如通过光的强度、相位或频率来表示数据。
- 嵌入：在这一阶段，数据通过特定的光学元件处理，如相位移位器或光学调制器，以进行特征提取和数据压缩。
- 解码：最后阶段，处理后的光信号转换回电信号或其他易于读取的格式，以输出最终计算结果。
扩展到十亿神经元级别：通过迭代优化这一处理流程，Taichi芯片能够扩展其网络规模，支持高达十亿级别的神经元，从而处理更大规模的数据集和更复杂的计算任务。

4.错误校正输出码（ECOC）分类方法：

Taichi采用多路径并行处理策略，通过错误校正输出码（ECOC）进行高效的任务分配和分类处理。
每个处理路径可以独立执行二元分类，通过集成多个路径的结果来实现复杂的多类分类任务。

应用前景

1、大规模光学神经网络

千类级分类：Taichi 芯片能处理大规模分类问题，如能在千类级别（例如1623类）进行高准确度分类，展示了其处理复杂数据集的能力。
人工智能生成内容（AIGC）：Taichi 不仅局限于传统的分类和识别任务，还能进行创造性的内容生成，如音乐作曲和高分辨率风格化绘画。这种能力使它可以在艺术创作和其他需要创造性输出的领域中找到应用。

2、构建超十亿神经元的模型

规模限制的突破：Taichi芯片通过达到超十亿神经元的规模，突破了之前光子计算和AI芯片的规模限制，为构建更大更复杂的神经网络模型提供了基础。
信息分散与合成：Taichi采用了高级的数据处理策略，能够在保持高容错性的同时，有效地分散和合成信息。这种策略增加了系统对错误的鲁棒性，尤其是在处理大规模数据时。