生成AIに最適:標準的な8Wの電力エンベロープ以内で、数十億のパラメータの生成系AIモデルをサポート |
効率的なAI演算: 非常に高いAIコンピュート利用率を達成し、卓越したエネルギー効率を実現 |
メモリ帯域幅の強化:高性能なDRAM帯域幅を確保し、LLMおよびLVMの優れた性能を確保 |
大容量DRAM:最大32GBのDRAMをサポートし、複雑なビジョンや生成AIのワークロードを効率的に処理 |
リアルタイム・データ・ストリーミング:バッチサイズ1で低遅延オペレーションに最適化 |
任意の活性化関数のサポート:ハードウェアアクセラレーションによる近似が適応性を向上 |
高度な精度: ソフトウェア対応の混合精度でFP32に近い精度を実現 |
効率的なデータ処理: 統合されたテンソルリシェイパーエンジンにより、ホストのCPU負荷を最小化 |
スパース計算: メモリフットプリントを削減し、DRAM帯域幅を最適化 |
電力管理:高度な電力管理で超高効率モードを実現 |