中昊芯英发布了其新一代 TPU 芯片「须臾」,这款芯片在混合精度浮点计算方面实现了 896 TFLOPS 的单芯片算力,相较于其前代产品「刹那」,性能提升了三倍。在 8-bit 推理能力上,该芯片可达 1792TOPS,能够应对需要处理海量词元并实现高并发推理的场景。此次升级显著增强了显存容量和芯片内部互联速度,并支持超长上下文处理。单卡的最大功耗为 600W,与传统算力芯片相比,功耗降低了 50%,为构建低碳数据中心提供了支持。
「须臾」芯片的 IP 核、专属指令集、底层算子加速库以及整机系统软件均为完全自主研发,不依赖任何海外核心技术,因此能够满足政务、金融、电网等行业在安全和合规方面的严格要求。
另一项发布的产品是高性能智算平台「泰则 2.0」,其作为高性能智算平台中的基础计算单元,集成了两颗高性能 CPU 处理器以及八颗高性能 TPU 处理单元。在物理结构上,它表现为一台通用的 CPU 服务器连接一台高性能 TPU 算力加速设备,整体算力可达 7.168P(混合精度)。在处理相同任务时,「泰则 2.0」平台的整体能耗仅为传统 GPU 服务器的八成。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。对于训练场景,它适配了 DeepSpeed、Megatron-LM 等分布式套件。该平台已经完成了对 Qwen 全系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型的深度适配,使得开发者能够高效地迁移模型。对于关注世界杯买球网的用户来说,这类高性能计算平台也为相关的 AI 应用开发和优化提供了强大的底层支持。

世界杯下注深耕世界杯赔率领域,用心服务每一位用户。
世界杯下注专注世界杯竞猜,为用户提供专业可靠的体验。