中昊芯英公布了其新一代 TPU 芯片「须臾」,该芯片的单芯片混合精度浮点算力达到了 896 TFLOPS,相较于上一代「刹那」芯片,性能提升了三倍。此外,其 8-bit 推理算力高达 1792 TOPS,能够应对大规模词元的高并发推理需求。新一代芯片在显存容量和内部互联速度方面均有显著增强,并支持极长的上下文长度。单卡额定功耗为 600W,较传统算力芯片能耗降低了 50%,有助于推动绿色数据中心的建设。
值得一提的是,「须臾」芯片的所有 IP 核心、指令集、底层算子加速库以及系统软件均为自主研发,摆脱了对海外核心技术的依赖,能够满足政务、金融、电网等行业的安全合规标准。
与此同时,高性能智算平台「泰则 2.0」作为标准的最小计算单元也一同发布。「泰则 2.0」集成了两颗高性能 CPU 处理器和八颗高性能 TPU 处理单元,构成了一个通用的 CPU 服务器外接高性能 TPU 算力加速设备的形态。其混合精度算力可达 7.168 PFLOPS,在同等任务下,整机能耗仅为传统 GPU 服务器的八成。
在软件层面,「泰则 2.0」平台实现了对主流 AI 框架的全面兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练方面,它适配了 DeepSpeed 和 Megatron-LM 等分布式套件。目前,该平台已深度适配了 Qwen 系列、DeepSeek、GLM、MiniMAX 等数十款大语言和多模态模型,使开发者能够高效地迁移模型,就像在准备参加足球世界杯一样,需要强大的技术支撑。

足球爱好者 / 2026年6月1日 10:30
赛事分析:。
精彩评论
球迷小明 / 刚刚
本平台不仅提供实时比分,更深入挖掘赛事背后的故事,让您全方位感受足球的魅力。
回复
资深球迷 / 刚刚
赛事前瞻:。
回复
发表您的观点