软通动力"北京壹号词元工厂"正式启动，发布开源词元（Token）工厂性能基准_科技资讯

全面定义大模型长时运行与混沌负载特征，推进行业分工与消费端质量监控标准化

北京2026年6月11日/美通社/ -- 2026年以来，随着Claude Code、OpenClaw等智能体（AI Agent）技术的全面破圈，AGI正式迈入新纪元。正如黄仁勋在GTC 2026主题演讲中所强调的：大语言模型（LLM）正从简单的对话机器人，加速演进为能够自主规划、推理并采取行动以达成复杂目标的长时运行系统。这一趋势下，大模型推理算力需求呈井喷式增长，"Token工厂"概念跃升为资本、产业与技术界的核心焦点。

然而，智能体（Agentic）的工作负载与传统的人类对话交互在结构上截然不同。它通常呈现为长周期的多轮循环，在"推理阶段"和"行动阶段"之间高频切换。随着AI从"对话式生成"全面驶入"自主智能体"的深水区，算力基础设施的生产、度量与消耗标准迎来解构性变革。

今日，软通动力正式宣布，其首个标杆示范项目——"北京壹号词元工厂" 正式投入运行，并同步向全球发布并开源"软通动力词元工厂性能基准"。这标志着大模型算力消耗正式告别粗放式的吞吐量比拼，步入标准化、工业化的"Token流水线"时代。

北京壹号词元工厂：面向智能体时代的"新型电厂"

作为软通动力AI战略的重要组成部分，北京壹号词元工厂聚焦Agentic Serving（智能体服务）场景，通过极限工程化手段压榨硬件性能，集成前沿算力调度与KV Cache极致复用算法，以确定性的服务质量与极致的性价比，向全社会输出标准化的"数字燃料"——Token，为智算时代提供确定性、高弹性的供应保障。

北京壹号词元工厂项目负责人表示："北京作为全国AI创新高地，集聚了最多的大模型公司和智能体应用团队，对新型算力服务的需求最迫切、最前沿。建设与之匹配的'Token工厂'是北京打造'全球数字经济标杆城市'的必然要求。Agentic Serving带来了天然复杂的业务逻辑。一个简单的最终指令背后，可能是模型内部数十次推理循环、工具调用与自我反思的叠加。这种极度的不确定性，使得传统的静态压测指标完全失效。行业陷入'指标迷雾'：底层建设者不知如何针对长上下文优化架构，算力运营者难以预估动态波动下的并发水位，企业级使用者缺乏明确的SLA作为采购依据，最终用户则频繁遭遇首字延迟不可控和推理中途断线的糟糕体验。我们发布这一基准，正是为了打造统一的'标杆之镜'。"

为了精准捕捉并复现智能体服务环境中的极端压力，软通动力在发布会上宣布：正式开源词元工厂性能基准，该基准不是单一工具，而是一个三层递进的完整评测体系，遵循"一个基准（刻画方法）"，采用"三类测试方法"，构建"分领域标准数据集" ，实现对算力集群真实服务能力的精准评估与公平对比。

软通动力对基于大模型发展初期行业通用的MLPerf LoadGen进行了深度重构，实现了从静态并发注入到动态行为仿真的跨越，发展出了 LoadGen 2.0。其核心突破在于：成功在测试环境中定义并重现了真实的"混沌局面"，它定义了"大家共识的混沌系统如何刻画和重现"——这是所有评测的根基。

以此为根基，软通动力构建了三层递进的完整评测体系：

LoadGen 2.0已完全开源（GitHub:github.com/issair/loadgen2）。

随着技术成熟，大模型行业正复制传统工业的发展轨迹——模型算法研发、算力基础设施运营（Token生产）、智能体路由分发以及垂直场景应用逐步解耦。专业的Token工厂需要具备"软硬一体"的全栈能力。

软通动力在以下方面形成了差异化能力

目前，软通动力正深度参与平潭两岸融合算力中心、韶关公共算力服务平台等国家一体化算力网络重点项目建设，并依托睿动智能体平台，打造连接国际云厂商与国产AI新势力的全球化AI双向枢纽。北京壹号词元工厂的启动，是公司推进AI基础设施布局、构建Token生态体系的重要实践。

未来，软通动力将持续推进"Token工厂"建设，并从消费者视角出发推出"实时监测"等一系列质量监控方法——如同在城市自来水管网中部署实时纯净度探针一般，在运行端动态监控Token生成的幻觉率、语义一致性及毫秒级延迟波动。这将帮助用户更直观地了解所使用算力服务的真实质量，推动行业建立更加透明、可信的评测体系。

本文来源：美通社 PR Newswire