
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
AI圈卷到咫尺,开动建工场了。
这不,就在刚刚,北京就开了一家,包含两个中枢构成部分:
一个是考研工场:
主张算力界限10万P,负责把通用大模子、行业数据和算力资源放进来,真金不怕火成金融、制造、政务、科研等行业能用的专科模子。
另一个是Token工场:
主张日均产能10万亿Token,负责把这些专科模子封装成企业不错调用、不错计量、不错结算、不错踏实托福的专科Token。

这即是九章云极在2026全球智算科技峰会暨九章云极计谋发布会上,郑重抛出一个新计谋——AI工场。
它听起来点像把AI产业搬进当代化工场:前端真金不怕火模子,后端送智能。
然后中间再用DCU(1度算力)度量算力参预,用专科Token(面向业务任务的智能价值单元)度量智能产出,再让业务数据回流,络续鼓吹模子迭代。
由此带来的效益,用一组数据展示即是:
10万P主张算力界限、10万亿主张Token日均产能、1000倍主张轮廓降本、策动孵化1000个高价值模子与智能应用。
更直不雅的,一张图解如下所示:

不外比起这些数字来说,从九章云极的这次计谋发布来看,智算云的买卖逻辑正在发生变化——
它不再只答复算力够不够,还要答复算力能不可变成确凿可托福的智能。
而这,即是九章云极这次行动的主张,把这上头个问题试图工程化。
AI工场,到底如何运转?方法会这座AI工场,咱们率先需要了解面前企业在拥抱大模子时面对的真实痛点。
往常,群众热衷于盘问的可能是模子参数有多大、是不是开源、打分高不高;但咫尺,业务一线的真实拷问是:
模子能不可确凿跑进咱们复杂的业务系统?在超高并发下,能不可踏实输出可预期的放胆?每一次API调用的成本,业务部门能不可算清账、算赢账?
这还是不是一个隧谈的算法竞赛,更准确的说,应该是一个典型的工程与工业化问题。
毕竟阻截AI落地的现实瓶颈时常不在大模子自己,而在其背后的整套底层智算基建,包括算力改造是否高效、异构算力能否协调纳管、推理成本是否饱和低、任务失败时系统能否自动感知并自愈……
因此,九章云极推出的AI工场,施行上是在用一套圭臬化、界限化、高可靠性的工业化活水线,去重构智能的出产与托福体系。
从AI工场的所有这个词幅员来看,不错分为四个要津部分来看。
参预侧:始创“一度算力”(DCU)
这是处罚如何购买算力的问题。
长期以来,算力行业最大的痛点就是资源不圭臬、计价不透明、参预不可量化。
往常,企业频繁需要去租用GPU、筹谋收罗拓扑、磋议存储带宽以及机器的使用时长。
这种随意的租借风景,就如同在初期的电力时期,想要用电,必须我方去买煤炭、租发电机,甚而我方去拉电线,门槛极高、成本狼籍词语、无规章模化。
九章云极在行业内始创了“一度算力”计量单元,将其界说为312TFlops×小时(每秒钟312万亿次浮点筹谋乘以一小时)。
△九章云极董事长,方磊
它将底层芯片(异构的GPU、NPU)、收罗、存储、使用时长及施行诓骗率等极其复杂的物理资源协调折合计量。
对客户而言,算力采购从此变得像买电同样浮浅,按“度”付费、所见即所得。
出产侧:考研工场
考研工场处罚的是智能“从0到1”的出产问题。
闲居来讲,就是把通用模子、行业数据、算力资源放进来,通过数据处理、领域精调、强化学习、评测响应等经过,考研出金融、制造、政务、科研等场景可用的专科模子。
这里的重点不仅仅有若干卡。
考研工场强调的是千卡到万卡级集群、高密度收罗存储、故障自愈、跨地域改造,以及从数据、考研、评测到部署的全经过器用链。考研工场能够将通用基础模子,升级为适配五行八作的专科任务模子。
通用模子存在自然的数据界限与智商界限,无法笼罩企业格外数据、行业Know-How、复杂业务经过。而考研工场的价值,就是把行业专属常识千里淀进模子,让AI从会聊天、会答题,升级为能拆撤职务、能自主有策动、能风险判断、能闭环落地的产业智能体,确凿适配企业出产环境。
封装侧:Token工场
Token工场处罚的是智能“从1到N”的托福问题。
考研工场出产出专科模子之后,模子自己还不是企业能平直破费的商品。企业确凿需要的是踏实API、SDK、权限体系、模子版块经管、监控告警、计量计费和处事保险。
Token工场就是把考研工场产出的专科模子,封装成可调用、可计量、可运营的专科Token。
这里的Token,也不仅仅大模子里的时刻计数单元。按照九章云极的界说,专科Token更接近一种面向业务任务的智能价值单元。不同任务、不同模子、不同处事等第,王人不错通过Token被计量和结算。
产出侧:越用越强,越强越低廉
至此,AI工场的中枢飞轮闭环就此酿成:
DCU度量参预 → 考研工场冶真金不怕火专科模子 → Token工场泛动为专科Token → 企业破费Token并回流业务数据 → 模子抓续迭代
咱们不错把它相识为“越用越强,越强越低廉”的增强回路。在这里,数据不仅是原料,亦然模子进化的营养。
值得注主张是,在这一闭环中,九章云极从头界说了Token。
他们以为,面向破费者的泛化Token单价还是由于市集竞争趋于零,其价值正渐渐见顶。而面向产业的、具有明确 ROI(投资陈述率)的专科Token,才是驱动产业智能化的中枢组件。
九章云极将这些专科Token进行了明晰的价值分层,并将其计谋重点聚焦在后两者:
破费级Token:主要处事于日常AI应用、内容创作,追求极致体验与界限普惠,如同踏实经济的基础电力;专科级Token:封装了行业深度Know-How与格外数据,充任金融风控、质料检测、政务处事的数字内行,保险经过安全、合规,让客户买到服气的遵循与风控价值;前沿级Token:面向复杂任务自动化与科研轻易。举例,封装了多体式、多器用的端到端仿真或科研责任流,平直处事于药物发现、新材料研发、城市级系统优化等也曾不可解或成本极高的科学界限。从租卡到用Token,企业AI开动变轻了
往常企业作念AI,时常是一条漫长的重钞票开辟旅途。
包括多方合作、粗重地在市面上找芯片、对付卡;组建专科的集群运维团队,处罚算力中断、故障收复;搭建复杂的开发与模子考研环境,再进行格外化部署。
这一套经过下来,周期频繁长达6到12个月,还没看到业务成果,前期成本开支还是堆成了天文数字。
而在九章云极AI工场的风景下,针对不同类型的市集玩家,所有这个词接入旅途被澈底变轻、变薄。
针对大模子公司和垂类AI企业:从考研开动
大模子创业公司或者垂直行业的AI领头羊,自身领有极强的算法和数据智商,但时常被算力运维和成本压得喘不外气。
关于这类客户,他们不错从考研工场无缝切入。AI工场提供千卡到万卡级的极致弹性算力集群,不仅保证大界限模子并行考研的高效运行,还提供跨地域改造和故障自愈的底座。
当模子在考研工场中考研、精调、评测完了后,客户无需再折腾复杂的转转运环境,不错平直在云霄一键Token化分发至Token工场。
AI工场不错说是帮这类企业买通了从研发到买卖化上线的这条路,让算法科学家能够将100%的元气心灵聚焦于模子自己。
针对行业客户和SaaS公司:从推理开动
关于绝大大王人金融、制造、政务领域的实体企业和SaaS开发商,他们只怕有必要考研我方底层的基座大模子。他们更现实、更弥留的需求,是在现存的客服、风控、质检或办公系统中,引入熟识好用的行业专科智能。
对他们而言,Token工场提供了一条极轻的破费型旅途:毋庸买卡、毋庸建集群、毋庸招募高尚的底层运维团队。
平台上还是预置了50多款主流基座模子以及多款面向金融、制造、政务、科研等真实场景精调完了的模子,这些模子和智商均已就绪。
企业不错平直调用还是封装好的Token处事,按需破费、按量付费,将千里重的基建投资改造为活泼的运营开销。
往常需要泰半年的神色开辟周期,咫尺若是从调用专科Token切入,最快只需两周把握即可完成业务观点考据。
针对开发者和AI Agent:还有专属进口
针对开发者、科研东谈主员与AI Agent场景,九章智算云打造轻量化算力进口,处罚腹地算力不及、云霄环境繁琐、云尔调试卡顿等行业痛点。
关于AI工程师而言,头疼的日常莫过于代码在腹地,算力在云霄。为了处罚云尔SSH卡顿、环境同步繁琐的痛点,九章智算云还是上线了IDE插件。
咫尺,开发者不错在VS Code、Cursor等常用腹地剪辑器中,已毕直连云霄GPU。开发东谈主员在腹地写下代码,算力平直在云霄跑实验,何况能够凭据任务自动开启和关闭,毋庸不计费。
同期,九章智算云还将陆续推出CLI、SDK以及Skills Hub。无需相识底层复杂的硬件拓扑,使用时通过浮浅的交互即可提交并运行任务使用算力。
与此同期,九章云极在发布会上同步启动智算绽开策动,面向全球开发者、科研团队和高校用户绽开普惠算力,放弃创意与智能落地的阻截。
算力战,咫尺拼的是卖出产力从行业视角来看,九章云极这次发布AI工场,踩中的是智算云市集正在发生的一次转向。
早期,市集拼的是有莫得卡。大模子爆发后,算力穷乏是硬敛迹,谁能提供更多GPU,谁就更有言语权。
随后,竞争开动转向能不可用好卡。算力界限上来后,GPU诓骗率、考研踏实性、跨地域改造、推理成本、异构硬件经管,王人会平直影响有用算力。
咫尺,企业更体恤的是第三件事,也就是能不可把算力确凿托福成业务放胆。
算力是参预,模子是中间产品,Token是产出,业务成果才是最终价值。这亦然AI工场观点最中枢的变化:九章云极莫得把我方只放在算力供应商的位置上,而是试图成为智能出产力的组织者和托福者。
它的念念路不错相识为用DCU界说算力参预,用考研工场出产专科模子,用Token工场开辟智能托福收罗,最终把智能智商送到企业和开发者手里。
诚然,智算云市集不缺巨或者念,最终还要看真实托福。客户会追问的,仍然是几个具体问题:接入是否浮浅?成本是否的确下落?处事是否踏实?账单是否透明?业务成果是否可考据?
尤其是1000倍轮廓降本这么的主张,饱和吸睛,也需要在更多场景里被抓续考据。它背后依赖的,不仅仅硬件堆叠,而是全栈自研OS、算电协同、全局改造,以及围绕考研和推理的系统级优化。
这亦然AI基础设施确凿拉开差距的方位。
长期来看,模子会络续迭代,硬件会络续更新,价钱也会波动。确凿稀缺的,是把算力、模子、Token和业务价值串起来的工程系统。
九章云极这次提议AI工场,敬爱正在于此。把智算云的竞争,从谁有更多算力,推向谁能更踏实、更低成本、更界限化地托福智能。
AI圈开工场了。
接下来要看的,是这座工场能不可的确开足马力。
— 完 —
量子位 QbitAI · 头条号
关注咱们欧洲杯体育,第一时辰获知前沿科技动态
