AI学什么(第16期):AI大模型背后的权力游戏
大家好,我是蓝衣剑客,欢迎来到「AI学什么」——一个专注于AI科普的栏目。这个栏目的宗旨是用最精彩的故事,讲述最硬核的知识。在这里,你将看到深入浅出的AI技术解析,既不会被枯燥的技术细节困扰,也不会停留在肤浅的概念层面。通过生动的类比、通俗的语言和完整的故事,帮助你在轻松阅读中掌握那些看似难以理解的AI知识,培养应对AI时代的认知能力。无论你是AI领域的新手,还是希望加深理解的从业者,这里都能为你提供清晰的知识和新的思考角度。
公元前2580年,埃及法老胡夫站在尼罗河西岸,凝视着正在建造的那座将要定义他永恒权力的巨大建筑。高146米的金字塔工程,动用了约10万名工人,历时20年才最终完成。每一块石头都重达2.5吨,需要从远方采石场运输而来。为了支撑这项浩大工程,整个埃及王国的资源都被调动起来:成千上万的农民在尼罗河泛滥期被征召为建筑工人,无数工匠日夜不息地切割、搬运巨石,庞大的后勤体系确保食物、工具和材料的持续供应。
法老胡夫深知一个秘密:真正的权力不在于技术的精巧,而在于动员史无前例资源的能力。没有绝对权威,没有整个王国的财富积累,没有数以万计的劳动力,再精妙的几何设计也只能停留在草图上。
现代大语言模型的建造,就像古代的金字塔工程,门槛在于获取和动用史无前例的资源规模,技术构想的创新反倒成了配角。训练一个GPT-4级别的模型,需要消耗数万块更先进的GPU,训练成本估计超过1亿美元。这些AI的现代金字塔,同样需要庞大的石料(数据)、无数的工人(GPU算力)和巨额的国库(资本投入)。
在英伟达位于加州圣克拉拉的总部大楼里,有一面被称为荣誉墙的展示区,上面陈列着历代GPU芯片的进化史。从1999年之一款GeForce 256,到今天的H100,每一代芯片性能的跃升都让前一代相形见绌。但外行人不知道这些不起眼的小玩意儿正在成为AI时代最珍贵的资源。一块最新的H100 GPU,截至2025年初市场价格超过4万美元,在某些地区溢价超过50%,比一辆宝马3系还贵。
另一端,谷歌在欧洲某处的数据中心里,25000块H100被整齐地排列在机架上,每块芯片都在以每秒数万亿次的速度进行数学运算。这些硅基劳工不知疲倦,24小时不间断地工作,它们的任务只有一个:让AI学会预测下一个词。就像古埃及工地上那些日夜不息的石匠,只是现在的石匠变成了电子的。
这种算力需求的规模是前所未有的。以GPT-4o为例,虽然OpenAI没有公开具体的算力消耗数据,但根据行业分析,其训练成本估计在1-2亿美元之间,需要数万块H100 GPU协同工作数月之久。训练过程消耗的算力相当于数千万亿次浮点运算,这相当于一个人用计算器不停按键数十万年的计算量。
这种巨大的算力需求造就了一个奇特的现象:在AI公司的财务报表中,更大的开支竟然是云计算费用,人力成本反倒退居其次。OpenAI每天的运营成本据估计超过100万美元,其中绝大部分都花在了GPU租赁和多模态数据处理上。这相当于每天烧掉一套超级豪华别墅的钱,只为了让AI能够与用户进行文字、图像和语音的全方位对话。
就像古代拥有更多士兵的王国具有压倒性优势,算力的稀缺性重新定义了AI公司的竞争力。这解释了为什么微软、谷歌、Meta这些科技巨头都在疯狂地采购GPU,建设自己的数字军团。
训练GPT-4o级别的大模型所消耗的电力,据业界估计足够为数万个家庭供电数月。如果算上数据中心的冷却系统,这个数字还要翻倍。有研究预测,到2030年,全球AI训练所消耗的电力将占到全球总发电量的1-2%。更令人担忧的是,这种能耗还在急剧增长。根据专家估计,AI行业的总电力消耗每年增长30-50%。
能耗问题也在重塑数据中心的选址策略,就像古埃及法老会选择在尼罗河岸边建造金字塔以便运输石材一样。越来越多的AI公司开始将计算中心建在电价便宜、气候凉爽的地区:北欧的挪威和冰岛成为热门选择,这里的水电资源丰富,气候寒冷,大大降低了冷却成本;美国的俄勒冈州和华盛顿州也因为廉价的水电而吸引了大量数据中心投资。
训练一个大语言模型需要多少数据?还是以4o为例,业界估计其使用了超过10万亿token的训练数据,包括文本、图像和音频数据。这相当于存储数百万本书籍加上数百万张图片和大量音频资料的信息量。
这些数据来自互联网的每一个角落:的条目、新闻网站的报道、论坛里的讨论、博客上的文章、GitHub上的代码、学术论文的档案库、图像数据库、音频资源......几乎包含了人类在数字时代留下的所有多媒体信息痕迹。
但并不是所有数据都具有同等价值,就像不是所有石头都适合建造金字塔一样。AI公司必须从互联网的海量信息中挑选出高质量的数据。什么是高质量?准确的事实、规范的语法、清晰的逻辑、丰富的知识...这些标准听起来简单,但实际操作却极其复杂。
另外,数据清洗是一个庞大的工程。之前,OpenAI雇佣了数千名标注员,他们的工作是阅读、评估和筛选文本内容。这些标注员大多来自肯尼亚、菲律宾等发展中国家,时薪只有2-5美元,却承担着为AI喂食的重要任务。他们就像古埃及的石匠,负责将粗糙的原料加工成适合建造的精品。
数据的稀缺性正在日益凸显。互联网上高质量的英文文本是有限的,据行业分析估计,整个英文互联网的文本数据只能支撑5-10个GPT-4o级别模型的训练。更严峻的是,GPT-4o这样的多模态模型还需要大量的图像和音频数据,这进一步加剧了数据稀缺性。这意味着,随着越来越多的公司进入AI赛道,高质量的多模态数据将成为比算力更稀缺的资源。
这个游戏还在不断加码。根据AI领域的scaling law(规模法则),模型的能力与其规模成正比。这意味着,如果你想让模型更聪明,就必须投入更多的算力、数据和资金。GPT-5的训练成本可能达到10亿美元,而GPT-6可能需要100亿美元。这种指数级增长的投入要求,正在将AI研发变成一场只有科技巨头才玩得起的游戏。
就在这种背景下,一个史无前例的超级计划正在悄然酝酿。2025年1月,OpenAI、软银和甲骨文联合宣布了一项名为星际之门(Stargate)的基础设施计划,预计投资高达5000亿美元。这个数字是什么概念?它相当于整个美国2024年国防预算的约56%,足以建造10个巴拿马运河,或者购买整个特斯拉公司。
而星际之门计划的核心目标是建设下一代AI基础设施,包括超大规模的数据中心、先进的芯片制造能力,以及支撑AGI(通用人工智能)发展所需的一切硬件设施。这个计划分为多个阶段,首期就将投入1000亿美元在美国本土建设数座超级数据中心,每座数据中心的规模都将是目前更大AI训练设施的10倍以上。
这实际上是一场关乎国运的数字曼哈顿计划。美国 *** 对此给予了前所未有的支持,不仅提供税收优惠和土地使用权,还承诺简化审批流程,确保项目能够快速推进。
星际之门计划的野心远不止于此。它试图建立一个完整的AI产业链闭环,从芯片设计、制造,到数据中心建设、模型训练,再到应用开发和商业化,形成一个自给自足的AI帝国。这种垂直整合的策略,就像当年的贝尔实验室或者苏联的核工业体系,都是举国之力打造的超级工程。
目前,全球只有少数几家公司有能力独立开发更先进的大语言模型:OpenAI(微软支持)、谷歌、Anthropic(谷歌投资)、Meta、中国的百度、阿里巴巴...这个名单不超过20家公司。而星际之门计划的出现,可能进一步缩小这个圈子,让AI的顶级游戏变成寡头竞技场。
这种权力集中产生了深远影响。OpenAI的一次模型更新,可能决定无数创业公司的生死;Meta的开源决策,可能重塑整个AI生态的竞争格局。
更深层的担忧在于,这些AI法老掌控的范围远不止技术本身,它们实际上在制定AI的伦理标准和发展方向。它们决定AI应该拒绝回答哪些问题,应该如何处理敏感话题,应该偏向哪种价值观。这种权力比传统的商业垄断更加深远,因为AI将成为人类获取信息、做出决策的重要工具。
听完我讲述这些事情,如果你站在胡夫金字塔面前,或许会有不同的感悟。这座石头建筑的确展示了古埃及文明的伟大成就,但它同时也见证了一个事实:决定文明进程的,是技术、资源和权力的复杂互动,单纯的技术创新反倒只是其中一环。
今天的AI革命也是如此。当我们被ChatGPT的智能回复震撼,被AI艺术作品的美感打动,被自动驾驶汽车的精确操控折服时,我们看到的是技术的表象。但在这些闪耀光芒的背后,推动历史车轮的,是对算力、数据和资本的控制与争夺
但历史告诉我们,没有任何统治是永恒的。古埃及的法老王朝最终消失在历史的长河中,他们的金字塔虽然依然矗立,但权力早已灰飞烟灭。
标签: 百科栏目
相关文章
-
行业新闻_智能设备_运动_汽车_智慧出行频道_天极网详细阅读
5月25日,小米生态链推出米兔卡片学习机,这是一款为年轻家长提供宝宝家庭教育的工具,那么它都能做什么呢? 5月2...
2025-08-26 7 百科栏目
-
中国传统文化推广代表性人物周亿萱的百科介绍详细阅读
周亿萱她是令人敬佩的新时代非遗文化传播大使,她是周氏集团第七代掌门人,也是非遗玉香融合开创者!故宫博物院玉器修复顾问、非遗玉香融合项目...
2025-08-25 6 百科栏目
-
上新!来自China Daily的“风物百科”到底藏了多少惊喜?详细阅读
在信息爆炸、节奏飞快的当下,China Daily推出了一个非常有意思的专栏——“Far and Wide”《风物图志》 ,用“慢镜头...
2025-08-25 6 百科栏目
-
乡村季风_农科频道_山东网络台_齐鲁网详细阅读
《乡村季风》是农科频道核心优质资源,国内首屈一指的品牌农业栏目,被誉为中国农业栏目的常青树。开播二十年来,时刻保持与时代同行,与世界同...
2025-08-24 7 百科栏目
- 详细阅读
-
百科真题重庆中考百科真题详细阅读
①心理学家在研究中发现,不同的读者在阅读时会在脑内对文章信息进行不同的加工编码。通俗地说,即读者会采取不同的策略进行阅读。其中一类策略...
2025-08-24 6 百科栏目
发表评论