生成式 AI 之后,计算架构的一些不成熟设想
我最早接触计算机,是在 Apple II 时代。
打开机器之后,屏幕上只有一个 BASIC 提示符。程序直接运行在机器上,没有操作系统,也没有所谓的"应用软件"。
很多年后我才意识到,那其实是一种完全不同的计算时代。
最近几年生成式 AI 的发展,让我产生了一种非常熟悉的感觉。
它让我想起了那个时代。
这篇文章只是一些非常粗略的想法。
如果这些假设是成立的,那么 AI 时代的变化
可能不仅仅发生在模型本身,
还会发生在:
- 计算硬件
- 企业软件架构
- 软件工程
- 用户界面
支 持 本 站: 捐赠服务器等运维费用,需要您的支持!
篇一:历史的隐喻,AI 正在经历它的"386 时刻"
我个人接触计算机比较早,最初是在 Apple II 时代。当时打开机器就是 BASIC 提示符,程序直接运行在机器上。后来到了 DOS 时代,系统的特点非常明显:单任务、内存限制极其严格,且程序直接控制硬件。
这和早期的基础大语言模型非常相似:只能进行单线程的文本输入输出,受限于极短的上下文窗口,开发者需要手动管理状态,一不小心就会"内存溢出"(也就是模型产生幻觉)。
转折点发生在 386 处理器和保护模式的普及。386 架构带来的"保护模式"和"虚拟 8086 模式",不仅实现了多任务调度和内存管理,更重要的是它在硬件级别隔离了不同程序的运行环境。这意味着一个程序的崩溃不再会轻易导致整个系统死机。
AI 的"操作系统"与"保护模式"
最近越来越多的人开始用一种有趣的隐喻来描述大模型:
LLM 就像一种新的操作系统。
在这个类比里:
- 模型本身像 CPU
- 上下文窗口像 RAM
- 工具调用(tool use)像系统调用
更为关键的是,随着自主 AI 智能体(Agent)的崛起,这些智能体会自主编写并执行代码。如果让它们在宿主环境中裸奔,将带来灾难性的安全风险。因此,业界正在引入类似当年 386 的"保护模式",也就是"智能体沙盒化"(Agentic Sandboxing)。例如,目前前沿的 Kubernetes 沙盒控制器可以利用 gVisor 等技术为执行不受信任代码的 AI 智能体创建严格隔离的容器环境。这就如同当年的 Windows 3.0 依靠硬件分页和特权环实现了应用隔离一样,是 AI 走向多任务并发操作平台的核心基石。
篇二:算力重构与边缘计算的突围,打破"内存墙"与小模型的春天
当我们在云端享受 LLM 带来的便利时,背后的计算基础设施却在承受巨大的物理瓶颈。
打破"内存墙"的新架构
现在的传统 GPU 集群算力虽然强,但在处理大模型推理时,绝大部分的时间和功耗都浪费在了把庞大的模型权重数据从外部显存搬运到计算核心上,这就是业界所谓的"内存墙"。
为了突破物理极限,半导体行业出现了一批偏离传统封装路线的新型架构。比如 Cerebras Systems 推出的晶圆级引擎(WSE-3)。它不再将晶圆切割成小芯片,而是在一整块硅片上集成了 4 万亿个晶体管和高达 44GB 的片上 SRAM,提供了惊人的每秒 21 拍字节(PB/s)的内存带宽。
如果模型权重可以直接驻留在片上存储中,
推理时的数据搬运就会大幅减少,
延迟也可能因此显著下降。
NPU 与端侧小模型(SLM)的爆发
在个人消费端,未来的趋势不是盲目调用云端的万亿参数模型,而是"智能微缩"。目前,参数在几十亿以内的小型语言模型(SLM)不仅足以处理 70-90% 的日常推理任务,还能直接运行在个人电脑和移动设备上。
这得益于神经网络处理器(NPU)在现代 AI PC 中的全面普及。NPU 能够在极低的功耗下高效处理 AI 数据吞吐。通过在本地执行任务,用户不仅获得了"零延迟"的极致响应体验,还从根本上保障了数据主权,你的隐私数据永远不会离开你的设备。
篇三:企业 AI 的分水岭,算力经济学与自动化的"数据飞轮"
对于企业级应用来说,技术选型不仅关乎酷炫的功能,更关乎投资回报率(ROI)、总体拥有成本(TCO)以及商业机密的安全性。
为什么不能只靠云端 API?
依赖公共云端的通用大型语言模型 API,面临着难以控制的持续订阅成本和严峻的数据泄露风险。企业核心业务的未来,一定是建立在私有基础设施之上的。
自动化的"数据飞轮"
企业 AI 架构的成熟方向,是构建基于本地小模型的"数据飞轮"。系统会自动摄取企业内部的文档、客户工单和私有代码,对本地化的 SLM 进行持续的微调(Fine-tuning)。
这种策略的商业收益是惊人的。以英伟达内部的员工支持 AI 智能体为例,他们通过数据飞轮方法微调了 1B 到 8B 规模的私有小模型,在企业内部业务路由的准确率达到了 94% 到 96%,完全媲美 700 亿参数的通用大模型。更关键的是,这种方案使得推理成本降低了惊人的 98%,延迟降低了 70 倍。将数据留在本地,用私有数据持续训练专属模型,这才是企业在 AI 时代建立核心护城河的方法。
篇四:软件工程与交互的终局,AI 编译器与生成式 UI
在前几篇文章中,我们讨论了架构、硬件和企业部署。在这最后一篇,我们来看看离开发者和用户最近的两层:代码是如何被生成的?界面是如何被呈现的?
自然语言作为最高阶的编程语言
传统的编译器遵循严格的语法,将人类代码转换为机器码。而今天,自然语言正在成为最顶层的编程语言,大模型则化身为"概率编译器"。前沿的 AI 编码智能体(如 Devin)不仅仅是帮你自动补全代码,它们能在沙盒环境中自主规划架构、编写代码,甚至通过读取传统编译器的报错日志,进行自我回溯和补丁修复。当大语言模型与严格的编译器反馈机制深度耦合,"基于提示词的编程"正在走向"工业级的软件工程"。
从 UI 到用户意图(User Intent)
生成式 AI 的成熟,正在引发人机交互界面的一场根本性颠覆。2025 年的趋势表明,系统设计哲学正在从传统的 User Interface(UI)向 User Intent(用户意图)跨越。
未来的界面不再是设计师提前硬编码好的静态视图。相反,系统通过 AI 主动理解你想要什么,然后在屏幕上为你实时生成互动式的组件(Generative UI)。目前 Google 等团队已经在实验让 AI 根据用户的提示词,瞬间生成包含 HTML、CSS 和动态图表的定制化完整应用体验。不仅如此,视觉 Web UI 还会与环境感知的语音交互无缝融合。
你只需自然地表达目标,软件就会为你"量身定做"出最合适的界面。
结语

从 80286 跨越到 80386,从本地单机跨越到多任务并发的云计算,技术世界真正的范式转移总是来自计算架构的改变。
今天旨在打破物理瓶颈的晶圆级芯片、在本地安全沙盒中执行任务的智能体、动态多模态的生成式 UI,以及企业级的自动化数据飞轮,共同构成了下一代计算纪元的核心框架。
之所以把今天类比成 DOS,而不是 Windows 3.0、互联网 1995 或 iPhone 2007,是因为我们仍处在"能力已出现、范式未定型"的早期阶段。
简单说,当前阶段更像 DOS,主要有四个特征:
- 功能粗糙:很多能力惊艳但不稳定,边界条件下仍容易失真或退化。
- 接口原始:提示词和工作流仍偏"命令行心智",离普适、直观的交互范式还有距离。
- 工具链混乱:模型、框架、评测、部署标准快速迭代,但尚未形成稳定工业基线。
- 应用生态刚开始:爆款场景在出现,但大规模、可持续、可复制的应用生态还在早期建设中。
换句话说,我们已经看见了新时代的轮廓,但还没走到"平台成熟、生态爆发"的中后段。
也许几十年后回头看,
今天的生成式 AI,
可能只是那个时代的
DOS。
参考资料与扩展阅读
文中引用的前沿数据与技术洞察,来源于以下行业实践与研究报告:
- 关于 80386 的虚拟 8086 模式与沙盒化隔离:可参考其处理隔离多任务的经典架构历史,以及目前 Kubernetes 生态中利用 gVisor 等实现智能体沙盒隔离的最新实践。
- 大语言模型的"操作系统"隐喻:Andrej Karpathy 关于 LLM 作为新型 OS,以及上下文窗口等同于主内存的论述。
- 打破"内存墙"与 Cerebras 架构:关于 WSE-3 晶圆级芯片突破传统 GPU 带宽瓶颈的数据详见其技术解析。
- NPU 与端侧小模型(SLM):关于 NPU 如何极大提升边缘计算中本地模型推理效率的探讨。
- 企业 AI 与数据飞轮经济学:关于持续微调闭环(Data Flywheel)的概念,以及英伟达内部应用小模型实现 98% 成本降低和 70x 延迟优化的真实案例。
- 生成式 UI(Generative UI)与用户意图:从传统 UI 向 User Intent 演进的行业趋势,以及 Google 团队关于即时生成全功能互动界面的最新研究。
引用文献
1. What is Cerebras? - Pangea, https://pangea.app/glossary/cerebras
2. Cerebras CS-3: the world's fastest and most scalable AI accelerator, https://www.cerebras.ai/blog/cerebras-cs3
3. NPU vs GPU: Key Differences for AI PCs - HP Tech Takes, https://www.hp.com/us-en/shop/tech-takes/npu-vs-gpu-ai-pcs
4. Devin | The AI Software Engineer, https://devin.ai/
5. 2025 UX Trends - The Evolution from UI (User Interface) to UI (User Intent): A New Era in Human-Agent Interaction - Prof. MING WEN, https://donwen.medium.com/2025-ux-trends-the-evolution-from-ui-user-interface-to-ui-user-intent-a-new-era-in-a0ac085f0d2b
6. Generative UI: A rich, custom, visual interactive user experience for ..., https://research.google/blog/generative-ui-a-rich-custom-visual-interactive-user-experience-for-any-prompt/
7. Generative UI Guide 2025: 15 Best Practices & Examples - Mockplus, https://www.mockplus.com/blog/post/gui-guide
8. What are the "virtual machines" that were running on 80386 and later x86 CPUs before full hardware virtualization? - Retrocomputing Stack Exchange, https://retrocomputing.stackexchange.com/questions/23617/what-are-the-virtual-machines-that-were-running-on-80386-and-later-x86-cpus-be
支 持 本 站: 捐赠服务器等运维费用,需要您的支持!
留言簿