news 2026/6/28 2:13:07

第一个:算力——让AI有了有力的工具。

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
第一个:算力——让AI有了有力的工具。

同样烧开一壶水,用电磁炉5分钟搞定,用蜡烛可能得烧到明天。

AI的算力,就是电磁炉和蜡烛的差别。

电脑芯片,从几十纳米,到如今的几纳米,能力越来越强。强大的算力,让AI的训练,从几年变成几个月乃至几周。大模型的突然爆发,也有能理解了。

因为硬件终于跟上了。但"硬件跟上"这四个字,也并非一路坦途。

2012年之前,AI研究主要用的还是CPU,训练一个图像识别模型可能要好几天。2012年AlexNet证明GPU(显卡芯片)并行计算能力远超CPU之后,NVIDIA顺势成为AI时代最重要的基础设施公司,GPU从游戏设备变成了AI训练的"标配"。2017年Google推出TPU(张量处理器),专门为深度学习设计,进一步拉高了算力上限。

算力的飞速增长带来了一个直接结果:训练大模型的成本在持续下降。

2017年训练一个中等规模的语言模型可能需要几十万美元;2020年GPT-3的训练成本据传已经接近千万美元级别;到了2024年,DeepSeek-V3用约600万美元的训练成本,做出了性能接近GPT-4o的模型,这个成本在几年前是不可想象的。

成本下降意味着更多公司有能力训练自己的大模型,而不是只有资金雄厚的巨头才能玩得起,这也让更多的企业,可以独立部署自己的AI,来规避数据泄露的可能。

算力的提升,让AI商业化之路,变得轻松。

第二个:数据——让AI有了充足的燃料。

老话说"巧妇难为无米之炊"。再厉害的厨师,没米也做不出饭。

AI也一样,再强的算力,再好的算法,没有数据也训练不出什么结果来。

互联网三十年积累了大量人类语言、图片、视频等等数据。ChatGPT读了几乎整个互联网的文字,你让DeepSeek帮你写方案,它能写出来,是因为它肚子里有足够多的素材。

但数据的故事不只是"量多"这么简单。

首先是规模。GPT-3用了约3000亿个token(词元)训练,DeepSeek-V3用了约14.8万亿token。读得越多,知识覆盖面越广,理解能力越强。

其次是质量。互联网上的数据是"有杂质"的,广告文案、网络吵架、无意义的水帖充斥其中。顶级AI实验室会花大量时间做"数据清洗"和质量筛选,从海量原始数据中挑出真正有价值的部分。

再次是多样性。单一来源的数据会让AI产生偏见,AI需要接触不同语言、不同领域、不同视角的数据,才能发展出更平衡的理解能力。

最后是"后训练"数据。大模型预训练完成后,还需要通过高质量的指令数据、人类反馈数据做进一步调优——这一步叫RLHF(基于人类反馈的强化学习),正是ChatGPT在2022年引爆行业时最核心的技术突破之一。预训练让AI"见过世面",RLHF让它"懂得规矩"。

没有数据,再强大的版图,再好的算法也只能空转。

第三个:算法——让AI有了高效的能力。

有火有米,要想做出好吃的饭,还得有食谱。

AI要想真正智能起来,就需要一套高效的算法,这就是AI的"食谱":规定好每一步怎么做、火候怎么掌握。

而这个算法的发展,也是在经历了几个关键节点后达到现在的水平。

符号 AI 时代(1950s-1980s):科学家们试图用明确的规则让机器"推理",比如"如果下雨,就带伞"。规则越多越复杂,但遇到没有预设的情况就完全失效。

连接主义崛起(1980s-2010s):让机器通过大量数据自己总结规律,而不是靠人工写规则。1986年反向传播算法(Backpropagation)的完善让深度学习成为可能,但受制于当时的算力和数据,发展缓慢。

2017年:Transformer登场。Google发表了论文《Attention Is All You Need》,提出了Transformer架构。这个架构让AI第一次能高效处理超长序列的数据,同时也让并行计算成为可能,直接催生了后来所有大语言模型。

可以这么说:没有Transformer,就没有ChatGPT,也没有今天的AI大模型。

2022年后:工程化的力量。算法不只有"架构"创新,训练方法、工程优化、推理加速……这些"工程化"的工作同样关键。DeepSeek之所以能震惊全球,不只是因为架构好,更是因为它用更少的算力和数据,通过一系列工程优化,做出了不逊于GPT的效果。这就相当于用更小的火、更少的米,按照更好的食谱,做出了一样好吃甚至更好吃的饭。

没有算法,再多数据和算力,也无用武之地。


今天的AI:它到底是什么?

说了这么多历史和技术,那到底应该怎么理解AI?

AI是Artificial Intelligence的缩写,也就是人工智能,是一项让机器具备人类一样的感知、理解和决策能力的技术。

它的核心就两点:

  1. 它不是魔法,是基于数学和算法的技术

  2. 它的目标是模仿人类智能的某些方面,而不是复制一个完整的人

它不需要有情感、有自我意识。它的"智能"体现在,做到以前只有人类才能做到的事,甚至超越人类。比如识别图片、能听懂你说的话、能生成文字和图片、能帮你做分析做决策。具体到我们的工作场景,AI现在能帮你做到:

  • 写作:写邮件、写方案、写总结、写代码,帮你从0到1

  • 分析:读懂数据、找出规律、给出建议,帮你做判断

  • 搜索:帮你找资料、总结要点、翻译成大白话

  • 创作:生成图片、海报、文案,帮你做创意

  • 客服:24小时在线,自动回答问题,帮你省人工

你可能会说:这些听起来好像也没什么了不起?

但关键在这里:以前这些事,你得花钱请人、花时间培训。现在,一个AI工具,几秒钟就能做,而且24小时不休息。

AI真正厉害的地方,不是某个功能有多惊艳,而是它把以前"很贵的事"变成了"很便宜的事"。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/28 2:11:34

MrRSS | 基于 AI 的 RSS 阅读器

链接:https://pan.quark.cn/s/8381b883481d基于 AI 的 RSS 阅读器,集成先进 AI 技术,赋能翻译、摘要、推荐等多种功能,支持 URL、XPath、脚本、Newsletter 等多种订阅源类型,支持 Obsidian、FreshRSS、RSSHub 等主流工…

作者头像 李华
网站建设 2026/6/28 2:07:39

P1423 小玉在游泳 题解

题目 小玉在游泳 —————————————————————————————— 题目描述 小玉开心的在游泳,可是她很快难过的发现,自己的力气不够,游泳好累哦。已知小玉第一步能游 2 米,可是随着越来越累,力气越来越…

作者头像 李华
网站建设 2026/6/28 2:07:25

HTTP协作的Web服务器

这篇文章解决什么问题我们平时访问一个网站时,直觉上会以为浏览器直接连到了目标服务器。实际情况往往更复杂:请求可能先经过代理服务器,也可能经过网关、隧道、缓存服务器,最后才到达真正保存资源的服务器。这一章主要讨论的就是…

作者头像 李华
网站建设 2026/6/28 2:00:18

程序员本地开发手机调试连接失败问题

在Win10电脑 开发程序,使用Nginx 代理80端口对外开放。让同局域网,手机、电脑 等设备能访问到开发的程序。前端Vue后端SpringBoot 在Nginx 配置的 开发电脑ipv4地址出现的问题 开发电脑能通过ipv4访问到项目;同局域网手机电脑访问不到&#x…

作者头像 李华
网站建设 2026/6/28 1:59:54

时空协同智能感知 零断点跨镜追踪实现全场景安全智控技术方案

方案出品单位:镜像视界浙江科技有限公司适用场景:智慧军营、智能矿山、港口口岸、司法监所、产业园区、危化能源、交通枢纽、城市综治一、方案概述当前国内全域安防与空间管控领域,长期存在视域孤岛割裂、跨镜追踪断链、盲区管控空白、有源定…

作者头像 李华
网站建设 2026/6/28 1:54:29

FCFS 调度算法:操作系统里最朴素的公平

FCFS 调度算法:操作系统里最朴素的公平 先来后到,最简单的调度,也是所有调度的起点。 一、调度的本质是排队 操作系统里,CPU 只有一个,进程却可能挤破头。 当多个进程同时就绪,谁先用 CPU?这就…

作者头像 李华