新書推薦:
《
汗青堂丛书147·光明时代:中世纪新史
》
售價:NT$
388.0
《
能成事的团队
》
售價:NT$
510.0
《
现代无人机鉴赏(珍藏版)
》
售價:NT$
356.0
《
汗青堂丛书·晚清风云(4册套装):帝国的切口 清朝与中华传统文化 太平天国运动史 冲击与回应
》
售價:NT$
1948.0
《
穿在身上的历史:世界服饰图鉴(增订珍藏版)
》
售價:NT$
2540.0
《
历史的严妆:解读道学阴影下的南宋史学(中华学术·有道)
》
售價:NT$
500.0
《
海外中国研究·江南:中国文雅的源流
》
售價:NT$
347.0
《
迟缓的巨人:“大而不能倒”的反思与人性化转向
》
售價:NT$
352.0
|
編輯推薦: |
本书讲述了微软、阿里、、华为、百度等科技巨头,以及科创企业AI技术演进的故事,每个故事都有自己的声音,每个故事都有自己的主角。那些推动技术的人,他们身负伟大任务的托付。他们发出光,我们被照亮。
回顾技术演进史,看到更远的未来。
|
內容簡介: |
在这六年里,我跟踪过许多微妙线索,与超过千余位AI从业者进行了谈话,见证了一段AI的发展,看见了技术风暴。正是AI算力、框架、平台、算法模型的合力创造了AI大模型的成功。在扎实的基建之上,ChatGPT这个“庞然大物”得以横空出世。本书讲述了微软、阿里、华为、百度等科技巨头,以及科创企业AI技术演进的故事,每个故事都有自己的声音,每个故事都有自己的主角。那些推动技术的人,他们身负伟大任务的托付。他们发出光,我们被照亮。
|
關於作者: |
谭婧,科技和科普题材作者,“亲爱的数据”公众号创始人。香港浸会大学硕士,曾负责中国节能集团控股企业战略管理,多年管理咨询经验,曾加入AI人脸识别创业公司创始团队。观察者网特约作者,虎嗅认证作者,36kr特邀作者。
|
目錄:
|
第1章 搞AI框架的那群人(一):AI框架简史
第2章 搞AI框架的那群人(二):燎原火,贾扬清
第3章 搞AI框架的那群人(三):狂热的AlphaFold和沉默的中国科学家
第4章 搞AI框架的那群人(四):AI框架前传,大数据系统往事
第5章 搞AI框架的那群人(五):老师木解读GPT大模型
第6章 那些站在微软云起点的中国创业者
第7章 零售:北极星永远指北
第8章 揭开本质:中国智能供应链走到了哪一步
第9章 DPU的风暴与咏叹调
第10章 超级计算机与人工智能:大国超算,无人领航
附录A 漫画科普ChatGPT,绝不欺负文科生
附录B ChatGPT大火,如何成立一家AIGC公司,然后搞钱
附录C 数据治理,是不是一道送命题
附录D AI人才,需要花多少成本栽培
|
內容試閱:
|
我和AI大模型的缘分,要从2021年元宵节发布的一篇1.4万字的稿子谈起。
《搞深度学习框架的那帮人,不是疯子,就是骗子》这篇稿子发布后,遭遇了冰火两重天,号称见不多识不广的谭老师我,直接傻眼了。
一方面文章在AI、计算机领域百余位专家的朋友圈疯传,我的微信那几天是爆炸状态。
有很多认识的人,疯狂地给我发截图。告诉我这篇文章如何在他们的朋友圈疯传。
一时间,我变成了一个朋友圈截图收集器,哇,好开心。
我看到很多知名人士的转发记录,以及知名人士的群聊记录。
虽未结识,但久仰大名矣。
随后不久,一位叫谢育涛的专家致电我,他告诉我,沈向洋老师想让他代为转达,问我愿不愿意加入IDEA,主要工作是写稿。
IDEA 研究院就是鼎鼎大名的粤港澳大湾区数字经济研究院。谭老师实在水平有限。
虽然这篇文章登上了知乎的周热点,但是评论区翻车了。好一片挖苦讽刺谩骂嘲讽之声。我当时心想,一个人一定是干了什么丧尽天良的事,才配获此“殊荣”。甚至有人说,你不配写科技,你一个女的为什么不去写情感专栏。哇,这真是一个好建议,我怎么没有想到。
言归正传,难能可贵的专家的“批量”转发与部分知乎网友的“尖酸”评价,冰火之别说明了什么?
很有可能说明“吃瓜“群众对于AI系统的认知和真正的专家相比,其分裂程度可能比东非大裂谷还大。
话说回来,世界大型计算机系统令架构师和开发者头疼,难道写这玩意儿的故事的人就不头疼了吗?做难事必有所得,头疼显然是值得的。因为这篇文章,很多知名专家来加微信,和我聊天。一些之前四年写稿攒下的专家资源也愿意把我推荐给“专家”。求之不得,感激不尽。一个月后,也就是2021年3 月,我在杭州阿里巴巴,见到了一位叫杨红霞的AI专家。
看见名字里的“红”字不要怀疑,没错,女科学家。那是一个春光明媚的晴天,湖蓝色玻璃映衬着阿里巴巴特有的橙色装饰,像跳动的钢琴键。远远望见超大的“淘公仔”站在建筑物外墙上咧着嘴笑。杨红霞博士朝我招手,我顺着半圆形的斜坡步行而上,也向她挥手回应。春草茵茵,行李箱轱辘哗哗作响。那次,我们聊的是一款叫作M6 的AI大模型。那天,我们也畅谈了当时火的AI大模型GPT-3。GPT-3 在2020年6 月10 日发布,给中国玩家的触动很大。
更直白些,中国AI科学家有压力。
阿里巴巴的会议室多得像森林里的树木,终于坐下,一张桌子,两杯咖啡。杨红霞博士扎着利落的马尾,额前干净,没有刘海,少量碎发。她说起话来,爽爽快快,普通话极为流利标准。她告诉我:“我实话跟你说,为什么会回国?”她的答案真好,连标点符号里都流露出温柔的真诚与强烈的技术愿景,她说:“我喜欢的技术是从复杂的业务里抽象出来,用技术去解决实际问题。我不喜欢走反过来的路,假如走反过来的路,我可以选择去研究型的高校。所有人都要有一些耐心,没有耐心,永远只有单点的结果,很难去实现线和面。”
当天的独家专访的主要内容有以下几点。,如今的深度学习模型已经不能满足我们的更多要求了。说白了,可能这个算法模型刚出现的时候只能满足一些特别低的要求,慢慢地,我们会越来越接近通用AI,要求的高度肯定越来越高。第二,阿里巴巴希望在一些很重要的核心方向上,尤其是在支撑AI的下一个阶段的技术和产品上,可以做到。第三,其他技术细节。可以看出,阿里巴巴很早就认得清下一代AI的价值,他们也很早出发了。谈话的后,杨红霞博士请我品尝了阿里巴巴食堂的鸭血粉丝汤,挺好吃的。
夜幕降临淘宝城,我明白了中国的AI科学家们在思考:在下一代AI的浪潮当中,中国到底哪些技术可以作为世界?在与杨红霞博士面谈之后,我又和几位技术大佬聊过。贾扬清(原阿里巴巴技术副总裁),林伟(原微软硅谷研究院研究员,阿里云机器学习PAI平台负责人),曹政(原阿里云基础设施事业群资深技术专家),他们分别代表不同的三层:框架、平台和云基础设施。再算上杨红霞的模型算法团队。一个AI大模型汇集了如此多的大佬。可以看出,对于AI大模型,阿里投入的是整建制的团队,调动的不只是达摩院的力量。所以,才会有M6 大模型的问世。这基本上是制造大模型的标准打法,多个团队“共建”一个模型。
我前后与多位AI从业者长达几十小时的促膝长聊之后,清楚地理解,想做出AI大模型(那时候还没有ChatGPT),仅靠一支算法团队远远不够。大模型团队是由几支分别擅长不同领域(AI算力、AI框架和AI平台)的技术团队合力而成。因为一些外力,我和杨红霞博士的故事就在这里戛然而止了,那次采访没有出稿。2023年春节前后,我得知杨红霞博士已经去了今日头条。此后,所有人问起我关于她离职的消息,我都三缄其口。
我们聊回ChatGPT 这类AI大模型。这么重要的特大工程,底层能不重要吗?需要解释一下,在互联网大厂,底层是共用的。阿里巴巴如此,华为、腾讯、百度,皆如此。底层软件的重要性无须多言,这里面有很多“置之死地,方可后生”的故事。我很激动地见证了AI软件的故事“讲述”到今天,也期待中国软件能够走在“长期主义”的大道上。
回到ChatGTP,AI算力、AI框架、AI平台、AI算法模型合力创造了AI大模型的成功。
某AI大佬曾谈到:“观察硬件和算力平台,如果没有某国的捣乱,整体而言,我们的硬件计算能力、计算量,以及就是说我们的一些底层的核心技术,比如说像高性能网络、高性能存储、异构计算,等等。在国际上,大家的能力拉平,大同小异,更多是在强调怎样用好这些资源。”在基建扎实的基础上,ChatGPT 这个“庞然大物”横空出世。AI新基建的范畴在变大。一开始,GPT 系列大模型不是基建。2023年,GPT-4 大模型已经是新基建的一部分了。在ChatGPT 引领的这一产品架构下,应用和底层大模型的联动十分紧密。
也就是说,大模型也是基建。
今天看来,AI大模型可以被看作是电,我们要有自己的发电厂。
接下来,无论是大玩意儿,还是小玩意儿,我们把大模型的应用玩起来,耍起来,发展起来。某种意义上,AI大模型的奇点已过,通用AI的火花闪烁。国内有多个团队争夺大模型的高地。万一追不上怎么办?那很有可能,一家独大,大家全挂。换句话说,假如美国OpenAI公司和微软公司赢家通吃,这里的赢家只有一家(一对),那会发生什么样的事情?这样的话,可能很大一堆产业只能多成为依附在巨头API 上的服务商。这可太糟了。好消息是,先进技术领先的时间窗口非常短暂。坏消息是,“赢家”的布局超级迅猛。
这也反映出他们自知领先时间并不是那么多,也有很强的危机感。
中国AI大模型创业者们在焦虑中临机制变。昔日我笔下的“骗子”已不知去向,而“疯子”在太阳升起的地方,沐浴着金色而悠远的晨光,再次出发,留给地平线崭新的背影。
在这六年里,我跟踪过许多微妙线索,与超过千余位从业者进行了谈话,有些人只和我简单说了两句;有些人则让谈话进行了数年。
有机会见证历史一刻,可真激动。衷心感谢大家拨冗与我交流。
“保持联系。”我在微信对话框里写道。
科技专栏作者,谭婧
|
|