导读:一个多月前,商汤科技参与编写的《人工智能基础(高中版)》成功刷了一些人的屏。 这本给高中生的人工智能选修教材让许多人惊诧:现在高中生都这么前沿了么?甚至在海外,也有许多网友将其视为中国AI进一步崛起的一个证明。 所以,我们怀着给自己的高中生涯补课的心态,通读了这本给高中生的AI教材。
作者:郭一璞
来源:量子位(ID:QbitAI)
01 这本书写了什么?
相信这本书的目录已经有很多朋友见过了,这里简单介绍一下每个部分的内容,看不懂的同学可以直接跳到下一段:
第一章 人工智能: 新时代的开启
1.1跨越时空: 铭铭的一天
1.2光辉岁月: 人工智能简史
1.3百花齐放: 人工智能在各行各业的应用
1.4初露真容: 人工智能与机器学习
1.5本章小结
第一章主要是基础知识,介绍了人工智能的应用、上世纪50年代以来的三波人工智能发展浪潮,以及机器学习的简单概念。
和许多其他学科的课本一样,第一章非常简单,几乎没有任何技术方法的内容。
第二章 牛刀小试: 察异辨花
2.1初学乍练: 分类任务
2.2含英咀华: 提取特征
2.3分门别类: 分类器
2.4实践出真知: 测试和应用
2.5五花八门: 多类别分类
2.6大显身手: 二分类在生活中的应用
2.7本章小结
第二章算是正式开始讲技术原理了。编者先从变色鸢尾和山鸢尾两种植物的分类入手,引入特征提取、分类器判断的过程,详细讲了特征提取是什么、如何把特征总结为特征向量、如何训练分类器、感知器学习算法、损失函数以及支持向量机。
之后,再把二分类延伸到多类别分类,介绍了这类技术在相机人脸检测和癌症监测中的应用。
第三章 别具慧眼: 识图认物
3.1温故知新: 基于手工特征的图像分类
3.2另辟蹊径: 基于深度神经网络的图像分类
3.3“网”不厌深: 深度神经网络的发展与挑战
3.4忽如一夜春风来: 图像分类在日常生活中的应用
3.5本章小结
第三章里,深度学习和卷积神经网络终于出现了,这对于笔者这样一个假理科生来说,需要集中精力反复翻阅才能大致看个明白,其中的一小部分,比如梯度,则压根看不懂是什么。
作为以识图为主要内容的一章,编者在这本书里先介绍了计算机图像的RGB格式,引入了三阶张量的概念,之后补充关于卷积运算的数学基础知识,介绍了用卷积提取图像特征。
后面则是对深度神经网络的具体介绍,卷积层、全连接层、归一化指数层、非线性激活层、池化层这些概念得到了一一介绍。
此外,这一章里编者也补充了关于深度神经网络的一些其他知识,比如ImageNet多年以来准确率的不断提升、数据与计算能力对神经网络 发展的限制、过拟合与欠拟合,还有笔者完全没看懂的梯度消失。
最后,作者以人脸识别为例,介绍了图像分类与深度学习在社会中的应用,比如门禁、刷脸支付、安防等。
第四章 耳听八方: 析音赏乐
4.1洗耳恭听: 听声的艺术
4.2丝竹管弦: 音乐风格分类
4.3言听计从: 语音识别技术
4.4听声辨曲: 乐曲检索技术
4.5本章小结
相比前一章图像分类,音乐和语音这一张似乎讲得格外模糊,厚度仅有前一章的一半。
开头先介绍了人耳的听觉原理,以及乐音三要素响度、音调、音色这些声音方面的基础知识。
之后引入了梅尔频率倒谱系数(MFCC)这个概念,以及依据此概念进行深度学习的方法。
再往后,就是对于语音识别和乐曲检索的简单介绍,总共不超过4页。
第五章 冰雪聪明: 看懂视频
5.1化静为动: 从图像到视频
5.2明察秋毫: 视频行为识别
5.3基于深度学习的视频行为识别
5.4本章小结
这一章先介绍了光流概念,之后大概介绍了如何用双流卷积神经网络识别短视频动作,最后则是针对长视频的时序分段网络。
第六章 无师自通: 分门别类
6.1当人工智能未曾听说花的名字
6.2物以类聚: 鸢尾花的K均值聚类
6.3人以群分: 相册中的人脸聚类
6.4层次聚类与生物聚类
6.5本章小结
标题里的“无师自通”说的是无监督学习。
而所通的对象依然鸢尾花,用K均值聚类将大量鸢尾花样本氛围山鸢尾、变色鸢尾和弗吉尼亚鸢尾三类。
之后,把鸢尾花变成人,通过人脸检测、人脸转正、特征提取步骤之后,完成人脸聚类,以实现相册根据面孔自动分类的过程。
第七章 识文断字: 理解文本
7.1任务的特点
7.2文本的特征
7.3高屋建瓴: 发掘文本中潜在的主题
7.4投其所好: 基于主题的文本搜索与推荐
7.5本章小结
这一章最主要的内容是词袋模型,以此分辨中文分词、停止词、低频词,之后得出不同词汇的频率,发掘主题。
语义分析和搜索可能过于难了一些,书中只给到了两页的简单介绍。
第八章 神来之笔: 创作图画
8.1九层之台, 起于累土: 数据空间和数据分布
8.2化腐朽为神奇的创作家: 生成网络
8.3火眼金睛的鉴赏家: 判别网络
8.4在对抗中合作与进步: 生成对抗网络
8.5得心应手地创作: 条件生成对抗网络
8.6本章小结
标题是画画,内文一定是GAN了。
开头先介绍了数据空间的概念,之后则单独把生成网络和判别网络拎出来讲,之后进入了对抗过程的步骤演示,最终,终于生成了一些假模假样的明星照片。
第九章 运筹帷幄: 围棋高手
9.1初窥门径: 阿尔法狗的走棋网络
9.2远见卓识: 阿尔法狗的大局观
9.3成就非凡: 阿尔法元
9.4本章小结
大众最为熟悉的阿尔法狗终于在最后一章出现了,这一章介绍了阿尔法狗的策略网络、估值网络、快速走子网络和蒙特卡罗树搜索,当然,还介绍了一点强化学习的概念。
02 究竟难度几何?有图有真相
除了第一章的基础介绍之外,其他部分还是在将技术相关内容。虽然受限于高中生的数学基础,但是对于具体的原理逻辑,已经讲解的相当详细了,可以说是学术不足、科普有余。
比如在介绍卷积神经网络时,书中以飞机、汽车、猫咪、木牌等图像的照片作为示例,先科普了计算机存储图像的RGB三色,提出三阶张量的概念;
又补充了卷积运算的数学知识;
利用卷积进行图像特征提取的原理和流程;
最后引出深度神经网络的结构,还顺便介绍了发展历程与应用。
其他相关的概念也是从实际应用的问题切入,从数学原理开始,一步步推导出算法模型,进而引入方法概念,最后回到实际应用中。
这个过程让我们学到了不少技术内容的基础知识,还成功复习预习了包括卷积运算、矩阵乘法、各种函数在内的一些数学知识。
在看完本书正文之后,我们还翻了一下书后的参考文献,发现Yann LeCun, Ian Goodfellow等大佬的作品赫然在列,这可能是很多高中生离学术界最近的一次了吧。
对于这本书,创新工场副总裁王咏刚给到了一个中肯的评价:
不过,一个难以解决的问题是,书中有许多实验环节,需要配套的实验平台来完成。根据执行主编林达华教授在知乎的相关介绍,商汤科技已经为合作学校提供了实验平台:
为了配合教材中的22套实验,我们还开发了一个配套的教学实验平台。在这个平台里,我们对多种常用的算法进行便于中学生进行实验的API设计和封装,配套的数据集也做了适当的剪裁,尽可能使得普通的中学生能在可以接受的时间里能够完成实验。在这个平台上,我们选用了在AI领域最广泛使用的Python语言。我们为合作学校提供了多方面的支持,包括教学平台的支持,老师的培训等等。
▲图片来自林达华教授的知乎回答
很遗憾的是,除了合作学校之外,我们并没有发现其他可以接触实验平台的渠道。在这本书出版方华东师范大学出版社的天猫官方旗舰店里,许多买了书的顾客在评价中表示,虽然书本内容清晰易懂,但是书中并没有附带光盘或网站等软件资源,身处非合作学校也接触不到实验平台,无法动手实践,有些遗憾了。
不过,相比其他课本,这本书的一个巨大优点是:
内容易读接地气,配图丰富,排版舒适,整本书都是彩色的。
让人想起当年学不会的高数/大物/模电,整本书密密麻麻,都是黑白文字,除了封面之外再无一点色彩。
希望编写大学教材的老师们行行好,写的稍微生动一点,拯救一下学渣。
03 汤教授也可以皮一下
除了知识与科普,主编汤晓鸥教授也在书里放了一点点彩蛋。
比如,本书每一个章节页和每一章的开头都会用一个故事或者生活场景作为引子,而故事的主角是一个叫“铭铭”的小朋友,铭铭的父亲是一位著名的人工智能科学家,因此他学到了许多关于人工智能的知识。
而本书主编、著名人工智能科学家汤晓鸥教授的儿子就叫铭铭。
真·孩奴·汤晓鸥教授,的确在儿子身上寄托了很大的希望呢。
另外,作为商汤科技联合创始人,汤教授悄悄软植入了一点产品信息:
在第三章的末尾,介绍图像分类技术的应用时,书中举了帮助警察搜寻犯罪嫌疑人的人脸识别布控系统作为例子。
例子的配图,正是商汤科技的人脸布控系统SenseFace。
▲品牌曝光×1
此外,我们还发现了一个小Bug:
▲DeepMind被强行加了空格,写成了“Deep Mind”
校对同学本月工资-50RMB。
高中学AI,这种看似“反常”的事情毫无疑问的引起了一波讨论。
讨论最热烈的是8090后的叔叔阿姨对年轻一代超越自己的担忧。
不少网友在这本书出版后迅速买了一本开(fa)始(peng)学(you)习(quan),担心被00后的高中生们超越,担心二十年后不懂AI的自己饭碗不保。
但引发更多争论的则是:这本书第一批合作的40所学校,都是大城市的顶尖高中,比如北京的清华附中,上海的七宝、格致、交大附中,广州的广雅、执信,西安的交大附中,成都七中,青岛二中等学校。
这些学校所在城市的本地居民都知道,这类学校是一个城市乃至一个省最为知名的顶尖高中了,能够在这些学校就读的孩子,除了极个别天赋异禀的学生之外,多数是既有条件优厚的家庭背景、又足够聪明好学的孩子。
而这些条件优厚的家庭背景,就意味着其父母不说非富即贵,也至少是高学历、高素质的中产家庭。
这让许多人感叹教育资源分配不均,能进入大城市顶尖学校的孩子可以学到包括AI在内的更多新知识,而小镇青年们只能要么进高考工厂深造,要么在教学水平一般的中学听天由命。
但是,这些差距并不是一本书、一门课的差距造成的。
执行主编林达华教授在知乎回应了这种观点:
很多朋友担心,基于开展AI教学的重点中学会获得比普通中学更进一步的优势,使得教育不平衡进一步加剧。
对于这个问题,我的看法是:这部高中版AI教材的出版,可以让更广大的学生群体在中学阶段就了解和接触人工智能,使得中学AI教学不再是个别重点中学的专利。
不过,即使是能送孩子读高中名校的中产家庭,家长也对过于强调素质教育有一些担心。笔者前不久见到了一位家长,他的儿子就读于这本书合作名单中的某知名高中,作为大学教授的他对儿子的高考充满了担忧,害怕过于丰富的课外活动和知识让儿子在未来的高考中败下阵来。
不过另一种声音则显得毫无压力:高中生还没学高数、线代等基础数学知识,也没学python编程,给毫无基础的孩子讲AI,他们不仅任何实践都做不出来,而且可能被揠苗助长。
这些评论者可能并没有看这本书的正文,因为书中一行代码都没有。
看,知乎大V轮子哥就非常淡定:
虽然都是学习科技,参观科技馆和学懂数学物理做实验显然难度差了十万八千倍。
这本带有少量专业知识的科普读物就相当于参观科技馆,并不会让中学生开始实际的学习研究,不过对于让他们认识AI、适应可能在几十年后出现的AI世界有一定的好处。
正如这位不在互联网的互联网人士徐先森隐藏在省略号中的意思,二十年后,当00后成家立业,成为社会中流砥柱的时候,还不懂AI可能真的与2038年的时代脱节了。
况且,科普总是能引发年轻人的兴趣,不妨把它视作AI科技在高中生中的一种推广,总会有对此感兴趣的孩子被点醒,或许十年后,他们中的少数优秀学生就会用新的研究成果证明这本书的价值。
读完这本书后,也想为编者老师们提出一个小建议:作为面向高中生的科普书,可以再补充一些社会认知的内容,比如:
担心AI取代就业岗位怎么办?
AI能消灭哪些旧岗位、创造哪些新岗位?
如何理性的看待科技发展、防止陷入泡沫、成为资本的韭菜?
对绝大多数不会成为AI研究者的高中读者来说,这些内容或许可以号召社会更加理性地看待AI这门技术。
说不定,还能拯救几个准备进入终将被AI取代行业的孩子。