关于知识,有一个非常有意思的现象,那就是在人们离开学校后,出现了两种完全对立的声音。
一种声音说:毕业这么多年根本没用到学校教的知识,为什么当初要浪费时间来学习?
另一种声音则说:毕业越久越觉得学校教的知识都非常有用,后悔当初为什么没好好学习。
而在知乎的这个问题下,大家都在试图说服第一种声音的拥护者要把眼光放长远一些,但事实上,两种声音都是对的。
为了解释为什么,让我们回到 1900 年初的德国。照片里的这个人叫做威廉 奥斯汀(Wilhelm Von Osten),曾是一名数学老师。一般大胡子的数学老师们都不太安分,而奥斯汀就觉得动物的智力被低估了,于是就开始教名为汉斯的一匹马学算数。
经过一段时间的训练后,奥斯汀便把汉斯带到众人面前来展示。当问到二加二等于几时,汉斯踏了四下蹄子,而问到“若今天是星期一,再过多少天是星期六”时,汉斯竟仍然可以正确的踏五下蹄子。
德国人可是一个很严谨的民族,专门成立了一个委员会来调查此事,带头的是另一个大胡子,叫做卡尔 斯坦普夫(Carl Stumpf),经过严格的调查后,他们并没有在奥斯汀身上发现任何欺诈或作弊行为,甚至用别人替代奥斯汀来提问,汉斯仍然可以正确回答,可问题出现在,当提问者远离汉斯的视线,或提问者自己也不知道答案时, 汉斯便无法回答了。
事实上,汉斯并没有真正学会的算数,而是构建了另一种模型:根据提问者在无意识间流露的微表情和肢体动作来判断什么时候该停止踏蹄。
这可是所有女生都默认自己男朋友有,但实际男朋友根本没有的能力。
虽然汉斯构建的微表情模型能够在提问者在场的条件下,完成同算数模型一样的功能,但二者并不是一个模型。
后来这个故事就被叫做“聪明的汉斯”。在心理学(观察者期望效应)和机器学习领域都给了人们启示。
机器学习中就以此来说明:人工智能看似能完成的一些智力任务,其实是在依赖所找到的某些微妙特征,一旦条件出现哪怕些许的变动,人工智能就很容易失效。
比如,某些识别坦克和飞机的模型,其实是在识别背景是否存在蓝天色。因此人们称机器根本没有理解知识。
然而较为讽刺的是,人类自身也存在着同样的问题:学生构建的模型能够在卷面上,能实现与教育想教的模型一样的功能,但二者往往也不是同一个模型。
因为在这种条件下,不管是汉斯,还是升学的学生并不是你想教什么,他们就学什么,而是通过最大化某一奖励(reward)来构建模型的(强化学习),但能最大化奖励的模型并不一定是教育目标的模型。
奖励(reward)
强化学习
对于汉斯或宠物们而言,它们的目的是最大化主人给的食物(奖励),至于自己是否真的学会了算数或握手对最大化食物并没有影响,宠物学到的“握手”很可能只是想要把你手中的食物“按”出来。
对于需要升学的学生而言,他们的目的是最大化自己的分数(奖励),虽然用真正的知识也可以得到正确答案,但若有另一个模型可以用更快捷的方式得到正确答案的话,哪怕是“三短一长选一长,三长一短选一短”这种无法解决实际问题的模型,学生们依然会选择后者。
实际上,扮演汉斯角色的并不仅仅是学生,初高中的老师、家长以及培训机构也都是这个系统下的参与者,其目的同样是最大化学生的分数,而这逐渐衍生出来了另一套看似在教实用知识,其实是在最大化分数的教育系统。
你是否曾好奇过:为什么初高中的英语教材在每一课的后面都有对话和听力等专项练习?毕竟老师上课的时候根本不会用到那些部分啊,为什么不直接选择一套好的辅导书作为教材,这样不就不用额外花钱买辅导书了吗?
这是因为编写教材的专家们想要最大化的奖励,与编写辅导书的专家们想要最大化的奖励并不相同:辅导书是升学专家为了让学生学会能最大化得分的知识而编写的材料,教材是教育专家为了让学生学会能解决实际问题的知识而编写的材料。
比如《新概念英语》的设计就非常科学,完全对应学习观07中提到的听、说、读、写四种模型,并为每一种模型都专门准备了输入和输出的练习材料,对应的正是课后的对话和听力。然而,对于最大化分数这个目的而言,教材的知识并不是最有效的模型,因此往往被取代。
不少人在学习观07下留言,说视频中介绍的单词学习法太慢,他们其实是以“最大化分数“为目的而做的评价。事实上也确实如他们所说,但若以“有效的交流”为目的时,学习观07中介绍的就是最有效原则。
回到开篇的问题。第一种声音的拥护者所说的“知识无用”,其实是指那些为最大化分数而构建的知识,那么就会像汉斯离开提问者便无法答题一样,当这些学生离开学校后,当初在学校构建的模型往往也不能被用于解决实际问题,这也是为什么“高分低能”会出现的原因之一,不仅仅是人们所说的“智商高,情商低”。
而第二种声音的拥护者所说的“知识有用”,指的是可解决实际问题的知识,这些知识都是人类最聪明的那些大脑所沉积下来的模型,是人类繁荣的根基,其有效性自然无需质疑。
两种声音之所以都对,是因为它们最初描述的就不是一个事物。
正是由于 “能最大化分数的模型” 并不一定是 “教育目标的模型”,就让学生们在就业时处在一个很尴尬的局面:企业一方面靠分数和学校出身来筛选人才,另一方面,又希望筛选出的人才可以解决工作中的实际问题。
这种教育系统与就业系统的不匹配,使得千辛万苦通过考试的学生们又不得不在进入职场后,重新参加培训来学习实用知识。
听到这里一定会有抨击高考的声音,希望可以推行素质教育改革,其实教育部早在2001年就提出了教育改革的口号,并试图推行素质教育,然而却并为见效,为什么?
先前提到过,升学的学生是通过最大化某种奖励(reward)来构建模型的。不管怎样限制,随着时间的推移,升学教育系统最终都会演化成学生在学习“能最大化奖励的模型”,而不是在学习“教育目标的模型”。
这就如同任何网络游戏最终都会演变成单一的最优玩法而变得枯燥一样。
只要升学教育系统主要的目的是为了筛选人才,那么素质教育改革的问题其实就可以被视为:能否通过改变奖励机制,使“能最大化奖励的模型”就等于“教育目标的模型”,或者说让“得分目标”完全等价于“能力目标”。
关于这个问题,其实并不是绝对不可能,但我们可以参考机器学习中的一个笑话,如果你把吸尘器的奖励函数设计成“捡垃圾越多奖励越多”,那么很可能产生的后果是,吸尘器学会了捡垃圾,又学会了放下,然后捡起和放下无限循环。
所以在奖励函数塑形(Reward Shaping),难以避免会出现这种意外结果。
奖励函数塑形(Reward Shaping)
而我们又需要对每个学科分别进行设计(语文的未必适用于数学的),倘若推行素质教育后,其奖励机制依然不能使“得分目标”等价于“能力目标”的话,那么系统最终也一定会根据素质教育的奖励机制演化成另一套偏离教育目标的应试教育系统。唯一不同的是:这套新的教育系统会使学生获得分数的成本变高,让人才筛选变得不再公平。因为素质训练的成本提升,会导致有些穷人无法支撑这部分教育成本,而无法获得所有学分。
这种“素质教育”就如同一款宣称大家可以打神装的网络游戏,但实际上必须要先充钱才有可能打得过BOSS,那么充不起钱的玩家和充的起钱的玩家的差距将会越来越大。
最好的例子就在美国,美国素质教育的评分机制涉及各种才艺特长,很多只有富人的子女才能享受到的提分渠道。在2019年爆出的“美国高校招生丑闻”,更是揭露了美国富人是如何利用“素质教育”的评分机制,让自己的子女获得更高的分数从而进入名牌大学。
如果当前无法保证能设计出使“得分目标”等价于“能力目标”的奖励机制,那么最合理的解决方案恰恰不是推行德、体、艺等提高评分条件的“素质教育”,反而是降低学生得分成本的“应试教育”,让每个学生都有机会仅靠历年真题便能获得所有分数。
而这个“应试教育”就是高考。它主要解决的并不是人才教育的质量问题而是人才选拔的公平问题。
大家其实也都清楚这一点,正如大家喜欢的网络游戏都是没有充值系统的网络游戏。
那么建模偏差难道就没有办法消除了吗?
说到底,教育体制之所以这么难改革,是因为它主要就不是教育学问题,而是社会学问题。只要一个系统起到的是筛选作用,那么系统内的个体就无法跳出“最大化奖励”的行为模式。换句话说,只要学生要利用该系统而争取有限资源(名校名额、上升渠道等),就无法完全消除偏差。
但只要这个系统脱离筛选目的,学生就可以自己通过明确输入输出,来抑制建模偏差。
比如,当输入也同时固定时(不允许看人的表情),汉斯就无法用微表情,只能用算数来得出结果了。这便是为什么明确输入输出是《学习观》中的第一条学习原则。
可是社会又需要人才筛选的功能,那么就只能暂时把教育系统进行分段:一个是负责筛选目的的义务教育阶段,一个是负责实用目的的高等教育阶段。
现在我们就可以回答《学习观》的一个奇怪规定了,为什么初中生,高一高二可以看学习观,唯独高三不可以看,可一旦高考结束,就又可以看了。
因为高三学生所处的正是起到筛选目的的义务教育阶段,无法避免的要靠学习应试知识来最大化自己的分数,虽然《学习观》中介绍的学习方法既适用于应试知识的学习,又适用于实用知识的学习,但由于目前的《学习观》主要强调的是负责实用目的的高等教育,比如学习观07就不是为应试生而准备的,所以我很担心会有高三学生看完目前的学习观后,产生“应试知识没用”的心理而耽误自己的人生,因此才禁止高三学生观看。
我上一篇文章中也提到过,《学习观》以后会多出一个部分(《断墨寻径》),来专门针对应试知识的学习,这也是为什么突然从16期,临时更新了一个18.5期来介绍应试知识和实用知识的区别。
其实在《学习观》中,我始终都在避免谈论天赋、制度等问题,尽管我们都知道存在天赋异禀的能人,尽管我们都疑惑高考究竟筛选了什么,但这些都不是我们能改变的因素,毕竟我们无法像玩网络游戏那样,在资质不满意或制度不合理时换游戏,唯一能做的只有集结所有自己能改变的因素,选出最合理的每一步。