加入书架 | 推荐本书 | 返回书页

今书网 -> 其他类型 -> 猫头鹰的万花筒

第八十夜 学习(三)

上一页        返回目录        下一页

    惩罚。

    分为正惩罚和负惩罚。

    正惩罚是通过惩罚弱化个体行为(与正强化相反),例如殴打、辱骂、限制自由等。

    负惩罚是去除个体强化物而不直接惩罚的行为,例如扣工资、没收财产、取消聚会等。

    惩罚是强化的对立行为,所以,惩罚必须持续才能起到作用,如果惩罚间断则起到相反的作用(例如职工迟到但并不是每次都被抓到或是并不是每次都会受到惩罚,那么迟到行为必定会被加强,这在进化机制上看是一种不确定性收益,相当于不定间隔强化)。

    惩罚在我们人类社会被大量使用,与强化有很大的不同,惩罚者在惩罚过程中往往会有愉悦的感觉,即使他们之间并没有恩怨。

    实验证实,让一个班级的孩子一部分扮演警察,一部分扮演罪犯,虽然他们之前是一起玩耍的好朋友,但扮演行为产生效力的时候,警察的孩子会因为使用权力惩罚那些罪犯孩子而感到兴奋和快乐,并自发的将惩罚不断升级。

    罪犯孩子受到惩罚有明显的反抗行为,例如拒绝执行命令,推挤等排斥行为,反抗也随着惩罚升级而升级。

    最终脱离所有规则双方混战成一团,尽管他们之前都是好朋友。

    现实中,我们进行惩罚并不一定能取得长久的效果,例如孩子考试不及格,有的家长直接脱裤子打屁股,虽然屁股被打烂但孩子下次考试依然不及格。

    家长打孩子很大程度不是为解决孩子的问题,而是为了解决自己的问题,为了解气,实质上孩子考试不及格与打屁股之间根本不存在因果关系。

    这个问题还是要以进化机制的生存和繁殖角度理解,惩罚从受罚个体看,本质上是自己不希望的,大部分都是减少其生存繁殖上的收益,小部分惩罚是为其长久生存繁殖有利的。

    比如小孩子训练过程中总是出现错误的动作或容易受伤的动作时进行惩罚有利于其以后更高难度动作的训练和发展。

    需要注意的是,对小偷进行收监的惩罚,从小偷角度看并不是有利于其生存繁殖的,在监狱里小偷是无法偷窃用于生存的钱物等资源,所以这种惩罚要足够重或是能让小偷有其他生存手段,否则惩罚不会产生长久效果,特别是小偷认知偷窃带来的生存收益远大于其所冒的风险。

    惩罚必须要全方位无死角持续,否则个体会采用所有可能手段回避惩罚,惩罚如果危及生命等重大利益时,个体会产生强烈的反抗行为,这会让惩罚者无利可图。

    惩罚对于受罚者而言,多数情况下并不会起到良好效果,因为惩罚一方面严重威胁其自身生存利益,二是强大的威胁感会抑制其积极学习的心理和行为,也就是习得性无助,这时惩罚对于受罚者而言已经没有任何正面意义。

    从施加惩罚个体看,惩罚在一定程度上能给惩罚者自己带来收益,这种收益直接涉及生存和繁殖。

    例如通过殴打孩子能树立权威,通过罚款能获得收益,通过惩罚能得到愉悦等,这和强化存在明显的区别。

    强化双方是平等互利的或是强化者无利可图,惩罚则在大多数情况下是单方收益的,只在很少情况下是互利的,本质上的差别造成了惩罚是行权者优先采用的行为,而不是强化。

    惩罚之所以进化,有其适应环境的合理性,在不得不实施正惩罚时(其他手段无效,例如负惩罚),注意一是惩罚必须紧跟不良行为,而不是威胁以后怎样。

    二是惩罚必须公平一致,对事不对人,每次,任何人做出同样的行为受到的惩罚必须一样,否则将起反作用。

    三是惩罚适度,太轻太重都不会有良好效果。

    四是惩罚必须要与行为环境保持一致,不能混淆惩罚信息,以惩罚为自己带来收益。

    正是因为惩罚(包括负惩罚)的有效条件远多于强化,所以采取惩罚手段具有相当大的风险,这个风险往往不是惩罚者所能预料的。

    大多数惩罚者都过于关注惩罚时自己获得的收益,而不会认知到以后可能产生更大的损害,所以要综合使用强化和惩罚,并且要与自己脱离利益关系,改变个体行为才会取得较好的效果。

    顿悟学习。

    为了解决难题,人(包括其他动物)会根据环境条件将多种行为(认知)组合使用,在这之前,他们是不知道解决问题(达到目的)的方法的。

    例如,有的人在睡觉时突然领悟了方法,有的人在吃饭时,有的在上厕所时等。这类学习在高等动物中普遍存在,例如,黑猩猩为得到高处的香蕉,通过房间内的木棍和纸箱(单独使用均无法完成),想到了办法。

    认知学习。

    并不是所有的学习都是通过行为(已知条件)进行的,更高级的学习是只通过大脑思考和客观逻辑判断产生的认知。

    这类学习典型代表是爱因斯坦,他的相对论及引力波就是认知学习的产物,特别是引力波直到最近才被证实正确,爱因斯坦如此强大的认知学习,在他那个年代根本无法被大众理解和认知,而这正是推动人类发展的关键。

    因为行为学习是较为低等的学习手段,只能以当前环境中存在的行为或已知条件进行,而认知学习是抽象思维的高级学习手段,这种学习是以宇宙客观规律为依据,以当前环境存在事实为基础,概括性、超前性极强的学习方式,也是人类特有的学习手段。

    内隐学习。

    指虽然没有强化刺激,人(包括动物)会对自己所处的陌生环境下意识观察(认知)和学习,从而在得到强化刺激时比那些刚接触的个体完成速度快的多。

    例如,并没有食物刺激,让一批小白鼠在迷宫里瞎转,这时放入食物测得他们找到食物的时间比从来没有事先熟悉迷宫的要快的多。

    这也解释了为什么少林寺扫地僧都比普通人厉害的多的原因。这种没有强化刺激而自发的学习实际上是进化机制决定的,因为熟悉环境实质上增加了个体生存繁殖的可能,其本身就是一种强化。

    观察学习。

    人(包括动物)会通过观察其他个体行为进行模仿和学习,特别是关系到生存和繁殖的行为。

    但这种学习有一个缺点,那就是对于间接性的行为(除了直接关系到生存繁殖的捕食、安全、防卫、逃跑、评估等行为),个体无法知道这种行为是有利于自己生存繁殖,还是有害,还是多余浪费时间的(暴力、欺骗、从众等具有多向性的行为)。

    学习能力。

    个体总是倾向于使用所有能用来解决问题的能力来学习,而不是象有些错误理论将人的学习划分左脑、右脑,文科、理科,抽象、具象等。

    要知道,无论哪个人,他的学习都是综合使用可能使用的资源进行学习的(左脑和右脑都是协作的,而不是分开的,文科理科都是共同作用于思维和学习的等)。

    说善于视觉学习的,实际上其他个体也是通过视觉进行学习,因为外在条件只能通过视觉产生学习行为。

    真正决定学习能力和水平的,主观方面是个体(遗传和能动性),客观方面是环境(外在的条件和事物)。
没看完?将本书加入收藏我是会员,将本书放入书架复制本书地址,传给QQ/MSN上的好友章节错误?点此举报