首页 理论教育 斯金纳的强化理论与巴甫洛夫的措施不同

斯金纳的强化理论与巴甫洛夫的措施不同

时间:2023-08-16 理论教育 版权反馈
【摘要】:美国心理学家斯金纳对强化的概念做了系统的论述。斯金纳对强化的解释与巴甫洛夫有些不同。巴甫洛夫只是把强化看成是使条件反射避免消退和得以巩固的措施,而斯金纳则把强化看成是增强某种反应、某种行为概率的手段,是保持行为和塑造行为必不可少的关键因素。在斯金纳之后,不少学者对人的行为强化问题进行了大量的研究,强化的概念也进一步得到发展。斯金纳认为行为并不是由反射或先天决定的,而是后天学习得到的。

斯金纳的强化理论与巴甫洛夫的措施不同

强化理论也称为操作性条件反射理论,是美国著名心理学家、哈佛大学心理学教授斯金纳(B.F.Skinner)在巴普洛夫的条件反射、华生的行为主义理论和桑代克的尝试学习的基础上,提出的一种新行为主义理论。这个理论特别重视环境对行为的影响作用,认为人的行为只是对外部环境刺激所起的反应,只要创造和改变外部的操作条件,人的行为就会随之改变。

1.强化的概念

强化的概念,最早是俄国生理学家巴甫洛夫在研究条件反射时提出的。在条件反射形成以后,为了防止条件反射消退,必须不时伴随以无条件刺激物(食物),这就是强化。但是在巴甫洛夫古典条件反射学说中,强化仅仅是巩固条件反射的一种。

美国心理学家斯金纳对强化的概念做了系统的论述。斯金纳是操作条件反射理论的创始人,他在长期用动物做实验的过程中创造了一种特殊的实验装置——“斯金纳箱”。箱内装有一个杠杆,把白鼠放在箱内自由走动,偶然碰到杠杆,就会有一粒食物沿沟槽滚入箱内。由于按压杠杆可以得到食物,所以白鼠很快学会了按压杠杆取食物的操作。这就是说,形成了操作条件反射。而这种操作条件反射形成的关键条件则是得到食物的强化。

斯金纳对强化的解释与巴甫洛夫有些不同。巴甫洛夫只是把强化看成是使条件反射避免消退和得以巩固的措施,而斯金纳则把强化看成是增强某种反应、某种行为概率的手段,是保持行为和塑造行为必不可少的关键因素。在斯金纳之后,不少学者对人的行为强化问题进行了大量的研究,强化的概念也进一步得到发展。

斯金纳认为行为并不是由反射或先天决定的,而是后天学习得到的。他指出:在具体行为之后创设令人满意的结果,会增加这种行为的概率。因此,所谓强化,就是指随着人的行为之后发生的某种结果会使以后这种行为发生的可能性增大。这就是说,那些能产生积极或令人满意结果的行为,以后会经常得到重复,即得到强化;反之,那些产生消极或令人不快结果的行为,以后重新产生的可能性则很小,即没有得到强化。

从这种意义上说,强化也是人的行为激励的重要手段,而强化理论也应属于激励理论之一。

强化过程即操作条件反射包含有3个要素:第一个要素是刺激,在组织中指的是所给定的工作环境;第二个要素是反应,也就是工作中表现出的行为和绩效;第三个要素是后果,也就是奖惩等强化物。

这3个要素的关系在心理学中被称为基本耦合,对于被强化者未来的行为模式有着显著的影响。

我们随处可以见到操作条件反射的例子。在任何情境中,这些例子都或多、或少、或明显、或隐含地表现出来,强化的程度依人们所采取的行为而定。例如,学校老师会向学生指出如果想得到高分就必须出满勤;一名想赚大钱的销售代理发现奖酬取决于他在此领域中所创造的高销售额。又如,假设你的上司告诉你,如果你能在下3个星期的忙季里加班工作,在下一次的绩效评估中你将得到补偿。但是,等绩效评估到来之时,你发现对你的加班工作没有得到任何的积极强化,下次你的上司再请你加班时,你会怎样做?你很可能会拒绝。你的行为可以用操作条件反射来解释。如果一种行为未得到积极强化,对该行为重复的可能性会降低。

2.强化的类型

学习不但发生在工作之前还发生在工作之中,因而管理者应当注意如何教导员工以使他们的行为对组织最有利。行为的改变意味着学习的发生,利用强化的手段塑造员工行为,就成为一项有效的管理工具。强化一般有4种方式:正强化、负强化、自然消退和惩罚。

(1)正强化(积极强化)

正强化是用某种有吸引力的结果或称奖酬,如认可、赞赏、提升、增资等,对某一行为进行奖励和肯定,使其因受到重视而加强。也就是说,组织在想要的行为发生后提供令人愉快的结果,使该行为得以保持。

正强化与奖赏在使用时容易被混淆。奖赏是个人觉得想要的和令自己愉快的事件。对于个人而言,奖赏是否是强化物是主观的,例如一位管理者当着同事们的面表扬某员工发现了团队报告中的一处错误,管理者坚信他是在强化想要的行为,然而后来他却发现这位员工受到团队别的成员的冷淡,再也不指出错误了。可见,奖赏要成为强化物,它必须能增加先于其出现的行为的频次。如果行为出现的频次减少或保持不变,这时奖赏就不是强化物。

应用正强化塑造员工行为有4个原则需要注意:

①随机强化原则。只有当组织所期望的目标行为有所表现时才给予强化,如果行为没有表现则不予强化。应该杜绝对非目标行为的强化,否则将失去强化的意义和效力。也就是说,强化措施应该取决于员工的目标行为,强化要有明确的目的性和针对性。要确定强化是否遵循了此规律,只需问一个问题:该强化措施只有在目标行为发生时才采取吗?

②即时强化原则。当组织期望的目标行为发生后,强化措施采取得越及时,强化效果越好,对该行为今后发生的频次的影响就越大;强化措施越是滞后于行为,强化效果就越差。因此,强化措施的实施应当尽实际可能与目标行为相一致。

③规模强化原则。当组织期望的目标行为发生后,所采取的强化措施规模越大,对所要强化的行为的今后发生的频次的影响就越大。强化的规模太小,将不会产生什么刺激,甚至会造成消极的情绪抵抗;强化的规模太大,会导致对将来奖励的不切实际的期望。值得注意的是:强化措施的规模是相对而言的,对一个人有足够影响力的强化物对另一个人未必有效,关键是确定强化物的规模和目标行为的收益相比是否值得。

④丧失强化原则。个人被剥夺的强化物越多,对目标行为未来的发生频次的影响作用越大。如果个人最近得到足够的强化物,这些强化物的强化效果将大打折扣。因此,管理人员要学会选择强化的数量和时间。

正强化是通过组织奖励来实现的。尽管组织一般使用的实物奖励(如加薪、奖金、额外福利等)都是很明显的,但是越来越多的组织也提供许多并不太明显的奖赏,包括言词赞扬、分配给想要的任务、改善工作条件和一项额外的带薪假期等。需要注意的是:组织奖励只有在个人自愿接受它们,并觉得它们是自己想要的或令人愉快的时候才能成为强化物。

(2)负强化(消极强化)

当某种不符合要求的行为有了改变时,减少或消除施于其身的某种不愉快的刺激(如批评、惩罚等),从而使其改变后的行为再现和增加。即一种反应伴随着终止或逃离不愉快事件时称为消极强化。

负强化和正强化的目的一样,都是想维持和增加某一有利的行为。负强化有时容易与惩罚混淆,因为两者都是利用令人不愉快的事件去影响行为。然而,负强化是用来增加想要行为的频次,而惩罚是用来减少不想要行为的频次。

应用负强化应记住两个要点:

①要实施负强化,事先必须确有不利的刺激存在。

②通过去除不利刺激来鼓励某一有利行为,要待这一行为出现时再去除方能奏效,以使受强化者明确行为与后果的连接关系。

(3)自然消退(忽视)

自然消退有以下2种方式:

一是对某种行为不予理睬,以表示对该行为的轻视或某种程度的否定,使其自然消退;

二是对原来用正强化建立起来的、认为是好的行为,由于疏忽或情况改变,不再给予正强化,使其出现的可能性下降,最终完全消失。

大量的研究表明,一种行为如果长期得不到正强化,便会逐渐消失。例如,如果老师不希望学生上课时提出问题,则当有学生举手发言时,忽视他们的存在,举手发言的行为得不到强化便会消失。

可见,消退其实就是不予强化,不强化就会自然消退,具有广义的强化作用。例如,领导对员工的积极行为不予奖励,本身就是给这种行为泼冷水,是不表态的表态。(www.xing528.com)

(4)惩罚

惩罚是用批评、降薪、降职、罚款等带有强制性、威胁性的结果来创造一种令人不愉快乃至痛苦的环境,或取消现有的令人满意的条件,以示对某一不符合要求的行为的否定,从而消除这种行为重复发生的可能性。

惩罚中所包括的撤销奖酬这一措施,与自然消退中的撤销奖酬有所不同。自然消退中撤销奖酬是针对某种过去认为是好的且用正强化建立起来的行为;惩罚中撤销奖酬则是为了消除某种不好的行为,这种行为从来没有跟这种奖酬联系过,如对酗酒的员工进行停薪或罚款,对于经常迟到的员工取消其年末晋级的资格等。

一个事件必须能减少不想要的行为才能称为惩罚物,不能仅仅因为某事件是令人不快的就认为该事件是惩罚物。组织经常会使用一些令人不快的事件来惩罚个体,包括物质惩罚物,如罚款、降薪、停职、降级、解雇等,也包括人际惩罚物,如批评、抱怨、糟糕的工作环境等。

前面讨论的运用正强化的4个原则同样适用于惩罚的运用。为了取得最大的效率,惩罚物必须目标明确具体,直接和不想要的行为联系起来(随机惩罚原则);当不想要的行为出现时,惩罚物应及时出现(即时惩罚原则);惩罚物越大,对不想要行为的威慑作用也就越大(惩罚规模原则)。

在使用惩罚改造员工行为时,不应忽视惩罚的负效应,即使惩罚可以让不想要的行为不再发生,但从长期来看,其潜在的负面效果可能比最初不想要的行为更大。图7-7列出了一些惩罚的潜在负效应:

图7-7 惩罚的潜在负效应

应当指出,强化的目的是为了使员工的行为与管理层的期望更接近。在这4种强化类型中,正强化是影响行为发生的最有力工具,因为它能增强或增加有效的工作行为;惩罚和自然消退只能使员工知道不应做什么,但并没有告诉员工应该做什么,无法让员工通过学习和强化达到塑造行为的目的;负强化则会使员工处于一种波动的、不快的环境之中,因此可能产生适得其反的结果。

3.强化的时机和程序

在某一行为发生之后,能否把握好强化的实施时机和程序,将直接影响到强化措施的效果。原则上说,实施强化越及时,效果就越好,但具体实行起来却遇到不少的困难与问题。实际上,强化的时机可以有多种安排方式,这称为强化的时间和程序安排。

强化按时间和程序安排可分为连续型强化和间歇型强化两种。

(1)连续型强化(continuous reinforcement)

这是指每次理想的行为出现时都给予强化,这是一种最简单的强化程序。比如,对于一个有上班迟到习惯的员工,每次他准时上班时,主管都肯定他这种好的行为。

(2)间歇型强化(intermittent reinforcement)

这是指非连续的强化,即不是每次发生的行为都受到强化,而是在目标行为出现若干次后才给予一次强化。研究表明,与连续型强化相比,个体在间歇型强化中倾向于更不愿意放弃活动。

间歇型强化一般有4种形式:固定时距强化、固定比率强化、可变时距强化和可变比率强化。

①固定时距的强化。是指每隔固定的一段时间给予一次强化。几乎所有的工薪阶层都受到这种程序的强化,如月工资和年末奖金等。

按照这种程序来实施奖赏是为了形成一种规则的行为模式。在强化之前,行为会经常发生并具有活力,在紧跟强化后的一段时间,行为发生的次数可能变少,因为个体相当迅速地了解到,下一个奖赏不会马上到来,需要过一段时间。

②固定比率的强化。是指强化的次数与目标行为发生的次数保持固定的比例关系,以明确地显示出强化与目标行为之间的因果关系。如制衣厂的工人每安装12个拉链付5元钱的计件付酬的方式。

③可变时距的强化。是指根据经过的时间给予强化物,但时间的长短围绕某一平均数而变动。例如,一家公司的一批新员工,他们在连续的全日工作满一年以后,有可能被提升到更高的职位。但有些可能在10个月以后被提升,另一些在12个月以后被提升,还有一些在14个月以后才被提升。然而,这一批人平均是12个月即一年以后被提升。又如,教师在课程开始时就告诉学生在这门课程中将有一系列随堂考试,作为成绩的30%,但具体的考试时间和次数学生并不知道,教师运用的就是可变时距强化。

④可变比率的强化。是指强化的次数与目标行为发生的次数之间的比例是变动的。例如,销售商对于潜在用户,有时只要2个电话就能谈成一笔生意。有时可能要20次或更多次电话才能探测一笔交易。这种奖励是变化不定的,它取决于销售商成功洽谈的生意的数目。

对强化程序和员工行为的研究表明:连续型强化程序容易导致过早的满足感,在该程序下,强化物一旦消失,行为倾向于迅速衰减;不过,连续型强化方式适合于新出现的、不稳定的和低频率的反应。与之对照,间断型强化程序不容易产生过早的满足感,因为它并不是每一次行为发生之后都有强化,这种方式适合于稳定的、高频率的反应。总体上看,可变程序倾向于比固定程序导致更高的绩效水平。我们已经注意到,组织中的大多数员工以固定时距方式得到报酬,但这种方式并未清楚、明确地表明绩效和奖励之间的清晰联系,奖酬是根据工作中所花费的时间而不是具体的反应(工作绩效)而提供的。相反,可变时距方式会产生更需要反应机率和更稳定一致的行为,因为在这种方式中,绩效和奖励之间的相关性很高,而且其中包含了不确定性的因素,从而员工倾向于更为警觉。

上述的各种强化程序安排各有其优缺点,应根据组织性质、人员素质、经营管理水平等因素的不同而采取不同的强化程序。实际上,在一个组织或一个企业里,也可综合使用不同的强化程序以达到相应的目的。

4.在管理中的应用

(1)分步实现目标,不断强化行为

强化理论的研究结果表明,当人的行为得到及时的奖励和肯定,该行为出现的频率就会增强。根据这一规律,管理者对员工的要求或制定的目标及奖励的标准要具体、客观、适宜。目标标准太低过细,一点小事就奖励,就会变得庸俗烦琐,激励作用减弱;目标标准太高、太远或太空,既不能检测、反馈和修正,又不能使员工的积极行为得到及时的强化、扶植,最终其积极性就会消退。大量的研究结果表明,当目标较大时,应采取分步到位的方法,把复杂的目标行为过程,分解为许多小的阶段目标来完成,利用每步所取得的成功结果,强化员工奔向总目标的积极性。

(2)强化力度必须达到最小的临界值

奖惩的数量大小要适当,要让接受者感受到影响力。如奖金的数量太小(几元、十几元钱),既给员工提供了相互比较、易产生不公平感的机会,又不能产生激励作用,这样不如不给。但奖金的数量太大,不但成本高,也失去进退的余地。另外,强化物要投其所好,满足不同人的不同需要,提高其效价。

(3)奖励要及时,方法要创新

现代心理学认为,当员工做出成绩时,如能给予及时的奖励,就可以使被强化者及时意识到强化与目标行为之间的联系,收到最佳奖励效果。如果时过境迁再给予奖励,甚至受奖者都忘了奖从何来,其激励作用就会大大降低。另外,同一种刺激如果多次重复,其作用就会衰减。因此,管理者要善于更新奖励方法和方式,利用新颖奇特的刺激来提高激励效果。

(4)奖惩结合,以奖为主

在对员工正面强化的同时,也要善于运用惩罚的手段削弱、改变、控制员工的不良行为。但是进行惩罚时应注意:①惩罚要合理及时;②惩罚要考虑行为的原因与动机,如对因家庭遭到不幸而情绪低落、工作懒怠者应从轻处罚,对顽劣成性者则应从重处罚;③对员工的一般错误,应给予教育、从严处理、从宽惩罚,这能使员工感到内疚,可避免产生抵触情绪或逃避心理;④惩罚方式要适当,对错误较小、影响不大的,宜采用个别的口头形式的惩罚,对重大错误且影响较大的,应以公开的书面方式为宜。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈