于大海的博客    海哥哥的周刊
用智力探索真知 用大脑探求真理
  质评IQ智商理论    上一篇  下一篇    
  发布者:于大海 |  浏览(10091) 评论 (29)  | 发布时间:2006-09-25 09:32:17 最后更新时间:2006-09-25 09:32:17  
  本作品所属分类:科学探索 文章类型:普通 推送到圈子 | 推荐给好友| 我要举报| 收入我的网摘  
 
 
质评IQ智商理论
 
作者:于大海
 
      大家知道,在智力心理学领域里有一个在社会上认可度相当高、影响面相当大、普及率相当广的理论与方法,这就是所谓的“智商”(IQ)理论和智力测量方法。
      何为IQ“智商”理论?这就是用量表形式对人认识、理解客观事物并运用知识、经验解决问题的能力进行检测,并用分值的方式进行标定的一种智力测验方法。
      用量表测验智力的理论最早始创于高尔顿(F.Galton),1883年他在《人类才能及其发展的研究》一书中就提出了智力测验量表的想法,并研制出了一个关于感知运动方面的测验来鉴别一个人的智力潜力。在这个测验中包括了反应时、视听的敏锐度等项目——因为高尔顿一直倾向于认为,感觉辨别力是心智能力中的最高能力,因此从各种感觉辨别力的测量结果中就可以推估出一个人的智力水平。为此他还专门创设了一个人类学测量实验室,对包括智力在内的人类心理功能进行具体的检测。在长达六年的时间内共有近万人接受了这种测量。
      1890年冯特的学生和助手,美国学者卡特尔发表了《心理测验与测量》一文,首次采用了“心理测验”(Mental Test)的概念,并具体编制了一本实验室手册,提出了一  个五十种的测验项目,其中包括了各种感觉能力和心理时间、心理强度与心理广度等内容,并用此对哥伦比亚大学的志愿者们进行了实地测验。
      世界上第一个正式的智力测验量表是1905年由法国医生比奈和他的学生西蒙(T.Simon)共同编制的(它登录在《诊断异常儿童智力的新方法》一文中)。这个量表是受法国政府委托,主要为区分智力异常儿童愚鲁的程度和等级以应进行特殊教育之需而设计的。该量表由30个题目组成,其中包括摹画图形、比较长短、倒背数字、词句重组、说明字义、识认物体、辨别食物等内容。1908、1911年经两次修订后,测验题又增加到59项,并使其成为了一种年龄量表——它以这样的假设为基础,即智力是不断发展的,并与年龄的增长具有平行关系。因此它的测量方法就是按年龄分组规定很多测验题目,每个年龄组一套,每套包括测验各种能力的题目。测量时让受试者回答一定年龄组的规定题目,得出该受试者的心理年龄,然后根据心理年龄的高低来衡量智力水平。如小儿能通过4岁的测试项目,则该小儿的智龄就是4岁。如智龄与实龄相同,小儿为正常智力;如高于实龄则为超常智力,低于实龄则为低常智力。这种表示智力水平的方法,不能用具体数字来表示小儿在相同年龄组的智力水平,因此属于定性的方法。
      自比奈-西蒙量表发表后,很快就引起世人的关注,并迅即得以推广。不少学者还根据本国的实际和个人的认识,又推出了许多新的量表,不仅大大扩展了测验的项目和测量的范围,而且还把原来只适用于为愚痴儿童进行分类定性的智力测验方法延展到了正常状态儿童和成人群体之中。
      比较著名并带有标志性的测验方法和量表,如由美国斯坦福大学的特曼在1916年修订的斯坦福-比奈量表(Stanford-Binet Intelligence Scale),该量表共分为六个亚测验:记忆、词汇、空间关系的理解、文字推理、数学推理和抽象思维等项目,并首次采用了“智力商数”(Intelligence Quotient)的概念,简称IQ(但“智商”这一概念却是由德国心理学家威廉·斯坦姆在1911年提出的),用来标示智力的等级。从此智力水平引进了数字概念,其方法也由定性转为定量计算了。具体方法就是智龄与实龄的比例乘以100即为智商(IQ=MA÷CA×100)。如果某儿童的智龄与实龄相等,他的智商即为正常值100;如果智商低于和高于100,则智力就偏低或偏高。为便于进行具体的衡量和比较,特曼还制定了一个智力等级的分类标准表。[见表1]
智商的范围       智力的等级
>140          天才(Genius)
120-140        超高智(Very Superior)
110-120        高智(Superior)
90-110         中等(Average)
80-90         愚钝(Dull)
70-80         临界线(Borderline)
<70          低能(Feebleminded)
--------------------------------------------------------
表1   特曼智力等级分类表
      还如,由美国医生韦克斯勒(D.Wechsler)编写的《学前儿童智力量表》(WPPSI,1963年修订,适用于4-6岁幼儿)、《学龄儿童智力量表》(WISC,1959年制订,适用于6-16岁儿童)、《成人智力量表》(WATC,1958年制定,适用于16-48岁的成人)也很有影响。在韦氏量表的项目中包含两个大的分量表。言语分量表包含一般知识、理解能力、词汇、数字记忆广度、算术推理、识别言语的相似性等分测验;作业分量表包含物体拚凑、填图、按照意义排图表、按照图案搭积木、学习以符号配数字等分测验。因此用韦氏量表可得出三种智力分数:言语分数、作业分数和总的智力分数。另外该量表首次使用了“离差智商“的概念,即以标准差为单位表示被试者成绩偏离同年龄组平均成绩的距离。如设定每个年龄组的平均成绩为100,标准差为15。这样85分就是低于一般,而115则为高于一般。以此可衡量智力的等级。该方法由于其测验结果可以在同年龄儿童间进行智商的比较,以及能够将量表的适用范围延伸到16岁以上的成人,从而克服了普通量表在计算智商时要受到年龄制约,即最高只能以16岁为除数的缺点。韦克斯勒也制定了一个种类等级分类表。[见表2]
----------------------------------------------------
智力等级                    IQ的范围
超高智(Very Superior)    130以上
高智(Superior)        120-129
聪明(Bright)         110-119
中等(Average)         90-109
愚钝(Duil)            80-89
临界线(Bordriine          70-79
智力缺陷(Mental Deficleney)  69以下
------------------------------------------------------
    表2  韦克斯勒智力等级分类表
      再如,1936年英国心理学家瑞文推出了一个非文字式的智力量表,简称瑞文推理能力测验。整个测验共由60张图案组成,测验主题分为五组:A组测验知觉辨别力、图形比较、图形想象力等;B组测验类同、比较、图形组合等;C组测验比较、推理、图形组合等;D组测验系列关系、图形套合、比拟等;E组测验互换、交错等抽象推理能力。测验通过评价被测者这些思维活动来确定智力活动能力。测验结果可以计算出原始分数(满分60分),然后根据常模资料换算成智商值。瑞文测验由于其使用方便、应用广泛而大受人们的欢迎。
      另如,1940年由美国学者格赛尔(A.Gesell)提出的《格赛尔发展量表》(分为<婴幼儿量表>,适用范围为0-3.5岁;<幼儿量表>,适用范围为0-5岁;<智能初检表>适用范围为4周到3岁)、1967年由美国儿科大夫佛兰肯勃利(W.K.Frankenbury)和道兹(I.B.Dod-ds)创制的《丹佛发展筛选量表》(DDST,适用于6岁以下幼儿)、1969年由美国学者贝利(N.Bay ley)编制的《贝利婴儿量表》等一批专门应用于婴幼儿的量表也形成了很大的应用规模。
      另外,还有诸如《斯特朗-坎贝尔兴趣问卷》、《爱德华个人倾向量表》、《霍兰职业爱好问卷》、《艾森克个性问卷》等有关职业倾向和个性特征方面的测验量表也很盛行。据估计,目前世界上有关智力测验的方法已达几千种之多——在1972年出版的《心理测量年鉴》第七卷中就介绍了1160种(其中包含了131种智力测验、536种成就测验、147种人格测验和747种其他形式的测验)。用智力量表方式测验人的智力已成为当今世界的一种时尚,并且在教育领域、军事领域、医学领域和司法领域等都普遍感受到了这种测验运动的影响。与此同时,智力测验也已发展成为一项高度专业化的职业和实业领域,并有数以万计的人在从事心理和智力测量工作。在美国就设立了很多专业的测验机构,如“美国心理公司”、“美国教育与工业测验服务中心”、“美国就业服务中心”等;美国每年出版的用于商业性目的的测验试题也有好几亿份以上;据一个1984年的调查资料显示,仅在美国应用的职业兴趣测验每年就达350万份以上。
      毋庸置疑,智力测验法的问世(由于它的标准化和数量化特点),对于千百年来建树不多的智力测量领域的确带来了一股清新的空气,它激发了人们的创新意识,并引发了智力测验的热潮。各种测验法的应用,在因材施教、职业选择、临床应用等方面都发挥了一定的作用,也产生了一定的功效(其中最有影响的几次大规模的应用都发生在美国。1917-1918年期间美国曾对1,726,966人进行了群体智力测量用以遴选兵员。在这次测试中共有7900人被淘汰,还有9487人被编入预备队接受观察;1921年,美国在空军进行的征兵中,又对25万名学生进行了智力测验,其中获得140分以上(即特曼智力分类标准中属于天才等级的智力商数)的有11560人。这应该说是很有成果的),于是乎人们在一时间又对智力测量方法产生了很多偏执性的认识——有的人就盲目地把它尊崇为,“人才选用的依据、生活咨询的参考、因材施教的工具、教育计划的助手”,是检测人类智力“唯一方便、十分有效的方式”。
      但是,人类社会的世象经验却告诉我们,在一个朦胧含糊的理论导引之下和在对智力概念偏狭理解的基础之上所设计出来的计量工具和检验方法,在被头脑昏然的人们使用一段时间并被过份渲染之后,就必然会在糟蹋被测量的对象并在耽误他们前程和贻误他们青春的同时又锈蚀了自己的理论和工具本身。这或许也是智力测验方法问世至今不仅未有得到实质性突破,而且还屡受责难的一个重要缘由吧。因此,还是在流行了近一百年后,反面的呼声也在甚嚣尘上了——智力测量法又象当年的颅相学一样也处于了芨芨可危的境地了。美国著名学者斯蒂芬·杰·古尔德(Stephen Jay Gould)在《对人的错误测量》一书中就强烈抨击了对智商和其他量化标准的滥用;美国著名心理学家丹尼尔·高曼也用他的EQ理论向IQ理论发起了一轮“狂轰乱炸”般的攻击;一些爱挑毛病的人也在历数智力测验在信度和效度等方面所暴露出来的一些显而易见的问题,以及IQ理论在现实生活中所造成的种种负面影响。比如珍妮特·沃斯(J.Vos)和戈登·德莱顿(G.Dryden)就批评说:“或许这个世纪最糟糕的教育改革就是所谓的智力测试”,“所谓IQ或智商测试的最大错误在于把逻辑与综合智力混淆起来,而逻辑只是思维技能的一种形式”;而我则更认为IQ理论所存在的缺陷要远远大于它对智力科学所带来的正面影响,智力测验所引发的问题要远远大于它对社会所建树的业绩——应该说,问题的确是显而易见、影响的确是十分消极的。
      下面我就从两个侧面谈谈自己的看法并进行具体的评述。
(一)智力量表不具备测量智力的功能。
      由于智力是人类大脑特定部位的一项特殊功能,智力在本质上所反映的就应该是人类大脑特定部位神经组织的一种生理功能和生物特性。因此,所谓智力测量从原则上讲就是要把大脑组织的状态和神经活动的质量真实地预测和反映出来。智力量表作为智力测量的一种工具无例外地应该担负起这样的职责。但由于量表的设计主要基于智力是人类的一种总的识认能力这样的认识,因而使得量表不论是在格式的编排上,还是在检测的方法上从一开始就摆脱不了问卷和测评模式的束缚,即它施测的内容是知识、运用的方法是考试、标定的分值是IQ。这样就从根基上偏离了测量智力的正确轨道,使得这种测量形式不能触及到智力的本质,因而最终也就达不到量度智力的目的。
1、智力量表不能检测智力的素质。
      我们知道,人类的智力素质是大脑神经组织对机体内外部信息的驾驭程度和反应水平——这种程度和水平表现在神经活动的速度和深度方面并通过人类的行为方式、处事原则和思维方法体现和反映出来。而对它所进行的量化就需要针对人类行为的方式和神经反应的水平方面了。但是,由于智力量表把其施测的着眼点放在了人类文化素质和知识含量方面,因而使得它的测量只涉及到人类行为的外在形式和智力的外部特征,即认知功能方面了,而检验所获取的结果也无外乎是体现在对知识的运用、对信息的掌握、对事物的判断等具体量项上了——毫无疑问,人类行为的这些表现形式对推断内在智力素质好坏有某种间接的帮助(一个愚笨的人肯定不会在认知和行为方面表现出高度的水准的),但一方面由于在人们进行识认和获取知识的过程中,不可避免地要受到外在因素的制约和影响(比如教育的、阅历的、环境的和家境的等);另一方面也由于在施测的过程中,不可避免地要受到人为因素的干扰和左右(比如样本的、常模的、经验的、情绪的、评价的等),因此就将会不仅使其所运用的形式实现不了科学测度智力素质本身的目的,而且还会使所获致的结果距离科学测度智力素质的要求相去甚远。
      我们可以这样想见:一个只是用有限的项目所组成的文化量表(智力测验的内容一般包括着诸如形象知觉、空间关系、言语推理、机械推理、字词知识、文书速度、数字运用和记忆效率等方面的问题。因此一个普通的智力量表也只能编排和容含进大约十几个类型的测验项目),它怎么能够反映得了一个人的整体行为特征并测度得了智力的整体素质?而一个只是用简单的题目所堆沏的知识问卷(如通过像“人有几只耳朵”、“狗有几条腿”、“你的鼻子在哪儿”、“什么是橘子”等内容的问答,你到底能企望它解决什么问题;或如通过像比线的长短、比图的大小、比量的多少等形式的作业,你又到底能期望它测量到什么东西----一个不能鉴别和比较诸如长短、多少和大小等类比关系的人还需要通过这样的方式进行判断和测量吗?或者说通过这些分数所得出的有关被测对象的智力水平的判断又有多大的准确性----一个智商的高分却尽可以是由于受到了早期教育,或者是由于家境优越而见多识广所获取的),它又怎么能够担负起预测智力水平并给智力定性这样重大的任务!诚如托尼·巴赞所言:“提倡智商检测的人对于测试和结果太过于关注了,从而忽略了被测试的大脑本身。他们的测试并没有测到基本的人类能力,而是对没有经过培训和开发的人类行为进行测量”;还有一位学者则认为,IQ通常是从受测者在一些试题上的答案评价出来的。受测者在智力测验上所得的IQ分数,只是该受测者在测验题目上的表现。因此IQ不能充分地反映一个人智力的全貌。
2、智力量表不能检测智力的过程。
      我们知道,智力是一个发展的概念和成长的事物。因此智力形态就难免要经历几个不同的过程和量与质的转化阶段。智力的这种过程性主要体现在两个层面上:一是人类种系智力从低级到高级的发展过程;一是人类个系从幼年到老年的发育过程。作为一个智力测量工具无例外地应该将这样的两个层面中每个阶段不同的智力状态反映出来。即一方面当我们要对生活在不同历史时代或处于智力不同发展阶段的人群进行测量和比较时,不至因为需要用两个不同的尺子施测而丧失其检测评量标准的一致性,从而不能实现对人类整个智力发展过程的有效鉴测;另一方面当我们要对处于不同年龄阶段的同一个个人进行智力的检测和跟踪时,又不至因为使用的同一套量表样本相关性不好,或不同量表间常模标准化各异而影响到对各阶段智力水平的客观和平衡的反映(即要避免出现在一个人童年时期的智力测验中得出了优秀的量值,而在中年期测量时却得出了良好的分值;或在一个人童年期的第一次测量中取得了中等的智力商数,而在间隔不长时间所进行的第二次测验中却又获致了上等的成绩这样的情况)。但智力量表的问题恰恰出在了这里。
      首先,量表的施测面非常狭窄——由于量表采用的是问卷形式,因此使它只能应用在活体的人类身上而不能对故去的人施测。比如对亚里士多德、对马克思的智力水平就不能运用量表形式进行测评,而当我们必须要对古人进行智力测量(这是避免不了的和经常需要做的事情)时就需要动用另外的测量工具(虽然现在还没有这样的一种测量工具),这样在两种“尺度”之间进行评量就会非常困难和难以掌握——那种通过其成就所做的推估因具有很大的随机性和臆测成分而缺乏实际的意义(1926年,美国学者柯克斯(Catherine Cox)就曾通过自传和传记资料为世界300个历史上智力超常人物早年的心理品质进行过智力商数方面的估测,所获得的平均智商为155分,其中高尔顿的得分为200,伏尔泰为190分,康德为175分,拜伦为150分,瓦特为140分),因为一方面,人的成就在很大程度上要受到机遇和外部因素的制约和影响(所谓的德、才、机、识等),而另一方面,对很多需要进行智力评估的无名古人来说甚至于连这样的成就依据也难以找到——况且这种成就的评量标准又是难以设定的(我们应如何估计和评价古代的德漠克利特撰述原子论和近代的道尔顿阐释原子论时所需要的智慧孰高孰低呢?我们又应如何评价中世纪时所发现的“地心论”和近时代所发现的“日心论”之间谁的知识含量高呢?但在这里我却可以负责任地说,那些在知识积累时代创造基本定理所需要动用的脑筋绝不应比知识爆炸时代阐述基础理论的耗费来得要小;那些在原始社会时期创造简单工具所需要具备的智慧绝不应比在现代社会创造先进工具的水平来得要低;而且在这里我还可以明确地说,自五万年前现代人类在地球上诞生以后,居于同一个人类种族的人群中间在智力水平方面已无大的差距可言了(或者反过来说,如果道尔顿生活在2300年前,其创造的业绩也绝不会比德谟克利特辈为多——因为文化是延革的,知识是累积的。道尔顿的成就在很大程度上得赖于这种文明的传承。但所有这些通过智力量表或文化测验的方式是绝对不可能进行衡量、估测和检验的)。
      再是,量表的预测点非常局限。一个合格的测量工具不仅要求有良好的诊断功能,还应有良好的预测功能。因为一个人在其成长的过程中虽然就其智力总体水平而言会是一个恒定的因素,并体现着一个稳定的量值——如果说一个人的智力水平是中等的,那么也就意味着他一生的智力水平都是中等的,而不会出现童年中等、青年上等,到老年就是下等的这种情况(也就是说,只要不是涉及到大脑发育上的障碍,那么一个人在其任何一个生命阶期中都会按照自己特定的遗传潜质发展,并能在与同期的、同类的比较中折射出自己立身其中的特定位置)。但是如果就他的智力发展曲线讲,一个人的智力的确是经历了从低到高再到低的过程,即童年期幼嫩的智力、青年期平台的智力和老年期衰退的智力。显然量表对智力这样一个连续过程的跟踪,以及对智力这样一种恒定因素的反映就是相当不够和十分欠缺的。
      一方面由于量表在常模设置和内容设计上的人为性,因而使得每一种年龄量表之间缺乏良好的衔接性,即在同一个个人身上使用同一套量表检测,却反映出了不同等级的智力水平来——美国有一个研究,计算了在3、6、9、12、18和24个月时儿童的测验分数同斯坦福-比奈测验在5岁时的测验分数之间的相关表明它们的相关性是很低的,而且随着两次估计之间的时间距离的增加,这种相关便趋于降低[见表3];还有一个学者也是用斯坦福-比奈量表检测了同一个儿童在4岁和10岁这两个不同年龄段的智力分数,结果得出了0.73的相关系数;
 表3  早期测验与后来测验间的相关
年龄      儿童数目      相关系数 
3个月~5岁   91         .008
6个月~5岁   91         —.065
9个月~5岁   91         —.001
12个月~5岁    91          .005
18个月~5岁  91          .231
24个月~5岁  91          .450
      麦克法兰和艾伦也发现,在“儿童指导中心”中,在6岁和18岁之间测验了几次的252个儿童中几乎有60%的智商改变了15分或15分以上(哇,这么大的一个分距呀!它足可以改变一个人的智力档级了)。松塔格、贝克尔和内尔森等几次用斯坦福-比奈量表跟踪测试了一批3岁到12岁的儿童,绝大多数都没有得到同样的智商分数,有的儿童智商变动还很大。  如果说在同一类量表间都能够出现这种问题,那么在不同类量表间的衔接性就会更成问题了(因此我们完全有理由将一个得出韦克斯勒量表和斯坦福-比奈量表0.83相关性的结论不置一词)。
      再一方面就是,由于量表有效的检测时期只体现在一个特定的生命阶期内——如大多数量表只能应用于16岁(这大概是基于心理学界的一个通行的看法得出的认识,即人到了16岁左右的年龄就意味着其生理水平已达到了成人阶期,而其智力水平亦会相应达到百分之百的量值。比如苏珊·格林菲尔德就认为:“我们需要约16年的时间才能认识作为一个成年人的潜能”。但智力测验方法的设计师和推崇者们却忽视了一个基本的问题,即人的文化知识在16岁以后仍然是在增长的——尤其是人的大学生活都是在16岁以后经历的,那么如果把这种具有文化性质的智力测验量表也规定在16岁的范围内并以此作为智力水平的评量标准,不啻于给智力测验的科学性打了一个很大的折扣,并又会从根本上否定了自己的这种智力测验方法)以下的人群,个别的如韦氏量表、瑞文量表等虽然把检测期限扩及到16岁以上的成人,但它也无法显示这个完整阶段的智力变化情况。比如,我们用韦氏成人量表检测一个耄耋老人,他所获得的100分的智商就会完全不同值于在他幼稚时期用韦氏儿童量表所获得的100分的智商(因为他不再需要回答诸如“你有几只耳朵”这类浅显的问题,也不会在诸如“达尔文是什么人”之类的常识性的问题上失分了);或者反过来说,一个在16岁时通过韦氏量表所获得的120的智商分数的人,却难保当其到耄耋之年时会在同一份韦氏成人量表的测试中还能获得120分的智力商数。那么这种前后的智力测验分数的所谓相似对一个人的智力水平又能说明怎样的意义呢?很显然,现行的智力量表体系难以使人类社会的每一个成员在整个生命阶期中的智力状况得到随时的监测和即时的反映。卡特尔早年曾对智力测验标定下了一个美好的愿望:“如果我们规定一个一律的手续使在异时和异地得出的结果可以比较、综合,则测验的科学性和实用性价值都可以增加”。可惜,这位心理学大师的设想并未在智力量表这种测验方法上得到实施(当然也不可能得到实施,因为由于测验形式自身具有本质性的缺陷,所以这个“一律的手续”在这种方法上是不可能被规定出来的)。如果说这里除了反映量表之间的衔接性问题外,同时也反映出了这种测量方法自身的局限性,及对测验分数进行测定的科学性问题。有的学者说,我们没有测定这些分数的手法,事实上也不可能存在着可以测定分数的东西。丁·沃蒂斯认为,“没有一个智力测验能够设计或能够兼顾如此之多的复杂性,并具有无限的效力”。当然问题的关键则在于我们经过改进和革新后能不能弥补这个毛病。
      但我们现在就可以肯定地说,就现行的智力测验方法及这种测量方式而言这一点是不可能做到的——尽管我们在理论和技术上能够做到这一点,但是由于这种智力测量立论上的错误和方法上的局限,因而也就决定了它的命运。首先是体现在编制者方面。由于量表的编制要受到人为因素的影响(一个人一个想法、一个量表一个尺度),因此它的随意性很大,在量表与量表之间难以进行统一和规范(势必是一个量表一个结果);其次是体现在测量工具方面。由于智力量表运用的主要是类似测验和考试的方式,因此它只能是用知识类的内容和知识测评的方式,并且只能是用有限的题目来考察受测者的一部分行为,而不能包揽智力的全部概念。而且最为重要的是它不能成为公正和客观化的工具。因为任何一个测量都必须作到客观和公正——它的结果不能随时间、地点而变化,它的工具不能你量他量一个样、今天量明天量一个样;再就是体现在受试者方面。他的测验成绩要受制于知识面和经验的影响(克雷奇就认为:“一个人特有的文化背景及经验,不可避免地要影响他对这些完全和个人的真正智力无关的项目作出正确反应的能力”)。比如一个生活在中世纪的十岁儿童和生活在现代的十岁学生就难以获得可以进行比较的客观结果。所有这些问题就必然会限制了它的手脚,使它不可能摆脱这个“樊篱”。这就有如要一个患先天小头畸型病的人实现其大脑神经组织的增容那样的不现实,
3、智力量表不能检测智力的内涵。
      智力是人类的一个主要标志,也是人类行为表现的一个总体象征。如果说一个人是一个完整的概念,那么一个人的智力就是体现这种完整意义上的人的一个内隐的指挥者。因此智力的内涵实际上包容着一个多相度的含义——既包含着学业方面的和识认方面的,同时也包含着情感方面的和意志方面的等等(早在十八世纪著名哲学家康德就把心智区分为知、情、意三大领域,十九世纪的心理学家们也把心理现象划分为认识、情绪、意志三个过程;还有不少的学者则悉心地注意到语言所能表达的只是心智中的一部分内容,在心智之中还有一些只能显现却不能表述的东西。比如英国著名哲学家维特根斯坦(L.Wittgenstein)就把逻辑形式看作是只能显现而不能说的东西),亦即由大脑左半球皮质所控制和掌管的语言性的或直线性的或特异性的智力,以及由大脑右半球皮质所控制和掌管的非语言性的或平面性的或非特异性的智力。
      但是我们的这种智力测量方法实际上却只是在断取智力的某一个侧面和某一项内容进行检测,因此使得智力测验所揭示出来的结果最终只能是从侧面反映了一个人智力水平的某一个方面,如知识水平、学习能力或语言表达功能(这些当然不是真正意义或完整意义上的智力功能了),而没有能够囊括智力的整体内容和所有方面,诸如情感的、形象的、平面的和空间的方面等等(有的个性问卷虽然包含了情感因素的考察内容,但是它也仍然是在与学业内容相隔裂的情况下设置的;有的智力量表,如韦氏量表虽然包含了空间性的和操作性的测验内容,但是也仍然是在把它作为一种辅助的情况下设置的),为此有人曾责怪现行的智力测验方法测量的只是“左脑智力”。如若这样,那么这种打着智力概念的旗号和顶着智力的名义进行的所谓智力测量就是对智力的歪曲和亵渎之举了——正像我们已经看到的那样,由于这个问题的存在,不仅影响了对智力科学含义的准确把握,甚至还直接影响了智力和智商的威信。人们由此把智力及其智商(IQ)摆在了一个很不经意的地位和很不被人看重的地步上去了(不是有人说,决定成功的要素,智商只占有20%的成份,而情商则可达到80%的份额吗)。现在人们对智商的无知非议和对情商的盲目推宠其因都概出于此。但即使在这样的一种情况下有一个观点却仍然是可以直陈的,即IQ和EQ这两种测量结果都没有能够完整和科学地反映人类智力的真实状况——传统的智力测验主要测量的是左脑的智力,即语言的智力,而现行的情商智力则主要是强调右脑的智力,即非语言的智力。因此相对于一个完整意义上的智力来说,两者都会因为没有实现测量智力的目的而了无妄自菲薄或妄自尊大的资格和理由了。
(二)智力商数不具备验证智力的效能。
      我们知道,人类的智力是一个稳定的量值,即一个人所具有的智力水平在该个人身上具有相对的稳定性。这就要求对这种量值的测评结果也需要可靠和稳定,即由智力测验所获得的智商分数不会因为受到外部环境的干扰和人为因素的影响而改变其量值——不然的话,它就不能达到验证智力素质好坏的效能,也不能成为预测智力水平高低的依据,因而也就不具备智力测量工具的资格。智商(IQ)作为智力测量所获得的一个结果恰恰没有实现这样的要求。麦克莱伦(McClelland)就曾断言:“智力测验或学校得分除记载有关本人情况于学院证书这种益处以外,对于预测取得许多人生成果的实际能力,都好象是作用不大的”;克雷奇也认定:“甚至很精致的、多方面的智力测验也越来越明显地表现其预测能力是有限的”。大量的事实已验证了智力测验方法在这方面存在的问题。
1、IQ分数高低可以受到样本和常模的左右。
      正像我们已经知道的那样,智力量表是以知识测验的方式体现的,因此在量表编制前事先建立一个智力常模(所谓常模,亦指比较标准。具体地说,是指在智力测验中常用的标准化样本分数。个人在智力分配中处于较高水平还是较低水平,要由测验所得的实得分数与标准化样本的平均分数以及各分数的分配状态互相参照才能决定),但要真正做到编制出一个适合人类各演化时期、各年龄组段、各族群类型、各文化背景等条件,并且是包含智力不同侧面的标准化量表,是近乎不可能的——因为这除了要受到量表编制人员的认识水平、他所接触的范围和取样标准的代表性,以及所处时代的文明程度的影响之外,尤其要受到量表文化测验性质本身的限制。这就势必是一个量表一个样,而且每一个量表间的相关性也难以有一个尺度,这就很难做到客观、统一和标准化,其测验结果也就不会准确和可靠:这样就出现了用不同的量表就会测量出不同的智商标准,甚至在同一系列的测验方法的应用上也会出现很大的误差的情况(这对于要通过它来验证一个人的智力水平这样严肃的事情来说是绝对不允许的)。比如,在“伯克利指导研究”中,3岁时的IQ和5岁时的IQ相关系数仅为0.54;而我本人则在用比奈量表测验一个七周岁儿童时,他能完成七岁组的所有项目,但对六岁组,甚至五岁组的项目却没有回答完整。
2、IQ分数高低可以受到出身和教育因素的制约。
      智力测验既然采用的是类似考试的方式,就必然要以人的文化水平和受教育的程度作为测量的重点。况且这样一种方式的智力测验量表也必然要以问答的形式出现,并且要以人们对测验题目的行为反应来估计其智力的(虽然比奈和西蒙当初在设计量表时曾考虑到要把智力与教育分开来:“我们唯一要测量的是智力,尽可能地不顾及受试者的教育程度。测验者应当把被试看作是既不会读也不会写的毫无知识的人”,但最后连他也有违了自己的初衷——他本人设计的智力量表就是一个典型的知识问卷,比如区分性别,说明橘子和吸管的作用等题目就罗列其上了;在斯坦福-比奈量表中也有着诸如,一只手有几个手指、星期二的前一天是星期几、鸟和狗有什么区别等问题充斥其中;而韦氏量表则干脆把“什么是象形文字”、“达尔文是什么人”、“是谁发明了电灯”等这样的内容也赫然于纸上了)。为此古登诺夫-哈里斯(Harrls)就曾断言:“要寻找不受文化影响的测验,无论是智力测验,艺术能力测验,个人社会特征测验,还是其他任何可以测量的品质的测验,都是一种幻想……”;还有的学者也认为:“从目前情况看,还无法设计出一种纯粹的‘无文化约束’的智力测验”(据说加拿大心理学家欧特尔(J.Ertl)当真设计了一种所谓与文化无关的智力测验法,即大脑神经效率测验法——它是通过测量思想反应速度来鉴定智力的。其方法是,在头皮上贴一些电极,用一闪光灯无规律地发出一百次闪光,再用计算机根据他的脑电图运算出脑对闪光的反应速度。但我真怀疑它真的能把智力水平测量出来;而还有的学者则是应用诱发电位的方法来检测人的智力水平)。
      因为“智力测验项目必然要涉及真实世界里的人物和事件,而一个人特有的文化背景及经验,不可避免地要影响他对这些完全和个人的真正智力无关的项目作出正确反应的能力”[巴赞语]——事实真要是如此的话,那么这种以文化知识和信息载量为重点的智力测量方法,对于一个能够受到良好教育或在知识和信息获取上比较方便的人来说就会占很大的便宜。如在一个富家子弟和一个穷孩子之间,或一个城市儿童和一个农村儿童之间,用这样一种量表所进行的测量就难以反映出智力的真实水平。英国心理学家拔特通过实验就认识到智力测验对伦敦上等社会的儿童特别有利,他发现教学水平较高的学校的儿童比教学水平较差的学校的儿童平均高出一岁或两岁的智龄。美国学者的研究结果也证明,“白人与黑人之间的平均差通常徘徊在10~20IQ分数之间”。同样,我国学者也曾测验过一个大城市(甲城)和一个中等城市(乙城)及其郊区的儿童的智力,发现甲城儿童的智力高于乙城儿童,乙城儿童智力又高于郊区儿童。但是这却并不能由此证明前者的智力素质要比后者为高。一旦我们的那些来自贫苦人家和贫困山区的学子们能与大城市的富家子弟接受到同等条件的教育时,他们的聪明才智就会显露出来,他们的学业成绩也会毫不逊色于人——赫比(F.Heber)通过对美国密尔瓦贫民窟地区一批母亲智商非常低的儿童进行一周五天紧张的学前教育以后,就使他们都获得了100以上的智力商数;在纽约儿童救护会50年收养的2800名孩子的父亲多数都是乞丐和流浪者,但由于在后期受到及时救助和良好教育,转而使87%的孩子成为社会有用,甚或是出色的人才;法国国家卫生与医学研究所和巴黎家庭医疗中心的专家曾经选择了65名4-6岁的被领养儿童进行专门的指导,几年后他们的智商就由原来的80分以下而提高到100分以上了。美国有一位学者认为:“当我们将智商与学术成就相比较时,就会发现在学术和文化上丧失良好教育的人中有大量未开发的人才,例如在部落、在少数民族中,以及家庭经济条件较差的儿童中就有这样的人才”,布隆伯格也曾记述说:“从历史上看,绝大部分伟大作家、艺术家、音乐家、舞蹈家、大律师和运动员来自经济环境较差的家庭”——可谓“英雄起陇亩,天子多布衣”、“自古隽彦出寒门”。但他们却往往会成为智力测验及其结果的歧视对象和落第者了——可见,智力测验的结果的可信性和可比性是令人怀疑的。难怪有人经常提出这样的诘难: “智力测验到底测验的是什么”?
3、IQ分数高低可以受到练习和经验的影响。
      这是障碍智力测验信誉的一个很重要的方面,也是科学测量人类智力所不应该存在的致命弱点之一。比如有两个儿童,甲在出生后第一次接受测验,而乙却参加多次了,那么后者的经验将会大大有助于其临场的发挥,而这样所得来的测验成绩不仅不能客观评价两者间的水平,也不能很好反映本人的水平;再比如以同一份测验量表对同一位被试进行两次测验的话,那么其得到的结果也自然会大不相同。有的学者估计,在一般情况下在两次不同的测验状况中,同一个人的智力商数可以相差10分左右。美国一位学者的试验对比结果证明,儿童在第二次参加这种智力测验时,得分将比第一次提高5~8分——即使是接受两个不同量表的测验其结果也是如此,这主要是由于对测验要求和过程的熟悉之故。
      很显然,如若通过练习就可以提高一个人的智力商数,那么这种智力测验方法就是十分糟糕的,那么这种智商分数也就不应成为一个人智力水平的检验标尺和对智力素质进行鉴定的工具。由于注意到在智力测验中存在着这样的缺陷,有的国家已开始在立法中作出了某些规定,力求避免因不合理地测验对人们的平等机会造成妨害。美国心理学会颁布的《心理学家的道德标准》中规定:“心理学家有责任在教学中控制对心理测验和其它手段的介绍,以防它们的内容和编制原则披露给公众,从而影响这些技术的有效性”。由中国心理学会颁布的《心理测验工作者的道德准则》中也规定:“为维护心理测验的有效性,凡不宜公开的心理测验内容、器材、评分标准以及常模等均应保密”。美国的一些州还制定了禁止将缺乏效度资料的测验用于人员选拔和安置的法律。但是,一个科学和公正的智力测量方法是不会、也不应该被做此限制和受此“待遇”的;一个大众的和公开的智力测量是不会、也不应该对公众保守、保留其测验内容和施测技巧的。
      看来,我们再也不能让这个已经实施100年的貌似科学的智力量表和IQ智商理论再来主导现代社会的智力测量市场和误导民众了。
 
评论列表
(以下网友留言只代表其个人观点,不代表本站的观点或立场)

“呼吸”先生关于“人需要先了解大脑,然后才能对大脑里的东西进行分析...”所言甚是,只是结论有点太悲观了,其实我们现在已经能够科学分析大脑的功能,并科学阐释智力的奥秘了。

发布者 :于大海 (2009-01-16 18:54:40)  回复

说白了就是不客观么
要想客观,目前只能靠科学
我觉得不够现实,因为人需要先了解大脑,然后才能对大脑里的东西进行分析...太遥远了

博主回复
“呼吸”先生关于“人需要先了解大脑,然后才能对大脑里的东西进行分析...”所言甚是,只是结论有点太悲观了,其实我们现在已经能够科学分析大脑的功能,并科学阐释智力的奥秘了。
发布者 :呼吸 (2009-01-04 13:15:11)  回复

太对了,人类还不了解智力和大脑功能,又怎么能定义高低,我们在用智力去解示智力,就好象用象棋来说明象棋一样.无从下嘴.

博主回复
匿名QQ31537785先生事言的前半句话是对的,但是后半句的“用智力解释智力”中,如果前面的“智力”是指人的大脑智力讲的话,那么它就是错的,如果是指智力概念讲的话,那就是对的,因为用概念解释概念是解释不通的。
发布者 :匿名:QQ31537785 (2008-10-25 12:22:26)  回复

于老师,我是一个七岁过五个月的男孩子的母亲,因为看到孩子各方面发育都比别的孩子差,学习成绩也相当差(一年级),学习相当吃力,所以,今天带孩子在广州某医院检查,其中一项是医生让护士对我儿子进行了瑞文智力测定,我儿子的智商是74,医生认为这已成定数,叫我做好心理准备,她认为他无数读多少年一年级,都跟不上的,因为他的智力是定型的了,我看到这个结果,心里相当难受,请问您同意这个说法吗?请给我一个答复好吗?

博主回复
风儿女士:你好。首先对你当前的心情表示理解,同时对于那位医生的结论表示质疑。其一,用瑞文或者任何一种智力测量的方法所做的测量都是不具备验证智力水平高低的资格的(诚如我在本文中已经阐述的那样),因此用它来为一个孩子做智力的定性是极为不负责的,因此也是不可信的;其二,虽然就某种意义上说,一个人的智力水平在其一生中的确是固定的或者是稳定的,但同时,人的智力的类型却是很不相同的,也就是说人的智力这种倾向性是各不相同的,而它则决定着一个人的智力走向,即所谓的包括那些白痴的人员都可以成为某一个领域的天才或者专家----比如舟舟等的根本原因。再由于,智力结构本身又具有着不同的特征和表现,因此某一个人即或在文化课程的学习方面比较吃力,但它全并不预示或决定他在技能和体能的学习方面也同样不能有所作为。因此如果用这种所谓的智力测验来为一个人做智力上的定性应该说是不恰当的。不过通过你所以描述的你的孩子的状况,也应该让我们认识到他的智力可能是存在某种程度的障碍的,但是这却并非就说明他的未来就会是一事无成的。只要我们找准他的智力的类型和学习的兴奋点,我们还是能够把他的智力潜能发掘出来的。有可能的话请你把他的头部的正面的、侧面照片发给我看看,让我再帮助你鉴别一下。邮箱地址是:yudahai188@sina.com
发布者 :匿名:风儿 (2008-05-02 22:25:07)  回复

查看留言

发布者 :春弟 (2007-02-06 11:17:17)  回复

谢谢于老师公正、科学的评价!

博主回复
也谢谢张老师对我所做的评价.
发布者 :张樱 (2006-11-13 17:41:08)  回复

于老师的博文相当的精彩和有深度,佩服至极!请教您一个问题:如果一个7岁小学生是班上第一名的成绩,但由于想要达到某种目的,做韦氏测试3次,分数分别是98、76、82分,司法鉴定能因此定为边缘智能,伤残八级吗?还望于老师讲解,以解困惑!

博主回复
不管这次所进行的韦氏智力测量的分数是多少,或者是用于什么样的目的,它都不应、也不能用来做诸如司法方面的鉴定,更不能用它来进行“边缘智能,伤残八级”这样的定性。这一者是因为这个智力量表本身就是一个不科学的方法,它也不具有鉴定和鉴别智力的功能。二者是因为,人的智力是个多项度的概念,人的心智也是一个全方位的生活体验,它绝对不是一个人工和人为设计的测量工具,或者一纸知识答卷就能进行评价和进行取舍得了的——尤其是对一个尚处于成长发育阶段的儿童就更应慎之又慎了。
发布者 :张樱 (2006-11-09 17:33:57)  回复

非常敬佩您的学识,今天偶然拜读您的见地有感而发. 我认为测量表本身就是用来参考的依据,但是得出的结果我们往往却需要用来论证某一方面.然而,科研需要数据,如果测量表失去了它本身的科学性,降低了可信度,我想求学一下我们还能用什么来支撑我们的论点呢?如有错误敬请原谅 !

博主回复
智力量表原本是为测量智障儿童的愚痴程度而设计的,后来就逐渐演变成了今天这种样子和现在这种模式了.应该说,在当时社会还比较封闭和信息量还不是很大的时候,做点这样的测量也有其特定的作用.但是到了今天这个网络的时代,再用这种方式显然就不好使了.我已经进行了新的测量尝试,也发明了一种新的测量方法.有机会便在博客上发表.
发布者 :张园园 (2006-10-10 13:46:05)  回复

截止目前,于博此篇"IQ"博文的访问量已经暂时超过前面的"恐龙"一稿了!回顾前面各篇的人气评论,最少为14,多数在24,最高到了29,也是相当不错喽!过"双节"了,大家都别太累,歇歇、休休,好好地“龟”几天吧!(于拍红叶归来时)

博主回复
谢谢我的推荐者这样细心地关注我的发博记录,并且又时刻在悉心地呵护我。我将对此感铭不忘。
发布者 :周确 (2006-10-02 07:39:20)  回复

祝于总全家幸福、和气满堂、合家欢乐!

博主回复
谢谢王总从广州发来的祝福,我在哈尔滨也向你致意和问候。
发布者 :王庆忠 (2006-10-01 07:39:57)  回复

人居两地,情发一心!——在国庆、中秋双节之际,谨向挚友天海兄弟祝福:合家欢乐愉快!!

博主回复
谢谢黄主任的祝福。在此也遥祝你节日愉快,全家幸福。
发布者 :黄纪义 (2006-10-01 01:39:08)  回复

大海哥哥总是出人意料,所言让人受益匪浅,拜读了!本家妹妹于新疆.

博主回复
啊,由于今年闰七月,所以现在去新疆应该正是时候的。
发布者 :渌茶 (2006-10-01 00:40:35)  回复

男子的理性思维,可是女儿家不能比的!问候于总!

博主回复
其实男人和女人的思维是互补的,如果世界上的人都是爱因斯坦和马克思的话那可就麻烦了。
发布者 :杨琇评 (2006-09-30 07:42:27)  回复

智力大师的智力大作啊。 听松涛阵阵、山涧秋鸣,看万山红遍、层林尽染,赏怪石嶙峋、沟壑纵横;您还可以去昌黎的十里葡萄沟,置身于葡萄藤蔓之下,徜徉于葡萄藤海之中,在这里,您似乎已分不清哪是农舍、哪是藤蔓,藤蔓已将整个村庄覆盖在下面,漫步在村巷之中,晶莹剔透的葡萄触手可及,热情好客的主人可以让您随意采摘您的最爱,并奉上能够足以引起您思乡的农家饭,借着藤下的阴凉慢慢品尝,好一番田园生活;假如您是一名鸟类爱好者,那么请到位于鸽子窝公园东侧的世界四大观鸟地之一北戴河湿地,在此,您可以看到万鸟临海、百鸟齐飞的壮观景象,四百余种各类珍奇名鸟令人目不暇接。给自己多些休养,更给自己多多的灵感。有时间去关照一下北戴河的阿庆嫂http://bdhly.blog.sohu.com/你们哈尔滨人那

博主回复
啊,没想到河北还有这么多神奇美丽的地方呀,有机会我要争取到这些地方转一转的。北戴河的阿庆嫂----王总,我已经拜访她了。
发布者 :春弟 (2006-09-28 11:10:30)  回复

海哥哥,想请教你问题,看你这里也没有留言板,只好写在这里了。不会觉得唐突吧。 右脑发达的人是不是战略性思维更好一些呢?基本都属于乱中有序的人?是不是井井有条的人无法更好的作战略规划呢? 海哥哥有时间的时候,给我指点指点哈,先谢过

博主回复
由于智力是大脑的功能,因此从一般的意义上讲,大脑两半球的结构特点必然会影响到他的智力类型特征。但是问题在于人们怎么才能知道或者掌握自己的大脑结构,或者智力类型?这就应该成为问题的关键所在了。我的智力研究恰恰在这个方面做了点探索,并有所建树。到时候我会在博文里逐步阐介这一成果。
发布者 :待到山花烂漫时 (2006-09-28 11:04:25)  回复
29 篇, 2 « 1 2 »
  
昵称: (必填)    请您文明上网、理性发言并遵守相关规定
内容:
湘ICP证010023 版权所有:华声在线股份有限公司