試題反應理論介紹 - 晨晰統計部落格新站(統計

文章推薦指數: 80 %
投票人數:10人

本文作者擬撰寫一系列文章,介紹試題反應理論的主要理論內涵及其應用,在此之前,我們有必要從歷史的觀點,來回顧與展望測驗理論的發展趨勢,以明瞭 ... 晨晰統計部落格新站(統計、SPSS、BIGDATA討論園地) 跳到主文 一個討論統計的好地方 部落格全站分類:圖文創作 相簿 部落格 留言 名片 公告版位 晨晰統計顧問有限公司在新北市板橋\服務市話:02-29602817\手機:0918-276-622\信箱:[email protected]\網址:http://www.rai-stat.com.tw Jul12Thu200717:33 試題反應理論介紹 政大教育系教授 余民寧 著   考試制度的創設雖然源自中國,綿延數千年後,世界各國爭相採用,以作為建立文官制度的選拔依據但是中國卻一直沒有針對「考試」這門學問進行比較科學化的量化分析,致使近代的心理計量學(psychometrics)卻發展且發揚於外國,西風東漸後,才傳入中國。

  心理計量學是一門研究心理測驗(psychologicaltesting)與評斷(assessment)的科學(Cohen,Montague,Nathanson,&Swerdlik,1988,P.26),是一門包括量化心理學(quantitativepsychology)、個別差異(individualdifferences)、和心理測驗理論(mentaltesttheories)等研究範圍的學問。

比奈-賽門(Binet-Simon)的智力測驗,可說是人類有史以來第一個心理測驗,測驗理論便是起源於此,並由此繼續往前發揚光大,成為心理計量學的主要架構。

  測驗理論(testtheory)(或全稱叫「心理測驗理論」)是一種解釋測驗資料間實證關係(empiricalrelationships)的有系統的理論學說,它的發展,迄今已邁入不同的新紀元,測驗理論學者通常把它劃分成二大學派:一為古典測驗理論(classicaltesttheory)——主要是以真實分數模式(truescoremodel)(Gullikson,1987;Lord&Novick,1968)為骨幹;另一為當代測驗理論(moderntesttheory)——主要是以試題反應理論(itemresponsetheory)(Hambleton&Swaminathan,1985;Hambleton,Swaminathan,&Rogers,1991;Hulin,Drasgow,&Parsons,1983;Lord,1980)為架構。

這兩派理論目前並行流通於測驗學界,但試題反應理論卻有後來居上,逐漸凌駕古典測驗理論之上,甚至進而取而代之之勢。

  本文作者擬撰寫一系列文章,介紹試題反應理論的主要理論內涵及其應用,在此之前,我們有必要從歷史的觀點,來回顧與展望測驗理論的發展趨勢,以明瞭測驗理論發展的來龍去脈,這也正是本文的主要目的。

    兩派測驗理論之比較   比奈-賽門的第一個心理測驗問世後,正是心理計量學誕生之始,後經諸多學者(如:Cronbach,1951;Guilford,1954;Gullikson,1987;Guttman,1944;Lord&Novick,1968;Richardson,1936;Terman,1916;Thurstone,1929;Tucker,1946)的研究與闡述,終於歸納形成古典測驗理論等學說。

  古典測驗理論的內涵,主要是以真實分數模式(亦即,觀察分數等於真實分數與誤差分數之和)為理論架構,依據弱勢假設(weakassumption)而來,其理論模式的發展已為時甚久,且發展得相當規模,所採用的計算公式簡單明瞭、淺顯易懂,適用於大多數的教育與心理測驗資料,以及社會科學資料的分析,為目前測驗學界使用與流通最廣的理論依據。

  然而,除上述各項優點外,古典測驗理論卻有下列諸項先天的缺失(Guion&Ironson,1983;Wright,1977): 古典測驗理論所採用的指標,諸如:難度(difficulty)、鑑別度(discrimination)、和信度(reliability)等,都是一種樣本依賴(sampledependent)的指標;也就是說,這些指標的獲得會因接受測驗的受試者樣本的不同而不同,因此,同一份試卷很難獲得一致的難度、鑑別度、或信度。

古典測驗理論以一個相同的測量標準誤(standarderrorofmeasurement),作為每位受試者的測量誤差指標,這種作法並沒有考慮受試者能力的個別差異,對高、低能力兩極端組的受試者而言,這種指標極為不合理且不準確,致使理論假設的適當性受到懷疑。

古典測驗理論對於非複本(nonparallel)但功能相同的測驗所測得的分數間,無法提供有意義的比較,有意義的比較僅侷限於相同測驗的前後測分數或複本測驗分數之間。

古典測驗理論對信度的假設,是建立在複本(parallelforms)測量的概念假設上,但是這種假設往往不存在於實際測驗情境裡。

道理很簡單,因為不可能要求每位受試者接受同一份測驗無數次,而仍然假設每次測量間都彼此獨立不相關,況且,每一種測驗並不一定同時都有製作複本,因此複本測量的理論假設是行不通的,從方法學邏輯觀點而言,它的假設也是不合理的、矛盾的。

古典測驗理論忽視受試者的試題反應組型(itemresponsepattern),認為原始得分相同的受試者,其能力必定一樣;其實不然,即使原始得分相同的受試者,其反應組型亦不見得會完全一致,因此,其能力估計值應該會有所不同。

  一般說來,為了克服古典測驗理論的缺失,才有當代測驗理論的誕生。

當代測驗理論的內涵,主要是以試題反應理論為理論架構,依據強勢假設(strongassumptions)而來,其理論的發展為時稍晚,理論模式也不斷的在發展當中,所採用的計算公式複雜深奧、艱澀難懂,為一立論與假設均合理與嚴謹的學說,所適用的測驗資料種類雖屬有限,但深受測驗學者的青睞,已有逐漸凌駕古典測驗理論之上,甚至進而取而代之之勢。

  當代測驗理論是為改進古典測驗理論的缺失而來,它具有下列幾項特點,這些特點正是古典測驗理論所無法具備的(Hambleton,1989;Hambleton&Cook,1977;Hambleton&Swaminathan,1985;Hambleton,Swaminathan,&Rogers,1991;Lord,1980): 當代測驗理論所採用的試題參數(itemparameters)(如:難度、鑑別度、猜測度等),是一種不受樣本影響(sample-free)的指標;也就是說,這些參數的獲得,不會因為所選出接受測驗的受試者樣本的不同而不同。

當代測驗理論能夠針對每位受試者,提供個別差異的測量誤差指標,而非單一相同的測量標準誤,因此能夠精確推估受試者的能力估計值。

當代測驗理論可經由適用的同質性試題組成的分測驗,測量估計出受試者個人的能力,不受測驗的影響(test-free),並且對於不同受試者間的分數,亦可進行有意義的比較。

當代測驗理論提出以試題訊息量(iteminformation)及試卷訊息量(testinformation)的概念,來作為評定某個試題或整份試卷的測量準確性,倒有取代古典測驗理論的「信度」,作為評定試卷內部一致性指標之勢。

當代測驗理論同時考慮受試者的反應組型與試題參數等特性,因此在估計個人能力時,除了能夠提供一個較精確的估計值外,對於原始得分相同的受試者,也往往給予不同的能力估計值。

當代測驗理論所採用的適合度考驗值(statisticofgoodness-of-fit),可以提供考驗模式與資料間之適合度、受試者的反應是否為非尋常(unusual)等參考指標。

  綜合上述,當代測驗理論似乎是絕對優於古典測驗理論,但是事實上,當代測驗理論被採用於解決真實測驗資料者,比起古典測驗理論廣泛地被應用的情形而言,尚屬少數,微不足道。

其主要原因有下列諸點: 當代測驗理論係建立在理論假設嚴謹的數理統計學機率模式上,是一種複雜深奧、艱澀難懂的測驗理論,這對於在數學方面訓練有限的教育與心理學界學者而言,無非是一大挑戰。

閱讀有關此理論之數學方面的研究報告與專書,已頗感困難,實在更難以深入將之發揚光大。

多數當代測驗理論學者都是出身自數學界或曾是數學主修者,或至少在數理統計學上訓練有素者,他們偏愛對理論模式的探討,遠勝於對實際應用的推廣工作。

過去,電腦科技的進步有限,沒有電腦套裝軟體程式的即時配合,當代測驗理論中對模式參數的估計,難以用手算或小型計算機順利進行,因此,在應用上更受限制。

有些古典測驗理論的擁護者,對當代測驗理論的研究與發展,所能獲致之成效與應用性深表懷疑。

為了證明與解釋疑惑,當代測驗理論學派的支持者,便更朝理論模式的量化技術方面探討,致使當代測驗理論的發展愈趨數學化、數量化、與電腦化。

礙於嚴苛的基本假設,當代測驗理論所能適用的教育與心理測驗資料有限,並且需要大樣本的配合,因此使得它的應用性大打折扣,未獲一般測驗使用者的全力擁護。

  由上述兩派測驗理論的比較可知,古典測驗理論雖然不夠嚴謹,但理論淺顯易懂,便於在實際測驗情境(尤其是小規模資料)實施;當代測驗理論雖然嚴謹,但理論艱深難懂,僅適用於大樣本測驗資料的分析。

所以,這兩派測驗理論各有所長,在應用上也各有其限制,我們僅能靜觀測驗理論的發展,逐步歸納出其未來的發展趨勢。

分享 FacebookPlurkYAHOO! 分享在我的Facebook 分享在我的Plurk 分享在我的即時通   全站熱搜 創作者介紹 晨晰部落格新站 晨晰統計部落格新站(統計、SPSS、BIGDATA討論園地) 晨晰部落格新站發表在痞客邦留言(0)人氣() E-mail轉寄 全站分類:進修深造個人分類:統計分析新趨勢此分類上一篇:電腦化適性測驗 此分類下一篇:IRT如何入門最好?---張世諭顧問學習心得分享 上一篇:電腦化適性測驗 下一篇:研究假設與考驗之辯 歷史上的今天 2011:結構方程模式的優勢與劣勢(AdvantageandDisadvantageofStructuralEquationmodeling,SEM)-上(簡介篇) 2010:會員心得分享--恭喜台北藍小姐順利畢業!! ▲top 留言列表 發表留言 熱門文章 文章分類 powerBI(38)生物醫學統計(135)迴歸與SEM(56)研究方法(66)SAS教學(54)Excel與統計軟體(52)統計應用專題(77)其他類統計知識(114)問卷知識(26)論文寫作(15)統計分析新趨勢(17)晨晰的宣傳與服務專案(56)數據話視頻(15)會員心得分享(10)新聞類(65)我們的故事(77)未分類文章(6) 最新文章 最新留言 文章精選 文章精選 2022八月(2) 2022七月(3) 2022六月(3) 2022五月(4) 2022四月(3) 2022三月(4) 2022二月(3) 2022一月(3) 2021十二月(4) 2021十一月(5) 2021十月(3) 2021九月(3) 2021八月(3) 2021七月(3) 2021六月(3) 2021五月(5) 2021四月(4) 2021三月(5) 2021二月(2) 2021一月(4) 2020十二月(4) 2020十一月(5) 2020十月(4) 2020九月(3) 2020八月(5) 2020七月(3) 2020六月(4) 2020五月(3) 2020四月(4) 2020三月(4) 2020二月(4) 2020一月(3) 2019十二月(4) 2019十一月(4) 2019十月(4) 2019九月(3) 2019八月(3) 2019七月(3) 2019六月(4) 2019五月(4) 2019四月(5) 2019三月(4) 2019二月(3) 2019一月(4) 2018十二月(4) 2018十一月(4) 2018十月(5) 2018九月(3) 2018八月(3) 2018七月(5) 2018六月(4) 2018五月(4) 2018四月(5) 2018三月(3) 2018二月(3) 2018一月(5) 2017十二月(4) 2017十一月(4) 2017十月(4) 2017九月(4) 2017八月(4) 2017七月(4) 2017六月(4) 2017五月(3) 2017四月(3) 2017三月(5) 2017二月(3) 2017一月(4) 2016十二月(4) 2016十一月(5) 2016十月(4) 2016九月(4) 2016八月(5) 2016七月(4) 2016六月(4) 2016五月(4) 2016四月(5) 2016三月(5) 2016二月(4) 2016一月(5) 2015十二月(4) 2015十一月(5) 2015十月(4) 2015九月(4) 2015八月(4) 2015七月(4) 2015六月(5) 2015五月(4) 2015四月(3) 2015三月(5) 2015二月(3) 2015一月(4) 2014十二月(5) 2014十一月(4) 2014十月(4) 2014九月(5) 2014八月(4) 2014七月(4) 2014六月(5) 2014五月(4) 2014四月(4) 2014三月(5) 2014二月(3) 2014一月(4) 2013十二月(6) 2013十一月(4) 2013十月(5) 2013九月(5) 2013八月(4) 2013七月(5) 2013六月(4) 2013五月(4) 2013四月(6) 2013三月(4) 2013二月(4) 2013一月(6) 2012十二月(4) 2012十一月(4) 2012十月(6) 2012九月(4) 2012八月(4) 2012七月(9) 2012六月(4) 2012五月(5) 2012四月(4) 2012三月(3) 2012二月(4) 2012一月(4) 2011十二月(4) 2011十一月(6) 2011十月(4) 2011九月(5) 2011八月(5) 2011七月(4) 2011六月(4) 2011五月(5) 2011四月(4) 2011三月(5) 2011二月(3) 2011一月(4) 2010十二月(5) 2010十一月(5) 2010十月(4) 2010九月(5) 2010八月(5) 2010七月(5) 2010六月(5) 2010五月(4) 2010四月(5) 2010三月(6) 2010二月(5) 2010一月(6) 2009十二月(5) 2009十一月(5) 2009十月(6) 2009九月(5) 2009八月(8) 2009七月(7) 2009六月(6) 2009五月(4) 2009四月(4) 2009三月(4) 2009二月(4) 2009一月(4) 2008十二月(8) 2008十一月(9) 2008十月(8) 2008九月(9) 2008八月(10) 2008七月(10) 2008六月(13) 2008五月(13) 2008四月(10) 2008三月(9) 2008二月(9) 2008一月(10) 2007十二月(10) 2007十一月(12) 2007十月(13) 2007九月(10) 2007八月(9) 2007七月(6) 2007六月(7) 所有文章列表 文章搜尋 新聞交換(RSS) 誰來我家 參觀人氣 本日人氣: 累積人氣: QRCode POWEREDBY (登入) {{article.user_name}} {{article.timestamp*1000|date:'MMM.dd.y.hh.mm'}} {{article.title}} {{article.content}} 我要留言 回到頁首 回到主文 免費註冊 客服中心 痞客邦首頁 ©2003-2022PIXNET 關閉視窗 PIXNET Facebook Yahoo! Google MSN {{guestName}} (登出) 您尚未登入,將以訪客身份留言。

亦可以上方服務帳號登入留言 請輸入暱稱(最多顯示6個中文字元) 請輸入標題(最多顯示9個中文字元) 請輸入內容(最多140個中文字元) 請輸入左方認證碼: 看不懂,換張圖 請輸入驗證碼 送出留言



請為這篇文章評分?