星期五, 6月 29, 2007

評量

這是我今年投稿到學生系刊的文章。有一點長(本來就是設定給印刷文章用的),若有空請看一下。

評量

這一篇文章,由各位同學所熟習的考試評量開始,最後希望能給同學們了解現在台灣各大學進行中的系所評鑑的背後想法。因為這個議題,身為心理學系的人應該多加以關心,也可以由自己所學當中(也是各位二年級以上同學所學心理測驗),出發來關心高等教育的現在與未來。

成績

在台灣的學生時代有考不完的試,其實念到大學(尤其本校)還有很多考試,如:期中考、期末考、隨堂小考...。可能很多人都會同意,打一任何一個科目的成績,單靠考試是不足的。尤其在心理系讀到二、三年級就會發現,老師打成續的方式真的很多樣。有的要寫報告,有的要上台表現,有的規定沒上台也要參加討論, 有時要分組報告(分組到最後組員間可能反目成仇:p)。老師們閒來無事搞出這麼多名堂,是不是老師們都是虐待狂?當然不是!老師們想知道的是同學們有沒有 學到該學的東西。至於每一個不同的學科,應該要學什麼?要學到什麼樣的程度?這一些標準(或判準)應該是每一位任課教師來決定。因為任課老師才對自己所教 的課程內容以及其背後邏輯等最最了解。且隔行真的如隔山,各專業科目的問題,真的不是外人可以理解的。

現行的大學課程,當某一科目的成績未達教師 認定的標準,就是俗稱的「當」掉的狀態,學生可能是拿不到該課程的修課認證(學分)。如果要取得這個科目的認證就得下一次再來(重修)。這樣的設計本來就 有她的合理性和傳統。因為學生沒有學好,最佳的補救方是就是重頭再學一次。但從實務(實際)層面來看,重修的成本不低,不論從重修的同學或是重教的老師。

誤差

心理系二年級以上都知道,施測真正的「心理測驗」還滿囉嗦,很多不知為何的標準化程序。但是其實再完美的執行,心理測驗總是有誤差的存在。以前也常說,我們 學校裡的考試,廣義的來說也是一種心理測驗。學校裡的考試可以分類到成就測驗,也就是考驗被測者在某一範圍的能力學會了多少的測驗。但是大家也心知肚明, 要把學校裡的考試稱為測驗,實在有一點不恰當。因為心理測驗上市,一定有作過信效度的檢驗(在此先跳過信效度更深入的話題,不然會談不完 ),而且應該有常模可以來對照。學校裡的考試有這些嗎?當然是沒有!這一段第一、二句也提到,再嚴謹的心理測驗也免不了有誤差,學校裡的考試難道沒有誤差嗎?當然有!

講這樣,好像學校裡的考試是「一文不值」,但各位認為我接下來否定學校裡的考試,那錯了。各位知不知道,農夫種稻前一定要篩選稻穀,找出那一些稻穀種下去不 會發芽。一般所用的方式就抓一把稻穀就丟到水裡,把浮出來的丟掉。在21世紀,這個方法仍然有效。因為這又快又方便。農夫不必為了這篩選買昂貴分析儀器, 那叫殺雞用牛刀。學校裡的考試也是一樣,我們的最主要的目的只是找出那一些人真的沒有學會該會的。至於81分是不是比75分厲害,那不是學校裡的考試該討 論的問題。因為現實上,一個班級超過四、五十人以上(有的更達100多人),沒有其他更快速方便的方法來篩選學生的學習狀態的工具。不過很麻煩的 是,在本地的學生,如果用很簡便的考試方式,真的無法篩選。

因為他們身經百戰(真實情況是早就超過千次以上),太過單純的題目型態,他們用左手就可以了! 所以老師們如果不用心出題,學生用猜的就可以拿高分。但是反過來,老師出題「太心機(刁鑽)」,很多本來會的人也答不對。當然可以出比較容易表現學生真的實力的題型,如申論題,甚至是開書考申論題。但除非老師閒閒沒事或是腦殼壞去,不會出這一類型題目。這多難改!字體難以辨識還是初步問題,很多同學文句不通順如閱讀外星文。常見啼笑皆非的邏輯推論就是,前面一堆無關重點的敘述,最後「所以題義可以獲得證明」等等話語來結尾。例如最近考了個知覺的小考,題目是「視覺實驗中為何較常以視角大小代表刺激大小?」。典型的回答就是:「因為當視角固定時,物體大小與距離成正比,所以視覺實驗中常以視角大小代表刺激大 小。」。每次碰到這一類型的陳述,我還要從頭仔細閱讀再三,有時甚至要一字一句唸出聲音,以免漏讀了任何一個字,怕後來同學來興師問罪。但是多半,這個所以不是邏輯上的由前題導出結論的所以,這個所以好像只是個語助詞。

如果遇見這樣的試卷,真的會影響情緒。所以我常用的對應方式就是出去走一圈,cool down一下。但是期限(要發考卷)快到的時候,可能沒有時間讓自己cool down,當然又可能發生一些誤差:p(抱歉Orz)。

真正的評量

評量的目的,其實要幫助受評的人了解自己學會了多少。有些更好的評量,可以告知受評量的人,怎麼樣來學習,會有更好的效果。但是評量本身如果附帶有篩選的作用,必定對評量方式會有「應付」的方法。歷史上有名的例子是檢驗辨色力異常的「石原測驗(Ishihara test)」,就是由大小不同的彩色圓圈組成數字或圖形,辨色力正常者與異常者所見不同。曾經這個測驗用來篩選各種不同的職業及考照能力,例如醫師、駕 照...。在十幾二十年前,報紙小廣告或路邊小廣告可以看到「治療色盲」的字眼,這一些就是針對石原測驗而來的。在理論上來說,辨色力異常是先天性的(就 是遺傳的),不可能被治癒的。所謂的治療是用特殊方法,讓辨色力異常的人可以通過石原測驗,根本不是治療!後來對於辨色異常的限制逐漸放寬(因為實際上沒 有太大的影響),生意也作不下去,加上取締也加強,所以現在看不到這樣的廣告。

我們將事情反過來說,是否只有石原測驗才能檢驗出辨色力異常嗎?通常自己比較細心,在用色時會發現自己對某些顏色的分辨能力是不好的。例如:紅綠辨色異常在黃綠色區域為無色彩,辨別紅與綠是有些困難,但辨識一般的紅綠燈 不太會有問題。重點是評量可給予已知(或已察覺)的事,加以補強的或是較有量化的「資料」。但如果將評量結果作為篩選的依據或是判定一個人很重大的決定,那勢必要很小心。

當評量結果付加篩選或判斷重問題時,較妥當的方式是用多種評量工具以便多個向度的方式了解與判斷。重要的是,不要以單一次、單一 向度的評量下重大決定。例如:前一陣子鬧得相當大的某一區域的資優班統一測驗,就那麼一次測驗決定小孩往後要不要接受所謂資優教育。不但不符公平原則,也 不合測驗評量的本意。其實在學校中之老師們的評量,常常也用多個向度,不同次數的評量,才會決定某一個學生在這個課程可否取得認可。雖然,數據本身之信度 或有可議之處,但認定「當掉與否」至少有起碼的效度。換言之,課程評量之真正重點在於過與不過,至於那個幾分、幾分並不是重點。

順帶一提的是,在研究所的甄選入學時,還會把在學成績納入考量,個人認為相當荒謬。一方面各校各系的計分標準不同,即便是同校同系,甚至修完全一樣的課程。那一些平均成績又有什麼意義?統計80分、普心70分,平均75分的人 會比統計70分、普心90分,平均80分的差嗎??如果你認為前面這兩個人中,平均80分的人真比平均75分的人好!那你中量化的毒太深了!深到簡直是無可救藥。

代結語

為了幫助了解自己的各項問題,利用適當的評量是絕對是正面的。在某一些篩選與判斷時,利用合宜的評量也是絕對合理。但使用任何評量工具及解讀任何評量結果時一定要知道這些工具的極限及結果正確的解釋方法。誤用評量工具,或誤解評量結果,都會影響被評量者之權益,也會影響大眾對評量工具的疑慮。就像大學甄試及 申請,先用學測粗略地對高中成就設置門檻,再由各校各系用適合各校各系特色的方式再加以篩選。形式上是比較理想的狀態。當然實務上,大學各校各系至今仍無理想的專責單位,發展或研究自己的甄選方式。因此也沒有能夠開發出令人滿意的機制,這也是真實。

最近大學各系所都忙於準備(或正接受)高等教育評 鑑基金會的評量。這個評量的目的本來也是協助各系所了解各自之優缺點。但實際上,系所評鑑有一個很具殺傷力的目的,就是退場機制。也就是要大學系所,如果辦不好就關門。高等教育評鑑基金會,所設計的評量原理還滿不錯,理念也算符合一般評量的精神。但最大問題在於,這個評量仰賴於大量的評鑑委員,且多項評量 項目成績需要靠委員的「專業主觀」判定。這一點當然令人害怕,就怕像當年教改一樣會荒腔走板。當年教改出問題,有部分原因就是執行教改的基層老師們,不了 解或是不認同教改的理念。上下不同調,如何來合奏出美麗的樂章?幸好,我們心理學門的委員,應該對測驗都有所認知。大概也可以真正量出我們系的教學情況與 學生學習狀態。其實身為系上教師的一份子,我也知道我們的長處與缺陷。也想了很多方法來解決問題但大環境實在不太容易(這對台灣的其他系所都是)。當然也希望同學們能了解我們的處境,一起來為高醫心理系的未來加油!

星期日, 6月 17, 2007

log2

log2 約等於 0.3010299957....

數學可以用在很多場合。

有興趣請往下看,數學過敏就勿看。但是很想知道知覺小考為什麼被扣分,那也請往下看。

指數與對數互為逆運算,就像加法與減法、乘法與除法。

舉例而言,log2=0.3010299957.....

10^log2 = 2
(附註:「^」這代表指數。)

再舉一例:
2^10=1024
log(2^10)=10log2=3.01029957.....
10^log2^10=1024
上例可以用工程用計算機算看看。

===================分隔線====================

以上說明,其實要說明上上一次知覺小考,演化相關問題。因為有人說(還不少人)突變是很稀少的(有看到網頁寫十億分之一,這是算最低的)。沒有錯突變是很少有的,但是人類及其祖先在地球上出現過很多很多。我來算一下:

現知舊人最早是400萬年前(可能會更早),一般人類性成熟在十餘年(保守一點就算20年一代)。這樣400萬年間有20萬代(200000),若400萬年間如果每一代雙親有兩個子代(對古早年代,我是說幾百萬年前來說,太少)。由一對祖先開始,單純計算到現在共有:

2^200000個後代,這等於
log(2^200000)=200000 x log2=60206(約數)

也就是約有6萬位數(不會唸多少)。當然因為中間發生過很多很多減亡事件,所以沒有這麼多。但是出現過的子代應該更多,這個當中10億分之1出現過也是約6萬位數(因為10億是10位數而已,尚不足誤差範圍)。

所以在長遠的時代中,突變的個體出現的機會是很多很多的。當然突變基因是否留下來,以及這些帶有突變基因個體變成新種,算是另外一個話題。如果下次有機會再談,但本文至少讓大家知道人類長遠的演化過程中突變有過太多了。

如果有興趣,也可以算一下,新人(或是智人)出現到現在的可能子代數量。你可以發現也是相當的多!

星期三, 6月 13, 2007

又是小考問題

一次小考,大家表現得也不很理想

因為時間關係,先跟大家講解最大問題的地方。

cones兩種的動物,並不是只能看黑白,他們與我們cones3種的動物相較在色彩解析(就是分辨不同顏色)能力上差一些。其實人類之中也有這樣的情況的。

在這個網頁中,有兩張模擬照片。所謂模擬是,他用影像處理的方式,猜測狗的視覺經驗(你又能知道狗看到什麼?)。抱歉是日文網頁,但這是來自一本英文書的內容。好玩的是這個部落格回應中有一位是辨色力異常的人,說,他看起來兩張圖片沒有什麼差異。

希望各位再深入思考一番。擇日再分享另一項較多人有問題的地方。

星期一, 6月 11, 2007

小玉走了

有人或許有看出來,這幾天我心情不是很好。畢業典禮,很抱歉與畢業生照相,也有一點心不在焉。因為我們家一位重要成員病了。而她今天下午16:40終於離開我們了。往後一個月本blog用gray的template,以紀念她。心情不佳,就此打住。

天国に帰りました

家族みんなでいろいろと看病してくれたけど、疲れたので、今日天国に帰りました。



これからはあちらか、みんなの事を見ています。

星期五, 6月 08, 2007

ちょっと一休み



最近いろいろ有って、少しブルーです。



気分転換に、面白い映像を







これは、毎日出勤途中にある看板ですが、上はマンションの広告、下は整形外科(美容外科ともここでは言っています)の広告。「狐臭」は「腋臭(わきが)」、「拉皮」は「シワ取り」のことです。



この二つのコンビネーションは絶妙だと思います(画像をクリックしてください、シワ取りが必要なのがわかります)。

コマーシャル

台湾の看板

星期二, 6月 05, 2007

ただいま闘病中

大変長く留守にしていました(ペコリ)。



実はフィラリアという恐ろしい病気にかかってしまいました。まだ重くなる前だったので、薬物治療で直せるということで、ただいま治療中です。



まだ元気がないので、今日はここまで。

フィラリアの顔

フィラリア治療前の顔

星期六, 6月 02, 2007

雙耳時間差神經機制--小考講解

各位修知覺的同學:

這一次小考考了一個很簡單的計算題,但又幾乎全倒。只好在這簡單解釋一下大概的方向。

題目大概如下(沒有帶回來因此文句可能有一些不同):

如果音源在如下圖的位置,請設計(或推測)利用雙耳時間差偵測這個音源位置的可能神經機制(3分)。

並進一步想像,利用雙耳時間差來偵測各種音源位置的可能神經機制(3分)

其他數據:假設頭圍為50cm,如果頭是正圓,週圍長度是直徑乘以3.14,所以直徑約為:15.915cm。半徑則:7.957cm。依畢氏定理r約為 28.34m,l約為28.23m。 l-r = 0.11m。音速為343m/sec. 所以到達雙耳的時間差為0.33msec.。另外,神經反應的最高頻率為500cycle/sec. 神經傳導速度(在沒有髓鞘的神經纖維)2m/sec. 。

-------------------------------------題目分隔線--------------------

由神經的最高反應頻率來看神經每一次反應至少要2msec. 遠長於聲音傳達雙耳的時間差,所以不太可能由神經反應的時間差來表現。在本題的時間差為0.33msec.,換算成神經訊息在神經纖維的傳導距離差約為 0.66mm(0.00033sec. X 2 m/sec. = 0.00066m = 0.66mm)。所以如下圖:

delta t可以換算成神經通路的長度差,如果這個長度差為0.66mm則可以偵測這個音源位置。

在實際可能的神經連結方式,可以是左右耳進來的訊息以不同神經纖維長度到達的神經元細胞排列為空間位置的指位系統。如下圖:

就可能偵測到不同音源方向的刺激。

以上是簡單講解。

我的日曆