閱讀數學/小學課本常見字排行榜(下)
上週我們提到小學課本常見的字。不過,我們也都清楚,課本是經過特殊設計,具有教學用途的內容,會有大量的字重複出現。如果換作專為小學生編撰的新聞媒體《國語日報》呢?
110年《國語日報》語料總計約 150 萬字,其中前 100 名常出現的字,佔了整體的 38.2%,比課本少了將近7個百分點,的確更發散。進一步統計《聯合報》、《國語日報》等諸多媒體總計八百多萬字的語料,前 100 名常出現的字,下降到佔整體的34.5%。雖然下降,可認識 100 個字,就能讀懂八百多萬字內容的 34.5% 字量,依然展現了就算是一般的文章,常用字還是非常有價值。八百萬字的常見排行榜前十名是:
的、一、是、不、有、人、在、中、國、年
跟課本的前十名有7個字一樣,表示課本果然有經過設計,能某種程度反映一般的文章內容。因為,就好像熱門歌曲有總榜,如果進到不同的分類榜,很可能就會有異軍突起。特定文本的常見字排行榜也是一樣。
極端一點的《蘋果日報》頭版標題,2012-2018的前十名裡出現了怵目驚心的「死、殺」,這或許也說明了儘管當時《蘋果日報》暢銷,但我們還是很少看到有家長拿著它來教小孩認字。《全唐詩》某種程度上則是座落在光譜的另一端,前十名是:
不、人、山、無、風、一、日、雲、有、何
少了白話文霸主「的」,多了幾分景緻。大家也可以想想看經典小說《西遊記》、我們都喜歡的「王文華的童話公園」老師作品,或是「數感實驗室」的科普讀物中,常見字排行榜又會是哪些字呢?
註:要特別強調,認識字不代表認識詞,或是理解文意,所以我們是指孩子能「看懂多少比例的字」,並非能「讀懂多少比例的內容」,跟這個主題更相關的有詞頻分析。此外,每個字筆畫不一樣,有些字會相關,所以實際上學生字的理想順序會更複雜,更因人而異。這邊都簡化到只單就頻率來討論。
留言