青空文庫のテキストを難易度推定にかけてみる。

リーダビリティ=児童書に付く「小学○年生向け」という読者の対象年齢のやつ。
使用するテキストは青空文庫、ツールは名古屋大学の佐藤理史先生による帯1.x (obi-one)
かなり手を抜いたので青空文庫内にHTMLファイルが存在する作品だけで、さらにぽろぽろ抜け落ちてそうだけど。


青空文庫の難易度推定


よく検証してないけど、まぁそれっぽい。

readability 対象学年 作品数 %
0 73 1.0%
1 小学1年 26 0.3%
2 小学2年 45 0.6%
3 小学3年 138 1.8%
4 小学4年 65 0.9%
5 小学5年 222 2.9%
6 小学6年 989 13.0%
7 中学1年 444 5.8%
8 中学2年 1,323 17.4%
9 中学3年 2,224 29.2%
10 高校1年 318 4.2%
11 高校2年 108 1.4%
12 高校3年 27 0.4%
13 大学 1,617 21.2%
総計 7,619 100.0%


ちなみに Amazon.com では、一部の書籍には「Text Stats」というリンクがあり、

Readability が表示される。

(上記画像の商品はこちら