青空文庫のテキストを難易度推定にかけてみる。
リーダビリティ=児童書に付く「小学○年生向け」という読者の対象年齢のやつ。
使用するテキストは青空文庫、ツールは名古屋大学の佐藤理史先生による帯1.x (obi-one)。
かなり手を抜いたので青空文庫内にHTMLファイルが存在する作品だけで、さらにぽろぽろ抜け落ちてそうだけど。
よく検証してないけど、まぁそれっぽい。
readability | 対象学年 | 作品数 | % |
---|---|---|---|
0 | 73 | 1.0% | |
1 | 小学1年 | 26 | 0.3% |
2 | 小学2年 | 45 | 0.6% |
3 | 小学3年 | 138 | 1.8% |
4 | 小学4年 | 65 | 0.9% |
5 | 小学5年 | 222 | 2.9% |
6 | 小学6年 | 989 | 13.0% |
7 | 中学1年 | 444 | 5.8% |
8 | 中学2年 | 1,323 | 17.4% |
9 | 中学3年 | 2,224 | 29.2% |
10 | 高校1年 | 318 | 4.2% |
11 | 高校2年 | 108 | 1.4% |
12 | 高校3年 | 27 | 0.4% |
13 | 大学 | 1,617 | 21.2% |
総計 | 7,619 | 100.0% |
ちなみに Amazon.com では、一部の書籍には「Text Stats」というリンクがあり、
Readability が表示される。
(上記画像の商品はこちら)