月配列の導入を検討する
日本語入力方法として、10年前までは自作の行段系8母音ローマ字配列「やつがしら」を使っていたが、ここ10年は普通のローマ字入力を少しだけ拡張した配列(「ん」「っ」「ー」を専用キー1打で、拗音を2打で打てるように拡張したもの)に戻っていた。しかし、やはりローマ字では快適さに限界がある。ここらでローマ字入力に見切りをつけて、かな入力の導入を検討しよう。
既存手法の評価
月配列系は各作者が数値評価を行っているが、どれもサンプルが小さすぎてアテにならない。そこで、国立国語研究所の現代日本語書き言葉均衡コーパスを使って既存の配列を再評価した。ただし、当該コーパスの全データを入手するには利用契約が必要で面倒なので、ここではBCCWJ長単位語彙表 (Version 1.1) のうち度数22以上の約10万語彙をサンプルとして使った。原文ではなく単語ごとの頻度表なので、単語内の運指は考慮されるが、単語をまたぐ運指は考慮されない。
結果は次のとおり。表の一番右の列は指ごとの負担率を示す。
どの配列も作者のノウハウが注ぎ込まれているわけだが、やはり作者ごとに異なる設計思想が透けて見える。なかでも、濁音を清音と同じ位置に置くか別の位置に置くかが大きな分かれ道のようだ。
方針
評価結果を踏まえて自分がどこから始めるかを考えているが…うーむ。
まぁ、どうせ後から自己流カスタマイズに走るだろうし、とりあえずは初めてのかな入力ということで、覚えやすそうな清濁同位置の「月配列 U9」を採用してみようかな。
評価プログラム
後者のページには初期値としてBCCWJ短単位語彙表 (Version 1.1) のうち度数555以上の約1万語彙が入力されている。かな配列はHTML内にハードコーディングされている。