2017年4月25日火曜日

斎藤強三さんらの「ひらがな標準配列」

梅棹忠夫さんの『知的生産の技術』(p.142)でもふれられている、斎藤強三さん(1899-1989)らのひらがなタイプライター用の「ひらがな標準配列」の仕様をしらべることができた。

ひらがな・ローマ字のコンビネーション タイプの仕様は次のとおり:

ノーマル面:
ぬへふひはほもまみめやゆ
 けくきかこのなにおえよ
 てつちたとんあいう゛を
 せすしさそわらりるれ
※ 各指で子音をそろえている。
  
シフト面:
023456789むゃゅ
 qwertyuiopょ
 asdfghjkl゜ね
 zxcvbnmっ。ろ
※ 1はlで代用か。

設計は1963年頃のものになるよう。「50音配列」ともいわれていたそうで、
  • 左手側に濁点のつく字を配置、
  • 50音の行ごとにキーをまとめる、
という構成はスティックニーの原則のまま。ひらがな専用タイプではシフト面で小書きの「ぁぃぅぇぉ」などもうてるようにされていたよう。

ドボラック博士とも交流のあった川上晃さんとの共同開発とのことで、斎藤さんも「ひらがな標準配列」をドボラックの研究を参考にして開発した、とされている。スティックニーの配列からの明確な改良点としては、濁点の位置を上段から中断にうつされている点があげられるだろう。また、出現頻度のひくい文字のおおい、は行やま行のキーを最上段に配置していて、上中下3段でなるべくおおくの文字を入力できるようにしたことがうかがえる。

ただ、Dvorak配列から類推されるような新JIS配列のようなものにはされなかった点は興味ぶかい。実際には、スティックニーの原則を保持したまま、 各指で子音をそろえ、よりおぼえやすさを重視して、コンビネーション タイプにされたものになっているようにみえる。

当時すでにあったコンビネーション タイプのカタカナ タイプライターは、スティックニーの配列のシフト面のカナを右外においだしてしまっていた。そのため、50音の行ごとのキーまとまりがくずれてしまっていた(それがのちに改悪といわれているJIS配列になってしまった)。「ひらがな標準配列」では、その点を一番の問題とされたのだろう。

もっとも、コンビネーション タイプではさけられないとはいえ、「ひらがな標準配列」は、「やゆよを」を4段10列の外側に配置してしまっている点では、スティックニーの配列よりも不利にみえる。梅棹さん自身はひらがなタイプライターでもカナモジカイのスティックニーの配列をつかわれつづけたことが『知的生産の技術』のなかにしるされている。

3段10列のニュー スティックニー配列では、ノーマル面とシフト面でなるべく子音をそろえる、ということをしている。各指の子音をそろえる、という点では「ひらがな標準配列」とちかいもののようにおもう。ひょっとすると斎藤さんなら、ニュー スティックニー配列にたいして、まだ性能よりに配列をつくりすぎ、という指摘をされるかもしれないとおもったりしている。

参考文献: 『ひらがなタイプライターの文字配列』ほか, 美しい日本語を求めて =ローマ字運動と共に生きる=第2集, 斎藤強三先生の90才を祝う会, 1989.


2017年4月21日金曜日

梅棹式表記法のための日本語入力システムをかんがえる(その2)

※ 今回は表記の実験もかねて、です・ます調ではなく、だ調でかいています。

 今回は、前回にひきつづいて梅棹式表記のための日本語入力システムについてかんがえてみたい。現在主流の方式は、まずよみを入力して漢字かなまじり文に変換をして、本文中に挿入していく、という方式だ。しかし、梅棹式のようなひらがなのおおい文章では、よみを入力して、けっきょくひらがなに変換(確定)して入力していくということになって能率がよくない。
 そのため前回は、よみを入力して漢字に変換しながら本文中に挿入するのではなく、入力ずみのひらがなを漢字に置換するという方式(置換変換)を実際にためしてみるところまですすめた。置換変換では、タイプしたひらがなは本文中に直接入力されていく。漢字にしたい単語があれば、その単語の末尾で[変換]キーをおす。そうすると、IMEは、カーソルの位置から前方に本文中のひらがなをよみこんでいって、辞書からみつけだした最長一致する単語に置換する。よみを漢字に変換して本文に挿入するのではなく、本文中のひらがなを漢字に置換する、という点がおおきなちがいだ。実際にためしてみると、なかなか、つかいがってがよいことがわかってきた。

文節変換は小学生にはむずかしい


 前回は日本語の表記をユーザーが制御する、という観点から現在主流の文節変換方式については考慮しなかった。文節変換の歴史はふるく、日本語ワープロとしてはじめて商品化されたJW-10は、文節を指定して漢字かなまじり文に変換する方式をすでにサポートしていた。これは天野真家さんの研究による部分がおおきい。
 しかし「文節」という概念は小学生ではならわない。中学生になってはじめてならうのだそうだ。しかも、橋本文法による文節という概念をそもそもおしえるべきなのかどうかさえ、国語の先生がたのなかでも意見が統一されているわけではないらしい(『国語の授業と日本語文法』, 百留康晴, 2011)。
 JW-10には文節指定モードのほかに、もうひとつ漢字指定モードというかな漢字変換モードが用意されていた。その理由の1つとして、『「文節」というような専門用語を一般の使用者に理解させる困難を回避できる』という意義をのべられている。漢字指定モードでは、「くうきはきたいです」という文を入力するとき、
[漢字]くうき[ひらがな]は[漢字]きたい[ひらがな]です。
のように入力する。ちなみに、前置の[漢字]キーの操作をなくすと、キー操作は置換変換とおなじになる。
 富士通のワープロOASYSも、当初は文節変換ではなく、よみの単語(熟語)への変換とひらがなへの無変換をくみあわせた方式をとっていた。「くうきはきたいです」という文を入力するときは、
くうき[変換]は[無変換]きたい[変換]です。[無変換]
のように入力する。これも、[無変換]キーの操作をなくすと、キー操作は置換変換とおなじになる。
 どちらの方式も漢字にするか、ひらがなにするかの決定は完全に著者にまかされている点は興味ぶかい。文節変換の技術を先行して確立していたにもかかわらず、JW-10に漢字指定モードも用意したのは、この点を意識してされていたことがかかれている。
 置換変換は、tsf-tutcodeやuim-tutcodeでは後置型変換というように、漢字のはじまりの指定をなくし、かわりに[変換]キーがおされたときのカーソル位置から前方に最長一致で単語変換をするものとみてもよいようにおもう(より高度な解析をおこなってもかまわないが)。おなじ例文を入力するときのキー操作はつぎのようになる。
くうき[変換]はきたい[変換]です。
この方法で単語のくぎりが想像以上にうまく判定でき、結果的に不要になった確定操作もふくめてキー操作の回数がへっているのが、梅棹式表記による置換変換のあつかいやさにつながっているようにおもう。和語の用言も漢字にする、ということだと、「はきたい[変換]」から「履きたい」に変換される可能性がでてくるが、梅棹式表記ならその可能性はない。
 じっさいのところ、小学生は文節変換をできるのか、ということについては、
「よく行われている変換のタイミングは、字種の変わるところです。例えば、漢字からひらがなに変わる箇所です。なぜか、ひらがなから漢字になるところでは変換しません。」- 『変換のタイミング/日本語変換のコツ, 小学校でのパソコン授業
と、情報教育アドバイザーの広田さち子さんがかかれている。置換変換方式で[変換]キーをおすタイミングは、小学生の直感ともわりとちかいようだ。これを文節変換のIMEでされると誤変換になってしまう。

そのほかの可能性


 もうひとつ、小学生たちにもつかいやすいとおもわれる漢字かなまじり文の入力方式は予測変換だろう。文を入力しながら、目的の単語がでてきたらそれを選択して入力していく方式で、文節のことは、やはりかんがえなくてよい。ただ、この方式でも、予測されてでてきた候補のなかに目的の単語がなかったときには、けっきょく変換操作が必要にある。また、つねに画面の候補をみながらことばをピックアップしていく、という作業が必要で、おもいついたことなどを一気に入力してしまいたい、といった場面ではむしろ面倒なようにもおもう。置換変換でも予測変換は併用できるので、このあたりはどちらもうまくつかえるようになっていると、よいのかもしれない。

1音の動詞は直接キーボードから入力する


 梅棹式で和語の用言で漢字をつかってもかまわないのは、1音の動詞だけだ。しかも、漢字をつかわなければ意味を判別しにくい場合にかぎられている。「うむ」は「生む」と「産む」をつかいわけることがあるけれども、漢字をかきわけないと意味が判別しにくくなるということはない。梅棹式ではこういった和語ではおなじものを漢語に翻訳するかのような感覚的なものは、すなおにひらかなで「うむ」とかくようだ。
 梅棹さんが例としてあげているのは、「切る」と「着る」のようによみはおなじだけれども意味に関係のない1音の動詞だ。ほかにも「買う」と「飼う」のようなものがおもいつく。「さかなをかいたい」という文があったときに、これが「魚を買いたい」なのか、「魚を飼いたい」なのかは、前後の文脈がなければ判断することはできない。最新のかな漢字変換エンジンでもこういった部分は誤変換をすることがあるようだ。
 つまりこういった1音の動詞は、よみから漢字に変換する方式ではどうしても誤変換がさけられない場面がでてくる。だからわざわざ梅棹式でも漢字をつかうことがゆるされているのだろう。もしキーボードで直接目的の漢字を入力できれば、誤変換の問題はさけることができる。そうはいっても、こうした漢字がおおいようだとむずかしくなるのだが、梅棹式でじっさいに必要なのは、以下のような動詞に限定されるようだ。

  • いる 射・(入)
  • うる 売・(得)
  • える 得・(獲)
  • おう 負・(追)
  • おる 織・(折)
  • かう 買・飼
  • かく 欠・(書)
  • きる 切・ 着
  • たつ 裁・(断)
  • とく 解・説
  • にる 似・煮

このなかで括弧のなかにある漢字は通常はひらがなでかいてしまう。けっきょく漢字でかかないといけない場面のでてくる1音の和語の動詞はあまりないようなのだ。これくらいなら容易にキーボードから直接漢字で入力することができる。たとえば、かな配列の場合は、\キーを前置キーとしてつかい、

* \ き → 切
* \ [Shift]+き → 着

といった具合に入力する。「か」は「買・飼・欠」と3文字あって、シフト面が1つだとおさまらないので、

* \ か → 買
* \ [Shift]+か → 飼
* \ け → 欠

といったぐあいに連想しやすい「け」に「欠」をわりあてている。(親指シフトのようにシフト面が2面あるような配列なら、「欠」も「か」にわりあてる。)
 プログラミング言語でも、\nで改行をあらわしたり、\tでタブをあらわしたりする言語がある(エスケープシーケンスとよばれている)。上記のような入力方法は、直接入力可能な漢字の数はかぎられるものの、漢直方式のなかでもおぼえやすいものだとおもう。
 なお、梅棹さんは「まず漢字の訓よみ廃止を」と『現代日本文字の問題点』(1969, 梅棹忠夫著作集18『日本語と文明』のなかに収録されている)のなかでかかれている。一般論としても、よみやすい文章をかくためには、漢字の訓よみをどこまでつかうかは意識しておくべきことのようだ。
 山田尚勇さん(1930-2008)は、「訓読みのものは教育漢字だけにしてあとはひらがなにする」というもしめされている。NHKでも、複数の調査から「訓読みの和語」については、かな表記を好む傾向があることをつかみ、常用漢字表の記載にとらわれず、「弄(もてあそ)・罵(ののし)・遡(さかのぼ)・ 綻(ほころ)・貪(むさぼ)・嘲(あざけ)・蔑(さげす)」といったよみかたのむずかしい訓よみの漢字は「かな優先」という原則をきめたことが報告されている。

モードレスな日本語入力


tsf-tutcodeではその目標のひとつに、
「モード無しで後置型変換を基本とするInputMethodにすることを目指しています。」
ということがあげられている。現在の標準的な日本語入力環境では、ふつうは以下のような3つのモードがある。

  1. 直接入力モード
  2. よみ入力モード
  3. かな漢字変換中モード

モードレスというのは、こういうモードをなくしていこう、ということだ。
 tsf-tutcodeやuim-tutcodeをつかった置換変換では、ひらがなは、つねに直接入力になるので、「よみ入力モード」がなくなっている。そのため、誤変換してしまったときでも、ワープロやテキスト・エディタの「元に戻す(Undo)」をつかえば、もとのひらがなにもどすことができて、IME専用の特別なキー操作は必要なくなっている。モードレスのよさはこういった部分だ。
 ここまでくると、「漢字変換中モード」もなくしたい、とおもうようになってくる。画面表示については、選択範囲の表示とくみあわせてアプリ側に完全にまかせてしまうような実装もおもしろいようにおもう。イメージとしては、
生きがいろん
というところで[変換]キーをおしたら、
生き概論
のようになり、「概論」の部分が選択されていて、カーソルは選択範囲のひだりはしに移動している、というような方法だ。ここでShift-→をおすと、選択範囲がちいさくなって、
生きが異論
とかわって、さらに、もう1回Shift-→で、
生きがい
となる。選択範囲をちいさくする方法が、通常の編集時とおなじになっている、という点がだいじな部分だ。この方法では、[変換]キーをきっかけとしてつくられた範囲選択中に文字キーがおされたら、置換ではなくて、範囲選択のとりけしと、文字の追加という動作になっていてほしいとおもうが、こういったことはIME側で制御できるのではないかとおもう。
 英文のテキスト処理でも、挿入モードと置換モードをどうとりのぞくか、というのはもっともむずかしく、すぐにはこたえがみつからなかった("User Interface: A Personal View", Alan Kay, 1989)、というくらいなので、きちんと実験ができるとよいとおもう。どちらかというと、プログラムがシンプルになるという部分がおおきな利点になるのかもしれない。

まとめ


 置換変換と梅棹式表記をつかうようになってまだ3週間弱といったところなのだが、じつはすっかり気にいってしまっている。一番の理由は、わざわざひらがなのよみを入力してひらがなに変換(確定)するというムダな作業をしなくてよいからだとおもう。梅棹式表記とあわせて、従来の文節変換よりも単純にかんたんで能率がよいように感じられる。
 置換変換については、小学生のときからつかう入力方式としても、現行の文節変換方式よりもよいのでは、ということをのべた。日本人はITリテラシーのあるひとが他国よりもすくない、ということがいわれる。ただこれはITのリテラシーではなくて、キーボードをつかって作文をする、というもっと基本的なかきかたのリテラシーをもったひとがすくない、という風にとらえるべきだとおもっている。
 リテラシーをもったひとをふやすには、ただ教育の時間をふやすのではなく、より容易にリテラシーをみにつけられるようにシステムをかえていくことがだいじなのだろう。日本人のよみかき能力は、戦後まもなくのリテラシーをもっている日本人は6.2%という状況から、現在は世界のトップ10にはいるほどにたかまってきた(コンピューターの操作をのぞいては)。これは、今のひとが明治・大正時代や戦前のひとよりも単純によみかきができるようになった、というようなことではなく、言文一致運動や漢字制限といった日本語の平明化の努力がみのったものだとおもう。
 明治から昭和にかけて事務のカナモジ化をおしすすめた伊藤忠兵衛さん(1886-1973)が、大正時代に小学校を卒業して入社してきた工員が100%よめない、とかかれた漢字は「練篠、糊槽、綜絖、梭 、筬 、杼、ナド」(『呉羽紡績30年』)で、これらは今でもよめないひとがおおいのではないだろうか。そういった漢字を安易につかってしまうことを年月をかけてあらためてきたことが、リテラシーをもったひとがおおい今の日本につながっているのだとおもう。ちなみに、杼(ひ)はシャトルのことだそうで、宇宙船ということばがよくつかわれているところをみると、大正時代ならひょっとしたらスペースシャトルも宇宙杼とかかれていたりしたのかもしれない(そしてよめない)。
 脱線してしまったけれども、小学生でも容易にキーボードをつかって作文をできるようなレベルまで、キーボードだけでなく、IMEなどもふくめて日本語入力システムそのものをよりかんたんなものにかえていく研究はますます必要になってきているようにおもう。
 また今回は、1音の動詞の入力方法についてものべた。これらは、かな漢字変換方式では誤変換につながりやすい漢字でもあり、できるかぎり簡易にした漢直方式をとりいれてみた。必要な文字数がそれほどおおくないこともあり、漢直をつかうのが適している場面のように今はおもっている。まだしばらく実験をつづけていく予定だ。梅棹さんなら、これらの漢字もつかわないですめばその方がよいといわれるにちがいない。
 日本語の表記をかんたんには制御しにくいワープロの文節変換方式が普及してきたことで、戦後までの50年にもおよぶ日本語の平明化の努力がわすれられたかのように、2010年には常用漢字が200字近く増える、ということになってしまった。ワープロでかかれた文章を調査して結論をみちびけば、常用漢字はふやしてよい、ということになったのだとおもう。しかし、きちんと日本人が漢字をよめているかどうかということをNHK放送文化研究所のようにしらべれば、常用漢字表の記載にとらわれず「かな優先」といった原則がつくられるようになった点は、日本語入力システムにかかわる技術者もあらためて考慮する必要がある点だろうとおもう。
 もちろん梅棹式表記ではひらがながおおすぎる、と感じられるひとはむかしからいらっしゃるようだ。ただ、すこし時間をおいて、自分で入力した漢字かなまじり文を自分でもよめるかどうか、といったことを、あらためてたしかめてみるのもよいようにおもう。
 tsf-tutcodeやuim-tutcodeのように、梅棹式表記のようなものにも比較的容易に対応できるIMEがあるいま、文節変換方式が本当によいものだったのかどうか、というところまでもどって今回はかんがえてみた。文節変換方式を実用化された天野真家さん自身が、別の方式もはじめから用意されていた、という事実はとても興味ぶかいことのようにおもう。
 というわけで、今回はここまでに。その3については、またあたらしい発見があれば。

補足: ツールについて


 tsf-tutcodeおよびuim-tutcode用のツール関連では、漢字辞書について、和語の熟語を辞書から削除するようなツールも用意して、前回よりも梅棹式表記を実践しやすい環境を用意しました。それらをまとめてGitHubから公開してあるので、興味をもたれたかたは、ためしてみてください。梅棹さんの著作などをほかのひとにすすめられるような機会があれば、論文でもブログでも梅棹式表記をつかわれることが一番ではないかとおもったりしています(すでにそうされている論文やブログ記事を数件みかけています)。


2017年4月3日月曜日

『日本語と事務革命』— 梅棹式表記法のための日本語入力システムをかんがえる

 最近になって梅棹忠夫さん(1920-2010)の『日本語と事務革命』をよんでみました。梅棹さんは、著書の『情報の文明学』を2017年3月の中央公論で「これからの時代を切り拓く学生達にも是非とも読んでもらいたい一冊である」と村井純さんがすすめられていたり、ひらかなタイプライターがはじめてできたとき、ワープロのOASYSができたとき、それぞれ開発者のかたから手紙をうけとるような、そんなおおきな存在のひとであったようです。

梅棹さんとキーボード


 『日本語と事務革命』は、おもに事務処理のための日本語の書き方の本ですが、梅棹さん自身がどのように日本語を書いてこられていたか、というながれも、とてもおもしろいものでしたので、簡単にまとめておきます。

1) 英文タイプライターでローマ字がきをされていた時代。(1930年代後半〜)


 高校生のころに自分用の英文タイプライターをてにいれられて、ローマ字で日本語をうたれるようになったのだそうです。むつかしい漢字をさけて、わかりやすい日本語をかかれるようになったのは、このときの経験がおおきいと。「梅棹忠夫の文章はなぜ明快なのか」という論文があるので、そちらも参考に。

 先日、梅棹さんの京都のご自宅だったロンドクレアントで、梅棹さんは、学術探検中にラクダのうえにタイプライターをのせて移動しながらタイピングをされたりしていた、というお話をうかがいました。じつはエクストリーム・タイピングの先駆者でもあったのかもしれません。

2) カナモジ・タイプライターの時代。(1960年頃)


 カナモジというのはカナモジカイのカタカナのよび方だそう。ローマ字でかいた文章は、ほかの人からはよんでもらうときに、あまりよろこばれない。それでもタイプライターはつかいたいと、英文タイプライターからカナモジ・タイプライターに変更されます。このカナモジ・タイプライターのかな配列をデザインされたのが、このブログではよく登場するスティックニーさんです。

 p.121に、スティックニーさんのかな配列表をわざわざのせられています。当時3万円もしてたかすぎといわれたタイプライターの雰囲気を、多少でもつたえられたかったのかとおもいます(この部分の原稿は1960年のもの)。「スティックネー技士」(p.51)をよむと、スティックニーさんがカナモジをとてもよく理解されていたことがつたわってきます。

3) ひらかなタイプライターの時代。(1962年〜)


 いまは小学校ではひらがなからならいますが、戦前はカタカナからならったのだそう。それでタイプライターもカタカナだったのですが、戦後、日常の文章はひらがな主体になりました。そのため梅棹さんは、ひらがなのタイプライターをご自身で開発されようとおもわれていたようです。そんなところへ、京都の斎藤強三さん(1899-1989)から梅棹さんのもとにひらがなでタイプされた手紙がとどいたそうです。斎藤強三さんが、川上晃さん(1921-2001)と共同ですでにひらかなタイプライターをつくられていたことをしって、すこし落胆もされたのだそうですが、さっそくひらかなタイプライターをつかわれはじめます。

余談: 斎藤さんのつくられたひらがなの活字をのせたタイプライターの最初期の1台は石原慎太郎さんのものになったのだそうです。川上晃さんは日本語入力機器の真の先駆者で、日本語の機械速記や漢直なども川上晃さんの開発されたものが最初期のものといってよいのだとおもいます。Dvorak配列のDvorakさんとも親交があったこともあり、石原慎太郎さんにわたされたものは、スティックニー配列ではなく、あたらしい配列になったようです。梅棹さんは、つかいなれたスティックニーの配列をひらかなタイプライターでもえらばれたのだそう。

3) カナかなタイプライターの時代。(1971年〜)


 日本語にカタカナの用語が急速にふえてくると、ひらかなタイプライターでは不充分とかんがえられるようなります。そしてカタカナとひらがなとアルファベットがうてるカナかなタイプライターの開発をはじめられます。1971年はその試作1号機がうごきだした年です。

 高解像度の写真がなく、一部まちがっているかもしれませんが、カナかなタイプライターの配列は3段シフトでおよそつぎのようなものだったようです。(正確な配列がわかるかたがいらしたら、ぜひおしえてください。)

゜ねぬゃゅょっをちつよゆやめ「 
゛ふひになのはたてとあえみむ
 ほへけくかきこんいうらおろ」
 わそせさすしもまるりれ、。

゜ネヌャュョッヲチツヨユヤメ 
゛フヒニナノハタテトアエミム
 ホヘケクカキコンイウラオロー
 ワソセサスシモマルリレ、。

 QWERTYUIOP︙(・'
 ASDFGHJKLァェ)“
 『ZXCVBNMィゥ!ォ?”
 』一二三四五六七八九〇+/

 英数のQWERTYは1段上に、さらに左方向にずれていて、ホームポジションは「き」と「い」になるようです。タイプライターではワープロのように英数/かなでモード切換というのもむつかしく、制約のおおいなかでのデザインになったことがわかります。英数字面にある小書きのァィゥェォなども特徴的です。また、スティックニー配列を愛用されていた梅棹さんらしく、50音の行ごとにキーをまとめたデザインになっているのも特徴のひとつでしょうか。「ぬね/ひふへほ/そわ」を左外にはじいたデザインは、1月にこのブログにのせたあたらしいかな配列で「ぬね/ひふへほ」がシフト面にあるのと同じ理論かとおもいます。

 カナかなタイプライターは40台分の予算を梅棹さんが初代館長をつとめられた民俗学博物館で確保されていたそうですが、残念ながらメーカー側で量産化はみおくられてしまいます。ワープロの時代がすぐそこまでせまっていたのでした。

余談: 一般にも、カタモジ・タイプライターで、ひらがなまではいらないけれど、アルファベットはうちたい、という要求があったようです。そのためシフト面にQWERTYのアルファベットを配置したカタモジ・タイプライターもつくられています。そのとき、もともとシフト面にあったカナモジはキーボードの右外においだされてしまっています。そのため、かな入力はしづらくなってしまったのですが、それをそのままひきついで標準化してしまったのが現在のJIS配列です。スティックニーさんはそんなおかしなデザインはされていない、というのは念のため。

4) ワープロの時代(キヤノワード60)。(1982年〜)


 梅棹さんは、OASYSの製品化時に、梅棹さんの著書を参考にされていたという神田泰典さんから手紙をいただいていたそうです。しかし、梅棹さんがえらばれたのはローマ字入力のできるキヤノワード60でした。高校時代からつかいなれてきたローマ字入力のできるワープロをえらばれたのは、ある意味自然なことだったのかもしれません。

余談: 梅棹さんは、Dvorakの影響をうけた川上さんらの新配列ではなく、スティックニー配列をつかわれつづけた、ということについても、ひょっとするとおぼえておかれたほうがよかったのかもしれません。

ワープロ反動


 さて、カタカナとひらがなとアルファベットだけでなく、とうとう漢字まで入力できるワープロができて、梅棹さんはよろこばれるだろう、とおそらくは神田さんもふくめて、技術者にはおもわれていたようです。しかし、梅棹さんは実際には相当な不満ももたれたようです。

「(ワープロは)日本語の洗練という点では、あきらかにマイナスであった」(p.224)

「日本語の文章における漢字はこの一世紀のあいだ、先人たちのひじょうな努力によって、ようやく現状のところまでへらすことに成功してきたのである。ワープロ技術者たちは、この先人たちの血のにじむような努力に経緯と考慮をはらったのであろうか。そういう歴史があることさえ、しらなかったのではないか。」(p.224)

 ワープロの登場によって漢字の使用率がふたたびたかまってしまったことを非常に問題視されたのです。梅棹さんのひとつの提案は「漢字変換をやめること」(p.229)でした。

第三次事務革命の先頭をきった、と梅棹さんが書かれた呉羽紡績の30年史(1960)から(p227)。

 歴史的には、日本人の識字率は99%といった主張のかげで、じっさいには最低限のよみかき能力(リテラシー)のあるひとは1870年代には8%、戦後1948年の「日本人の読み書き能力調査」では人口の6.2%にすぎなかったことが『占領下日本の表記改革』などでつたえられています。

 日本の文部省は「なかなか進歩的であった」(p.65)と梅棹さんが評されるように、初代文部大臣森有礼は、自国語の教科書さえもそろっていないことを心配して、日本語の表記はアルファベットにしようか、とまでかんがらえたようです。そういうなかで、さいわい、ちいさな「」を導入した「うひまなび」のような教科書もうまれていたのでした。それまでは「ッ」は表記では省略されたりしたことがかかれています。

 1900年には、文部省では上田万年さんらが日本語のかなづかいを表音式に変えることや漢字の制限を一度は決定します。しかしこれはすぐにくつがえされてしまい、表音式のかなづかいは戦後になってようやく実現します。それでもこの年の小学校令で棒引き(長音のー)をつかうようになったことが、いまにつながっていたりすることが山口謠司さんの著書などでふれられています。

 梅棹さんもp.65では、第49代文部大臣の平生釟三郎さんが、漢字をすくなくしたい、勅語もそうしたい、という趣旨を国会で答弁して、発言をとりけさざるをえなかったということに、わざわざふれられています。「日本人の読み書き能力調査」のことは梅棹さんもご自身の著書のなかでふれられていて、リテラシーの問題、日本語の平明化は梅棹さんにとってもおおきなテーマであったことがつたわってきます。

梅棹式表記法


 梅棹さんは民俗学博物館館長をつとめられたあと、ローマ字会の会長をされて、日本語の表記をローマ字に、とうったえられるようになります。ひらかなタイプライターの開発者、斉藤強三さんからの遺言だったそうです。しかし、いまは『日本語と事務革命』の、

「新字論はダメだ、ということが、一つの結論」(p.133)
「(ローマ字は)日本語をかく文字としては、まさに新字の一種」(p.134)

という段階にとどまって、なにができるだろう、ということをかんがえてみたいとおもいます。さいわい梅棹さんは漢字かなまじり文で文章をどうかくべきか、ということも著書にのこされています。「梅棹式」表記法とよばれているものです。

梅棹式表記のルールは、
  1. 漢語は漢字。むつかしいのはさける(常用漢字を意識)。
  2. 和語はかな。1音の動詞で意味が判別しにくいもの(例:切る、着る)は漢字の使用も許容。
「漢字はやめたい」, 『日本語の将来』, p249.

という風にまとめてよいようにおもいます。また用言をひらがなにする、という風に説明されていることもあるようです。

 これなら漢字がすくなくて簡単、と一瞬おもうのですが、実際にはなかなかむずかしいことです。こういった表記法で梅棹さんのように意味がすっとわかる文章をかくには、同音異義語をさけたりといった言葉えらびがきちんとできていないと、ということを梅棹さんの秘書をされていた藤本ますみさんが著書(p.87)のなかでかかれています。

 しかし、とにかく梅棹さんはこのルールで文章をかかれています。そのときに、ワープロのかな漢字変換というのはあまりにもつかえない、というのがワープロへのひくい評価につながったのではないか。そういうことがひとつかんがえられそうです。梅棹さんに、しかられないような日本語入力システムの条件はどのようなものになるだろうと、つぎのような3つの条件をかんがえてみました。

1. ひらがなを変換や確定といった操作をかいさずにベタに直接うてること。

 梅棹さんの提案は「漢字変換をなくすこと」だったわけですから、これはまちがいないようにおもいます。

2. カタカナやアルファベットも直接入力できること。

 カナかなタイプライターのときに、梅棹さんはカタカナやアルファベットの入力を「漢字をやめての最低抵抗線」(p.167)とされました。ですので、これはカナかなタイプライターの3段シフトのように、変換ではなく、モードきりかえを想定するとよいだろうとかんがえました。

3. 梅棹式で許容されている範囲内でどうしてもというときだけ、漢字を入力する手段がつかえること。

 漢字の使用には「自制が必要なのだ」(p.230)とかかれているので、ここをいいかげんにすることはできません。簡単に本人すらじつはしらないような漢字を入力できてしまうようなシステムは絶対にだめ。そういうことになるだろうとかんがえました。

 3.の条件にたいして、漢字の使用を自制できる、すくなくとも完全にユーザーが漢字の使用を制御できる入力方式ということでは、以下の3つの案がうかびました。

案1. 漢直方式


 漢直という、キーボードから漢字を直接入力する方法があります。どうするのかというと、漢字1文字1文字それぞれにことなるキーの打鍵順(通常は2キーか3キー)をきめて、それをひとつひとつ暗記して、キーボードで漢字を1文字ずつ直接入力していくという方法です。ふつうのひとが何千もの漢字のキーの打鍵順をおぼえるのは大変です。それなら漢字自体あまりつかわなくなるのではないか、とかんがえたのでした。

 この方式は、川上さんのラインプットという方式が先駆的なもので、T-code, TUT-codeといったそのほかの方式も開発されて、現在でも熱心につかわれているかたがいます。

案2. 前置方式


 竹内郁雄先生のKanzenという方式があります。竹内先生も一太郎ver.2で、「私の編集作業のかなりの部分は漢字になってしまったものをひらがなに戻すことだった」というご経験から、「無変換をデフォールトとし,変換は先に指定する方式とする」ことにされ、「かな入力の場合は変換キーを先に打つ」というKanzenという入力方式を考案されていました。この方式でも、前置キー(シフトキーや変換キー)をうたないかぎりは、文章に漢字がまざることは絶対にありません。

 現在はSKKというIMEでこの方式を利用することができて、実際につかわれているかたもかなりおおいようにおもいます。

案3. 置換変換(後置方式)


 とりあえずベタでひらがなを入力してしまって、漢字にしたい部分だけあとから変換キーをおして漢字に置換するという方式についてもかんがえてみました。一般的なIMEは、漢字かなまじり文をつねにIMEのなかでつくって本文に挿入するような方式になっています。それにたいして、置換変換は本文中にはすでにひらがなで文章がはいっていて、漢字にしたい部分の末尾にカーソルをうごかして(入力中はもともとカーソルが末尾にある)、変換キーをおすと漢字に変換したものに置換されるという方式です。変換キーをおすのは、ふつうのIMEのように文節のあとではなくて、漢字の熟語の直後になります(後置)。

 こういうことができるためには、ワープロに入力ずみのテキストをIMEにもどすようなしかけがアプリケーション ソフトウェア側にも必要になります。このことが置換方式があまり一般的になっていない理由のひとつかもしれません。Microsoft社のナチュラル インプットはWordとセットでこうしたことにトライしたIMEだったようです。

 まだ案としては、ほかにもあるかもしれません。この3案のなかでは、置換変換はそもそも置換変換が可能なIMEがいまもあるのかどうかよくわからないところがありました。

置換変換をためす — tsf-tutcodeとuim-tutcode


 いま置換変換のようなことをためせるIMEはないのかな、とおもっていたところ、漢直のT-codeやTUT-codeの後置型まぜがき変換機能がおなじよう方式だということをTwitterでおしえてもらいました。まぜがき変換というのは、「帰しゃ」というような漢字とひらがながまざったすでに入力ずみの文字列からさらに「帰社」に変換しておきかえる、というものです(これができると「汽車」や「記者」に誤変換されることがありません)。そして、後置型まぜがき変換はかなだけの文字列にたいしてもつかえる、ということでした。

 後置型まぜがき変換機能のつかえる漢直IMEとして紹介していただいたのが、Windows用のtsf-tutcodeと、Linuxなど用のuim-tutcodeです(くわえてemacs用のtc2も紹介していただきました)。どちらも、本来は漢直方式のTUT-codeのためのもので、そのままでは一般的なローマ字入力やかな入力には対応していませんでした。そこで実験のために、Twitter上でアドバイスをいただきながら、ローマ字入力用の設定ファイルを用意しました:

tsf-tutcode用: https://gist.github.com/ShikiOkasaka/e5a46a278965f6fe3f1e2686c10c57f4
uim-tutcode用: https://gist.github.com/ShikiOkasaka/451a995da66c87f71ced2f5cd5bbbf87

 ちなみに上記の設定ファイルではローマ字の表記に梅棹さんがローマ字会の会長をされていたときにつくられた99式を採用しています。興味のあるかたは、99式の表記もみてみてください。またエスリルのNISSEをつかわれているかたは、この設定ファイルで親指シフトやTRONかな配列をつかって置換変換をつかうことができるようになります。

 また梅棹さんは、「(ワープロ)メーカー側にも、漢字がふえるのをふせぐための配慮がほしいものだ。たとえば、常用漢字以外はでてこないようにするための規制スイッチをつけるくらいは、技術的にはやさしいことであろう。」(p.225)とのべられています。これにこたえられるように、今回、専用の辞書(restrained.dic)も用意しました: https://gist.github.com/ShikiOkasaka/51286f65d20a35c988afd03ba91c095b

 restrained.dicは、tc2のmazegaki.dic(常用漢字外の辞書登録もかなりふくまれています)から、常用漢字および人名用漢字にない漢字をつかった熟語、すべての活用語、および、まぜがきのよみをいったん削除したものに、漢字の使用が許容されている1音の動詞のみ別途追加したものになっています。この辞書をつかって置換変換しているかぎりは、梅棹さんのいわれた最低限の漢字制限はまもることができるはずです。ただ、まだ梅棹さんならひらがなでかかれたような熟語がrestrained.dicにはふくまれています。こういった部分は本当にまだ自制が必要です(そういった熟語を全部なくした辞書もつくってみたいところですが、梅棹さんの著作がコンピュータライズされていないとすこし大変です)。

 実際に置換方式をつかう場合の入力方法は、つぎのようになります。例文として、梅棹さんの、
「しろうとむけワープロの登場を期待したいですね。」(p.205)
という文をつかって説明していきます。ふつうのIMEですと、このとおり入力しようとおもっても、
しろうとむけわーぷろのとうじょうをきたいしたいですね。[変換][確定]

で「素人向けワープロの登場を期待したいですね。」となったまま、よしとしてしまう人がおおいのだろうとおもいます。梅棹さんがいきどおられたのは、こうしたことだろうとおもいます。

 きちんと「しろうとむけワープロの登場を期待したいですね。」と入力するには、
しろうとむけ[無変換]わーぷろのとうじょうをきたいしたいですね。[変換][確定]

といったことになるでしょうか。人によっては、
しろうとむけ[確定]わーぷろの[変換][確定]とうじょうを[変換][確定]きたいしたいですね。[変換][確定]

といった具合に入力されていたり、場合によってはくせもあって、
しろうとむけ[変換][ESC][確定]わーぷろの[変換][確定]とうじょうを[変換][確定]きたいしたいですね。[変換][確定]

といったことになってしまう人もいるのではないかとおもいます。結局、漢字をたくさんつかった日本語のほうが入力しやすくなってしまっているようなところが問題ということになるのではないでしょうか。

置換変換では、
しろうとむけ[Caps/on]ワープロ[Caps/off]のとうじょう[変換]をきたい[変換]したいですね。

といった具合に入力します。カタカナの部分は小指シフトかCaps Lockをつかいます。漢字は、意図的に漢字にしたい部分の最後で[変換]キーをおします。

 同音異義語がなければ[変換]をおして候補がでた状態でそのまま次の文字を入力していけば大丈夫です。梅棹式は、同音異義語をさけるような言葉えらびもこみで梅棹式というべきでしょうから、じょうたつすれば変換候補をつぎつぎに表示していくような操作はへっていくはずです。

 また漢字をまだならっていない小学生であれば、
しろうとむけ[Caps/on]ワープロ[Caps/off]のとうじょうをきたいしたいですね。

のように入力できれば十分でしょう。漢字変換のことは、もっとあとでおぼえてもよいのです。

 置換型変換では、カーソルの直前にあるひらがなの文字列にたいして、なるべくながい熟語に変換しようとします。そのため「いきがい論」と入力したいときには、最初は「いき概論」のようになります。これを修正するには、>か右カーソルキーをじゅんにおしていくと対象がみじかくなっていって、「いきが異論」、「いきがい論」といった具合に、目的の漢字がでてくるようになります。こういうことが頻繁におきるときには、tsf-tutcodeやuim-tutcodeでは、カーソルの直前の何文字目までにたいして置換変換をおこなう、といった操作をすることもじつはできます。このあたりは、置換変換が漢直や前置方式とくらべるとわずらわしさがのこる部分ということになるのかもしれません。

 しかし、この記事はずっとuim-tutcodeをつかってかいてきているのですが、実用では>や右カーソルキーをつかって熟語の長さをなおさないといけない場面はあまりないようなのです。日本語の専門家ではないので、実際ところはよくわかりませんが、日本語の助詞というのがそもそも語と語を自然にくぎるような音でつくられているのではないかというふうにおもったりもします。また、このあたりは置換変換というかんがえかたがひろまれば、単純な前方最長一致よりもくわしく解析をおこなって置換変換をするようなIMEも将来つくられることもひょっとしたらあるのではないかとおもいます。

ひとまずのまとめ


 一点、梅棹さんの基本的なコンテキストは、まずは事務の書類のようによんだ人がだれでもきちんと理解できることを期待しているような文書ということになるのだろうとおもいます。「言語は100年をおよそ一代」とかかれた山口謠司さんは、100年前の夏目漱石は理解可能、そのすこしまえの森鴎外はすでにむずかしい、とかかれていました。その漱石ですら現代語訳が出版される時代です。じつは自分もセイを所為とうつことがおおかったのですが、こういうのはふだんはなおしていかないと、とおもったりしています。

 ところで、最初の、
「これからの時代を切り拓く学生達にも是非とも読んでもらいたい一冊である」
の「切り拓く」はよめたでしょうか?「きり?く」。開拓の「拓」なので意味はつかめますが、「拓」の訓よみは常用漢字のなかにはありません。梅棹式なら、
「これからの時代をきりひらく学生たちにも、ぜひともよんでもらいたい一冊である」
のようにまずはなって、ひょっとすると文そのものも、なおしたりすることになるようにもおもいます。

 今回は、梅棹忠夫さんの著書『日本語と事務革命』の話題から、梅棹式表記法、そのための日本語入力システムの考察と、置換変換の紹介をしました。平明な日本語の文章をかくためのソフトウェアというのは、まだまだ未開なところがあるようにもおもいます。またこの文章は置換変換の実験もかねて、梅棹式でuim-tutcodeをつかってかいてみました。よみにくいところは、まだ梅棹式表記法をつかってみたばかりで、ということで。置換変換もつかいはじめたところで、カタカナの入力はモードきりかえがよいのか辞書登録がよいのか、といったあたりはまだこたえはだしていません。それでも、もとのIMEにもどそうとはもうおもわなくなっているくらい、なかなかよいものだとおもっています。

 ということで、つづきはまた次回に。