2017年4月3日月曜日

『日本語と事務革命』— 梅棹式表記法のための日本語入力システムをかんがえる

 最近になって梅棹忠夫さん(1920-2010)の『日本語と事務革命』をよんでみました。梅棹さんは、著書の『情報の文明学』を2017年3月の中央公論で「これからの時代を切り拓く学生達にも是非とも読んでもらいたい一冊である」と村井純さんがすすめられていたり、ひらかなタイプライターがはじめてできたとき、ワープロのOASYSができたとき、それぞれ開発者のかたから手紙をうけとるような、そんなおおきな存在のひとであったようです。

梅棹さんとキーボード


 『日本語と事務革命』は、おもに事務処理のための日本語の書き方の本ですが、梅棹さん自身がどのように日本語を書いてこられていたか、というながれも、とてもおもしろいものでしたので、簡単にまとめておきます。

1) 英文タイプライターでローマ字がきをされていた時代。(1930年代後半〜)


 高校生のころに自分用の英文タイプライターをてにいれられて、ローマ字で日本語をうたれるようになったのだそうです。むつかしい漢字をさけて、わかりやすい日本語をかかれるようになったのは、このときの経験がおおきいと。「梅棹忠夫の文章はなぜ明快なのか」という論文があるので、そちらも参考に。

 先日、梅棹さんの京都のご自宅だったロンドクレアントで、梅棹さんは、学術探検中にラクダのうえにタイプライターをのせて移動しながらタイピングをされたりしていた、というお話をうかがいました。じつはエクストリーム・タイピングの先駆者でもあったのかもしれません。

2) カナモジ・タイプライターの時代。(1960年頃)


 カナモジというのはカナモジカイのカタカナのよび方だそう。ローマ字でかいた文章は、ほかの人からはよんでもらうときに、あまりよろこばれない。それでもタイプライターはつかいたいと、英文タイプライターからカナモジ・タイプライターに変更されます。このカナモジ・タイプライターのかな配列をデザインされたのが、このブログではよく登場するスティックニーさんです。

 p.121に、スティックニーさんのかな配列表をわざわざのせられています。当時3万円もしてたかすぎといわれたタイプライターの雰囲気を、多少でもつたえられたかったのかとおもいます(この部分の原稿は1960年のもの)。「スティックネー技士」(p.51)をよむと、スティックニーさんがカナモジをとてもよく理解されていたことがつたわってきます。

3) ひらかなタイプライターの時代。(1962年〜)


 いまは小学校ではひらがなからならいますが、戦前はカタカナからならったのだそう。それでタイプライターもカタカナだったのですが、戦後、日常の文章はひらがな主体になりました。そのため梅棹さんは、ひらがなのタイプライターをご自身で開発されようとおもわれていたようです。そんなところへ、京都の斎藤強三さん(1899-1989)から梅棹さんのもとにひらがなでタイプされた手紙がとどいたそうです。斎藤強三さんが、川上晃さん(1921-2001)と共同ですでにひらかなタイプライターをつくられていたことをしって、すこし落胆もされたのだそうですが、さっそくひらかなタイプライターをつかわれはじめます。

余談: 斎藤さんのつくられたひらがなの活字をのせたタイプライターの最初期の1台は石原慎太郎さんのものになったのだそうです。川上晃さんは日本語入力機器の真の先駆者で、日本語の機械速記や漢直なども川上晃さんの開発されたものが最初期のものといってよいのだとおもいます。Dvorak配列のDvorakさんとも親交があったこともあり、石原慎太郎さんにわたされたものは、スティックニー配列ではなく、あたらしい配列になったようです。梅棹さんは、つかいなれたスティックニーの配列をひらかなタイプライターでもえらばれたのだそう。

3) カナかなタイプライターの時代。(1971年〜)


 日本語にカタカナの用語が急速にふえてくると、ひらかなタイプライターでは不充分とかんがえられるようなります。そしてカタカナとひらがなとアルファベットがうてるカナかなタイプライターの開発をはじめられます。1971年はその試作1号機がうごきだした年です。

 高解像度の写真がなく、一部まちがっているかもしれませんが、カナかなタイプライターの配列は3段シフトでおよそつぎのようなものだったようです。(正確な配列がわかるかたがいらしたら、ぜひおしえてください。)

゜ねぬゃゅょっをちつよゆやめ「 
゛ふひになのはたてとあえみむ
 ほへけくかきこんいうらおろ」
 わそせさすしもまるりれ、。

゜ネヌャュョッヲチツヨユヤメ 
゛フヒニナノハタテトアエミム
 ホヘケクカキコンイウラオロー
 ワソセサスシモマルリレ、。

 QWERTYUIOP︙(・'
 ASDFGHJKLァェ)“
 『ZXCVBNMィゥ!ォ?”
 』一二三四五六七八九〇+/

 英数のQWERTYは1段上に、さらに左方向にずれていて、ホームポジションは「き」と「い」になるようです。タイプライターではワープロのように英数/かなでモード切換というのもむつかしく、制約のおおいなかでのデザインになったことがわかります。英数字面にある小書きのァィゥェォなども特徴的です。また、スティックニー配列を愛用されていた梅棹さんらしく、50音の行ごとにキーをまとめたデザインになっているのも特徴のひとつでしょうか。「ぬね/ひふへほ/そわ」を左外にはじいたデザインは、1月にこのブログにのせたあたらしいかな配列で「ぬね/ひふへほ」がシフト面にあるのと同じ理論かとおもいます。

 カナかなタイプライターは40台分の予算を梅棹さんが初代館長をつとめられた民俗学博物館で確保されていたそうですが、残念ながらメーカー側で量産化はみおくられてしまいます。ワープロの時代がすぐそこまでせまっていたのでした。

余談: 一般にも、カタモジ・タイプライターで、ひらがなまではいらないけれど、アルファベットはうちたい、という要求があったようです。そのためシフト面にQWERTYのアルファベットを配置したカタモジ・タイプライターもつくられています。そのとき、もともとシフト面にあったカナモジはキーボードの右外においだされてしまっています。そのため、かな入力はしづらくなってしまったのですが、それをそのままひきついで標準化してしまったのが現在のJIS配列です。スティックニーさんはそんなおかしなデザインはされていない、というのは念のため。

4) ワープロの時代(キヤノワード60)。(1982年〜)


 梅棹さんは、OASYSの製品化時に、梅棹さんの著書を参考にされていたという神田泰典さんから手紙をいただいていたそうです。しかし、梅棹さんがえらばれたのはローマ字入力のできるキヤノワード60でした。高校時代からつかいなれてきたローマ字入力のできるワープロをえらばれたのは、ある意味自然なことだったのかもしれません。

余談: 梅棹さんは、Dvorakの影響をうけた川上さんらの新配列ではなく、スティックニー配列をつかわれつづけた、ということについても、ひょっとするとおぼえておかれたほうがよかったのかもしれません。

ワープロ反動


 さて、カタカナとひらがなとアルファベットだけでなく、とうとう漢字まで入力できるワープロができて、梅棹さんはよろこばれるだろう、とおそらくは神田さんもふくめて、技術者にはおもわれていたようです。しかし、梅棹さんは実際には相当な不満ももたれたようです。

「(ワープロは)日本語の洗練という点では、あきらかにマイナスであった」(p.224)

「日本語の文章における漢字はこの一世紀のあいだ、先人たちのひじょうな努力によって、ようやく現状のところまでへらすことに成功してきたのである。ワープロ技術者たちは、この先人たちの血のにじむような努力に経緯と考慮をはらったのであろうか。そういう歴史があることさえ、しらなかったのではないか。」(p.224)

 ワープロの登場によって漢字の使用率がふたたびたかまってしまったことを非常に問題視されたのです。梅棹さんのひとつの提案は「漢字変換をやめること」(p.229)でした。

第三次事務革命の先頭をきった、と梅棹さんが書かれた呉羽紡績の30年史(1960)から(p227)。

 歴史的には、日本人の識字率は99%といった主張のかげで、じっさいには最低限のよみかき能力(リテラシー)のあるひとは1870年代には8%、戦後1948年の「日本人の読み書き能力調査」では人口の6.2%にすぎなかったことが『占領下日本の表記改革』などでつたえられています。

 日本の文部省は「なかなか進歩的であった」(p.65)と梅棹さんが評されるように、初代文部大臣森有礼は、自国語の教科書さえもそろっていないことを心配して、日本語の表記はアルファベットにしようか、とまでかんがらえたようです。そういうなかで、さいわい、ちいさな「」を導入した「うひまなび」のような教科書もうまれていたのでした。それまでは「ッ」は表記では省略されたりしたことがかかれています。

 1900年には、文部省では上田万年さんらが日本語のかなづかいを表音式に変えることや漢字の制限を一度は決定します。しかしこれはすぐにくつがえされてしまい、表音式のかなづかいは戦後になってようやく実現します。それでもこの年の小学校令で棒引き(長音のー)をつかうようになったことが、いまにつながっていたりすることが山口謠司さんの著書などでふれられています。

 梅棹さんもp.65では、第49代文部大臣の平生釟三郎さんが、漢字をすくなくしたい、勅語もそうしたい、という趣旨を国会で答弁して、発言をとりけさざるをえなかったということに、わざわざふれられています。「日本人の読み書き能力調査」のことは梅棹さんもご自身の著書のなかでふれられていて、リテラシーの問題、日本語の平明化は梅棹さんにとってもおおきなテーマであったことがつたわってきます。

梅棹式表記法


 梅棹さんは民俗学博物館館長をつとめられたあと、ローマ字会の会長をされて、日本語の表記をローマ字に、とうったえられるようになります。ひらかなタイプライターの開発者、斉藤強三さんからの遺言だったそうです。しかし、いまは『日本語と事務革命』の、

「新字論はダメだ、ということが、一つの結論」(p.133)
「(ローマ字は)日本語をかく文字としては、まさに新字の一種」(p.134)

という段階にとどまって、なにができるだろう、ということをかんがえてみたいとおもいます。さいわい梅棹さんは漢字かなまじり文で文章をどうかくべきか、ということも著書にのこされています。「梅棹式」表記法とよばれているものです。

梅棹式表記のルールは、
  1. 漢語は漢字。むつかしいのはさける(常用漢字を意識)。
  2. 和語はかな。1音の動詞で意味が判別しにくいもの(例:切る、着る)は漢字の使用も許容。
「漢字はやめたい」, 『日本語の将来』, p249.

という風にまとめてよいようにおもいます。また用言をひらがなにする、という風に説明されていることもあるようです。

 これなら漢字がすくなくて簡単、と一瞬おもうのですが、実際にはなかなかむずかしいことです。こういった表記法で梅棹さんのように意味がすっとわかる文章をかくには、同音異義語をさけたりといった言葉えらびがきちんとできていないと、ということを梅棹さんの秘書をされていた藤本ますみさんが著書(p.87)のなかでかかれています。

 しかし、とにかく梅棹さんはこのルールで文章をかかれています。そのときに、ワープロのかな漢字変換というのはあまりにもつかえない、というのがワープロへのひくい評価につながったのではないか。そういうことがひとつかんがえられそうです。梅棹さんに、しかられないような日本語入力システムの条件はどのようなものになるだろうと、つぎのような3つの条件をかんがえてみました。

1. ひらがなを変換や確定といった操作をかいさずにベタに直接うてること。

 梅棹さんの提案は「漢字変換をなくすこと」だったわけですから、これはまちがいないようにおもいます。

2. カタカナやアルファベットも直接入力できること。

 カナかなタイプライターのときに、梅棹さんはカタカナやアルファベットの入力を「漢字をやめての最低抵抗線」(p.167)とされました。ですので、これはカナかなタイプライターの3段シフトのように、変換ではなく、モードきりかえを想定するとよいだろうとかんがえました。

3. 梅棹式で許容されている範囲内でどうしてもというときだけ、漢字を入力する手段がつかえること。

 漢字の使用には「自制が必要なのだ」(p.230)とかかれているので、ここをいいかげんにすることはできません。簡単に本人すらじつはしらないような漢字を入力できてしまうようなシステムは絶対にだめ。そういうことになるだろうとかんがえました。

 3.の条件にたいして、漢字の使用を自制できる、すくなくとも完全にユーザーが漢字の使用を制御できる入力方式ということでは、以下の3つの案がうかびました。

案1. 漢直方式


 漢直という、キーボードから漢字を直接入力する方法があります。どうするのかというと、漢字1文字1文字それぞれにことなるキーの打鍵順(通常は2キーか3キー)をきめて、それをひとつひとつ暗記して、キーボードで漢字を1文字ずつ直接入力していくという方法です。ふつうのひとが何千もの漢字のキーの打鍵順をおぼえるのは大変です。それなら漢字自体あまりつかわなくなるのではないか、とかんがえたのでした。

 この方式は、川上さんのラインプットという方式が先駆的なもので、T-code, TUT-codeといったそのほかの方式も開発されて、現在でも熱心につかわれているかたがいます。

案2. 前置方式


 竹内郁雄先生のKanzenという方式があります。竹内先生も一太郎ver.2で、「私の編集作業のかなりの部分は漢字になってしまったものをひらがなに戻すことだった」というご経験から、「無変換をデフォールトとし,変換は先に指定する方式とする」ことにされ、「かな入力の場合は変換キーを先に打つ」というKanzenという入力方式を考案されていました。この方式でも、前置キー(シフトキーや変換キー)をうたないかぎりは、文章に漢字がまざることは絶対にありません。

 現在はSKKというIMEでこの方式を利用することができて、実際につかわれているかたもかなりおおいようにおもいます。

案3. 置換変換(後置方式)


 とりあえずベタでひらがなを入力してしまって、漢字にしたい部分だけあとから変換キーをおして漢字に置換するという方式についてもかんがえてみました。一般的なIMEは、漢字かなまじり文をつねにIMEのなかでつくって本文に挿入するような方式になっています。それにたいして、置換変換は本文中にはすでにひらがなで文章がはいっていて、漢字にしたい部分の末尾にカーソルをうごかして(入力中はもともとカーソルが末尾にある)、変換キーをおすと漢字に変換したものに置換されるという方式です。変換キーをおすのは、ふつうのIMEのように文節のあとではなくて、漢字の熟語の直後になります(後置)。

 こういうことができるためには、ワープロに入力ずみのテキストをIMEにもどすようなしかけがアプリケーション ソフトウェア側にも必要になります。このことが置換方式があまり一般的になっていない理由のひとつかもしれません。Microsoft社のナチュラル インプットはWordとセットでこうしたことにトライしたIMEだったようです。

 まだ案としては、ほかにもあるかもしれません。この3案のなかでは、置換変換はそもそも置換変換が可能なIMEがいまもあるのかどうかよくわからないところがありました。

置換変換をためす — tsf-tutcodeとuim-tutcode


 いま置換変換のようなことをためせるIMEはないのかな、とおもっていたところ、漢直のT-codeやTUT-codeの後置型まぜがき変換機能がおなじよう方式だということをTwitterでおしえてもらいました。まぜがき変換というのは、「帰しゃ」というような漢字とひらがながまざったすでに入力ずみの文字列からさらに「帰社」に変換しておきかえる、というものです(これができると「汽車」や「記者」に誤変換されることがありません)。そして、後置型まぜがき変換はかなだけの文字列にたいしてもつかえる、ということでした。

 後置型まぜがき変換機能のつかえる漢直IMEとして紹介していただいたのが、Windows用のtsf-tutcodeと、Linuxなど用のuim-tutcodeです(くわえてemacs用のtc2も紹介していただきました)。どちらも、本来は漢直方式のTUT-codeのためのもので、そのままでは一般的なローマ字入力やかな入力には対応していませんでした。そこで実験のために、Twitter上でアドバイスをいただきながら、ローマ字入力用の設定ファイルを用意しました:

tsf-tutcode用: https://gist.github.com/ShikiOkasaka/e5a46a278965f6fe3f1e2686c10c57f4
uim-tutcode用: https://gist.github.com/ShikiOkasaka/451a995da66c87f71ced2f5cd5bbbf87

 ちなみに上記の設定ファイルではローマ字の表記に梅棹さんがローマ字会の会長をされていたときにつくられた99式を採用しています。興味のあるかたは、99式の表記もみてみてください。またエスリルのNISSEをつかわれているかたは、この設定ファイルで親指シフトやTRONかな配列をつかって置換変換をつかうことができるようになります。

 また梅棹さんは、「(ワープロ)メーカー側にも、漢字がふえるのをふせぐための配慮がほしいものだ。たとえば、常用漢字以外はでてこないようにするための規制スイッチをつけるくらいは、技術的にはやさしいことであろう。」(p.225)とのべられています。これにこたえられるように、今回、専用の辞書(restrained.dic)も用意しました: https://gist.github.com/ShikiOkasaka/51286f65d20a35c988afd03ba91c095b

 restrained.dicは、tc2のmazegaki.dic(常用漢字外の辞書登録もかなりふくまれています)から、常用漢字および人名用漢字にない漢字をつかった熟語、すべての活用語、および、まぜがきのよみをいったん削除したものに、漢字の使用が許容されている1音の動詞のみ別途追加したものになっています。この辞書をつかって置換変換しているかぎりは、梅棹さんのいわれた最低限の漢字制限はまもることができるはずです。ただ、まだ梅棹さんならひらがなでかかれたような熟語がrestrained.dicにはふくまれています。こういった部分は本当にまだ自制が必要です(そういった熟語を全部なくした辞書もつくってみたいところですが、梅棹さんの著作がコンピュータライズされていないとすこし大変です)。

 実際に置換方式をつかう場合の入力方法は、つぎのようになります。例文として、梅棹さんの、
「しろうとむけワープロの登場を期待したいですね。」(p.205)
という文をつかって説明していきます。ふつうのIMEですと、このとおり入力しようとおもっても、
しろうとむけわーぷろのとうじょうをきたいしたいですね。[変換][確定]

で「素人向けワープロの登場を期待したいですね。」となったまま、よしとしてしまう人がおおいのだろうとおもいます。梅棹さんがいきどおられたのは、こうしたことだろうとおもいます。

 きちんと「しろうとむけワープロの登場を期待したいですね。」と入力するには、
しろうとむけ[無変換]わーぷろのとうじょうをきたいしたいですね。[変換][確定]

といったことになるでしょうか。人によっては、
しろうとむけ[確定]わーぷろの[変換][確定]とうじょうを[変換][確定]きたいしたいですね。[変換][確定]

といった具合に入力されていたり、場合によってはくせもあって、
しろうとむけ[変換][ESC][確定]わーぷろの[変換][確定]とうじょうを[変換][確定]きたいしたいですね。[変換][確定]

といったことになってしまう人もいるのではないかとおもいます。結局、漢字をたくさんつかった日本語のほうが入力しやすくなってしまっているようなところが問題ということになるのではないでしょうか。

置換変換では、
しろうとむけ[Caps/on]ワープロ[Caps/off]のとうじょう[変換]をきたい[変換]したいですね。

といった具合に入力します。カタカナの部分は小指シフトかCaps Lockをつかいます。漢字は、意図的に漢字にしたい部分の最後で[変換]キーをおします。

 同音異義語がなければ[変換]をおして候補がでた状態でそのまま次の文字を入力していけば大丈夫です。梅棹式は、同音異義語をさけるような言葉えらびもこみで梅棹式というべきでしょうから、じょうたつすれば変換候補をつぎつぎに表示していくような操作はへっていくはずです。

 また漢字をまだならっていない小学生であれば、
しろうとむけ[Caps/on]ワープロ[Caps/off]のとうじょうをきたいしたいですね。

のように入力できれば十分でしょう。漢字変換のことは、もっとあとでおぼえてもよいのです。

 置換型変換では、カーソルの直前にあるひらがなの文字列にたいして、なるべくながい熟語に変換しようとします。そのため「いきがい論」と入力したいときには、最初は「いき概論」のようになります。これを修正するには、>か右カーソルキーをじゅんにおしていくと対象がみじかくなっていって、「いきが異論」、「いきがい論」といった具合に、目的の漢字がでてくるようになります。こういうことが頻繁におきるときには、tsf-tutcodeやuim-tutcodeでは、カーソルの直前の何文字目までにたいして置換変換をおこなう、といった操作をすることもじつはできます。このあたりは、置換変換が漢直や前置方式とくらべるとわずらわしさがのこる部分ということになるのかもしれません。

 しかし、この記事はずっとuim-tutcodeをつかってかいてきているのですが、実用では>や右カーソルキーをつかって熟語の長さをなおさないといけない場面はあまりないようなのです。日本語の専門家ではないので、実際ところはよくわかりませんが、日本語の助詞というのがそもそも語と語を自然にくぎるような音でつくられているのではないかというふうにおもったりもします。また、このあたりは置換変換というかんがえかたがひろまれば、単純な前方最長一致よりもくわしく解析をおこなって置換変換をするようなIMEも将来つくられることもひょっとしたらあるのではないかとおもいます。

ひとまずのまとめ


 一点、梅棹さんの基本的なコンテキストは、まずは事務の書類のようによんだ人がだれでもきちんと理解できることを期待しているような文書ということになるのだろうとおもいます。「言語は100年をおよそ一代」とかかれた山口謠司さんは、100年前の夏目漱石は理解可能、そのすこしまえの森鴎外はすでにむずかしい、とかかれていました。その漱石ですら現代語訳が出版される時代です。じつは自分もセイを所為とうつことがおおかったのですが、こういうのはふだんはなおしていかないと、とおもったりしています。

 ところで、最初の、
「これからの時代を切り拓く学生達にも是非とも読んでもらいたい一冊である」
の「切り拓く」はよめたでしょうか?「きり?く」。開拓の「拓」なので意味はつかめますが、「拓」の訓よみは常用漢字のなかにはありません。梅棹式なら、
「これからの時代をきりひらく学生たちにも、ぜひともよんでもらいたい一冊である」
のようにまずはなって、ひょっとすると文そのものも、なおしたりすることになるようにもおもいます。

 今回は、梅棹忠夫さんの著書『日本語と事務革命』の話題から、梅棹式表記法、そのための日本語入力システムの考察と、置換変換の紹介をしました。平明な日本語の文章をかくためのソフトウェアというのは、まだまだ未開なところがあるようにもおもいます。またこの文章は置換変換の実験もかねて、梅棹式でuim-tutcodeをつかってかいてみました。よみにくいところは、まだ梅棹式表記法をつかってみたばかりで、ということで。置換変換もつかいはじめたところで、カタカナの入力はモードきりかえがよいのか辞書登録がよいのか、といったあたりはまだこたえはだしていません。それでも、もとのIMEにもどそうとはもうおもわなくなっているくらい、なかなかよいものだとおもっています。

 ということで、つづきはまた次回に。

0 件のコメント:

コメントを投稿