Shiki’s Weblog

梅棹(うめさお)忠夫(ただお)さんの表記法(ひょうきほう)日本語(にほんご)入力(にゅうりょく)IME(アイエムイー)

2022/06/18

はじめに

 前回(ぜんかい)は、梅棹(うめさお)忠夫(ただお)さんの文章(ぶんしょう)作法(さくほう)をスタイルガイドとしてまとめました。今回(こんかい)は、梅棹(うめさお)さんの表記法(ひょうきほう)をつかうときの、日本語(にほんご)入力(にゅうりょく)IME(アイエムイー)(かん)する技術(ぎじゅつ)(てき)なおはなしをまとめておきます。

 このブログの記事(きじ)は、この5(ねん)ほど、わたしがつくったIMEをつかってかいています。「ひらがなIME」というIMEです。表記法(ひょうきほう)梅棹(うめさお)忠夫(ただお)さんのつかわれた表記(ひょうき)(ほう)をつかうように()をつけています。

 梅棹(うめさお)さんの表記(ひょうき)(ほう)のルールはつぎの(みっ)つでした。

 一般的(いっぱんてき)なIMEで、この表記法(ひょうきほう)をつかおうとしても、いまひとつ実用(じつよう)になりません。ひらがなでかきたいところまで、かってに漢字(かんじ)変換(へんかん)してしまうためです。それをさけるためには、よみの確定(かくてい)をひんぱんにしないといけません。「よみの確定(かくてい)をひんぱんにしないといけません。」と入力(にゅうりょく)したければ、だいたい、つぎのようにうちます。

よみの❲確定❳かくていを❲変換❳ひんぱんに❲確定❳しないといけません。❲確定❳

 一般的(いっぱんてき)なIMEには「よみ入力(にゅうりょく)モード」というモードがあります。さいごの「ません。」までうったときには、「ません。」はまだIMEのよみ入力(にゅうりょく)バッファのなかにあります。さいごに〔確定(かくてい)〕をおして、はじめて、アプリケーションソフトの本文(ほんぶん)のなかに「ません。」まで入力(にゅうりょく)できます。(句読点(くとうてん)自動(じどう)確定(かくてい)するように設定(せってい)すれば、最後(さいご)の〔確定(かくてい)〕は省略(しょうりゃく)できます。けれども、誤変換(ごへんかん)をなおさないといけないことがおおいと、自動(じどう)確定(かくてい)されてしまってはこまるのです。)

 一般的(いっぱんてき)なIMEは、

よみのかくていをひんぱんにしないといけません。〔変換〕〔確定〕

とうてば、「読みの確定を頻繁にしないといけません。」と入力(にゅうりょく)できるようにつくられているわけです。これは、じぶんの表記法(ひょうきほう)をめいかくにもっているひとたちにとっては、かならずしもよいことではありません。雑誌(ざっし)などでは、漢字(かんじ)のひらきかたをきちんとさだめていることがあります。そうした(ほん)原稿(げんこう)をかくときには、IMEが変換(へんかん)したままの表記(ひょうき)ではつかえないこともあります。

 このように、一般(いっぱん)(てき)なIMEは、よみ入力(にゅうりょく)バッファにためた文字列(もじれつ)解析(かいせき)して、なるべく漢字(かんじ)をあてようとします。なるべく“たくさん”漢字(かんじ)をあてようとするといってもよいでしょう。それで、すこしこまったことがおきています。

 IMEにまかせて変換(へんかん)をして、できた文章(ぶんしょう)をインスタント メッセンジャーなどでおくる。そうすると、あいてが漢字(かんじ)をよめずにこまっている。そうゆうことがよくあります。一般(いっぱん)(てき)なIMEが出力(しゅつりょく)する漢字(かんじ)は、わたしたちが日常(にちじょう)(てき)にやりとりする文章(ぶんしょう)には、むずかしすぎるのです。

 一般(いっぱん)(てき)なIMEは、論文(ろんぶん)やレポートなどをかくのには、それらしく漢字(かんじ)がでてきてべんりです。以前(いぜん)は、文章(ぶんしょう)をかいて提出(ていしゅつ)するのは学校(がっこう)やしごとのときだけ。そうゆうひともおおかったはずです。大野(おおの)(すすむ)さんも、かつて、「実際(じっさい)(じょう)文字(もじ)機能(きのう)は、今日(こんにち)社会(しゃかい)では極端(きょくたん)にいえば、()めればいいんですよ。普通(ふつう)手紙(てがみ)を一(にち)(つう)()(ひと)なんていないんですよ」といいはなったことがあります(『対談 日本語を考える』,大野(おおの)(すすむ)(へん))。梅棹(うめさお)さんは、対談(たいだん)のなかで「もっともっと(ぞく)世界(せかい)が、いま眼前(がんぜん)にひろがっているわけです」といわれました。いまは、梅棹(うめさお)さんがいわれたように、ともだちや家族(かぞく)にむけて文章(ぶんしょう)をかいていることがとてもおおくなりました。

 このような問題(もんだい)対処(たいしょ)するためにつくったのが、「ひらがなIME」です。「ひらがなIME」では、「よみの確定(かくてい)をひんぱんにしないといけません。」という(ぶん)は、つぎのようにうちます。

よみのかくてい〔変換〕をひんぱんにしないといけません。

 ひらがなIMEは「モードレスIME」です。「よみ入力(にゅうりょく)モード」がありません。さいごの「ません。」までうったときには、アプリケーションソフトの本文(ほんぶん)のなかに「ません。」まで入力(にゅうりょく)されています。

 また、「ひらがなIME」の漢字(かんじ)辞書(じしょ)は、なまえ以外(いがい)常用(じょうよう)漢字(かんじ)(ひょう)(ない)漢字(かんじ)だけでつくられています。むずかしい漢語(かんご)をつかおうとしても、漢字(かんじ)表示(ひょうじ)されることがありません。ことばをおきかえたほうがよいときには、すぐに()がづきます。

ひらがなIMEの変換(へんかん)方式(ほうしき)前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)

 「ひらがなIME」はPythonで2,000(ぎょう)ちょっとのプログラムです。「ひらがなIME」をみて、自分(じぶん)でもIMEをつくってみようとされているひとたちもいるようです。「自作(じさく)IME」というのもみじかな題材(だいざい)になってきていそうです。

 いま「ひらがなIME」がつかっているかな漢字(かんじ)変換(へんかん)方法(ほうほう)は、とてもかんたんな方法(ほうほう)です。〔変換(へんかん)〕キーがおされたら、カーソルの位置(いち)から前方(ぜんぽう)にむかって、よみに一致(いっち)するいちばんながい単語(たんご)辞書(じしょ)からえらんでいます。これを「前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)」といいます。

 一般(いっぱん)(てき)なIMEでは「n文節(ぶんせつ)最長(さいちょう)一致(いっち)(ほう)」という方法(ほうほう)がよくつかわれていました。とにかくながく一致(いっち)するものをえらぶと、どういうわけか、うまく変換(へんかん)できてしまうところがあります。

 いまの「ひらがなIME」は、文節(ぶんせつ)をしらべたりはしていません。ひらがなでかかれたよみに一致(いっち)する()をえらんているだけです。それで、実装(じっそう)がとてもかんたんになっているわけです。こんなにかんたんな方法(ほうほう)でも、梅棹(うめさお)さんのような表記(ひょうき)(ほう)をつかうぶんには、とくに問題(もんだい)はおきていません。

 もちろん、たんじゅんにこれだけですと変換(へんかん)をあやまることがあります。けれども、辞書(じしょ)学習(がくしゅう)がすすむと、うまくいくようになります。前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)誤変換(ごへんかん)したときは、つぎのように辞書(じしょ)登録(とうろく)しています。

 「だが異論(いろん)もあった」という(ぶん)は、はじめは、「だ概論(がいろん)もあった」のように変換(へんかん)してしまいます。そこで、つぎからは「異論(いろん)」がでてくるように、学習(がくしゅう)(よう)辞書(じしょ)に「が異論(いろん)」を登録(とうろく)します。「ひらがなIME」では、出現(しゅつげん)頻度(ひんど)(じゅん)のならべかえにくわえて、この処理(しょり)も「学習(がくしゅう)」とよんでいます。

 しばらく「ひらがなIME」をつかったあとで、こうゆう学習(がくしゅう)をしていた単語(たんご)には、したのようなものがありました。ひだりはしが漢字(かんじ)のよみです。そのあとのスラッシュ(/)でくぎられている()変換(へんかん)候補(こうほ)です。ひらがなではじまる()が、学習(がくしゅう)によって追加(ついか)された()です。

あるかん /ある感/アルカン/
いかた /い型/伊方/
いかん /い感/移管/遺憾/偉観/衣冠/医官/尉官/異観/
いき /い気/域/息/粋/意気/遺棄/委棄/位記/壱岐/イキ/
いせい /い星/異性/以西/威勢/為政/
いせん /い線/緯線/伊仙/
いたじき /いた時期/板敷/
いちえん /い遅延/一円/
いぶん /い文/異聞/異文/遺文/遺聞/
いほん /い本/異本/
いもじ /い文字/鋳物師/
いよく /い欲/意欲/
いるか /いる蚊/イルカ/
いろん /異論/い論/
いわた /い綿/岩田/磐田/
うかん /う感/有漢/
うき /う気/雨期/雨季/
うじ /う字/氏/宇治/
うせつ /う説/右折/
うてん /う点/雨天/
うろん /う論/ウロン/
おき /お気/沖/隠岐/
かあす /か明日/カース/
かいかん /かい感/快感/会館/開管/開館/快漢/怪漢/開巻/
かいきょう /かい今日/海峡/回教/懐郷/海況/
かいこう /か意向/開校/開講/改稿/開口/回航/海港/海溝/開港/海口/開高/
がいぜん /が以前/蓋然/
かいてん /かい点/回転/開店/
かいは /かい派/会派/
かいぶん /かい文/回文/灰分/怪聞/
がいろん /がい論/概論/が異論/
がき /が気/餓鬼/ガキ/
がきょう /が今日/画境/
がしょう /が生/賀正/画商/雅称/
がむし /が無視/ガムシ/
からげんき /空元気/から元気/
きじゅん /基準/き順/規準/帰順/
きてき /き的/汽笛/
きてん /き点/基点/起点/機転/
きばん /基板/き番/基盤/
きひ /き日/忌避/基肥/
きよう /き用/器用/起用/紀要/貴陽/
くかん /く感/区間/
くき /く気/茎/九鬼/久喜/
くぶん /く文/区分/
くめん /く面/工面/
たいかん /たい感/退官/体感/耐寒/戴冠/大患/大官/大観/
たいき /たい気/待機/大気/大器/大樹/
たいけん /体験/た意見/大圏/大権/大剣/帯剣/
たいち /た位置/対地/対置/太一/
たいめん /対面/たい面/体面/
たかだい /た課題/高台/
たかん /た感/多感/
たき /た気/滝/瀧/多岐/多喜/多紀/
たさい /た際/多彩/多才/
たじ /た字/他事/多事/
たてん /た点/他店/
たぶん /た文/多分/他聞/多聞/タブン/
ためん /た面/多面/他面/
ついかん /つい感/追完/
つき /月/つ気/
つべつ /つ別/津別/
ていけん /て意見/定見/
ていこう /抵抗/て移行/
てきぎょう /て企業/適業/
てきさい /て記載/適才/
てきたい /て期待/敵対/
てじゅん /手順/て順/
てやく /て訳/手役/
とき /と気/時/土岐/朱鷺/鴇/
としん /都心/と信/妬心/
とせん /と線/渡船/
とち /土地/と地/栃/
とりかい /と理解/鳥飼/
ないかん /ない感/内患/内観/
ないき /ない気/内規/内記/ナイキ/
ないけん /ない件/な意見/内見/
ないてん /ない点/な移転/内典/
ないぶん /ない文/内聞/内分/
ないめん /ない面/内面/
ないやく /な意訳/内約/
なかず /な数/中洲/
なかた /な型/中田/仲田/
におう /に応/仁王/
にき /に気/仁木/ニキ/
にさんか /に参加/二酸化/
にぶん /に文/二分/
のいえ /の家/ノイエ/
のうむ /の有無/濃霧/
のおと /の音/ノート/
のかた /の型/野方/
のかみ /の神/野上/
のき /の木/軒/
のじ /の字/野地/野路/
のてん /の点/野天/
のなか /の中/野中/
のまど /の窓/ノマド/
のみ /の身/能美/ノミ/
はいがい /は意外/拝外/排外/
はいじ /は維持/拝辞/
はいぜん /は以前/配膳/
はいと /は意図/ハイト/
はいみ /は意味/俳味/
はき /は気/破棄/覇気/破毀/杷木/
はすう /は数/端数/波数/
はせん /は千/破線/波線/破船/
はほん /は本/端本/
はやく /は約/は訳/端役/破約/
はやま /は山/葉山/端山/早馬/
へいこう /並行/へ移行/平行/閉口/平衡/併行/閉校/
むかん /む感/無冠/無官/
むき /む気/無期/無機/無記/無季/
もよう /も用/模様/
ゆうかん /ゆう感/夕刊/勇敢/有閑/憂患/
らいこう /ら移行/来航/来光/来貢/雷公/雷光/
りき /り気/力/利器/
りぶん /り文/利分/
るいじょう /る以上/累乗/
るうた /る歌/ルータ/
るせつ /る説/流説/
るてん /る点/流転/
れいがい /れ以外/例外/冷害/
れいこう /れ以降/励行/霊光/
れいじょう /れ以上/令嬢/令状/礼状/霊場/礼譲/

 この一覧(いちらん)をみていると、おもしろいことに()づきます。誤変換(ごへんかん)をひきおこす漢語(かんご)には、いくつかのパターンがみられます。

 こうしてみると傾向(けいこう)がみえてきます。およそ、つぎのようなかたちと、よみがかさなる漢語(かんご)がじゃまになることがわかります。

 もしこのような漢語(かんご)がたくさんあったなら、前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)実用(じつよう)にならなさそうです。けれども、じっさいには、そうゆう漢語(かんご)はすくないことがわかります。ここにあげた一覧(いちらん)をみても、そもそも漢字(かんじ)辞書(じしょ)からとりのぞいてもよいような()がめだちます。

 そのほかにじゃまをしている()は、ひとのなまえや、あたらしいカタカナのことばです。そうゆうことばも、ひんぱんにつかうことはあまりありません。くわえて、梅棹(うめさお)さんのようにかこうとしているときには、むずかしい漢語(かんご)同音(どうおん)異義(いぎ)()もつかわないようにしています。それで、いちど辞書(じしょ)学習(がくしゅう)してしまえば、前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)でも誤変換(ごへんかん)がかなりへるのです。

日本語(にほんご)表記(ひょうき)(ほう)

 いまの日本語(にほんご)表記(ひょうき)は「漢字(かんじ)かなまじり(ぶん)」と「かな漢字(かんじ)まじり(ぶん)」にわけることができます。むかしはこれにくわえて「よみくだし(ぶん)」と「漢字(かんじ)(ぶん)」がありました。

 「かな漢字(かんじ)まじり(ぶん)」というのは、梅棹(うめさお)さんが『知的(ちてき)生産(せいさん)技術(ぎじゅつ)』のなかでつかったいいかたです。漢字(かんじ)がすくない文章(ぶんしょう)という意味(いみ)です。

 日本語(にほんご)表記(ひょうき)(ほう)は、つぎのような(ひょう)にまとめることができそうです。

表記法(ひょうきほう) 漢字(かんじ)含有(がんゆう)(りつ) 説明(せつめい)
かな(ぶん) ほぼ0% 土佐(とさ)日記(にっき)』の原文(げんぶん)のような文章(ぶんしょう)漢語(かんご)漢字(かんじ)でかきますが、ほとんど漢語(かんご)がでてきません。
かな漢字(かんじ)まじり(ぶん) 20%未満(みまん) ライトノベルや梅棹(うめさお)忠夫(ただお)さんのような文章(ぶんしょう)。「ひらがなIME」がおもに対象(たいしょう)としている文章(ぶんしょう)
漢字(かんじ)かなまじり(ぶん) 20%以上(いじょう) いまの公用文(こうようぶん)など。いまの一般的(いっぱんてき)なIMEが対象(たいしょう)としている文章(ぶんしょう)
よみくだし(ぶん) 60%以上(いじょう) 漢字(かんじ)(ぶん)訓読(くんどく)したままのような文章(ぶんしょう)明治(めいじ)初期(しょき)新聞(しんぶん)など。言文一致(げんぶんいっち)運動(うんどう)(つう)じて、つかわれることがほとんどなくなりました。
漢字(かんじ)(ぶん) ほぼ100% 漢字(かんじ)だけでかいた日本語(にほんご)中国(ちゅうごく)()漢文(かんぶん)としてみると悪文(あくぶん)であったり()(ぶん)であったりします。

 本居(もとおり)宣長(のりなが)擬古文(ぎこぶん)などは、和語(わご)にも漢字(かんじ)をあてることがありますが、かな(ぶん)にちかいものです。「やさしい日本語(にほんご)」は、漢字(かんじ)を1,000文字(もじ)くらいに制限(せいげん)してかくことがあります。用言(ようげん)をまだ漢字(かんじ)でかいていますが、「かな漢字(かんじ)まじり(ぶん)」にうつっていく途中(とちゅう)のようにもみえます。

 「漢字(かんじ)まじり(ぶん)」といういいかたは、ふるくは「ふりがな廃止(はいし)(ろん)」をとなえた山本(やまもと)有三(ゆうぞう)さんが「(わたし)のいふのはカナ(まじ)(ぶん)でなくつて、漢字(かんじ)(まじ)(ぶん)にするのです。」といわれています (「ふりがな廢止論」の理念と実践 : 山本有三の改版作業から」)。


日本(にほん)では、戦後(せんご)、ルビをふることがよくないようにおそわってきたところがあります。これは、標準(ひょうじゅん)(てき)日本語(にほんご)を「かな漢字(かんじ)まじり(ぶん)」にまで平明(へいめい)()したうえで、はじめてなりたつおはなしでした。いまのようになんでもかんでも漢字(かんじ)のよみを暗記(あんき)させるようなことをかんがえていたわけではありません。

日本語(にほんご)表記(ひょうき)はどう変化(へんか)してきたか

 日本語(にほんご)表記(ひょうき)は、明治(めいじ)から昭和(しょうわ)にかけて、漢字(かんじ)(ぶん)から漢字(かんじ)かなまじり(ぶん)にかわってきた。えらいひとたちの文章(ぶんしょう)だけをみれば、そういえるかもしれません。けれども、それはえらいひとたちのなかだけのことです。

 ふつうのひとたちは、かな(ぶん)やかな漢字(かんじ)まじり(ぶん)をずっとつかってきました。野口(のぐち)英世(ひでよ)(はは)シカの手紙(てがみ)」 をみたことがあるひともいるでしょうか。明治(めいじ)45(ねん)文章(ぶんしょう)です。いまこんなふうにかくひとはいない。そうおもうひとも、いるかもしれません。けれども、()でかけば、およそひらがなだけになるひとは、いまでもよくいるはずです。ワープロはそうゆう事実(じじつ)をかくしてきたところがあります。漢字(かんじ)がにがてなひとにとっては、そのことをかくせるありがたい機械(きかい)でもあったわけです。

 さいきんの研究(けんきゅう)をみると、鎌倉(かまくら)時代(じだい)にかな(ぶん)がよくつかわれるようになっていったことをしめすものがあります。「仮名(かな)文書(もんじょ)文体(ぶんたい) : 譲与(じょうよ)文言(もんごん)における接続(せつぞく)形式(けいしき)分類(ぶんるい)(4)」には、 「<仮名(かな)主体(しゅたい)文書(もんじょ)>の「全体(ぜんたい)文書(ぶんしょ)(すう)」は、後半期(こうはんき)に512(つう)(のぼ)り、漢字(かんじ)専用(せんよう)文書(もんじょ)()いて最多(さいた)となる。」とかかれています。

 日記(にっき)のように自分(じぶん)しかよまない文章(ぶんしょう)もありますが、ほとんどの文章(ぶんしょう)は、ひとによんでもらうためのものです。自分(じぶん)だけでなく、あいてさえも、よめないような漢字(かんじ)をつかっても意味(いみ)はありません。ともだちとのあいだでやりとりするような文章(ぶんしょう)であれば、なおさらです。

 いかに“ただしく”漢字(かんじ)出力(しゅつりょく)するかというのは、日本語(にほんご)入力(にゅうりょく)IME(アイエムイー)にもとめられている機能(きのう)一面(いちめん)でしかありません。こうしたことに興味(きょうみ)をもったひとは、梅棹(うめさお)さんの『日本語(にほんご)事務(じむ)革命(かくめい)』(底本(ていほん): 梅棹(うめさお)忠夫(ただお)著作集(ちょさくしゅう) 18 日本語(にほんご)文明(ぶんめい))もぜひよんでみてください。

おわりに

 梅棹(うめさお)さんのかきかたは、わかった。でも、梅棹(うめさお)さん以外(いがい)にそんなかきかたをするひとはいるのか。そう、おもうひともいるかもしれません。大学(だいがく)先生(せんせい)がかかれた、()たような文体(ぶんたい)でかかれている論文(ろんぶん)のリンクをはっておきます。

 論文(ろんぶん)でも、こうした文体(ぶんたい)でかけるのです。「遠慮(えんりょ)会釈(えしゃく)なくつらぬいて」ともありましたけれども(笑)。こまつひでおさんは今年(ことし)なくなられた小松(こまつ)英雄(ひでお)さんです。

 個人(こじん)でかくものなら、なおさらに、IMEにしばられたりせず、じゆうにかけばよいのです。そうやってことばとゆうのは、かわっていくもののはずです。俳優(はいゆう)(さかい)雅人(まさと)さんがひらがなのおおい文章(ぶんしょう)をかくことも、わりとよくしられているようにおもいます。

 製品(せいひん)マニュアルとか雑誌(ざっし)とかになると、それぞれで表記(ひょうき)(ほう)がきめられていることもあるとおもいます。そうゆうものには、したがわなければならないでしょう。たいていは、よみやすくなるように、さだめられているはずです。それでも、お(きゃく)さまや読者(どくしゃ)につたわらないとおもったときは、なおしていくように提案(ていあん)してみてはどうでしょうか。

 ひらがなIMEは、バージョン0.14から、用言(ようげん)をよりかんたんに変換(へんかん)できるようにしました。これまでの最長(さいちょう)一致(いっち)(ほう)による学習(がくしゅう)だけで用言(ようげん)もうまく処理(しょり)できるかどうかは、いま確認(かくにん)しているところです。

 ちなみに、前方(ぜんぽう)最長(さいちょう)一致(いっち)(ほう)でわりとうまく変換(へんかん)できることは、T-Code開発(かいはつ)ちゅうに発見(はっけん)されていたようです。MLかなにかに、そのようなことがかかれていたのをみた記憶(きおく)があります。ざんねんながらどこにだったかまでは、おぼえていません。漢直(かんちょく)では、まぜがき変換(へんかん)実現(じつげん)するために、カーソルのまえの文章(ぶんしょう)をみるひつようがうまれました。そのときに、漢字(かんじ)がいっさいまじっていない状態(じょうたい)でも、わりとうまく変換(へんかん)できることに()づかれたようです。