Shiki’s Weblog
ソフトウェアで複文をチェックする
2025/03/28
はじめに
梅棹忠夫さんは、「複文というのはわかりにくい。単文の連続でかかんと」(『梅棹忠夫 語る』 p.43)といわれていました。こみいった複文は、とてもよみにくいものです。文章をかいているときにも、むずかしい複文をつかっていないかチェックできると、べんりそうです。そこで、日本語NLPライブラリ GiNZAを利用して、そうしたツールをつくってみました。今回は、そのお話です。
文のとらえかた
日本語の文は、「述語以外はすべてその補足部として作用する」(『日本語の作文技術』 p.214)。梅棹忠夫さんは、そうもいっていました。補足部のあとにスラッシュ(/)をいれてしめすと、日本語の文はつぎのような構造になっています。
補足部/補足部/……/述語。
たとえば、「述語以外はすべてその補足部として作用する。」という文は、つぎのような構造になっています。
述語以外は/すべて/その補足部として/作用する。
文がよみにくいときは、補足部と補足部のあいだに読点(、)をうつのもひとつの方法です(『日本語の作文技術』 p.130)。
述語以外は、すべて、その補足部として作用する。
単文と複文
単文というのは、文のなかにひとつだけ述語がある文です。複文というのは、文のなかにふたつ以上の述語がある文です。複文では、文末の述語のほかに、補足部のなかにも述語があらわれます。ここでは、補足部のなかにうめこまれた述語とその補足部をカッコでくくってあらわすことにします。
たとえば、「きみがくる日はいつも雨だ。」という複文は、つぎのようにあらわすことができます。
(きみが/くる)日は/いつも/雨だ。
わかりにくい複文
わかりにくい複文の例として、ウィキブックスの「日本語/構文」のなかにつぎの文がでてきます。
取引先が我が社の社長が作家がどこに隠れているか秘書に調べさせていることを快く思っていないことをみんなは黙っていた。
このままでは、なにをいっているのか、よくわかりません。そこで、スラッシュとカッコをつかって、文の構造をみてみます。
(取引先が/(我が社の社長が/(作家が/どこに/隠れているか)/秘書に/調べさせている)ことを/快く/思っていない)ことを/みんなは/黙っていた。
『日本語作文術』にでてくるように、ながい修飾部がまえにくるように文をかきかえます。
(((作家が/どこに/隠れているか)/我が社の社長が/秘書に/調べさせている)ことを/取引先が/快く/思っていない)ことを/みんなは/黙っていた。
こうすると、カッコとスラッシュをとりさっても、すこしよみやくなっています。
作家がどこに隠れているか我が社の社長が秘書に調べさせていることを取引先が快く思っていないことをみんなは黙っていた。
この文は、つきにのような単文の連続にかきなおすことができます。
作家がどこかに隠れてしまった。我が社の社長が作家の居場所を秘書に調べさせている。取引先はそのことを快く思っていない。けれども、みんなは黙っていた。
ここであげた例ほどわかりにくい複文は、さすがにかかない。そうおもうひとも、いるかもしれません。けれども、じぶんでかいた文章となると、よみにくくても、なかなか気づかないようです。すこし時間をあけて文章をみなおすと、問題点に気づくこともあります。
ソフトウェアで複文をチェックする
ひとつひとつの文のながさをみじかく。いまの国語では、よくそうおそわります。こみいった複文は、文がながくなりがちです。ひとつひとつの文のながさに注意していれば、こみいった複文もへらすことができます。ふりがなパッドのようなエディターをつかうと、文のながさをチェックしながら作文することもできます。
けれども、文のながさをチェックするだけでは、わかりにくい複文を見おとしていることがあります。複文を直接チェックできるツールがあれば、作文をするときにべんりそうです。
GiNZAを利用する
さいきんは、ソフトウェアをつかって、文の構造をわりと正確にしらべられるようになってきています。たとえば、日本語NLPライブラリ GiNZAをつかうと、文中の単語間の関係をしらべることができます。これを利用して、文の構造をしめすコマンドライン ツールをつくってみました。
つくったツールのソースコードをGitHub Gistにおいておきました。GiNZA v5.2.0をインストールしてつかってみてください。しらべたい文を入力すると、文の構造がカッコとスラッシュをつかって表示されます。
さきほどの複文をこのツールにとおしてみます。
取引先が我が社の社長が作家がどこに隠れているか秘書に調べさせていることを快く思っていないことをみんなは黙っていた。
(取引先が/(我が社の社長が/(作家が/どこに/隠れているか)/秘書に/調べさせている)ことを/快く/思っていない)ことを/みんなは/黙っていた。
最新のja_ginza_bert_large β1を利用すると、期待どおりの結果をえることができました。この文は、数年まえのja_ginza_electraではうまく解析できていませんでした。ja_ginza_bert_largeはまだベータ版ですが、よいものができてきそうです。
つぎに、以前、NEWS WEB EASYの記事にでてきた、わかりにくい文をこのツールにとおしてみます。
来年からは、会社が作る車の中で、決まった割合以上を電気自動車などにしなければならないという新しい規則がスタートする予定です。
(来年からは、/((会社が/作る)車の中で、/決まった割合以上を/電気自動車などに/しなければならないという)新しい規則が/スタートする)/予定です。
この文も、複文の構造がふかく入れ子になってしまっています。「やさしい日本語」の文章としては、ふさわしくない感じがします。
こみいった複文は、文章をわかりにくくします。カッコが何段にもいれ子になっているような複文は、かきなおしたほうがよさそうです。
まとめ
今回は、複文をソフトウェアでチェックするというお話でした。日本語の表記の問題。複文の問題。梅棹忠夫さんの文章のよみやすさを理解しようとおもうと、勉強しないといけないことがたくさんあります。