英和辞典の編集に欠かせない英語コーパス

(1)学習英和辞典の役割
 本辞典では,学習英和辞典の最も大切な役割は,今使われている英語の実態を正しく反映する記述をすることだと考えています.学習英和辞典の中に,今は使われなくなった語義や用法と,今の生きた英語とを十分に区別していない記述があるとすれば,英語学習者にとって好ましいことではありません.
 我が国では江戸時代末期から今日に至るまで,さまざまな英和辞典が作られてきました.その間に英語も随分と変化しています.ところが残念ながら,古くからある辞書の内容を無批判に引き継いで,今は使われないような語義や用法をそのまま踏襲して記述している英和辞典も珍しくありません.そのような弱点を補うためには,今の英語の実態調査をすることが不可欠になります.
(2)英語の実態調査の手段
 それでは,英語の実態調査はどのようにして可能になるのでしょうか.古くから行われているのが,新聞や小説などから採集した用例をカードにとってファイルし,必要に応じてそれを検索するという方法です.これには莫大な手間と時間がかかります.それに代わるものとして考え出されたのがコーパスです.
 コーパスとは,ある一定の方針のもとに,大量に収集した書かれた文章や話された言葉を文字化し,それをデータベースとして,コンピュータ上で必要に応じてさまざまな情報をそこから取り出すことができるようにした言語資料体です.
(3)コーパスの利用
 コーパスを効果的に利用するためには,コーパスそのものと,そこから必要なデータを呼び出す検索ソフトを用意しなければなりません.幸い本辞典の編集にあたっては,大規模の英語コーパス British National Corpus [BNC] を活用することができました.その BNC を小学館独自開発の検索ソフトを使って縦横に調べ,現代英語の実態に迫りました.
(4)BNC
 BNC は,1991年から1994にかけて,オックスフォード大学出版局,ロングマン社やオックスフォード大学,ランカスター大学などが中心になって,政府資金も導入して作り上げられた現代英語約1億語のデータベースです.今の英語の姿を忠実に反映するように計画的に作り上げられたコーパスで,書き言葉9,000万語と話し言葉1,000万語が含まれ,その信頼性は高く評価されています.これまでにもいろいろなコーパスが作られて利用されていますが,一定の見識をもって組織的に収集されたBNC は,最も信頼に値するコーパスと言えるでしょう.このコーパスを使って既に Longman Dictionary of Contemporary EnglishOxford Advanced Learner's Dictionary などの辞書が編集されています.
 このコーパスを最大限に活用した英和辞典は,本辞典が初めてです.ただ,BNCは基本的にはイギリス英語のコーパスであるために,米語用法など BNC だけでは不十分な部分は,独自のコーパスを利用し,アメリカ英語の実態に迫っています.
(5)コーパスで何ができるか
 コーパスを全面的に利用することによって,「ある語義がどのくらいの頻度で使われるのか」が検出できます.ほかに「to不定詞,動名詞,that節がどのような構文パターンで使われるか」などについても検出し,それぞれの意味でどのような構文パターンをとるのかがわかりますが,それを明示しているのも本辞典の大きな特徴です.
 また surprised の後には at がくるのか by がくるのかといったコロケーションの頻度の検索にはきわめて大きな力を発揮します.be surprised by とbe surprised at はほぼ同数あることがたちどころにわかります. 従って、surprised の項では、at と by が同じように使われることがわかるように併記してあります。
 また,例えば「…する仕方」を意味する the way to do と how to do は類義表現ですが,使い方の区別については今までほとんど知られていないことが本辞典で明らかにされています(→way ここが違う).さらに,much の項には,very と much はそれぞれどのような語句を修飾するかについて述べた詳しい 語法ノート があります.このような ここが違う語法ノート で,詳細な使い分けを明示できたのは,コーパスを最大限に利用した成果によるものです.
 また,独自のコーパスを利用して,今までに知られていなかった口語表現を数多く見い出し,多様な用法と併せてそれらを収録しています.
(6)コーパスパネル
 特に語法上論争のある用法については, コーパスパネル欄を設けて表現の使用頻度をグラフ化し,簡潔な解説を加えていますが,それによってこれまで感覚的にしかわからなかった使用状況が数値的に検証できます.その際,BNC の特性を考慮して,英米で語法の差が出ないものを取り上げるようにしました.なお同欄では,連語などの情報についてもグラフで視覚化しています.
(7)コーパスは万能か
 コーパスは以上述べたように,英語の実態を知るために驚くほどの力を発揮します.ただ,コーパスでは「不可能な表現」の検索はできません.また,例えば want は時に節をとることがありますが,want that節の形は検索できます.ところが,that のない形があるのかないのかというようなことの検索には困難を伴います.そのような場合には,やはり英語を母語とする人たちにインフォーマントになってもらわなければなりません.また,近年のめざましく進化した英米の学習英英辞典の記述や,コーパスを利用した英文法書,内外の英語研究の成果も,コーパスだけでは得ることのできない貴重な情報源になっています.
(8)ただ数を数えればよいのか
 コーパスによって頻度がわかった,あるいはインフォーマントによる調査によってある表現が英語として容認されないことがわかったというような場合,それがなぜなのか,という観点からの分析が必要です.発見できた現象をただ羅列するだけでは,言葉の辞書としては不十分です.本辞典では,可能な限り,なぜそのようになるのかという理由を説明しようとしています.先に be surprised の後には by も at も同じような頻度で現れるということに触れましたが,それではどのような使い分けが2者にあるのか,ということが分析者の役割になります.本辞典はこのことを絶えず念頭に置きつつ編まれています.(八木克正)