コーパスについて

コーパスとは

コーパス(corpus)とは,言語研究のために一定の設計基準で収集されたテキストの集合体である.本辞典では,小学館コーパス・ネットワーク(SCN)の一環として,代表的英語均衡コーパスであるBritish National Corpus(1億語)を基礎に,最新のコーパス言語学の動向を反映するべく,科学技術英語コーパスPERC Corpus(21分野,約1600万語)および独自に収集された経済・法律・政治・ITの4分野からなるweb コーパス “SEKAI Corpus”(20億5000万語)を整備した.これらにより総計22億語の英語データを参照しつつ,現代英語の用法を反映する記述を心がけた.

コーパス利用の観点

コーパスからの情報として,さまざまなことばの使用法の「頻度と分布」に関するデータが得られる.それを単語,品詞,単語と単語,品詞と品詞,単語と品詞,そして構文など,さまざまな情報単位で分析することで,ことばの文中での使用状況を解析する.さらに,それらの使用実態を上記のコーパスで特徴づけられる「専門分野」に特徴的な用法に特化した分析も可能になる.このような観点をもとに,特に以下の各情報に関してコーパス利用を促進した:
(1) コロケーション情報の充実:中級英語学習者が特に必要な3000~5000語レベルの中頻度語に関してコロケーション情報を付加し,発信技能に備えた.
(2) 自然な用例の提案:改訂作業に関して,最新のコーパスから,より現代的で新鮮な用例を採用した.
(3) コーパスコラムの新設:専門分野コーパスの特徴を最大限に発揮した,コーパス情報の特別コラムを設けた.

コーパスコラム

コーパスコラムの種類は以下の通りである:

分野別コロケーション

一般に,コロケーションを示す英語辞書は増えてきているが,分野ごとのコロケーションの相違を示す辞書は少ない.本辞典では分野別コーパスを活用して,特に一般語が専門的な意味合いで用いられる場合のコロケーション情報を提供した.
コーパス order+[名]
[一般] pizzacopydrinkinquiryinvestigationmeal
[法律] supportrestitution 返還 /paymenttrialcustody 養育権; 身柄確保 /visitation

文法関係

特に動詞の使用法を中心に,主語・目的語にくる名詞の意味領域を整理することで,その動詞のふるまいを適確にとらえることができる.今回は特に,活用が必要な中頻度動詞にしぼってコラム化した.
コーパス [主]+deliver+[目]
[主] 〔配達人〕 postmancourier 配送業者;
販売者〕 sellersuppliervendorprovider
裁判官・陪審〕 judgejury
[目] 〔メッセージ〕 speechlecturemessageaddress 講演/sermon (教会の)説教/eulogy 賛辞;
配達品・サービス〕 goodsmailserviceletteraid
判決・判断〕 verdictjudgment
打撃〕 blowpunch
成果〕 performancebenefitimprovementresult

動詞構文頻度

コーパスでは分析がかなり困難な動詞の構文頻度を,専門チームで構文解析データを用いて集計した.
コーパス decideの構文頻度
(1) 41%〔~ to do〕 decide to go alone
(2) 21%〔~ that節〕 He decided that he wanted more time.
(3) 10%〔~ wh節〕 decide what to do
(4) 5%〔~ [名詞]〕 decide the issue
(5) 5%〔be decided〕 Nothing has been decided.
(5)のみ受身形での頻度.

日英発想別コロケーション

日英比較の発想の違いをコロケーション的にとらえたコラム.英語らしい発想,英語になりにくい日本語の側面をとらえ,発信・受信のニーズに対応した.
コーパス cardの日英発想別コロケーション
[共通] a credit card/a video card/a yellow card/a wild card/a debit card/a memory card
[英〓日] an ID card 身分証/a business card 名刺/a report card 通知表/a playing card トランプのカード
[日〓英] ポイントカード ((英)) a loyalty card/偽造カード a forged [fake] card/入国カード a landing [an immigration] card

動詞構文⇔名詞構文の書き換え

中級英語学習者が高度な英文を書く際に必要になる,動詞構文から名詞構文への書き換えを整理したコラム.よく用いられるパタンをコーパスから採用した.
コーパス register ⇔ registration
All participants are required to register in advance.
Advanced registration is required for all participants.

類語コロケーション比較

類語の使い分けを,それぞれの語が共起するコロケーションの違いによって特徴づけたコラム.
コーパス brief vs. short[名]
brief: summaryoverviewdescriptionglimpserespite 一時休止
short: termstorywhilewalkfilm
brief は時間が短いこと全般に用いるが,説明の簡潔さに用いることが多い.short は単に持続時間が短いことをさす.
以上,コーパスコラムは,中級英語学習者の英語使用に有効な発信情報を中心に,従来の英語辞典に掲載されているコーパス関連情報とは一線を画する新規情報を多数掲載した.
ジャパンナレッジとは

ジャパンナレッジは約1500冊以上(総額550万円)の膨大な辞書・事典などが使い放題のインターネット辞書・事典サイト。
日本国内のみならず、海外の有名大学から図書館まで、多くの機関で利用されています。

ジャパンナレッジ Personal についてもっと詳しく見る

百科
日本語
歴史
英語
ヨーロッパ言語
東アジア言語
用語・情報
人名・文化・宗教
科学
記事・コラム
叢書
JKBooks