小学館コーパスネットワークを実際にご利用いただいているユーザーの方々に、その魅力や活用法をお聞きしました!
小学館コーパスネットワークと出会って辞典を編む
2016年8月28日
佛教大学 英米学科
教授 瀬戸 賢一
これまでに二冊の辞典を編みました。『英語多義ネットワーク辞典』(2007年、小学館)と『プログレッシブ英和中辞典』(2012年、5版、小学館)です。ちょうどBNCが使いやすい日本語のインターフェイスと共に利用できるようになった時期と重なります。何か運命的な出会いを感じました。
これで一気にコーパスは身近な存在になったのです。日ごろ感じる疑問を母語話者よりも1億語のコーパスに尋ねてみる――すると正確なデータが瞬時に返ってきます。まさに夢のよう。たとえば「大成功」と「大失敗」なら、日本語としてどちらも同じくらいよく使うでしょう。
そこで、これに相当すると思えるtotal successとtotal failureを調べてみると、圧倒的にtotal failureのほうが多いという結果に直面します。このtotalは「完全な、まったくの」という意味。しかし、否定的な名詞との結びつきが強い。今回21億語のWEBコーパスになったSCNで確かめると、その比率は約7対1です。『プログレッシブ英和中辞典』にはtotal failureが用例として載せてあります。
新しいSCNの凄さは、容量が膨らんだだけではありません。そのサブコーパスが注目すべき利用価値を秘めています。政治・経済・法律などの各分野ごとに検索できるのです。どこでどのような語が実際にどのように用いられているかが手に取るようにわかります。
spokenとwrittenもそれぞれ別にして調べられます。たとえば、一見したところイディオム的であると気づきにくいhaving said that(とは言うものの、とはいえ)は、ほぼ6対1の割合でspokenに多く現れます。さらに頭にbutをかぶせたBut having said thatの形が、話のつなぎ言葉としてよく用いられることもわかります。
このように新しいSCNは、日常のふとした疑問にも研究にも、ほとんどいかようにも使えます。研究の一例も挙げましょう。たとえば、be in loveの〈in+感情を表す名詞〉の結合があります。イディオムとまではいかない慣習的な語と語の結びつきをコロケーションと呼びますね。コーパスで実態を調べましょう。すると感情表現では、pain(苦痛)、horror(恐怖)、despair(絶望)、agony(苦悶)、astonishment(驚愕)、shock(ショック)などとは高い頻度でinとつながることがわかります。しかし、hate(憎しみ)、pleasure(喜び)、delight(嬉しさ)などとはまったく手を結びません。
どうしてだろうかと考え込みませんか。このときあなたはもう研究の入り口に立っているのです。コーパスは、調べ方によってすばらしい資料を提供してくれます。が、その先は、あなたが考えなければなりません。be in despairなどは、きわめて強い感情なので、その気持ちが膨らんで、ついに私たちの身体の外にまで膨張して、私たちがまるでその「中に(in)」包み込まれるようになった全身的な状態を言うのではないでしょうか。
より多くの人にコーパスの可能性を肌で感じてもらいたい。21億語はあなたの強い味方となるでしょう。
BNC Onlineで「ネイティブの直観」に迫る
2016年8月28日
札幌学院大学 人文学部 英語英米文学科
准教授 山添 秀剛
小学館コーパスネットワークのBNC Onlineにお世話になってもうかれこれ10年あまり。使いこなせているかと問われればはなはだ心もとないが,言語学を修める身として多くの恩恵に浴してきました。
英語を学ぶ者ならば英文を作るとき,「より自然な英文は?」と自問するでしょう。その際,高校までに習う文法知識が答えを与えない場合もあり,より専門的な文法書を見てもなお解答にたどり着けないこともあります。
「自然な語の連なり」を求める旅へ出ます。ネイティブに聞けば一発だと思われるかもしれませんが,常にそばにいてくれるわけではありませんし,その方の直観だけに頼って一般化するのは危険な場合もあるでしょう。そこで,英和辞典,和英辞典,学習英英辞典,コロケーション辞典などとさまようことに。「これだ!」と思える例文や解説に出会えなければ,さらに旅路は続きます。インターネット辞典もチェックし,Google検索であたりをつけ,最終的にBNC(アメリカ英語の場合はCOCA)で裏付けをとる。旅の終わりです。
小学館コーパスネットワークの検索ソフトは非常に使いやすく,私のようにコンピュータに明るくない者にも十分な恩恵を与えてくれます。BNC Onlineはイギリス英語に限定されるものの,信頼のおける良質なデータの宝庫です。Google検索やCOCAなどを併用することで,「ネイティブの直観」に迫ることができるでしょう。
小学館コーパスネットワークに21億語のデータも加わる! 英語を学ぶ者には朗報です。
コーパスを取り入れた英文法授業
2016年9月30日
国際基督教大学 教養学部 アーツ・サイエンス学科
教授 守屋 靖代
国際基督教大学教養学部アーツ・サイエンス学科では、「言語教育のための英文法 I, II」というふたつの英文法のコースを開講している。これらのコースではさまざまな文法理論や教授法を取り上げるが、コーパスアプローチも積極的に導入し、使いこなすための訓練も行っている。
コーパスが英文法研究にもたらした変革のひとつは、伝統的なルールを先に決めるprescriptive grammar からコンテクストや社会階層による変種も含めて考えるdescriptivegrammarへのシフトが挙げられる。例えば付加疑問文についてのリサーチでは、まず複数の文法書や検定教科書からルールを導き出す作業を課す。(1), (2)の文に付加疑問を付けるのは簡単でも、(3)の文には学生たちは戸惑う。
(1) You used my bike,__________________________?
(2) My mother hasn’t seen the photo,__________________________?
(3) I am a smart student, __________________________?
Be動詞一人称単数の短縮形が必要になるが、amn’t I? という言い方には違和感がある。ネイティブに尋ねると戸惑うことなく全員が aren’t I? (あるいはain’t I?) と回答する。文法書にはこのような場合の付加疑問について説明があるものもあるが、用例はあったとしても理由は説明されていない。
そこでamn’t I? は決して使われないのか、aren’t I? ain’t I?は実際に使われるのかをコーパスでチェックさせると、British National Corpusでは、amn’t の用例は僅少の1例(0.01/100万語)だけであり、しかもその小説からの引用例はタブー語と共に使われた教養のない層による禁忌表現であることが分かる。
他方、aren’t I という組み合せは、総数197例(1.77/100万語)であり、コーパスデータとしては少数であるが、amn’t I? より頻度は高い。個々の用例の引用元を調べると、すべて会話あるいは小説中の会話表現であることが明らかになる。会話表現をコーパスから検証することはデータ数の問題があり一般化には慎重にならなくてはならないが、文法書に詳しく説明されていない言い回しやそのコンテクストを直接知るのにコーパスは有益である。
このようにコーパスに直接触れその意義を理解した学生たちは、卒論研究のデータベース作成にもコーパスを役立てている。