コーパスとは

「コーパス」をご存じですか?

コーパスって何?

新聞、雑誌、本などに書かれている中身や、文字化した話し言葉を大量に集め、コンピュータでいろいろ検索・分析して調べられるようにしたデータベースのことです。言語研究のためにバランスよく収集された多種多様な英語が取り入れられています。

コーパスで何ができて何がわかる?

実際に使われているネイティブスピーカーの英語を調べられます。辞書や参考書の例文を見ると、数が少なすぎるだけでなく、説明のための例文であるために実用性が低かったり、あまり使われないイディオムが載っていたり、英語を使うための情報が不足しています。コーパスは生の英語そのものですから、それ調べることによって、たくさんの例文はもちろん、何がよく使われ、何があまり使われないかも一目でわかります。

辞書などには、わかりにくい表現や特殊な言い方の意味はよく載っていますが、よく使われる表現は載っていないことがあります。コーパスを使うと、頻度がすぐにわかりますから、使ってよい表現なのかそうでないのかがすぐにわかります。また、よく使われる表現は、自分で検索して簡単に調べてみつけることができます。

小学館コーパスネットワークができること

コーパスは決して特殊なデータベースなどではなく、電子辞書を引いたり、インターネット検索をするのと同じ手軽さで使うことができます。 「学習」や「教育」「研究」など、活用の用途は様々です。 小学館コーパスネットワークは、1つの言語世界と呼べるほどの奥深さを持っているコーパスを通じ、「ことば」に関わりのある研究や職業に携わる方々のサポートをいたします。

プロジェクトスタッフ
監修:投野由紀夫(東京外国語大学教授)
検索ソフトSAKURA設計:中村隆宏
検索システム構築:相澤弘、渡辺亮嗣