JEFLL Corpus JEFLL Corpus

初めてお使いになる方は必ず「初めてご利用の方へ」をお読みください

JEFLL Corpusとは

JEFLL(Japanese EFL Learner)コーパスは、東京外国語大学の投野由紀夫先生を中心とするプロジェクトが構築をしている、日本人英語学習者によって書かれた英作文のコーパスです。このJEFLLコーパスは、特に日本人EFL学習者(中学1年〜高校3年)を収集対象としたもので、2007年8月にコーパス規模約70万語にて無償公開されました。BNC Online / WordbanksOnlineサービスと同様のインターフェースにてご利用いただけます。

JEFLL Corpus Project(英語版)

JEFLL Corpus の収集データ

JEFLL Corpus は、10年間以上の長期間にわたるプロジェクトとして,生徒の許諾を得て収集したデータを公開しています。ただし,プライバシー情報などを配慮して,学校名,個人名,それに類する情報は意図的にマスクされています。またオンライン検索用のコーパスデータ作成に際しては”CLAWS”(ランカスター大学の自動タグ付けソフト)を使用して,品詞付与(C5 Basic Tagset)をおこないました。

CLAWS(ランカスター大学の自動タグ付けソフト)
品詞付与(C5 Basic Tagset)

JEFLL Corpus の英作文課題

JEFLL Corpus の英作文は,教室内で実施した20分間の辞書無しによる自由英作文です。6種類のトピックからなり,中学1年から高校3年まで統一したトピックでデータ収集がなされています。

JEFLL Corpus の日本語

JEFLL Corpus では,どうしても英語で書けない部分は日本語の使用を認めています。プロジェクトの初期はこの部分はローマ字表記になっており,ここ数年は漢字かな混じりで表記しています。今後,海外への公開に向けてローマ字に統一する予定ですが,現在は未整理ですので,ご了承ください。

JEFLL Corpus の研究利用

JEFLL Corpus は研究用に小学館の提供する web 検索ツールを介してフリーで公開されている資料です。JEFLL Corpus を用いたあらゆる成果物は,下記の要領で適切に引用をする必要があります。JEFLL は,研究チームの許諾なくしては,商用利用はできません。

「本研究に使用したデータは,投野由紀夫を中心として構築された中高生の英作文コーパス Japanese EFL Learner (JEFLL) Corpus に基づくものである。検索ツールは,JEFLL Corpus の web 検索システム(小学館コーパスネットワーク)を利用した。」

免責事項

JEFLL Corpus に書かれている内容に関しては,個人の英作文なので本研究チームは一切関知しません。また,作文の内容や英語力のレベルを批判すること,作文から学校などを推定して公開することは禁止します。JEFLL Corpus を利用して行われた研究・教育上の一切の損害に関して,研究チーム,小学館および株式会社ネットアドバンスは責任を負いません。

JEFLL Corpus

70万語 英作文(無料