JKボイス お客様の声知識の泉へ
ジャパンナレッジを実際にご利用いただいているユーザーの方々に、その魅力や活用法をお聞きしました。
ジャパンナレッジユーザーに関わるイベント、他メディアでの掲載記事などを「SPECIAL」と題してアップしていきます。今後もユーザーのみなさんが各方面でJKを応援していただいている様子をお伝えしていこうと思います。ご期待ください。
2009年03月

JKボイス-セミナーレポート:ジャパンナレッジ コピペ問題を考える ~大学などで今起こっているレポート作成の問題と対応策~

杉光一成さん
(すぎみつ かずなり)
金沢工業大学大学院工学研究科
知的創造システム専攻 教授 Ph.D.
コピペ検出ソフト開発に携わられた杉光さん。コピペ問題への抑止力として脚光を浴びましたが、杉光さんは、そこに横たわる本質について見極めなければ、解決にはならないと語ります。
第10回図書館総合展
2008年11月26日(水)
会場:パシフィコ横浜(神奈川県)

コピペ検出ソフト開発に対する反響

 私は、「コピペ検出ソフトを開発した人」ということで、ソフト開発者と思われがちなのですが、実際は「知的財産」の特許について大学院で講義をするのが本職なのです。ですから、今回ソフト開発に携わることの方が、私の本職からすると異色だということになります。ただ、知的財産には、もちろん著作権等も含まれますので、そういう意味では、知的財産の教育は、むしろ専門と思っていただいても良いのかもしれません。

 さて、2008年5月25日の朝日新聞朝刊に「コピペしたリポート、ばれちゃうぞ 検出ソフト開発」という記事が載りました。資料1
 この記事が出た背景は、朝日新聞の記者の方とまったく別の話をしている時に、たまたま、「今、大学ではコピペが問題になっているから、朝日新聞が社会問題として取り上げたらどうでしょう?」というお話をしたのがきっかけなのです。その流れで、ソフト開発が専門ではありませんが、すでに、このようなソフトも製作している、ということをお話しました。
 本意ではない部分も多少はありましたが、コピペが社会問題として取り上げられることに関しては、これはこれで良かったと思っています。
 ただ、この記事のインパクトは想像以上に大きかったようです。特にネット掲示板にものすごい勢いでこの記事に関する書き込みされ、大変驚きました。私がざっと見た限りではありますが、幸いにも、9割5分くらいは「いいんじゃないの」「賛成」「このようなソフトはあったほうが良い」という肯定意見でした。
 ただ、やはり一部には、非常に批判的というか、ネガティブな意見もありました。「杉光先生というのは、全国の学生を敵に回した」とか、「余計なことをしやがって」とか、「来年発売されるそうだから、僕は4年で良かった」とかですね。ですが、議論が起きたという意味では、ある意味それを期待していた部分もありましたので、良いことかと思っています。

 朝日新聞の記事をきっかけに、様々な取材を受けることになりました。資料2
 ネット上の書き込み以外にどのような反応があったかと申しますと、一番最初は、なぜか会計監査員という方から「国のニーズとして必要なので早めに使わせていただけないか?」という電話をいただいて、こっちがびっくりしました(笑)
 それから、某大学の先生からは、「うちの大学院でも問題になったので、早めにソフトをお分けいただけませんか?」というような話もありました。さらに、別の大学の事務局の方からは、「来年、大学として一括購入したいので、予算を取りたいから大体1本いくらになるか教えてください」という、かなり気の早い話もございました。
 それ以外にも、イタリアの経済新聞から取材が来て、--もちろん取材自体はイタリア語ではなくて英語できたのですが、よく分からないうちに、私の名前をアルファベットで検索するとイタリア語でいっぱい出てくるようになりました。でも、何が書いてあるか分からない(笑)。
 そのような状況がいろいろありました。

 ただ、これらの様々なコピペ議論の中で、ちょっと話がかみ合っていないな、と思う場面も多々ありました。そこで気がついたのは、“コピペ”という言葉がはっきりと定義されていないということでした。定義が成されていないまま、コピペは良いとか悪いとか、コピペというのは重要だとか重要じゃないとか、いろいろな議論が戦わされているということに気付いたのです。“コピペ”という言葉を整理をしてみようと思ったのがこちらです。資料3
 Aは、最も単純な「コピー&ペースト」というコンピュータの機能です。
 Bは、それを実際に人間が行う行為です。
 Cも、広い意味でコピペと言うのかもしれません。要するに、他人の文章を丸写しして自分の文章であるかのように詐称するという行為です。
 さらにDは、このCの詐称を、コンピュータのコピー&ペースト機能を使って行う行為になります。
 このように整理できるのではないかと思います。
 もちろん、私が今回開発しているのは、Dの意味でのコピペを検出するためのソフトです。

コピペ検出ソフト開発の背景と概要

 コピペ検出ソフト開発のきっかけは、大学でレポート課題を出し、提出された学生のレポートを読んでいた時のことです。
 ある学生のレポートを読んで、「これはなかなか面白い、斬新なアイデアが書いてあるな」と思ったわけです。しかし、その次の次のレポートを読んだ時に、大半が同じ内容であることに驚きました。もしかすると……と思い、ネットで調べてみたところ、ある人のブログの意見がそのままコピペされていたことが分かりました。
 これはまずいなと、疑心暗鬼にもなり、全員のレポートで少し特徴的な文章など、気になる文章を抜き出して全部検索エンジンにかけるということを一生懸命やってみました。その時に、コピペを検出するようなソフトがないと困るなと思ったのが1つの起因です。
 それから、もう1つの問題の背景としては、これはうちの大学や私のゼミ、院生だけの問題ではないのでは、と思ったのです。そこでネット上を調べてみたところ、匿名のものが多かったのですが、いろいろな大学の先生が「実はうちの大学でこんなことがあって困ってる」というような、先生の告白ブログみたいなのを見つけたのです。
 ご存じの方も多いと思いますが、さらに驚いたのは、小学生・中学生の感想文を支援するサイトです。たとえば「坊ちゃんを読んで」の中学校2年生向けとか、小学校6年生向けとかありまして、「自由にお使いください。夏休みを有意義に過ごしましょう」といったふれ込みまで書かれている。そのようなサイトがあるということに気がついたのです。
 これはもしかすると、重大な問題なのにあまり多くの人が語っていない。あるいは、あまり公にはされていない問題なのではないかと考えるに至ったわけです。そこで、コピペを検出するようなソフトが必要だと思い、探してみたのですが、どうも日本には存在してないということが分かりました。
 そこで、そんなソフトがないのであれば自分で作ってみようということになったわけです。資料4実際には私自身がソフトの開発を行っているのではなくて、私の基本的な設計をベースに、ソフトウェア会社のANKさんが開発を行っています。

 本日はソフトの説明をするのがメインではないので、簡単に概略だけを説明します。ただし、2009年に発売予定ですので、まだあくまでも試作品で、完成はしていないという前提です。
 これが、初期画面です<資料5
 画面右側の[ファイルの参照]をクリックして、院生・学生のレポートのファイルを読み込み、文章を見るというのが最初のステップです。資料6
 文章を読み込んだ上で、検索条件の設定を行います。資料7検索条件というのは、画面右側にあるように、いくつかの条件を設定します。日付やファイル形式などを設定して[検索実行]をクリックします。
 すると、どの部分がコピーされているのかということが赤い背景色で表示されます。かつ、画面右上に69%と表示されていますが、これは、全体の69%が、Webサイト上の情報などから成り立っているレポートであることを示しています。資料8
 少し見づらいのですが、左下の濃く赤い背景色の部分にURLが表示されています。この部分については、ここのURLの情報と同じですよ、ということが表示される仕組みになっています。資料9

 アメリカのサービスと比較して、本ソフトの特徴を紹介します。資料10
 多くの方はご存じかもしれませんが、アメリカにはすでに「Turnitin」という、コピペ的なものを判断するサービスがあります。ただし、日本語対応のものはなく、あくまでも英語を前提にしています。英語は単語ごとにスペースがありますが、日本語は単語ごとにスペースがあるわけではありませんので、単純に「Turnitin」のメニューを日本語化したからといって、そのまま日本では使えません。言語の解析ということで、まず単語ごとに分解する処理を行わなければ、日本語の検索はできないでしょう。そういった意味でも2者はちょっとタイプが違うものになります。
 それから、「Turnitin」は基本的にはWebサービスです。アメリカでは、大学単位のサービスになっていて、大学単位で契約を行っているらしいのですが、それに対してこのソフトは、個人が1個ずつ購入するパッケージソフトになります。

コピペ検出ソフトの是非と効用

 コピペ検出ソフトについてどのような意見が出てきたかをご紹介します。資料11
 主に、朝日新聞の記事が出た直後にネット上の反響です。

 「コピペ検出ソフトができたとしてもコピペ問題は解決しない」というご意見。これについては反論するつもりはありません。おっしゃるとおりだということで、私もこのソフトができたから全部解決すると言うつもりは全くありません。あとでご説明しますが、このソフトは、コピペに対するひとつの抑止力になり得るんじゃないかというふうには考えております。
 「コピペ検出ソフトができてもそれを破るソフトができるだけである(いたちごっこ)」というご意見。これも、反論するつもりは特にはないです。ただ1つ言えるのは、たとえばコンピュータのウィルス対策も、結局いたちごっこをしているわけですが、いたちごっこになるから、そもそもセキュリティソフトはいらないかというと、そういう議論にはならないはずだと思います。
 「正当な引用までもコピペであるとされてしまう」というご意見もありました。これについては、正当な引用についてはコピペではないと判断するような機能を付ける予定です。
 次は、「普段から接している学生の出来とレポートを比較すれば見抜けるはずだ」という厳しいご意見。確かにそういうケースもあると思います。ですが、人数やレポートの内容等によってケースバイケースではないかと思います。5、6人の学生を対象にしているのであれば、そのような可能性はあり得ますが、50人、100人と規模が大きい場合もありますし、必ずしも見抜けるとは限らないのではないかと考えております。

 では、コピペ検出ソフトの効用を考えてみましょう。
 私が申し上げたい第一のポイントは、何よりも教育の方が重要だということです。このソフトで全てが解決できるわけではないというのは先ほども申し上げたとおりで、むしろ、コピペをしないできちんとレポートを作る重要性というものを教育していくことがとても大切であると考えています。
 ただ、そうは言いながらも、教育をしたからといって、全員が本当にコピペをしないようになるかというと、必ずしもそうではないというのが現実だと思います。

 例え話をさせていただきますと、自動車の教習所では、スピード違反をすると重大な事故を招く可能性があると教育します。では、本当にそれだけやっていればスピード違反が無くなるかといえば、それは違いますよね。実際には、スピード違反の取り締まりが行われているのが現実です。
 スピード違反で捕まりたくないから、罰金を払いたくないから制限速度で走っている人もおそらく多数いると思います。その時に私が思うのは、誰が恩恵を受けているのかということ。それはやはり、そのスピードを落としている本人に、相当の恩恵が、スピード違反の取り締まりによって与えられていると思うのです。
 つまり、もしみなさんが今日この会場にいられるのも、もしかしたらその取り締まりがあったおかげで、スピードを出さなかったから事故に遭わなかったのかもしれない。取り締まりがあることによって仕方なくスピードを落としたというものの、きっかけはそうであったとしても、結果的には事故を免れている、本人のためになっているという可能性はあるのではないかと考えております。
 そのような意味で、このソフトも同様の考え方になっています。教育も重要ですが、教育だけでは防ぎきれない部分があるので、検出ソフトがあることによって、「コピペしてもばれてしまうから仕方がない」となり、自分で考えて書かざるを得なくなる。結果的にその人は、嫌々ながらかもしれませんが、きちんと考えてきちんと調べてレポートを書いていることになります。結果、その人のためになっているのではないかと考えているわけです。

コピペ問題の本質を見極めた対応を

 コピペ問題については、検出ソフト以外にも様々な対応方法が考えられると思います。1つは、手書きでレポートを提出させるというやり方。それからもう1つは、レポートによる評価をやめて、試験で一律に評価するという考え方です。
 まず手書きレポートの提出。このような対応の方法はもちろんあると思いますが、私の個人的な見解としては、大学に限らず学校というのは、これから社会に出て行く準備段階なのであり、あまり社会で使わないことを教育するのはどうかなと思っております。何が言いたいのかというと、今の社会の中で、手書きでレポートを書く、文章を書くという機会がどの程度あるのかということに疑問を持っているのです。手書きで書かせるということが、社会に出る準備として正しい方向性なのかどうかという点です。もちろん、レポートを手書きで書かせることもコピペを防ぐための1つの方策かもしれませんが、手書きで書かせるという行為が、果たしてこの問題に対する一番の良い方法なのかどうかということに関しては、疑問があるところです。
 それから、もう1つの、レポートによる評価を廃止して試験のみを行うという対応。意外とこの方法を取られているところが多いようですが、これについては先ほどの手書きで書かせることよりも強く、おかしいと思います。そもそもレポートというのは試験で測れないことを測ろうとしているはずです。試験で測れるのであれば、レポートというものは必要ないはずです。
 たとえば、試験というのは、既存の知識が身についているかどうかの確認という意味では、非常に優れたやり方だと思います。これに対しレポートでは、その人が過去に経験したこと、あるいは知識を得たことを踏まえて、新しいオリジナルの考え方を出させたり、新しい問題を発見したりするということを問うことできます。レポートだからこそ問えるようなものを出すのが本来のレポートの姿ではないかと考えるわけです。

 私自身が実際に出したレポート課題は、「デジタルコンテンツビジネスの未来像」というテーマでした。これまでの授業を踏まえて、自分の考えで書いてください、というレポートだったのです。それが、ある人のブログからのコピペになってしまったわけなんですが…。
 このように、未来を予測させるようなタイプのレポートというのは、試験問題として出すことは難しいでしょう。もし、すべて試験にしてしまえば、きちんと調べて、自分の考えを書かせるというレポートの効用というもの自体が、損なわれてしまうのではないでしょうか。本末転倒と言うと言い過ぎかもしれませんが、レポートの良さというのが消えてしまうという可能性があると考えております。

 コピペ問題の本質がなんなのかということを考えてみましょう。資料12
 「コピペというのは今に始まったことではない。昔からある問題だ」という意見もあります。では、昔と今とでは何が違うのかというと、おそらく、手の抜き方があまりにも著しいケースが多いということですね。要するに、昔、書き写した時代は、一生懸命文章を見て、中身を確認しながら考えながら写したと思います。ですから、それなりの学習効果もあったでしょう。同時に、書き写すための文献を探すというところにも、労力がそれなりにかかっていたと思われます。
 ところが、今の時代のコピペ問題というのは、検索エンジンにポンと入れて、パッと出て、それをコピーするだけということで、全部で数秒の作業なわけです。図書館に行って、どれを写そうかなと言っている方がまだ、時間をかけていますし、あるいは書き写す時間もかかっていたということです。

コピペが生み出す弊害と今後

 コピペ問題が生み出す弊害についても考えてみましょう。資料13
 私が考える弊害としては、コピペをした学生、コピペをしなかった学生、先生の3者にとって問題が生じると思います。
 1つは、レポートを提出する学生からすると、レポート課題に対応して、自分で考えて、調べて、自分の論理を構築するというせっかくの機会を失うという意味での損失があると思います。
 また、コピペのレポートというのは、先生をだます行為に相当していますので、それ自体も問題があります。
 それから、そのレポートを受領した先生が、最初にも申し上げたように、コピペしたかどうかをチェックするという面倒な作業をやらざるを得ない、余計な時間がかかるということもあると思います。
 まじめな学生にとっても非常に不公平なことになります。ネット上の書き込みでも、「友だちはコピペして提出してAを取ったけれど、まじめに頑張った自分はBだった。だからコピペ検出ソフトに賛成する」という内容のものもありました。

 では、コピペ問題の根底には何があるのでしょうか。
 これも、あくまでも私の考えにすぎないのですが、1つはインターネットの発展が考えられます。これは、異論がないところかと思います。図書館に入り浸って文献を探すということが当たり前だった時代から、今は、おそらくインターネットによって日本のほとんどの家庭に図書館があるというような状況になってきています。
 それからもう1つは、ジェネレーションギャップです。これも私が個人的に考えたところなのですが、要するに、今の教育する側と教育を受けている側とでは、育ってきた環境がまったく違うということが、コピペ問題が浮上してきた背景にあるのではないかと思うのです。
 つまり、今、教育をしている先生側は、おそらく自分の学生時代にコピペという、インターネットを使って出てきた情報をコピーするという行為は存在しなかったと思います。ところが今の大学生は、ちょうど物心ついた頃からすでにインターネットがあるという世代になります。生まれた時から存在しているというものに対する当たり前感、まったく抵抗がないというギャップというのは、かなり大きい、と考えております。

 最後に、コピペ問題の今後についてです。資料14
 先ほどから何度も申し上げていますが、コピペ検出ソフトだけで解決する問題ではありませんので、情報倫理、著作権教育といった教育の問題として取り組む必要があると考えています。
 ご参考として、今年の7月から新しい国家試験の「知的財産管理技能検定」という検定制度ができましたのでご紹介いたします。これは、著作権を含めた試験です。こういったものを使って教育し、目標に向かって頑張ってもらうというのも1つの方法だと思います。
 また、コピペが発覚した際の明確な処分も必要かもしれません。例外があるとは思いますが、私が聞いている限り、アメリカではコピペが発覚した場合、非常に厳しい処分があり、普通は退学とのことです。ところが日本では、その科目の単位が落ちる程度のところが多いようです。もう少し厳格に対処しても良いのではないかと考えております。

 「今の教育における能力開発の方法は正しいのか?」
 私自身の疑問・問題提起ではありますが、答え自体は持っておりません。申し訳ありません。
 昔、本や情報が貴重だった時代というのは、頭の中にどれだけの情報を蓄えているのかということが、その人の価値というか、学習そのものだったと思うのです。しかし今は、どこに行ってもインターネットさえあれば必ず情報は手に入ります。このような状況の中で、頭に詰め込む教育というのが本当に今の時代に合った教育なのかということなのです。
 かなりひねくれた話になりますが、他人よりも素早く情報を引き出せる、検索能力に優れている人の方が優秀な人なのではないかと思えるのです。
 今まではたぶん、頭の中に入っている情報が、一番アクセススピードが速かったでしょう。ですが、頭の中には入っていないけれど、手元にあるコンピュータから素早く情報を引き出せるというのも、その人がそれだけの情報量を持っているということにほかならないと言えます。もしかすると、検索能力が求められる時代に変わってきているのかなという気もいたします。
 ただ、このことは、私が正解や的確な考えを持っているわけではなく、このようなことも、もしかしたら今後考えていかなければならない問題ではないか? ということです。

 雑駁な話になってしまいましたが、ご静聴どうもありがとうございました。