ご相談

講演依頼.com 新聞

コラム ビジネス

2024年01月17日

生成AIを悩ませる学習データの著作権・プライバシー問題とは

2023年は生成AIに振り回された1年でしたが、AIは2024年も進化を続けるでしょう。好むと好まざるとに関わらず、AIは日々の生活の中に入り込んできます。そのような中、昨年12月に米ニューヨークタイムズが、ChatGPTを使うMicrosoftとその開発元であるOpenAIを提訴したというニュースが飛び込んできました。ChatGPTがニューヨークタイムズの記事を無断で学習したというのです。

このコラムでも以前ご紹介したように、AIはネット上のデータを使って学習を行います。膨大なデータを読み込んで、さまざまな言葉の繋がり、即ち「パターン」を蓄積するのです。そして「次に来そうな単語」を繋ぎ合わせることで、自然な文章を生み出します。つまり、AIの回答は「誰かがどこかで書いたこと」をバラバラにして繋ぎ合わせたものである、という見方もできるのです。ニューヨークタイムズは「AIの回答の中にはニューヨークタイムズの記事の断片が含まれているかもしれない。」ということで、著作権侵害で提訴したわけです。

これは、画像生成AIや音楽生成AIではさらに大きな問題であり、米国では早くから訴訟が起きています。訴えが棄却された例もあれば、まだ係争中のものもあり、今後どのように推移していくのかはわかりません。個人のプライバシーについても同様の問題があり、個人情報の保護に積極的なEUでは、一時ChatGPTの使用が禁止されたりしました。ネット上の個人情報の断片が開示される恐れがあるということです。

これらの問題は昨年5月の広島サミットでも取り上げられ、早急にルール化が必要ということで、先進国の間で協議が続いていました。昨年11月には一定の方向性が出され、規制に関する話としては異例の速度で進んでいます。著作権やプライバシーの保護は重要である一方で、AIの進化を止めてはならないということなのでしょう。

規制当局の動きも速いのですが、ベンダーの動きはもっと迅速です。昨年、MicrosoftとGoogleは、自社のAIサービスを使った結果ユーザーが誰かから訴えられた場合、その訴訟を肩代わりすると発表しました。訴訟を引き受けるリスクを負ってでも、AIを普及させていきたいということでしょう。今後各社は、著作権やプライバシーに配慮した学習データを使うなどして、リスクを最小限にしつつ、AIの開発を進めていくものと考えられます。

大越章司

大越章司

大越章司おおこししょうじ

株式会社アプライド・マーケティング 代表取締役

外資系/国産、ハードウェア/ソフトウェアと、幅広い業種/技術分野で営業/マーケティングを経験。現在は独立してIT企業のマーケティングをお手伝いしています。 様々な業種/技術を経験しているため、IT技…

  • facebook

講演・セミナーの
ご相談は無料です。

業界21年、実績3万件の中で蓄積してきた
講演会のノウハウを丁寧にご案内いたします。
趣旨・目的、聴講対象者、希望講師や
講師のイメージなど、
お決まりの範囲で構いませんので、
お気軽にご連絡ください。