2023年10月12日

「学習」とは、AIに「常識を持たせる」プロセス

大越章司

いよいよ来月からMicrosoft 365に生成AI機能が搭載されるなど、AIはいよいよ身近になってきました。しかし、未だに「AIは間違ったことも言うし、安心して使えない。」といった声も根強いようです。このような心配は、AIの仕組みを知ることで、ある程度緩和することができます。

生成AIに限らず、現代のAIはディープラーニング（深層学習）によってAIモデルを訓練し（AIにとっては「学習」）、その結果できあがったモデルを使って人間からの質問に答える、という構造になっています。
このとき、訓練（学習）に使われるのが、ネット上の大量のデータです。テキスト生成の場合には、ネット上のテキストデータをAIに大量に学習させることで、言葉と言葉の間の関連性をAI内に蓄積するのです。

例えば、日本で生まれ育った人に「『我輩は』の後に続く言葉は何ですか?」と聞いた場合、ほとんどの人が「それは『猫』でしょう。」と答えるでしょう。（もちろん、海外では違うでしょうが）これは、日本で生まれ育つ中で、様々な場面であの有名な小説についての情報に触れるからです。これを「常識」と呼んでも差し支えないでしょう。人間は、様々な経験を積み、その中から一定の法則（常識）を学ぶのです。機械学習は、AIにおいてこれと同じ事をしようとするものと考えることもできます。

AIが日本語のテキストを大量に学習することで、人間が長い間をかけて獲得する常識を短時間に得ることができます。しかし、そこには問題もあります。以前も書きましたが、学習データが常に正しく、偏りが無いとは限らないからです。
「我輩は」の後が必ず「猫」とは限りません。別の文脈で使われることも当然あるでしょうし、中にはわざと猫でない動物を書く場合もあるでしょう。そうすると、学習データに「揺らぎ」が生じます。そのため、AIの内部では「『我輩は』の後に『猫』が来る確率は90％」といった扱いになっており、それを「『我輩は』の後に続くのは『猫』です！」と言い切るか、「『我輩は』の後は『猫』が続くことが多いです」と伝えるかは、AI全体の設計思想や目的によります。初期のChatGPTは、自信の無い答えでも言い切るように調整されていたと考えられます。「自信たっぷりに嘘をつく」と言われたのは、これが原因と言えるでしょう。

日本語のサイトは英語のサイトに比べれば数も量も少なく、こういった「揺らぎ」の影響を受けやすいと言われています。今後AIはますます身近になっていくでしょうが、こういった仕組みを理解しておくと、AIの限界や特性に注意しながら、AIとうまく付き合って行くことができるでしょう。

大越章司