最終更新日:1/6/2024

AIが引き起こすハルシネーション対策!ファクトチェック法を解説

ChatGPTを筆頭に、SEOに強いAIライティングツール「トランスコープ」のような、生成系のAIサービスは大きな話題を呼んでいます。

趣味などの日常生活はもちろん、ビジネスへも活用されはじめるフェーズに移行してきており、上手く活用することで、私たちの強い味方になりうる存在となっています。

とはいえ、生成系のAIサービスは慎重に利用することが大切です。例えば、生成系のAIサービスには、「ハルシネーション」という、誤った情報を生成してしまう問題が起きています。ビジネスで活用する担当者は、生成された情報を適切に扱わないと、大きなトラブルになりかねません。

今回は、ハルシネーションの基礎知識や、ハルシネーションへのファクトチェックの方法など、AIサービスの利用にあたり押さえておきたい情報の扱い方について解説していきます。

ハルシネーションとは

ハルシネーションとは、ユーザーがChatGPTなどの機械学習モデルへ求めた内容に対して、生成されたデータが実際のデータとは異なる、もしくは存在しないものを生成してしまう現象を指します。これは、主に画像や文章の生成などにおいて問題になるケースが多く、正確で意味のある出力の生成を阻害する要因となります。

ChatGPTとは?:https://transcope.io/column/chat-gpt

ハルシネーションの本来の意味は、「幻覚」です。

人間が実際に現実で見たものと異なる「幻覚」を見る状態と同じように、AIが「幻覚」を見て情報を生成しているようであるため、ハルシネーションと言われています。

AIは、人間と異なり社会的な常識を理解していません。

例えば、AIが学習したデータに、現実では存在しない歴史上の人物Aがいたとします。

その情報を元に、歴史上の人物を求められた場合、その存在していない人物を回答として出力してしまうことが起きてしまいます。一般的にそんな情報はありえないと人間が違和感をおぼえる情報でも、AIは生成してしまう恐れがあるため注意しましょう。

ハルシネーションが起こる仕組み

ハルシネーションが起きる原因はいくつかあります。

誤ったデータの学習

AIは、与えられたデータを基に学習し、学習された内容を元に結果を生成します。しかし、誤ったデータが学習データに含まれている場合、モデルが学習する過程で間違った知識を習得してしまうことがあります。

例えば、果物に関する情報を学習するAIに、誤って玉ねぎが果物であるというデータが与えられた場合、そのAIは玉ねぎを果物をとして扱ってしまうでしょう。

学習データの意訳

AIは、大量のデータから学習を行いますが、その過程でデータの意味を正確に理解できないことがあります。

例えば、AIが日本語の慣用句を学習して英語に訳す場合、AIにとって、「頭が固い」という表現は直訳すると意味が通じないため、適切な意訳が必要です。しかし、AIが間違った意訳をしてしまうと誤った情報を生成することになります。

異なるデータの組み合わせ

AIが、複数の異なるデータを組み合わせ、新たな情報を生成することも、ハルシネーションを引き起こす原因です。

例えば、映画の情報と料理レシピがAIに学習された場合、映画に登場するキャラクターが料理を作るという状況をAIが想像してしまう可能性があります。このような組み合わせは、現実には存在しない情報をAIが生成することに繋がります。

データの学習不足による推測

AIが十分なデータを学習できていない場合、推測から結果を生成することがあります。

例えば、地球上の全ての動物について学習していないAIが、未知の動物についての情報を求められた場合、既存の動物の特徴を組み合わせた独自の生物を想像してしまうことがあります。

ファクトチェックでハルシネーションを防ぐ

上記のように、ChatGPTなどの生成系AIサービスでは、正確な情報を得られない可能性があります。ビジネス利用においては、このような誤情報に対するファクトチェックが必要です。

ファクトチェックをすることで、AIによって生成された情報の信頼性が担保され、より適切にAIサービスを活用することができます。ファクトチェックには、Microsoft Bingの使用をおススメします。

大きな特徴として、下記が挙げられます。

  • ChatGPTと同様にチャット形式で回答を得られる
  • 無料で最新情報を扱える
  • 情報の参照元を明示してくれる

以下で詳しく解説します。

Microsoft Bingとは

Microsoft Bingとは、マイクロソフト社が開発した検索エンジンです。Bingを使用すれば、情報の最新性と信頼性の両方を無料で担保できます。

ChatGPTとBingのAIは、どちらもGPTという言語モデルを採用していますが、下記のような違いがあります。

ChatGPTとBingの違い

ChatGPTは、自身が学習したデータの中から情報を生成するチャットボットです。つまり、生成される情報は学習データの中からに限られます。データには、論文やウェブサイト、書籍などが含まれます。

一方で、Bingは、基本的にはAIを用いた検索エンジンで、その中にチャットボットを組み込んだサービスです。インターネット上で公開されている情報から検索をしてAIで回答生成をするため、検索エンジンとチャット形式の2つの機能を持っています。

また、BingがGPT-4を利用している点も大きな特徴です。

ChatGPTは、無料版の場合、GPT-3.5を使用しており、有料版に切り替えるとGPT-4が使用できます。GPT-4の場合、3.5よりも生成の精度があがりハルシネーションが減少されます。

Bingは、GPT-4を利用しているにもかかわらず無料で利用可能です。

さらに、生成された情報の参考元を明示してくれる点も大きなメリットであり、この機能がファクトチェックに活用できます。

Bingは、ChatGPTと同じく、AIによって回答が生成されるため、ハルシネーションが起きる可能性があります。

しかし、Bingは生成された情報の参照元を明示するため、参照データに間違いがないかを確認することができます。参照元を確認することで、情報に誤りが無いか確認することができます。

Bingでファクトチェックをする方法

実際に、Bingを用いてファクトチェックをしてみましょう。

BingはMicrosoftアカウントを持っていなくとも使用できます。しかし回答数などに制限があるため、無料でアカウントを作成して利用することをおすすめします。

例えば、BIngで「2023年現在の、世界各国の人口の順位を教えてください。」と指示を出すと、下記のような答えが返ってきます。

画像上にある、詳細情報の欄には、実際にBingが回答の生成のために参照した情報元を掲載してくれます。こちらの情報をクリックすると、参照したデータのページへ飛ぶことが可能です。

これにより、生成された情報の正確性を確認できるため、ハルシネーションを避けることができます。

サイト分析も可能

Bingを使用すれば、サイトの信頼性を確認することも可能です。

例えば、先ほどの回答の参照元のページへ飛び、画面右側にある「b」マークをクリックすると、「分析情報」が確認できるページが表示されます。

これにより、このページ、サイトへの流入数や評価を確認できるため、情報の信頼性を把握する1つの判断材料となります。

他にも、プロンプトをより具体化させたり、追加で情報を与えることで、自身の求める回答により近づけることも可能です。

例えば、AI分野では「ショット」という用語が存在します。

しかし、「ショット」はスポーツやお酒など、その他の分野でも使用される用語であるため、もし「ショットについて教えてください。」とプロンプトを出力しても、AIはどの分野の「ショット」を説明したらよいかわからず、ハルシネーションに繋がってしまいます。

意図した回答を得るため、「AI分野における〜」など、情報を指定する指示を出すことも対策の1つとなるでしょう。

ビジネスシーンでChatGPTなどを利用する際は、プロンプトの質が非常に重要です。

ChatGPTのプロンプトについて更に詳しく知りたい方はこちらを参考にしてみてください。

AI生成において把握しておきたい情報の扱い方

ファクトチェックに限らず、AIが生成する情報において、把握しておきたい注意点が他にもあります。

倫理観

事実としては正しくても、倫理的に問題のある回答をChatGPTが生成してしまう可能性があります。

例えば「爆弾の作り方を教えて」というプロンプトに対し、AIが詳しく作り方を回答してしまうと、事件になりうる計画をたてるアシストをしてしまう恐れがあります。

そうなると、AIが規制されたりなど、AI分野や社会に悪影響を及ぼす可能性が起きてしまいます。だからこそ、AIには倫理的な判断力が求められます。

現バージョンのGPT-4では改善がされており、 爆弾の作り方を聞いても見事に回避するが掲載されています。

著作権

ChatGPTなどで生成されたコンテンツの著作権についても把握する必要があります。

結論、ChatGPTで生成されたコンテンツの商用利用は可能です。とはいえ、プロンプトを与える時に使用する情報には注意しましょう。無断で他人のコンテンツや個人情報を使用すると、著作権侵害に当たるため、十分に気を付けながら利用してください。

ChatGPTの著作権関連についてより詳しく知りたい方はこちら:https://transcope.io/column/chatgpt-copyright

AI生成コンテンツはファクトチェックが必須

ChatGPTなどの生成系AIサービスは、効率的に情報を収集できたり、コンテンツの生成をしてくれたりするため、ビジネスにおいて非常に効果的なサービスとなるでしょう。

とはいえ、情報の正確性がより求められるビジネスシーンにおいて、ハルシネーションへの対策は必要不可欠です。

正確な情報を得るために、Bingを活用してファクトチェックをしたり、プロンプトの質をあげたりしましょう。

現在のAIの生成精度では、生成された情報を人の目でチェックする必要があります。担当者は、ファクトチェックを欠かさずに実施して適切にビジネス活用をしましょう。

弊社が運営するSEOに強いAIライティングツール「トランスコープ」は、Bing同様に、より生成精度が高いGPT-4を無料から利用できるため、ハルシネーションリスクを極力避けながらビジネス用のコンテンツを生成可能です。

コンテンツマーケティングにお困りの企業の方は、ぜひ一度お試しください。

最終更新日:1/6/2024

シェアモル株式会社 代表取締役

齋藤 康輔

大学在学中に半導体のシミュレーションを専攻する傍ら、人材会社にてインターン。
インターン中に人材会社向け業務システムを開発し、大学卒業後の2007年3月に上記システム「マッチングッド」を販売する会社、マッチングッド株式会社を設立。
12年の経営の後、2019年1月に東証プライム上場企業の株式会社じげんに株式譲渡。
売却資金を元手に、シェアモル株式会社を設立。
AIを利用したM&A・事業承継の仲介サービス「シェアモルM&A」SEOに強い文章をAIが作成する「トランスコープ」を展開中。

Contact

以下から登録またはX(旧Twitter)をフォローすると
お役立ち情報を無料で受け取れます!

SEOに強いAIライティングツールAIならトランスコープ

© Transcope.