記事にPRを含む場合があります

【完全解説】生成AIに機密情報や個人情報を入れても大丈夫?ChatGPT・Gemini・Claudeの安全性と正しいリスク管理術

テクノロジー
テクノロジー

「ChatGPTなどの生成AIに、仕事のデータやプライベートな情報を入力しても大丈夫なのだろうか?」

AIの普及に伴い、このような不安を抱く方が増えています。

結論から言うと、生成AIの安全性は「どの会社のAIか」だけでなく、「どのプランをどう設定して使っているか」によって大きく変わります。

実態は単純な二択ではなくグラデーションですが、大きく分けると「個人向け」と「法人・API向け」で方針が異なる点がポイントです。本記事では、主要AI(ChatGPT・Gemini・Claude)の規約の違いと、医療・金融・著作物といったセンシティブな情報を扱う際の鉄則を解説します。

一目でわかる!生成AIの「安全性マトリクス」

生成AIのリスクを理解する上で重要なのは、「個人向け」「法人向け」「API経由」という3パターンの違いです。

サービス個人向け法人向けAPI経由
ChatGPT(OpenAI)初期設定で学習あり※オプトアウト要学習なし(既定)学習なし(既定)
Gemini(Google)初期設定で学習あり※オプトアウト要学習なし(既定)学習なし(既定)
Claude(Anthropic)初期設定で学習あり(2025年8月以降)※オプトアウト要学習なし(既定)学習なし(既定)

※詳細な保持期間・条件はサービスや地域、時期によって変わるため、本記事の数値は目安としてご覧ください。最新の正確な情報は各社の公式ヘルプページでご確認ください。

ChatGPT:個人向けはユーザー自身の対応が必要

ChatGPTの個人向けプラン(Free/Plus/Pro)は、初期設定でデータ共有(学習)が有効になっており、ユーザー自身でオプトアウト(拒否)を設定する必要があります。

お客様のコンテンツをモデルの学習に利用させていただくことで、モデルの精度が向上し、お客様固有の問題解決能力が高まるだけでなく、モデルの汎用性と安全性も向上します。例えば、ChatGPTは、お客様がオプトアウトしない限り、ユーザーとの会話を継続的に学習することで性能が向上します。

How your data is used to improve model performance

Business/Enterprise/Edu・APIは、提供された入出力を初期設定では学習に使用しません。

デフォルトでは、ChatGPT Business、ChatGPT Enterprise、APIを含む、ビジネスユーザー向け製品の入力データや出力データを使用して学習は行いません。

How your data is used to improve model performance

なお、安全監視目的のログ保持期間は用途や環境によって異なる場合があります。

Gemini:個人向けは「アクティビティ」が既定でON

個人向けは「アクティビティ」機能が既定でONになっており、一部の会話がサンプリングされて人間レビューに回ることがあるとGoogleは説明しています。

アクティビティを保持しておくと、いつでも中断したチャットを再開できるほか、AI モデルを含む Google サービスの改善に役立ちます。この設定がオフの場合でも、Gemini での応答やセキュリティ維持のために、チャットは 72 時間保存されます。

Gemini アプリ アクティビティ

レビュー対象になった会話は保持期間が延びる可能性がありますが、具体的な期間は時期や地域によって変わり得るため、最新情報は公式ヘルプでの確認をおすすめします。

一方Workspace版は、許可なく人間レビューや学習に使われないとGoogleは説明しています。

Gemini とのやり取りが組織外に開示されることはありません。Gemini は、お客様の許可なくコンテンツを組織外に共有することはありません。
既存の Google Workspace の保護は自動的に適用されます。Gemini は、他の Google Workspace サービスと同じエンタープライズ グレードのセキュリティを提供します。
お客様のコンテンツが他のお客様のために使用されることはありません。 お客様のコンテンツは、人間によってレビューされることも、許可なくお客様のドメイン外で生成 AI モデルのトレーニングに使用されることもありません。

Google Workspace の生成 AI に関するプライバシー ハブ

Claude:方針が転換した最大のポイント

従来「Claudeは個人向けでも初期設定で学習なし」と説明されることが多くありましたが、2025年8月、Anthropicは個人向けプラン(Free/Pro/Max、Claude Code含む)に対し、会話データを学習に使うかどうかをユーザーに選ばせる規約変更を行ったと公式に発表しています。

同意UIでは、データ共有のトグルが初期状態で有効になっているため、意図せずオプトインしてしまうケースが指摘されています。

法人契約ではデフォルトで、モデルの再学習に使われません。

デフォルトでは、弊社の商用製品(例:Claude for Work、Anthropic API、Claude Govなど)からの入力データや出力データは、弊社のモデルの学習には使用されません。

https://privacy.claude.com/en/articles/7996868-is-my-data-used-for-model-training

オプトインした場合、Anthropicの公式発表によれば会話は非識別化された状態で最大5年間保持され、学習に利用される可能性があります。オプトアウトすれば、従来通り30日保持・学習なしの扱いに戻ります。

Claudeの「安全レビュー」に関する報道について

一部メディアでは、Anthropicが2026年6月に更新したプライバシーポリシーにおいて、安全レビューのため社内システムがフラグを立てた会話は、ユーザーのオプトアウト設定にかかわらず学習に利用され得るという例外規定を明記したと報じられています。ただしこれはAnthropic1社に関する報道であり、ChatGPT・Geminiに共通する話ではありません。また「会話が人間レビューの対象になる」ことと「その会話が学習に使われる」ことは厳密には異なる論点であり、公式の一次情報による裏付けは現時点で限定的です。機密性の高い情報を扱う際は、この点も踏まえて慎重に判断することをおすすめします。

Google検索とは何が違うのか

「Google検索でも情報は見られていたはず」という疑問は少なくありませんが、生成AIには次の違いがあります。検索は単語の断片中心ですが、生成AIには文章やファイルを丸ごと渡すため文脈がそのまま渡ります。検索の目的は主に広告最適化ですが、生成AIは「モデル自体の能力向上」が目的とされています。さらに、学習に使われたデータがパターンとして溶け込み、別の利用者への回答に断片的に反映される可能性が構造上あります。

漏えいリスクの実態と、入れてはいけない3大情報

他人に内容が漏れる確率は「低いが、ゼロではない」

AIは入力をそのまま横流しするのではなく、大量データの中に薄く広く溶け込ませる仕組みのため、1〜2回の入力がそのまま再現される可能性は小さいとされています。ただし、同じ組織が同じ機密プロジェクトを繰り返し相談する「情報の固定化」、書き方の正解パターンが限られる「プログラムコード」、学習以外の原因(システムバグ)による流出は、例外的にリスクが上がる要因として挙げられます。

① 医療情報(病歴・検査結果など)

法律(米国HIPAA等)の厳格なルールに、個人向けアカウントは対応していません。安全チェックのため人間レビュアーに会話が見られる可能性(特にGemini個人向けなど)もあるため、生の病歴をそのまま入れるのは避けるべきです。

② 金融情報・企業機密

アカウント乗っ取り時の実害(不正利用・インサイダー取引疑惑など)が大きすぎます。個人向けプランでの長期保持・学習リスクも踏まえ、生データは入れないのが原則です。

③ 他人の著作物や有料記事

他人の記事や購入した有料記事・書籍の文章を丸ごとコピペして「要約して」「リライトして」と指示する行為には注意が必要です。

学習がオンになっている個人向けプランでは、他人の著作物を意図せずAIの学習プロセスに関与させてしまう可能性があり、利用規約違反や著作権上のトラブルにつながるリスクがあります。

ただし、これが直ちに著作権侵害に該当するかどうかは国やケースによって判断が分かれる、法的にグレーな部分が大きい論点である点には留意してください。

安全に使うための実践ガイド

マスキングのコツ

健康・お金・ビジネスの相談をするときは、情報を抽象化してから入力します。単に名前を隠すだけでなく、「ビジネスモデルや文脈からも特定できない状態」まで崩すのがポイントです。

  • 悪い例:「48歳男性、東京在住の〇〇です。血圧が150で…」
    良い例:「ある成人男性が血圧150の場合、一般的に推奨される食生活の改善は?」
  • 悪い例:「〇〇銀行の口座にある350万円の資産の運用について〜」
    良い例:「手元の元金350万円を運用する場合〜」
  • 悪い例:(競合他社のブログ文章をそのままコピペして)「これをベースに自社用にリライトして」
    良い例:(文章を入れず構造だけを抽出して)「構成案の作り方として、どのような流れが一般的か教えて」

AIを使う際に気をつけるべきポイント

  • 個人向けプランは3社とも「初期設定で学習あり」が基本。使い始めに設定を必ず確認する
  • 設定や保持期間の細部は時期・地域によって変わるため、最新情報は公式ヘルプで確認する
  • 「消したら消える」とは限らない。安全監視のため一定期間はバックエンドに残る
  • 確証のない機密情報は、そもそも入力しないのが最も確実な対策

今日からできる4つの対策

  1. 設定変更から始める
    ChatGPTは「Improve the model for everyone」、Geminiは「アクティビティ(Keep Activity)」、Claudeは「Help improve Claude」を確認してオフにします。
  2. コピペの前にマスキングを癖にする
    固有名詞・具体的な数字・特定されやすい文脈をダミーに置き換えてから入力します。
  3. 機密データはセキュアな環境でのみ扱う
    本物のカルテ、財務データ、独自のソースコード、権利関係が絡む文章は、個人向けAIには一文字も入れず、法人向けプランやAPI(Zero Data Retention設定含む)でのみ扱います。
  4. 定期的に規約変更をチェックする
    3社とも方針は短期間で変わっています。半年に一度はプライバシー設定を見直しましょう。

生成AIは、正しい知識とルールさえ持っていれば、過度に恐れる必要はありません。仕組みを理解し、安全にその恩恵を最大限に活用していきましょう。

タイトルとURLをコピーしました