Q.
生成AIの「学習に用いない」とはどういう意味ですか?
関連タグ
生成AI一般守秘義務(民法等)個人情報保護法
A.
AIの「学習」とは何か
生成AIの「学習」とは、AIが「より良い回答を出せるようになるため」に、大量のデータをもとにモデル内部のパラメータ(設定値)を統計的に調整するプロセスです。入力した文章をそのままどこかに「保存・記憶」するのではなく、無数のデータの傾向を反映してモデル全体を少しずつ最適化していくイメージです。
学習されると、入力した情報が他のユーザーに出てくるの?
原則として、そのようなことは起きません。
学習はあくまで統計的なパラメータ調整であり、特定の入力内容がそのまま別のユーザーへの回答に使われるわけではありません。
ただし、まったくリスクがないとも言い切れません。学習データの中に同じ表現・パターンが大量・反復して存在した場合、モデルがそのパターンを「極めて高確率で出力するパターン」として収束させてしまうことがあります。これは「メモライゼーション」と呼ばれる現象で、AIが意図的に記憶しているのではなく、統計的に強く焼き付いたパターンが再現されるものです。一般的なビジネス文書の単発入力で発生する可能性は低いですが、同種の機密情報を大量・反復してAIに送り続けるような使い方では注意が必要です。
「学習オフ」は秘密保持・DPAとは別物
「学習に使用しない(学習オフ)」はあくまで技術的な設定であり、法的な秘密保持義務とは全く別の概念です。
学習オフであっても、以下は起こりえます:
- サービス運営者のスタッフによる入力内容の閲覧・品質レビュー
- セキュリティ・不正利用防止目的でのログ保存
- 外部インフラ業者(サブプロセッサー)へのデータ共有
- 利用規約の変更による取扱いの事後的な変更
これに対し、DPA(データ処理契約) はGDPRや個人情報保護法対応のために締結される契約で、個人データの取扱いについて法的な義務を課すものです。また NDA(秘密保持契約) は業務上の機密情報全般の開示・漏洩を法的に禁じるものです。
機密性の高い情報を生成AIで扱う際は、①学習オフの確認、②DPAの締結、③必要に応じNDAの締結、という三層で検討することが実務上望ましいといえます。