生成AIの「学習に用いない」とはどういう意味ですか？

Question

原 智輝 · Accepted Answer

AIの「学習」とは何か生成AIの「学習」とは、AIが「より良い回答を出せるようになるため」に、大量のデータをもとにモデル内部のパラメータ（設定値）を統計的に調整するプロセスです。入力した文章をそのままどこかに「保存・記憶」するのではなく、無数のデータの傾向を反映してモデル全体を少しずつ最適化していくイメージです。学習されると、入力した情報が他のユーザーに出てくるの？原則として、そのようなことは起きません。学習はあくまで統計的なパラメータ調整であり、特定の入力内容がそのまま別のユーザーへの回答に使われるわけではありません。ただし、まったくリスクがないとも言い切れません。学習データの中に同じ表現・パターンが大量・反復して存在した場合、モデルがそのパターンを「極めて高確率で出力するパターン」として収束させてしまうことがあります。これは「メモライゼーション」と呼ばれる現象で、AIが意図的に記憶しているのではなく、統計的に強く焼き付いたパターンが再現されるものです。一般的なビジネス文書の単発入力で発生する可能性は低いですが、同種の機密情報を大量・反復してAIに送り続けるような使い方では注意が必要です。「学習オフ」は秘密保持・DPAとは別物「学習に使用しない（学習オフ）」はあくまで技術的な設定であり、法的な秘密保持義務とは全く別の概念です。学習オフであっても、以下は起こりえます：サービス運営者のスタッフによる入力内容の閲覧・品質レビューセキュリティ・不正利用防止目的でのログ保存外部インフラ業者（サブプロセッサー）へのデータ共有利用規約の変更による取扱いの事後的な変更これに対し、DPA（データ処理契約） はGDPRや個人情報保護法対応のために締結される契約で、個人データの取扱いについて法的な義務を課すものです。また NDA（秘密保持契約） は業務上の機密情報全般の開示・漏洩を法的に禁じるものです。機密性の高い情報を生成AIで扱う際は、①学習オフの確認、②DPAの締結、③必要に応じNDAの締結、という三層で検討することが実務上望ましいといえます。

生成AIの「学習に用いない」とはどういう意味ですか？

AIの「学習」とは何か

学習されると、入力した情報が他のユーザーに出てくるの？

「学習オフ」は秘密保持・DPAとは別物

関連するQ&A

この記事の内容でお困りですか？

お問い合わせ

お問い合わせ