ChatGPT、Bing AI Chat、Notion AI、Google Bardのデータ利用ポリシーを調べた

Mar 26, 2023 09:50 · 2733 words · 6 minute read AI ChatGPT

「ChatGPT選手権!エンジニアリングに組み込んでみたらこうなりました LT大会」のアーカイブ動画を見ました。

【再放送】ChatGPT選手権!エンジニアリングに組み込んでみたらこうなりました LT大会 - connpass

各社のChatGPT活用事例が紹介されており、とても興味深い内容でした。 ChatGPTを業務で使うとなると、業務データを入力することになります。

  • ChatGPTに業務データを入力して大丈夫なの?
  • 入力したデータはAIのトレーニングに利用されるの?
  • 入力したデータは保存されるの?
  • Bing AI ChatやNotion AIなどChatGPT以外のサービスではどうなの?

といった点が気になったので、調べた内容をブログに残しておきます。
※2023年3月末の本記事執筆時点の情報です。記事執筆後に情報が更新されている可能性があります。

イベントのアーカイブ動画はYouTubeの限定公開で視聴できます。 Findyに登録すると、イベントページから限定公開のアーカイブ動画を視聴できます。

ハイスキルなエンジニアのプレミアム転職Findy(ファインディ) (findy-code.io)

目次

ChatGPTのデータ利用ポリシー

以下、公式ドキュメントの抜粋です。

  • ChatGPTはAPIを介して送信されたデータはモデルのトレーニングに利用しない
  • 悪用と誤用を監視する目的で、APIを介して送信されたデータを最大で30日間保存する。ただし法律によって定めがある場合は法律に従う
  • 保存したデータにアクセスできるのは許可されたOpenAIの従業員と、機密保持やセキュリティ義務の対象となる外部の専門業者
  • 不正使用の疑いを調査検証する目的でのみデータにアクセスする
  • ChatGPTやDALL-EなどのAPI以外の消費者向け製品については、サービスを改善するために、プロンプト、応答、アップロードされた画像、生成された画像などのコンテンツを使用する場合がある
    • →APIを介さない場合は入力データがトレーニングに使用される可能性がある
    • →Webアプリに入力したデータはトレーニングに使用される可能性がある
  • API以外に入力したデータをオプトアウトしたい場合は、専用のGoogleフォームから連絡する
  • 取得したデータを販売目的で第三者に共有することは無いが、サービス提供に必要な別グループとコンテンツを共有する場合がある

※2023 年3月1日以降の規約です。3月1日より前にAPIに送信されたデータはモデルのトレーニングに使用された可能性があります。

参照URL

Notion AIのデータ利用ポリシー

以下、公式ドキュメントの抜粋です。

  • ユーザーデータはNotionのデータ保護対策(data protection practices)に従って暗号化され、非公開
  • ユーザーデータをモデルのトレーニングに使用することはない
  • Notion AI が動作するために使用される全ての情報は、Notion AI の機能をお客様に提供する目的でのみパートナー企業に共有される
  • パートナーや第三者がユーザーデータをモデルのトレーニングなど、その他の目的で使用することはない。

参照URL

Bing AI Chatのデータ利用ポリシー

公式ドキュメントを見つけられなかったので、BingのChatでAIに聞いてみました。

Q:bing chatに入力したデータはAIの学習データとして活用されるの?

A:いいえ、Bingチャットに入力されたデータは、学習データとして使用されません。 Bingチャットは、ユーザーの質問に回答するために設計されています。 私たちは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 ご安心ください。

Q:このチャットに入力したデータの利用方法と保存期間を教えて

A:Bingチャットに入力されたデータは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 Bingチャットは、ユーザーの質問に回答するために設計されています。 入力されたデータは、回答を提供するために使用され、保存されません。 ご安心ください。

Q:データを保存していないのであれば、例えば不正利用があったときの調査はどうやってすすめるの?

A:Bingチャットに入力されたデータは保存されていないため、不正利用があった場合、調査することはできません。 ただし、Bingチャットは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 ご安心ください。

  • プライバシーを尊重しており、データは保存していない
  • データを保存していないので、何かインシデントがあっても調査することはできない

という回答でした。本当に?
マイクロソフトがプライバシーを尊重しているのは理解できます。 しかし、何かあったときの調査用やサービス改善用に抜かりなくデータを残していそうな気がするのですが・・・🤔

Bing Chatの機能を分解すると、大きく「自然言語処理部分」と「Bing検索エンジン部分」に分けることができます。

  • 自然言語処理部分
    • GPT-4→OpenAIが開発改善する→Bing Chatからのデータはトレーニングデータとして利用しない契約をMicrosoftとOpenAIで結んでいる?
  • Bing検索エンジン部分
    • これまでの検索エンジンと同じ機能→Microsoftが開発改善する

Bing検索エンジン部分を担当しているMicrosoftとしては、トレーニング用のデータを収集蓄積する必要が無いのかもしれません。

Google Bardのデータ利用ポリシー

2023年3月末の記事執筆時点では、まだ日本でBardを利用できません。 しかし、FAQページにはアクセスできたので、データ利用について確認しました。

以下、公式ドキュメントの抜粋です。

  • Bardとやりとりすると、Googleは下記のデータを収集する
    • ユーザーの会話
    • IPアドレスに基づく現在地
    • フィードバック、使用情報
  • データはGoogleのサービスや機械学習の改善に利用する
  • 個人を特定できない状態に加工したデータを最長3年保持する
  • Bardの機能を無効にしたとしても、会話の内容は短期間保持する
  • 会話内容は広告目的では利用しない

参照URL

最後に

ChatGPTを始めとしたAIは、今後どんどん企業活動に利用されるでしょう。 今回調べた各社のデータポリシーを参考にしつつ、便利なものは積極的に使って業務を効率化したいですね。

tweet Share