ChatGPT、Bing AI Chat、Notion AI、Google Bardのデータ利用ポリシーを調べた
Mar 26, 2023 09:50 · 2733 words · 6 minute read
「ChatGPT選手権!エンジニアリングに組み込んでみたらこうなりました LT大会」のアーカイブ動画を見ました。
【再放送】ChatGPT選手権!エンジニアリングに組み込んでみたらこうなりました LT大会 - connpass
各社のChatGPT活用事例が紹介されており、とても興味深い内容でした。 ChatGPTを業務で使うとなると、業務データを入力することになります。
- ChatGPTに業務データを入力して大丈夫なの?
- 入力したデータはAIのトレーニングに利用されるの?
- 入力したデータは保存されるの?
- Bing AI ChatやNotion AIなどChatGPT以外のサービスではどうなの?
といった点が気になったので、調べた内容をブログに残しておきます。
※2023年3月末の本記事執筆時点の情報です。記事執筆後に情報が更新されている可能性があります。
イベントのアーカイブ動画はYouTubeの限定公開で視聴できます。 Findyに登録すると、イベントページから限定公開のアーカイブ動画を視聴できます。
ハイスキルなエンジニアのプレミアム転職Findy(ファインディ) (findy-code.io)
目次
ChatGPTのデータ利用ポリシー
以下、公式ドキュメントの抜粋です。
- ChatGPTはAPIを介して送信されたデータはモデルのトレーニングに利用しない
- 悪用と誤用を監視する目的で、APIを介して送信されたデータを最大で30日間保存する。ただし法律によって定めがある場合は法律に従う
- 保存したデータにアクセスできるのは許可されたOpenAIの従業員と、機密保持やセキュリティ義務の対象となる外部の専門業者
- 不正使用の疑いを調査検証する目的でのみデータにアクセスする
- ChatGPTやDALL-EなどのAPI以外の消費者向け製品については、サービスを改善するために、プロンプト、応答、アップロードされた画像、生成された画像などのコンテンツを使用する場合がある
- →APIを介さない場合は入力データがトレーニングに使用される可能性がある
- →Webアプリに入力したデータはトレーニングに使用される可能性がある
- API以外に入力したデータをオプトアウトしたい場合は、専用のGoogleフォームから連絡する
- 取得したデータを販売目的で第三者に共有することは無いが、サービス提供に必要な別グループとコンテンツを共有する場合がある
※2023 年3月1日以降の規約です。3月1日より前にAPIに送信されたデータはモデルのトレーニングに使用された可能性があります。
参照URL
- API data usage policies (openai.com)
- ChatGPT APIリリースに伴ってOpenAIのAPIデータ利用ポリシーが改定されたので読んでみた | DevelopersIO
- Data usage for consumer services FAQ | OpenAI Help Center
Notion AIのデータ利用ポリシー
以下、公式ドキュメントの抜粋です。
- ユーザーデータはNotionのデータ保護対策(data protection practices)に従って暗号化され、非公開
- ユーザーデータをモデルのトレーニングに使用することはない
- Notion AI が動作するために使用される全ての情報は、Notion AI の機能をお客様に提供する目的でのみパートナー企業に共有される
- パートナーや第三者がユーザーデータをモデルのトレーニングなど、その他の目的で使用することはない。
参照URL
Bing AI Chatのデータ利用ポリシー
公式ドキュメントを見つけられなかったので、BingのChatでAIに聞いてみました。
Q:bing chatに入力したデータはAIの学習データとして活用されるの?
A:いいえ、Bingチャットに入力されたデータは、学習データとして使用されません。 Bingチャットは、ユーザーの質問に回答するために設計されています。 私たちは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 ご安心ください。
Q:このチャットに入力したデータの利用方法と保存期間を教えて
A:Bingチャットに入力されたデータは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 Bingチャットは、ユーザーの質問に回答するために設計されています。 入力されたデータは、回答を提供するために使用され、保存されません。 ご安心ください。
Q:データを保存していないのであれば、例えば不正利用があったときの調査はどうやってすすめるの?
A:Bingチャットに入力されたデータは保存されていないため、不正利用があった場合、調査することはできません。 ただし、Bingチャットは、ユーザーのプライバシーを尊重し、個人情報を収集しないようにしています。 ご安心ください。
- プライバシーを尊重しており、データは保存していない
- データを保存していないので、何かインシデントがあっても調査することはできない
という回答でした。本当に?
マイクロソフトがプライバシーを尊重しているのは理解できます。
しかし、何かあったときの調査用やサービス改善用に抜かりなくデータを残していそうな気がするのですが・・・🤔
Bing Chatの機能を分解すると、大きく「自然言語処理部分」と「Bing検索エンジン部分」に分けることができます。
- 自然言語処理部分
- GPT-4→OpenAIが開発改善する→Bing Chatからのデータはトレーニングデータとして利用しない契約をMicrosoftとOpenAIで結んでいる?
- Bing検索エンジン部分
- これまでの検索エンジンと同じ機能→Microsoftが開発改善する
Bing検索エンジン部分を担当しているMicrosoftとしては、トレーニング用のデータを収集蓄積する必要が無いのかもしれません。
Google Bardのデータ利用ポリシー
2023年3月末の記事執筆時点では、まだ日本でBardを利用できません。 しかし、FAQページにはアクセスできたので、データ利用について確認しました。
以下、公式ドキュメントの抜粋です。
- Bardとやりとりすると、Googleは下記のデータを収集する
- ユーザーの会話
- IPアドレスに基づく現在地
- フィードバック、使用情報
- データはGoogleのサービスや機械学習の改善に利用する
- 個人を特定できない状態に加工したデータを最長3年保持する
- Bardの機能を無効にしたとしても、会話の内容は短期間保持する
- 会話内容は広告目的では利用しない
参照URL
最後に
ChatGPTを始めとしたAIは、今後どんどん企業活動に利用されるでしょう。 今回調べた各社のデータポリシーを参考にしつつ、便利なものは積極的に使って業務を効率化したいですね。