챗GPT(ChatGPT) 데이터 유출, 학습 데이터 사용, 보안 정책 설명 및 설정 방법
챗GPT(ChatGPT) 사용자 중 데이터 유출, 사용을 걱정하시는 분들에게
웹이나 앱으로 챗GPT를 사용하시거나, GPT-API를 사용하시는 분은, 데이터 유출 또는 학습 데이터로 사용되는 것에 대해 불안, 걱정하시는 분들이 있으실 겁니다.
이번에는 오픈AI의 홈페이지에 나와있는 데이터 정책을 살펴보고, 학습 데이터 사용을 원하지 않는 경우 데이터 동의 옵션을 끄는 방법 대해 알려드리겠습니다.
오픈AI 데이터 정책 살펴보기
OpenAI Docs, OpenAI FAQ, OpenAI 홈페이지에 있는 내용을 알려드립니다.
OpenAI Docs(오픈AI 독스)
링크 : OpenAI Docs 바로가기
먼저 OpenAI Docs에 가시면 데이터 정책에 관한 내용을 보실 수 있습니다.
내용은 다음과 같습니다.
여기서 옵트인(Opt in)은 "내가 자발적으로 오픈AI에 나의 데이터를 학습 데이터로 사용해 주세요"라고 요청하는 겁니다.
즉, 자발적으로 원하는 경우 학습 데이터로 사용되지만 그렇지 않을 경우 사용하지 않는다라고 이해하시면 됩니다.
또한, Docs에서 API 데이터 정책과 관련된 내용이 있습니다.
여기서 API를 사용할 때 모델 훈련을 하지 않겠다고 공지하고 있습니다. (맨 아래에 API 데이터 제어 방법도 있습니다.)
데이터 유출 및 학습 데이터로 사용하는 것에 있어서 안심하라는 뜻인 것 같습니다.
오픈AI 공식 홈페이지
링크 : 오픈AI 공식홈페이지 바로가기
빨간색 박스 안에 있는 내용을 보면, 유료 요금제(ChatGPT Team, ChatGPT Enterprise, API) 사용자의 데이터는 사용하지 않는다고 명시되어 있는 것을 확인할 수 있습니다.
즉, 학습 데이터로 사용하지 않으니, 보안이나 유출과 관련해서 안심하라는 내용입니다.
오픈AI 도움말 센터
링크 : OpenAI Policy FAQ
오픈AI 도움말 센터에서 Policy FAQ에 있는 내용을 보면 다음과 같이 나옵니다.
쉽게 설명하면 다음과 같습니다.
1번: 개인 서비스로 사용할 경우 학습 모델로 사용할 수 있다.
2번: 개인 서비스 이용자 중 학습 모델에 사용을 원하지 않는 경우, 데이터 제어를 통해 거부할 수 있다.
3번: ChatGPT Team, Enterprise, API 서비스를 이용하는 경우 학습 모델로 사용하지 않는다.
즉, 개인 사용자(무료, Plus) 데이터 제어를 "꺼짐"으로 설정하면 학습 데이터로 사용 안 하겠다는 의미입니다.
하지만 "켜짐"으로 설정되어 있을 경우 학습 모델로 사용하겠다 라는 의미입니다.
ChatGPT 웹 버전 - 데이터 제어 설정하기
웹에 들어가시면 우측 상단에 보시면 프로필이 있는데 누르시면 설정 화면이 나옵니다.
이후에 설정 → 데이터 제어 클릭 → 모델 개선 클릭 해제 하시면 됩니다.
전 켜져 있는데, 들어가셔서 꺼주시면 됩니다.
초록색 : 데이터 사용 허용 켜짐
회색 : 데이터 사용 허용 꺼짐
데스크탑 전용 ChatGPT 앱 - 데이터 제어 설정하기
좌측 하단에 프로필 이미지가 있는데 여기서도 설정 들어가셔서 꺼주시면 됩니다.
모바일 ChatGPT 앱 - 데이터 제어 설정하기
모바일 ChatGPT에서 왼쪽 상단에 2개 줄을 누르시면 대화 내역이 나오는데, 맨 아래 프로필을 눌러주시면 데이터 제어 설정 화면이 나옵니다.
여기서 "모든 사용자 대상 모델 개선"을 클릭해 주시면 설정을 끄실 수 있습니다.
ChatGPT 웹, 테스크탑 전용 앱, 모바일 앱 3개 중 편한 거 하나만 설정하시면 나머지는 똑같이 적용되니 됩니다.
GPT API 사용자 - 데이터 제어 설정하기
API도 데이터 제어를 설정할 수 있습니다. OpenAI API 홈페이지에 접속합니다.
1. 우측 상단 프로필 옆에 있는 톱니바퀴 모양의 설정(Settings) 아이콘을 클릭합니다.
2. 왼쪽 탭에서 Data controls를 선택합니다.
3. Sharing 섹션을 클릭합니다.
3. 데이터를 보호하기 위해 아래 설정을 모두 Disabled로 변경하시면 됩니다.
Sharing 섹션의 내용은 다음과 같습니다.
[Submit model feedback from the Platform]
→ Disabled로 설정하여 사용 중 생성된 대화나 피드백이 OpenAI와 공유되지 않도록 합니다.
[Share evaluation data with OpenAI]
→ Disabled로 설정하여 평가 데이터(프롬프트 등)가 OpenAI에 전달되지 않도록 합니다.
[Enable sharing prompts and completions with OpenAI]
→ Disabled로 설정하여 API 요청과 응답 데이터를 OpenAI가 학습 목적으로 사용할 수 없게 만듭니다.
모든 옵션을 Disabled로 설정하면 OpenAI와의 데이터 공유가 완전히 차단됩니다.
추가적으로 Visibility 섹션 설정이라고 것이 있는데, 이건 팀 내부에서 데이터 접근 권한을 관리할 수 있습니다.
원하시는 옵션(비공개, 소유자만, 모두 공개)을 선택하시면 됩니다.
[Threads]
→ Hidden으로 설정하여 Playground 및 Assistants API에서 생성된 데이터가 팀 내에서도 비공개로 유지됩니다.
[Usage dashboard]
→ Visible to organization owners로 설정하여 API 사용량과 비용 데이터를 관리자만 볼 수 있도록 제한합니다.
[Chat Completions]
→ Visible to organization owners로 설정하여 저장된 응답 데이터를 소유자만 확인할 수 있게 합니다.
마무리
사실 이렇게 설정 옵션을 끈다고 해도 찜찜하긴 마찬가지일 겁니다.
사용 안 한다고 하는데, 뒤에서 몰래 사용할 수도 있으니깐...
이런 분들은 LLM 모델 다운받아서 직접 만드시는 방법 외에는 없는 것 같습니다.
댓글