본문 바로가기
메뉴
뉴스레터

‘인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서’ 공개

2024.07.22

개인정보보호위원회(이하 “위원회”)는 2024. 7. 17. ‘인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서’(이하 “안내서”)를 공개하였습니다(링크).
 
안내서는 그 적용대상인 ‘공개된 개인정보’를 누구나 합법적으로 접근 가능한 개인정보로 정의하면서, AI 개발·서비스 시 공개된 개인정보를 수집·이용할 수 있는 근거인 ‘정당한 이익’에 대한 법 해석 기준을 제시하고, AI 기업 등이 AI 학습 및 서비스 단계에서 이행할 수 있는 안전성 확보 기준, 권리주체 권리 보장 방안 및 내부관리체계에 대해 안내하고 있습니다. 안내서의 주요 내용은 다음과 같습니다.
 

1.

'정당한 이익’ 조항의 적용 요건 및 기준

안내서는 개인정보 보호법(이하 “법”)상 ‘정당한 이익’ 조항(법 제15조 제1항 제6호)이 AI 학습·서비스를 위한 공개된 개인정보의 수집, 이용의 실질적인 적법 근거가 될 수 있다고 밝히면서, 개인정보처리자의 정당한 이익이 인정되기 위한 요건과 적용사례를 안내하고 있습니다.
 
정당한 이익 조항의 적용 요건은 다음과 같습니다.
 

(1)

(요건 1) 목적의 정당성

  • 개인정보처리자의 ‘정당한 이익’은 AI 개발자 및 서비스 제공자의 영업상 이익과 그로부터 발생하는 사회적 이익 등 다양한 층위의 이익을 포괄할 수 있음

  • AI 개발자 등은 목적을 최대한 구체적으로 정의하는 것이 바람직함

  • 그 구체성의 정도는 ‘특정목적 AI’인지 ‘범용 AI’인지 여부에 따라 차이가 있을 수 있음

구분

목적의 구체화 정도

특정목적 AI

  • 의도된 목적·용도를 최대한 구체적으로 정의하는 것이 바람직함

  • (예) 문서요약, 번역, 이미지 생성 등

범용 AI

  • 합리적으로 예측가능한 범위에서 AI 시스템의 유형(type), 기능(functionality), 성능(capability) 등을 통해 정당한 이익의 내용을 구체화할 수 있음

 

(2)

(요건 2) 처리의 필요성

  • 필요성은 AI의 구체적인 목적, 용도, 맥락 등을 고려하여 개별적으로 판단됨

  • 처리가 정당한 이익과 상당한 관련이 있고, 합리적인 범위 내의 처리여야 함

  •  AI 개발 목적·용도에 맞는 학습데이터 수집 기준을 사전에 정하고, AI 개발과 상당한 관련성이 없는 정보는 학습에서 제외하는 것이 바람직함
     

(3)

(요건 3) 이익형량

  • 개인정보처리자의 정당한 이익이 정보주체의 권리에 명백히 우선할 것

  • 이익형량 시 이하에서 논의하는 안전성 확보 조치 및 정보주체 권리보장 방안 시행 여부 등이 고려될 수 있음
     

2.

안전성 확보 조치 및 정보주체 권리보장

안내서는 사업자가 비즈니스 특성에 부합하도록 안전조치를 이행할 수 있고, 현 시점에서의 AI의 기술적 특성, 제약요인 등을 고려하면서 정보주체 권리 행사를 실질적으로 지원할 필요가 있다고 밝히고 있습니다. 안내서에 소개된 안전조치 및 권리 보장 방안의 구체적인 내용은 다음과 같으며, 안내서는 모든 안전조치를 도입해야 하는 것은 아니라는 점을 명시하고 있습니다.
 

(1)

기술적 안전조치

구분

구체적 내용

학습데이터 수집 출처 검증·관리

  • 웹사이트 이용약관과 로봇배제표준(robots.txt)을 준수하고 커먼 크롤 등 제3자가 수집한 데이터 집합 이용하는 경우 주요 데이터 출처 목록 확인

  • 위원회와 한국인터넷진흥원이 식별한 특정 도메인 정보(URL)를 AI 학습데이터에서 배제 등

개인정보 유·노출 방지

  • 고유식별정보, 민감정보, 계좌번호, 신용카드정보 등 개인 식별자를 삭제 또는 비식별화

  • 중복제거 데이터셋 이용 또는 중복제거 도구 적용

  • 차분 프라이버시(Differential Privacy) 등 개인정보 보호 강화 기술 적용 등

개인정보의 안전한 저장 및 관리

  • 학습데이터가 유출되거나 이용자 DB 등과 결합되는 것을 방지하기 위해 접근제한 등 안전조치

미세조정을 통한 안전장치 추가

  • 지도학습 기반 미세조정, 사람 피드백 기반 강화학습 등 미세조정 적용

프롬프트 및 출력 필터링 적용

  • 개인 프로파일링 또는 사생활 침해 답변 생성을 유도하는 프롬프트에 대해 답변 생성 거절 또는 미리 정해진 답변 제공 등

  • 출력물에 개인정보가 생성되는 경우 감지·제거하는 필터 기술 적용

학습 결과에서 특정 데이터 삭제

  • 향후 기술 개발 추이에 따라 머신 언러닝(machine unlearning) 등 기술 도입

 

(2)

관리적 안전조치

구분

구체적 내용

학습데이터 처리 기준 정립 및 개인정보 처리방침에 공개

  • 학습데이터 수집·이용 기준(주요 수집 출처, 수집 방법, 안전조치 방안 등 포함)을 개인정보 처리방침, 기술문서, FAQ 등에 공개 등

개인정보 영향평가 수행 고려

  • 학습데이터에 민감한 정보가 포함되어 있을 개연성이 높거나 정보주체 권리·의무에 중대한 영향을 미칠 수 있는 AI 서비스의 경우 특히 영향평가 실시를 고려하는 것이 바람직함

AI 프라이버시 레드팀    

  • 외부 전문가가 포함된 레드팀을 구성·운영하여, 개인정보 침해 유형을 시험·확인 등

오픈소스, API 등 AI 개발·배포 특성에 따른 안전조치

  • (오픈소스 모델) 이용방법과 조건의 범위를 명시한 라이선스 정책 수립·배포, 취약점 발견 시 조치방안 신속하게 강구 및 재배포 등

  • (API 연계를 통한 서비스) API 이용사업자가 개인정보 보호하도록 계약상 의무 부과하고 상세한 사용지침과 기술문서 제공 등

 

(3)

정보주체 권리 보장 방안

구분

구체적 내용

AI 학습데이터 투명성 제고    

  • 공개된 개인정보 수집 사실, 주요 출처, 처리 목적 등을 개인정보 처리방침, 기술문서, FAQ 등에 공개

정보주체 권리 행사 지원

  • 정보주체의 개인정보 열람, 정정·삭제 등 정보주체 권리 행사에 대하여 시간, 비용 기술을 합리적으로 고려한 범위 내에서 보장하도록 노력

 

3.

AI 기업 등의 내부관리체계 마련

위원회는 개인정보보호책임자(CPO)를 중심으로 AI 프라이버시를 담당하는 조직을 구성할 것을 권고하고 있습니다. 안내서는 이러한 조직의 주요 역할로, 개인정보 처리를 위한 법적 근거를 충족하였는지 확인·평가 후 그 근거를 문서화하는 것, 주기적인 리스크 요인 모니터링 및 정보주체 권리 행사의 지원 등을 제시하고 있습니다.
 
위원회는 안내서가 참고할 수 있는 법 해석 기준을 제시한 것으로서 법적 구속력은 없음을 명시하면서 안내서상 개별 조치를 이행하지 않았다고 하여 공개된 개인정보의 처리가 곧바로 위법하게 되는 것은 아니라는 입장을 밝히고 있으나, 공개된 개인정보 처리의 적법성에 대한 입증 책임을 각 사업자가 부담한다는 점 역시 언급하고 있습니다. 안내서가 위원회의 판단 기준을 확인할 수 있는 주요 문서라는 점을 고려할 때 향후 안내서 내용의 적용 사례와 후속 동향 등을 참고하실 필요가 있겠습니다.

 

[영문] The PIPC Releases its “Guideline on Processing Publicly Available Data for AI Development and Services”

공유하기

레이어 닫기

관련 구성원

레이어 닫기

관련 구성원

레이어 닫기