세계 보안 엑스포  전자정부 솔루션 페어  개인정보보호 페어  국제 사이버 시큐리티 컨퍼런스  세계 태양에너지 엑스포  스마트팩토리  세계 다이어트 엑스포  INFO-CON
개인정보 보호 및 활용 위한 개인정보 비식별조치 시 고려사항
  |  입력 : 2017-08-24 11:15
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
빅데이터 산업 활성화를 추진하는 개인정보 보호와 활용

[보안뉴스=이광우 금융보안원 융합정보팀 차장] 전 세계가 4차 산업혁명에 집중하고 있는 요즘, 우리나라를 비롯하여 미국, 영국 등 주요 선진국들은 경쟁우위를 점하기 위해 전력을 다하고 있는 모양새다. 융합을 기반으로 하는 4차 산업혁명의 원동력 중 하나는 바로 빅데이터라고 할 수 있다.

[이미지=iclickart]


이러한 빅데이터의 이용 수요 급증에 대처하기 위하여 주요 선진국에서는 개인정보 침해 가능성을 최소화하면서 빅데이터 산업 활성화를 추진하는 개인정보 보호와 활용을 동시에 모색하는 정책을 추진해 오고 있다.

이러한 세계적인 정책 변화에 적극 대응하고자 우리나라는 2016년 6월에 개인정보침해를 방지하기 위한 안전장치를 마련하고 비식별된 빅데이터를 각 산업에서 활용할 수 있도록 하기위한 가이드라인으로 ‘개인정보 비식별 조치 가이드라인’을 정부 합동으로 제정·발표했다.

비식별 조치를 통한 데이터 결합·분석한 사례가 나오고 있으나 가이드라인에 대한 찬반 논란, 가이드라인에 대한 이해부족, 재식별에 대한 우려, 법적 효력에 대한 불확실성 등을 이유로 빅데이터의 비식별 조치 및 비식별된 빅데이터의 활용이 활성화되지 못하고 있는 실정이다.

비식별된 빅데이터 활용을 활성화시키기 위해서는 무엇보다도 비식별 조치의 안전성에 대한 우려부터 불식시킬 필요가 있다. 그렇다면 비식별 조치 기술은 안전하게 사용할 만한 기술인가? 일부에서는 해외의 재식별 사례를 들어 가이드라인에 대한 부정적인 입장을 표하고 있지만, 이들 재식별 사례를 좀 더 상세하게 살펴보면 비식별 조치를 통해 개인정보 침해 위험을 최소화하면서 비식별된 빅데이터를 활용할 수 있는 가능성을 발견할 수 있다.

넷플릭스의 재식별 사례를 보자. 온라인 영화대여 회사인 넷플릭스는 고객 기호에 맞는 영화를 추천하는 알고리즘의 정확성을 높이기 위해 2006년에 경연대회를 개최하면서 사용자 이름 등의 식별자를 삭제한 1억 건의 시청 이력 데이터를 공개했다.

이 때 텍사스 대학의 한 그룹이 넷플릭스사가 공개한 시청 이력 데이터와 영화정보 사이트 IMDb(Internet Movie Database)에 공개된 사용자 리뷰를 결합하여 480,189명 중 두 명(0.000004%)이 재식별된 사례이다. 이 두 명은 매우 특이한 영화를 보았으며 영화를 본 날짜까지 넷플릭스의 공개정보에 포함되었는데 이는 적정하게 비식별 조치를 하였다고 볼 수 없다.

일반적으로 비식별 조치 시에는 통계적으로 특이한 값을 가지는 데이터는 재식별 위험이 있으므로 삭제하거나 다른 집합에 포함되어 재식별되지 않도록 조치하는 것을 권고하고 있다. 넷플릭스가 비식별 조치를 보다 신중하고 적정하게 처리하였다면 재식별되지 않았을 가능성이 크다.

이와 같이 지금까지 알려진 대부분 재식별 사례들을 보면, 특별한 조건을 가정하여 재식별 가능성을 주장하고 있지만 넷플릭스 사례와 마찬가지로 비식별 조치가 적정하지 않은 경우이다. 실제 재식별을 가능할 수 있게 하는 정보들은 쉽게 구할 수 있지 않을 뿐만 아니라, 적정하게 비식별 조치를 할 경우 재식별될 확률은 극도로 낮아지게 된다.

의료분야에서 많이 언급되고 있는 미국 세이프하버(Safe Harbor) 방식은 이름, 주소 등 18가지 주요 식별자를 제거하도록 규정하고 있으며 이를 잘 지킬 경우 비식별 조치한 데이터 집합 내에서 한 개인이 재식별될 확률은 0.04%로 추정하고 있다.

우리나라 가이드라인은 단순한 식별자 제거는 물론 프라이버시 모델에 의한 비식별 조치 적정성평가 및 사후관리 기준까지 제시하고 있어 가이드라인에 따라 적정하게 비식별 조치하고 관리한다면 개인정보 노출 위험을 최소화 하면서 빅데이터 분석 등에 활용할 수 있을 것이라 생각된다.

우리나라 가이드라인에서는 개인정보를 안전하게 비식별 조치하기 위해 사전검토, 비식별 조치, 적정성 평가, 사후관리의 4단계 과정을 제시하고 있고, 가이드라인에 따라 개인정보를 비식별 조치하여 빅데이터에 활용할 경우 몇 가지 고려할 사항이 있다.

첫째, 활용 목적에 적합한 데이터를 선정해야 한다. 예를 들어, 비식별 조치 대상 데이터는 기업의 비즈니스 목적을 달성할 수 있는 필요한 데이터만으로 최소화해서 구성하는 것이 좋다. 불필요한 데이터를 포함할 경우 비식별 과정이 복잡해질 뿐만 아니라 재식별 가능성 또한 높아질 수 있기 때문이다. 아울러 활용 목적에 따라 기업 외부 데이터를 포함하여 기업의 비즈니스 목적 등에 더욱 적합한 데이터를 발굴하는 것이 필요하다.

둘째, 원본 데이터에 비식별 조치 기법을 적용할 경우에는 데이터의 특성을 고려한 비식별 조치 기법을 사용하고 데이터 이용도를 최대한 유지하면서 적정한 비식별 조치가 될 수 있도록 해야 한다. 비식별 조치를 과도하게 할 경우 정보손실이 커지게 되고 비식별 조치 수준이 낮을 경우 개인정보 침해 우려로 적정성 평가 시 ‘부적정’ 판정을 받아 다시 처음부터 비식별 조치 작업을 수행해야 할 수도 있다.

이를 방지하기 위해 내부적으로 데이터 분석에 필요한 최소한의 데이터 품질 목표를 정한 후, 이를 유지하면서 비식별 조치가 적정하게 될 수 있도록 처리하는 것이 중요하다. 비식별 조치는 단순한 경우에는 엑셀이나 SQL을 이용해서 수작업으로도 처리 가능하지만, 비식별 조치 기법을 신속하고 다양하게 적용한 후 데이터의 이용도와 비식별 수준에 대한 정보를 가시화해주는 공개용·상용 솔루션도 있으니 이에 대한 활용도 고려해 볼 필요가 있다.

셋째, 적정성 평가를 효율적으로 진행하기 위해서는 비식별 정보에 대해 엄격한 사후관리 대책을 수립하고 이를 기초자료에 충실하게 반영·작성해야 한다. 적정성 평가단계는 개인정보를 보호하기 위한 가장 중요한 과정이라고 할 수 있다. 평가과정에서 가장 이슈가 되는 것은 비식별 조치 수준의 적정성에 대한 이해관계 상충이다. 데이터를 활용하는 입장에서는 데이터의 이용도가 중요하고 적정성을 평가하는 입장에서는 개인정보 보호가 중요하기 때문이다.

따라서 평가과정이 신속하고 원활하게 이루어지기 위해서는 비식별 정보에 대한 사후관리대책을 엄격하게 마련함으로써 개인정보 안전성을 확보하고, 이를 기초자료에 자세하게 작성함으로써 적정성 평가단이 사후관리 대책을 충분히 이해할 수 있도록 하는 것이 무엇보다 중요하다. 예를 들면 다음 사항을 고려할 수 있다.

- 데이터는 활용목적에 맞게 최소화하여 구성
- 데이터 특성을 고려한 비식별 조치 방법 및 비식별 조치 수준의 적정성
- 비식별 정보는 별도 분리된 DB에 저장하고, 최소한의 사용자만 접근 가능하도록 엄격한 접근 제어정책 적용
- 비식별 정보는 목적 달성 후 완전 삭제 조치 등 철저한 사후관리 대책 등


기초자료 작성 항목에 대해서는 가이드라인에 명시되어 있으며, 자세한 작성 요령을 포함한 안내서는 금융보안원 등 개인정보 비식별조치 지원 전문기관의 홈페이지에 게시되어 있으니 이를 활용할 필요가 있다.

4차 산업혁명을 준비하고 국가 경쟁력을 강화하기 위해서는 혁신적인 아이디어 발굴 및 서비스 개발을 위한 빅데이터 활용 전략 수립이 무엇보다 중요하다. 이러한 측면에서 ‘개인정보 비식별조치 가이드라인’은 개인정보를 안전하게 보호하면서 빅데이터 활용을 활성화할 수 있는 구체적인 비식별조치 기준을 제시하고 있기 때문에 그 의의가 크다고 할 수 있다.

가이드라인과 전문기관에서 제공하는 각종 안내서 등에 따라 데이터 이용환경, 데이터 특성, 리스크 분석, 비식별조치 기술 등을 고려해 비식별조치를 적정하게 수행하여 비식별된 빅데이터를 적극 활용한다면 우리나라 빅데이터 산업 활성화 및 4차 산업혁명시대의 국가 경쟁력 제고에 기여할 것으로 기대한다.
[글_ 이광우 금융보안원 융합정보팀 차장]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>



비츠코리아 파워비즈시작 2017년7월3일파워비즈 배너
북한의 사이버 공격이 갈수록 심해지고 있습니다. 해킹 공격이 미사일 공격보다 더 무섭다는 소리도 나올 정도입니다. 정부 차원에서 더 강화된 사이버 보안을 위한 전략을 새롭게 수립해야 한다고 생각하십니까?
아니다. 지금 있는 것만 제대로 해도 충분하다.
그렇다. 단, 미국의 행정명령처럼 장기적인 방향성을 가져야 한다.
그렇다. 단, 지금의 위기상황에 당장 적용할 수 있는 것이어야 한다.
아니다. 민간 차원에서 해결할 수 있어야 한다.
정부 차원의 전략이 얼마나 도움이 될지 잘 모르겠다.
크게 보면 외교 문제다. ‘보안’의 시각으로만 접근해서는 안 된다.
기타(댓글로)