Home > 전체기사 > 외신
[주말판] 현 시점, 딥 러닝에 대해 꼭 알아야 할 것 9
  |  입력 : 2019-02-23 15:49
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
머신 러닝의 하위 분야인 딥 러닝, 비정형 데이터 처리에 능숙
블랙박스가 도입에 큰 문제...하지만 이미 인간보다 뛰어난 면모 증명


[보안뉴스 문가용 기자] 머신 러닝의 하위 분야인 딥 러닝(Deep Learning)에 대한 관심이 높아지고 있다. 시장 조사 기관인 IDC에 의하면 딥 러닝에 대한 기업들의 투자액이 2022년까지 776억 달러 규모로 늘어날 것이라고 한다. 현재의 투자액이 240억 달러 수준이니, 4년 안에 3배 정도로 성장할 거라는 뜻이 된다.

[이미지 = iclickart]


또한 회계법인 PWC는 딥 러닝을 비롯한 여러 인공지능 기술이 2030년까지 세계적으로 15조 7000억 달러 규모로 성장할 것이라고 예측하고 있다. 그러면서 “인공지능 기술의 도입이 본격적으로 가속되는 건 2019년부터일 것”이라고 덧붙이기도 했다.

그러나 전망이 밝은 것만은 아니다. 가트너(Gartner)의 경우, 딥 러닝이 실제로 사용할 만하고 큰 효과를 가지고 있다는 것이 사용자 기업들 사이에서 증명되지 않으면 관심이 뚝 떨어지고 성장에 하락세가 나타나기 시작할 것이라고 경고했다. 그리고 실제로 많은 기업들이 딥 러닝의 적용에 애를 먹고 있다. 그래서 이번 주 주말판에서는 딥 러닝에 대해 알아야 할 것 9가지를 준비했다.

1. 딥 러닝은 복잡한 문제를 해결하는 데에만 적당하다
IT 전문가가 아닌 일반인들이 가장 궁금해 하는 건 “딥 러닝으로 뭘 할 수 있는가?”이다. 새롭게 등장하는 기술들이 다 그렇지만 이 질문에 대한 답을 각자가 찾는 과정에서 기대치가 증폭되고 있다. 물론 딥 러닝은 굉장히 강력한 기술이다. 그러나 딥 러닝이 강력함을 발휘하려면 엄청나게 많은 자원이 투입되어야 한다. 기초적인 데이터 분석 문제를 해결하기 위해 딥 러닝을 사용하는 건 어울리지 않다는 뜻이다.

데이터 과학 플랫폼을 만드는 다타이쿠(Dataiku)는 딥 러닝 기술을 ‘비행기 여행’에 비유한다. “뉴욕에서 파리를 가는 일정이면 비행기를 타는 게 맞겠죠. 그런데 자동차로 다리 하나만 건너면 되는 맨해튼에서 브룩클린에 가는 거라면 비행기를 타는 게 전혀 어울리지 않습니다.”

그러면서 다타이쿠는 “아이스크림을 한 번 산 고객이 다음에도 아이스크림을 살 가능성이 있다는 걸 분석하기 위해 딥 러닝을 사용할 필요는 없다”고 말한다. 소비자들의 특정 소비 패턴이나 구매 성향을 예측하기 위한 모델은 이미 여럿 존재하고 있고, 인간 데이터 분석가들도 꽤나 이런 일에 능숙하다. 구조적 데이터와 관련된 문제, 즉 전통적인 형태의 데이터베이스를 분석하는 데에는 평범한 머신 러닝이 더 적절하다.

딥 러닝은 비정형 데이터를 분석하는 데에 좋은 도구다. 다타이쿠가 드는 예시는 다음과 같다. “페이스북에 올라온 글들 중 가짜뉴스는 어떤 것인가와 같은 문제는 전통적인 데이터 분석 방식으로는 해결이 어렵습니다. 또한 암의 초기 증상을 나타내는 이미지를 골라내는 일도 마찬가지고, 네트워크 트래픽 중에 악성인 것을 골라내는 것도 그렇습니다. 이런 문제들에는 딥 러닝이 힘을 발휘할 수 있습니다.”

2. 딥 러닝은 특성 공학(feature engineering) 문제를 해결한다
딥 러닝은 머신 러닝의 하위 분야에 들어가긴 하지만, 다른 유형의 머신 러닝들과는 차이점을 보인다. 어떤 점에서? 심층 신경망(deep neural network)을 가지고 있다는 점에서 그렇다. 심층 신경망은 데이터셋의 어떤 특성들이 중요한지를 스스로에게 가르쳐줄 수 있는 기능을 가지고 있다.

예를 들어 컴퓨터 비전을 다른 머신 러닝 모델에 적용한다고 하면, 1) 고양이와 개가 어떤 식으로 차이가 나는지를 구분하는 모델을 만들고, 2) 그 모델을 바탕으로 개와 고양이의 차이점을 학습시킨다. 하지만 이게 말이 쉽지, 고양이와 개의 차이를 분명하게 구분해주는 모델을 인간이 직접 구축한다는 건 대단히 힘든 일이다. 사람은 특별한 원리 없이 그 둘을 구분할 수 있지만, 컴퓨터가 보기에는 둘의 공통점이 너무나 많기 때문이다. 다리도 네 개고, 털도 있으며, 발톱도 있고, 꼬리도 있으니 말이다.

그러면 딥 러닝은 이 문제에 어떤 식으로 접근할까? 일단 머신 러닝과 다르게 데이터 과학자들이 모델을 구축할 필요가 없다. 그저 수많은 고양이 그림과 개 그림을 딥 러닝에 학습시키면, 딥 러닝이 스스로 고양이와 개의 차이를 파악해낸다. 물론 시간이 걸리는 일이다. 하루 이틀 사이에 딥 러닝이 고양이와 개를 구분해내지 못한다. 딥 러닝은 정보를 층위별로 처리한다. 1단계에서 배운 것들을 사용해, 2단계에서의 학습에 활용하고, 거기서 나온 결과를 3단계에서의 학습에 적용하는 식으로 진행하는 것이다. 가장 중요한 특성들이 추려질 때까지 이런 행위가 반복된다.

3. 사람들은 ‘블랙박스’를 두려워 한다
위에서 말한 특성 학습 혹은 특성 공학 문제는 딥 러닝의 가장 큰 장점이기도 하지만, 가장 큰 단점이기도 하다. 왜냐하면 아직까지 사람은 딥 러닝 모델이 어떤 원리에 의해 결론에 도달하는지 모르기 때문이다. 문제가 주입되고 결론이 나오는 그 중간 과정에 대해 우리의 지식은 깜깜하고, 그래서 이를 블랙박스라고 부른다.

문제는 사람들이 이해하지 못하는 것에 대해 두려워하고, 불신한다는 것이다. 그래서 딥 러닝이 도출한 결과를 신뢰하지 않으려 한다. 중간 과정을 이해할 수가 없기 때문이다.

그러나 블랙박스를 사람들이 이해할 수 있도록 나타낸다는 건 대단히 어려운 문제다. 딥 러닝이 분석하는 데이터 자체가 매우 복잡하기 때문에, 인간 스스로도 중요한 특성이 뭔지 모르는 상태이기 때문이다. 현재 조직 경영진의 60%가 딥 러닝 사용을 꺼려하는 이유로 “중간 과정이 설명되지 않기 때문”이라고 말하기도 했다.

유럽연합도 이 ‘설명할 수 없다는 특성’에 대해 거리낌을 보이고 있다. 지난 해부터 시행하기 시작한 GDPR에서도 이 부분에 대한 언급이 있을 정도다. GDPR은 “알고리즘에 기초한 결정을 인간이 검토할 권리가 있다”고 명시하고 있다.

4. 딥 러닝 기술은 전이 학습(transfer learning)이 가능하다
배운 것을 어딘가로 옮길 수 있다는 것 역시 딥 러닝의 강점이다. 인간의 학습 과정과 기계의 학습 과정이 비슷하다면, 전이 학습 부분에 있어서 그 특성이 가장 잘 드러난다. 배운 것을 전이한다는 건 어렸을 때 브로콜리를 처음 먹어본 경험을 다른 야채에 적용하는 것과 비슷하다.

예를 들어 한 아이가 브로콜리를 생전 처음으로 맛보았다. 만약 그 경험이 끔찍했다면(그리도 대부분의 아이들에게 그렇다) 그 아이는 그 느낌을 다른 음식들에도 적용하기 시작한다. 그래서 초록색인 음식들을 거부한다. 사실 많은 미취학 아동들이 야채를 잘 먹지 않는 것이 야채에 대한 좋지 않은 첫 경험 때문이다.

딥 러닝 시스템들도 한 가지 문제를 통해서나 데이터셋에서 배운 것을 다른 것에 적용할 줄 안다. 그래서 1주일 동안 컴퓨터 비전을 통해 고양이 식별 방법을 익힌 딥 러닝이라면, 개를 식별하는 방법을 익힐 때 더 짧은 시간을 필요로 한다.

5. 딥 러닝은 로지스틱 회귀(logistic regression)에 뛰어나다
딥 러닝을 조금 공부하다보면 금방 마주치는 용어 중에 로지스틱 회귀가 있다. 통계학을 공부했다면 익숙한 용어일 수도 있다. 로지스틱 회기란 최소 두 개의 변수들이 있는 상황에서 결과를 예측하는 기술 중 하나다. 신장, 무게, 연령, 흡연 이력 등의 변수들이 입력된다면 로지스틱 회귀 모델은 폐암에 걸릴 확률을 계산할 수 있다. 비슷하게, 연령, 자금 사정, 총부채상환비율 등을 통해 돈을 빌려간 사람이 채무를 이행하지 않을 확률도 계산이 가능하다.

물론 로지스틱 회귀만을 위해 딥 러닝을 사용할 필요는 없다. 딥 러닝을 로지스틱 회귀에 활용하는 건 과하다는 의견도 전문가들 사이에서 많이 나오고 있다. 하지만 로지스틱 회귀가 가져다주는 ‘예측’이라는 결과물에 기업의 관심도가 높아짐에 따라 딥 러닝을 여기에 적용하려는 시도도 일어날 것이 분명해 보인다.

6. 딥 러닝 프로젝트 대부분 기울기 하강(gradient descent)과 관련이 있다
딥 러닝 분야에 등장하는 중요한 개념 중 하나로 기울기 하강이라는 게 있다. 가장 이해하기 힘든 개념이기도 하다. 딥 러닝이 가장 자주 사용하는 알고리즘 중 하나로, 예측 오류를 줄이고 모델을 최적화하는 기능을 가지고 있다.

기울기 하강의 배경에 있는 수학 원리는 굉장히 복잡하다. 미적분도 어느 정도 필요로 한다. 그러나 개념 자체는 비교적 간단한 편이다.
1) 기울기 하강을 사용하는 가장 큰 목적은 수학 모델에서의 오류를 줄이는 것이다.
2) 수학 모델에 값을 입력하면서 오류가 얼마나 나오는지 파악한다.
3) 모델을 살짝 바꾸고 계산을 다시 한다.
4) 오류가 얼마나 나오는지 파악하고 2)와 비교한다.
5) 이 과정을 오류가 가장 적게 나올 때까지 반복한다.

7. 딥 러닝은 다양한 형태로 활용되고 존재한다
딥 러닝은 머신 러닝의 하위 분야고, 머신 러닝은 인공지능의 하위 분야다. 그런데 딥 러닝에도 하위 분야들이 존재한다. 다음과 같다.

1) 순방향 신경망(feedforward neural network) : 이미지 인식, 음성 인식
2) 방사형 기초 함수 신경망(radial basis function neural network) : 사이버 보안, 의료 건강, 전력 복구
3) 코호넨 자가조직 신경망(Kohonen self-organizing neural network) : 클러스터와 항목화(의료 건강, 이미지 인식, 음성 인식)
4) 순환 신경망(recurrent neural network) : 텍스트 음성 변환, 텍스트 예측
5) 단위 신경망(modular neural network) : 독립적인 신경망을 여러 개 운영해야 할 때 유용함. 다양한 사용처 있음.
6) 콘볼루션 신경망(convolutional neural network, CNN) : 컴퓨터 비전, 이미지 분류, 신호 처리

8. 콘볼루션 신경망이 가장 보편적인 신경망이다
딥 러닝 신경망에는 여러 유형이 존재하지만 콘볼루션이라고 불리는 CNN이 가장 보편적이다. 특성 학습에 특히나 뛰어나다는 장점을 가지고 있다. 그 이유는 CNN은 두 개의 분명한 층으로 구성되어 있기 때문이다. 하나는 데이터셋으로부터 중요한 특성을 파악해내는 층이고, 두 번째는 새로운 이미지를 기존 데이터와 비교해 가장 잘 맞는 걸 찾아내는 층이다.

CNN은 이미지 분류 및 항목화에 뛰어나다. 그렇다는 건 안면 인식이나 무인 운전과 같은 기술에 강점을 보인다는 뜻이다. 뿐만 아니라 이미지 처리와 관련이 없는 여과 기능도 뛰어나다.

9. 딥 러닝은 다양한 부분에서 인간보다 뛰어난 면모를 보인다
CNN을 비롯한 여러 딥 러닝 신경망들은 인간을 뛰어넘는 기능성을 보여주고 있다. 물론 개나 고양이를 사진만 보고 구분하는 데에는 인간이 뛰어나다. 그러나 암을 초기에 발견하거나 알츠하이머의 징조를 일찍부터 발견하는 데에는 딥 러닝이 인간을 이미 능가하고 있다. 이런 효용성이 계속해서 발견되고 입증된다면 블랙박스에 대한 두려움도 어느 정도 해소될 수 있을 것으로 보인다.

가트너는 “2023년까지 인공지능과 딥 러닝 기술은 데이터 과학에서 가장 보편적으로 사용되는 기술이 될 것”이라고 예측하고 있다. 가트너의 부회장인 알렉산더 린덴(Alexdander Linden)은 “지금 시점에서는 기술에 대한 의심이나 회의적인 시각이 팽배한 것도 사실이지만, 인간에게 유용한 부분이 있다는 게 입증되기만 한다면 매일의 삶속에 인공지능을 활용하는 때가 곧 올 것”이라고 말한다.
[국제부 문가용 기자(globoan@boannews.com)]

Copyrighted 2015. UBM-Tech. 117153:0515BC
<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기


  •  SNS에서도 보안뉴스를 받아보세요!! 
IBM 파워비즈 배너 2019년2월8일~2020년2월7일까지모니터랩 파워비즈 5월 31일까지파워비즈배너 시작 11월6일 20181105-20200131
설문조사
7월 1일부터 주 52시간 근무제가 확대 시행됩니다. 보안종사자로서 여러분의 근무시간은 어느 정도 되시나요?
주 32시간 이하
주 40시간
주 48시간
주 52시간
주 58시간
주 60시간 이상
기타(댓글로)
      

티제이원
PTZ 카메라

인콘
통합관제 / 소방방재

현대틸스
팬틸트 / 카메라

파나소닉코리아
Sevurity Camera / CCTV

시큐인포
CCTV / NVR

한화테크윈
CCTV 카메라 / 영상감시

비전정보통신
IP카메라 / VMS / 폴

대명코퍼레이션
DVR / IP카메라

쿠도커뮤니케이션
스마트 관제 솔루션

하이크비전 코리아
CCTV / IP / NVR

원우이엔지
줌카메라

AVIBILON
영상 보안 / 출입 통제

다후아 코리아
CCTV / DVR

씨앤비텍
통합보안솔루션

지케이테코
출입통제 / 얼굴인식

한국하니웰
CCTV / DVR

이화트론
DVR / IP / CCTV

경인씨엔에스
CCTV / 자동복구장치

테크스피어
손혈관 / 차량하부 검색기

한국씨텍
PTZ CCTV

슈프리마
출입통제 / 얼굴인식

트루엔
IP 카메라

디비시스
CCTV토탈솔루션

에스카
CCTV / 영상개선

엔토스정보통신
DVR / NVR / CCTV

씨오피코리아
CCTV 영상 전송장비

CCTV프랜즈
CCTV

티에스아이솔루션
출입 통제 솔루션

구네보코리아
보안게이트

옵티언스
IR 투광기

디케이솔루션
메트릭스 / 망전송시스템

지와이네트웍스
CCTV 영상분석

KPN
안티버그 카메라

베일리테크
랜섬웨어 방어솔루션

화이트박스로보틱스
CCTV / 카메라

신우테크
팬틸드 / 하우징

네이즈
VMS

케이제이테크
지문 / 얼굴 출입 통제기

혜인에스앤에스
통합보안시스템

셀링스시스템
IP 카메라 / 비디오 서버

사라다
지능형 객체 인식 시스템

두레옵트로닉스
카메라 렌즈

퍼시픽솔루션
IP 카메라 / DVR

이노뎁
VMS

새눈
CCTV 상태관리 솔루션

지에스티엔지니어링
게이트 / 스피드게이트

케이티앤씨
CCTV / 모듈 / 도어락

창우
폴대

수퍼락
출입통제 시스템

일산정밀
CCTV / 부품 / 윈도우

아이엔아이
울타리 침입 감지 시스템

에프에스네트웍스
스피드 돔 카메라

엔클라우드
VMS / 스위치

대산시큐리티
CCTV 폴 / 함체 / 랙

엘림광통신
광전송링크

싸이닉스시스템즈
스피드 돔 카메라

포커스에이치앤에스
지능형 / 카메라

휴컴스
PTZ 카메라 / 줌카메라

인사이트테크놀러지
방폭카메라

유진시스템코리아
팬틸트 / 하우징

카티스
출입통제 / 외곽경비

넷플로우
IP인터폰 / 방송시스템

글로넥스
카드리더 / 데드볼트

세환엠에스
시큐리티 게이트

화인박스
콘트롤박스 / 배전향