[주말판] 현 시점, 딥 러닝에 대해 꼭 알아야 할 것 9

머신 러닝의 하위 분야인 딥 러닝, 비정형 데이터 처리에 능숙
블랙박스가 도입에 큰 문제...하지만 이미 인간보다 뛰어난 면모 증명

[보안뉴스 문가용 기자] 머신 러닝의 하위 분야인 딥 러닝(Deep Learning)에 대한 관심이 높아지고 있다. 시장 조사 기관인 IDC에 의하면 딥 러닝에 대한 기업들의 투자액이 2022년까지 776억 달러 규모로 늘어날 것이라고 한다. 현재의 투자액이 240억 달러 수준이니, 4년 안에 3배 정도로 성장할 거라는 뜻이 된다.

[이미지 = iclickart]

또한 회계법인 PWC는 딥 러닝을 비롯한 여러 인공지능 기술이 2030년까지 세계적으로 15조 7000억 달러 규모로 성장할 것이라고 예측하고 있다. 그러면서 “인공지능 기술의 도입이 본격적으로 가속되는 건 2019년부터일 것”이라고 덧붙이기도 했다.

그러나 전망이 밝은 것만은 아니다. 가트너(Gartner)의 경우, 딥 러닝이 실제로 사용할 만하고 큰 효과를 가지고 있다는 것이 사용자 기업들 사이에서 증명되지 않으면 관심이 뚝 떨어지고 성장에 하락세가 나타나기 시작할 것이라고 경고했다. 그리고 실제로 많은 기업들이 딥 러닝의 적용에 애를 먹고 있다. 그래서 이번 주 주말판에서는 딥 러닝에 대해 알아야 할 것 9가지를 준비했다.

1. 딥 러닝은 복잡한 문제를 해결하는 데에만 적당하다
IT 전문가가 아닌 일반인들이 가장 궁금해 하는 건 “딥 러닝으로 뭘 할 수 있는가?”이다. 새롭게 등장하는 기술들이 다 그렇지만 이 질문에 대한 답을 각자가 찾는 과정에서 기대치가 증폭되고 있다. 물론 딥 러닝은 굉장히 강력한 기술이다. 그러나 딥 러닝이 강력함을 발휘하려면 엄청나게 많은 자원이 투입되어야 한다. 기초적인 데이터 분석 문제를 해결하기 위해 딥 러닝을 사용하는 건 어울리지 않다는 뜻이다.

데이터 과학 플랫폼을 만드는 다타이쿠(Dataiku)는 딥 러닝 기술을 ‘비행기 여행’에 비유한다. “뉴욕에서 파리를 가는 일정이면 비행기를 타는 게 맞겠죠. 그런데 자동차로 다리 하나만 건너면 되는 맨해튼에서 브룩클린에 가는 거라면 비행기를 타는 게 전혀 어울리지 않습니다.”

그러면서 다타이쿠는 “아이스크림을 한 번 산 고객이 다음에도 아이스크림을 살 가능성이 있다는 걸 분석하기 위해 딥 러닝을 사용할 필요는 없다”고 말한다. 소비자들의 특정 소비 패턴이나 구매 성향을 예측하기 위한 모델은 이미 여럿 존재하고 있고, 인간 데이터 분석가들도 꽤나 이런 일에 능숙하다. 구조적 데이터와 관련된 문제, 즉 전통적인 형태의 데이터베이스를 분석하는 데에는 평범한 머신 러닝이 더 적절하다.

딥 러닝은 비정형 데이터를 분석하는 데에 좋은 도구다. 다타이쿠가 드는 예시는 다음과 같다. “페이스북에 올라온 글들 중 가짜뉴스는 어떤 것인가와 같은 문제는 전통적인 데이터 분석 방식으로는 해결이 어렵습니다. 또한 암의 초기 증상을 나타내는 이미지를 골라내는 일도 마찬가지고, 네트워크 트래픽 중에 악성인 것을 골라내는 것도 그렇습니다. 이런 문제들에는 딥 러닝이 힘을 발휘할 수 있습니다.”

2. 딥 러닝은 특성 공학(feature engineering) 문제를 해결한다
딥 러닝은 머신 러닝의 하위 분야에 들어가긴 하지만, 다른 유형의 머신 러닝들과는 차이점을 보인다. 어떤 점에서? 심층 신경망(deep neural network)을 가지고 있다는 점에서 그렇다. 심층 신경망은 데이터셋의 어떤 특성들이 중요한지를 스스로에게 가르쳐줄 수 있는 기능을 가지고 있다.

예를 들어 컴퓨터 비전을 다른 머신 러닝 모델에 적용한다고 하면, 1) 고양이와 개가 어떤 식으로 차이가 나는지를 구분하는 모델을 만들고, 2) 그 모델을 바탕으로 개와 고양이의 차이점을 학습시킨다. 하지만 이게 말이 쉽지, 고양이와 개의 차이를 분명하게 구분해주는 모델을 인간이 직접 구축한다는 건 대단히 힘든 일이다. 사람은 특별한 원리 없이 그 둘을 구분할 수 있지만, 컴퓨터가 보기에는 둘의 공통점이 너무나 많기 때문이다. 다리도 네 개고, 털도 있으며, 발톱도 있고, 꼬리도 있으니 말이다.

그러면 딥 러닝은 이 문제에 어떤 식으로 접근할까? 일단 머신 러닝과 다르게 데이터 과학자들이 모델을 구축할 필요가 없다. 그저 수많은 고양이 그림과 개 그림을 딥 러닝에 학습시키면, 딥 러닝이 스스로 고양이와 개의 차이를 파악해낸다. 물론 시간이 걸리는 일이다. 하루 이틀 사이에 딥 러닝이 고양이와 개를 구분해내지 못한다. 딥 러닝은 정보를 층위별로 처리한다. 1단계에서 배운 것들을 사용해, 2단계에서의 학습에 활용하고, 거기서 나온 결과를 3단계에서의 학습에 적용하는 식으로 진행하는 것이다. 가장 중요한 특성들이 추려질 때까지 이런 행위가 반복된다.

3. 사람들은 ‘블랙박스’를 두려워 한다
위에서 말한 특성 학습 혹은 특성 공학 문제는 딥 러닝의 가장 큰 장점이기도 하지만, 가장 큰 단점이기도 하다. 왜냐하면 아직까지 사람은 딥 러닝 모델이 어떤 원리에 의해 결론에 도달하는지 모르기 때문이다. 문제가 주입되고 결론이 나오는 그 중간 과정에 대해 우리의 지식은 깜깜하고, 그래서 이를 블랙박스라고 부른다.

문제는 사람들이 이해하지 못하는 것에 대해 두려워하고, 불신한다는 것이다. 그래서 딥 러닝이 도출한 결과를 신뢰하지 않으려 한다. 중간 과정을 이해할 수가 없기 때문이다.

그러나 블랙박스를 사람들이 이해할 수 있도록 나타낸다는 건 대단히 어려운 문제다. 딥 러닝이 분석하는 데이터 자체가 매우 복잡하기 때문에, 인간 스스로도 중요한 특성이 뭔지 모르는 상태이기 때문이다. 현재 조직 경영진의 60%가 딥 러닝 사용을 꺼려하는 이유로 “중간 과정이 설명되지 않기 때문”이라고 말하기도 했다.

유럽연합도 이 ‘설명할 수 없다는 특성’에 대해 거리낌을 보이고 있다. 지난 해부터 시행하기 시작한 GDPR에서도 이 부분에 대한 언급이 있을 정도다. GDPR은 “알고리즘에 기초한 결정을 인간이 검토할 권리가 있다”고 명시하고 있다.

4. 딥 러닝 기술은 전이 학습(transfer learning)이 가능하다
배운 것을 어딘가로 옮길 수 있다는 것 역시 딥 러닝의 강점이다. 인간의 학습 과정과 기계의 학습 과정이 비슷하다면, 전이 학습 부분에 있어서 그 특성이 가장 잘 드러난다. 배운 것을 전이한다는 건 어렸을 때 브로콜리를 처음 먹어본 경험을 다른 야채에 적용하는 것과 비슷하다.

예를 들어 한 아이가 브로콜리를 생전 처음으로 맛보았다. 만약 그 경험이 끔찍했다면(그리도 대부분의 아이들에게 그렇다) 그 아이는 그 느낌을 다른 음식들에도 적용하기 시작한다. 그래서 초록색인 음식들을 거부한다. 사실 많은 미취학 아동들이 야채를 잘 먹지 않는 것이 야채에 대한 좋지 않은 첫 경험 때문이다.

딥 러닝 시스템들도 한 가지 문제를 통해서나 데이터셋에서 배운 것을 다른 것에 적용할 줄 안다. 그래서 1주일 동안 컴퓨터 비전을 통해 고양이 식별 방법을 익힌 딥 러닝이라면, 개를 식별하는 방법을 익힐 때 더 짧은 시간을 필요로 한다.

5. 딥 러닝은 로지스틱 회귀(logistic regression)에 뛰어나다
딥 러닝을 조금 공부하다보면 금방 마주치는 용어 중에 로지스틱 회귀가 있다. 통계학을 공부했다면 익숙한 용어일 수도 있다. 로지스틱 회기란 최소 두 개의 변수들이 있는 상황에서 결과를 예측하는 기술 중 하나다. 신장, 무게, 연령, 흡연 이력 등의 변수들이 입력된다면 로지스틱 회귀 모델은 폐암에 걸릴 확률을 계산할 수 있다. 비슷하게, 연령, 자금 사정, 총부채상환비율 등을 통해 돈을 빌려간 사람이 채무를 이행하지 않을 확률도 계산이 가능하다.

물론 로지스틱 회귀만을 위해 딥 러닝을 사용할 필요는 없다. 딥 러닝을 로지스틱 회귀에 활용하는 건 과하다는 의견도 전문가들 사이에서 많이 나오고 있다. 하지만 로지스틱 회귀가 가져다주는 ‘예측’이라는 결과물에 기업의 관심도가 높아짐에 따라 딥 러닝을 여기에 적용하려는 시도도 일어날 것이 분명해 보인다.

6. 딥 러닝 프로젝트 대부분 기울기 하강(gradient descent)과 관련이 있다
딥 러닝 분야에 등장하는 중요한 개념 중 하나로 기울기 하강이라는 게 있다. 가장 이해하기 힘든 개념이기도 하다. 딥 러닝이 가장 자주 사용하는 알고리즘 중 하나로, 예측 오류를 줄이고 모델을 최적화하는 기능을 가지고 있다.

기울기 하강의 배경에 있는 수학 원리는 굉장히 복잡하다. 미적분도 어느 정도 필요로 한다. 그러나 개념 자체는 비교적 간단한 편이다.
1) 기울기 하강을 사용하는 가장 큰 목적은 수학 모델에서의 오류를 줄이는 것이다.
2) 수학 모델에 값을 입력하면서 오류가 얼마나 나오는지 파악한다.
3) 모델을 살짝 바꾸고 계산을 다시 한다.
4) 오류가 얼마나 나오는지 파악하고 2)와 비교한다.
5) 이 과정을 오류가 가장 적게 나올 때까지 반복한다.

7. 딥 러닝은 다양한 형태로 활용되고 존재한다
딥 러닝은 머신 러닝의 하위 분야고, 머신 러닝은 인공지능의 하위 분야다. 그런데 딥 러닝에도 하위 분야들이 존재한다. 다음과 같다.

1) 순방향 신경망(feedforward neural network) : 이미지 인식, 음성 인식
2) 방사형 기초 함수 신경망(radial basis function neural network) : 사이버 보안, 의료 건강, 전력 복구
3) 코호넨 자가조직 신경망(Kohonen self-organizing neural network) : 클러스터와 항목화(의료 건강, 이미지 인식, 음성 인식)
4) 순환 신경망(recurrent neural network) : 텍스트 음성 변환, 텍스트 예측
5) 단위 신경망(modular neural network) : 독립적인 신경망을 여러 개 운영해야 할 때 유용함. 다양한 사용처 있음.
6) 콘볼루션 신경망(convolutional neural network, CNN) : 컴퓨터 비전, 이미지 분류, 신호 처리

8. 콘볼루션 신경망이 가장 보편적인 신경망이다
딥 러닝 신경망에는 여러 유형이 존재하지만 콘볼루션이라고 불리는 CNN이 가장 보편적이다. 특성 학습에 특히나 뛰어나다는 장점을 가지고 있다. 그 이유는 CNN은 두 개의 분명한 층으로 구성되어 있기 때문이다. 하나는 데이터셋으로부터 중요한 특성을 파악해내는 층이고, 두 번째는 새로운 이미지를 기존 데이터와 비교해 가장 잘 맞는 걸 찾아내는 층이다.

CNN은 이미지 분류 및 항목화에 뛰어나다. 그렇다는 건 안면 인식이나 무인 운전과 같은 기술에 강점을 보인다는 뜻이다. 뿐만 아니라 이미지 처리와 관련이 없는 여과 기능도 뛰어나다.

9. 딥 러닝은 다양한 부분에서 인간보다 뛰어난 면모를 보인다
CNN을 비롯한 여러 딥 러닝 신경망들은 인간을 뛰어넘는 기능성을 보여주고 있다. 물론 개나 고양이를 사진만 보고 구분하는 데에는 인간이 뛰어나다. 그러나 암을 초기에 발견하거나 알츠하이머의 징조를 일찍부터 발견하는 데에는 딥 러닝이 인간을 이미 능가하고 있다. 이런 효용성이 계속해서 발견되고 입증된다면 블랙박스에 대한 두려움도 어느 정도 해소될 수 있을 것으로 보인다.

가트너는 “2023년까지 인공지능과 딥 러닝 기술은 데이터 과학에서 가장 보편적으로 사용되는 기술이 될 것”이라고 예측하고 있다. 가트너의 부회장인 알렉산더 린덴(Alexdander Linden)은 “지금 시점에서는 기술에 대한 의심이나 회의적인 시각이 팽배한 것도 사실이지만, 인간에게 유용한 부분이 있다는 게 입증되기만 한다면 매일의 삶속에 인공지능을 활용하는 때가 곧 올 것”이라고 말한다.
[국제부 문가용 기자(globoan@boannews.com)]

SK텔레콤 해킹 사태로 최근 잇슈가 되고 있는 ‘BPF도어’ 관련, 어떤 솔루션을 사용중인가요?
	안랩 V3 Net for Linux
	소만사 Server-i
	파이오링크 점검 도구
	잉카인터넷 전용 백신
	트렌드 마이크로 백신
	기타 국산(솔루션명은 댓글로)
	기타 외산(솔루션명은 댓글로)
	사용하지 않는다