Home > 전체기사
한국 사람의 말과 감성을 이해하는 똑똑한 AI 시대 앞당긴다
  |  입력 : 2019-06-16 14:59
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기
NIA, 한국어 음성·대화·복합 영상 데이터 250만개 개방

[보안뉴스 박미영 기자] 한국 사람의 감정에 대한 영상 정보, 한국어의 자연스러운 발성 정보를 담고 있는 인공지능(AI)용 데이터가 개방된다. 이번 데이터 개방이 인공지능 기술의 활용 스펙트럼을 넓히고, 관련 AI 서비스의 상용화를 촉진하는 계기가 될 것으로 전망된다.

한국정보화진흥원(이하 NIA)은 금년 6월 250만개의 인공지능 학습용 데이터를 공개했다.

공개되는 데이터는 △감정·상황·대화 내용을 담고 있는 복합 영상 데이터 △자연스러운 한국어 대화 음성 데이터 △한국어 챗봇용 대화 및 시나리오 데이터 △한국어 기계 독해 데이터 4종이다. 데이터는 NIA가 운영하는 AI허브에서 간단한 회원 가입을 통해 누구나 내려받아 사용할 수 있다.

‘데이터의 확보가 AI 경쟁력’이지만 대다수의 중소·벤처·스타트업은 많은 비용과 시간이 소요되는 데이터 구축에 어려움을 겪고 있다. 따라서 ‘인공지능 데이터 구축·공개 사업’은 AI 시장에 막 진입하고자 하는 신생 기업들에게 특히 매력도가 높은 사업이다.

NIA는 2017년부터 법률·특허·일반상식·한국형 이미지 4종의 데이터셋 구축을 시작해 2019년 1월에는 관광·농업·헬스케어 등 7종을 개방했고, 6월에 한국어 음성 등 4종을 추가 개방했다.

금년 말에는 한-영 번역 말뭉치, 한국형 사물이미지, 한글 글 자체 이미지, 이상행동 영상 등 10종 2,500만여건의 데이터셋을 대량 공개할 예정이다.

또한 국가 R&D 과제인 지능정보 플래그십 사업 등을 통해 만들어진 인공지능 학습용 데이터 다수를 금년 7월 AI허브에 공개할 예정이다. 지능정보 플래그십 사업은 음성·언어·영상 등 다양한 정보를 복합적으로 학습해 사람과 상호 작용하는 대화형 에이전트 기술 및 서비스를 개발하는 AI 분야 연구개발(R&D) 사업이다.

NIA 문용식 원장은 “인공지능 제품과 서비스가 활발히 개발되고 출시될 수 있도록 수요에 꼭 맞는 데이터셋을 대량 구축·공개해 국내 인공지능 산업과 시장의 경쟁력을 강화하는 데 역량을 집중하겠다”고 밝혔다.
[박미영 기자(mypark@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기


  •  SNS에서도 보안뉴스를 받아보세요!! 
넷앤드 파워비즈 진행 2020년1월8일 시작~2021년 1월8일까지위즈디엔에스 2018파워비즈배너 시작 11월6일 20181105-20200131
설문조사
코로나19 사태로 인해 화상회의, 원격교육 등을 위한 협업 솔루션이 부상하고 있습니다. 현재 귀사에서 사용하고 있는 협업 솔루션은 무엇인가요?
마이크로소프트의 팀즈(Teams)
시스코시스템즈의 웹엑스(Webex)
구글의 행아웃 미트(Meet)
줌인터내셔녈의 줌(Zoom)
슬랙의 슬랙(Slack)
NHN의 두레이(Dooray)
이스트소프트의 팀업(TeamUP)
토스랩의 잔디(JANDI)
기타(댓글로)