Home > 전체기사

[보.알.남] RAID, 훼손 위협으로부터 데이터 안정성 확보하기 위한 분산 전략

  |  입력 : 2022-11-21 16:22
페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기
여러 개 하드디스크에 중복된 데이터 동시 저장, 특정 디스크 훼손시 복구 가능
‘무정지’와 ‘고성능’ 등 사용목적에 따라 구분...동작방식에 따라 7단계로 정의


[보안뉴스 김영명 기자] RAID는 ‘Redundant Array of Inexpensive/Independent Disks’의 약어로 ‘복수의 디스크에 보존해 훼손으로부터 데이터 사용자 신뢰성을 높이는 기술’을 뜻한다. 저장장치(하드디스크 등) 여러 개를 하나로 묶어 고용량, 고성능의 저장장치 한 개와 같은 효과를 얻기 위해 개발한 기법이다.

[이미지 = utoimage]


이렇듯 복수 배열 독립 디스크를 만들기 위해서는 여러 개의 하드디스크에 일부 중복된 데이터를 나눠서 저장해야 한다. 데이터를 분류하는 데는 다양한 방법들이 존재하며, 이 방법을 레벨이라 부르는데, 레벨에 따라 저장장치의 신뢰성을 높이거나 전체 성능을 향상하는 등의 다양한 목적을 만족시킬 수 있다.

RAID는 여러 개의 디스크를 하나로 묶어 하나의 논리적 디스크로 작동하게 하며, 운영체제에 이 디스크가 하나의 디스크처럼 보이게 하는 하드웨어적인 방법과 운영체제 안에서 구현되며 사용자에게 디스크를 하나의 디스크처럼 보이게 하는 소프트웨어적인 방법으로 나뉜다.

저장장치는 소모품으로 보통 5~10년 정도 읽고 쓰기를 수없이 반복하 경우 물리적으로 움직이는 부품이 있는 하드디스크드라이브(HDD)와 전자적으로만 작동하는 SSD(Solid State Drive : 자기디스크가 아닌 반도체 메모리를 내장하고 있는 메모리 저장장치)도 낸드(NAND) 소자가 닳아 읽기/쓰기 속도가 느려지고, 더 악화되면 읽고 기록할 수 없는 부분인 불량섹터가 발생하게 된다.

여러 개의 디스크를 특정한 방법으로 연결해주는 시스템인 RAID는 이렇게 저장장치가 갑자기 불량이 생기거나 인식되지 않는 경우를 대비해 활용할 수 있는 유용한 기법이다.

RAID의 주된 사용 목적은 ‘무정지 구현’과 ‘고성능 구현’으로 나눌 수 있다. 무정지 구현을 우선하면 RAID 1, 고성능 구현을 우선하면 RAID 0으로 정의한다. 또한, RAID 5와 RAID 6은 RAID 0과 RAID 1 사이에서 기능을 적절히 조절한 형태를 의미하며, RAID 10과 RAID 01과 같이 무정지 구현과 고성능 구현을 혼용하는 경우도 있다.

구현방식에 따라 하드웨어, 펌웨어, 소프트웨어로 분류
전 세계 5만명 이상의 IT 스토리지 전문가가 활동하는 비영리 무역협회인 SNIA(Storage Networking Industry Association)에 따르면, RAID는 구현 방식에 따라 △하드웨어 RAID △펌웨어 RAID △소프트웨어 RAID 등 3가지로 나뉘며, 동작 방식에 따라 Level 0부터 Level 6까지 7단계로 구분된다.

먼저 구현방식으로 ‘하드웨어 RAID’는 별도의 RAID 카드를 컴퓨터에 장착해 구현하는 방법으로 속도와 안정성은 모두 뛰어나지만, 별도의 RAID 카드 구매에 따른 비용 부담이 생긴다는 단점이 있다.

두 번째로 ‘펌웨어 RAID’는 하드웨어 RAID와 달리 기능을 간략화한 RAID 칩을 탑재하고 펌웨어로 제어해 구현하는 방법이다. 보통 시스템 구동 전 BIOS 세팅에서 RAID를 구현한다. 이 방식은 기존의 디스크를 가상 디스크가 대체하는 방식으로, 용량이 서로 다른 두 하드웨어를 묶었을 때 남는 공간은 활용하지 못하고 폐기된다는 단점이 있다. 안정성 측면에서도 하드웨어 RAID를 장착하는 것과 비교하면 부실하기 때문에 RAID 1을 제외하면 RAID 어레이가 깨졌을 때 데이터 복구는 불가능하다.

세 번째로 ‘소프트웨어 RAID’는 OS의 디스크 관리 메뉴에서 RAID를 구현하는 방법이다. 소프트웨어 RAID는 OS에서 직접 관리해 다양한 방법으로 RAID를 구성할 수 있으며, 용량이 다른 두 제품이라도 RAID를 구성한 후, 남은 공간에 단일 파티션 또는 또 다른 RAID 어레이를 구성할 수도 있다. 하지만 데이터 안정성 측면에서 장기간 소프트웨어 RAID 방식을 사용하는 것은 추천하지 않는다.

▲RAID 6의 구성체계[이미지=SNIA]


멤버 디스크 사용 개수 늘어날수록 안정성 약화
RAID는 동작 방식에 따라 Level 0~6의 7단계로 구분할 수 있다. RAID 0은 여러 개의 하드디스크를 병렬로 배치해 거대한 하나의 디스크처럼 사용하며, 하드디스크의 수가 N개라면 이론상 입출력 속도 및 저장공간은 N배가 된다. 하지만 멤버 디스크 중 하나만 손상 또는 분실돼도 전체 데이터가 파손되며, 오류검출 기능이 없어 멤버 디스크를 늘릴수록 안정성이 떨어진다.

RAID 1은 각 멤버 디스크에 같은 데이터를 중복으로 기록하기 때문에 멤버 디스크 중 일부가 파괴되더라도 하나만 살아있으면 데이터는 보존되며, 복원도 간단해 서버에서 끊김 없이 지속적으로 서비스를 제공하기 위해 사용된다.

RAID 2~4는 오류정정부호(Error Correcting Code : ECC)를 기록하는 전용의 하드디스크를 이용해 안정성을 확보한다. 하나의 멤버 디스크가 고장 나도 ECC를 이용해 정상적으로 작동이 가능하지만, 추가 연산이 필요해 입출력 속도는 크게 감소된다.

RAID 5는 하나의 멤버 디스크 고장에는 작동이 가능하지만, 두 개 이상의 디스크가 고장나면 데이터는 모두 손실된다. RAID 5는 데이터베이스 서버 등 대규모 용량과 무정지 복구 기능을 동시로 사용해야 하는 환경에서 주로 쓰인다.

RAID 6은 RAID 5가 한 개의 고장까지 허용해 스스로 데이터를 보호하는 반면, RAID 6은 두 개의 하드디스크 고장까지 안전하게 데이터를 보호한다는 장점이 있다. RAID 6는 기본적으로 컨트롤러가 RAID 5보다 비싸고, 멤버 디스크도 최소 4개 이상 확보해야 하기 때문에 초기 구축 비용이 높다. RAID 6는 더욱 높은 가용성이 필요할 때 사용되고 있다.
[김영명 기자(boan@boannews.com)]

<저작권자: 보안뉴스(www.boannews.com) 무단전재-재배포금지>

  •  
  • 0
  • 페이스북 보내기 트위터 보내기 네이버 밴드 보내기 카카오 스토리 보내기 네이버 블로그 보내기

  •  SNS에서도 보안뉴스를 받아보세요!! 
아스트론시큐리티 파워비즈 2023년2월23일 시작 시큐아이 위즈디엔에스 2018
설문조사
오픈AI가 개발한 인공지능 챗봇 챗GPT가 GPT4 버전까지 나오면서 디지털 혁신의 촉매재 역할을 하고 있습니다. 보안 분야에서도 챗GPT로 인해 보안위협이 가속화될 것이라는 전망과 함께 보안업무에 효과적으로 활용된다면 보안대응 역량 향상에도 크게 기여할 것이라는 의견도 제기됩니다. 이에 대한 여러분들의 생각은 어떠신가요?
챗GPT 악용으로 인해 보안위협이 더욱 고도화되고 증가할 것
챗GPT를 악용하는데 한계가 있어 보안위협이 소폭 늘어나는 추세에 그칠 것
챗GPT 활용에 따라 보안대응 업무에 적지 않은 도움이 될 것
챗GPT의 적극적인 도입 및 적용 통해 보안대응 역량이 획기적으로 향상될 것
보안위협 또는 보안대응과 관련해서는 큰 영향이 없을 것
기타(댓글로)