데이터 암호화

지난 2008년 2월 국내 최대의 인터넷 경매 전문 사이트인 ‘옥션’에서 1,863만명의 개인정보 유출사고가 일어났다.
이후 2012년 7월 KT 개인정보유출 사고까지 13건의 개인정보 유출사고가 발생하여 총 1억 754만건의 개인 정보가 유출되었고 이는 국내 거주자 대부분 개인정보가 유출되었다는 결론이다.
이런 중요한 개인 정보는 유출이 되면 안되는 중요한 데이터이지만, 개발, 서비스 개발과 같은 특수한 상황에서 어쩔 수 없이 필요한 경우가 있다.
(주)데이터스트림즈에서 수행한 신한 카드 차세대의 새로운 양질의 서비스를 위해 데이터 이행이 필요하였다.
이행 프로그램 개발을 하는 개발자들은 개발된 프로그램을 테스트 할 데이터를 필요로 하였지만, 원본 데이터 사용을 할 수 있는 상황이 아니었다. 또한, 프로그램 테스트를 위해서는 원본 데이터와 유사한 데이터가 필요 하게 되었다. 하지만 일반적인 데이터 암호화에서는 데이터를 특정 문자로 일괄 치환하는 경우가 많아 RI 검증 등 개발자의 테스트에 한계를 가져왔다. 이런 문제를 해결하기 위해 데이터스트림즈에서는 원본 데이터의 길이, 특성을 그대로 가지고 있는 문자로 변환하며 PK 정합성까지 유지 하는 테스트 데이터 생성툴인 TeraTDS를 개발 하게 되었다.

신한카드에서는 TeraTDS(테스트 데이터 보안툴)을 도입하여 개발자들에게 테스트 데이터를 제공하였다. 고객 이름, 주민등록번호 등과 같은 중요한 개인 정보를 원본의 데이터 특성을 유지하여 변환함으로써 개발자들이 보다 정확한 테스트를 할 수 있도록 기여하였다.

데이터 검증

데이터 암호화에서 가장 중요한 요인 중 하나는 암호화 된 데이터의 정합성 검증 이다. 즉, 데이터의 특성을 유지해야 한다는 것이다. 데이터 암호화가 무작위로 되어있을 경우 데이터 사이의 특성이 깨지기 때문에 개발자의 테스트의 한계가 발생한다는 것은 앞서 언급을 하였다. 또한 새로운 데이터가 발생하여 암호화 할 경우 기존 암호화 된 데이터와의 연관관계가 유지되어야 할 것이다.
데이터스트림즈의 테스트 데이터 보안툴(TeraTDS)의 경우 데이터 고유의 특성을 유지하여 암호화 하며, 새로운 데이터가 발생하여도 기존의 암호화 데이터와의 연관관계를 유지할 수 있다. 따라서 원본 데이터간의 조인(Join)이나 기본키(Primary Key)등은 유지되어 실제와 같은 상황에서 테스트 진행을 할 수 있다.

대량으로 테스트 데이터가 만들어 졌을 경우, 이를 검증하기 위해서 TeraTDS 는 검증 방법 또한 제공을 하게 되었다. 예를 들어, 대외기관에서 오는 원장성 자료들의 경우, 주만등록번호와 같은 개인 정보 부분이 그대로 들어 있어, 이러한 데이터들을 활용하여 데이터들을 검증 하려고 하면, 다시한번 암호화를 해 주어야 한다. 이러한 데이터들이 대부분 파일에서 부터 시작 되기 때문에, 알려진 파일 파일 스키마 정보를 그대로 활용 하여 데이터를 암호화 해주는 방법의 검증이 이루어 졌다.
신한 카드에서는 데이터 암호화 이후에 발생하는 데이터들을 신한 카드 ITMS와 연동을 하여서 기존 파일 스키마 정보를 입력 하고, 암호화 할 부분을 입력만 하게 된다면, 이를 토대로 암호화 된 파일을 생성 하게 된다. 이렇게 생성된 암호화 된 외부에서 온 파일들은 기존의 시스템과 연동을 지원하여 데이터 검증을 원활하게 되었다.