데이터 분석을 위해서는 그에 적합한 데이터가 필요하며, 이를 확보하기 위해서는 충분한 데이터 전처리(Data Preparation) 과정이 필수적이다. 그러나 국내에서는 데이터 전처리를 데이터 분석 과정의 일부로 여길 뿐, 별도의 기술과 솔루션이 필요하다는 점에 대해서는 인식이 부족한 실정이다.
쓰레기를 넣으면 쓰레기가 나온다(garbage in, garbage out)는 것은 데이터 분석의 기본 전제다.
국내에서 전문적으로 데이터 전처리 기술을 제공하는 기업과 BI솔루션을 제공하는 기업을 대상으로 데이터 전처리에 대해 알아봤다.