Database of Things

 

 

사물인터넷(IoT)는 수많은 장치들이 각각 인터넷을 통하여 데이터를 전달하고, 수신하고, 처리하는 것을 말한다.  장치들은 센서, 디지털로 제어되는 구동기(actuator)와 이동 객체의 통신단말 등을 모두 포함한다. 이러한 장치들의 데이터를 수집, 가공, 분석하여 여러가지 정보를 도출하고, 이 정보들을 이용하여 새로운 부가가치를 창출하는 것이 4차 산업 시대의 새로운 흐름이다. 

다만, 사물 인터넷 데이터는 기존의 데이터와 다른 특성들을 갖고 있으면서 대량의 데이터가 발생하기 때문에 기존의 데이터 처리 솔류션으로 처리하기가 어려운 점이 많다.

이 문서에서는 사물 인터넷 데이터의 종류와 특징을 살펴보고, 사물 인터넷 데이터를 처리하기 위해서 극복해야 할 과제에 대해서 기술한다.

 

 

사물 인터넷 데이터의 종류와 특징

 

사물 인터넷은 한때 RFID만을 가리키는 용어였으나 이후 통신 및 컴퓨팅 기술의 발달로, 더욱 다양한 종류의 데이터가 사물 인터넷 데이터에 포함되었다. 다양한 종류의 사물 인터넷 데이터의 특성을 살펴보자

 

 

RFID(Radio Frequency Identification)

(Image source: https://www.flickr.com/photos/christiaancolen/21845323893)

 

RFID는 전파로 기록된 정보를 송수신하는 tag로 장비에 붙여두거나 장비 내에 포함시킬 수 있다. RFID tag는 데이터를 저장하는 IC chip과 데이터를 송수신하는 안테나로 구성된다. Tag의 데이터는 tag reader를 이용하여 무선으로 통신한다. 

RFID는 매우 다양한 분야에서 활용중이다. 예를 들면 여권이나 휴대전화, 물류 관리, 재고 관리, 헬스케어 등의 분야 등이다. Tag 가격이 대량생산되어 매우 싸기 때문에 수많은 분야에서 사용되고 있지만, 유통 분야에서는 bar code에 비해서 아직 비싸므로 bar code를 완전히 대체하지는 못 하고 있다.  RFID를 물류 등의 용도로 사용할 경우, tag의 위치정보, 시간 정보가 기록되어 tag의 시계열 이동 궤적을 추적할 수 있게 된다.

RFID의 보안상 문제점은 그 장치의 소유자나 운반자가 알지 못하는 사이에 장치의 데이터를 읽을 수 있다는 점이다.

 

 

Log Data

machbase database code

 

수많은 소프트웨어 및 하드웨어가 생성시키는 로그 데이터는 장치와 소프트웨어를 관리하는 데 있어 매우 중요한 역할을 수행한다. 하지만, 이 데이터들은 텍스트 형태로 생성되어 일정 용량이 되면 자동으로 삭제되도록 구성되어 있기 때문에, 장기간의 데이터를 수집하여 분석하기 위해서는 다른 방식의 접근이 필요하게 되었다.

로그 데이터는 일반적으로 로그의 생성 시점을 반드시 기록하고, 입력된 메시지 내용으로부터 다양한 정보(ip address, mac address 등의 id 정보, 시스템 사용량 및 부하 정보, 온도 및 습도 등 환경 정보 등)를 포함하고 있으며, 정형 데이터가 아니어서 관계형 DBMS의 스키마로 나타내기 위해서는 로그 메시지의 파싱 등의 변환 과정이 필요하다.

로그 데이터는 생성하는 프로그램에 따라 여러가지의 format으로 기록되므로 처리하기에 쉽지 않은 측면이 있다.

 

위치 및 환경 데이터

(Image source:  http://www.noaanews.noaa.gov/stories2006/images/now-coast-capture-03-14-2006b.jpg )

 

RFID의 예에서 볼 수 있듯이 이동객체 데이터 및 기상 환경 데이터는 그 데이터가 발생한 곳의 위치 정보가 매우 중요하다. 일반적으로 위치정보는 GPS(global positioning system)을 이용하여 얻게 되는데, 여러개의 위성을 통해 얻는 GPS정보는 그 특성상 대략의 위치만을 알 수 있을 뿐, 정확한 위치 정보를 얻기가 쉽지 않은 특징이 있다. 특수한 환경에서는 local positioning system을 이용하여 더 상세한 정보를 얻을 수 있는 경우도 있다.

이동하지 않는 장비의 위치 데이터도 매우 중요한 정보로 취급될 수 있다. 예를 들어 해상에 떠 있는 센서의 온도, 습도, 기압 등의 환경 정보와 위치 정보를 조합하면, 기상 예보, 재난 경보등에 매우 도움이 되는 정보를 얻을 수 있다.

위치 및 환경 데이터는 지리정보 시스템(Geographical information system)과 모바일 컴퓨팅 등의 기술과 융합하여 연구되고 있다.

 

센서 데이터 – 시계열 데이터

machbase database log

우리는 수 많은 센서들에 둘러싸여 생활하고 있다. 휴대 전화에도 카메라, GPS, 가속도 센서등의 수많은 센서가 부착되어 있으며 공장이나 공공 부문(도로, 철도, 항만, 공항)에도 매우 많은 센서들이 있다. 이 센서 데이터를 분석하면 다양한 부분에서 이전에 실행할 수 없었던 문제들을 해결 할 수 있다. 각 센서는 유일 식별자를 갖고, 읽어들인 데이터 값과 측정 시간을 같이 기록하여 전달한다. < Timstamp, 센서 식별자, 센서값>의 형태로 기록되는 데이터는 차후에 데이터 분석을 위해 순차적으로 입력시간에 따라 저장되며 이를 시계열 센서 데이터라고 한다.

 

센서 데이터와 제어 데이터

실시간으로 변화하는 구동기(actuator)등에서 수집한 센서 데이터 뿐만 아니라, 그 구동기를 제어하기 위한 제어 신호 데이터도 시계열로 기록된다. 이러한 데이터들은 실시간으로 변화하는 중의 데이터이므로 대량의 데이터가 발생하여 저장 및 분석에 어려움을 주고 있다.

이후 사고 분석, 불량 예측, 품질 개선, 생산량 조절 등에 기존의 데이터를 분석하여 진단할 수 있다.

 

Historical Data

시간을 포함하는 센서 데이터를 모으면 이 데이터는 historical data가 된다. 데이터를 수집하는 주기에 따라 데이터의 양은 매우 증가한다. 자세한 분석을 위해서 데이터 수집 주기를 짧게 할 수록 데이터 양이 커지기 때문에, DBMS로는 해결해야 할 문제점이다.

 


Database of Things 2 (Machbase Database) 차세대 산업 IoT를 위한 데이터 혁명 : Next Generation Historian 3

Leave a Reply

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.