60. 공공데이터 개방 (Open Data) 표준 규격

⚠️ 이 문서는 국가나 지자체가 보유한 공공데이터를 민간이 자유롭게 활용해 새로운 비즈니스 앱(예: 대중교통 앱, 부동산 앱)을 만들 수 있도록, 데이터를 기계가 읽을 수 있는(Machine-Readable) 개방형 표준 포맷(CSV, JSON, REST API)으로 제공하는지 점검하는 감리 항목을 다룹니다.

핵심 인사이트 (3줄 요약)

  1. 본질: 공공기관이 데이터를 단순히 게시판에 한글(HWP)이나 PDF 파일로 올려놓는 것은 '데이터 개방'이 아니다. 앱 개발자가 즉각적으로 데이터베이스에 연동할 수 있도록 기계 친화적 표준 규격을 강제하는 것이다.
  2. 가치: 정보의 파편화와 독점을 막고, 데이터의 상호운용성(Interoperability)을 높여 민간의 창의적인 아이디어(혁신 서비스)와 결합할 수 있는 디지털 경제의 쌀(인프라)을 제공한다.
  3. 감리 체계: 감리인은 정보시스템 구축 시 데이터가 1단계(비표준 파일)가 아닌, 공공데이터포털 연계를 위한 최소 3단계(CSV 등) 이상, 이상적으로는 4~5단계(REST API, LOD)로 개방되도록 아키텍처가 설계되었는지 점검한다.

Ⅰ. 데이터 개방의 5단계 (Tim Berners-Lee의 5 Star)

월드와이드웹의 창시자 팀 버너스리가 제안한 데이터 개방 수준 모델이다.

  1. 1~2단계: 무늬만 개방 (감리 부적합):
    • 1단계 (★): 사진, PDF, HWP 포맷. 눈으로 볼 수는 있으나 기계가 데이터를 추출할 수 없다.
    • 2단계 (★★): 엑셀(XLS) 포맷. 기계가 읽을 순 있으나 마이크로소프트의 상용 독점 소프트웨어가 있어야만 열 수 있다.
  2. 3단계: 기계 가독형 표준 포맷 (최소 권장 요건):
    • 3단계 (★★★): CSV (Comma-Separated Values) 또는 JSON, XML. 특정 기업의 소프트웨어에 종속되지 않고 어떤 프로그래밍 언어로도 즉시 읽어 들일 수 있는 개방형 표준 포맷이다.
  3. 4~5단계: 완벽한 연결과 지능화:
    • 4단계 (★★★★): RESTful API 제공. 파일을 다운로드할 필요 없이, 시스템이 실시간으로 DB에 질의하여 최신 데이터를 가져갈 수 있는 구조 (URI 부여).
    • 5단계 (★★★★★): LOD (Linked Open Data). 내 데이터가 다른 기관의 데이터와 시맨틱(의미론적) 웹 기술로 그물망처럼 연결된 최고 수준의 개방.

📢 섹션 요약 비유: 요리사(앱 개발자)에게 식재료(데이터)를 줄 때, 꽁꽁 얼어붙은 통나무 박스(PDF)에 넣어 주거나 전용 열쇠가 필요한 자물쇠 상자(엑셀)에 주는 것이 아니라, 껍질까지 다 까서 도마 위에 가지런히 올려둔 상태(CSV, API)로 제공하는 것이 진정한 데이터 개방입니다.


Ⅱ. 공공데이터 개방 시스템 감리 핵심 점검 사항

감리인은 사업자가 납품하는 시스템이 공공데이터법과 지침을 준수하는지 따져야 한다.

  1. 개방 데이터 셋(DataSet) 선정 및 명세서 적정성:
    • 개인정보(주민등록번호), 국가안보 기밀 등 비공개 대상 정보가 개방 데이터에 섞여 나가지 않도록 필터링/비식별화 아키텍처가 설계되었는지 확인한다.
    • 공공데이터포털(data.go.kr)에 등록하기 위한 메타데이터(데이터 명세서) 표준 포맷을 준수했는지 점검한다.
  2. 오픈 API (RESTful) 설계 및 성능 점검:
    • 단순히 데이터를 제공하는 것을 넘어, 민간에서 트래픽이 폭주할 때 공공기관 본연의 업무 DB가 죽지 않도록 **API 게이트웨이(트래픽 제어, 인증 키 발급)**나 별도의 개방용 DB(Read Replica)망이 분리되어 있는지 감리한다.
  3. 코드값(마스터 데이터) 표준화 준수:
    • 지역 코드를 A 기관은 '02', B 기관은 'SEOUL'로 주면 민간에서 연동하기 어렵다. 행정안전부의 '행정표준코드'를 매핑하여 제공하고 있는지 점검한다.

📢 섹션 요약 비유: 공공 수도관(데이터)을 민간에 연결해 줄 때, 수질(표준 코드)이 깨끗한지, 독극물(개인정보)이 섞이지 않았는지 검사하는 것은 물론, 사람들이 물을 너무 많이 튼다고 관공서 정수기 물까지 안 나오는 일이 없도록 별도의 보조 물탱크(API 분리망)를 설치했는지 확인하는 감리 과정입니다.


Ⅲ. 기대 효과와 품질 보증(QA)의 중요성

개방의 목적은 '게시'가 아니라 '활용'이다.

  1. 데이터 기반 혁신 생태계 (Data Economy):
    • 버스 도착 정보 API, 약국 마스크 재고 API 등은 정부가 직접 앱을 만들지 않고도 민간의 민첩성을 이용해 대국민 서비스를 창출한 성공적인 표준 개방의 사례다.
  2. 지속적인 현행화 (데이터 생명주기 관리):
    • 한 번 CSV 파일을 올리고 1년째 업데이트가 안 되면 그 데이터는 죽은 것이다. 감리인은 데이터가 DB 변경 시 배치(Batch)나 실시간 동기화(CDC)를 통해 개방 포털에 자동으로 현행화(Update)되는 연계 모듈이 제대로 동작하는지 시스템 통합 테스트를 거쳐야 한다.

📢 섹션 요약 비유: 멋진 뷔페식당(공공데이터포털)을 열어놓고 음식이 한 번 세팅된 후 다시는 리필되지 않거나(현행화 실패), 상한 음식(비표준 데이터)이 방치되면 손님(앱 개발자)은 다시는 오지 않습니다. 자동 리필 시스템이 잘 돌아가는지 확인하는 것이 핵심입니다.