60. 공공데이터 개방 (Open Data) 표준 규격
⚠️ 이 문서는 국가나 지자체가 보유한 공공데이터를 민간이 자유롭게 활용해 새로운 비즈니스 앱(예: 대중교통 앱, 부동산 앱)을 만들 수 있도록, 데이터를 기계가 읽을 수 있는(Machine-Readable) 개방형 표준 포맷(CSV, JSON, REST API)으로 제공하는지 점검하는 감리 항목을 다룹니다.
핵심 인사이트 (3줄 요약)
- 본질: 공공기관이 데이터를 단순히 게시판에 한글(HWP)이나 PDF 파일로 올려놓는 것은 '데이터 개방'이 아니다. 앱 개발자가 즉각적으로 데이터베이스에 연동할 수 있도록 기계 친화적 표준 규격을 강제하는 것이다.
- 가치: 정보의 파편화와 독점을 막고, 데이터의 상호운용성(Interoperability)을 높여 민간의 창의적인 아이디어(혁신 서비스)와 결합할 수 있는 디지털 경제의 쌀(인프라)을 제공한다.
- 감리 체계: 감리인은 정보시스템 구축 시 데이터가 1단계(비표준 파일)가 아닌, 공공데이터포털 연계를 위한 최소 3단계(CSV 등) 이상, 이상적으로는 4~5단계(REST API, LOD)로 개방되도록 아키텍처가 설계되었는지 점검한다.
Ⅰ. 데이터 개방의 5단계 (Tim Berners-Lee의 5 Star)
월드와이드웹의 창시자 팀 버너스리가 제안한 데이터 개방 수준 모델이다.
- 1~2단계: 무늬만 개방 (감리 부적합):
- 1단계 (★): 사진, PDF, HWP 포맷. 눈으로 볼 수는 있으나 기계가 데이터를 추출할 수 없다.
- 2단계 (★★): 엑셀(XLS) 포맷. 기계가 읽을 순 있으나 마이크로소프트의 상용 독점 소프트웨어가 있어야만 열 수 있다.
- 3단계: 기계 가독형 표준 포맷 (최소 권장 요건):
- 3단계 (★★★): CSV (Comma-Separated Values) 또는 JSON, XML. 특정 기업의 소프트웨어에 종속되지 않고 어떤 프로그래밍 언어로도 즉시 읽어 들일 수 있는 개방형 표준 포맷이다.
- 4~5단계: 완벽한 연결과 지능화:
- 4단계 (★★★★): RESTful API 제공. 파일을 다운로드할 필요 없이, 시스템이 실시간으로 DB에 질의하여 최신 데이터를 가져갈 수 있는 구조 (URI 부여).
- 5단계 (★★★★★): LOD (Linked Open Data). 내 데이터가 다른 기관의 데이터와 시맨틱(의미론적) 웹 기술로 그물망처럼 연결된 최고 수준의 개방.
📢 섹션 요약 비유: 요리사(앱 개발자)에게 식재료(데이터)를 줄 때, 꽁꽁 얼어붙은 통나무 박스(PDF)에 넣어 주거나 전용 열쇠가 필요한 자물쇠 상자(엑셀)에 주는 것이 아니라, 껍질까지 다 까서 도마 위에 가지런히 올려둔 상태(CSV, API)로 제공하는 것이 진정한 데이터 개방입니다.
Ⅱ. 공공데이터 개방 시스템 감리 핵심 점검 사항
감리인은 사업자가 납품하는 시스템이 공공데이터법과 지침을 준수하는지 따져야 한다.
- 개방 데이터 셋(DataSet) 선정 및 명세서 적정성:
- 개인정보(주민등록번호), 국가안보 기밀 등 비공개 대상 정보가 개방 데이터에 섞여 나가지 않도록 필터링/비식별화 아키텍처가 설계되었는지 확인한다.
- 공공데이터포털(data.go.kr)에 등록하기 위한 메타데이터(데이터 명세서) 표준 포맷을 준수했는지 점검한다.
- 오픈 API (RESTful) 설계 및 성능 점검:
- 단순히 데이터를 제공하는 것을 넘어, 민간에서 트래픽이 폭주할 때 공공기관 본연의 업무 DB가 죽지 않도록 **API 게이트웨이(트래픽 제어, 인증 키 발급)**나 별도의 개방용 DB(Read Replica)망이 분리되어 있는지 감리한다.
- 코드값(마스터 데이터) 표준화 준수:
- 지역 코드를 A 기관은 '02', B 기관은 'SEOUL'로 주면 민간에서 연동하기 어렵다. 행정안전부의 '행정표준코드'를 매핑하여 제공하고 있는지 점검한다.
📢 섹션 요약 비유: 공공 수도관(데이터)을 민간에 연결해 줄 때, 수질(표준 코드)이 깨끗한지, 독극물(개인정보)이 섞이지 않았는지 검사하는 것은 물론, 사람들이 물을 너무 많이 튼다고 관공서 정수기 물까지 안 나오는 일이 없도록 별도의 보조 물탱크(API 분리망)를 설치했는지 확인하는 감리 과정입니다.
Ⅲ. 기대 효과와 품질 보증(QA)의 중요성
개방의 목적은 '게시'가 아니라 '활용'이다.
- 데이터 기반 혁신 생태계 (Data Economy):
- 버스 도착 정보 API, 약국 마스크 재고 API 등은 정부가 직접 앱을 만들지 않고도 민간의 민첩성을 이용해 대국민 서비스를 창출한 성공적인 표준 개방의 사례다.
- 지속적인 현행화 (데이터 생명주기 관리):
- 한 번 CSV 파일을 올리고 1년째 업데이트가 안 되면 그 데이터는 죽은 것이다. 감리인은 데이터가 DB 변경 시 배치(Batch)나 실시간 동기화(CDC)를 통해 개방 포털에 자동으로 현행화(Update)되는 연계 모듈이 제대로 동작하는지 시스템 통합 테스트를 거쳐야 한다.
📢 섹션 요약 비유: 멋진 뷔페식당(공공데이터포털)을 열어놓고 음식이 한 번 세팅된 후 다시는 리필되지 않거나(현행화 실패), 상한 음식(비표준 데이터)이 방치되면 손님(앱 개발자)은 다시는 오지 않습니다. 자동 리필 시스템이 잘 돌아가는지 확인하는 것이 핵심입니다.