자료(資料, data)는 문자, 숫자, 소리, 그림, 영상, 단어 등의 형태로 의미 단위라고 말한다. 보통의 경우 연구나 조사 등의 바탕이 되는 재료를 말하며, 자료(data)를 의미 있게 정리하면 정보(information)가 된다. 자료(data)와 정보(information)는 서로 교환되어 사용하는 경우가 많지만 자료와 정보의 의미는 다르다. (위키백과 재인용)

 

컴퓨터가 상용화된 이후 컴퓨터의 정보 처리를 기반으로 정보(데이터)라는 단어가 많이 사용되고 있다. 초기에는 정보의 원래 뜻에 따라 정보(information)와 자료(data, 데이터)를 구별하고, 정보는 ‘뜻을 가지는 자료’라고 생각하는 의견도 있었다. 하지만 최근에는 정보의 뜻을 가지고 문제 삼는 경우는 별로 없으므로, 특별히 정보와 자료를 구별하지 않는다. 이러한 정보를 토대로 최근에는 기업이나 공공기관 혹은 연구기관 등에서 각자의 목적에 맞게 활용하고 있다.

즉 기업은 고객을 위한 마케팅 서비스로, 공공기관은 국민의 행정 서비스를, 각종 연구기관은 그에 상응하는 서비스와 연구 보고서를 발표, 활용함으로써 우리의 일상생활을 편리하게 하는 한편 삶을 진화시키고 있다. 특히 기업은 생산과 물류 그리고 고객 서비스 등 여러 분야에 적극적으로 가공된 정보를 활용하여 편리성을 증대하는 대표적 예이다. 이때 활용되는 수많은 자료를 모아둔 것이 바로 빅데이터이다. 이 빅데이터를 각각의 기관 혹은 기업, 단체 등에서 각자의 용도에 맞게 ‘뜻 있는 자료’로 가공, 정보화하여 활용하고 있다.

 

 

구글 이미지

 

 

특히, 4차 산업혁명을 이야기할 때 빠지지 않고 등장하는 단어가 빅데이터이다. 새삼 빅테이터가 무엇인지 설명할 필요가 없지만, 빅데이터란 여러 분야와 관련된 엄청난 양의 데이터 집합 정도로 이해하면 될 듯하다. 중요한 것은 이러한 빅데이터가 우리 경제 곳곳에서 활용되고 있다는 것이다.

즉 엄청난 양으로 수집된 빅데이터를 목적에 맞게 분류하여 활용하는 것이다. 국내의 일상적인 데이터를 활용한 사례 몇 가지를 살펴보면, 우선 통신사 고객의 위치 정보 활용을 통한 버스 정류장 이용량 분석과 버스 정류장 이용량 분석을 토대로 만든 노선을 바탕으로 한 심야 올빼미 버스 운영을 들 수 있다. 이 외에도 사용자의 소비패턴을 분석해 금융 상품을 추천하고, 신용카드사 가맹점에 동종업권 연령대별, 성별, 시간대별 매출 정보 등 상권 분석 정보를 제공한다. 중고차 빅데이터 기반의 허위 매물 필터링 프로그램을 개발·적용한 중고차 거래 앱이 출시되었고, 공공정보 데이터 분석으로 소형 부동산 시세 정보를 제공해 주며, 서민 대출 이용 지원(대한민국정책브리핑 재인용)과 같은 것도 빅데이터를 활용한 사례들이다.

이러한 사례들이 데이터로 있는 자료들을 ‘뜻 있는 자료’로 가공하여 만든 정보들이다. 이러한 사례는 이미 우리 일상 곳곳에 상당 부분 스며들어 있으며 위 내용은 극히 일부의 사례다. 앞으로 우리 일상생활에 더 많이, 더 깊이 스며들수록 데이터는 ‘경제’가 될 것이다. ‘데이터의 활용으로 다른 산업의 촉매 역할을 하고 새로운 제품과 서비스를 창출하는 경제’라는 의미로 통용될 수 있는 이 ‘데이터 경제’는 그 규모가 점차 확대될 것으로 예상된다.

‘데이터 경제’는 데이터를 통해 경제 성장을 촉진할 수 있으며 데이터 자체가 경제적 가치를 지니고 있고, 그래서 데이터가 바로 시장 원리에 부합한다고 볼 수 있다. 따라서 데이터가 경제에 도움이 되려면 지금보다 더 많은 자료 즉 데이터와 그 데이터 속에서 뜻 있는 자료를 찾아 가공하여야 한다. 그러나 이렇게 만들어진 가공된 정보는 우리의 일상생활에 도움이 되기도 하지만, 때로는 불편을 야기할 수도 있다. 예를 들어 사용할 때 편리하기는 하나 나의 개인정보가 알지 못하는 사이에 유출되는 것과 같은 경우가 발생할 수 있기 때문이다.

우리나라의 경우 지난 2020년 초 ‘데이터 3법’이라 불리는 개인정보보호법· 정보통신망법· 신용정보법이 국회 본회의를 통과했다. 특히 개인정보는 개인정보보호법 개정을 통해 보호하고 있다. 이번 개인정보보호법 개정안은 누군가의 개인정보를 가명 처리한 형태로 보완했다고 볼 수 있다.(효성그룹 블로그, 재인용) 개인정보를 가명 처리한 형태를 가명정보라 하는데, 가명정보란 개인 비식별 조치가 된 익명 개인정보와 식별 가능한 개인정보 사이의 중간 단계이다. 성명·전화번호 등 개인을 식별할 수 있는 정보를 삭제하거나 대체(가명처리)하는 등의 방법으로 식별 가능성을 낮춘 개인정보를 말한다. 이렇게 가명 처리된 정보는 개인의 동의 없이도 통계, 연구 등에 활용할 수 있고 각기 다른 기관의 자료를 가명으로 결합해 활용하는 것도 가능하다. 또한 가명정보는 기업에서 데이터 분석·활용 및 공급·수급에 훨씬 더 효과적이라 할 수 있다.

 

  

구글 이미지

 

 

개인을 특정할 수 없는 것은 익명 정보와 동일하여 개인정보는 보호되지만 개인을 식별하는 정보가 없으므로 활용도 면에서 정보로서의 가치는 가명 정보가 크다. 또한 상업 목적을 포함한 통계 작성, 연구, 공익 기록 보존 등에 한하여 정보 주체의 동의 없이 가명정보를 활용할 수도 있다. 다만 주의해야 할 점은 가명정보를 결합하면 결합할수록 개인을 식별할 수 있다는 가능성이 있다는 것이다. 따라서 이러한 불안감을 줄이기 위해 개인정보 보호위원회는 지침을 통해 개인정보처리 기본 원칙을 준수하도록 하고 식별 가능성이 큰 정보는 삭제하거나 기존 정보로 복원할 수 없도록 하였다. 또 보안 수준이 낮은 환경에서는 익명 정보에 가깝게 처리하여 식별 가능성을 낮추도록 하였다.(네이버 지식백과, 재인용) 그러나 이처럼 개인정보가 가명정보로 처리되어도 불안함은 여전히 존재한다.

한편 이와 같이 데이터가 중요해지는 이유는 데이터를 자산으로 인식하는 사회적 인식을 토대로 데이터를 거래하고 공유하는 기반으로 만들어진 지속 가능한 경제 체제를 유지할 수 있다는 판단 때문이다. 바로 이러한 점 때문에 세계 각국 정부는 데이터가 차세대 원유 또는 원유보다 더 중요한 자원이라는 인식을 바탕으로 세계 1등의 데이터 경제를 구축하려 치열하게 경쟁 중이다.

이미 전 세계는 크롬, 익스플로러 같은 몇몇 인터넷 웹을 통해 여러 나라의 특정 정보를 얻기 위한 웹서핑을 하거나, 혹은 소셜 미디어와 같은 SNS 플랫폼으로 사실상 연결이 되어있다. 온라인상에서는 국경이라는 의미가 무색할 정도로 데이터 활용이 자유롭다는 의미다. 이 때문에 자료 즉 데이터의 중요성은 날이 갈수록 중요해져 가고 있으며, 만약 이러한 인식을 하고 있지 않다면 그 자체가 문제라 할 수 있다.

즉 온라인상에서 영상 플랫폼인 YOUTUBE를 전 세계 모든 세대에 걸쳐 즐길 수 있는 이유가 바로 데이터 연결을 통한 정보의 유통 때문이다. 또한 페이스북이나 트위터 그리고 틱톡과 같은 연결 플랫폼에서 데이터 트래픽이 증가한다는 것은 텍스트 정보와 이미지(영상) 정보 전달이 전 세계에서 일어나고 있기 때문인 것이다.

 

 

EU개인정보이동권(뉴딜코리아)

 

 

문제는 국가마다 경제적 가치가 있는 데이터 정보를 활용할 때 긍정적인 활용 못지않게 부정적으로 악용되지 않도록 주의를 기울여야 한다는 점이다. 자칫 국민들을 감시하는 형태의 치명적인 인권 문제로도 비화할 수도 있기에 그 활용은 매우 신중해야 한다. 실제 하루에도 수천수만 건의 문제들이 일어나고 있는 가운데 이러한 데이터 혹은 가공된 정보를 통제함으로써 국민들의 삶에 악영향을 끼치는 경우도 있을 수 있다. 물론 인터넷 내에서의 국가 간 자유로운 데이터 유통 역시도 기본적으로 사람들의 프라이버시를 보호하기 위해 익명 데이터 또는 가명화(pseudonymization)된 데이터를 기반으로 한다. 이때 가명화란 앞서 말한 바와 같이 데이터에서 특정 개인을 식별할 수 있는 정보를 가명으로 대체함으로써 관련된 개인과의 연결성을 제거하는 것을 의미한다. 이에 안심해도 된다고는 하나, 아직도 불안이 가시지 않고 있는 것이 사실이다.

중국판 카카오 같은 위챗은 스마트폰에서 모바일 메신저와 문자를 보내고 결제도 하며, 스트리밍 엔터테인먼트 서비스를 즐기거나 모바일 게임을 하고, 뉴스도 보고, 의견을 공유한다. 그러나 중국 당국은 위챗이 반정부 뉴스를 퍼트리고, 온라인의 익명성을 이용해 반체제 활동을 감추는 데 사용될까 봐 두려워한다. 이것은 중국이 지금까지 페이스북과 트위터 등 서구권 소셜 미디어 서비스를 막고 있는 상황을 보면 알 수 있다. 또한 위챗의 채팅방 참여자를 500명으로 제한하다 보니, 많은 중국인들은 위챗이 정부의 감시를 받고 있다고 믿는다. 물론 일부의 확인되지 않은 경우라고 하지만, 북경 시내에만 수천만 개의 CCTV를 통해 국민 대부분을 촬영한다는 말이 공공연하게 흘러나오고 있고, 이러한 데이터를 AI와 같은 인공지능을 통해 더욱 통제를 강화한다는 이야기도 있어 개인정보 부분에 대한 불안감은 여전하다. 따라서 이처럼 데이터를 경제적 가치의 산물로 활용하기보다, 국민을 통제하고 여론을 감시하고 표현의 자유를 억압하는 도구로 악용한다면 이미 이러한 데이터는 아무런 쓸모가 없다. (The Epoch Times, 재인용)

과거 기업은 사람의 느낌과 경험에 의지해 비즈니스의 상태를 파악하는 일이 많았지만, 지금처럼 빅데이터 활용으로 다양한 데이터의 수집 및 저장이 쉬워지고 데이터 분석이 가능해진 지금은 다르다. 데이터를 긍정적으로 활용하기보다 부정적으로 접근하려 하는 것은 경제적인 침체와 고객의 소비 욕구마저 떨어뜨리는 것은 물론, 국가 전체를 혼란스럽게 하리라는 것은 누구나 충분히 짐작할 수 있는 일이다. 너무도 당연한 말이지만 소비자와 국민의 삶을 윤택하게 함으로써 소비가 늘고 경제 활동이 활발해짐으로써 국익은 점진적으로 증가할 것이고, 이것이 바로 데이터를 경제에 활용해 얻고자 하는 데이터의 긍정적 활용이다.

 

 

글로벌 네트워크 시대(구글 이미지)

 

 

2020년 대통령 직속 4차산업혁명위원회는 대한상공회의소, 한국인터넷기업협회와 공동으로 데이터 3법 개정에 대한 설문조사를 실시하고, 그 결과를 발표했다. 이 설문은 국회 통과와 시행령의 입법 예고 기간에 맞춰 일반 국민 및 전문가 그룹을 구분해 진행했는데 우선 국민의 71.2%는 데이터 3법의 개정 사실을 알고 있으며, 32.1%는 그 내용까지도 인지하고 있고 국민의 79.9%가 생활 속에서 빅데이터 기반 서비스를 경험하고 있으며 이 중 91.4%가 생활에 유용하다고 답했다. 설문 결과 삶의 질 향상에 도움이 된다는 답변이 무려 90.6%로 드러나는 등 데이터가 실생활에 큰 영향을 주고 있는 것으로 나타나 데이터 기반의 다양한 서비스가 이미 자리 잡고 있으며, 국민들은 이에 긍정적인 생각을 갖고 있는 것으로 조사되었다.

그리고 코로나19 관련 데이터 서비스와 개인정보 공개 등에 관한 설문 결과, 확진자 맵 또는 동선 정보 서비스를 국민의 58.6%가 이용한 것으로 조사되면서, 이용자의 92.7%가 이것이 유용하다고 평가했다고 한다. 개인정보 제공에 관해서도 국민의 77.4%가 이를 제공할 의향이 있다고 답변했으며, 우려 요인이 해소될 경우 무려 86.6%가 개인정보를 제공하겠다고 답했다는 내용에서 실제 우리 국민들이 데이터의 긍정적 활용에 매우 만족한다는 것을 느낄 수 있다. (인더스트리 뉴스, 재인용)

국민들은 데이터에서 잘 가공된 정보가 우리 삶의 질 향상에 도움이 되며, 전반적인 생활 환경 베네핏으로서 데이터의 긍정적 활용이 도우미 역할을 톡톡히 한다는 것을 이미 느끼고 있다. 데이터의 부정적 활용에 대해서는 국민들이 언제든 불안해 할 수밖에 없다는 것을 이해하고, 사전에 악용되는 것을 예방해 나가야 할 것이다. 이처럼 우리는 데이터의 긍정적 활용이 우리 삶을 당연히 질적으로 진화시키리란 걸 이미 체감하여 잘 알고 있으며, 실제로 이러한 데이터 분석과 지속적 관리는 우리 삶의 질뿐만 아니라 경제 전반에 많은 영향을 미칠 것이다.

한편 지난 7월 부산시에서 직관에 의한 행정에서 벗어나 객관적·과학적 행정을 지원하고자, 분야별 빅데이터를 분석하고 행정 서비스를 개선할 수 있는 양질의 정책 정보를 생산하는 사업을 추진키로 했다는 발표가 있었다. 부산시의 ‘지역경제 활성화 및 청년고용 분석’은 부산의 경제와 청년 인구 현황을 분석하고, 바람직한 일자리 특성과의 차이 분석을 통해 부산 경제 활성화를 위한 일자리 특성 파악 및 청년 유출 방지 방안을 제시할 거라 밝혔다. 또한 부산 시민의 성별·연령·주거지 등에 기반한 라이프 스타일을 파악하여 일상 속 시민 삶의 질 향상을 위한 서비스를 도출하고 부산 청년의 문화적 욕구, 취향에 부합하는 지원 또는 보완 정책을 마련하는 데 활용될 예정이라고 한다. 아울러 코로나로 어려운 시기를 겪고 있는 시민들이 체감할 수 있는 정책을 개발(뉴시스 기사, 재인용)하여 급변하는 환경에 빠르게 대응해 시민 삶의 질을 높여 나갈 계획이다.

이 외에도 앞으로 각 분야에 걸쳐 데이터의 활용은 무궁무진할 것이며 활용의 범위가 넓어질수록 개개인의 개인정보 활용에 대한 불안 역시도 비례해서 늘어날 수밖에 없다. 따라서 데이터 활용에서 성장의 긍정적 효과를 얻기 위해서는 데이터의 무절제한 활용을 반드시 막아야만 미래 우리의 삶이 질적으로 진화할 수 있을 것이다.

 

 

Gil Park님의 브런치에 게재된 글을 모비인사이드가 한 번 더 소개합니다.