코로나로 인해 비대면이 일상화되고 4차 산업혁명으로 기술 발전이 앞당겨짐에 따라 국내외 시장 환경이 디지털 중심으로 빠르게 변화하고 있습니다. 그래서 이번 포스팅에서는 이 같은 환경에서도 촉망받고 있는 직업, ‘데이터 라벨링‘에 대해 소개해드리고자 합니다.​

 

데이터 라벨링이란?

 

말 그대로 데이터에 이름표를 붙이는 작업이라고 할 수 있습니다. 개발하려는 인공지능 소프트웨어에 따라 필요한 Data가 다릅니다. 그런데 일정 수준의 학습을 받은 사람은 사물이나 이름을 분류할 수 있지만 인공지능은 그렇지 않습니다. 여기서 인공지능(AI) 학습을 위해 사람이 직접 Data를 분류하고 가공하는 모든 작업을 데이터 라벨링이라고 합니다. 그만큼 정교한 작업이 필요하기 때문에 아직까지는 사람의 힘이 필요한 것입니다.

 

 

데이터 라벨링은 한 건당 20원~3,000원 정도로 수익이 크지는 않지만 한 번에 수십 개에서 수백 건을 할 수 있을 정도의 간단한 재택 알바 업무입니다. 그래서 직장인들이 자투리 시간을 이용하거나 프리랜서, 주부, 노년층 등 누구나 쉽게 접근할 수 있는 것이 주요 메리트라고 할 수 있습니다. 작업 방식의 경우, 크게 4가지(이미지, 영상, 텍스트, 음성) 유형별 프로젝트로 구분되며 작업 방식은 2가지(수집, 가공)로 구분됩니다.

 

1. 이미지 프로젝트

 

1) 수집

휴대폰으로 정해진 대상을 촬영해 업로드하는 작업입니다. 온라인에서 이미지를 다운로드해 업로드하게 되면 저작권 문제가 발생하기 때문에 작업 화면에서 바로 카메라를 실행해 찍고 업로드하는 형태입니다. 이는 동영상 수집이나 음성 수집 모두 동일합니다.

 

2) 가공

① 바운딩

이미지에서 정해진 대상을 마우스로 드래그하여 박스를 그리는 작업입니다. 정교하게 박스를 그리는 것이 중요하기 때문에 PC에서만 참여가 가능합니다. 박스를 그린 후에는 해당 대상이 무엇인지 분류하는 ‘태깅’, 바운딩 대상이 글자인 경우 해당 글자를 입력하는 ‘전사’로 이어지기도 합니다. 이러한 유형의 프로젝트를 가공한 결과물은 향후 자율 주행 개발 등 광범위한 인공지능 개발에 활용됩니다.

 

② 스켈레톤 추출

대상의 특정 부위에 점을 찍는 작업이 진행됩니다. 가공된 결과물은 이미지나 영상의 객체를 인식하는 소프트웨어를 개발하는 데 활용됩니다.

 

③ OCR

OCR은 인공 지능에 글자를 가르쳐주기 위한 프로젝트입니다. 화면에 있는 이미지 내 글자를 바운딩해 해당 텍스트의 가로, 세로 여부를 선택하거나 글자를 입력하는 프로젝트로 다른 프로젝트에 비해 난이도가 다소 높은 편입니다. 또한 글자 바운딩 기준은 고객사의 요청에 따라 결정되기 때문에 작업 기준을 꼭 가이드에서 자세히 확인해야 합니다.

 

④ 감정 태깅, 상태 묘사

사진 속 사람의 표정을 보고 감정을 추론해 태깅하거나 이미지를 글로 상세히 묘사하는 작업입니다.

 

 

2. 영상 프로젝트

 

 

1) 수집

영상 수집은 휴대폰으로 정해진 대상이나 행동을 촬영해 업로드하는 작업입니다. 온라인에서 영상을 다운로드해 업로드할 경우 저작권 문제가 발생하기 때문에 작업 화면에서 바로 카메라를 실행해 촬영하고 업로드하는 형태로 진행됩니다.

 

2) 가공

① 구간 추출

영상에서 특정 구간을 선택하는 작업입니다. 예를 들어 화자가 특정 동작이나 대사를 말할 때 해당 구간을 선택하는 등 고객사에서 필요한 Data에 따라 영상의 구간을 선택해 추출합니다. 구간 추출 후에는 감정을 태깅하거나 대사를 받아쓰는 작업으로 이어지기도 합니다.

 

② 바운딩

이미지 작업과 동일하게 영상에서도 정해진 대상을 마우스로 드래그해 바운딩하는 작업이 진행되며 바운딩 후에는 대상을 분류하는 태깅으로 이어질 때가 많습니다.

 

③ 스켈레톤 추출

영상에서도 이미지와 동일하게 대상의 특정 부위에 점을 찍는 작업이 진행됩니다. 방식은 이미지에서 스켈레톤 추출과 유사합니다.

 

 

3. 텍스트 프로젝트

 

1) 수집

주어진 시나리오에 맞는 Q&A 대화를 만들거나 제시된 지문을 읽고 질문을 만드는 작업 등이 있습니다. 이렇게 수집된 결과물은 챗봇이나 기계 독해 엔진을 만들 때 사용됩니다.

 

2) 가공

① 문장 비교

주어진 문장을 읽고 의미가 같은지, 다른지 태깅하는 작업입니다. 가공된 결과물은 인공 지능의 문장 파악 정확도를 향상하는 데 활용됩니다.

 

② 감정 태깅

주어진 문장을 읽고 느껴지는 감정을 태깅하는 작업으로 인공지능의 감정 인식을 고도화하는 데 활용됩니다.

 

③ 키워드 찾기

대화 속 주제의 키워드를 찾는 작업으로 챗봇을 고도화하는 데 활용됩니다.

 

④ 문장 요약

지문을 읽고 핵심 내용을 요약하는 작업으로 인공 지능이 정보성 글의 핵심 내용을 인식하는 알고리즘을 개발하는 데 활용됩니다.

 

 

4. 음성 프로젝트

 

 

1) 수집

① 휴대폰으로 정해진 문장을 녹음하는 작업

이미지나 동영상과 동일하게 온라인에서 다운로드해 업로드할 경우 저작권 문제가 발생하기 때문에 작업 화면에서 제공되는 녹음 기능을 이용해 녹음하고 제출하는 형태로 진행됩니다. 작업 시 조용한 곳에서 녹음을 진행해 제출해야 합니다. 녹음 작업의 검수 기준은 고객사에서 요구한 조건대로 결정되기 때문에 프로젝트별로 검수 기준이 다소 다를 수 있습니다.

 

2) 가공

① 음성 받아쓰기

주어진 음성을 듣고 들리는 대로 받아쓰는 작업으로 자막 자동 생성이나 대본 자동 작성 프로그램을 개발하는 데 활용됩니다. 기준 음성과 비교 대상 음성을 듣고 화자가 같은지, 다른지를 태깅하는 작업으로 인공지능 스피커를 고도화하는 데에 활용됩니다.

 


 

여기까지, 데이터 라벨링 개념에 대해 어느 정도 익히셨다면 아래 사이트를 통해 활동하실 수 있습니다. (단, 위 내용은 ‘크라우드 웍스’ 학습 내용을 정리한 것이므로 사이트마다 운영 방식이 다를 수 있습니다.)

 

 

옌 yen님이 블로그에 게재한 글을 편집한 뒤 모비인사이드에서 한 번 더 소개합니다.