경제,사회,문화 그리고 낭만 여행

데이터 라벨러 심화 과정--중 편

아폴론b 2023. 5. 16. 11:05

데이터 라벨러 심화 과정--중편

목차

1.음성AI

2.스켈레톤

3.검수 실습 프로젝트 가이드:데이터 수집검수.이미지 텍스트 분류 판별검수. 바운딩 검수. ocr및 음성 전사 검수. 키포인트 검수

1.음성AI의 영상 번역 과정은 전사. 검수. 번역. 감수. 의 단계를 거쳐야한다. 전사는 영상의 모든 텍스트를 받아쓰는 작업이고, 검수는 음성에 문제가 없는지 확인하는 작업이다. 번역은 전사와 검수를 한 내용을 토대로 번역을 하는 작업이다. 그리고 나서 최종적으로 감수작업을한다.

실습:사람이 말하는 소리를 일정한 규칙에 근거해 글로 적어 문자화 하는 작업을 한다. 그리고 말하는 사람의 성별을 선택하고 음성을 듣고 받아 쓰는 전사를 한다.

순서로는 ㄱ)작업선택 클릭.ㄴ)구간설정.ㄷ)음성확인.ㄹ)화자선택.ㅁ)전사.ㅂ)저장및 제출 이며 대화중에 아, 어, 음, 과같은 간투사는 전사대상이 아니므로 주의해야한다. 

작업을 할때 추가하기를 클릭 하기전에 음성파동의 노랑색 시작점을 마우스로 클릭한후 추가하기를 클릭하면 좀더 수월한 작업을 할 수 있다. 그리고 초록색 바를 움직여 파동의 구간을 설정하여 계속 반복하기를 들으면서 전사작업을 한다. 그리고 문장끝에 반드시 마침표나 물음표를 표기 해야 한다. 대화체는 2개로 나누어 지는데 혼자 소설을 읽는 듯한 비대화체와, 2인 이상의 대화로 이루어진 대화체가 있다.

2.스켈레톤:스켈레톤 작업은 사람의 손 관절 부위에 점을 찍어 나타내는 작업을 말한다. 라벨링의 순서는 ㄱ)작업대상을 확인한다. ㄴ)작업추가하기를 클릭한다.ㄷ) 손목중앙부터 소지4 까지 순서대로 총 20곳을 라벨링(점찍기) 해야한다. ㄹ)저장및 작업제출로 라벨링을 마무리한다. 라벨링의 위치를 세분화 해서 살펴보면 손목중앙. 엄지의3. 검지4. 약지4. 소지4곳으로  총20곳이며 뼈마디 중앙에 점을 잘찍어야하고 손끝은 손톱끝이 아니라 손톱 살의 끝으로 점을 찍어야한다.

3.검수 실습 프로젝트 가이드:인공지능 모델의 목적과 특성에 맞게 수집된 데이터의 품질을 확인하는 과정이다. 모든 실습 과정이 마찬 가지 이겠지만 검수를 하는데 있어서 가장 중요한것은 기준이다. 그러므로 항상 기준을 기록하여 옆에 가까이 두고 참고 해야 한다. 

검수의 종류를 세부적으로 살펴보면 다음과같다.

ㄱ)데이터수집검수:인공지능 모델의 목적과 특성에 맞게 수집된 데이터의 품질을 확인 하는 과정이다.

ㄴ)이미지 텍스트 분류.판별검수:사물을 볼때 위에서 내려다 보이는 각도는 직각으로 표기하고 나머지는 대각선으로 분류한다. 음식종류를 태깅하고 음식의 상태가 그릇에 담긴 것인지 용기에 담긴 것인지 태깅한다.

특히 반려사유를 메모해서 완벽한 작업이 될수 있도록 하는것이 중요하다. 반려 사유는 다음과 같다.

1)어떤 음식인지 알아 볼 수 없게 촬영 한 경우.

2)한상 차림의 음식이 일부분만 촬영된 경우.

3)불투명한 포장지로 내용물이 확인되지 않는 경우.

4)음식에 초점을 맞추지 않고 촬영된 경우.

5)모니터 촬영등 직접 촬영된 이미지가 아닌 경우.

6)음식이 잘리거나 음식전체를 확인 할 수 없게 촬영한 경우.

ㄷ)음성,영상분류, 판별검수:이작업의 라벨링 순서는 다음과같다.

손의 모양을 순서에 맞게 영상을 보고 태깅을 한다. 올바르게 작업된 영상은  녹화사작-1초 준비자세(주먹)-손동작 5회 반복-1초 마무리 자세(주먹)-녹화종료 의 순으로 징행되어야한다.

작업기준

ㄱ)특정 손 동작이 5회 반복되어야 한다.

ㄴ)준비및 마무리 자세(주먹)를 포함해서 녹화를 해야한다.

ㅁ)녹화시간이 최소 5초이상 최대 20초 이하 범위 여야한다.

ㄹ)직접 녹화한 영상이 아닌경우(부정작업)는 안된다.

ㅁ)영상속의 손동작과 작업자가 선택한 손동작이 같아야한다.

반려사유

ㄱ)손이 화면 중앙에 꽉차게 녹화가 되지 않는 경우.

ㄴ)손이 화면 박으로나가게 녹화한 경우.

ㄷ)손에 엑세서리를 착용하고 녹화 한경우

ㄹ)손목이 가려지게 녹화한경우

ㅁ)손에 그림자가 지게 녹화한경우.

음성데이터 검수: 우선 올바르게 작업되 음성이어야한다.

방법은 녹음시작-1초이상 묵음- 문장읽기-1초이상 묵음-문장읽기- 1초이상 묵음- 녹음종료이다.

반려사유

ㄱ)문장을 정확한 발음으로 녹음한다.

ㄴ)문장을 똑같은 내용으로 녹음한다.

ㄷ)소음이 없는 조용한 곳에서 녹음을 한다.

ㅁ)한사람의 목소리로 녹음을 한다.

ㅂ)작업기준에 맞게 다시 녹음을 한다.

이상으로 데이터 라벨링 심화과정을 교육 받으면서 메모 해놓은 자료를 올려봅니다. 입문 과정을 공부 할때보다 좀더 깊이있는 교육이라 조금 어려울 수 도 있습니다. 그러나 수익을 많이 올리기 위해서 해야할 노력이라면 더욱 신경을 써서 교육에 임하는 편이 좋다고 생각합니다. 저는 나이가 63세이다 보니 바운딩 영역이나, 스켈레톤이 적응이 안되서 애를 먹고있습니다. 쉽지는 않겠지만 그래도 한번 도전해 보려고 합니다. 또한 저의 글이 처음 데이터 라벨링을 공부 하시는 분들께 도움이 많이 되셨으면 좋겠습니다. 중편을 마무리하고 최종 하편을 곧 올리겠습니다. 감사합니다.