불량명이 작업자마다 다름
같은 현상을 다른 이름으로 부르면 AI 학습 데이터가 섞입니다.
불량 데이터 라벨링은 단순 반복 작업이 아닙니다. 불량 유형 정의, 애매한 샘플 기준, 검수 프로세스가 있어야 AI 품질검사 결과를 믿을 수 있습니다.
검색으로 들어온 사용자가 바로 자기 문제를 찾을 수 있도록, 페이지마다 하나의 의도를 중심으로 구성했습니다.
같은 현상을 다른 이름으로 부르면 AI 학습 데이터가 섞입니다.
경계 사례를 어떻게 라벨링할지 정하지 않으면 모델 평가가 흔들립니다.
라벨 수보다 라벨 일관성이 중요합니다. 샘플 검수와 오류 수정 흐름이 필요합니다.
양품, 불량, 애매한 샘플의 정의와 예시 이미지를 정리합니다.
라벨러가 볼 기준과 검수자가 확인할 항목을 만듭니다.
클래스 불균형, 오류 라벨, 중복 이미지를 점검해 PoC에 반영합니다.
업체를 쓰더라도 기준은 고객사가 먼저 정해야 합니다. 기준이 없으면 많은 라벨이 오히려 혼란을 만들 수 있습니다.
처음에는 발생 빈도와 비용 영향이 큰 유형부터 시작해 점진적으로 확장하는 것이 좋습니다.