[Boostcamp Day-67] 성능 평가 기준

Boostcamp AI Tech

[Boostcamp Day-67] 성능 평가 기준

ju_young 2021. 11. 12. 19:19

데이터셋 제작 파이프라인

서비스 요구사항 -> 제작 목적 설정 -> 가이드라인 제작 -> Raw Image 수집 -> 어노테이션(라벨링) -> 모델링 -> 성능 평가/분석
성능 평가/분석 -> 제작 목적 설정 (반복)

가이드 라인 제작 과정

가이드 작성 -> 가이드 교육 -> 라벨링 -> 라벨링 검수 -> 데이터 검수

Recall, Precision

Precision (정밀도) : 예측한 값들이 정답일 확률
Recall (재현도) : 실제 값들 중 예측한 값이 정답일 확률

Area Recall / Area Precision

Area Recall : 예측 영역과 실제 영역의 교집합을 실제 영역으로 나눔
Area Precision : 예측 영역과 살제 영역의 교집합을 예측 영역으로 나눔

One-to-One | One-to-Many | Many-to-One Match

정답에 해당되는 영역 하나가 예측에 해당되는 여러 영역 중 하나의 영역으로 매칭되는 경우

정답 영역 하나에 여러 예측 영역들이 매칭되는 경우

여러 정답 영역이 하나의 영역에 매칭되는 경우

DetEval (2013)

모든 정답 영역, 예측 영역 간의 매칭 정도를 area recall / area precision 둘 다 계산

셀 중에 area recall >= 0.8 and precision >= 0.4 를 충족하면 1 아니면 0으로 값을 바꿈

행렬 값을 보면서 one-to-one, Many-to-one, One-to-Many의 관계를 찾는다.
행렬 값에서 Recall, Precision을 계산
Recall과 Precision의 조화 평균을 계산

IoU (2015)

one-to-one matching만 허용
IoU value > 0.5 일 경우 correct, 그렇지 않은 경우 incorrect

TIoU (Tightness-aware IoU)

부족하거나 초과된 영역 크기에 비례하여 IoU 점수에 대해 패널티 부여
예측 박스의 타이트함을 점수에 반영

부족한 영역 Penalty : 부족한 영역 크기 / 정답 영역 크기 (TIoU Recall)
초과한 영역 Penalty : 초과된 영역 크기 / 예측 영역 크기 (TIoU Precision)
TIoU Recall과 TIoU Precision의 조화 평균으로 계산

CLEval (Character-Level Evaluation)

얼마나 많은 글자를 맞추고 틀렸느냐를 가지고 평가
Detection 뿐 아니라 end-to-end, recognition 에 대해서도 평가 가능

PCC (Pseudo Character Centers) : 글자 영역 위치 정보와 글자 시퀀스 정보로부터 글자별 위치 정보를 추정

Matching Matrix

[정답 기준]

CorrectNum : 정답 영역 내 PCC 중 어느 예측 영역이라도 속하게 된 PCC의 수

GranualPenalty : 정답 영역 내 PCC를 포함하는 예측 영역의 개수 - 1

TotalNum : 정답 영역 내 PCC 개수

[예측 기준]

CorrectNum : 이 예측 영역이 포함하고 있는 PCC 별로, 해당 PCC를 포함하는 예측 영역의 개수로 나누어 합함

GranualPenalty : 예측 영역과 연관된 정답 영역의 개수 - 1

TotalNum : 이 예측 영역이 포함하고 있는 PCC 개수

[Scoring]

'Boostcamp AI Tech' 카테고리의 다른 글

[Boostcamp Day-65] 데이터 제작의 중요성 (0)	2021.11.12
[Boostcamp Day-66] EAST (0)	2021.11.12
[Wrap-up report] Semantic Segmentation (0)	2021.11.07
[실험 일지 Day-62] Pstages - Semantic Segmentation (0)	2021.11.06
[실험 일지 Day-61] Pstages - Semantic Segmentation (0)	2021.11.06

현재글[Boostcamp Day-67] 성능 평가 기준

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

JADE's Repository

[Boostcamp Day-67] 성능 평가 기준

데이터셋 제작 파이프라인

가이드 라인 제작 과정

Recall, Precision

Area Recall / Area Precision

One-to-One | One-to-Many | Many-to-One Match

DetEval (2013)

IoU (2015)

TIoU (Tightness-aware IoU)

CLEval (Character-Level Evaluation)

'Boostcamp AI Tech' 카테고리의 다른 글

'Boostcamp AI Tech'의 다른글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

[Boostcamp Day-67] 성능 평가 기준

데이터셋 제작 파이프라인

가이드 라인 제작 과정

Recall, Precision

Area Recall / Area Precision

One-to-One | One-to-Many | Many-to-One Match

DetEval (2013)

IoU (2015)

TIoU (Tightness-aware IoU)

CLEval (Character-Level Evaluation)

'Boostcamp AI Tech' 카테고리의 다른 글

'Boostcamp AI Tech'의 다른글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역