728x90
Boostcamp AI Tech
141

[실험 일지 Day-76] P Stage - 모델 최적화(경량화)

베이스라인에서 FP16을 사용하여 Data를 불러왔음 -> FP16은 Floating Point 16을 말하고 뒤에 숫자 16은 정밀도를 말하는 것같다. 만약 FP32라고 한다면 32bit를 이용하여 실수를 저장하고 FP64라고 하면 64bit를 이용하여 실수를 저장한다. 그러니까 FP16을 사용하면 더 적은 bit를 사용하게되서 저장 공간도 절약되고 연산 속도도 빨라지는 것 같다. 하지만 정밀도에서는 당연히 떨어질 것이다. amp.gradscaler -> 특정 연산에 대한 forward pass에 float16 입력이 있는 경우 해당 연산에 대한 backward pass는 float16 gradient를 생성한다. 크기가 작은 gradient 값은 float16에서 표현할 수 없다. 이러한 값은 0(u..

Boostcamp AI Tech 2021.12.06

[Boostcamp Day-75] 최적화 소개 및 강의 개요

경량화의 목적 모델의 연구와는 별개로 산업에 적용되기 위해서 거쳐야하는 과정 요구조건(하드웨어 종류, latency 제한, 요구 throughput, 성능)들 간의 trade-off를 고려하여 모델 경향화/최적화를 수행 경량화, 최적화의 대표적인 종류 Efficient Architecture Design(+AutoML;Neural Architecture Search(NAS)) Network Pruning : 가지치기라고도 한다. 학습된 네트워크를 가지고 있다라고 했을 때 그 네트워크의 중요도가 낮은 파라미터들을 제거해서 사이즈를 줄여보자라는 접근법이다. Knowledge Distillation : 학습된 큰 규모의 teacher network가 있을 때 작은 student network의 teacher ..

Boostcamp AI Tech 2021.12.06

[주말 실험 일지 - 토] P Stage - OCR

multi scale을 적용하기 위해 augmentation을 탐색 -> rotate, flip, crop, resize를 전체적으로 실행하는 방법을 사용 -> patch를 정의하여 patch 영역 내에 box가 잘리지 않고 있을때 추출해주는 방법이 적용됨 flip을 적용했을때 angle_loss가 높게 나옴 -> flip을 적용하지 않고 rotate도 0.5로 줄임 데이터셋은 annotation 실습 결과물 + MLT 데이터셋을 추가한 것으로 학습 multi scale을 적용하고 inference를 했더니 결과값이 아무것도 안나옴...

Boostcamp AI Tech 2021.11.22

[실험 일지 Day-73] P Stage - OCR

테스트 데이터셋의 이미지들은 1500 사이즈를 넘어가지 않기때문에 ICDAR2019_ArT 데이터셋에서 1500 사이즈가 넘어가는 이미지는 제외 -> 언어는 영어, 중국어 두 종류가 있으며 영어만 뽑은 데이터셋과 중국어를 포함한 데이터셋으로 나누어 json 파일을 저장 -> 전체 이미지 중 1000장을 sampling하여 val set으로 저장 해당 대회는 문자를 인식하여 box를 그리는 것이므로 다양한 언어를 학습시키는게 좋을 거 같음 야외 촬영 이미지 데이터셋도 각 종류별로 50장씩 sampling하여 val set으로 저장 야외 촬영 이미지와 ICDAR2019_ArT를 추가하여 돌렸을 때 Loss가 잘 줄어들지 않음 -> 데이터 수가 많아서 금방 학습이 된것인가.... test set을 한 번 돌려..

Boostcamp AI Tech 2021.11.22

[주말 실험 일지 - 토] P Stage - OCR

autocad를 사용하여 labeling하는 것을 한 번 진행해봄 ICDAR2019_ArT 데이터셋을 다운받음 -> UFO 형식으로 변경하고 points 4개 짜리가 없을 경우 이미지를 삭제함 -> 모델이 points 4개인 box만 학습하기 때문 AI hub에 있는 야외 촬영 이미지를 다운받음 -> 전체 다운로드를 받으려니 435GB.... -> train, validation에서 zip 파일 하나씩 선택하여 다운받음(그래도 오래걸림... 10시간 정도?) 어제 눈바디 다시 제출했는데 아직 결과가 안나옴... -> 너무 느리다....

Boostcamp AI Tech 2021.11.22
728x90