Boostcamp AI Tech

[Boostcamp Day-65] 데이터 제작의 중요성

ju_young 2021. 11. 12. 19:25
728x90

Software 1.0

  1. 문제 정의
  2. 큰 문제를 작은 문제들의 집합으로 분해
  3. 개별 문제 별로 알고리즘 설계
  4. 솔루션들을 합쳐 하나의 시스템으로
  • TCP/IP Stack : Internet, Android Stack : Smartphone 과 같은 많은 곳에서 큰 성과를 이룸
  • 이미지 인식 기술도 처음에는 Software 1.0 철학으로 개발됨

Software 2.0

  • Software 1.0의 경우 사람 수와 시간의 제약으로 복잡한 프로그램은 개발하기 어려움(어떤 연산을 할지 사람이 개입하여 정함)
  • Software 2.0은 뉴럴넷의 구조에의해 검색 영역이 정해짐

 

  • 최적화를 통해 사람이 정한 목적에 제일 부합하는 연산의 집합을 찾음

  • 이때 경로와 목적지는 데이터와 최적화 방법에 의해서 정해짐

  • 구조를 설계하는 데에는 사람의 개입이 필요하지만 점점 개입을 줄이고 최적화에 더 신경씀

Software 1.0 & 2.0


  • Software 1.0 : 사람이 고민하여 프로그램을 만듬
  • Software 2.0 : AI 모델의 구조로 프로그램의 검색 범위를 한정하고 데이터와 최적화를 통해 최적의 프로그램을 찾음

Production Process of AI Model


목표는 요구사항을 충족시키는 모델을 지속적으로 확보하는 것이고 다음과 같이 두 가지 방법이 있음

  1. Data-Centric : 데이터만 수정하여 모델 성능 올리기
  2. Model-Centric : 데이터는 고정시키고 모델 성능 올리기
  • 모델 성능 달성에 있어서 데이터와 모델의 비중은 50:50
  • 사용 중인 모델의 성능 개선 시에 데이터와 모델의 비중은 80:20

 

728x90