728x90
반응형
AI모델은 시간이 지남에 따라 해당 Task의 환경이 변하는 경우, 모델 성능이 저하되는 경향이 있다.
이를 Data Drift라고 부른다.
따라서 Data Drift를 해결하기 위해서는 정기적인 or 추가적인 학습이 필요할 때가 있다!
이를 해결하기 위한 방법 중 입력 데이터 stream 방식에 따라 구분되는 배치 학습, 온라인 학습과 같은 방법들이 있다.
Batch Learning(배치 학습)
학습할 때마다 가용한 데이터를 모두 사용하는 학습 방식
특징
- 전통적인 학습 방식
- 일반적으로 시간과 자원을 많이 소모
- 저장된 데이터로 학습하기 때문에 오프라인 방식, 오프라인 학습(Off-line Learning)이라고 불리기도 함
- 새로운 데이터를 학습하려면, 매 번 전체 데이터를 처음부터 다시 학습 해야 함
- 비교적 시간⇡, 비용⇡
On-line Learning(온라인 학습)
데이터를 순차적으로 mini-batch 단위로 주입하여 학습하는 방식
특징
- 매 학습 단계가 빠름
- 비교적 비용↓
- main memory에 들어갈 수 없는 매우 큰 데이터셋 학습 가능
- 변화가 빠른 분야에 적합
728x90
반응형