4.1 데이터에서 학습한다!
신경망은 데이터를 보고 학습할 수 있다.
=> 가중치 매개변수의 값을 데이터를 보고 자동으로 결정한다.
지금까지는 직접 매개변수를 설정하였는데, 이제야 딥러닝으로 들어간 느낌이 물신난다.
4.1.1 데이터 주도 학습
드디어! 기계학습의 이야기를 하기 시작했다.
이미지 패턴을 예시로 들자면, 이미지에서 특징을 추출하고 그 특징의 패턴을 기계학습 기술로 학습한다.
이미지의 특징은 보통 벡터로 기술하고, Computer vision에서는 SIFT, SURF, HOG 등을 사용한다.
이미지 데이터를 벡터로 변환하고, 이 벡터를 가지고 학습하는 방법이 SVM, KNN 과 같은 것들이다.
그런데 이미지를 벡터로 변환할 때 사용하는 특징은 사람이 설계하는 것이다.
하지만 딥러닝은 사람이 개입하는 것이 아니다.
신경망은 이미지를 '있는 그대로' 학습한다.
딥러닝은 end-to-end ml 이라고도 한다. (종단간 기계학습)
만약에 개냐 고양이냐? 아니면 숫자가 무엇이냐? 와 같이 다른 문제에 대해서는 기계학습의 알고리즘이 달라져야 한다. 분류의 특징이 달라지기 때문이다. 하지만 딥러닝이라면 주어진 데이터를 그대로 입력 데이터로 활용해 end-to-end로 학습할 수 있다.
4.1.2 훈련 데이터와 시험 데이터
기계학습 문제는 데이터를 훈련 데이터와 시험 데이터로 나눠 학습과 실험을 수행하는 것이 일반적이다.
- 훈련 데이터만 사용하여 학습하면서 최적의 매개변수를 찾는다.
- 시험 데이터를 사용하여 앞서 훈련한 모델의 실력을 평가한다.
=> 아직 보지 못한 데이터로도 문제를 올바르게 풀어내는지 테스트 하기 위함이다. (범용 능력)
'머신 러닝 및 파이썬 > 밑바닥부터 시작하는 딥러닝' 카테고리의 다른 글
Ch.4 신경망 학습/ 4.3 수치 미분 4.4 기울기 (0) | 2020.02.27 |
---|---|
Ch.4 신경망 학습/ 4.2 손실함수 (0) | 2020.02.26 |
Ch.3 신경망/ 3.5 출력층 설계하기 (0) | 2020.02.23 |
Ch.3 신경망/ 3.4 삼층 신경망 (0) | 2020.02.23 |
Ch.3 신경망/ 3.1~3.2 활성화 함수 (0) | 2020.02.22 |