728x90
- 기계학습(Machine Learning)?
- '학습'을 하는 기계/알고리즘/도구/에이전트 등
- 수집된 data로부터 pattern, knowledge, model, concept description을 찾아내는 것이며, 그러한 일을 하는 알고리즘을 기계학습 알고리즘이라고 함
- 학습에 사용되는 '경험': 해당 도메인에서 모여진 데이터 혹은 시뮬레이션
- 혼용되는 용어/분야들의 의도와 목적
- 기계학습: 데이터(경험)로부터 유용한 일반화 패턴을 찾는 알고리즘에 대한 것. 정형 데이터에 주로 사용되었지만 최근에는 딥러닝의 성장으로 비정형 데이터를 다루기 시작했으며 '인식'쪽으로 확장해 나가고 있음.
- 인공지능: 인간의 지능적인 행위를 흉내내는 모델을 만들고자 하는 것. 그 중 인간의 학습과 인식을 담당하는 것이 기계학습이며 그 외에도 지식표현 ,습득, 추론 등 포함.
- Data Mining: 엄청난 양의 data로부터 유용한 정보/패턴을 찾는 것. 주로 마케팅이나 business data를 다루어 경영 의사결정의 insight를 얻고자 함. 데이터를 관리하고 정제하고 숨겨진 패턴과 insight를 찾고 그것을 활용하기 쉽게 표현하는 것을 모두 포함하는 일종의 process 관점.
- Big Data: 주로 비정형데이터, 매일 자동으로 수집되는 data를 유용하게 사용. '활용' 관점이 더 큼.
- Data Science: 데이터 마이닝과 비슷한 관점. data 속에 숨겨져 있는 패턴을 찾아서 insight를 찾아내는 모든 과정에 다 관심이 있음.
- ML에서 사용되는 용어들
- data: 속성(feature, attribure)들로 이루어진 instance들의 집합
- label(target): 분류 혹은 예측하고자 하는 출력값
- class: 분류 시 label에 속하는 범주
- feature(attribute): 데이터를 정의하는 속성들
- input: 원하는 결과를 얻기 위해 모델어 넣는 데이터의 속성 값들
- training(learning): features를 통해 label을 예측하거나 분류하기 위한 모델을 만드는 것
- predict(inference): label을 예측하기 위해 학습된 모델에 unlabeled 데이터를 적용하는 것
- 알고리즘의 종류
- 분류(classification) -> supervised learning (지도학습)
- 군집(clustering) -> unsupervised learning (비지도 학습)
- 연관(association)
- 수치 예측 (Regression)
'대학공부 > 기계학습' 카테고리의 다른 글
Deep NN (0) | 2023.10.11 |
---|---|
Feature selection, SVM, 앙상블 (0) | 2023.10.11 |
Evaluation (0) | 2023.10.11 |
Classification(2) (0) | 2023.10.10 |
Classification(1) (0) | 2023.10.10 |