본문 바로가기
대학공부/기계학습

기계학습(ML)이란?

by 진진리 2023. 10. 10.
728x90
  • 기계학습(Machine Learning)?
    • '학습'을 하는 기계/알고리즘/도구/에이전트 등
    • 수집된 data로부터 pattern, knowledge, model, concept description을 찾아내는 것이며, 그러한 일을 하는 알고리즘을 기계학습 알고리즘이라고 함
    • 학습에 사용되는 '경험': 해당 도메인에서 모여진 데이터 혹은 시뮬레이션
  • 혼용되는 용어/분야들의 의도와 목적
    • 기계학습: 데이터(경험)로부터 유용한 일반화 패턴을 찾는 알고리즘에 대한 것. 정형 데이터에 주로 사용되었지만 최근에는 딥러닝의 성장으로 비정형 데이터를 다루기 시작했으며 '인식'쪽으로 확장해 나가고 있음.
    • 인공지능: 인간의 지능적인 행위를 흉내내는 모델을 만들고자 하는 것. 그 중 인간의 학습과 인식을 담당하는 것이 기계학습이며 그 외에도 지식표현 ,습득, 추론 등 포함.
    • Data Mining: 엄청난 양의 data로부터 유용한 정보/패턴을 찾는 것. 주로 마케팅이나 business data를 다루어 경영 의사결정의 insight를 얻고자 함. 데이터를 관리하고 정제하고 숨겨진 패턴과 insight를 찾고 그것을 활용하기 쉽게 표현하는 것을 모두 포함하는 일종의 process 관점.
    • Big Data: 주로 비정형데이터, 매일 자동으로 수집되는 data를 유용하게 사용. '활용' 관점이 더 큼.
    • Data Science: 데이터 마이닝과 비슷한 관점. data 속에 숨겨져 있는 패턴을 찾아서 insight를 찾아내는 모든 과정에 다 관심이 있음.

 

  • ML에서 사용되는 용어들
    • data: 속성(feature, attribure)들로 이루어진 instance들의 집합
    • label(target): 분류 혹은 예측하고자 하는 출력값
    • class: 분류 시 label에 속하는 범주
    • feature(attribute): 데이터를 정의하는 속성들
    • input: 원하는 결과를 얻기 위해 모델어 넣는 데이터의 속성 값들
    • training(learning): features를 통해 label을 예측하거나 분류하기 위한 모델을 만드는 것
    • predict(inference): label을 예측하기 위해 학습된 모델에 unlabeled 데이터를 적용하는 것

 

  • 알고리즘의 종류
    1. 분류(classification) -> supervised learning (지도학습)
    2. 군집(clustering) -> unsupervised learning (비지도 학습)
    3. 연관(association)
    4. 수치 예측 (Regression)

'대학공부 > 기계학습' 카테고리의 다른 글

Deep NN  (0) 2023.10.11
Feature selection, SVM, 앙상블  (0) 2023.10.11
Evaluation  (0) 2023.10.11
Classification(2)  (0) 2023.10.10
Classification(1)  (0) 2023.10.10