본문 바로가기
728x90

전체 글247

Deep NN MLP (=shallow NN): hidden layer 1~2개 -> 모든 non-linear 형태의 모델을 생성 가능 feature가 알려진 모든 정형 데이터는 MLP에서 더 성능이 뛰어남 이미지, 소리, 텍스트 데이터는 다루지 못함 해결 idea: hidden layer를 더 늘리기 -> Deep Neural Network: hidden layer가 10개 정도 문제: hidden layer의 depth를 늘리자 학습이 안됨 - 이유: Vanishing Gradient 문제 Vanishing Gradient 문제: 미분할 수록 gradient의 값이 점점 작아지면서 사라짐 - sigmoid 함수때문에 발생 Backpropagation에서 y(sigmoid)가 계속 미분되면서 적용됨 gradient는.. 2023. 10. 11.
Feature selection, SVM, 앙상블 Feature selection: 기존 features의 subset을 선택 feature의 수가 많을 때 상대적으로 sample의 수가 적으면 모델이 overfit됨 필요한 feature를 골라 사용하여 성능 향상 제거해야 하는 feature: irrelevant, redundant features 어떻게 판단? filter methods: 하나씩 제거해서 만든 모델의 성능을 각각 평가하여 feature의 순위를 매김. feature를 개별적으로 평가. wrapper methods: 모든 가능한 조합에 대하여 test하여 최적의 조합을 선택. feature가 서로 독립적이지 않으므로 사용. complexity가 높음. embedded methods: 여러 머신러닝 모델로 training 시킨 후 그 모.. 2023. 10. 11.
Evaluation available data가 전체 domain은 잘 표현하는지, 모델의 성능을 어떻게 평가? 그 외의 신뢰성, 공정성, 윤리성, 안전성의 문제가 존재 원인은 데이터 or 최적화 알고리즘에서 초래됨 test data set을 가지고 평가하고자 하는 성능을 "Generalization(일반화)"하는 방법 다양한 모델 사용, 특정 모델의 parameter 값에 따라, feature에 따라... 모델의 정확성을 위한 training / test / validation set의 적절한 비율 dig data set: 60% / 20% / 20% middle size data set(충분한 양): training 60%, test 40% dataset의 크기가 작을 경우? training set으로 test: gen.. 2023. 10. 11.
[프로그래머스] 문자열 내림차순으로 배치하기(Java) import java.util.Arrays; class Solution { public String solution(String s) { char[] char_arr = s.toCharArray(); Arrays.sort(char_arr); String str = new String(char_arr); String answer = ""; int len = str.length(); for(int i=0;i 2023. 10. 10.
자주 쓰는 함수 타입 변환 문자열(String)을 숫자(int)로: int a = Integer.parseInt(String b) 숫자(int)를 문자열(String)으로: String b = Integer.toString(int a) Long형일 때는 Long.toString() 문자를 문자열(String)으로: String str = String.valueOf(char c) 대소문자 확인 Character.isUpperCase(char c) Character.isLowerCase(char c) n의 제곱근(double 형) Math.sqrt(n) 배열 import java.util.Arrays; 정렬하기: Arrays.sort(정렬할 배열); 배열 자르기: arr1 = Arrays.copyOfRange(arr0, s.. 2023. 10. 10.
Classification(2) NN(Neural Network) 장점: 가장 강력한 분류 도구, noisy에 매우 강함. 임의의 non-linear discrimination(판별식) 제공 단점: 적절한 구조(hidden layer, unit 개수 등)을 모름(->overfit 정도를 바탕으로 판단) NN이 학습한 것을 통역 불가능(->통역 가능한 DT보다 성능 좋음) MLP(Multi-Layer Perceptron, shallow NN) perceptron의 x1, x2 -> hidden layer h1, h2 -> y 1~2개의 hidden layer 추가: hidden layer의 에러값을 알 수 없음. layer마다 우리가 알지 못하는 새로운 feature(hidden unit), 임의의 decision boundary를 스스.. 2023. 10. 10.