728x90 대학공부58 Classification(2) NN(Neural Network) 장점: 가장 강력한 분류 도구, noisy에 매우 강함. 임의의 non-linear discrimination(판별식) 제공 단점: 적절한 구조(hidden layer, unit 개수 등)을 모름(->overfit 정도를 바탕으로 판단) NN이 학습한 것을 통역 불가능(->통역 가능한 DT보다 성능 좋음) MLP(Multi-Layer Perceptron, shallow NN) perceptron의 x1, x2 -> hidden layer h1, h2 -> y 1~2개의 hidden layer 추가: hidden layer의 에러값을 알 수 없음. layer마다 우리가 알지 못하는 새로운 feature(hidden unit), 임의의 decision boundary를 스스.. 2023. 10. 10. Classification(1) Classification 모델 class에 따라 data instance를 잘 분류하는 것. feature space에서 분류하는 boundary 혹은 hyperplane을 찾는 것. 모델 종류: linear model, non-linear model, tree model 에러 계산 방식(최적화 방식) error-rate, 거리 계산 probability (data point를 가지고 확률 분포 결정) 영역을 divide-and-conquer 전략으로 gradient discent 방식으로 1. Zero-R(0R) label의 각 class 개수만 따져서 그 확률로 판단. minimum(baseline) 성능 ex. class{ yes, no }에서 yes가 9개, no가 5개인 경우: 9/14=약 6.. 2023. 10. 10. 기계학습(ML)이란? 기계학습(Machine Learning)? '학습'을 하는 기계/알고리즘/도구/에이전트 등 수집된 data로부터 pattern, knowledge, model, concept description을 찾아내는 것이며, 그러한 일을 하는 알고리즘을 기계학습 알고리즘이라고 함 학습에 사용되는 '경험': 해당 도메인에서 모여진 데이터 혹은 시뮬레이션 혼용되는 용어/분야들의 의도와 목적 기계학습: 데이터(경험)로부터 유용한 일반화 패턴을 찾는 알고리즘에 대한 것. 정형 데이터에 주로 사용되었지만 최근에는 딥러닝의 성장으로 비정형 데이터를 다루기 시작했으며 '인식'쪽으로 확장해 나가고 있음. 인공지능: 인간의 지능적인 행위를 흉내내는 모델을 만들고자 하는 것. 그 중 인간의 학습과 인식을 담당하는 것이 기계학습이며.. 2023. 10. 10. Software Fault-Tolerance 하드웨어의 경우: TMR(Triple Modular Redundancy), RAID 등 Recobery block: alternative의 적합성 여부를 Acceptance test로 검사 실패한 경우 후보가 있으면 alternative 실행 실패하는 경우를 대비한 checkpoint estabilish / restore 문제점 acceptance test에서 문제가 발생하는 경우 fail-tolerance 불가능. 비교적 시간이 걸리므로 domain dependent(실시간 sw에 영향을 미침). acceptance test와 alternative간의 근본적인 차이가 없음. alternative간의 common mode failure를 피하기 어렵고 우선순위 설정 어려움. 지원하는 언어가 없고 chec.. 2023. 10. 6. Software Testing Test를 pass하는 기준은 expected output: 테스팅을 통해 알 수 있는 것은 expected output과 actual output이 같다는 것 테스팅이 어려운 이유 실제 사용되는 환경에서 검증하기 어려움 소프트웨어가 처리해야 하는 모든 입력값의 범위 및 조합에 대한 테스팅이 현실적으로 불가능 오작동이 입력값외에 환경에 영향을 받을 수 있음 multithread 프로그램인 경우 소프트웨어의 행위 및 출력이 수행할 때마다 달라짐 프로그래밍 언어에 따라 다른 테스팅 기법 적용 결함이 없다고 보장 불가능 Combinatorial testing: 시스템에 대한 입력 매개변수에 대해 모든 가능한 개별 조합을 테스트 Random testing: random possible input을 생성, 모든 .. 2023. 10. 6. Software Metric: Cost Estimation, COCOMO, Function Point Software Cost Estimation: 프로젝트 비용 예측. 프로젝트 관리를 위해 기본적인 데이터가 필요. 요구사항과 개발 환경의 변화가 없다면 일정과 비용에 미치는 영향에 대한 양적인 측정이 가능. Cost Estimation 접근들: Rules of thumb(과거 프로젝트로부터의 짐작), Top-down/Bottom-up estimating, Algorithmic models (COCOMO, Function Point 등) COCOMO(Constructive Cost Model): 데이터를 수집하여 만든 개발 기간과 프로젝트 크기 간의 관계 개발 노력(SM) = 2.4(a) * (프로그램 규모=라인 수)^1.05(b) 개발 기간(TDEV) = 2.5(c) * (SM)^0.38(d) 적정 투입.. 2023. 10. 6. 이전 1 ··· 5 6 7 8 9 10 다음