본문 바로가기
728x90

대학공부58

여러 가지 방법을 이용한 분류 1. k-최근접 이웃에 기반한 분류k-Nearest Neighbor(k-최근접 이웃, k-NN)가장 가까운 이웃 k개를 바탕으로 분류를 수행하는 방법데이터가 주어질 때마다 연산을 통한 분류가 이루어지므로, 엄밀하게는 학습이라고 하기 어려움 Python에서의 k-NN# 필수 라이브러리 불러오기import pandas as pdfrom sklearn.neighbors import KNeighborsClassifierfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import confusion_matrix# 지뢰와 보물 데이터 불러오기df = pd.read_csv('treasure.csv')# 주어진 데이터에서 입력 변수와 예측.. 2024. 4. 29.
인터넷 프로토콜(IP) 인터넷 프로토콜(IP)TCP/IP 프로토콜이 사용하는 전송 메커니즘TCP: 신뢰성 있음네트워크 계층(3계층) 프로토콜비신뢰성(Unreliable), 최선의 노력 전달 서비스데이터그램이 목적지에 성공적으로 도달한다는 것을 보장하지 않음비연결성(Connectionless): 전달되는 데이터그램에 대해 상태 정보 유지하지 않음데이터그램 방법을 사용하는 패킷 교환망(인터넷망)을 위해 설계된 비연결형 프로토콜 -> for 라우팅(최적 경로 설정)네트워크에서 전송될 수 있는 최대 크기가 1500bytes(MTU, 최대 전송 단위 - 이더넷의 경우)로 정해져 있으므로 패킷을 쪼개서 보냄(단편화)데이터그램IP 계층의 패킷가변 길이 패킷으로 헤더와 데이터(페이로드) 부분으로 구성헤더는 20~60 바이트라우팅에 필요한 정.. 2024. 4. 19.
DHCP Spoofing DHCP 스푸핑DHCP: 네트워크 상에 동적으로 IP 정보를 할당하여 사용자에게 편의를 제공하기 위한 프로토콜서버로부터 IP 주소, IP 만료 기한, subnet netmask, gateway, dns 서버를 자동으로 할당받는 서비스UDP로 동작하므로 인증이 불가능UDP 자체가 비신뢰성/비연결지향성 프로토콜이기 때문에 인증된 DHCP인지 판별 불가능DHCP 스푸핑: DHCP 프로토콜이 제공하는 정보를 변조해 타깃 PC를 속이는 공격 방법실제 IP 할당을 하기 전에 공격자가 할당공격자는 타깃 PC를 대상으로 ARP 스푸핑을 통해 스니핑(Sniffing)을 해야 함정상적인 DHCP 동작 과정DHCP 패킷의 동작 순서: DISCOVER - OFFER - REQUEST - ACK.. 2024. 4. 19.
언어 모델(Language Model): 통계적 언어 모델 언어 모델(Language Model, LM) 언어를 이루는 구성 요소(글자, 형태소, 단어, 단어열 혹은 문장, 문단 등)를 문맥으로 하여 이를 바탕으로 다음 구성 요소를 예측하거나 생성하는 모델 예시: 자동완성, 문장생성, 대화시스템, 음성인식, 기계번역, 문서요약 통계적 언어 모델(Statistical Language Model, SLM) 딥러닝 언어 모델(Deep Neural Network Lanuage Model, DNN LM) 통계적 언어 모델 주어진 문서(코퍼스) 내 단어열(혹은 문장)의 등장 확률을 기반으로 각 단어의 조합을 예측하는 전통적인 언어 모델 실제로 많이 사용하는 단어열(문장)의 확률 분포를 정확하게 근사하는 것이 모델의 목표 조건부 확률과 언어 모델 조건부 확률 P(B|A): .. 2024. 4. 12.
ARP Spoofing(ARP Cache Poisoning) ARP Spoofing ARP 캐시 테이블(동적인 IP와 MAC)이 공격 대상(정보 변경이 목적) 공격자가 지속적으로 ARP 응답을 보냄으로써 캐시 테이블을 변조 시키는 것 공격자는 MAC 주소를 위장해야 하므로 같은 네트워크에 위치해야 함 Alice가 Bob의 정보를 얻음 192.168.10.7 / BB:BB:BB:BB:BB:BB (정상적인 정보) 동적으로 저장되었다면 시간이 지나면 삭제되는 것을 허용 공격자는 정상적인 ARP Cache를 가지고 있음 step 1. Alice에게 요청 패킷을 받으면 공격자는 가상 reply 패킷 응답을 192.168.10.7 / CC:CC:CC:CC:CC:CC로 전송 동일하게 Bob에게도 192.168.10.5 / CC:CC:CC:CC:CC:CC으로 전송 Bob은 아무.. 2024. 4. 12.
개인정보 비식별화와 데이터 윤리 1. 가명 정보와 데이터 비식별화 국내법에 따른 정보의 분류 개인 정보: 주소, 휴대 전화 번호 등 특정 개인에 관한 정보 사전에 구체적 동의를 받아 제한된 범위에서 활용 가능 가명 정보: 추가 정보가 주어지지 않으면 개인을 알아볼 수 없는 정보 연구, 통계 작성 등에 한해 동의 없이 활용 가능 추가 정보: 암호화 당시 쓰인 키, 가명 처리 시 활용된 매핑 테이블, 가명 처리 알고리즘의 파라미터 등 익명 정보: 추가 정보가 주어져도 개인을 전혀 알아볼 수 없는 정보 활용 목적에 무관하게 자유로이 활용 가능 개인정보보호법의 적용 대상이 아님 데이터를 더 가치 있게, 비식별화 데이터 비식별화(De-Identification, Anonymization) 데이터 내에 개인 식별이 가능한 정보가 존재하는 경우, .. 2024. 4. 8.