분류 전체보기 281

자연어처리 task

자연어처리 모델의 학습 방법 트랜스퍼 러닝(Transfer Learning): 특정 태스크를 학습한 모델을 다른 태스크 수행에 재사용하는 기법 특징 기존보다 모델의 학습 속도가 빨라짐 새로운 태스크를 더 잘 수행 업스트림(Upstream) 태스크 모델이 대규모의 코퍼스를 가지고 문맥을 고려하면서 태스크 수행 대표적인 업스트림 태스크 다음 단어 맞히기 빈칸 채우기(BERT-Masked Language Model) GPT 계열 모델 다운스트림(Downstream) 태스크 자연어처리의 구체적인 태스크 성능을 올리기 위해 (업스트림 태스크로 Pre-training) 다운스트림 태스크의 본질은 Classification 자연어를 입력받아 해당 입력이 어떤 범주에 해당하는지 확률 형태로 반환 문서분류, 자연어추론,..

선형 회귀를 이용한 예측과 그 응용

1. 상관계수와 상관분석의 기초 두 변량의 상관관계는? 상관계수 Pearson Correlation Coefficient 두 변수 사이에 존재하는 선형적인 상관관계를 수치로 나타낸 것 크기는 -1 ~ +1으로, 값이 0일 경우 상관관계가 없는 것임 부호가 (+)이면 양의 상관관계, 부호가 (-)이면 음의 상관관계를 의미 DataFrame 내에서의 상관계수 도출 english.csv : TOEIC, TEPS, TOEFL의 점수 파일 import pandas as pd df = pd.read_csv('english.csv') df_corr = df.corr(method = 'pearson') df_corr 주어진 데이터 중 결측치가 부분적으로 존재할 때 pandas는 어떻게 상관계수를 계산? 해당 데이터 쌍..

탐색적 데이터 분석(EDA)과 데이터 시각화

1. 공공데이터 품질 관리와 오류율 데이터 품질 지표(DQI) 일관성: 데이터 품질 오류율의 표준 오류율과 직결된 세부 지표: 속성 / 표준 / 중복값 / 연계값 개체의 속성이 표준을 준수하고 있으며 중복되지는 않는가? 데이터 연계에 있어서 일관성이 유지되고 있는가? 완전성: 데이터 품질 오류율의 구조 오류율과 직결된 세부 지표: 논리 모델 / 식별자 / 물리구조 / 속성의미 데이터베이스 구축에 있어 논리적 설계와 물리적 구조가 올바르게 구축되었는가? 정확성: 데이터 품질 오류율의 값 오류율과 직결된 세부 지표: 입력값 / 업무규칙 / 범위, 형식 / 참조관계 / 계산식 데이터가 유효한 범위 및 형식으로 구성되어 있는가? 준비성 데이터 품질 관리 정책 및 지침이 기관에 맞게끔 잘 정의되어 있는가? 경영자..

네트워크의 구성요소

네트워크의 구성 공유기 -> ISP(인터넷 서비스 제공업체 ex. SKT, KT, U+ 등) 단말기를 통해 공유기로 접속 왼쪽 영역을 LAN, 오른쪽 영역을 WAN 구간이라고 함 네크워크 구성 요소 단말기(노트북, 컴퓨터)와 네트워크 서비스를 제공하는 프로그램 접속 장치(스위치, 라우터, 허브) L2 스위치: 한 네트워크 내부에서 데이터 전송을 수행하는 장치로 네트워크 입구 - 데이터 링크 계층(MAC 주소) 허브: 연결된 단말기 수만큼 속도가 1/N된다는 문제로 스위치가 등장 여러 개의 단말기에서 동시에 데이터를 전송할 때 충돌이 발생 Collision Domain: 충돌이 발생할 수 있는 범위 Broadcast Domain: 한 단말기에서 네트워크 내의 모든 단말기와 통신하고자 할 때 도달할 수 있는..

자연어 분석

자연어 분석 단계 자연언어 문장 형태소 분석 구문 분석 - 문장의 구조 이해 의미 분석 - 중의성 확인 화용 분석 어휘 분석 형태소 분석이란? 어휘 분석: 단어의 구조를 식별하고 분석을 통한 어휘의 의미와 품사에 관한 단어 수준의 연구 형태소 분석: 더 이상 분해될 수 없는 최소한의 의미 단위인 형태소를 자연어의 제약 조건과 문법 규칙에 맞춰 분석하는 것 필요성: 한국어는 조사에 따라 의미가 변함 ex. 날다 -> 나는 (Me or Fly?) // 일종의 중의성 고유명사, 사전에 등록되지 않은 단어 처리에 도움이 됨 형태소 분석 절차 단어에서 최소 의미를 포함하는 형태소 후보로 분리 형태소 분석의 처리 대상: 어절(하나 이상의 형태소가 연결된 것) 형태소열 예시) 한국어(Korean)는 = 한국어 + (..

Docker Image 심화

Dockerfile 최적화 빠르게 만들기: Docker 이미지 만드는 시간을 줄일 수 있음 이미지 크기 줄이기: 저장 공간을 덜 차지하고 다운로드나 전송할 때도 더 빨라짐 재사용성 높이기: 여러 번, 여러 곳에서 쓸 수 있어서 편리 보안 강화 유지보수 쉽게: 나중에 수정하거나 업데이트할 때 훨씬 쉬움 # build 는 gradle 이미지에서 `builder`라는 이름으로. FROM gradle:8.5-jdk21-alpine AS builder WORKDIR /app COPY ./ ./ RUN gradle clean bootJar # App FROM eclipse-temurin:21-jre-alpine WORKDIR /app COPY --from=builder /app/build/libs/spring-bo..

Docker Network

Docker Network 이해 도커 컨테이너끼리 서로 통신할 수 있게 도와주는 네트워크 컨테이너 네트워크 모델(CNM) : 도커에서 네트워크를 쉽고 효율적으로 구축할 수 있도록 도와주는 네트워크 모델 샌드박스: 컨테이너를 외부 세계로부터 완전히 분리 엔드포인트: 외부 세계와 샌드박스 사이의 연결점 네트워크: 엔드포인트에서 다른 엔드포인트로 데이터를 보내는 길 실습 # back, front 네트워크 생성 docker network create --driver=bridge back docker network create --driver=bridge front # 각 서비스를 생성 및 실행 docker run --name=webapi -itd --net=front ubuntu:14.04 docker run ..

Docker volume

Volume 사용 이유 데이터 영속성: 컨테이너가 사라져도 데이터는 그대로 남음 같은 데이터를 여러 컨테이너가 사용 데이터를 백업하고 옯기기 쉬움 많은 양의 데이터를 다룰 때 더 빠르게 처리해줌 데이터를 안전하게 보관: 중요한 데이터를 컨테이너 밖에 따로 안전하게 보관 코드와 데이터를 따로: 코드를 바꿔도 데이터는 그대로 유지. 개발 및 운영에 편리 volume 컴퓨터의 특정 폴더 (대부분 /var/lib/docker/volumes/ 라는 곳)에 Docker가 관리해서 사용하는 데이터를 여기에 저장 볼륨의 좋은 점 백업하고 옮기기 쉬움 Docker 명령어로 관리 어디서나 잘 작동 여러 컨테이너와 함께 사용 가능 볼륨 드라이버로 더 많은 기능을 추가 가능 Mac이나 Windows에서 더 빠르게 돌아감 bi..

Docker 모니터링&로깅

도커 모니터링 컨테이너의 성능, 사용중인 자원(CPU, 메모리), 네트워크 사용량 같은 것들을 확인 모니터링 정보를 통해 문제를 빨리 발견하고 해결할 수 있음 컨테이너를 효율적으로 관리하고 최적화할 수 있음 docker stats : Docker에서 제공하는 간단하고 실용적인 모니터링 도구 CPU 사용률, 메모리 사용량, 네트워크 I/O, 디스크 I/O 등 여러 중요한 정보를 보여줌 특정 컨테이너의 상태만 보고 싶다면 docker stats [컨테이너 이름 또는 ID] htop : 시스템 모니터링의 필수 도구 리눅스 시스템을 모니터링하는데 사용되는 도구 주요 기능 실시간 모니터링: CPU, 메모리, 스왑 사용량을 실시간으로 볼 수 있음 프로세스 관리: 실행 중인 프로세스를 쉽게 확인하고 필요하면 종료시킬..

Docker Compose

Docker Compose 사용 이유 편하게 설정: 여러 컨테이너를 한 번에 쉽게 설정 가능 자동 배포: 설정 파일이 있으면 Docker Compose가 알아서 컨테이너들을 만들어 주고 실행 의존성 관리: 컨테이너들이 서로 의존하는 관계 관리 모니터링과 로깅 확장성: 여러 컨테이너를 하나의 그룹으로 관리하고 확장하기 쉬움 유연성: 개발 환경, 테스트 환경, 실제 운영 환경에서도 같은 설정 파일을 써서 일관성을 유지 가능 보안 강화: 컨테이너들의 네트워크를 분리해서 외부로부터의 접근을 제한 유지보수가 쉬워요: 설정 파일 하나로 컨테이너들을 관리하기 때문에 파일만 수정하면 됨 Docker Compose 사용 환경 개발 환경에서 앱을 따로 떼어 놓고 실행하고 테스트할 수 있는 환경 Compose 파일은 앱이 ..