본문 바로가기
728x90

대학공부/자연어처리5

언어 모델(Language Model): 통계적 언어 모델 언어 모델(Language Model, LM) 언어를 이루는 구성 요소(글자, 형태소, 단어, 단어열 혹은 문장, 문단 등)를 문맥으로 하여 이를 바탕으로 다음 구성 요소를 예측하거나 생성하는 모델 예시: 자동완성, 문장생성, 대화시스템, 음성인식, 기계번역, 문서요약 통계적 언어 모델(Statistical Language Model, SLM) 딥러닝 언어 모델(Deep Neural Network Lanuage Model, DNN LM) 통계적 언어 모델 주어진 문서(코퍼스) 내 단어열(혹은 문장)의 등장 확률을 기반으로 각 단어의 조합을 예측하는 전통적인 언어 모델 실제로 많이 사용하는 단어열(문장)의 확률 분포를 정확하게 근사하는 것이 모델의 목표 조건부 확률과 언어 모델 조건부 확률 P(B|A): .. 2024. 4. 12.
자연어처리 task 자연어처리 모델의 학습 방법 트랜스퍼 러닝(Transfer Learning): 특정 태스크를 학습한 모델을 다른 태스크 수행에 재사용하는 기법 특징 기존보다 모델의 학습 속도가 빨라짐 새로운 태스크를 더 잘 수행 업스트림(Upstream) 태스크 모델이 대규모의 코퍼스를 가지고 문맥을 고려하면서 태스크 수행 대표적인 업스트림 태스크 다음 단어 맞히기 빈칸 채우기(BERT-Masked Language Model) GPT 계열 모델 다운스트림(Downstream) 태스크 자연어처리의 구체적인 태스크 성능을 올리기 위해 (업스트림 태스크로 Pre-training) 다운스트림 태스크의 본질은 Classification 자연어를 입력받아 해당 입력이 어떤 범주에 해당하는지 확률 형태로 반환 문서분류, 자연어추론,.. 2024. 3. 27.
자연어 분석 자연어 분석 단계 자연언어 문장 형태소 분석 구문 분석 - 문장의 구조 이해 의미 분석 - 중의성 확인 화용 분석 어휘 분석 형태소 분석이란? 어휘 분석: 단어의 구조를 식별하고 분석을 통한 어휘의 의미와 품사에 관한 단어 수준의 연구 형태소 분석: 더 이상 분해될 수 없는 최소한의 의미 단위인 형태소를 자연어의 제약 조건과 문법 규칙에 맞춰 분석하는 것 필요성: 한국어는 조사에 따라 의미가 변함 ex. 날다 -> 나는 (Me or Fly?) // 일종의 중의성 고유명사, 사전에 등록되지 않은 단어 처리에 도움이 됨 형태소 분석 절차 단어에서 최소 의미를 포함하는 형태소 후보로 분리 형태소 분석의 처리 대상: 어절(하나 이상의 형태소가 연결된 것) 형태소열 예시) 한국어(Korean)는 = 한국어 + (.. 2024. 3. 20.
자연어처리의 기본 자연어처리란 자연어: 사람들의 사회생활에서 자연스럽게 발생하여 쓰이는 언어 자연어 처리: 자연어를 컴퓨터를 이용하여 이해하고 생성하도록 하는 제반의 언어 NLU(자연어 이해) + NLG(자연어 생성) 자연어처리의 응용 분야 기계번역, 문서요약, 기계독해, 개인비서 서비스, 로봇 저널리즘, 문서분류, 챗봇, 감성분석 자연어처리가 어려운 이유 (1) 언어의 중의성 중의성: 단어, 어절 그리고 구 등 하나의 언어적 단위가 두 가지 이상의 해석이 가능한 것 같은 글자의 조합이 여러 의미를 가지고 있음 -> 처리의 복잡도가 상승 (2) 규칙의 예외 형태론: 언어의 규칙을 연구하는 분야 규칙을 모든 단어에 그대로 적용할 수 없음 -> 처리의 복잡도가 상승 (3) 언어의 유연성과 확장성 구조 문법: 문장의 여러 단어.. 2024. 3. 13.
인간 지능을 흉내 내는 인공지능 인공지능의 정의 인간의 학습능력과 추론능력, 지각능력, 자연언어의 이해능력 등을 컴퓨터 프로그램으로 실현한 기술 인간의 지능이 가지는 학습, 추리, 적응, 논증 따위의 기능을 갖춘 컴퓨터 시스템 지능적으로 행동하는 계산 에이전트를 만들고 분석하는 학문 분야 충돌하는 관점 앨런 튜링의 튜링 테스트 튜링 테스트를 통과한 기계는 생각한다고 간주해도 된다. 철학자 존 설의 중국인의 방 컴퓨터 프로그램은 중국어 질문을 전혀 이해하지 못한 채 튜링 테스트를 통과할 수 있음 튜링 테스트를 통과해도 생각한다고 말하면 안 됨 인공지능의 역사 제1차 AI붐 1950년 : Alan Mathison Turing 학습하는 기계에 대한 논문 발표 Turing machine 고안 2차 세계 대전, 에니그마 해독 1956년 : Jo.. 2024. 3. 13.