Okt1 [텍스트 분석] konlpy 한글 형태소 분석 0. 텍스트 전처리 단계 1. 데이터 정제 (Python 문법, 정규표현식 사용) 2. 영어/한글에 따라 전처리 진행(nltk, konlpy) 토큰화 : 텍스트의 단위를 token으로 나누기 문장토큰화/단어토큰화/단어보다 더 작은 형태로 토큰화 정규화 : 어간 추출, 표제어 추출 ex) go, goes > go 품사 태깅 : 명사, 대명사, 형용사 등으로 분석 요구에 따라 태깅 👉 이번 포스팅 : konlpy 라이브러리를 사용하여 형태소 분석 하는 방법 (mac 사용자의 경우, 설치 과정이 복잡하고 에러가 빈번하므로 Jupyter보다 Colab에서 사용하길 권장한다) 1. Konlpy 라이브러리 설치 및 임포트 Konlpy(Korean Natural Language Processing in Python).. 2024. 2. 22. 이전 1 다음