
본 포스팅은 『텐서플로2와 머신러닝으로 시작하는 자연어처리』를 참고하여 만들어졌습니다. https://wikibook.co.kr/nlp-tf2/ 자연어 처리를 위해서는 우선 텍스트에 대한 정보를 단위별로 나누는 것이 일반적이다. 예측해야 할 정보(문장 혹은 발화)를 하나의 특정 기본 단위로 자르는 것을 토크나이징이라고 한다. 파이썬을 이용하면 이러한 작업을 라이브러리를 통해 간편하게 처리할 수 있다. 토크나이징을 할 때는 언어의 특징에 따라 처리 방법이 달라지므로 영어 토크나이징과 한글 토크나이징을 구분해서 알아보자. 1. 영어 토크나이징 라이브러리 영어의 경우 NLTK(Natural Language Toolkit)와 Spacy가 토크나이징에 많이 쓰이는 대표적인 라이브러리이다. 1) NLTK (Natu..
인공지능, 자연어처리/텐서플로2와 머신러닝으로 시작하는 자연어처리
2021. 1. 3. 14:03
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 심리학
- 당신의 그림자가 울고 있다.
- 그림자
- Tutorial
- word vector
- web
- Mikolov
- WebProgramming
- AI
- 융
- CBOW
- 자연어처리
- 인공지능
- 알고스팟
- 코딩하는 신학생
- NLP
- 젠심
- text classification
- Polls
- 분석심리학
- word2vec
- django
- lstm
- Skip-gram
- Python
- 로버트존슨
- 코딩테스트
- 텍스트분류
- word embedding
- 단어표현
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함