티스토리 뷰
본 포스팅은 『텐서플로2와 머신러닝으로 시작하는 자연어처리』를 참고하여 만들어졌습니다.
https://wikibook.co.kr/nlp-tf2/
언어 생성이란 무엇일까? 사람이 언어를 생성하는 과정을 생각해보자. 일반적으로 글을 쓰거나 말을 할 때 어떠한 주제에 대한 목적 의식을 가지고 언어에 맞는 문법과 올바른 단어를 사용해 문장을 생성한다. 신문 기사가 될 수도 있고, 상대방과의 대화, 문장 요약 등 언어를 활용해 우리는 서로 "소통(Communication)"하면서 살아간다. 그렇다면 컴퓨터가 상대방의 대화를 이해하고 글도 쓴다면 어떨까? 로봇에게만 적용해도 우리의 삶은 현재와는 다른 세상이 될 것이다. 실제로 기술이 진보하면서 이와 관련된 사례들이 조금씩 나오고 있다. 하지만 일반적으로 감정 및 논리력이 들어가는 글을 작성하는 데는 아직까지 한계가 있어서 보조 도구로 쓰이고 있는 상태이며, 관련 영역에 해당하는 많은 데이터가 필요하다.
컴퓨터는 0과 1로 이뤄져 있다. 따라서 감정이나 논리 같은 숫자로 정량화하기 어려운 내용이 포함된 문장에 대해서는 아직까지는 컴퓨터가 작성하기 어렵지만 사실 기반의 기록에서는 충분히 효과적이다. 예를 들어, 비즈니스에 관해 분석한 결과를 글로 표현하거나, 이메일이나 문자의 내용을 보고 자주 쓰는 답변으로 답하거나, 일반 가전기기가 고장 났을 때 고장 내용을 작성해주는 등 활용할 가치가 많다.
언어 생성은 사람의 대화를 최대한 많이 수집해서 대화를 배우게 하고 지속적으로 평가하는 과정을 반복해서 특정 목적에 맞는 텍스트를 생성하는 것이 주 목적이다. 이 분야는 아직 많은 연구와 개척이 필요한 분야다. 현재 언어 생성 기술을 활용해서 성공적으로 활용하는 분야 중 하나는 기계번역 분야다. 구글이나 네이버에서 끊임없이 서비스를 개선함에 따라 점점 언어의 장벽이 문어지고 있어 새로운 혁신으로 일컬어지는 분야 중 하나다.
네이버 파파고
번역을 부탁해 파파고
papago.naver.com
Google 번역
글자 수 제한은 최대 5,000자(영문 기준)입니다. 더 길게 번역하려면 화살표를 사용하세요.
translate.google.co.kr
'인공지능, 자연어처리 > 텐서플로2와 머신러닝으로 시작하는 자연어처리' 카테고리의 다른 글
4장 텍스트 분류 : 영어 텍스트 분류(1) - 데이터 분석 (0) | 2021.01.11 |
---|---|
3장 자연어 처리 개요(5) : 기계 이해 (0) | 2021.01.06 |
3장 자연어 처리 개요(3) : 텍스트 유사도 (0) | 2021.01.06 |
3장 자연어 처리 개요(2) : 텍스트 분류 (0) | 2021.01.05 |
3장 자연어 처리 개요(1) : 단어표현 (0) | 2021.01.05 |
- Total
- Today
- Yesterday
- 심리학
- Mikolov
- 로버트존슨
- Tutorial
- AI
- CBOW
- 코딩테스트
- 단어표현
- 분석심리학
- Polls
- word2vec
- Python
- WebProgramming
- NLP
- text classification
- 융
- 젠심
- lstm
- 자연어처리
- web
- 인공지능
- 알고스팟
- 당신의 그림자가 울고 있다.
- 텍스트분류
- word vector
- 코딩하는 신학생
- django
- word embedding
- Skip-gram
- 그림자
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |