1 |
강의개요 및 권장 학습순서와 NLTK 설치하기 [15:48]
|
|
2 |
corpus(말뭉치)란 무엇인가 [12:06]
|
|
3 |
nltk gutenberg corpus 다운로드 및 텍스트 내용 출력하기 [21:45]
|
|
4 |
nltk gutenberg corpus 여러가지 값 출력 [18:54]
|
|
5 |
nltk tokenization - sent_tokenize [16:20]
|
|
6 |
word_tokeniz() 함수를 사용한 토큰화 vs gutenberg.words() 함수를 사용한 토큰화 비교 [21:25]
|
|
7 |
각 토큰당 평균 문자 수 [12:53]
|
|
8 |
브라운 코퍼스를 활용한 여러가지 메서드(1) [20:07]
|
|
9 |
브라운 코퍼스를 활용한 여러가지 메서드(2) 및 FreqDist 함수 사용법 [25:00]
|
|
10 |
FreqDist() 함수로 단어 빈도 수 체크시 대소문자 문제 [22:58]
|
|
11 |
특정 단어의 빈도 수 체크 [13:45]
|
|
12 |
특정 단어의 빈도 수 체크 - list comprehension 사용 [13:46]
|
|
13 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 기초학습 [19:53]
|
|
14 |
전부 소문자로 바꾼 후 중복되는 것 없이 단어 수 체크 [29:31]
|
|
15 |
세익스피어는 비극 햄릿을 쓸 때 한 문장당 평균 몇개의 단어를 사용해서 썼을까 - 최종 통계 구하기 [16:36]
|
|
16 |
브라운 코퍼스 장르별 원하는 단어 수 세기 - ConditionalFreqDist() 사용법 [30:06]
|
|
17 |
cfd 출력시 pair로 구성해서 출력하기 [12:08]
|
|
18 |
브라운 코퍼스 카테고리별 단어 수 체크시 배열 변수 만들어서 이중 for문으로 구성하기 [10:19]
|
|
19 |
n-gram이란 무엇이고 bigram, trigram 등이 검색 예측에 어떻게 활용되어지는가 [33:15]
|
|
20 |
nltk 패키지내 ngrams를 활용하여 bigram, trigram 구하기 실습 [18:29]
|
|