텀블벅 후원에 성공하려면 프로젝트 이름을 어떻게 지어야 할까? (2)
성공/실패한 텀블벅 프로젝트 이름을 모두 수집했다. 이제 문장구조/사용한 문장부호의 종류를 분석해보려 한다. 우선 수집한 프로젝트 이름이 있는 텍스트 파일을 불러오고 with open('fail.txt', 'r', encoding='UTF8') as f: fail_line = f.read().splitlines() 중복된 이름을 제거한다. fail_line = set(fail_line) len(fail_line) # 중복 제거 그리고 Komoran으로 품사 태깅을 해준다. from konlpy.tag import Komoran tagger = Komoran() tagged_f = [tagger.pos(fl) for fl in fail_line] 만만한 문장부호 먼저 분석해주면 f_punct = [] fo..
2019.09.30