목록파이썬 (2)
MyCloud
Natural Language Processing 파이썬은 한국어 자연어처리를 위해 다양한 라이브러리가 존재합니다.그 중에서 자주 사용하며 필수적인 몇 가지 라이브러리에 대해 소개하겠습니다. 1. KoNLPyKoNLPy는 한국어 형태소 분석기로써 Twitter, Komoran, Mecab 등 다양한형태소 분석기를 모듈화하여 내장하고 있다는 장점이 있습니다.또한, 문서화가 잘되어 있어 사용하기 편리합니다! 링크 : http://konlpy.org/ko/v0.4.4/ 2. hanjahanja는 한자를 한글로 변환시켜주는 라이브러리입니다.한자가 껴있는 텍스트인 경우 전처리 과정에서 많이 사용합니다. 링크 : https://pypi.python.org/pypi/hanja 3. hangulizehangulize는..
Numpy - Sparse Matrix TfidfVectorizer에 bigram을 사용하여 변환된 3068x23466 sparse matrix에 unigram을 이어붙이고 싶을 때,여러 개의 서로 다른 sparse matrix를 이어붙이는 방법에 대해 적어두려고 합니다. 1. np.c_import numpy as np # matrix a, bnp.c_[a, b]* sparse matrix의 경우 'CClass object is not callable' 오류 2. np.concatenateimport numpy as np # matrix a, bnp.concatenate((a, b))* sparse matrix의 경우 'Error While Concatenation - zero-dimensional ar..