목록자연어처리 (2)
MyCloud
코엑스에서 열린 SK Tech Planet 2016에 다녀왔습니다 ! 늦었지만 들었던 세션을 중심으로 몇 가지 내용을 정리하고자 합니다. 매 시간마다 세 개의 트랙 중 하나를 선택해서 들을 수 있었는데,저는 주로 머신러닝, 딥러닝, 자연어처리에 대한 세션을 들었습니다. ... 1. Apache Spark은 어떻게 가장 활발한 빅데이터 프로젝트가 되었나 최근 5년 사이의 오픈소스 프로젝트 흐름을 그물망 형태로 보여주신 것이 인상적이었습니다.지난 3~4년간 하둡 중심의 빅데이터 생태계가 이루어졌다면, 현재부터 앞으로는 Spark 중심이 될 것Spark의 가장 큰 장점은 빠르다는 것과 쉽게 사용할 수 있다는 점!한번 공부해볼까? 라는 생각이 들었습니다. 2. Google Tensor Flow & Machine..
Natural Language Processing 파이썬은 한국어 자연어처리를 위해 다양한 라이브러리가 존재합니다.그 중에서 자주 사용하며 필수적인 몇 가지 라이브러리에 대해 소개하겠습니다. 1. KoNLPyKoNLPy는 한국어 형태소 분석기로써 Twitter, Komoran, Mecab 등 다양한형태소 분석기를 모듈화하여 내장하고 있다는 장점이 있습니다.또한, 문서화가 잘되어 있어 사용하기 편리합니다! 링크 : http://konlpy.org/ko/v0.4.4/ 2. hanjahanja는 한자를 한글로 변환시켜주는 라이브러리입니다.한자가 껴있는 텍스트인 경우 전처리 과정에서 많이 사용합니다. 링크 : https://pypi.python.org/pypi/hanja 3. hangulizehangulize는..