목록정리 (14)
MyCloud
코엑스에서 열린 SK Tech Planet 2016에 다녀왔습니다 ! 늦었지만 들었던 세션을 중심으로 몇 가지 내용을 정리하고자 합니다. 매 시간마다 세 개의 트랙 중 하나를 선택해서 들을 수 있었는데,저는 주로 머신러닝, 딥러닝, 자연어처리에 대한 세션을 들었습니다. ... 1. Apache Spark은 어떻게 가장 활발한 빅데이터 프로젝트가 되었나 최근 5년 사이의 오픈소스 프로젝트 흐름을 그물망 형태로 보여주신 것이 인상적이었습니다.지난 3~4년간 하둡 중심의 빅데이터 생태계가 이루어졌다면, 현재부터 앞으로는 Spark 중심이 될 것Spark의 가장 큰 장점은 빠르다는 것과 쉽게 사용할 수 있다는 점!한번 공부해볼까? 라는 생각이 들었습니다. 2. Google Tensor Flow & Machine..
Natural Language Processing 파이썬은 한국어 자연어처리를 위해 다양한 라이브러리가 존재합니다.그 중에서 자주 사용하며 필수적인 몇 가지 라이브러리에 대해 소개하겠습니다. 1. KoNLPyKoNLPy는 한국어 형태소 분석기로써 Twitter, Komoran, Mecab 등 다양한형태소 분석기를 모듈화하여 내장하고 있다는 장점이 있습니다.또한, 문서화가 잘되어 있어 사용하기 편리합니다! 링크 : http://konlpy.org/ko/v0.4.4/ 2. hanjahanja는 한자를 한글로 변환시켜주는 라이브러리입니다.한자가 껴있는 텍스트인 경우 전처리 과정에서 많이 사용합니다. 링크 : https://pypi.python.org/pypi/hanja 3. hangulizehangulize는..
Git command 1. 저장소 관련 명령어// 로컬 저장소 복제git clone 사용자명@호스트:/원격/저장소/경로 // 추가와 커밋git statusgit add *git commit -m "contents"git push origin master // 원격 서버로 발행git remote add origin 2. 브랜치 관련 명령어// 브랜치 만들기git checkout -b branch_name // 브랜치 이동git checkout master // 브랜치 삭제git branch -d branch_name // 원격 저장소로 전송git push origin branch_name 3. 저장소 갱신과 병합// 저장소 갱신git pull // 변경내용을 현재 브랜치에 병합git merge branch..
Neural Networks: Motivations 이전에 Logistic Regression을 통해 Quadratic model을 분류할 수 있게 되었습니다.하지만 feature가 2~3개가 아니라 10만개가 넘는다면? Logistic Regression으로 성능을 내기 힘들게 됩니다. 대표적인 예시가 컴퓨터 비전 분야입니다. 예를 들어, 사진을 주고 이것이 자동차인지 아닌지 컴퓨터가 구분하는 것입니다.사람이 보기에 자동차의 손잡이는 그냥 손잡이 모양이지만,컴퓨터가 보는 손잡이는 아래와 같은 Binary code로 이루어져 있습니다. 만일 사진의 크기가 500 x 500 픽셀이라면, feature의 수는 25만이 됩니다. 여기에 흑백 사진이 아닌 컬러 사진이라면 RGB가 추가되어 75만개의 featur..
Regression Linear Regression, Logistic Regression, Softmax Regression에 관해 정리한 좋은 자료를 찾아서 공유합니다. 출처 : TensorFlow KR - Deep NLP Study
Logistic Regression Logistic Regression이란, 우리말로 로지스틱 회귀라고 하는데, 역시 전혀 감이 안옵니다.간단히 설명하자면, Logistic Regression은 분류(Classification)를 위한 예측모델입니다.특히 Negative 또는 Positive, 즉 0 또는 1로 정의되는 이항형 문제에서 사용됩니다.Anderw Ng이 들었던 예시는 다음과 같습니다.어떤 암 환자의 종양의 크기에 따라 이것이 악성인지 아닌지를 판단하는 문제입니다. 만일 Linear Regression 처럼 선형 모델을 만들게 되면,종양이 아주 큰 경우에 대해 예측 값이 틀리게 되며, 이러한 오버피팅이 자주 발생하게 됩니다.따라서 No를 0, Yes를 1로 가정했을 때, feature를 어떻게..
Linear Regression Linear Regression 은 우리 말로 선형 회귀(?) 라고 하는데 별로 와닿지 않습니다.간단히 말하면, Linear Regression이란 어떤 두 개의 변수 사이의 선형 상관관계를 모델링하는 것입니다.Andrew Ng이 말했던 집 값의 상관관계를 예로 들어 보겠습니다. 일반적으로 집의 크기가 클 수록 가격이 높게 나타납니다.위의 그래프와 같은 데이터가 있다면 상관관계를 우측 상향하는 직선으로 표현할 수 있습니다.그렇다면 저 직선은 어떻게 해야 정확하게 그릴 수 있을까요?(직선을 정확하게 그린다는 말은 실제와 비슷한 예측모델을 만든다는 말을 의미합니다) 바로 경사하강법(Gradient Descent)을 통해 조정할 수 있습니다. Gradient Descent Gr..
세종대학교 컨벤션홀에서 열린 Google I/O 2016 Extended Seoul 에 다녀왔습니다 ! 입구에 사진을 찍을 수 있는 포토존(?)이 있었습니다.민망해서 배경만 찍는걸로 개인적으로 마음에 들었던 스티커 모음집빨리 소진되서 좀만 늦게왔어도 못 받을뻔 했습니다. 매 시간마다 세 개의 트랙 중 하나를 선택해서 들을 수 있었는데,저는 안드로이드, 파이어베이스, 텐서플로우에 관한 세션을 들었습니다. 몇 가지 메모했던 내용을 정리하자면, ... 안드로이드에서 앞으로 서비스, 브로드캐스트를 명시적으로 사용하는 것은 점차 사라질 것이며,최소한으로 꼭 필요한 경우에만 백그라운드 데이터를 사용하는 방향으로 갈 계획이라고 합니다. 안드로이드 테스트 서포트 라이브러리는 유닛 테스트 담당이라면,에스프레소는 유저 인..
전송계층 프로토콜 TCP와 UDP 프로토콜은 모두 전송계층에서 동작하는 프로토콜입니다.TCP는 Transmission Control Protocol의 약자이고, UDP는 User Datagram Protocol의 약자입니다.두 프로토콜은 모두 패킷을 한 컴퓨터에서 다른 컴퓨터로 전달해주는 IP 프로토콜을 기반으로 구현되어 있지만,서로 다른 특징을 가지고 있습니다. 지금부터 두 프로토콜을 비교 정리해보겠습니다. TCP - Transmission Control Protocol TCP는 신뢰성있는 데이터 전송을 지원하는 연결지향형 프로토콜입니다.여기에서 어떻게 신뢰성있는 데이터 전송이 가능할까? 라는 의문이 생길 수 있습니다.TCP는 패킷을 성공적으로 전송하면 Acknowledgement(ACK) 라는 신호를..
Oracle DDL DDL 이란, 데이터베이스를 정의하는 언어를 말합니다.데이터를 생성하거나 수정하거나 삭제할 수 있으며,NOT NULL, UNIQUE, PRIMARY KEY, FOREIGN KEY, CHECK 등의 제약조건을 설정할 수 있습니다. 1. 테이블 생성CREATE TABLE book (bookno NUMBER(5),title VARCHAR2(50),author VARCHAR2(10),pubdate DATE); 2. 테이블 수정// 컬럼 추가ALTER TABLE book ADD (pubs VARCHAR2(50)); // 컬럼 수정ALTER TABLE book MODIFY (title VARCHAR2(100)); // 컬럼 삭제ALTER TABLE book DROP author; 3. 테이블 삭..