목록머신러닝 (6)
MyCloud
코엑스에서 열린 SK Tech Planet 2016에 다녀왔습니다 ! 늦었지만 들었던 세션을 중심으로 몇 가지 내용을 정리하고자 합니다. 매 시간마다 세 개의 트랙 중 하나를 선택해서 들을 수 있었는데,저는 주로 머신러닝, 딥러닝, 자연어처리에 대한 세션을 들었습니다. ... 1. Apache Spark은 어떻게 가장 활발한 빅데이터 프로젝트가 되었나 최근 5년 사이의 오픈소스 프로젝트 흐름을 그물망 형태로 보여주신 것이 인상적이었습니다.지난 3~4년간 하둡 중심의 빅데이터 생태계가 이루어졌다면, 현재부터 앞으로는 Spark 중심이 될 것Spark의 가장 큰 장점은 빠르다는 것과 쉽게 사용할 수 있다는 점!한번 공부해볼까? 라는 생각이 들었습니다. 2. Google Tensor Flow & Machine..
Neural Networks: Motivations 이전에 Logistic Regression을 통해 Quadratic model을 분류할 수 있게 되었습니다.하지만 feature가 2~3개가 아니라 10만개가 넘는다면? Logistic Regression으로 성능을 내기 힘들게 됩니다. 대표적인 예시가 컴퓨터 비전 분야입니다. 예를 들어, 사진을 주고 이것이 자동차인지 아닌지 컴퓨터가 구분하는 것입니다.사람이 보기에 자동차의 손잡이는 그냥 손잡이 모양이지만,컴퓨터가 보는 손잡이는 아래와 같은 Binary code로 이루어져 있습니다. 만일 사진의 크기가 500 x 500 픽셀이라면, feature의 수는 25만이 됩니다. 여기에 흑백 사진이 아닌 컬러 사진이라면 RGB가 추가되어 75만개의 featur..
Regression Linear Regression, Logistic Regression, Softmax Regression에 관해 정리한 좋은 자료를 찾아서 공유합니다. 출처 : TensorFlow KR - Deep NLP Study
Logistic Regression Logistic Regression이란, 우리말로 로지스틱 회귀라고 하는데, 역시 전혀 감이 안옵니다.간단히 설명하자면, Logistic Regression은 분류(Classification)를 위한 예측모델입니다.특히 Negative 또는 Positive, 즉 0 또는 1로 정의되는 이항형 문제에서 사용됩니다.Anderw Ng이 들었던 예시는 다음과 같습니다.어떤 암 환자의 종양의 크기에 따라 이것이 악성인지 아닌지를 판단하는 문제입니다. 만일 Linear Regression 처럼 선형 모델을 만들게 되면,종양이 아주 큰 경우에 대해 예측 값이 틀리게 되며, 이러한 오버피팅이 자주 발생하게 됩니다.따라서 No를 0, Yes를 1로 가정했을 때, feature를 어떻게..
Supervised Learning 감독학습이란, 과거의 평가된 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 방법입니다. 1. Classification : 분류 - 단절된 요소를 나누는 것 (discrete value) - 이메일이 도착했을 때 스펨 메일인지 아닌지 구분, 환자의 종양 크기에 따라 악성 종양인지, 아닌지 판단하는 것 2. Regression : 회귀 (추상, 트렌드, 경향) - Regression은 continuous value 를 예측하는 것입니다. - 집의 평수에 따라 가격을 예측, 수 많은 제품들을 3달 안에 판매할 수 있는지 예측 Unsupervised Learning 자율학습이란, 대상에 대한 어떤 정보도 주어지지 않은 상태(labeling 되지 않은 ..
머신러닝의 배경 올해의 가장 핫한 IT 키워드는 바로 머신러닝 (Machine Learning) 입니다.전문가들은 알파고와의 바둑 대전을 보며앞으로 인공지능 시대가 올 것이라고 예측하고 있습니다. 사실 머신러닝, 인공지능 개념은 예전부터 존재했지만 발전이 없었으며 소수에 연구원들에 의한 주제였기에 대중화 될 수 없었습니다.하지만 빅데이터 확보, CPU 성능향상, 오픈소스 프로젝트로 인해많은 개발자들이 인공지능 연구에 참여하게 되었습니다.앞으로 발전속도는 더 빨라질 것이며 나중에는 API를 가져다 쓰는 것만으로도 구현할 수 있게 될 것입니다. 머신러닝의 개념 머신러닝이란 어떠한 입력(Input)이 들어왔을 때 알고리즘을 통해 출력(Output)해주는 모듈(예측모델)을 구현하는 것을 말합니다. 사진을 보시면..