본문 바로가기

Big Data Big Data라는 단어는 여러 분야에서 Hot한 주제이다. 20년 전의 PC의 메모리, 하드디스크의 용량과 최신 PC, 노트북 사양을 비교해보면 과거에 비해 데이터 용량이 비약적으로 늘어났다는 것을 알 수 있다. 특히 스마트폰과 페이스북, 트위터 같은 소셜 네트워크 서비스(SNS)의 등장으로 새로운 데이터가 생산, 유통, 보유량이 계속 증가하고 있다. 하지만 이러한 수많은 정보 중에서 가치있는 데이터는 소수에 불과하다. 따라서 대용량 데이터를 처리하고, 의미있는 데이터를 발굴하는 기술이 필요하다. 인터넷과 기술의 발달로 우리 주변에는 무한에 가까운 정보가 있고, 이 중에서 유용한 정보를 얻어내는 것을 Big Data처리 기술이라고 할 수 있을 것이다. 세계적인 컨설팅 기관인 McKinsey & Comp.. 더보기
Learning sparse recognition for Human action recognition 더보기
TEX 예제 사용법: '+$ ~~~~~ $+' (+는 뺴고! 굳이 HTML 편집도 필요 없다. 다만 글자 색을 바꾸거나 하면 안될 수 있으니 주의!) \mid, \parallel'$ \mid $', '$ \parallel $' \alpha, \beta, \gamma, \mu, \theta, \vartheta, \phi, \varphi, \omega, \Gamma, \Theta, \Phi, \Omega'$\alpha$', '$\beta$', '$\gamma$', '$\mu$', '$\theta$', '$\vartheta$', '$\phi$', '$\varphi$', '$\omega$', '$\Gamma$', '$\Theta$', '$\Phi$', '$\Omega$' \cos (2\theta) = \cos^2 \thet.. 더보기
Self-taught Learning: Transfer Learning from Unlabeled Data Abstract 우리는 self-taught learning이라는새로운 Machine Learning 기법을 제시하겠다. 이는 unlabeled data를 이용해서 supervised classification task를 수행할 것이다. 우리는 unlabeled된 data가 동일한 class label이나 labeled data와 같이 generative distribution을 따를 것이라고 생각하지 않는다. 그러므로 우리는 인터넷에서 랜덤하게 다운 받은 많은 수의 unlabeled 영상(혹은 오디오, 문자)를 사용해서 주어진 영상(혹은 오디오, 문자) classification의 성능을 향상시키는데 사용할 수 있다. 이러한 unlabeled data는 일반적인 semi-supervised나 trans.. 더보기