Study/etc

    [용어 정의] CPU, GPU, TPU의 정의

    CPU와 GPU는 분석을 하지 않는 사람들도 많이들 알고 있는 이름이고, 컴퓨터 사양을 볼 때도 많이 보는 이름인데, TPU는 영 낯설다. 그런데 논문에서 사용한 스펙을 보다보면 TPU라는 이름이 자주 등장한다. 그리고 Colab을 쓸 때도 TPU를 선택하는 버튼이 있다. 모르고 안쓰는 것보다 알고 써보자라는 생각으로 적어놓는 CPU, GPU, TPU에 대한 정의. CPU(Central Preocessing Unit) CPU는 중앙 처리 장치라는 의미로, 컴퓨터 시스템을 통제하고, 프로그램의 연산을 실행하고 처리하는 핵심적인 컴퓨터의 제어장치를 말한다. 다시 말하면 컴퓨터의 가장 기본되는 연산 장치에 대한 칩을 의미한다. 컴퓨터를 구매할 때 가장 먼저 살펴보는 CPU로 컴퓨터의 전반적인 성능을 좌우하는 ..

    [colab] Colab에서 데이터 불러오는 방법 (드라이브 마운트 사용)

    Colab을 실행시키는 것 자체는 아래 포스팅을 참고 2020/12/28 - [Code/Python] - [Python] Colab이란? Colab 구글 드라이브에서 사용하기 [Python] Colab이란? Colab 구글 드라이브에서 사용하기 colab.research.google.com/notebooks/intro.ipynb# Google Colaboratory colab.research.google.com 데이터 분석을 하다보면(특히나 딥러닝을 사용할 때) GPU를 사용하거나 큰 메모리를 사용해야 하는 경우가 종.. everywhere-data.tistory.com 오늘 포스팅은 드라이브 마운팅을 성공한 상태에서 시작한다. 처음에 데이터를 불러오는 부분이 막막해서 헤맸었는데 의외로 간단하다. 1. ..

    [논문 리뷰] 추천시스템을 위한 Wide & Deep Learning

    해당 포스팅은 Wide & Deep Learning For Reccommender Systems 를 번역하고 주관적인 생각을 약간 섞어 리뷰한 것이다. 개요 비선형 변수 변환을 사용하는 일반화 선형모델은 대규모 회귀분석과 sparse(희소)한 input을 가진 분류문제에 대해 다양하게 사용된다. Wide Memorize에 효과적이다. (cross-product columns) 변수 간 상호작용을 파악하는 것에 효과적이며, 해석가능하다. But, 일반화(Generalization)하는데에는 더 많은 feature engineering이 필요하다. Deep 적은 feature engineering을 사용한다. sparse한 input 변수들을 저차원 embedding 시킴으로 변수간의 보이지 않는 조합을 일..

    [Trend 용어] 마이데이터(Mydata)란?

    요즘은 빅데이터 사업이 많아서 그런지, 업계에서 분석 활동을 할 때 많이 듣는 용어가 있다. 그 중 하나가 바로 마이데이터(Mydata)이다. 마이데이터가 그냥 "개인 데이터" 라고 생각하고 넘어간다면, 아마 오해할 요소가 많을 거라는 생각이 든다. 그래서 그런 용어를 기록해보고자 마이데이터에 대해 포스팅해보려고 한다. 한국데이터산업진흥원의 글을 빌리자면, 마이데이터란, "정보주체가 개인데이터에 대한 열람, 제공 범위, 접근 승인 등을 직접 결정함으로써 개인의 정보 활용 권한을 보장, 데이터 주권을 확립하는 패러다임" 이라고 한다. 즉, 개인의 데이터에 대해 개인이 적극적으로 활용하는 과정에 대해 말하는 것이다. 무언가 어플을 하나 설치하고, 그것을 사용하려고 하면 "개인정보 수집 및 이용에 동의하시겠습..