전체 글

전체 글

    [Git] 버전 관리를 위한 tool, git!!

    아래 내용은 나처럼 깃허브를 사용하려 했지만 어려워서 엄두를 내지 못하고 있던 사람들을 위해, 그리고 내가 잊어버릴까봐..ㅎ 기록용을 위해 적어놓는 내용들이다. 개발 직군, 데이터 분석 직군, 최근에는 디자이너 직군까지 많은 사람들이 github를 사용하고 있다고 한다. 나조차도 학부 때부터 github에 대해 많이 들아왔지만 막상 어려워서 잘 사용하지 않고 있었다. 그런데 이번에 회사에서 프로젝트를 진행하면서, 버전관리를 위해서는 반드시 필요하다고 느꼈고, 한번 알고 난 후에는 버전관리와 협업을 위해서는 반드시 필요하다고 느꼈다. 그리고 최근에는 개발 직군의 직원을 채용할 때 포트폴리오 대신 깃허브 링크를 받아 보는 사람도 많다고 하니, giuthub를 시작하면서 포트폴리오 관리를 하는것도 매우 좋다고..

    머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (3)

    * 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. DataFrame group by 이해하기¶ In [1]: import pandas as pd import numpy as np group by¶ 아래의 세 단계를 적용하여 데이터를 그룹화(groupping) (SQL의 group by 와 개념적으로는 동일, 사용법은 유사) 데이터 분할 operation 적용 데이터 병합 In [21]: # data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data df = pd.read_csv('./train.csv') df.head() Out[21]: PassengerId Survived Pclass Name Sex Age..

    머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (2)

    * 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. Dataframe data 살펴보기¶ DataFrame¶ Series가 1차원이라면 DataFrame은 2차원으로 확대된 버젼 Excel spreadsheet이라고 생각하면 이해하기 쉬움 2차원이기 때문에 인덱스가 row, column로 구성됨 row는 각 개별 데이터를, column은 개별 속성을 의미 Data Analysis, Machine Learning에서 data 변형을 위해 가장 많이 사용 In [1]: import pandas as pd import numpy as np In [2]: # data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data ..

    머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (1)

    * 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. pandas Series 데이터 생성하기¶ In [1]: import numpy as np import pandas as pd pandas의 중요한 객체 : Data Frame!!¶ 엑셀 파일과 같은 차트 ex) 이름 키 몸무게 홍길동 162 50 김철수 180 78 Series¶ pandas의 기본 객체 중 하나 dataframe에서 파생된 결과로 series가 많이 사용됨 numpy의 ndarray를 기반으로 인덱싱을 기능을 추가하여 1차원 배열을 나타냄 index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based 인덱스 생성, 지정할 경우 명시적으로 지정된 index를 사용 같은 타입의 0개 이상의..

    머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 처리를 위한 Python(Numpy)(2)

    * 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 2.broadcasting 이해 및 활용하기 브로드캐스팅이란? shape이 같은 두 ndarray에 대한 연산은 각원소별로 진행 연산이 되는 두 ndarray가 다른 shape를 갖는 경우, 브로드캐스팅(shape을 맞춤) 후 진행 행렬이 맞지 않는 데이터를 행렬을 맞춰서 연산 진행! 뒷 차원에서부터 비교하여 shape이 같거나 차원 중 값이 1인 것이 존재하면 가능 shape이 같은 경우의 연산 x = np.arnage(9).reshape(3,3) y = np.arange(9).reshape(3,3) x + y [[ 0, 2, 4], [ 6, 8, 10], [14, 16, 18]] scalar(상수)와의 연산 x + 1 # ..