머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (3)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. DataFrame group by 이해하기¶ In [1]: import pandas as pd import numpy as np group by¶ 아래의 세 단계를 적용하여 데이터를 그룹화(groupping) (SQL의 group by 와 개념적으로는 동일, 사용법은 유사) 데이터 분할 operation 적용 데이터 병합 In [21]: # data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data df = pd.read_csv('./train.csv') df.head() Out[21]: PassengerId Survived Pclass Name Sex Age..
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (2)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. Dataframe data 살펴보기¶ DataFrame¶ Series가 1차원이라면 DataFrame은 2차원으로 확대된 버젼 Excel spreadsheet이라고 생각하면 이해하기 쉬움 2차원이기 때문에 인덱스가 row, column로 구성됨 row는 각 개별 데이터를, column은 개별 속성을 의미 Data Analysis, Machine Learning에서 data 변형을 위해 가장 많이 사용 In [1]: import pandas as pd import numpy as np In [2]: # data 출처: https://www.kaggle.com/hesh97/titanicdataset-traincsv/data ..
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 분석을 위한 Python(Pandas) – (1)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 1. pandas Series 데이터 생성하기¶ In [1]: import numpy as np import pandas as pd pandas의 중요한 객체 : Data Frame!!¶ 엑셀 파일과 같은 차트 ex) 이름 키 몸무게 홍길동 162 50 김철수 180 78 Series¶ pandas의 기본 객체 중 하나 dataframe에서 파생된 결과로 series가 많이 사용됨 numpy의 ndarray를 기반으로 인덱싱을 기능을 추가하여 1차원 배열을 나타냄 index를 지정하지 않을 시, 기본적으로 ndarray와 같이 0-based 인덱스 생성, 지정할 경우 명시적으로 지정된 index를 사용 같은 타입의 0개 이상의..
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 처리를 위한 Python(Numpy)(2)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 2.broadcasting 이해 및 활용하기 브로드캐스팅이란? shape이 같은 두 ndarray에 대한 연산은 각원소별로 진행 연산이 되는 두 ndarray가 다른 shape를 갖는 경우, 브로드캐스팅(shape을 맞춤) 후 진행 행렬이 맞지 않는 데이터를 행렬을 맞춰서 연산 진행! 뒷 차원에서부터 비교하여 shape이 같거나 차원 중 값이 1인 것이 존재하면 가능 shape이 같은 경우의 연산 x = np.arnage(9).reshape(3,3) y = np.arange(9).reshape(3,3) x + y [[ 0, 2, 4], [ 6, 8, 10], [14, 16, 18]] scalar(상수)와의 연산 x + 1 # ..
머신러닝과 데이터 분석 A-Z 올인원 패키지-데이터 수집을 위한 Python(2)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 데이터 수집을 위한 Python 1. beautifulsoup 모듈 breautifulsoup 모듈 사용하여 HTML 파싱하기(parsing) parsing이란? html 모듈 내에서 우리가 원하는 특정 값만 추출하는 과정 from bs4 import BeautifulSoup # 모듈 실행 html 문자열 파싱 문자열로 정의된 html 데이터 파싱하기 html = ''' Contents Title Test contents Test Test Test 1 Test Test Test 2 Test Test Test 3 ''' find 함수 특정 html tag를 검색 검색 조건을 명시하여 찾고자 하는 tag를 검색 soup = Bea..
머신러닝과 데이터 분석 A-Z 올인원 패키지 - 데이터 수집을 위한 Python(1)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. 데이터 수집을 위한 Python 1. 웹 기본 지식 이해하기 개발자도구(Chrome)을 이용하여 웹 페이지 분석하기 웹 페이지 하나 열기 -> 보기 -> 개발자 -> 개발자도구(F12) Element Tap : 원하는 부분을 클릭하면 그 부분에 대한 html 코드를 표현해주는 탭 Network Tap : 서버에 요청되는 모든 로그를 표현하는 tap XHR tap을 가서 데이터 크롤링 가능 HTTP method(GET, POST) 이해하기 HTTP란? HyperText Transfer Protocol : HTML 문서 등의 리소스를 전송하는 프로토콜 클라이언트와 서버 상에서의 리소스를 서로 공유 클라이언트 –> http 요천(g..
머신러닝과 데이터분석 A-Z 올인원 패키지 - Python Programming 기초(4)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스에서 주관하는 강의를 수강하고 작성한 노트입니다. * 퍼가실 경우 출처를 명시해 주세요. Python Programming 기초 파이썬 모듈 - 모듈의 이해 및 사용과 import 방법 모듈 임포트 그동안 사용했던 함수들처럼, 다양한 기능들이 미리 함수로 구현되어 모듈 형태로 제공 대표적으로 추후 과정에서 사용하게 될 아래의 모듈들이 존재 ex) requests - HTTP요청/응답모듈 ex) numpy - 수치해석 모듈 ex) pandas - 데이터분석 모듈 import import를사용하여 해당 모듈 전체를 import tab을 누르면 그 해당 모듈의 함수를 볼 수 있음 import math # 모듈 불러오기 math.pi # 모듈 안에 해당된 기능 사용 >> 3.1415..
머신러닝과 데이터분석 A-Z 올인원 패키지 - Python Programming 기초(3)
·
AI Study/ML_Basic
* 위 강의노트는 패스트캠퍼스가 주관하는 강의를 수강한 후 작성한 노트입니다. * 퍼가실 경우 출처를 명시해주세요. Python Programming 기초 함수의 이해 및 사용 - 코드의 재사용 함수란? 지금까지 무심코 코드에서 사용된 함수들이 존재 ex) sum, len, range… 함수란 우리가 알고있는 개념처럼 주어진 입력(input)에대해서 의도된 출력(output)을 전달하는 역할 함수의 정의 정의 시 최초에 def키워드 사용 argment정의 (함수에 입력으로 전달하는 값을 의미, argument또는 parameter라고 함) :(콜론) -> 함수 역시 코드 블록이기 때문에 콜론이 필요 body(함수의 구현 부분, 함수 역시 코드블록이기 때문에 들여쓰기 된 부분까지 함수의 코드블록으로 인지함..