저번 포스팅에서는 날짜 객체 자체를 연산하는 것에 대해 이야기 했었는데, 보통 우리가 사용하는 데이터는 DataFrame형태이기 때문에 날짜 특성의 column은 Series 연산을 해야한다.
그래서 오늘은 Series 형태의 날짜를 연산하는 몇가지 함수에 대해 이야기 하려 한다.
이전 날짜 연산 모듈 포스팅은 아래 참고
우선 String이지만 date형태로 되어있는 Series 객체를 하나 생성한다.
>>> import pandas as pd
>>> from datetime import datetime, timedelta
>>> dates = ['20201101','20201102', '20201103', '20201104', '20201105']
>>> date_Series = pd.Series(dates)
>>> date_Series
0 20201101
1 20201102
2 20201103
3 20201104
4 20201105
dtype: object
현재는 데이터 형태를 보면 object형태이다.
1. string 형태의 객체를 datetime으로 변환하기
pandas의 to_datetime함수를 이용해 string을 datetime 형태의 객체로 변환할 수 있다.
>>> pd.to_datetime(date_Series)
0 2020-11-01
1 2020-11-02
2 2020-11-03
3 2020-11-04
4 2020-11-05
dtype: datetime64[ns]
아래 dtype을 보면 datetime으로 변환되어 있는 것을 알 수 있다.
2. datetime range 만들기
pandas의 date_range 함수를 이용하면 다양한 간격으로 datetime 형태의 Series를 만들 수 있다.
2.1. 1일 간격으로 date_range 만들기 : freq = 'D'
>>> pd.date_range('2020-11-01', '2020-11-30', freq = 'd')
DatetimeIndex(['2020-11-01', '2020-11-02', '2020-11-03', '2020-11-04',
'2020-11-05', '2020-11-06', '2020-11-07', '2020-11-08',
'2020-11-09', '2020-11-10', '2020-11-11', '2020-11-12',
'2020-11-13', '2020-11-14', '2020-11-15', '2020-11-16',
'2020-11-17', '2020-11-18', '2020-11-19', '2020-11-20',
'2020-11-21', '2020-11-22', '2020-11-23', '2020-11-24',
'2020-11-25', '2020-11-26', '2020-11-27', '2020-11-28',
'2020-11-29', '2020-11-30'],
dtype='datetime64[ns]', freq='D')
2.2 n일 간격으로 date_range 만들기 : freq = 'nD'
>>> pd.date_range('2020-11-01', '2020-11-30', freq = '2d')
DatetimeIndex(['2020-11-01', '2020-11-03', '2020-11-05', '2020-11-07',
'2020-11-09', '2020-11-11', '2020-11-13', '2020-11-15',
'2020-11-17', '2020-11-19', '2020-11-21', '2020-11-23',
'2020-11-25', '2020-11-27', '2020-11-29'],
dtype='datetime64[ns]', freq='2D')
2.3. 월 간격으로 date_range 만들기 : freq = 'M'
>>> pd.date_range('2020-11-01', '2021-11-30', freq = 'M')
DatetimeIndex(['2020-11-30', '2020-12-31', '2021-01-31', '2021-02-28',
'2021-03-31', '2021-04-30', '2021-05-31', '2021-06-30',
'2021-07-31', '2021-08-31', '2021-09-30', '2021-10-31',
'2021-11-30'],
dtype='datetime64[ns]', freq='M')
2.4. 월 간격으로 길이가 10인 date_range 만들기 : periods = 10
>>> pd.date_range('2020-11-01', periods = 10, freq = 'M')
DatetimeIndex(['2020-11-30', '2020-12-31', '2021-01-31', '2021-02-28',
'2021-03-31', '2021-04-30', '2021-05-31', '2021-06-30',
'2021-07-31', '2021-08-31'],
dtype='datetime64[ns]', freq='M')
위와 같은 객체의 출력은 Index 형태이며, pd.Series를 하면 Series 형태로 출력된다.
>>> pd.Series(pd.date_range('2020-11-01', periods = 10, freq = 'M'))
0 2020-11-30
1 2020-12-31
2 2021-01-31
3 2021-02-28
4 2021-03-31
5 2021-04-30
6 2021-05-31
7 2021-06-30
8 2021-07-31
9 2021-08-31
dtype: datetime64[ns]
Series에서의 날짜 연산
datetime 타입의 series에 timedelta 객체를 사용하면 날짜 연산이 가능하다.
>>> date_series = pd.Series(pd.date_range('2020-11-01', '2020-11-30', freq = '2d'))
>>> date_series - timedelta(days = 1) ## 하루씩 빼기
0 2020-10-31
1 2020-11-02
2 2020-11-04
3 2020-11-06
4 2020-11-08
5 2020-11-10
6 2020-11-12
7 2020-11-14
8 2020-11-16
9 2020-11-18
10 2020-11-20
11 2020-11-22
12 2020-11-24
13 2020-11-26
14 2020-11-28
dtype: datetime64[ns]
Series 끼리의 연산
datetime타입의 Series끼리 연산도 가능하다.
>>> date_series_1 = pd.Series(pd.date_range('2020-11-01', '2020-11-30', freq = '2d'))
>>> date_series_2 = pd.Series(pd.date_range('2020-11-01', periods = 15, freq = 'd'))
>>> print(date_series_1 - date_series_2)
0 0 days
1 1 days
2 2 days
3 3 days
4 4 days
5 5 days
6 6 days
7 7 days
8 8 days
9 9 days
10 10 days
11 11 days
12 12 days
13 13 days
14 14 days
dtype: timedelta64[ns]
'Code > Python' 카테고리의 다른 글
[Python] pytorch 모델 저장하기 - state_dict() (0) | 2021.01.06 |
---|---|
[Python] isinstance 함수 - 파이썬 자료형 확인하는 함수 (0) | 2021.01.06 |
[Python] enumerate 함수 (0) | 2020.12.31 |
[Python] Colab이란? Colab 구글 드라이브에서 사용하기 (0) | 2020.12.28 |
[python]날짜 연산하기, 월말일자 구하기 (0) | 2020.11.24 |