[python]Series, Dataframe에서 날짜 연산하기

2020. 11. 24. 14:05·Programming/Python
반응형

저번 포스팅에서는 날짜 객체 자체를 연산하는 것에 대해 이야기 했었는데, 보통 우리가 사용하는 데이터는 DataFrame형태이기 때문에 날짜 특성의 column은 Series 연산을 해야한다. 

그래서 오늘은 Series 형태의 날짜를 연산하는 몇가지 함수에 대해 이야기 하려 한다. 

 

이전 날짜 연산 모듈 포스팅은 아래 참고

 

[python]날짜 연산하기, 월말일자 구하기

별로 안쓸 줄 알았던 날짜 연산 코드가 프로젝트에 가면 심심찮게 많이 사용된다. 그리고 하나의 객체에 대한 날짜 연산 프로그램도 있지만, Series 날짜의 연산도 아주 많이 사용된다. 이번 포스

everywhere-data.tistory.com

우선 String이지만 date형태로 되어있는 Series 객체를 하나 생성한다. 

>>> import pandas as pd
>>> from datetime import datetime, timedelta

>>> dates = ['20201101','20201102', '20201103', '20201104', '20201105']
>>> date_Series = pd.Series(dates)
>>> date_Series

0    20201101
1    20201102
2    20201103
3    20201104
4    20201105
dtype: object

현재는 데이터 형태를 보면 object형태이다.

 

1. string 형태의 객체를 datetime으로 변환하기

pandas의 to_datetime함수를 이용해 string을 datetime 형태의 객체로 변환할 수 있다. 

>>> pd.to_datetime(date_Series)

0   2020-11-01
1   2020-11-02
2   2020-11-03
3   2020-11-04
4   2020-11-05
dtype: datetime64[ns]

아래 dtype을 보면 datetime으로 변환되어 있는 것을 알 수 있다. 

 

 

2. datetime range 만들기

pandas의 date_range 함수를 이용하면 다양한 간격으로 datetime 형태의 Series를 만들 수 있다. 

 

2.1. 1일 간격으로 date_range 만들기 : freq = 'D'

>>> pd.date_range('2020-11-01', '2020-11-30', freq = 'd')

DatetimeIndex(['2020-11-01', '2020-11-02', '2020-11-03', '2020-11-04',
               '2020-11-05', '2020-11-06', '2020-11-07', '2020-11-08',
               '2020-11-09', '2020-11-10', '2020-11-11', '2020-11-12',
               '2020-11-13', '2020-11-14', '2020-11-15', '2020-11-16',
               '2020-11-17', '2020-11-18', '2020-11-19', '2020-11-20',
               '2020-11-21', '2020-11-22', '2020-11-23', '2020-11-24',
               '2020-11-25', '2020-11-26', '2020-11-27', '2020-11-28',
               '2020-11-29', '2020-11-30'],
              dtype='datetime64[ns]', freq='D')

2.2 n일 간격으로 date_range 만들기 : freq = 'nD'

>>> pd.date_range('2020-11-01', '2020-11-30', freq = '2d')

DatetimeIndex(['2020-11-01', '2020-11-03', '2020-11-05', '2020-11-07',
               '2020-11-09', '2020-11-11', '2020-11-13', '2020-11-15',
               '2020-11-17', '2020-11-19', '2020-11-21', '2020-11-23',
               '2020-11-25', '2020-11-27', '2020-11-29'],
              dtype='datetime64[ns]', freq='2D')

2.3. 월 간격으로 date_range 만들기 :  freq = 'M'

>>> pd.date_range('2020-11-01', '2021-11-30', freq = 'M')

DatetimeIndex(['2020-11-30', '2020-12-31', '2021-01-31', '2021-02-28',
               '2021-03-31', '2021-04-30', '2021-05-31', '2021-06-30',
               '2021-07-31', '2021-08-31', '2021-09-30', '2021-10-31',
               '2021-11-30'],
              dtype='datetime64[ns]', freq='M')

2.4. 월 간격으로 길이가 10인 date_range 만들기 : periods = 10

>>> pd.date_range('2020-11-01', periods = 10, freq = 'M')

DatetimeIndex(['2020-11-30', '2020-12-31', '2021-01-31', '2021-02-28',
               '2021-03-31', '2021-04-30', '2021-05-31', '2021-06-30',
               '2021-07-31', '2021-08-31'],
              dtype='datetime64[ns]', freq='M')

위와 같은 객체의 출력은 Index 형태이며, pd.Series를 하면 Series 형태로 출력된다. 

>>> pd.Series(pd.date_range('2020-11-01', periods = 10, freq = 'M'))

0   2020-11-30
1   2020-12-31
2   2021-01-31
3   2021-02-28
4   2021-03-31
5   2021-04-30
6   2021-05-31
7   2021-06-30
8   2021-07-31
9   2021-08-31
dtype: datetime64[ns]

 

Series에서의 날짜 연산

datetime 타입의 series에 timedelta 객체를 사용하면 날짜 연산이 가능하다. 

>>> date_series = pd.Series(pd.date_range('2020-11-01', '2020-11-30', freq = '2d'))
>>> date_series - timedelta(days = 1) ## 하루씩 빼기

0    2020-10-31
1    2020-11-02
2    2020-11-04
3    2020-11-06
4    2020-11-08
5    2020-11-10
6    2020-11-12
7    2020-11-14
8    2020-11-16
9    2020-11-18
10   2020-11-20
11   2020-11-22
12   2020-11-24
13   2020-11-26
14   2020-11-28
dtype: datetime64[ns]

Series 끼리의 연산

datetime타입의 Series끼리 연산도 가능하다. 

>>> date_series_1 = pd.Series(pd.date_range('2020-11-01', '2020-11-30', freq = '2d'))
>>> date_series_2 = pd.Series(pd.date_range('2020-11-01', periods = 15, freq = 'd'))

>>> print(date_series_1 - date_series_2)

0     0 days
1     1 days
2     2 days
3     3 days
4     4 days
5     5 days
6     6 days
7     7 days
8     8 days
9     9 days
10   10 days
11   11 days
12   12 days
13   13 days
14   14 days
dtype: timedelta64[ns]
반응형

'Programming > Python' 카테고리의 다른 글

[Python] pytorch 모델 저장하기 - state_dict()  (0) 2021.01.06
[Python] isinstance 함수 - 파이썬 자료형 확인하는 함수  (0) 2021.01.06
[Python] enumerate 함수  (0) 2020.12.31
[Python] Colab이란? Colab 구글 드라이브에서 사용하기  (0) 2020.12.28
[python]날짜 연산하기, 월말일자 구하기  (0) 2020.11.24
'Programming/Python' 카테고리의 다른 글
  • [Python] isinstance 함수 - 파이썬 자료형 확인하는 함수
  • [Python] enumerate 함수
  • [Python] Colab이란? Colab 구글 드라이브에서 사용하기
  • [python]날짜 연산하기, 월말일자 구하기
자동화먹
자동화먹
많은 사람들에게 도움이 되는 생산적인 기록하기
    반응형
  • 자동화먹
    자동화먹의 생산적인 기록
    자동화먹
  • 전체
    오늘
    어제
    • 분류 전체보기 (144)
      • 생산성 & 자동화 툴 (30)
        • Notion (24)
        • Obsidian (0)
        • Make.com (1)
        • tips (5)
      • Programming (37)
        • Python (18)
        • Oracle (6)
        • Git (13)
      • AI Study (65)
        • DL_Basic (14)
        • ML_Basic (14)
        • NLP (21)
        • Marketing&Recommend (4)
        • chatGPT (0)
        • etc (12)
      • 주인장의 생각서랍 (10)
        • 생각정리 (4)
        • 독서기록 (6)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    ML
    노션
    Python
    gcp
    GPT
    딥러닝
    노션첫걸음
    Github
    빅데이터분석
    머신러닝
    dl
    cnn
    Transformer
    Google Cloud Platform
    seq2seq
    파이토치로 시작하는 딥러닝 기초
    nlp
    python기초
    pytorch
    기초
    Jupyter notebook
    빅데이터
    데이터분석
    git
    파이토치
    git commit
    notion
    자연어처리
    LSTM
    데이터베이스
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
자동화먹
[python]Series, Dataframe에서 날짜 연산하기
상단으로

티스토리툴바