분류 전체보기
[Process Mining] Process Mining이란?
1. 서론 현대에는 수많은 데이터가 분출되고 있고, 더욱이나 사람들이 웹이나 앱, 모바일을 통해서 자신이 원하는 작업을 수행하고 행동하는 경우가 증가하고 있다. 한 사람의 하루 행동 여정, 또는 하나의 작업을 수행하는 과정 등 모든 과정 가운데 데이터는 존재하고 그것은 수많은 가치를 지니고 있다. 오늘 집중해서 살펴볼 것은 그러한 과정을 분석하고 의사결정하는 Process Mining이다. 2. Process Mining이란? Process Mining과 Data Mining의 차이점 간단히 말한다면, Process Mining은 event data와 process, process models 간의 관계를 파악하는 것이다. 이벤트 로그 데이터로부터 프로세스를 도출하여 이를 시각화하고, 그 간의 밀접한 관..
[CRM] 01. CRM, CRM Marketing 에 대해서
최근까지도 개인화 추천 관련된 AI 프로젝트를 진행하면서 마케팅에 대해 점점 알아보고 이해하는 경우가 생겼다. 마케터들이 어떤 고민들을 안고 있는지, 고객 관리를 위해 어떤 지표들을 삼고 있는지 등... 찾아보고 듣다 보니 마케팅의 분야가 참 넓고 다양하다는 생각을 하고 있다. 자사의 제품을 저비용으로 최대 이익을 얻으며 고객에게 판매하는 방법에 대해서 끊임없이 고민하고 생가하는 그들. 이들을 돕거나 이들을 대신할 수 있는 AI 모델을 개발하는 것은 어떨까 해서 시작하게 된 마케팅 공부. 마케팅과 관련된 "프로세스 마이닝", "디지털마케팅" 등에 대해서도 앞으로 차차 업로드 해 볼 예정이다. 오늘은 간단하게, CRM 마케팅에 대해서 알아보고자 한다. 1. CRM 마케팅이란? CRM의 정의에 대해서 알아보..
[생각정리] 프로젝트를 마치고 느끼는 회고
장장 8개월의 프로젝트를 수행하고 나서 소소하게 적어보는 회고록. 금융사에서 AI 추천 시스템을 적용하는 프로젝트를 진행했다. 프로젝트를 하면서 이런저런 생각나는 것과 느낀 바가 있어 기록 차 적어보려 한다. 1. 늘 느끼는 거지만 매우 중요한 커뮤니케이션 커뮤니케이션은 항상 중요하다. 고객사와의 커뮤니케이션도 매우 중요하고, 팀원들 간의 커뮤니케이션도 마우 중요하다는 생각이 든다. 이 때, 이전보다 조금 더 생각하게 된 게 있었다. - 고객사에게는 설득력있고, 자신감있게 이야기해야한다. 당연하다고 느낄 수 있겠지만, 어쨌든 고객사는 돈을 주고 우리에게 특정 업무를 맡긴 것. 특정 업무를 수행하는데 신뢰가 있을 수 있도록 설득력 있고 자신감있게 설명해야 한다는 생각이 든다. 그러나 모르는 것도 아는척 하..
[IT] NVIDIA 그래픽카드(GPU) 종류 간단정리
AI 업계에 일하면서, 딥러닝 학습 속도를 위해서는 GPU가 반드시 필요하다는 걸 알고 있으면서 그 종류에 대해서 자세히 알고 있지는 않았다. 그냥 그래픽카드가 GPU이고, 게임이나 디자인 하는데 반응속도가 빠른걸 사기 위해서는 그래픽 카드가 필요하구나, 근데 딥러닝에서도 쓰이네? 정도로 알고 있었더랬다. 그래서 남들이 "V100? 3080? 우와~" 하는 말들에 감흥을 못느끼고 있었다. 그러다가 이제는 좀 알아야 하지 않을까 싶어서 찾아보는데, 명확하게 정리된 문서는 너무 찾기 어려웠다. 그래서.. 내 위주로라도 정리하고 찾아본 내용을 여기에 적어보려고 한다. 1. NVIDIA GPU 종류 NVIDIA에서는 GPU 종류를 크게 3가지로 나누는 듯 하다. 데스크톱 용 GPU 모바일 용 GPU 워크스테이션..
[Python] inspect 모듈의 getsource() 함수
우리가 쓰는 패키지는 대부분 소스코드와 함께 제공이 되고 있다. 또한 공식적인 패키지가 아니라면, 함수에 자세한 설명이 적혀있지 않은 경우도 많다. 이러한 경우, 함수의 소스코드를 직접 확인하고 참조해야 하는 경우가 있는데, 이럴 때 inspect의 get source를 사요하면 좋다. 1. inspect 설치 inspect 설치는 간단하다. pip install로 설치한다. pip install inspect 2. inspect의 기능 inspect는 모듈, 클래스, 함수에 대한 소스코드를 출력해준다. 다양한 기능이 있다고 하지만, getsource()함수 하나도 참 유용하다. getsource() 안에 클래스 이름을 써주면, 해당 클래스의 소스코드가 출력된다. from inspect import ge..
[독서기록] 글쓰기의 쓸모 _손헌
한창 글쓰기에 관심이 많을 때 읽고 많이 감명을 받았던 책에 대해 소개하고자 한다. 손헌의 실제로 이 책은 글쓰기 동아리나 스터디 같은 곳에서도 유시민의 글쓰기 특강 다음으로 많이 사용되는 책이 아닐까 싶다. 저자 손헌은 현재 토스에서 글을 쓰고 있는 사람이며, 매거진, 퍼블리를 지나왔다. 1. 왜 이책을 읽게 되었는가. 시작은 덕분이었을 것 같다. 이전에 마케터 이승희 씨의 를 참 재밌게 보았다. 정말 작은 것부터 기록을 할 수 있다니. 그리고 그 기록이 언젠가는 어디서든 모두 유용하게 작동이 된다니. 좋은 여운이 남아있던 시기에 내가 좋아하는 인스타 마케터(?) 들 중 누군가 이 책을 읽고 있는 걸 보면서. 책 이름도 비슷하다 느껴져 친근감이 있었고, 당시 문과적 소양으로 글쓰기를 잘 하고 싶다는 생..
[Oracle] Oracle Exadata의 압축방식 (Exadata Hybrid columnar Compression, EHCC)
오늘은 Oracle Exadata의 압축방식과 데이터를 활용하는 방법에 대해서 알아보려고 한다. 1. Oracle 압축방식 Oracle은 데이터 압축을 통해서 저장 공간을 절약할 뿐만이 아니라 I/O의 비용을 최소화할 수 있다. 기존 오라클 압축에서는 BASIC 압축, OLTP 압축 방식이 있었는데 Exadata에서는 Exadata Hybrid Columnar Compression(EHCC, 또는 HCC)라고 하는 새로운 압축 기법을 제공하고 있다. Basic 압축과 OLTP 압축은 데이터를 블록 레벨로 압축하는 방식이다. 반면에 EHCC는 Compression Unit이라는 논리적인 압축 단위로 압축을 한다. 2. EHCC란 무엇인가? 기본적으로 테이블에는 여러개의 튜플(로우)와 여러개의 어트리뷰트(컬..
[Oracle] Oracle Exadata란 무엇인가
현재 프로젝트를 수행하고 있는 업체에서 DB 를 Exadata를 사용하고 있다고 한다. 처음에 Oracle Exadata를 사용한다기에 Oracle 과 어떤 차이가 있는지 잘 몰랐는데 알고 보니 곳곳에서 차이점이 꽤 있는 듯 하다. 잘 아는 것은 아니지만, 찾아보고 검색한 대로 내용을 정리해 보려고 한다. 1. Exa데이터는 무엇인가? 우선 데이터의 단위에 대해서 알면 Exadata에 대한 접근이 쉬울 듯 하다. Exa는 기가 - 테라 - 페타 다음의 데이터 기억 용량의 단위이다. 한마디로 매우 큰 데이터의 용량 단위라고 생각하면 된다. 시대가 발전하면서 데이터가 저장할 수 있는 크기가 점점 커졌지만, 그에 따라 데이터를 처리하는 시간 또한 늘어나고 데이터를 처리하는 것에 대해 오류가 발생할 확률 또한 ..