본문 바로가기

분류 전체보기113

다중 시각화 그래프 (matplotlib, gridspec, seaborn) 이 포스팅은 matplotlib.GridSpec과 seaborn 라이브러리를 사용해서 여러개의 시각화 그래프를 그리는 방법에 관한 내용을 담고 있다. (예시 데이터는, seaborn 라이브러리의 titanic 데이터를 사용한다.) 시각화 그래프 구조 1. matplotlib.pyplot , seaborn - 그래프 시각화 2. matplotlib.gridspec 사용 - 서브플롯의 위치 & 크기 정교하게 조정 3. for ~ in enumerate 반복문 사용 0. 데이터 & 라이브러리 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import matplotlib.gridspe.. 2023. 12. 1.
PORT MIS 대기시간 예측 - 3. 결측치 처리(시계열 데이터, 중앙값) 이 포스팅은 2차 전처리(입출항 기준 데이터셋 재구성)에 이은, 결측치 처리(3차 전처리)에 관한 내용을 담고 있다. 개요 결측치 처리 방법은 다음과 같다. 1. 선박제원정보 : 선박용도별 중앙값 대체 2. 기상데이터 결측치 : 선형보간법 사용 1. 선박제원정보 결측치 처리 선박제원정보 데이터 타입 변경(숫자) # 쉽표 제거 columns_to_fix = ['총톤수', '재화중량톤수', '선박제원(총길이, m)', '선박제원(너비, m)', '만재흘수(m)', '깊이(m)', '길이1(m)'] df[columns_to_fix] = df[columns_to_fix].replace({',': ''}, regex=True) # 숫자로 변환 df[columns_to_fix] = df[columns_to_fix].. 2023. 11. 30.
PORT MIS 대기시간 예측 - 2. 입출항 기준 데이터셋 재구성(2차 전처리) 항만 대기시간 예측 및 운영시스템 개선 을 위한 두번째 전처리 단계인, 입출항 1건당 전처리에 관한 내용을 담고 있다. 지난 포스팅에서는 PORT MIS 입출항 + 시설하용허가 데이터를 서비스시간, 대기시간을 산출하기 위해 1차 전처리한 후, 항구별 대기율을 산출한 과정을 담고 있으며, 해당 결과를 바탕으로 타겟항구가 울산항으로 선정되었다. https://datapilots.tistory.com/59 PORT MIS 대기시간 예측 1. 항구별 대기율 산정 항만 대기시간 예측 및 운영시스템 개선 을 위한 첫번째 전처리 단계인, 항구별 대기율 산정에 관한 내용을 담고 있다. 1. 사용 데이터 데이터명 사용 목적 merge 기준 컬럼 PORT MIS 입출항 현황 입 datapilots.tistory.com 1.. 2023. 11. 23.
[Tableau] 라인차트 그리기 이 포스팅은 planit 태블로 교육을 바탕으로 작성하였다. 라인차트 그리기 주문일자 별 평균 매출액 > 행/ 열 지정 최대/ 최소 값 > 레이블 표현 분석 - 평균 라인 사용(평균, 연평균) Step1. 행/열 지정 주문일자를 선택하고 + 버튼을 누르면, 분기, 월 순으로 드롭다운 된다. 분기별로 선택할 것이므로, 분기까지만 남긴다. 연속형/ 불연속형 자료 구분 상단(년-분기-월-일) : 불연속형 하단(년-분기-월-일): 연속형 Step 2. 최대/ 최소 값 > 레이블 표현 Step3. 평균 라인 사용(평균, 연평균) 분석 테이블의 평균라인을 테이블로 끌어온다. > 평균라인 분석 테이블의 평균라인을 패널로 끌어온다 > 연평균라인 Step 4. 숫자 사용자 지정 2023. 11. 19.
[Tableau] 파이차트, 도넛차트 그리기 이 포스팅은 planit 태블로 교육을 바탕으로 작성하였다. 파이차트 그리기 파이차트는 행/열 지정에 선반을 사용하지 않고, 마크를 이용해서 지정한다. 마크 - 파이차트로 지정 행열지정 - 고객 세그먼트 별 정렬 매출, 고객시그먼트 레이블 설정 매출 구성 필드 추가 레이블 수정- 순서, 괄호 추가 Step 1. 마크 - 파이차트 지정 Step 2. 고객 세그먼트별 매출 기본 차트 그리기 마크 - 고객 세그먼트 > 색상 합계(매출) > 각도 Step 4. 정렬 기준 [필드]로 변경 Step 5. 구성비율 설정 Step 6. 구성비율(괄호, 순서) 표현 도넛차트 그리기 도넛차트는 원 안에 추가적인 정보를 담을 수 있어서 많이 사용된다. 파이차트를 생성한 후, 이어서 다음 단계를 따른다. Step 01. 열 .. 2023. 11. 19.
[Tableau] 막대차트 만들기 이 포스팅은 planit 태블로 교육을 바탕으로 작성하였다. 1. 막대차트 실습 Step 1. 행/열 지정 더블 클릭으로 행과 열을 지정한다. ( 행, 열 순으로 지정 가능) - 행 : 합계(매출) - 측정값(합계)로 자동지정 - 열 : 제품 대분류 : 제품 대분류별 매출 합계 시각화 Step 2. 전체보기- 확대 선반 - 전체보기 클릭 후, 전체보기 Step 3. 색상 설정 1. 합계(매출) 필드를 의 색상 위로 드래그한다. 2. 우측 상단에 생성된 색상 탭을 클릭 > 색상편집 해 Step 4. 레이블 설정 1. 합계(매출) 필드를 의 레이블 위로 드래그 2. 레이블 클릭 후 가운데 정렬을 맞춘다. 2023. 11. 18.
PORT MIS 대기시간 예측 1. 항구별 대기율 산정(1차 전처리) 항만 대기시간 예측 및 운영시스템 개선 을 위한 첫번째 전처리 단계인, 항구별 대기율 산정에 관한 내용을 담고 있다. 1. 사용 데이터 데이터명 사용 목적 merge 기준 컬럼 PORT MIS 입출항 현황 입출항 데이터 사용 > 서비스시간 산출 호출부호, 선박명 ,입항횟수_횟수, 입항횟수_연도 PORT MIS 시설사용허가현황 접안대기, 출항대기 데이터 파악 및 대기시간 산출 2. 전처리 설계 2.1. 선박 입출항 관련 서비스 지표 대기율 (WR) = TW/TS TW : 대기시간 (Waiting Time) TS : 서비스시간 (Service Time) 선박 입출항 관련 서비스 지표인 대기율(대기시간/서비스시간) 을 기준으로 대기율이 가장 높은 항구를 선정한다. 22년 기준 물동량이 가장 많은 항구인 부산,.. 2023. 11. 13.
[카카오 지도 API] 반경 내 시설 정보 수집 with python 이 포스팅에서는 카카오 지도 API 를 이용하여, 특정반경 내 집객시설를 수집하는 코드를 python 으로 구현한다. 1. 검색 키워드로 반경 내 집객시설 수집_예시 코드 카카오 지도 API 도메인 주소 : 'https://dapi.kakao.com' import requests # HTTP 요청 import pandas as pd # 카카오 API의 장소 검색 엔드포인트 URL url = 'https://dapi.kakao.com/v2/local/search/keyword.json' params = { 'query': '카페', # 검색할 키워드 (예시: '카페') 'x': 441908.750495, # 중심점의 x 좌표 'y': 194438.829927, # 중심점의 y 좌표 'radius': 200.. 2023. 11. 9.
GCP 빅쿼리 Locker 연동하기 Google Cloud Platform https://console.cloud.google.com/ Google 클라우드 플랫폼 로그인 Google 클라우드 플랫폼으로 이동 accounts.google.com Big Query 사용하기 Step 01. GCP 에서 왼쪽 상단 메뉴에서 BigQuery 를 클릭한다. Step 02. 데이터 세트 만들기를 클릭하여 데이터 세트를 만든다. 데이터 세트가 생성되었다면, 생성된 이름으로 데이터 세트 정보를 확인할 수 있다. Step 03. 데이터 세트 위에 커서를 올리고, 테이블 만들기를 선택한다. (임의로 iris.csv 를 사용했다.) iris 테이블이 잘 생성되었다. Step 04. 쿼리 테스트 전체 아이리스 테이블이 잘 불러와지는지 확인한다. Looker s.. 2023. 10. 25.
Google Cloud Console - 새프로젝트, VM, 방화벽 이 포스팅에서는 구글클라우드 시작을 다룬다. 회원가입 과정은 생략, 새프로젝트에서 SSH 브라우저에서 열기까지의 과정을 설명한다. Step 01. 새프로젝트 생성 https://console.cloud.google.com/ Google 클라우드 플랫폼 로그인 Google 클라우드 플랫폼으로 이동 accounts.google.com 메인화면 상단에서 새 프로젝트를 생성한다. 사용자가 원하는 이름을 삽입 후 만들기를 클릭한다. Step 02. VM 인스턴스 생성 새프로젝트 생성 후, VM 인스턴스를 생성한다. 부팅 디스크 변경 클릭 만들기 버튼으로 생성한다. Step 03. 방화벽 규칙 설정 VM 인스턴스 생성 후 방화벽 규칙을 설정해준다. 소스 Ipv4 : 0.0.0.0/0 으로 입력 후 만들기 버튼 눌러.. 2023. 10. 17.