언어/Python 23

Python_Traffic_Accident(실습)

데이터 받아오기 import pandas as pd data = pd.read_csv('./data/Traffic_Accident_2017.csv', encoding = 'euc-kr') data 경도와 위도 표시하기 # scatter : 산점도 x = data['경도'] y = data['위도'] plt.scatter(x, y, alpha = 0.1) # alpha : 투명도 plt.xlim(123, 133) # 왼쪽으로 치우치는 현상 해결 plt.show() 요일별 사고수 그래프 그리기 # bar 차트 # 요일별로 사고 수를 시각화 # x에는 요일, y에는 요일별 사고수 temp = data['요일'].value_counts() x = ['월','화','수','목','금','토','일'] x = y...

언어/Python 2022.06.23

Python_maplotlib

matplotlib 이란? - python에서 시각화할 수 있는 대표적인 패키지 - python과 pylab이란 sub 패키지가 있다. pyplot pylab 기능 시각화 시작화 + numpy 특징 비대화형 (간단한 정보만 입력해서 플롯이 된다) 대화형 (비교적 많은 정보를 입력해 플롯을 요구한다) - import matplotlib pyplot as plt 1. matplotlib 이해하기 스타일 옵션 종류 marker 종류 정의 약자 color 선 색깔 c linewidth 선 굴기 lw linestyle 선 스타일 ls marker 마커 종류 markersize 마커 크기 ms markeredgecolor 마커 선 색깔 mec markeredgewidth 마커 선 굵기 mew markerfaceco..

언어/Python 2022.06.23

Python_경찰청 데이터 분석(실습)

df2015 = pd.read_csv('./data/2015.csv', encoding = 'euc-kr', index_col = '관서명') df2016 = pd.read_csv('./data/2016.csv', encoding = 'euc-kr', index_col = '관서명') df2017 = pd.read_csv('./data/2017.csv', encoding = 'euc-kr', index_col = '관서명') # 2017년도에만 광주지방경찰청이 존재한다. df2017.index.unique() # 합쳐주기 위해서 2017년 데이터에서 광주지방경찰청 삭제 df2017.drop('광주지방경찰청', inplace = True) # 각 년도별 총계컬럼 만들기 df2015['총계'] = df201..

언어/Python 2022.06.23

Python_pandas_학급별 데이터 분석(실습)

score = pd.read_csv('./data/score.csv', encoding = 'euc-kr', index_col = '과목') score # sum 함수는 기본적으로 열 단위로 계산 # 학급별 순위 score.sum().sort_values(ascending = False) # axis = 1 : 행 단위로 계산 score.sum(axis = 1) # 합계 구하기 score['합계'] = score.iloc[:, 0:4].sum(axis = 1) score # 평균 구하기 score['평균'] = score.iloc[:, 0:4].mean(axis = 1) score # 반평균 구하기 score.loc['반평균'] = score.iloc[0:5, 0:6].mean().sort_values(..

언어/Python 2022.06.22

Python_도시 데이터 분석(실습)

import pandas as pd # euc-kr, utf-8 : 가장 대중적인 인코딩 방법 # cp949 : 위의 2개가 안되었을때 인코딩 # index_col 속성 = 원하는 컬럼을 인덱스로 사용 가능 data = pd.read_csv('./data/population_number.csv', encoding = 'euc-kr', index_col = '도시') data # 정렬 # 1. 인덱스 기준으로 : sort_index() # 기본값은 오름차순(한글 ㄱㄷㄴ, 영어는 abc, 숫자는 123) # ascending = False : 내림차순 정렬 data.sort_index(ascending = False) # 2. 데이터 기준으로 : sort_values() data.sort_values(by ..

언어/Python 2022.06.22

Python_pandas_DataFrame

pandas 사용하기 => import pandas as pd Pandas 모듈을 import 하고 앞으로 pd라는 이름으로 부른다. 1. 딕셔너리 사용해서 데이터 프레임 생성하기 # 딕셔너리 사용해서 데이터 프레임 생성 data = { "2015" : [9904312,3448737,2890451,2466052], "2010" : [9631482,3393191,2632035,2431774] } df = pd.DataFrame(data) df # 데이터 프레임 생성할때 인덱스 값 지정 # 첫번째 방법 ind = ['서울', '부산', '인천', '대구'] df = pd.DataFrame(data, index = ind) df # 두번째 방법 # 인덱스 값 수정 # 데이터프레임이 만들어진 후에 사용 df.i..

언어/Python 2022.06.21

Python_pandas_Series

pandas 사용하기 => import pandas as pd Pandas 모듈를 import 하고 앞으로 pd라는 이름으로 부른다. 1. Series Class # 1차원 데이터 Series 사용 pop = pd.Series([9904312,3448737,2890451,2466052]) pop # 인덱스 지정해서 생성 pop = pd.Series([9904312,3448737,2890451,2466052], index=['서울', '부산', '인천', '대구']) pop # 원하는 값 인덱싱으로 가져오기 pop[1], pop['부산'] # 여러가지 값을 인덱싱 하기 # 순서, 횟수 관계없이 # 리스트 형식으로 여러가지 값 인덱싱하기 a = pop[ ['인천', '서울', '인천'] ] b = pop[ ..

언어/Python 2022.06.21

Python_영화 평점 구하기

1. 텍스트 파일에 있는 데이터 가져오기 data = np.loadtxt('ratings.txt', delimiter = "::", dtype='int') data 2. 데이터의 차원, 크기, 요소 갯수 출력 # 데이터의 차원, 크기, 요소갯수 출력 print(data.shape) print(type(data)) print(data.size) print(data.ndim) 3. 전체 데이터의 평점 평균 구하기 # 전체 데이터의 평점 평균 구하기 print(data[:, 2].mean()) 4. 1번 사용자의 평점 평균 구하기 # 1번 사용자의 평점 평균 구하기 # 첫번째 방법 user_id = np.unique(data[:, 0]) # unique는 중복값을 제거 for i in user_id : res..

언어/Python 2022.06.20