'언어/Python' 카테고리의 글 목록

Python_Traffic_Accident(실습)

데이터 받아오기 import pandas as pd data = pd.read_csv('./data/Traffic_Accident_2017.csv', encoding = 'euc-kr') data 경도와 위도 표시하기 # scatter : 산점도 x = data['경도'] y = data['위도'] plt.scatter(x, y, alpha = 0.1) # alpha : 투명도 plt.xlim(123, 133) # 왼쪽으로 치우치는 현상 해결 plt.show() 요일별 사고수 그래프 그리기 # bar 차트 # 요일별로 사고 수를 시각화 # x에는 요일, y에는 요일별 사고수 temp = data['요일'].value_counts() x = ['월','화','수','목','금','토','일'] x = y...

언어/Python 2022.06.23

Python_maplotlib

matplotlib 이란? - python에서 시각화할 수 있는 대표적인 패키지 - python과 pylab이란 sub 패키지가 있다. pyplot pylab 기능 시각화 시작화 + numpy 특징 비대화형 (간단한 정보만 입력해서 플롯이 된다) 대화형 (비교적 많은 정보를 입력해 플롯을 요구한다) - import matplotlib pyplot as plt 1. matplotlib 이해하기 스타일 옵션 종류 marker 종류 정의 약자 color 선 색깔 c linewidth 선 굴기 lw linestyle 선 스타일 ls marker 마커 종류 markersize 마커 크기 ms markeredgecolor 마커 선 색깔 mec markeredgewidth 마커 선 굵기 mew markerfaceco..

언어/Python 2022.06.23

Python_경찰청 데이터 분석(실습)

df2015 = pd.read_csv('./data/2015.csv', encoding = 'euc-kr', index_col = '관서명') df2016 = pd.read_csv('./data/2016.csv', encoding = 'euc-kr', index_col = '관서명') df2017 = pd.read_csv('./data/2017.csv', encoding = 'euc-kr', index_col = '관서명') # 2017년도에만 광주지방경찰청이 존재한다. df2017.index.unique() # 합쳐주기 위해서 2017년 데이터에서 광주지방경찰청 삭제 df2017.drop('광주지방경찰청', inplace = True) # 각 년도별 총계컬럼 만들기 df2015['총계'] = df201..

언어/Python 2022.06.23

Python_데이터 합치기

df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3]) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7']}, index=[4, 5, 6, 7]) df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'], 'B': ['B8', 'B9..

언어/Python 2022.06.22

Python_나이 데이터 분석(실습)

# 데이터를 카테고리로 나누기 # pd.cut(카테고리화 시킬 데이터, 카테고리의 범위, 할당시킬 값) ages = [0, 2, 10, 21, 23, 37, 31, 61, 20, 41, 32, 100] 범위 = [0, 15, 25, 35, 60, 99] 할당값 = ['미성년자', '청년', '중년', '장년', '노년'] pd.cut(ages, 범위, labels = 할당값)

언어/Python 2022.06.22

Python_pandas_학급별 데이터 분석(실습)

score = pd.read_csv('./data/score.csv', encoding = 'euc-kr', index_col = '과목') score # sum 함수는 기본적으로 열 단위로 계산 # 학급별 순위 score.sum().sort_values(ascending = False) # axis = 1 : 행 단위로 계산 score.sum(axis = 1) # 합계 구하기 score['합계'] = score.iloc[:, 0:4].sum(axis = 1) score # 평균 구하기 score['평균'] = score.iloc[:, 0:4].mean(axis = 1) score # 반평균 구하기 score.loc['반평균'] = score.iloc[0:5, 0:6].mean().sort_values(..

언어/Python 2022.06.22

Python_도시 데이터 분석(실습)

import pandas as pd # euc-kr, utf-8 : 가장 대중적인 인코딩 방법 # cp949 : 위의 2개가 안되었을때 인코딩 # index_col 속성 = 원하는 컬럼을 인덱스로 사용 가능 data = pd.read_csv('./data/population_number.csv', encoding = 'euc-kr', index_col = '도시') data # 정렬 # 1. 인덱스 기준으로 : sort_index() # 기본값은 오름차순(한글 ㄱㄷㄴ, 영어는 abc, 숫자는 123) # ascending = False : 내림차순 정렬 data.sort_index(ascending = False) # 2. 데이터 기준으로 : sort_values() data.sort_values(by ..

언어/Python 2022.06.22

Python_pandas_DataFrame

pandas 사용하기 => import pandas as pd Pandas 모듈을 import 하고 앞으로 pd라는 이름으로 부른다. 1. 딕셔너리 사용해서 데이터 프레임 생성하기 # 딕셔너리 사용해서 데이터 프레임 생성 data = { "2015" : [9904312,3448737,2890451,2466052], "2010" : [9631482,3393191,2632035,2431774] } df = pd.DataFrame(data) df # 데이터 프레임 생성할때 인덱스 값 지정 # 첫번째 방법 ind = ['서울', '부산', '인천', '대구'] df = pd.DataFrame(data, index = ind) df # 두번째 방법 # 인덱스 값 수정 # 데이터프레임이 만들어진 후에 사용 df.i..

언어/Python 2022.06.21

Python_pandas_Series

pandas 사용하기 => import pandas as pd Pandas 모듈를 import 하고 앞으로 pd라는 이름으로 부른다. 1. Series Class # 1차원 데이터 Series 사용 pop = pd.Series([9904312,3448737,2890451,2466052]) pop # 인덱스 지정해서 생성 pop = pd.Series([9904312,3448737,2890451,2466052], index=['서울', '부산', '인천', '대구']) pop # 원하는 값 인덱싱으로 가져오기 pop[1], pop['부산'] # 여러가지 값을 인덱싱 하기 # 순서, 횟수 관계없이 # 리스트 형식으로 여러가지 값 인덱싱하기 a = pop[ ['인천', '서울', '인천'] ] b = pop[ ..

언어/Python 2022.06.21

Python_영화 평점 구하기

1. 텍스트 파일에 있는 데이터 가져오기 data = np.loadtxt('ratings.txt', delimiter = "::", dtype='int') data 2. 데이터의 차원, 크기, 요소 갯수 출력 # 데이터의 차원, 크기, 요소갯수 출력 print(data.shape) print(type(data)) print(data.size) print(data.ndim) 3. 전체 데이터의 평점 평균 구하기 # 전체 데이터의 평점 평균 구하기 print(data[:, 2].mean()) 4. 1번 사용자의 평점 평균 구하기 # 1번 사용자의 평점 평균 구하기 # 첫번째 방법 user_id = np.unique(data[:, 0]) # unique는 중복값을 제거 for i in user_id : res..

언어/Python 2022.06.20

ASU

언어/Python 23

티스토리툴바