pandas 사용하기
=> import pandas as pd
Pandas 모듈을 import 하고 앞으로 pd라는 이름으로 부른다.

1. 딕셔너리 사용해서 데이터 프레임 생성하기
# 딕셔너리 사용해서 데이터 프레임 생성
data = {
"2015" : [9904312,3448737,2890451,2466052],
"2010" : [9631482,3393191,2632035,2431774]
}
df = pd.DataFrame(data)
df

# 데이터 프레임 생성할때 인덱스 값 지정
# 첫번째 방법
ind = ['서울', '부산', '인천', '대구']
df = pd.DataFrame(data, index = ind)
df
# 두번째 방법
# 인덱스 값 수정
# 데이터프레임이 만들어진 후에 사용
df.index = ['서울', '부산', '인천', '대구']
df

2. 리스트 사용해서 데이터 프레임 생성하기
# 리스트 사용해서 데이터 프레임 생성
data_list = [
[9904312,3448737,2890451,2466052],
[9361482,3393191,2632035,2431774]
]
ind = ['2015', '2010']
col = ['서울', '부산', '인천', '대구']
pd.DataFrame(data_list, index = ind, columns = col)
df

# 전치 = 컬럼과 인덱스 바꾸기
df.T

# DataRrame 확인
# 값(values), 인덱스(index), 컬럼(columns)
df.values
df.index
df.columns
# 열 인덱싱
df['2015']
# 인덱스 슬라이싱
df[0:1]


# 인덱서
# 행(index)과 열(columns)을 한번에 인덱싱/슬라이싱할 때 사용
# loc[]: 직접 부여한 인덱스, iloc[]:
# 인덱서[행 , 열]
# loc[]: 직접 부여한 인덱스,
# 1. 서울과 부산 인덱스
# 2. 2015 컬럼
df.loc['서울' : '부산', '2015']
# iloc : 자동으로 부여된 인덱스, 컬럼값 사용
df.iloc[0 : 2, 0]

# 서울, 인천 인덱스
# 2010 컬럼
df.loc[['서울', '인천'], '2010']

** 차이점 알기

# 데이터 추가
# 컬럼을 기준으로 데이터 추가
df['2005'] = [465, 789, 798, 465]
df

# 인덱스 기준으로 데이터 추가
# 인덱서에 하나의 값만 적으면 해당 행의 모든 열을 가져옴
df.loc['광주'] = [46543, 6545132, 8798543]
df
df.loc['순천'] = [353575, None, None]
df


**왜 '2010'와 '2005'는 float 인지?

728x90
반응형
'언어 > Python' 카테고리의 다른 글
Python_pandas_학급별 데이터 분석(실습) (0) | 2022.06.22 |
---|---|
Python_도시 데이터 분석(실습) (0) | 2022.06.22 |
Python_pandas_Series (0) | 2022.06.21 |
Python_영화 평점 구하기 (0) | 2022.06.20 |
Python_numpy 함수 (0) | 2022.06.20 |