언어/Python

Python_pandas_DataFrame

asu2880 2022. 6. 21. 17:58

pandas 사용하기

=> import pandas as pd

Pandas 모듈을 import 하고 앞으로 pd라는 이름으로 부른다.

 

1. 딕셔너리 사용해서 데이터 프레임 생성하기 

# 딕셔너리 사용해서 데이터 프레임 생성
data = {
    "2015" : [9904312,3448737,2890451,2466052],
    "2010" : [9631482,3393191,2632035,2431774]
}

df = pd.DataFrame(data)
df

 

# 데이터 프레임 생성할때 인덱스 값 지정
# 첫번째 방법
ind = ['서울', '부산', '인천', '대구']
df = pd.DataFrame(data, index = ind)
df

# 두번째 방법
# 인덱스 값 수정
# 데이터프레임이 만들어진 후에 사용
df.index = ['서울', '부산', '인천', '대구']
df

 

2. 리스트 사용해서 데이터 프레임 생성하기 

# 리스트 사용해서 데이터 프레임 생성
data_list = [
    [9904312,3448737,2890451,2466052],
    [9361482,3393191,2632035,2431774]
]

ind = ['2015', '2010']
col = ['서울', '부산', '인천', '대구']
pd.DataFrame(data_list, index = ind, columns = col)
df

 

# 전치 = 컬럼과 인덱스 바꾸기
df.T

 

# DataRrame 확인
# 값(values), 인덱스(index), 컬럼(columns)
df.values
df.index
df.columns

 

# 열 인덱싱
df['2015']

# 인덱스 슬라이싱
df[0:1]

 

# 인덱서
# 행(index)과 열(columns)을 한번에 인덱싱/슬라이싱할 때 사용
# loc[]: 직접 부여한 인덱스, iloc[]:
# 인덱서[행 , 열]

# loc[]: 직접 부여한 인덱스,
# 1. 서울과 부산 인덱스
# 2. 2015 컬럼
df.loc['서울' : '부산', '2015']

# iloc : 자동으로 부여된 인덱스, 컬럼값 사용
df.iloc[0 : 2, 0]

 

# 서울, 인천 인덱스
# 2010 컬럼
df.loc[['서울', '인천'], '2010']

 

** 차이점 알기

 

# 데이터 추가
# 컬럼을 기준으로 데이터 추가
df['2005'] = [465, 789, 798, 465]
df

 

# 인덱스 기준으로 데이터 추가
# 인덱서에 하나의 값만 적으면 해당 행의 모든 열을 가져옴
df.loc['광주'] = [46543, 6545132, 8798543]
df

df.loc['순천'] = [353575, None, None]
df

 

**왜 '2010'와 '2005'는 float 인지?

728x90
반응형

'언어 > Python' 카테고리의 다른 글

Python_pandas_학급별 데이터 분석(실습)  (0) 2022.06.22
Python_도시 데이터 분석(실습)  (0) 2022.06.22
Python_pandas_Series  (0) 2022.06.21
Python_영화 평점 구하기  (0) 2022.06.20
Python_numpy 함수  (0) 2022.06.20