Python

[Python] 판다스(Pandas) : CSV 파일 읽어오기

Let it out 2024. 2. 10. 22:49

Pandas import

Pandas 패키지를 설치하고 pd 라는 이름으로 import 해주는 것이 관례다.
import pandas as pd

 

 

CSV 파일 읽기

Pandas 에서 CSV, Excel, HTML, SQL, JSON 등 다양한 파일의 데이터를 읽고 데이터 프레임을 만들 수 있다.
 
그 중 CSV 파일을 읽어와서 데이터 프레임 구조로 바꿔보는 방법에 대해 알아보자.
 

 

 

CSV란?

csv는 필드를 쉼표(,)로 구분한 텍스트 파일이다.
 
쉼표로 구분되어 있는 데이터 형식을 csv 파일 형식이라고 부르며,
 
확장자 명이 .csv라고 되어있으면  csv 파일이라고 한다.
 

 

 
 
 

csv 파일 만들기 

csv는 메모장, execl 등으로 만들 수 있다.
 
나는 메모장으로 csv 파일 만들었다.
 
열을 담당할 1열,2열,3열 을 적고 아래에 데이터 쉼표로 구분지어 적어주면 된다.
 
주의 : 띄어쓰기 없이 해야 한다!!
 
 
 

확장자를 .CSV로 저장하면 된다.

 
 
 

 

csv 프로젝트 폴더에 넣기

만든 test.csv를 프로젝트 폴더에 넣으면 된다.
 
만약 엑셀이 설치되어 있다면 메모장으로 적은 test.csv 파일이 엑셀로 자동변환 된다.
 
(엑셀로 test.csv를 열었을 때 ??? 가 뜨면서 글씨가 깨져 보여도 오류가 아니니 괜찮다.)


 

 
 

 

csv 가져오기

read_csv로 읽어오면 된다.
 
이때 csv 파일을 자동으로 데이터 프레임 구조로 바꿔준다.

 

import pandas as pd

df = pd.read_csv('test.csv')

 
 
 

 

데이터 프레임 출력 하기 

출력 해보면 정상적으로 csv파일을 가져 온것을 확인 할 수 있다.
 
인덱스(행)는 자동으로 시퀀스가 부여된다.

 

print(df)
<결과>
   1열  2열  3열
0   1   2   3
1   4   5   6
2   7   8   9
 

 

 

반응형