반응형
Pandas import
Pandas 패키지를 설치하고 pd 라는 이름으로 import 해주는 것이 관례다.
import pandas as pd
CSV 파일 읽기
Pandas 에서 CSV, Excel, HTML, SQL, JSON 등 다양한 파일의 데이터를 읽고 데이터 프레임을 만들 수 있다.
그 중 CSV 파일을 읽어와서 데이터 프레임 구조로 바꿔보는 방법에 대해 알아보자.
CSV란?
csv는 필드를 쉼표(,)로 구분한 텍스트 파일이다.
쉼표로 구분되어 있는 데이터 형식을 csv 파일 형식이라고 부르며,
확장자 명이 .csv라고 되어있으면 csv 파일이라고 한다.
csv 파일 만들기
csv는 메모장, execl 등으로 만들 수 있다.
나는 메모장으로 csv 파일 만들었다.
열을 담당할 1열,2열,3열 을 적고 아래에 데이터 쉼표로 구분지어 적어주면 된다.
주의 : 띄어쓰기 없이 해야 한다!!
확장자를 .CSV로 저장하면 된다.
csv 프로젝트 폴더에 넣기
만든 test.csv를 프로젝트 폴더에 넣으면 된다.
만약 엑셀이 설치되어 있다면 메모장으로 적은 test.csv 파일이 엑셀로 자동변환 된다.
(엑셀로 test.csv를 열었을 때 ??? 가 뜨면서 글씨가 깨져 보여도 오류가 아니니 괜찮다.)
csv 가져오기
read_csv로 읽어오면 된다.
이때 csv 파일을 자동으로 데이터 프레임 구조로 바꿔준다.
import pandas as pd
df = pd.read_csv('test.csv')
데이터 프레임 출력 하기
출력 해보면 정상적으로 csv파일을 가져 온것을 확인 할 수 있다.
인덱스(행)는 자동으로 시퀀스가 부여된다.
print(df)
<결과>
1열 2열 3열
0 1 2 3
1 4 5 6
2 7 8 9
반응형
'Python' 카테고리의 다른 글
[Python] Tkinter 레이블, 엔트리, 버튼 폰트 바꾸기(글꼴, 크기, 색상) (0) | 2024.03.04 |
---|---|
[Python] 파이썬 TKinter 모듈로 GUI 만들기 (0) | 2024.03.03 |
[Python] 판다스(Pandas) : 데이터 프레임(DataFrame) 사용법 정리 (1) | 2024.02.10 |
[Python] 판다스(Pandas) : 시리즈(Series) 사용법 정리 (0) | 2024.02.10 |
[Python] 판다스(Pandas) 총정리 / 시리즈(Series)/ 데이터 프레임(data frame)/ csv 파일 읽어오기 (1) | 2024.02.10 |