[pandas] DataFrame 설명 | 데이터 조작, 필터링, 시각화, 통계 분석
판다스(Pandas) 판다스(Pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리로, 특히 표 형식의 데이터를 다루기에 용이하다. 판다스의 주요 자료구조인 데이터프레임(DataFrame)은 행과 열로 이루어진 테이블 형식의 데이터를 다루기 위한 자료구조로 데이터를 다룰 때 자주 사용된다. 데이터프레임 생성 import pandas as pd # 2차원 리스트로 데이터프레임 생성 data = [ ['Alice', 25, 'New York'], ['Bob', 30, 'San Francisco'], ['Charlie', 35, 'Los Angeles'] ] df = pd.DataFrame(data, columns=['Name', 'Age', 'City']) 판다스의 pd.DataFrame() 함수를..
2023. 11. 16.
[pandas] 2차원 리스트를 데이터프레임으로 변환하기 | pd.DataFrame
데이터 파일이 콤마나 탭으로 구분된 csv, tsv 등의 파일 형태이면, pd.read_csv(file_path) 또는 pd.read_table(file_path, sep='\t') 을 파일을 읽어 바로 데이터프레임으로 사용할 수 있다. 하지만, 간혹 비정형 데이터를 테이블 형태로 가공 후 데이터프레임으로 변환하고 싶을 때가 있는데, 생각보다 매우 간단하다. pd.DataFrame()을 사용하고, columns 만 지정해주면 된다. 2차원 리스트 → 데이터프레임 변환 예시 import pandas as pd # 2차원 리스트 data = [ ['Alice', 25, 'New York'], ['Bob', 30, 'San Francisco'], ['Charlie', 35, 'Los Angeles'] ] # ..
2023. 11. 16.