[pandas] DataFrame ์ค๋ช
| ๋ฐ์ดํฐ ์กฐ์, ํํฐ๋ง, ์๊ฐํ, ํต๊ณ ๋ถ์
ํ๋ค์ค(Pandas) ํ๋ค์ค(Pandas)๋ ํ์ด์ฌ์์ ๋ฐ์ดํฐ ์กฐ์๊ณผ ๋ถ์์ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก, ํนํ ํ ํ์์ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๊ธฐ์ ์ฉ์ดํ๋ค. ํ๋ค์ค์ ์ฃผ์ ์๋ฃ๊ตฌ์กฐ์ธ ๋ฐ์ดํฐํ๋ ์(DataFrame)์ ํ๊ณผ ์ด๋ก ์ด๋ฃจ์ด์ง ํ
์ด๋ธ ํ์์ ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๊ธฐ ์ํ ์๋ฃ๊ตฌ์กฐ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃฐ ๋ ์์ฃผ ์ฌ์ฉ๋๋ค. ๋ฐ์ดํฐํ๋ ์ ์์ฑ import pandas as pd # 2์ฐจ์ ๋ฆฌ์คํธ๋ก ๋ฐ์ดํฐํ๋ ์ ์์ฑ data = [ ['Alice', 25, 'New York'], ['Bob', 30, 'San Francisco'], ['Charlie', 35, 'Los Angeles'] ] df = pd.DataFrame(data, columns=['Name', 'Age', 'City']) ํ๋ค์ค์ pd.DataFrame() ํจ์๋ฅผ..
2023. 11. 16.
[pandas] 2์ฐจ์ ๋ฆฌ์คํธ๋ฅผ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํํ๊ธฐ | pd.DataFrame
๋ฐ์ดํฐ ํ์ผ์ด ์ฝค๋ง๋ ํญ์ผ๋ก ๊ตฌ๋ถ๋ csv, tsv ๋ฑ์ ํ์ผ ํํ์ด๋ฉด, pd.read_csv(file_path) ๋๋ pd.read_table(file_path, sep='\t') ์ ํ์ผ์ ์ฝ์ด ๋ฐ๋ก ๋ฐ์ดํฐํ๋ ์์ผ๋ก ์ฌ์ฉํ ์ ์๋ค. ํ์ง๋ง, ๊ฐํน ๋น์ ํ ๋ฐ์ดํฐ๋ฅผ ํ
์ด๋ธ ํํ๋ก ๊ฐ๊ณต ํ ๋ฐ์ดํฐํ๋ ์์ผ๋ก ๋ณํํ๊ณ ์ถ์ ๋๊ฐ ์๋๋ฐ, ์๊ฐ๋ณด๋ค ๋งค์ฐ ๊ฐ๋จํ๋ค. pd.DataFrame()์ ์ฌ์ฉํ๊ณ , columns ๋ง ์ง์ ํด์ฃผ๋ฉด ๋๋ค. 2์ฐจ์ ๋ฆฌ์คํธ → ๋ฐ์ดํฐํ๋ ์ ๋ณํ ์์ import pandas as pd # 2์ฐจ์ ๋ฆฌ์คํธ data = [ ['Alice', 25, 'New York'], ['Bob', 30, 'San Francisco'], ['Charlie', 35, 'Los Angeles'] ] # ..
2023. 11. 16.