[pandas] 특정 컬럼에서 특정 문자열이 포함된 행 찾기

판다스에서는 특정 컬럼에서 특정 문자열이 포함된 행을 찾을 수 있습니다. 이를 위해서는 해당 컬럼의 문자열에 대해 str.contains() 메서드를 사용할 수 있습니다.

str.contains()

기본 사용법

contains_apple = df[df['컬럼 A'].str.contains('가나다라')]

"컬럼 A"에서 "가나다라"가 포함된 행을 찾기 위해서는 위와 같이 사용하면 된다.

정규 표현식 사용

contains_pattern = df[df['A'].str.contains('사과|바나나', regex=True)]

regex=True 로 설정하여 정규 표현식을 사용할 수 있다.
예를 들어, 특정 패턴이나 문자열을 정규 표현식으로 지정하여 검색할 수 있다.
위 예시는 '사과' 또는 '바나나'가 포함된 행을 찾는 것

대소문자 구분 옵션

contains_case_sensitive = df[df['A'].str.contains('Apple', case=True)]
contains_case_insensitive = df[df['A'].str.contains('Apple', case=False)]

case 매개변수를 사용하여 대소문자를 구분하거나 무시할 수 있다.

NA(결측값) 처리

contains_with_na = df[df['A'].str.contains('사과', na=False)]

na 매개변수를 사용하여 NaN 값 처리를 지정할 수 있습니다.

예시

import pandas as pd

# 샘플 데이터프레임 생성
data = {'A': ['사과바나나', '포도딸기', '복숭아', '사과오렌지']}
df = pd.DataFrame(data)

# 'A' 컬럼에서 '사과'가 포함된 행 찾기
contains_apple = df[df['A'].str.contains('사과')]

# 결과 출력
print(contains_apple)

A 라는 컬럼에서 '사과'가 포함된 행을 찾는 예시

'💻 Programming > Python' 카테고리의 다른 글

[python] 멀티프로세싱 Process 사용법 및 코드 예시 \| multiprocessing.Process \| 여러 프로세스에 서로 다른 작업을 할당 (3)	2024.01.07
[python] 멀티프로세싱 Pool 사용법 및 코드 예시 \| multiprocessing.Pool \| python 속도 향상 (0)	2024.01.07
[pandas] 특정 컬럼의 값이 공백인 행을 제외하는 방법 \| dropna (0)	2023.11.17
[pandas] 특정 컬럼에서 중복된 값 제거 \| drop_duplicates (1)	2023.11.17
[pandas] DataFrame 설명 \| 데이터 조작, 필터링, 시각화, 통계 분석 (0)	2023.11.16

[pandas] 특정 컬럼에서 특정 문자열이 포함된 행 찾기 | str.contains

str.contains()

예시

'💻 Programming > Python' 카테고리의 다른 글

티스토리툴바