λ°μν
νλ€μ€μμλ νΉμ 컬λΌμμ νΉμ λ¬Έμμ΄μ΄ ν¬ν¨λ νμ μ°Ύμ μ μμ΅λλ€. μ΄λ₯Ό μν΄μλ ν΄λΉ 컬λΌμ λ¬Έμμ΄μ λν΄ str.contains() λ©μλλ₯Ό μ¬μ©ν μ μμ΅λλ€.
str.contains()
κΈ°λ³Έ μ¬μ©λ²
contains_apple = df[df['μ»¬λΌ A'].str.contains('κ°λλ€λΌ')]
- "μ»¬λΌ A"μμ "κ°λλ€λΌ"κ° ν¬ν¨λ νμ μ°ΎκΈ° μν΄μλ μμ κ°μ΄ μ¬μ©νλ©΄ λλ€.
μ κ· ννμ μ¬μ©
contains_pattern = df[df['A'].str.contains('μ¬κ³Ό|λ°λλ', regex=True)]
- regex=True λ‘ μ€μ νμ¬ μ κ· ννμμ μ¬μ©ν μ μλ€.
- μλ₯Ό λ€μ΄, νΉμ ν¨ν΄μ΄λ λ¬Έμμ΄μ μ κ· ννμμΌλ‘ μ§μ νμ¬ κ²μν μ μλ€.
- μ μμλ 'μ¬κ³Ό' λλ 'λ°λλ'κ° ν¬ν¨λ νμ μ°Ύλ κ²
λμλ¬Έμ κ΅¬λΆ μ΅μ
contains_case_sensitive = df[df['A'].str.contains('Apple', case=True)]
contains_case_insensitive = df[df['A'].str.contains('Apple', case=False)]
- case 맀κ°λ³μλ₯Ό μ¬μ©νμ¬ λμλ¬Έμλ₯Ό ꡬλΆνκ±°λ 무μν μ μλ€.
NA(κ²°μΈ‘κ°) μ²λ¦¬
contains_with_na = df[df['A'].str.contains('μ¬κ³Ό', na=False)]
- na 맀κ°λ³μλ₯Ό μ¬μ©νμ¬ NaN κ° μ²λ¦¬λ₯Ό μ§μ ν μ μμ΅λλ€.
μμ
import pandas as pd
# μν λ°μ΄ν°νλ μ μμ±
data = {'A': ['μ¬κ³Όλ°λλ', 'ν¬λλΈκΈ°', '볡μμ', 'μ¬κ³Όμ€λ μ§']}
df = pd.DataFrame(data)
# 'A' 컬λΌμμ 'μ¬κ³Ό'κ° ν¬ν¨λ ν μ°ΎκΈ°
contains_apple = df[df['A'].str.contains('μ¬κ³Ό')]
# κ²°κ³Ό μΆλ ₯
print(contains_apple)
- A λΌλ 컬λΌμμ 'μ¬κ³Ό'κ° ν¬ν¨λ νμ μ°Ύλ μμ
λ°μν