본문 바로가기

PANDAS3

[Pandas] loc vs iloc: 헷갈리지 말고 정확히 사용하기 판다스를 배우면서 가장 헷갈리는 것 중 하나가 바로 df.loc[]와 df.iloc[]입니다. 둘 다 데이터를 선택하는 기능이지만 접근 방식이 완전히 다릅니다. 이번 글에서는 두 방법의 차이점을 명확히 알아보고, 언제 어떤 것을 써야 하는지 정리해보겠습니다.1. 핵심 차이점 한눈에 보기 df.loc[] df.iloc[] 기준레이블(label) 기준정수 위치(integer position) 기준인덱스행/열 이름을 사용행/열 번호(0부터 시작)를 사용사용 형태df.loc[행이름, 열이름]df.iloc[행번호, 열번호]슬라이싱끝 값 포함끝 값 미포함 2. df.loc[] 사용법: 이름으로 접근하기loc는 "레이블(이름)"을 기준으로 데이터에 접근합니다. 기본 사용법import pandas as pddata =.. 2025. 6. 20.
[Pandas] idxmax() 결과 변환의 숨겨진 이유 데이터 분석을 하다 보면 가끔 이런 코드를 마주치게 됩니다: pythondfmax = dfratio.idxmax(axis=1)dfmax_reset = dfmax.reset_index().rename({0: '범죄유형'}, axis=1)언뜻 보면 결과값이 똑같아 보이는데, 왜 굳이 아래 코드가 필요한 걸까요? 이 궁금증을 해결해보겠습니다.두 코드의 실제 차이점첫 번째 코드: Series 형태dfmax = dfratio.idxmax(axis=1)print(type(dfmax)) # print(dfmax)결과:0 범죄유형31 범죄유형2 2 범죄유형5dtype: object이는 Series 객체로, 인덱스는 원래 데이터의 행 번호(또는 연도 등)이고, 값은 해당 행에서 최댓값을 가진 열의 이.. 2025. 6. 18.
[Pandas] pivot_table 완벽 가이드 1. 개요pandas.pivot_table은 엑셀의 피벗 테이블과 같은 기능을 제공하는 강력한 데이터 분석 도구입니다. 복잡한 데이터를 쉽게 요약하고 분석할 수 있도록 도와주며, 스프레드시트 스타일의 피벗 테이블을 DataFrame 형태로 생성합니다. 2. 기본 문법 pandas.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All', observed=, sort=True) 3. 매개변수 상세 설명[필수 매개변수]da.. 2025. 6. 17.