전체 글7 [Pandas-1-] 타이타닉 데이터 셋 불러와서 가공 하기 아래 링크를 클릭 하면, 타이타닉 데이터 셋을 가져 올 수 있다. Titanic - Machine Learning from Disaster | Kaggle Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 저장 하려면 다음과 같이 가입을 해야된다. 구글 계정으로 간편하게 가입 할 수 있다. 구글 계정연동 하고 나면 다음과 같이 보인다. 타이타닉 데이터 샘플이나 IRIS data set은 기본적인 공부 코드에 이용 많이되니 저장 해 놓으면 두고 두고 쓸일 이 있을 것이다. 이제 Data를 열어 보자. 1 2 3 4 5 6 7 8 9 10 import pandas as pd import numpy as np df = pd.read_csv('t.. 2024. 1. 1. 파이썬 넘파이 불린 인덱싱(Numpy Boolean Indexing) 불린 인덱싱은 조건 필터링을 할 수 있어서 매우 유용하다. 이 기능으로 추 후 판다스 가공에도 많이 사용 할 수 있다. 필터링 조건이 True인 값을 추출 한다고 생각하면 된다. 1 2 3 4 5 6 7 import pandas as pd import numpy as np arr1 = np.arange(12) print("논리값 확인 ") print([arr1>5]) print("논리값이 True 인 것만") print(arr1[arr1>5]) cs 결과 값 처럼, True값만 조회 되는 것을 확인 할 수 있다. 이것을 사용 하면 if , for 문 같이 loop를 돌지 않고 할 수 있기 때문에 계산이 빠르다. 2023. 12. 31. 넘파이 팬시 인덱싱(numpy Fancy Indexing) 오늘은 팬시인덱싱에서 대해 정리를 해 보자 팬시인덱싱은 인덱스 집합을 지정하면 해당위치의 인덱스에 ndarray를 반환 하는 인덱싱 방식 사실 기존의 인덱싱과 큰 차이점을 모르겠음, 다차원에 인덱싱을 할 수 있다는 것이 큰 차이 인 것인 것 같다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 import pandas as pd import numpy as np arr1 = np.arange(12) arr2 = arr1.reshape(3,4) print("일반인덱싱") print(arr1[:3]) print(arr2[2:3]) print("팬시인덱싱") print(arr2[[0,1,2]]) print(arr2[[0,1],0:2]) cs 결과물 (0차원, 1차원) array[[0차원.. 2023. 12. 31. 이전 1 2 다음