본문 바로가기

분류 전체보기7

[데이터 전처리]데이터 인코딩(레이블 /원핫 인코딩 ) AI에서 문자형 데이터를 피처의 형대로 넣기 위해서는 인코딩이 필요하다. 그중 대표적인 인코딩 방식은 레이블 인코딩과 원-핫 인코딩이 있다. 1. 레이블 인코딩 레이블 인코딩은 카테고리 피처를 코드형 숫자 값으로 변환한다. 1 2 3 4 5 6 7 8 from sklearn.preprocessing import LabelEncoder items = ['두부', '버섯','닭가슴살','우둔살','콩','현미','율무','견과류'] encoder = LabelEncoder() encoder.fit(items) labels = encoder.transform(items) print(labels) Colored by Color Scripter cs 결과물 [2 3 1 4 6 7 5 0] 가나다라순으로 정렬되어 .. 2024. 1. 7.
sklearn 라이브러리 설치, iris DesicionTree Classification 실습 오늘은 iris data를 활용하여, 분류를 해보겠다. iris data는 scikit-learn에서 가져올 수 있다. 1 2 3 4 5 6 7 8 import sklearn from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split import pandas as pd iris = load_iris() print(type(iris)) Colored by Color Scripter cs 다음처럼 Dictionary 형태로 되어 있어서, 아래쪽 스크롤하면 분류 결과도 있다. data는 numpy array로 되어 있다... 2024. 1. 6.
아나콘다 가상환경 리스트 확인, 가상 환경 라이브러리 설치 (sklearn) 가상 환경 list 확인 하고 가상 환경 접속 하여 sklearn 설치 해보자 1 2 3 4 5 conda info --envs activate py37nlp conda install scikit-learn cs conda info --envs : 가상 환경 list확인 activate : 가상환경 list 확인하기 conda install scikit-learn pip install scikit-learn → sklearn 라이브러리 설치 하기 2024. 1. 6.
[Pandas 2] 타이타닉 데이터 프레임 컬럼 다루기 (생성, 삭제, 수정) 저번 시간에는 판다스를 활용하여 타이타닉 데이터를 불러와서 DATA 가공을 했다. 이어서 해보도록 하겠다. https://reny23.tistory.com/4 [Pandas-1-] 타이타닉 데이터 셋 불러와서 가공 하기 아래 링크를 클릭 하면, 타이타닉 데이터 셋을 가져 올 수 있다. Titanic - Machine Learning from Disaster | Kaggle Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 저장 하려면 다음과 같이 가입을 해야된다 reny23.tistory.com 1. 신규컬럼 생성 및 컬럼조회 방법 신규컬럼을 추가하기 위해서는 [] 연산자를 활용하면 된다. df[신규생성컬럼명] = 해당컬럼의 조건 아래 코.. 2024. 1. 4.