본문 바로가기

DATA | IT/빅데이터분석기사3

[공부] 빅데이터분석기사 실기 2유형 | 랜덤포레스트 모델링 | 파이썬 Python 코드 정리 분류- 주로 a인지 b인지 판단하는 과제ex) 사원들이 이직을 할 것인가? 안할 것인가? (이직 : 1, 이직X: 0)따라서 보통은 pred결과가 0 혹은 1로 분류됨 # 라이브러리 및 데이터 호출import pandas as pdimport numpy as npx_train = pd.read_csv('주소.csv')y_train = pd.read_csv('주소.csv')x_test = pd.read_csv('주소.csv')#만약 train 데이터셋이 하나라면,# train = pd.read_csv('주소.csv') 로 일단 불러온 다음# y_train = train[['id', '타겟이 되는 컬럼명']]# x_train = train.drop(['타겟이 되는 컬럼명'], axis=1) # 타겟컬럼을 먼.. 2025. 1. 15.
[후기|자격증] 빅데이터분석기사 9회 실기 벼락치기 성공 방법 | 공부법 | 합격 수기 지난 2024.11.30에 실시된 빅분기 실기에 대한 후기를 남겨보겠습니다..!우선 저는 기본적으로 파이썬 pandas를 활용해서 데이터프레임을 가공하는 법은 익숙한 상태였고모델링은 이론적인 지식만 알고있고 실전으로 해본적은 없었어요자격증 준비를 하던 시기에 이것저것 취준때문에 바쁜 시기였기 때문에선택과 집중을 하기로 마음먹었고,,저는 3유형을 과감하게 버리기로 합니다....ㅎ실질적인 공부 기간은 2주정도? 되는거같아요 1유형 주로 인터넷 자료를 활용해서 공부를 했고 퇴근 후 딴짓 님의 캐글 자료를 제일 많이 활용했습니다!https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr Big Data Certification KR퇴근후딴짓 의 빅데이터 .. 2025. 1. 15.
[공부] 빅데이터분석기사 실기 1유형 | 파이썬 Python 코드 정리 python 환경 기준 1) 라이브러리 호출 및 데이터셋 불러오기import pandas as pd # 판다스와 넘파이 라이브러리 호출import numpy as npdf = pd.read_csv('주소.csv') # df라는 이름으로 데이터셋 불러오기df.head() # 생략 가능 과정. 데이터의 대략적인 모습을 확인하기 위함. 2) 실행해야할 문제 조건 뜯어보기 '데이터에서 IQR을 활용해 Fare 컬럼의 이상치를 찾고, 이상치 데이터의 여성 수를 구하시오.' 라는 문제가 나왔다면# IQR을 활용해 Fare 컬럼의 이상치 찾기# 이상치 데이터의 여성 수 구하기총 두가지의 값을 도출해야한다 3) 간단한 EDA 코드df.shape # 데이터프레임의 (행, 열) 갯수를 알려줌df.isnull().sum(.. 2024. 11. 25.