본문 바로가기
자격증 이모저모/빅데이터 분석기사(파이썬)

빅데이터 분석기사 실기 3번만의 합격(제 6회) 후기 및 꿀팁

by 지각쟁이 2023. 7. 8.
반응형

빅데이터 분석기사 실기 2회 변형 기출문제 풀이(feat. 데이터마님)

 

실기시험 3번의 도전끝에

빅데이터 분석기사에 합격했다.

 

공부를 많이 하지 않았기 때문에

시험을 계속해서 쳐야했지만,

덕분에 빅분기 실기시험에 대해

어느 정도 잘 파악할 수 있지 않았나

하는 생각이 든다.

 

3회차(제 6회) 실기 시험 결과

 

지금부터 어떻게 공부했는지,

그리고 시험 팁에는 어떤것이 있는지

소개하겠다.


 

목차

1. 공부 방법

2. 시험 팁


1. 공부 방법

① 첫번째 시험 (제 4회차 실기 시험)

첫번째(4회차) 시험을 준비할때는 이기적 교재를 사용했다.

 

지금은 유형 1,2,3이 모두 코딩이지만

5회차까지는 유형1은 필답형 문제 10문제였다.

 

나는 필답형 10문제(유형 1)은 버렸다.

'코딩문제를 모두 맞추면 합격할 수 있겠다.'

라는 계산이 섰다.

 

그리고 어떻게 보면 유형2(현재 유형 1)도

어느 정도 버렸다고 볼 수 있다.

나름 전자 공학부 출신이라고

한번 쭉 흝어보고

 

'아, 이 정도면 그냥 할수도 있겠는데,,?' 하고

유형3(현재 유형2)만 봤다.

실제로 공부한 날은 하루, 길면 이틀정도였다..

 

공부는 뭐 별거 하지도 않은 주제에,

의욕적으로 막 뭐라도 해본다고

이기적 교재에서 본 내용중에

기억나는 건 다 사용한 것 같다.

전처리로 스케일링도 하고

이상치 처리도 하고

원핫인코딩도 했다.

 

그리드서치를 써서 파라미터 튜닝도 했다....

(시험장에 마지막까지 혼자 남아서 작업형 제2유형을 풀었다.)

(왜 그랬지,, 미친놈이었다.)

 

1회차(제 4회) 실기 시험 결과

작업형 제2유형 점수가 20점이 나왔다.

 

 

근데 이게 전처리를 아무것도 안하고

그냥 랜덤포레스트(RandomForestClassifier)만 돌린 사람들

만점(40점)을 받았다.

 

그래서 이때 깨달았다.

괜히 어설프게 이것저것 하면

아무것도 하지 않으니만 못하구나.

 

그렇다.

 

작업형 제 2유형에서

이렇게 하면 될까...?

더 괜찮을 수도 있을 것 같은데,,?

 

이런 생각이 들면, 굳이 하지 않아도 된다.

 

기본만 하면 만점(40점)을 받을 수 있다.

여기서 기본은

최소한의 인코딩(원핫 또는 라벨),

그리고 최소한의 알고리즘(랜포 분류/회귀)

의미한다.

 

딱, 그정도만 해도 40점.

못해도 30점은 받을 가능성이 농후하다.

 

 

 

반응형

② 두번째 시험 (제 5회차 실기 시험)

나는 첫번째 시험에서 두가지 깨달음을 얻었다.

 

1. 작업형 1유형도 공부해야 한다.

2. 작업형 2유형은 확실한 것만 한다.

 

그래서, 이번에는 책을 버리고

파이썬을 공부했다.

데이터마님의 블로그를 보면서

문제를 풀었다.

 

판다스 연습 튜토리얼 — DataManim

판다스 연습 튜토리얼 토트백, 브리프 케이스, 백팩 홍보합니다 ㅎㅎ 무신사, 네이버 평점 4.9!! 25% 할인 쿠폰 문의는 단톡방 들어오셔서 해주세요 프록시엘 홈페이지 프록시엘 인스타 시험준비

www.datamanim.com

음,, 지금은 사업을 하시는지,,

블로그에 예쁜 가방도 싸게 홍보하고 계신다,,

 

쨌든, 데이터마님의 블로그에서

판다스와 작업1유형 연습문제를

쭉 풀어보았다.

 

퇴근하고 7시쯤부터 10시,11시쯤까지

일주일정도 파이썬을 공부했다.

(물론, 중간중간 쉬는 시간은 가졌다.)

 

아, 이 정도면 열심히 한거 아닌가,,?

합격하겠는데,,?

라는 생각에 신나게 시험을 치러 갔다.

 

물론 필답형은 버렸지만,

 

작업형 2유형최소한으로 하기로(만점 전략) 했고,

작업형 1유형은 만족스러운 정도로 공부했으니

충분히 합격할 수 있을 거라고 생각했다.

 

2회차(제 5회) 실기 시험 결과

하지만, 작업형 2유형을 너무 쉽게 봤다.

'작업형 2유형은 그냥 할 수 있을거야.'

라는 생각으로 문제를 풀었고,

0점을 받았다.

 

사실 5회차 시험에서 작업형 2유형 문제가

처음으로 회귀문제가 나왔고,

나는 분류와 회귀의 구분이 불가능한 상태였다.

 

RandomForestClassifier()로 문제를 풀었고,

점수가 잘 나올 리가 없었다.

(RandomForestRegressor()회귀 모델로 풀어야 한다.)

 

참고로,

분류이산적인 값을 예측할 때

회귀연속적인 값을 예측할 때 사용한다.

 

 

 

세번째 시험 (제 6회차 실기 시험)

아, 이번엔 무조건 합격이다.

자신이 있었지만,

 

6회차 실기 시험부터 시험 유형이 바뀌었다.

단답형이 빠지고,

작업 3유형(통계)이 추가됐다.

 

아아,, 굉장히 안타까웠지만,,

 

데이터마님의 블로그에서 작업형 3유형을

업데이트 해주셨고

 

해당 내용을 보면서 공부를 해서

 

3회차(제 6회)실기 시험

마침내 합격을 했다.

 

 

근데, 문제는 빅분기 시험이 얼마 되지 않았다 보니

아직 정보가 부족하고,

제 3유형은 특히 정보가 더 부족하다.

 

그래서 지금부터 제 3유형을 풀때의 팁을 소개하겠다.

(물론, 1,2유형을 코딩할 때도 유용한 팁이다.)

 

 

2. 시험 팁

시험 1,2,3에 대한 내용은

(기출문제 풀이 및 2유형 기본만 하기)

따로 포스팅해서 다루도록 하고,

이번 포스팅에서는 

 

시험 팁으로 dir(), help() 함수 사용 방법

소개하려고 한다.

개인적으로는, 해당 함수들을 시험시간에

사용해서 많은 도움을 받았다.

 

위 함수들을 사용하지 않는 게 가장 베스트이긴 하다.

내가 도움을 받아야 한다는건,

내가 잘 모른다는 것이기 때문이다.

 

하지만, 내가 모든 것을 알고 있을 수는 없다.

그래서 dir, help를 기억하고

시험장에 들어가길 추천한다.

 

 

① dir() 

dir() 은 함수가 가지고 있는

속성과 메서드의 리스트를 반환하는 기능을 가진다.

 

나는 dir()을 유형3번 문제를 풀때 많이 사용했다.

(유형 3에 대한 정보가 많지 않아서 직접 부딪혀야 했다..)

 

예를 들어서, 이 문제를 푸는데 필요한 함수가

'scipy.stats' 안에 있을 거 같긴한데,

내가 여기 뭐가 있는지는 모르겠다..

이런 경우,

scipy.stats 라이브러리를 호출하고 

그 아래에 어떤 함수 또는 클래스가 있는지 알 수 있다.

 

참고로, scipy과학 및 수치 계산을 위한 라이브러리

통계 관련 함수는 scipy.stats 안에 많이 들어있다.

 

또는 유형2 를 풀 때 뭔가 알거 같은데

함수 사용법이 정확히 기억이 안나는 경우에도

dir()을 사용할 수 있다.

 

 

② help()

어떤 함수를 써야 될지는 알 것 같은데

함수를 어떻게 써야 될지 모를 때,

help() 함수를 유용하게 사용 할 수 있다.

 

▲예를 들어서, apply 함수를 사용하면 될 것 같은데

어떻게 써야 될지 긴가민가 한 경우

위의  그림처럼 예제를 확인 할 수 있다.

 

특히, 유형3 에서 dir()과 help()를 연계해서 사용할 수 있다.

 

예를 들면, 위의 문제에서 카이제곱 독립성검정 이라는 말이 있다.

카이? 독립? 이런 느낌의 함수를 우선 찾아보면,

scipy.stats 아래에  chi(카이)가 보이며,

뭔가 다른 것들보다는

chi2_contingency 가 그래도 카이제곱 독립성 검정에

가까울 것 같은 느낌이다.

 

모르면 어쩔 수 없다...

느낌으로라도 풀어야 맞출 확률이 조금이라도 생긴다.

 

쨌든, chi2_contingency 를

help()함수로 확인해 보면,

아니나 다를까,

독립된 값을 카이제곱 테스트라고 적혀 있다.

 

그럼 이제 쭉 내려서 어떻게 사용했는지,

그 예제를 확인하고

그 예제에 맞추어서 코딩을 할 수 있다.

 

 

dir()help() 함수.

정말 별거 아닌거 같지만,

내 시험의 합격과 불합격을

결정지을 수 있는 중요한 키가 될 수도 있다.

반응형