본문 바로가기
career/자격증

빅데이터분석기사 실기 최종합격 후기 (2024.06 8회) / 응시료 외에 한 푼도 안 쓰고 합격하는 방법

by 고기만두(개발자) 2024. 7. 6. 17:23
728x90
반응형

필기합격후기 아래 글 참고

https://career-gogimandu.tistory.com/232

 

빅데이터분석기사 8회 (2024.04) 필기 합격 후기

시험이 처음 생길쯤부터 언젠간 따야지 .. 시험이 안정화 되면 ... 이라고 생각했는데 그게 올해였다. 아직 안정화가 되었다고 말하기 어렵지만, KPI 때문에 자격증이 필요해졌다. 고기만두는 -산

career-gogimandu.tistory.com

빅데이터분석기사 실기합격

2024년 6월 20일 빅데이터분석기사 8회 실기시험에 응시하여 최종 합격하였다.

(7월 12일 최종 오피셜 발표지만,

5일 공개된 사전점수가 이정도면 합격에 무리가 없을 것으로 보여서 일주일 미리 작성)

 

빅데이터분석기사 실기 시험은 파이썬/R을 활용한 프로그래밍 시험으로,

1유형 3개 + 2유형 1개 + 3유형 소문항 6개 = 총 10문제를 180분동안 풀이하게 된다.

 

0. 언어 선택 : 파이썬

문항별로 Python / R 선택하여 섞어서 풀수도 있다고 듣긴 했는데,

고기만두는 파이썬으로 시험을 봤다.

파이썬 사용자가 압도적으로 많고, 참고할 교재나 강의도 압도적으로 많다.

 

고기만두는 산업공학을 전공했고, 학교 다닐 때 빅데이터분석 과목을 좋아하고 잘 하는 편이었다.

내가 학교 다닐 때는 데이터 분석 수업에서 주로 R이나 SAS/SPSS를 활용했는데

졸업하고 취업준비할 무렵부터는 파이썬으로 대세가 옮겨오는 모습을 볼 수 있었다.

쉽게 말해 나는 R 끝물 세대였던 것.

그리고 졸업한지가 벌써 언제인지.... 현업에서 전혀 사용하지 않아 당연히 다 까먹었다.

728x90

파이썬은 경험이 없는건 아니지만 시험을 볼 만큼 자신있게 활용할 수 있는 정도는 아니었다.

하지만 R 기억을 되살리자니 자료가 너무 없어, 어쩔 수 없이 대세에 편승하여 파이썬 선택.

 

1. 도움을 받은 자료

개인적으로는 필기 때도 구매했던 시중 교재가 그다지 만족스럽지 않았고,

실기시험 대비용 시중교재는 각 회사마다 다 비교해봐도 세간의 평가가 필기교재보다 더 좋지 않았다.

그리고 마침 회사 사수에게 강의를 하나 추천받았다.

닉네임 '퇴근후딴짓' 님이 인프런에 올려주신 빅데이터분석기사 실기 인터넷강의였다.

https://www.inflearn.com/course/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0/dashboard

 

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3) 강의 | 퇴근후딴짓 - 인프런

퇴근후딴짓 | 비전공자, 입문자가 빅데이터 분석기사 실기를 빠르게 취득할 수 있도록 안내해드려요! 꼭 필요한 파이썬, 판다스, 머신러닝을 다루고 있어요!, ❤️공지❤️ 7회 기출 유형 업데이

www.inflearn.com

(사수 본인이 합격하셨다는 이야기는 아쉽게도 아니고 ...

대신 가족이 같이 듣고 그 분만 합격하셨다나)

회사와 인프런이 제휴가 되어 있어서 외부교육수강 결재를 올리면 강의비용을 무료로 지원해주는 제도가 있었다.

그래서 회사 돈으로 공짜로 강의를 들었다.

시험 직전까지 고사장 리스트업, 최신화된 요약 자료 등으로 AS도 꾸준하게 이루어졌다.

 

하지만 강의 초반에 해준 판다스 설명도 괜찮았지만,

파이썬을 제대로 사용해 본 적이 별로 없어 강의만 듣기에는 조금 부족한 느낌이 있었는데

데이터마님 사이트의 판다스 연습 튜토리얼 100제를 완료하고 나니 이 부분은 해결되었다.

https://www.datamanim.com/dataset/99_pandas/pandasMain.html

 

판다스 연습 튜토리얼 — DataManim

Question 43 df의 데이터 중 new_price값이 lst에 해당하는 경우의 데이터 프레임을 구하고 그 갯수를 출력하라 lst =[1.69, 2.39, 3.39, 4.45, 9.25, 10.98, 11.75, 16.98]

www.datamanim.com

각 유형별 연습 문제도 있지만 개인적으로는 해설을 보면 나와는 풀이 스타일이 조금 맞지 않았다.

뭔가 쉬운 문제도 상당히 어렵게 푸는 느낌이 들었다고 해야하나 ...

그리고 개인이 사비와 광고수익만으로 운영하시는 사이트라고 들었는데,

그래서인지 시험에 임박해서는 접속 상황이 조금 불안정하여, 사용하기 어렵게 느껴졌다.

유형별 문제는 조금 어렵게 느껴지는 경우 과감하게 스킵해도 무방할 것 같다.

대신 판다스가 익숙하지 않은 경우 튜토리얼 100제는 꼭 풀이하자.

또한 R 풀이를 제공한다는 장점이 있다.

 

또한, 퇴근후딴짓 님이 캐글에 올려주신 문제 자료가 무료로 공개되어 있다.

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

 

Big Data Certification KR

빅데이터 분석기사 실기 (Python, R tutorial code)

www.kaggle.com

 

이 자료로 시험 약 4~5주 정도 전부터 진행하는 오징어게임 디스코드 스터디가 매우 큰 도움이 되었다.

만약 강의를 들을 경제적/시간적 형편이 되지 않는다면 캐글 스터디만 함께 해도 큰 도움이 될 것 같다.

한 달 동안 월~토 주 6회 매일 1~3문제 정도 씩을 풀고 인증하며 참여도가 낮은 경우 추방된다.

또한 다른 회원들은 어떻게 풀었는지도 볼 수 있고, 질문/답변도 잘 이루어져서 큰 도움을 받았다.

그리고 내가 몰라서 못 풀어도 일단 베껴서 깍두기로 제출하는 과정에서 공부가 된다.

 

-> 요약하면

인프런 퇴근후딴짓 강의(회사 교육비 지원제도로 무료수강했지만 여건이 되지 않으면 안들어도 무방할듯)

+ 데이터마님(무료) + 퇴근후딴짓 캐글(무료)*디스코드 스터디 '오징어게임' (무료) 1개월 참여 정도.

벼락치기할 깜냥이 되지 않는다는 빠른 메타인지를 통해

넉넉하게 기간을 잡고 회사 다니면서 저녁시간/주말 최대한 활용하여 공부하였다.

 

 

2. 각 유형별 공부 방법과 전략

3개 유형 합쳐서 100점 만점에 60점을 넘기면 합격이다. 그리고 '과락이 없다'

이 말은, 전략적으로 버릴 거 버려도 합격선만 넘기면 별로 지장이 없다.

개인적으로는 기초에 해당하는 1유형 30점과,

한 문제로 모든 게 결정되지만 템플릿이 정해져 있는  2유형 40점을 모두 확보하는 것이 가장 중요해 보인다.

공부에 사용할 수 있는 시간이 2주 이하인 경우 3유형은 아예 버리는 것도 방법이 될 수 있다.

 

1) 1유형

1유형은 별다른 노하우가 없다.

판다스 사용법을 잘 이해하고, 문제 지시사항을 정확히 이해하고 구현하면 된다.

8회차 시험에서 나온 문제는 평이한 편이었다.

- GROUP BY를 통한 그룹별 평균을 구하고 -> 그 중 가장 큰 그룹의 구성원 순서화하여 요구하는 값 구하기

- 파생변수 사용하기 : 칼럼1~4 합계 이런거.

- MIN-MAX SCALING 후 표준편차 구하여 뺄셈

: sklearn 스케일러를 사용할 줄 몰라도 제시된 수식을 직접 구현하는 방법으로도 문제를 풀 수 있었다.

그리고 문제 조건을 잘못 보고 절댓값을 제출하여 틀린 사례가 있었을 것 같다.

 

2) 2유형

https://career-gogimandu.tistory.com/235

 

빅데이터분석기사 실기 2유형 템플릿 : 내가 보려고 작성하는 베이스라인

7회까지 기준으로는 랜덤포레스트 모델링 / 별도의 튜닝 진행하지 않아도 40점 만점에 지장이 없다는 후기 다수 목격.상대평가가 아니기도 하고, 내가 어떤 전략을 가지고 있는지 점검하고 마지

career-gogimandu.tistory.com

40점이 걸려있어 반드시 최대한 만점을 깔고 가야한다.

머신러닝이 처음 접하면 조금 어렵지만, 아직은 어느정도 출제 유형이 정해져 있는 편이다.

분류인지 회귀인지 정확하게 문제를 읽고 파악한 후

랜덤 포레스트 분류/회귀 모델만 정확하게 사용할 수 있으면 40점 획득에 무리가 없어 보인다.

이론적으로는 평가지표 비교를 통해 성능이 좋은 모델을 사용하거나,

하이퍼 파라미터 튜닝을 하여 성능을 높이는 방법도 알아두면 좋겠지만..

나는 굳이 하지 않고 랜덤포레스트 템플릿만 외워 사용하여 40점을 받았다.

8회차에서는 회귀 모델 문제가 출제되었고 MAE가 평가지표였다.

이전 회차들에서 분류 회귀가 번갈아 출제되어 분류 차례인가 생각했는데 변칙이라면 변칙.

개인적으로는 템플릿만 외워서 푸는 현재 유형에서 뭔가 변칙이 들어갈까봐

(랜덤포레스트가 아닌 특정 모델을 사용하여라 같은) 걱정했는데 그런 건 없었다.

 

3) 3유형

3유형이 개인적으로는 가장 방대하고 난감했다.

반응형

https://career-gogimandu.tistory.com/236

 

빅데이터분석기사 실기 3유형 : 시험에 뭐가 나올까? 내가 보려고 정리한 요약집

빅분기 실기 3유형6회차 시험에 처음 생긴 유형이라,아직 기출문제가 2개 회차밖에 없음가설검정과 통계 분석에 대해 다루지만, 내용이 워낙 많은 거에 비해문제수는 대문항 2개 * 대문항 1개당

career-gogimandu.tistory.com

실질적인 통계분석에 대한 문제로, 대문항 2개, 각 대문항에 소문항 3개 = 총 6개 문제 30점이다.

1~2유형에서 만점을 받을 수 있다는 확신이 있으면 버려도 되지만

만일의 사태를 대비해 보험으로 10~15점 정도 더 받아주면 좋은 정도.

7회와 8회 연속으로 로지스틱 회귀분석과 선형 회귀 분석이 나왔다.

개인적으로는 모델 구현에는 모두 성공했지만 , 그 다음 결과 해석에서 실수가 있었던 것으로 기억한다.

코드 구현에 대한 부분점수가 주어지지 않아, 폼에 입력한 답으로만 채점을 한다.(1유형도 동일)

그래서 여기에서 10점을 획득했는데,

목표치는 달성했지만 7회와 동일한 유형이 출제되었다보니

100점을 받지 못해 개인적으로는 조금 아쉽다.

 

+ 공부하면서, 나는 캐글 에디터 / 구글 코랩을 주로 사용하였다.

시험 환경이 구름 기반의 조금 독특한 폐쇄적인 환경인데,

셀단위로 나누어 실행이 불가능하고 print문에 감싸야만 출력이 가능하다.

따라서 시험환경에 대한 사전 연습(주최측에서 제공하는 구름 링크 참고)이 꼭 필요하며

평소 문제를 풀 때도 가급적 한 셀에서 통으로 코딩하는 식으로 연습해야 할 것이다.

https://dataq.goorm.io/exam/3/%EB%B9%85%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D%EA%B8%B0%EC%82%AC-%EC%8B%A4%EA%B8%B0-%EC%B2%B4%ED%97%98/quiz/1

 

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

edu.goorm.io

 

4. 시험장 / 감독관에 대한 다소의 아쉬움

빅분기 실기서울영상고등학교

 

시험장은 접수 전 영업일쯤 리스트가 공개되고 퇴근후딴짓 선생님이 바로 공지를 쏴주셨는데

공지되면 접수전에 원하는 고사장을 미리 2~3곳 정도 골라놓으면 좋을 것 같다.

서울 지역의 경우 건국대 등 대학교에 인원이 많이 배정되었고,

컴퓨터 학원이나 특성화 고등학교에도 인원이 배정되었다.

번화가 역세권일 수록 빠르게 매진되는 것 같은데,

나는 서울영상고등학교가 가장 가까운 고사장이라 이 곳을 선택하였다.

학생들이 매일 영상 디자인 수업을 받는 곳일 테니

컴퓨터 성능과 책걸상 상태들이 최소 평균 이상은 할 것이라고 판단했다.

빅데이터분석기사 시험환경

 

다만... 서울영상고 고사장 감독관들의 운영이 다소 아쉬운 점이 있었다.

9시 반부터 건물 입장이 가능했는데, 시간이 지났는데 입장을 시켜주지 않으려고 했다.

심지어 사진에서 보이지만 그 날은 비가 매우 많이 왔다.

9시 반부터 입장 아닌가요? 라고 항의했더니 몇 분 뒤에 입장이 허용되었고,

그렇게 올라갔더니 고사실 앞에서도 입장하실 수 없다고 막아서 또 항의를 해야 했다.

또한 위 이미지는 데이터 전문가 포럼 카페에서 어떤 응시자분이 아쉬움을 토로하며 가져오신 규정인데,

다행히 아무 이상 없긴 했지만 나도 4~6번을 사전점검 때 진행할 수 없었다. (글을 보기 전까지 몰랐음)

시험 사이트 접속까지만 점검을 시켰고, 그다음부터는 멀뚱멀뚱 대기하게 했다.

시험 감독관은 상시직이 아닌 걸로 알고있기는 하지만

이런 불만이 한두곳에서 나오는 것도 아닌 걸 보니 감독관 교육을 확실하게 해야 할 필요가 있어 보인다.

한국데이터산업진흥원 다른 시험에서는 이런 일이 없었다.

실기시험이라 신경쓸 부분이 더욱 많겠지만 ...

 

또한, 큐넷에서 진행하는 다른 기사시험의 경우 청년 응시료 할인 50%가 적용된다고 알고 있는데

빅데이터분석기사는 할인 적용이 되지 않는 점이 조금 아쉽다.

물론 나는 회사에서 응시료를 환급받을 예정이긴 하지만 취업준비생들에게 꽤나 부담이 될 것 같다.

 

5. outro

빅분기 시험은 1년에 두 번 있는 시험이라 부담감이 크긴 하지만,

전략적으로 준비하면 못 할 일이 없다.

그럼 화이팅.

728x90
반응형

댓글