ADsP 자격증을 취득하기로 한 이유
복수전공을 하고 있는 '경영학과'의 졸업요건에는 무엇이 있는지 찾아보던 중, 졸업시험 대신 자격증 3개로 대체할 수 있다고 하는데 가능한 대체 자격증들 중에서 ADsP가 있는 것을 보았다!
현재 'AI빅데이터'를 전공하고 있는 나에게는, 내 전공을 공부하면서 복수전공인 '경영학과' 졸업 준비까지 할 수 있는 좋은 기회라고 생각이 들어 바로 준비하게 되었다.
첫 번째 시험 - 제 38회 데이터분석 준전문가(ADsP) 시험
이 사실을 알고 ADsP를 취득하겠다고 마음먹은 때는 작년인 2023년이었다.
그래서 바로 38회 시험으로 접수를 했고, 시험공부를 위해 일명 '민트책' 이라고 불리는 '데이터에듀' 출판사의 책으로 공부를 시작했다.
때는 방학이었는데 '서초 AI칼리지'라는 교육과정을 참여하면서 바쁘다는 핑계로.. ADsP 시험을 소홀히 한 결과,
총 3과목 중 1과목: '데이터 이해'밖에 공부를 못했는데 시험 날짜가 다가와버렸다..
당연히 떨어질 거라고 예상했지만 예상외로 커트라인인 60점이 나왔다!
'3과목: 데이터 분석' 영역에는 통계, 인공지능 관련 내용들도 나오는데 다행히도 통계는 학교 수업, 인공지능은 따로 조금이라도 공부해서 어느 정도 맞은 것 같다. 하지만 각 과목별 정답률 40%이 넘지 않으면 과락이라는 사실을 그제야 알았고 결과는 역시 불합격이었다..!
두 번째 시험 - 제 41회 데이터분석 준전문가(ADsP) 시험
첫 번째 시험에서 아쉽게 떨어져서 다시 보기 위해 제 41회 ADsP시험을 접수했다!
그땐 몰랐다.. 국가근로장학생, KT디지털인재장학생 면접준비, 연구실 프로젝트 등.. 지금이 역대급으로 시간이 없을지... 방학 때 제대로 할걸!
결국 시험 전날 저녁~밤이 되고 나서야 공부를 시작했다. 전에 사놓은 민트책은 보지도 못하고 유튜브에 총정리 해주는 영상을 보고 필기하면서 공부하는데 ,'1영역: 데이터 이해' 부분만 했는데도 새벽이 되어버렸다.
데이터에듀PT
그 때 생각 났다. 며칠 전 갔던 COEX에서 하는 '국제 AI EXPO'에서 우연히 보았던 민트책의 출판사인 '데이터에듀'가 프로토타입으로 출시한 ADsP공부 어플 '데이터에듀PT'가!
로그인 | 데이터에듀PT
로그인 데이터에듀PT에 오신것을 환영합니다!
dataedupt.kr
크롬 기반의 웹앱(WebApp)으로 제공된다.
안드로이드는 크롬에서 링크를 타고 들어가서 '더 보기' -> 앱 설치 를 하면 스마트폰에 설치할 수 있다. (아이폰은 안 찾아봐서 모르겠다.) '빅데이터분석기사' 자격증에 대한 기능도 추가할 예정이라고 한다.
링크를 타고 들어가면 '예상문제', '모의고사', '기출문제'를 풀 수 있고 오답노트, 컨닝페이퍼(시험볼 때 쓰는 거 아님) 등 기능들이 있다.
나는 시간이 별로 없어서 36회~39회 총 4개 기출문제를 풀었는데, 처음에 50점대 중후반이 나와서 '커트라인 60점만 넘기고 과락만 면하자!'라는 마인드로 풀고 오답노트를 보면서 공부했다. 더 풀고 싶었지만 시간이 없어 60점 중반 점수가 나오는 것만 확인하고, 시험 시작 전에는 민트책의 '합격노트'를 보고 시험을 시작했다.
당연히 이전처럼 40문제 객관식(2점), 10문제 서술형(2점) 일 거라고 생각하고 시험을 시작했지만, 언제부터인가 객관식 50문제로 바뀌었다고 한다. 좋은 소식 같지만 이 덕분에 시험 난이도는 체감 상 훨씬 어려워진 것 같다... ('데이터에듀 포럼' 카페에서도 이번엔 어렵고 지엽적이었다는 반응)
총 50문제 중 애매하거나 몰라서 찍은 문제를 세보니까 17개나 되었다. 찍은 문제는 다 틀리고 나머지 문제들은 다 맞았다고 가정해서 계산해보니 66점이었다. 다른 문제들에서도 많이 틀렸을 것 같지만 이대로만 됐음 좋겠다...!
(떨어지면 3번째 도전... 포기란 없다..!)
시험 결과
결과는... 74점으로 합격했다!!
거의 하루도 안되게 벼락치기를 해서 많이 걱정했지만... 운이 좋게도 찍은 것들도 잘 맞아서 합격 한 것 같다 ㅎㅎ
제 41회 데이터분석 준전문가(ADsP) 시험 문제 복기
시험 문제들이 잘 기억나지는 않지만 기억나는 문제나 선지라도 끄적여보겠다.
1과목: 데이터 이해
데이터사이언티스트가 통찰력 있는 분석을 하기 위한 역량 문제
- 호기심
- 연구윤리
- 다각도 접근
- 비판적 논리
논리적 비판다양한 의미 전달 매체에 의해 표현된 데이터, 정보, 지식, 저작물 등의 인식가능한 모든 자료를 뭐라고 하는가?
- 콘텐츠
- 형식지 (이게 아니라니..)
- 암묵지
데이터베이스빅데이터 위기 요인 -> 해결 방안
빅데이터 문제점
사생활 침해패러다임 변화
- 디지털화 - 연결 - 에이전시
2과목: 데이터 분석 기획
분석을 위한 조직 형성 문제
- 과제 정의와 분석?
- 부서랑 긴밀히 연결되어야 한다.
- 분석을 통해 인사이트를 도출하고 최종 의사결정을 할 수 있어야한다.
집중형, 분산형과 같은 구조를 고려해야 한다.조직 분석 수준 구분 문제 (분석방법O, 분석대상X ?)
- 도입형
- 준비형
- 표준형
확산형상향식 접근 방식 문제
분석 정의 전, 위험 대응 방법 문제
- 회피
- 전이
- 완화
- 제거
과제 분석 방법 발굴, 동종업계 참고하는 것은?
- 외부참조모델 탐색
- 경쟁자 분석
- 비즈니스 모델 탐색
3. 데이터 분석
의사결정나무(Decision Tree) 알고리즘 종류 구분 문제
- CART
- C4.5
- ID3?
CHAID?의사결정나무(Decision Tree) 지니계수 관련 문제
- 엔트로피와 trade-off관계?
- 지니지수가 0이면 순도가 높다.
의사결정나무(Decision Tree) 가지치기 문제
- 최소 나뭇잎수를 증가시키면 트리가 작아진다.
- 가지치기하면 성능이 향상된다.
배깅 관련 문제
- 여러 번 반복해도 일반적으로 과적합이 일어나지 않는다.
결측치 완전분석법 문제
- 결측값을 제거한다
- 결측값이 적을 때 쓰면 유용하다
- 결측값이 많을 때, 자료 손실 위험이 있다.
다중공선성 문제
- 다중공선성이 있으면 회귀계수 설명력이 낮아진다.
- 모델이 불안정해질 수 있다.
계층적 군집 문제
- K-means 군집 분석이 해당된다.
- 가까운 점부터 점차 묶어나가는 방식이다.
R코드 결과 해석 문제
연관 분석 문제
- 지지도가 1인 경우 상관관계는 존재하지 않는다.
- agorigo
FP Grouwth위치측도, 산포측도 문제
- 중앙값은 평균에 영향받지 않는다.
Cook's distance (선지 중 있었는데, 논란 있는 듯)통계값 보고 분석 문제
특이값 판별 문제
- 수면시간 줄어든 사람은 5명이다
25%가 3.4시간 이상 수면한다.거리 구하기 구분 문제
- 유클리드 거리
- 맨하튼 거리
- 민코프스키 거리
- 마할라노비스 거리
신뢰도, 지지도 구하기 문제
다차원척도법 문제
회귀분포에서의 오차값 가정? 문제
- 원래 데이터의 위치와 값이 보존된다.
대립가설, 귀무가설 문제
비모수, 모수 검정 문제
상관계수 문제
로짓함수, 라코함수
로지스틱 회귀분석 문제 (틀린 것 찾기)
- 오즈 ~
- 선형회귀모델과 같이 회귀계수에 대한 변경 없이 해석할 수 있다.
재현율(Recall) 구하기 문제
변수 선택법 문제
입력층 - 은닉층(적음) - 출력층 신경망의 특징 문제
- 계산이 단순하다 -> 정답예상
- 기울기 소실 발생한다
- 복잡한 의사결정 발생