ADsP 47회 1과목 기출문제 정리

유튜브 기출문제풀이 영상 기반

by 위키북스

ADsP 시험이 이제 5일밖에 안 남았네요.

막판에 기출문제 다시 보면서 개념 정리하는 게 제일 중요하다고 느껴서,

ADsP 47회 1과목 기출문제 풀이 영상을 보며 핵심 내용 위주로 정리해봤습니다.


이 글은 문제를 하나하나 복기하면서

✔ 어떤 개념을 묻는 문제인지

✔ 선택지에서 헷갈리기 쉬운 포인트는 무엇인지

를 중심으로 정리한 기록입니다.


특히 시험 직전에 빠르게 훑어보기 좋게,

이론 설명보다는 기출에서 어떻게 나오는지에 초점을 맞췄어요.

같이 마무리 정리하는 느낌으로 보면 좋을 것 같습니다.





문제 1: 지식의 순환 과정

image1.jpg?type=w966 [문제 1 화면]


이 문제는 암묵지와 형식지의 상호 작용에 따른 지식의 순환 과정 순서를 묻고 있습니다.

지식 순환의 올바른 순서는 다음과 같습니다.


1. 공통화(Socialization): 암묵지에서 암묵지로 전환되는 단계로, 경험의 공유를 통해 이루어집니다.

2. 표출화(Externalization): 암묵지가 언어나 문서 등의 형식지로 표현되는 단계입니다.

3. 연결화(Combination): 표출된 형식지가 다른 형식지와 결합하여 새로운 형식지를 창출하는 단계입니다.

4. 내면화(Internalization): 형식지를 학습하여 개인의 암묵지로 전환하는 단계입니다.


정답: 1번 (공통화 → 표출화 → 연결화 → 내면화)


image3.jpg?type=w966





문제 2: DIKW 피라미드

%EC%8A%A4%ED%81%AC%EB%A6%B0%EC%83%B7_2026-02-02_214157.png?type=w966 [문제 2 화면]


이 문제는 DIKW 피라미드에서 성격이 다른 하나를 찾는 것입니다.

보기를 분석하면 다음과 같습니다.


1번: "30대 여성 고객층이 지난달 전체 매출액의 10%를 차지한다" → 정보(Information)

2번: "1분기 매출액이 전분기 대비 15% 상승" → 정보(Information)

3번: "1월부터 8월까지 매출 상승 추세를 바탕으로 다음 분기 매출이 약 3천만 원 증가할 것으로 예측" → 지식(Knowledge) 또는 지혜(Wisdom)

4번: "지난 분기 평균 매출은 42억 원이다" → 정보(Information)


1번, 2번, 4번은 단순 팩트(정보)인 반면, 3번은 정보를 해석하여 미래를 예측하는 것으로 성격이 다릅니다.


정답: 3번





문제 3: 데이터베이스의 특성

image2.jpg?type=w966 [문제 3 화면]


이 문제는 기계 가독성, 검색 가능성, 원격 조작 가능성이 데이터베이스의 어떤 특성에 해당하는지를 묻고 있습니다.


데이터베이스의 특성은 크게 세 가지 측면에서 분류됩니다.


1. 정보의 축적 및 전달 측면: 기계 가독성, 검색 가능성, 원격 조작 가능성

2. 정보 이용 측면: 사용자가 실질적으로 데이터를 이용하는 관점

3. 정보 관리 측면: 데이터를 일정한 구조에 따라 관리하는 관점


문제에서 제시된 세 가지 특성(기계 가독성, 검색 가능성, 원격 조작 가능성)은 모두 정보의 축적 및 전달 측면에 해당합니다.


정답: 1번 (정보의 축적 및 전달 측면)





문제 4: 익명화와 가명화

image5.jpg?type=w966 [문제 4 화면]


이 문제는 개인 정보를 식별할 수 없도록 제거하거나 변형하는 기술을 묻고 있습니다.

익명화와 가명화의 차이점을 이해하는 것이 중요합니다.


익명화(Anonymization):

- 개인 정보를 식별할 수 있는 정보를 삭제하거나 변형하여 특정 개인을 알아볼 수 없도록 만드는 기술

- 재식별 가능성을 완전히 제거

- 개인정보보호법 적용을 받지 않음

- 통계, 연구 목적으로 활용 가능


가명화(Pseudonymization):

- 개인 정보를 다른 값으로 대체하되, 매핑 정보가 있으면 원래 정보를 복원할 수 있음

- 재식별 가능성이 존재

- 개인정보보호법 적용을 받음


정답: 익명화


image4.jpg?type=w966 [익명화와 가명화 비교표]





문제 5: 빅데이터의 본질적 특성 (3V)

image7.jpg?type=w966 [문제 5 화면]


이 문제는 빅데이터의 본질적 특성 중 부적절한 것을 찾는 것입니다.


빅데이터의 본질적 특성3V로 알려져 있습니다.

1. Volume(규모): 기존 데이터베이스 관리 시스템으로는 처리하기 어려운 방대한 규모의 데이터

2. Variety(다양성): 정형 데이터뿐만 아니라 텍스트, 이미지, 영상, 음성 등 비정형 및 반정형 데이터를 포괄

3. Velocity(속도): 실시간 스트리밍 데이터나 센서 데이터처럼 빠른 속도로 생성되고 처리되어야 하는 특성


4번의 가용성(Availability)은 사용자가 필요로 할 때 언제든지 데이터에 접근할 수 있는 환경과 인프라 수준을 의미하지만, 이는 3V에 해당하지 않습니다.


정답: 4번 (데이터의 가용성)


image6.jpg?type=w966 [빅데이터 3V 개념도]





문제 6: 연관 분석

image9.jpg?type=w966 [문제 6 화면]


이 문제는 연관 분석의 개념적 특징과 활용에 대해 부정확한 설명을 찾는 것입니다.


연관 분석의 주요 개념

- 변수 간의 통계적 상관 관계를 규명하는 분석 기법

- 장바구니 분석(Market Basket Analysis)이라고도 함

- 특정 상품 구매 시 함께 구매될 가능성이 높은 상품을 찾아 교차 판매나 묶음 전략에 활용


연관 분석에서 사용하는 핵심 지표

- 지지도(Support): 전체 거래 중 특정 아이템 조합이 포함된 거래의 비율

- 신뢰도(Confidence): 특정 아이템을 구매했을 때 다른 아이템도 구매할 확률

- 향상도(Lift): 규칙의 유용성을 나타내는 지표


3번에서 언급된 "재현율(Recall)"은 연관 분석이 아닌 분류 모델 평가에서 사용되는 지표입니다.


정답: 3번 (재현율 관련 설명)





문제 7: 빅데이터 분석 기법

image8.jpg?type=w966 [문제 7 화면]


이 문제는 빅데이터 분석 기법과 활용 예시가 적절하지 않은 것을 찾는 것입니다.


[1번 보기를 분석하면]

- "군집 분석: 자동차의 성능 향상을 위해 여러 설계안을 반복적으로 평가하며 세대를 거쳐 최적의 조합을 탐색하는 진화적 설계에 활용된다"


여기서 핵심 키워드는 "세대", "진화", "최적의 조합 탐색"입니다. 이러한 특징은 유전자 알고리즘(Genetic Algorithm)의 특성이며, 군집 분석(Clustering)과는 관련이 없습니다.


군집 분석은 유사한 특성을 가진 데이터들을 그룹화하는 비지도 학습 기법입니다.


나머지 보기들은 올바른 매칭입니다.

- 2번: 연관 분석 - 대형마트 장바구니 분석 ✓

- 3번: 감정 분석 - 유튜브 댓글 긍부정 분석 ✓

- 4번: 사회관계망 분석 - SNS 사용자 간 상호 작용 분석 ✓


정답: 1번 (군집 분석과 유전자 알고리즘 혼동)





문제 8: 빅데이터 위기 요인과 통제 방안

image12.jpg?type=w966 [문제 8 화면]


이 문제는 빅데이터 위기 요인과 통제 방향이 잘못 짝지어진 것을 찾는 것입니다.


[보기 분석]

- 가. 사생활 침해: 제공자 동의 원칙에서 사용자 책임 원칙으로 전환 → 올바른 매칭

- 나. 책임 원칙 훼손: 알고리즘 접근을 허용한다 → 잘못된 매칭

- 다. 데이터 오용: 결과 기반 책임 원칙 고수 → 잘못된 매칭


나와 다가 서로 바뀌어 있습니다.

- 책임 원칙 훼손의 통제 방안은 "결과 기반 책임 원칙 고수"

- 데이터 오용의 통제 방안은 "알고리즘 접근 허용"(투명성 확보)


정답: 3번 (나, 다)





문제 9: OLTP와 OLAP

image10.jpg?type=w966 [문제 9 화면]


이 문제는 기업 운영 과정에서 거래 데이터를 실시간으로 처리하는 시스템을 묻고 있습니다.


[문제의 핵심 키워드]

- "거래 데이터"

- "실시간 입력, 삭제"

- "즉각적으로 데이터베이스에 반영"

- "트랜잭션(Transaction)"


이러한 특징은 OLTP(Online Transaction Processing)의 정의입니다.


OLTP와 OLAP의 차이:

- OLTP (Online Transaction Processing): 온라인 거래 처리. 실시간으로 트랜잭션을 처리하는 시스템

- OLAP (Online Analytical Processing): 온라인 분석 처리. 대량의 데이터를 분석하는 시스템


키워드 암기법:

- T = Transaction: 거래, 실시간 처리

- A = Analytical: 분석, 대량 데이터 처리


정답: OLTP





문제 10: 데이터 과학자의 역량

image11.jpg?type=w966 [문제 10 화면]


이 문제는 데이터 과학자의 핵심 역할과 요구 역량에 대해 부적절한 설명을 찾는 것입니다.


3번 보기를 분석하면 "데이터 분석 작업은 개인의 기술적 전문성에 의해 독립적으로 이루어지는 활동이므로 조직 내 이해 관계자의 소통이나 협업 역량보다는 통계적 분석 기법과 프로그래밍 역량이 더 중요하다"


이 설명은 부적절합니다. 실제로 데이터 과학자에게는

- 통계적 분석 기법과 프로그래밍 역량도 중요하지만

- 조직 내 다양한 이해 관계자와의 소통 및 협업 역량이 매우 중요합니다

- 분석 결과를 비즈니스 관점에서 해석하고 전달하는 커뮤니케이션 역량이 필수적입니다


[데이터 과학자의 필수 역량]

1. 전산학, 통계학 이론적 지식

2. 도메인 전문 지식

3. 협업 및 커뮤니케이션 역량

4. 시각화 및 스토리텔링 능력


정답: 3번




계속해서 2과목, 3과목도 정리해서 업로드할 예정입니다. 계속해서 따라와주세요.


https://cafe.naver.com/easyadsp


keyword
작가의 이전글pre-commit으로 품질 가드레일 5분 구축법