엑셀 레코드란? 데이터 정합성과 엑셀 로우데이터의 구성

레코드란 무엇인지, 데이터 정합성이 왜 중요한지

by 데이터위자드
image.png?type=w966


엑셀을 단순히 계산기처럼 쓰던 사람도 어느 순간 “이제는 데이터를 관리해야 한다”라는 벽에 부딪히게 됩니다. 예를 들어 상사가 “2025년 매출 현황을 정리해서 대시보드까지 만들어 와”라고 지시했다고 가정해봅시다. 처음에는 고객 이름, 전화번호, 매출 금액, 구매 일자 같은 항목을 열거해두면 끝이라고 생각하기 쉽습니다. 하지만 막상 데이터를 입력하다 보면 고민이 생깁니다.



고객 한 명이 여러 번 구매하면 같은 이름을 여러 줄에 적어야 할지, 아니면 합계를 내서 한 줄에만 적어야 할지 헷갈립니다. 전화번호가 중복되면 문제가 생기지 않을까 불안합니다.


또 일자 입력을 자유롭게 두면 어떤 건 ‘2025-01-01’, 어떤 건 ‘1/1’, 또 어떤 건 ‘2025년 1월 1일’로 기록되어 뒤죽박죽이 됩니다. 이런 상태에서 피벗테이블을 만들거나 차트를 그리면 결과가 이상하게 나오고, 보고서는 신뢰를 잃게 됩니다.



즉, 단순히 데이터를 “적어 넣는 것”과 “정해진 구조 안에서 레코드를 쌓아가는 것”은 전혀 다른 차원입니다. 엑셀은 표를 꾸미는 도구를 넘어서 데이터베이스 개념을 훈련할 수 있는 훌륭한 학습장이 됩니다.




데이터를 올바른 형태로 기록하고 정합성을 유지해야만, 이후 대시보드 제작이나 자동화 분석 단계에서 흔들리지 않습니다.


이번 글에서는 바로 그 핵심, 레코드란 무엇인지, 데이터 정합성이 왜 중요한지, 그리고 로우데이터를 어떤 원칙으로 구성해야 하는지를 차근차근 짚어보겠습니다.





1. 레코드(Record)란 무엇일까?



image.png?type=w966



레코드는 데이터베이스에서 한 개의 완결된 행(row)을 의미합니다. (열=필드)

쉽게 말해, 하나의 거래, 하나의 고객, 하나의 주문, 하나의 설문 응답 등 "하나의 사건이나 객체"를 설명하는 모든 속성을 담은 데이터 묶음입니다.




예를 들어 고객 관리 시트를 만든다고 가정해봅시다.



A열: 고객번호

B열: 이름

C열: 전화번호

D열: 가입일

E열: 구매금액


이 경우 2행 전체(A2:E2)가 바로 하나의 레코드가 됩니다. "홍길동이라는 고객"에 관한 정보를 한 줄로 묶어놓은 것이죠.



image.png?type=w466
image.png?type=w466





여기서 중요한 점은, 레코드 단위가 명확해야 한다는 것입니다.


만약 한 줄에 두 명의 고객 정보를 억지로 넣거나, 같은 고객의 여러 사건(구매내역)을 한 줄에 합쳐버리면, 엑셀의 장점인 필터, 피벗테이블, 함수 활용이 어려워집니다. 레코드는 언제나 한 사건/객체 = 한 행(row) 이라는 원칙을 지켜야 합니다.





데이터 정합성(Data Integrity)이란 무엇일까?


데이터 정합성이란 단순히 값이 틀리지 않는 수준을 넘어, 데이터가 모순 없이 일관성을 유지하는 상태를 말합니다.


여기에는 크게 두 가지 축이 있습니다. 바로 필드 정합성(Field Integrity)과 레코드 정합성(Record Integrity)입니다.





1) 필드 정합성(Field Integrity)


이 부분은 상대적으로 이해가 쉽습니다. 하나의 테이블(시트 안의 데이터 블록) 안에서 각 필드(열)가 올바르게, 그리고 같은 규칙을 가지고 입력되어야 한다는 뜻입니다.


예를 들어, 고객 관리 시트에 다음과 같은 테이블이 있다고 가정합시다.

데이터정합성.png



여기서 보이는 문제는 바로 필드 정합성 깨짐입니다.

이름: 같은 고객인데 “홍길동”과 “홍 길동”으로 다르게 입력

날짜: 같은 날짜를 표기했는데 하나는 2025-01-15, 다른 하나는 2025/01/15

금액: 숫자가 아니라 “이십만”이라는 텍스트로 기록



이런 불일치가 있으면 피벗테이블이나 SUMIFS 함수로 집계했을 때 결과가 달라집니다. 그래서 필드 정합성이란 곧 “열 단위 규칙을 지켜라”라는 의미입니다.




2) 그런데 테이블(매트릭스)이란 무엇일까?


여기서 많은 분들이 묻습니다. “필드 정합성은 알겠는데, 테이블(매트릭스)라는 건 뭐냐고요?”


테이블이란 엑셀에서 데이터를 행과 열로 구조화한 하나의 블록을 말합니다. 쉽게 말해 하나의 주제를 가진 로우데이터 집합입니다.



고객 테이블: 고객ID, 이름, 전화번호, 가입일, 주소

매출 테이블: 주문ID, 고객ID, 제품코드, 수량, 금액, 일자

상품 테이블: 제품코드, 제품명, 단가, 분류



, 테이블은 “행은 레코드, 열은 필드”라는 원칙을 가진 구조화된 표를 의미합니다.




3) 레코드 정합성(Record Integrity)


이제 레코드 정합성이란 개념이 나옵니다. 필드 정합성은 한 테이블 안에서 열 단위로 규칙을 지켜주는 것이라면, 레코드 정합성은 여러 테이블 간 행과 행이 올바르게 연결되는 것을 말합니다.


예를 들어, 엑셀에서 시트를 이렇게 나눴다고 합시다.


고객 DB 시트: 고객정보를 담는 원본 데이터

매출 DB 시트: 실제 주문과 매출 데이터를 담는 원본 데이터


이 두 시트가 잘 연결되려면 고객ID 같은 공통 키(Key)가 정확히 맞아야 합니다.


그런데 만약:


매출 DB 시트에 고객ID “C005”가 있는데, 고객 DB 시트에는 C005 고객이 없음

매출 DB에 제품코드 “P100”이 있는데, 상품 테이블에는 P100이 정의되지 않음

매출 금액이 있는데, 해당 주문번호가 고객 테이블과 매칭되지 않음



이런 상황이 생기면 레코드 정합성이 깨졌다고 말합니다. 즉, 서로 다른 테이블의 행들이 공통 키 값으로 연결되지 않아 고아 데이터(orphan record)가 발생하는 것입니다. *자주쓰는 표현은 아니고 그냥 key가 안맞다, 정합성이 깨졌다 정도로 표현하기도 합니다.





4) 정합성의 두 축이 모두 필요하다


필드 정합성: 테이블 안에서 열 값이 형식, 규칙, 필수 여부를 지켜야 한다

레코드 정합성: 여러 테이블 사이에서 키 값으로 정확히 연결되어야 한다


이 두 가지가 모두 충족되어야만 데이터 분석 결과를 믿을 수 있습니다. 필드만 맞고 테이블 간 연결이 끊기면 매출과 고객이 분리되고, 테이블 간 연결만 맞고 필드가 제각각이면 집계가 왜곡됩니다.




즉, 데이터 정합성이란 “각 테이블 안에서 필드를 지켜라”와 동시에 “테이블 간 레코드를 연결하라” 두 가지 원칙을 모두 포함하는 개념입니다. 엑셀에서 시트를 나누어 로우데이터를 관리할 때, 반드시 이 정합성을 의식해야 나중에 피벗, 대시보드, 리포트가 올바르게 동작합니다.





3. 로우데이터와 행을 구성할 때의 원칙


엑셀에서 ‘로우데이터(Raw Data)’란 가공되지 않은 원본 데이터를 말합니다. 이 로우데이터는 보고서나 대시보드를 만드는 근간이 되기 때문에 반드시 구조적으로 잘 설계해야 합니다.



(1) 행 = 레코드, 열 = 속성

앞서 언급했듯이 한 행이 하나의 사건(레코드)을 표현해야 합니다.

열(Column)은 그 사건의 속성(누구, 언제, 무엇, 얼마 등)을 나타내야 합니다.




예:


행: 고객 1명, 주문 1건, 설문 1회

열: 이름, 날짜, 제품, 수량, 금액




(2) ★★★ 병합 셀 금지 ★★★


엑셀 초보자들이 자주 하는 실수는 데이터를 보기 좋게 하려고 병합(Merge)을 사용하는 것입니다. 하지만 병합된 셀은 함수, 필터, 피벗테이블에서 오류를 유발합니다. 로우데이터에서는 절대 병합을 사용하지 않고, 각 행과 열은 독립적으로 유지해야 합니다.



(3) 꾸미지 말고 담백하게


로우데이터는 분석을 위한 원본입니다. 색상 강조, 불필요한 합계 행, 공백 행은 분석에 방해만 될 뿐입니다. 데이터는 깔끔하게 ‘행렬 구조’만 유지하는 것이 이상적입니다.



(4) 키 값의 명확화


모든 행은 고유하게 식별될 수 있어야 합니다. 예를 들어 "고객번호+주문번호"처럼 중복되지 않는 키가 존재해야 정합성이 유지되고, 나중에 데이터베이스나 다른 시트와 연결할 때 문제가 발생하지 않습니다.


(5) 로우데이터와 가공데이터 분리


하나의 시트에 원본 데이터와 요약표를 섞어두면 관리가 어렵습니다.


원본 데이터 시트는 오직 기록만, 별도의 시트에서 피벗테이블이나 수식을 통해 요약·분석하는 구조가 가장 안정적입니다.






마무리



엑셀은 데이터베이스가 아니지만, 기본 원리를 따르지 않으면 금세 한계에 부딪힙니다.


레코드를 명확히 정의하고, 데이터 정합성을 지키며, 로우데이터를 올바르게 구성하는 습관이야말로 엑셀 고수로 가는 첫걸음입니다.




정리하자면:



레코드 = 하나의 사건을 담은 한 행

정합성 = 데이터의 일관성과 신뢰성

로우데이터 구성 = 행은 사건, 열은 속성, 병합 없이 담백하게




이 세 가지 원칙만 지켜도, 나중에 수백만 건의 데이터를 다룰 때도 흔들리지 않는 구조를 갖출 수 있습니다.




작가의 이전글엑셀 함수에서 통계 분석이 필요한 순간.