brunch

USDA 미국 영양소 데이터베이스 파일 형식 설명(1)

USDA 미국 국가 영양소 데이터베이스 파일 형식 설명 #

파일 형식 설명 (1) #

영양소 데이터는 서로 다른 두 가지 조직 형식임

관계형 포맷으로 네 가지 주요 파일과 여섯 개의 지원 파일이 데이터베이스를 구성하며, 관계 형식은 다음과 같음 모든 음식, 영양소 및 관련 데이터

다른 하나는 약식 포맷으로 모든 식품 품목은 있지만, 영양소는 적고 다른 모든 관련 품목은 포함되어 있지 않음 약식 포맷에는 전분, 개별 설탕, 불소, 인, 비타민 D2 또는 D3, 비타민 E 첨가, 비타민 B12, 알코올, 카페인, 테오브로민, 식물 스테롤, 개별 아미노산 또는 개별 지방산 등 정보 포함


네 가지 주요 데이터베이스 파일은 식품 설명 파일, 양분 데이터 파일, 그램 무게 파일 및 각주 파일

관계형 파일은 ASCII (ISO / IEC 8859-1) 형식과 Microsoft Access 2007 데이터베이스 형식으로 되어있음

표3 ~ 표15는 각 형식에 대한 설명임

이 파일들 사이에 만들 수 있는 관계에 대한 정보도 제공

항상 공백이나 null로 남겨 둘 수 있는 데이터와 필드를 포함하는 필드에서 식별됨

"Blank" 열: N은 항상 채워지는 필드를 나타냄

Y 인덱스는 공백으로 남겨 둘 수 있음

별표는 파일의 기본 키를 나타냄

키가 ASCII 파일에 대해 식별되지는 않지만 파일 설명은 NDBS 내에서 레코드를 정렬하고 관리하는 데 사용이 됨

이 파일들을 데이터베이스 관리 시스템, 키가 파일에 대해 식별되는 경우 중요 함

데이터를 추출할 경우 여기에 나열된 키를 사용하면 됨

특히 두 가지를 사용하는 양분 데이터 파일을 사용


<표. 3> 주요 파일 및 추가 파일내의 레코드 수

uc?id=1Ck5lVNS3Jsd0rcQfqccYiCkmA9FjE0m8&export=download


출처: USDA National Nutrient Database (미국 농무성 국제 식품 영양 표준 데이터베이스,

https://www.ars.usda.gov/

)

ASCII 파일의 모든 필드는 캐럿 (^)으로 구분되며 텍스트 필드는 물결 무늬 (~)로 둘러 쌓여 있음 * 이중 캐럿 (^^) 또는 두 개의 캐럿과 두 개의 물결표 (~~)는 필드가 null이거나 비어있는 경우 형식임 * 형식 설명서에는 각 필드의 이름, 유형 [N = 너비 및 소수 자릿수 (w.d) 또는 A = 영숫자로 숫자 최대 레코드 길이를 나타내지만, 데이터 파일의 실제 길이는 그다지 길지 않을 수 있고 최신 업데이트가 되면 변경됨 * 데이터가 채워질 때 가져올 때 값 뒤에 0이 채워집니다. 사용된 형식에 따라 다양한 소프트웨어 패키지로 변환할 수 있습니다.

<그림. 1> USDA 참조표준 DB 파일간의 관계 다이어그램

uc?id=1u_Ipi-CcOBKEcoGgucZSe5Ak3FECofkG&export=download


출처: USDA National Nutrient Database (미국 농무성 국제 식품 영양 표준 데이터베이스,

https://www.ars.usda.gov/


출처: http://www.incodom.kr/USDA_DB/Explanation_of_file_format_1


keyword
매거진의 이전글USDA 미국 영양소 데이터베이스 참조표준 DB (2)