Distilling data into knowledge.
* Biocuration이 무엇이고, 가치가 무엇인지를 기술하고 있고 지향해야 할 목표를 제시하고 있다. 출판된 과학문헌과 그 결과들의 가치가 향상되기 위해서는 사람만 이해할 수 있는 언어에서 컴퓨터가 이해할 수 있는 언어로 확장되어야한다(full semantic spectrum). Biocurator는 curation할 데이터의 표준을 개발해야하며, 이에 드는 시간과 비용을 아까워 해서는 안된다.
Biocuration이란?
* Biocuration은 구조화되지 않은 생물학적 데이터로 부터 구조화된 데이터로 지식을 추출하는 일이다.
* 비구조화된 데이터는 manuscript나 실험데이터를 의미한다.
* Biocurator는 실험경험 및 도메인지식을 가지고 있는 PhD 수준의 생물학자가 많다.
* Biocurator는 다양한 소스 정보들로 부터 정보를 통합하고 합성하는 일을 수반한다.
Biocuration motivation
* Scientific communication은 정보화시대로 이동되고 있다.
* 연구자들이 curated resources에 대한 의존성이 증가하고 있다.
* 예를 들어, Protein Data Bank(PDB)는 고분자 구조에 대한 상세한 정보가 담겨져 있고, 가지고 다니면서 볼수 있는 pdf파일로 되어 있다. 이러한 컴퓨터가 읽을 수 없는 형태의 문자는 다운스트림 비교하는데에는 적절하지 않다.
* 기타 다른 공식적인 depositories들은 노력의 가치가 있는 것으로 평가된다.
* 이러한 예시들 처럼 저널 에디터와 데이터베이스간의 콜라보레이션과 시너지의 중요성이 강조된다.
* 출판된 논문들의 재사용과 영향력이 상승하려면, 사람만 이해할 수 있는 언어에서 컴퓨터가 이해할 수 있는 언어로 까지 full semantic spectrum이 되어야한다.
Biocuration costs
* biocuration이 굉장히 노동집약적인 일이다.
* biocurator들은 종종 기계 학습 및 자연 언어 처리 기술을 개발할 때 팀원으로 적극적으로 참여한다.
* 생물학적 데이터베이스 서비스의 가치를 평가하는 설문조사에 따르면, 사용자와 기금 제공자에게 주는 이익은 연구소가 직접 운영하는 비용의 20배에 해당한다.
* 필요한 데이터를 구조화된 형식으로 쉽게 접근할 수 있다는 것은 시간당 상당한 비용절감을 가지고 오기때문에 숨겨진 비용도 상당하다.
Actionable recommendations
* Everyone can be a biocurator
* biocuration을 너무 어렵게 생각하지 마라.
* 마찬가지로 실험실에서는 스프레드 시트의 개별 셀 내에서 자동 완성을 지원하는 소프트웨어 응용 프로그램과 보다 정교한 표준 인식 데이터 수집 도구를 사용하여 데이터 수집시 표준 용어가 적용되도록합니다
* 그러한 전자 실험 노트와 원고의 사용을 통해 권장형식/온톨로지 사용하여 'computer로 부터 탄생된' 데이터 생성의 목표가 실현될 것이다.
* Support for standards - Development, usage, and sustainability
* 표준의 중요성 강조
* 표준이 없으면 데이터베이스 검색 결과에 필연적으로 주요 정보가 누락되거나 관련성이 없는 자료가 포함된다.
* Biocurator 역할 중 하나는 표준을 개발하는 것이다.
* 하지만, 표준을 개발하는 시간과 비용에 대한 투자는 잘 이루어지지 않고 있다 (다양한 국제프로젝트를 예시로).
* Expediting the collection and processing of data
* 크라우드소싱(crowdsourcing) : 기업활동의 전 과정에 소비자 또는 대중이 참여할 수 있도록 일부를 개방하고 참여자의 기여로 기업활동 능력이 향상되면 그 수익을 참여자와 공유하는 방법이다.
* 크라우드소싱이 성행하여 최근에 연구자들이 biocuration tool들을 활용하여 자신의 결과를 지식 자료에 직접 게시하고 있다.
* 이러한 방법에서 성공을 보장하기 위해서는 편집상의 감독, 자동화 된 무결성 검사, citation mechanism 과 같은 전제조건이 있어야한다.
* 성공한 project들은 biocurator들에 의해 편집상의 감독을 하고 있다.
* 또한, 논문 투고 관련 웹 사이트의 ui, 투고 tool, 컴퓨터를 통한 컨텐츠 검증 유틸리티등을 개발하는데 biocurator들이 지원할 수 있다.
* Biocuration is a necessity for scientific progress
* 개별 연구자가 정보를 발견하고, 수집하고, 수동으로 확인하고, 단편적인 방식으로 통합하는 데 소요되는 시간은 과학적 진보를 저해한다.
* 연구자를 위해 biocuration은 문서화되고 안정적인 resource에서 광범위하고 상호 연결된 정보를 쉽게 찾을 수 있게 해준다.
IF팀 LSM 한글 요약
https://www.ncbi.nlm.nih.gov/pubmed/29659566