성간여행, 은하 간여행 interstellar, intergalaxial
만약에 우리 인류의 조상들이 進步를 위해서 위험을 무릅쓰고 희생하고 연구하고 고민하고 노력하지 않았다면 아직까지도 우리는 중세의 유럽이나 조선시대처럼 걸어 다닐 수 있는 기껏해야 반경 10 mile 생활권에서 평생을 갇혀 자급자족(self sufficient)하며 육체적으로 매우 힘들게 harsh 살다가 어린 나이에 병이라도 걸리면 왜 죽는지도 모르고 치료약이 없으므로 지금보다도 훨씬 짧은 생을 마쳐야 했을 것이다.
POWER OF DATA 2018.4.19
(성간여행, 은하 간여행 interstellar, intergalaxial travel)
***********************************************
Data의 사전적 의미는 다음과 같다.
Facts and statistics collected together for reference or analysis.
참조하거나 분석을 하기 위해 모은 사실 facts 또는 통계.
************************************************
1. 구글이나 아마존등 클라우드 서비스 회사들은 엄청난 양의 data를 처리하고 보관한다.
데이터는 양적인 그리고 질적인 측면에서 모두 중요하다. 양질의 데이터라도 데이터의 크기가 작을 경우 sampling을 할 수 없고 품질이 낮은 data는 Data의 양이 많더라도 마찬가지로 쓸모가 없다.
왜냐하면 저품질의 big데이터나 고품질의 small data 모두 통계학적으로 신뢰할 수 없기 때문이다.
Dji라는 드론 drone을 생산하는 세계적인 先發 中國제조회사가 있다. 전 세계 시장 점유율 또한 압도적으로 1등이다. 매년 매력적인 신제품을 세상에 내놓으며 소비자를 끌어들인다.
다른 모든 세계 1등 회사와 마찬 가지로 드론이 세계 1등 회사가 되는 데는 그들이 가지고 있는 비행정보 데이터가 여타 드론제조회사 보다 훨씬 많기 때문이라고 한다.
그 많은 비행 정보 데이터는 customer의 드론 비행정보로부터 전송이 되어 Dji사의 데이터 file에 쌓이게 된다. 그 데이터는 회사가 다음 신제품을 내놓을 때 데이터가 알려주는 구제품의 positive와 negative를 분석하여 신제품에 반영을 하게 된다.
그러므로 이전 버전의 제품보다 분명히 하드웨어적 그리고 소프트웨어적으로 성능이 우수한 비행체를
만들어 낼 수 있는 것이다.
그러므로 경험이 많고 제품판매가 많은 즉 오래되거나 고객이 많은 큰 회사일수록 빅데이터의 축적에 당연히 유리하다.
Amazon, Apple, Boeing, Samsung, Toyota, Canon 등 세계적인 先導 기업들이 특별한 이유가 없는 한 그 위치가 쉽게 위협받지 않는 것도 근본적으로 그 BIG DATA의 힘으로 보면 무난할 것이다.
기업에서 데이터는 제품생산뿐만 아니라 全社的인 거의 모든 분야를 아우른다고 볼 수 있다. 기업의 우두머리가 회사의 큰 방향을 틀어 어디로 갈 것인지를 결정할 때 그 분석자료가 되는 데이터의 중요성은 너무도 클 것이다. 왜냐하면 잘못된 결정은 회사의 존립에 치명적인 영향을 줄 수 있기 때문이다.
데이터를 이용하여 자료를 분석하고 나아갈 길을 보여주는 다음과 같은 방법들이 있다.
***********************************
Machine Learing(機械學習)
***********************************
컴퓨터 사이언스의 한 분야인 머신러닝은 컴퓨터에게 정해진 프로그램을 주지 않고 프로그램이 없이 데이터를 전부 주거나 일부를 주어서 컴퓨터가 데이터를 사용하는 방법을 배우게 하는 것이다. 머신러닝은 1959년에 처음으로 아서 사무엘에 의해 이름이 붙여졌는데 컴퓨터 統計學과 밀접한 관계가 있다.
효율적인 머신러닝은 쉽지 않다. 왜냐하면 분류작업등을 위한 패턴(pattern)을 찾는 것이 어렵고 학습을 위한 데이터가 적기 때문이다.
최소한의 데이터를 주고 action에 대한 피드백만을 제공하는 ‘자율자동차운전’이나 ‘적과의 게임’을 하는 등의 임무 부여 학습이 기계학습의 일부이다
기계학습의 應用분야는 다음과 같다.
. 분류작업 分類作業 (classification)
. 회귀선도 분석 回歸線圖分析 (regression analysis)
. 군집분석 群集 分析 (clustering analysis)
. 확률밀도추정 確率密度推定(density estimation 도수분포)
. 주성분분석 主成分 分析(dimensionality reduction)
********************************
컴퓨터게임과 인공지능(AI :Artificiall intelligence)의 선구자였던 아서 세뮤얼은 1959 IBM근무당시 기계학습(Machine learnin)이란 용어(term)를 처음으로 도입했고 기계학습은 이후 成長하여 AI(인공지능)의 탐구를 향해 발전하게 된다.
*********************************
***************************
Deep Learning(딥 러닝)
***************************
딥러닝은 작업목표가 분명한 알고리즘(ALGORITHM)에 반대되는 개념이다.
거친 데이터(raw data)로부터 사물감지(feature detection)나 分類(classification)를 위해 필요한 表現因子를 자동으로 찾아내기 위한 일단의 기술인 表現學習(representation learning)에 基礎한 큰 의미의 기계학습이다.
딥러닝은 생물학적 신경계 시스템의 정보분석과 전달패턴과 어느 정도 관련이 되어 있다.
딥러닝의 응용분야로는 다음과 같은 것이 있다.
. 컴퓨터 비전 : 컴퓨터가 사진이나 비디오로부터 정보를 분류하는 것.
. 안면(얼굴 face) 인식
. 음성인식
. 인간言語 분석
. 언어 번역기
.新藥발명
. AlphaGo
지금까지 빅 데이터(big data)의 주도권은 영어를 사용하는 서구문명권에 있다. 거의 모든 연구 research, 발명 그리고 발견들이 英語로 보고(report)되고 그리고 documentation이 이루어지고 클라우드데이터化 되고 있기 때문이다.
데이터는 거의 모든 산업현장과 사회분야에서 자연의 선택(natural selection)과 같이 事故(collision) 확률이 작은 안전한 방향으로 갈 수 있게 하는 方向舵 (steering) 역할을 한다.
AI(artificial intelligence인공지능)은 인간이 할 수 없는 일을 하거나 또는 인간에 비해 매우 짧은 시간 동안 대량의 데이터 프로세스나 분석을 통해 그 결과물을 내놓음으로써 인간의 삶을 도우는데 목적 이 있지만 그에 대한 비판도 많다.
************************************************
뉴욕대학교 교수이며 언어, 생물학 그리고 마음에 초점을 두고 연구하는 심리학자인 게리 마커스 Gary Marcus(1970~ )는 다음과 같이 인공지능 AI(artificial intelligence)에 대해서 말한다.
“현실적으로 일반적인 상호관계가 결핍된 Deep learning 머신들은 예를 들면 대상/물체가 무엇인지 그리고 무엇에 필요한 것인지 그리고 어디에 사용되는 것인지에 대한 논리적인 사유思惟를 할 수 있는 방법이 없고, 주어지는 추상적인 지식(정보)을 통합분석 하려면 아직도 멀었고, 가장 강력한 인공지능인 IBM의 WATSON도 통계학의 아주 복잡한 기술 중의 한 요소만을 사용하고 있다.”
************************************************
인터스텔라(Interstellar)라는 영화에 보면 IBM의 WATSON같이 사람의 물음에 대답하는 萬物博士 機械가 등장한다. 그런데 영화를 보면 그 기계는 새로운 행성의 바다에 착륙하여 물이 얕은 바다에 주인공과 걸어 나간다.
그러나 그 기계(AI Robot)는 저 멀리에서 다가오는 파도를 보지만 무엇인지 모르므로 인간에게 경고하지 못하고 주인공인 캡틴이 그것이 거대한 파도라는 것을 육안으로 인지하여 승무원들과 기계에게 우주선으로 귀환을 명령한다.
첨단 SF영화 안에서 아이러닉 하게도 사람이 AI(人工知能)을 위험으로부터 구한 것이다.
****윗글과 관련이 있는 내용****
참조;평행우주 Parallel universe (Michio Kaku)
*****************************************
INTERSTELLAR travel (星間 旅行)
*****************************************
인류는 지금 고작 유인우주선을 빛의 속도로 10만 년 크기의 은하계내에서 1초밖에 걸리지 않는 달까지밖에 보내지 못하고 있다.
인류가 태양계(빛의 속도로 13시간 半徑의 太陽系 假想의球hemisphere까지의 거리)를 벗어나 다른 태양인 별까지 여행(가장 가까운 별 Proxima Centauri: 약 4광년)까지 하려면 우리는 아주 빠른 로켓(광속의 10%로 44년 거리/ 보잉 747로는 1.32백만 년 소요 )을 만들어야 한다.
그리고 그 별에 대한 정보와 별까지의 여정에 가로놓여있는 우주먼지(STARDUST)와 우주공간의 질량분포를 빠짐없이 알아내어 공간의 重力에 의한 곡률(curvature)등 위험요소들에 대한 정보와 계산결과가 있어야 한다.
그 정보인 INFORMATION은 데이터를 기반으로 분석을 통해 계산이 이루어진다. 그러므로 엄청난 양의 데이터의 蓄積(KNOW HOW)은 중요하다.
과학자들은 문명의 수준을 정보의 양으로 가늠하는 방법을 고안해 냈는데 문자가 없는 원시문명인 A type문명은 10의 6승 byte (10 to the 6 bit)의 정보량을 가지고 있다고 본다.
반면 현재 우리의 문명은 전 세계 도서관의 모든 책과 사진 비디오등을 전부 합치면 10의 13승 bit의 data를 가지고 있는 0.7H급의 문명으로 본다. (문자화하기 전에 머릿속에 있는 생각은 데이터가 아니다.)
최소 K급文明(civilization)이 돼야 성간 여행이 가능하다고 본다.
*****************************************
INTERGALAXY travel (銀河間 旅行)
*****************************************
Data정보량과 계산능력이 훨씬 앞선 문명인 Q급 문명에서 가능하다고 얘기하고 있다.
은하 간여행은 획기적인 기술과 발견이 없이 지금 우리가 생각하는 로켓과 같은 정상적인 탈것으로는 사실상 불가능하다. 왜냐하면 우리 은하를 탈출하는데만 ( 총알의 30,000배 속도이며 광속의 10%인 초속 30,000km 極極초고속이라고 해도) 20萬年이 걸리고 가장 가까운 안드로메다은하까지 아무 사고 없이 무사히 간다고 해도 2500만 년이 걸리기 때문이다. (보잉 747 비행기로는 가장 가까운 안드로메다 은하까지 2조 5000억 년 소요)
*************
Thoughts
*************
어떤 여행의 경우이던 인류가 도달하기에 매우 먼 미래(수십 수백만 년이 걸릴)의 이야기 일수도 있다. 그렇지만 우리가 몇십 년의 짧은 생을 산다고 해서 아무것도 안 하고 지금부터 좌절하고 포기할 수는 없다.
왜냐하면 그것은 우선 삶의 목적에 부합되지 않고 또한 우리는 우리의 후손들이 대를 이어 지금보다 더 나은 환경에서 살게 되기를 원하기 때문이다.
인류를 위한 획기적인 돌파구(breakthrough)를 찾아내는 과학자등을 칭송稱頌하는 노벨상 Nobel prize이 존재하는 이유가 거기에 있다.
*********************************************
만약에 우리 인류의 조상들이 進步를 위해서 위험을 무릅쓰고 희생하고 연구하고 고민하고 노력하지 않았다면 아직까지도 우리는 중세의 유럽이나 조선시대처럼 걸어 다닐 수 있는 기껏해야 반경 10~20Km의 생활권에서 평생을 자급자족(self sufficient)하며 육체적으로 매우 힘들게 harsh 살다가 어린 나이에 병이라도 걸리면 왜 죽는지도 모르고 치료약이 없으므로 지금보다도 훨씬 짧은 생을 마쳐야 했을 것이다.
*********************************************