죠슈아 건즈 (Joshua Gans), 어제이 애그러월 (Ajay Agrawal), 아비 골드파브( Avi Goldfarb)는 2020년 9월 하버드 비즈니스 리뷰에 '머신러닝으로 이기는 법(How to Win with Machine Learning)'을 개제하였습니다. 그들은 토론토 로드먼경영대학원의 교수입니다.
거의 모든 산업에서 머신러닝을 사용합니다. 머신러닝으로 업계의 판도를 바꾸는 선두 기업들에 의해 만들어진 진입장벽은 무엇이고, 후발 진입 기업들이 취할 수 있는 전략은 무엇인지를 설명합니다.
The past decade has brought tremendous advances in an exciting dimension of artificial intelligence—machine learning. This technique for taking data inputs and turning them into predictions has enabled tech giants such as Amazon, Apple, Facebook, and Google to dramatically improve their products. It has also spurred start-ups to launch new products and platforms, sometimes even in competition with Big Tech.
지난 10년간 인공지능의 흥미로운 분야에 눈부신 발전이 있었습니다. 바로 머신러닝입니다. 아마존, 애플, 페이스북, 구글 등 IT 거대 기업들은 데이터를 수집하고 분석하여 예측하는 기술을 활용하여 자사의 제품을 획기적으로 개선합니다. 스타트업 기업들은 때때로 거대 IT 기업들과 경쟁할 수 있는 새로운 제품과 플랫폼을 출시합니다.
Consider BenchSci, a Toronto-based company that seeks to speed the drug development process. It aims to make it easier for scientists to find needles in haystacks—to zero in on the most crucial information embedded in pharma companies’ internal databases and in the vast wealth of published scientific research. To get a new drug candidate into clinical trials, scientists must run costly and time-consuming experiments. BenchSci realized that scientists could conduct fewer of these—and achieve greater success—if they applied better insights from the huge number of experiments that had already been run.
신약 개발 프로세스를 신속히 제공하는 캐나다 토론토에 위치한 벤치사이 기업을 살펴봅시다. 과학자들이 건초더미에서 바늘을 찾는 것을 더 쉽게 합니다. 벤치사이는 제약회사 내부 데이터베이스와 방대한 연구자료에 숨겨진 가장 중요한 정보를 찾습니다. 신약 후보물질을 임상시험에 적용하기 위해, 과학자들은 시간과 비용이 많이 드는 실험을 해야 합니다. 벤치사이는 과거에 실행된 수많은 실험에서 얻어진 통찰력을 적용한다면, 과학자들이 실험 횟수를 줄이고 더 큰 성공을 달성할 수 있다는 것을 깨달았습니다.
Indeed, BenchSci found that if scientists took advantage of machine learning that read, classified, and then presented insights from scientific research, they could halve the number of experiments normally required to advance a drug to clinical trials. More specifically, they could use the technology to find the right biological reagents—essential substances for influencing and measuring protein expression. Identifying those by combing through the published literature rather than rediscovering them from scratch helps significantly cut the time it takes to produce new drug candidates. That adds up to potential savings of over $17 billion annually, which, in an industry where the returns to R&D have become razor-thin, could transform the market. In addition, many lives could be saved by bringing new drugs to market more quickly.
벤치사이는 과학자들이 실험 결과들을 읽고 분류할 수 있는 머신러닝을 활용한다면, 과학자들은 신약을 임상시험을 적용하기까지 실험 횟수를 절반으로 줄일 수 있다는 사실을 발견했다. 자세히 설명하자면, 과학자들은 단백질 발현에 영향을 미치고 측정하기 위한 필수 물질인 생물학적 시약(試藥·reagents)을 찾기 위해 머신러닝을 사용할 수 있다. 맨 땅에서 시약을 찾는 것과 달리 논문과 연구 결과를 결합하여 시약을 찾아내는 것은 신약 후보 물질을 생산하는 시간을 크게 단축할 수 있습니다. 이로 인해 연간 170억 달러(약 20조 원) 이상의 잠재적 비용절감 효과를 얻을 수 있다. 머신러닝 기술을 연구개발 수익성이 매우 낮은 제약산업계에 적용한다는 것은 시장을 뒤흔드는 획기적인 사건입니다. 또한 신약 개발 속도를 가속화해 많은 생명을 구할 수 있습니다.
What is remarkable here is that BenchSci, in its specialized domain, is doing something akin to what Google has been doing for the whole of the internet: using machine learning to lead in search. Just as Google can help you figure out how to fix your dishwasher and save you a long trip to the library or a costly repair service, BenchSci helps scientists identify a suitable reagent without incurring the trouble or expense of excessive research and experimentation. Previously, scientists would often use Google or PubMed to search the literature (a process that took days), then read the literature (again spending days), and then order and test three to six reagents before choosing one (over a period of weeks). Now they search BenchSci in minutes and then order and test one to three reagents before choosing one (conducting fewer tests over fewer weeks).
여기서 주목할 만한 점은 벤치사이는 신약 개발 분야에서 구글이 인터넷 검색 서비스 분야에서 하는 것과 비슷하다는 것이다. 즉, 검색 분야에 머신러닝을 활용하는 것이다. 구글은 식기세척기가 고장 났을 때 당신이 도서관에 가는 시간과 가전 수리점에 맡기는 고가의 비용을 지불하는 대신에 식기 세척기를 고치는 법을 알려줍니다. 벤치사이는 과학자들이 과도한 연구와 실험을 하지 않고 적절한 시약을 찾도록 도와줍니다. 전에는, 과학자들은 종종 논문을 검색하기 위해 구글이나 의약전문 검색 엔진 펍메드를 사용하고 (수일이 걸렸던 과정), 논문을 읽고 (또다시 수일을 보냄), 그러고 나서 3개에서 6개의 시약을 주문하고 테스트한 후에 하나를 선택합니다. (몇 주가 걸림). 지금은 과학자들이 몇 분만에 벤치시아를 검색하고 나서 1개에서 3개 정도의 시약을 주문하고 테스트한 후에 하나를 선택합니다. (더 적은 테스트 기간이 걸림)
Many companies are already working with AI and are aware of the practical steps for integrating it into their operations and leveraging its power. But as that proficiency grows, companies will need to consider a broader issue: How do you take advantage of machine learning to create a defensible moat around the business—to create something that competitors can’t easily imitate? In BenchSci’s case, for instance, will its initial success attract competition from Google—and if so, how does BenchSci retain its lead?
많은 기업이 AI를 활용하여 회사를 운영하는 단계에 있습니다. 그러나, 응용능력이 높아지면서, 기업들은 더 광범위한 이슈를 고려해야 합니다: 비즈니스 주위에 해자를 만들어 경쟁기업들이 쉽게 모방할 수 없는 무엇인가를 만들기 위해 머신러닝을 어떻게 활용해야 할까요? 예를 들면, 벤치시아의 케이스에서 그들의 초기 성공은 구글을 이 시장으로 끌어들이게 할까요? 만일 그렇다면, 벤치시아는 어떻게 선두를 유지할까요?
In the following pages, we explain how companies entering industries with an AI-enabled product or service can build a sustainable competitive advantage and raise entry barriers against latecomers. We note that moving early can often be a big plus, but it’s not the whole story. As we discuss, late adopters of the new technology can still advance—or at least recover some lost ground—by finding a niche.
다음 페이지에서, 우리는 AI가 활성화된 제품이나 서비스를 가진 산업에 진입하는 기업들이 지속 가능한 경쟁 우위를 구축하고, 후발 주자에 대한 진입 장벽을 높이는 방법을 설명할 것입니다. 선두 주자는 큰 이점이 있지만 그것이 전부는 아닙니다. 우리가 논의한 대로, 신기술을 채택이 늦은 기업들도 틈새시장을 발견하거나 적어도 잃어버린 땅을 회복할 수 있습니다.
Businesses use machine learning to recognize patterns and then make predictions—about what will appeal to customers, improve operations, or help make a product better. Before you can build a strategy around such predictions, however, you must understand the inputs necessary for the prediction process, the challenges involved in getting those inputs, and the role of feedback in enabling an algorithm to make better predictions over time.
비즈니스는 패턴을 인식하고 예측하기 위해 머신러닝을 사용합니다. 예측은 무엇이 고객에게 어필할 것인지, 무엇이 운영을 개선할 것인지, 무엇이 제품을 더 좋게 할 수 있는지에 관한 것입니다. 그러나, 예측에 기반한 전략을 세우기 전에, 당신은 예측 프로세스에 필요한 입력 데이터, 입력 데이터를 얻기 위한 도전 과제와 알고리즘이 시간이 지날수록 더 나은 예측을 하기 위한 피드백의 역할을 이해해만 합니다.
A prediction, in the context of machine learning, is an information output that comes from entering some data and running an algorithm. For example, when your mobile navigation app serves up a prediction about the best route between two points, it uses input data on traffic conditions, speed limits, road size, and other factors. An algorithm is then employed to predict the fastest way to go and the time that will take.
머신러닝에서 예측이란 데이터를 입력하고 알고리즘을 실행한 출력 정보입니다. 예를 들면, 스마트폰의 내비게이션 앱 서비스는 두 지점 사이의 최적 경로를 예측할 때, 교통정보, 속도제한, 도로 크기 등 여러 요인에 대한 입력 데이터를 사용합니다. 알고리즘은 가장 빠른 경로와 소요시간을 예측합니다.
The key challenge with any prediction process is that training data—the inputs you need in order to start getting reasonable outcomes—has to be either created (by, say, hiring experts to classify things) or procured from existing sources (say, health records). Some kinds of data are easy to acquire from public sources (think of weather and map information). Consumers may also willingly supply personal data if they perceive a benefit from doing so. Fitbit and Apple Watch users, for example, allow the companies to gather metrics about their exercise level, calorie intake, and so forth through devices that users wear to manage their health and fitness.
예측 프로세스의 핵심 과제는 합리적인 결과를 얻기 위해 필요한 입력 데이터인 훈련용 데이터를 생성하는 것입니다. 훈련용 데이터를 생성하기 위해서는 전문가를 고용하여 데이터를 직접 분류하거나 의학기록과 같은 기존 소스에서 가져옵니다. 날씨와 지도 정보와 같은 데이터는 오픈 소스로 공개되어 쉽게 활용할 수 있습니다. 소비자들은 적절한 보상이 제공된다면 개인 정보를 제공할 수도 있습니다. 예를 들어, 핏빗이나 애플워치를 사용하는 사람들은 자신의 건강과 피트니스 관리를 위한 운동 수준, 칼로리 섭취 등의 데이터를 제공합니다.
Obtaining training data to enable predictions can be difficult, however, if it requires the cooperation of a large number of individuals who do not directly benefit from providing it. For instance, a navigation app can collect data about traffic conditions by tracking users and getting reports from them. This allows the app to identify likely locations for traffic jams and to alert other drivers who are heading toward them. But drivers already caught in the snarls get little direct payoff from participating, and they may be troubled by the idea that the app knows where they are at any moment (and is potentially recording their movements). If people in traffic jams decline to share their data or actually switch off their geolocators, the app’s ability to warn users of traffic problems will be compromised.
그러나, 직접적인 보상을 제공받지 못하는 대중들로부터 예측을 위한 훈련용 데이터를 획득하는 것은 어려울 수 있습니다. 예를 들어, 내비게이션 앱은 사용자를 추적하여 교통 상황에 대한 정보를 수집합니다. 내비게이션 앱은 교통체증이 발생할 가능성이 높은 곳을 식별하고 다른 운전자들에게 경고합니다. 그러나, 이미 교통체증 지역에 들어온 운전자는 정보 공유에 따른 직접적인 보상을 거의 받지 못하지만 앱이 자신의 위치 정보와 교통 상황 정보를 계속 보낸다는 것을 알고 있습니다. 교통체증 지역에 있는 운전자들이 데이터를 공유하는 것을 거부하거나 위치 알람을 끈다면, 교통 상황을 다른 사용자들에게 경고할 수 없습니다.
Another challenge may be the need to periodically update training data. This isn’t always an issue; it won’t apply if the basic context in which the prediction was made stays constant. Radiology, for example, analyzes human physiology, which is generally consistent from person to person and over time. Thus, after a certain point, the marginal value of an extra record in the training database is almost zero. However, in other cases algorithms may need to be frequently updated with completely new data reflecting changes in the underlying environment. With navigational apps, for instance, new roads or traffic circles, renamed streets, and similar changes will render the app’s predictions less accurate over time unless the maps that form part of the initial training data are updated.
또 다른 도전과제는 훈련용 데이터를 주기적으로 업데이트해야 해야 한다는 것입니다. 이것이 항상 문제가 되는 것은 아닙니다. 예측이 일정하다면 문제가 되지 않습니다. 예를 들어, 병원의 방사선 검사는 사람의 생리 상태를 분석합니다. 사람의 생리 상태는 일반적으로 시간이 지남에 따라 크게 달라지지 않습니다. 특정 시점이 지난 후에 머신러닝 훈련을 위한 데이터베이스에 데이터를 추가해도 문제가 되지 않습니다. 그러나, 반대로 데이터와 관련된 환경 변화를 반영하기 위해 자주 알고리즘을 업데이트하는 경우도 있습니다. 내비게이션 앱은 예측 정확도를 유지하기 위해 신규 도로나 로터리, 도로명 변경, 기타 여러 변경 등으로 초기 훈련 데이터의 일부가 되는 지도를 업데이트해야 합니다.
In many situations, algorithms can be continuously improved through the use of feedback data, which is obtained by mapping actual outcomes to the input data that generated predictions of those outcomes. This tool is particularly helpful in situations where there can be considerable variation within clearly defined boundaries. For instance, when your phone uses an image of you for security, you will have initially trained the phone to recognize you. But your face can change significantly. You may or may not be wearing glasses. You may have gotten a new hairstyle, put on makeup, or gained or lost weight. Thus the prediction that you are you may become less reliable if the phone relies solely on the initial training data. But what actually happens is that the phone updates its algorithm using all the images you provide each time you unlock it.
많은 상황에서, 알고리즘은 입력 데이터로 만든 예측 결과와 실제 결과를 비교하는 피드백을 통해 개선될 수 있습니다. 이 방법은 정의된 범위 내에서 명시적인 변화를 감지할 수 있는 상황에서 유용합니다. 예를 들면, 스마트폰이 보안을 위해 사용자 이미지를 사용할 때, 당신은 스마트 폰이 사용자를 인식하도록 훈련시킬 것입니다. 그러나, 당신의 얼굴은 크게 달라질 수 있습니다. 당신은 안경을 쓰거나 벗을지도 모릅니다. 당신은 새로운 헤어스타일이나 화장을 하거나 몸무게를 늘리거나 줄일 수 있습니다. 따라서, 스마트폰이 초기 훈련용 데이터에 의지한다면, 예측 신뢰도는 떨어집니다. 그러나, 실제로는 전화기는 사용자가 잠금해제를 할 때마다 제공되는 모든 이미지를 사용하여 알고리즘을 업데이트합니다.
Creating these kinds of feedback loops is far from straightforward in dynamic contexts and where feedback cannot be easily categorized and sourced. Feedback data for the smartphone face-recognition app, for example, creates better predictions only if the sole person inputting facial data is the phone’s owner. If other people look similar enough to get into the phone and continue using it, the phone’s prediction that the user is the owner becomes unreliable.
피드백을 쉽게 분류하고 소스 화할 수 없는 상황에서 피드백 루프를 설계하는 어렵습니다. 예를 들면, 스마트폰 소유자만이 얼굴 데이터를 입력한다면, 스마트폰 얼굴 인식 앱의 피드백 데이터는 더 나은 예측을 생성합니다. 스마트폰 소유자와 비슷한 얼굴을 가진 사람이 계속 잠금 해제를 시도한다면, 사용자가 소유자 나는 전화기의 예측은 신뢰할 수 없게 됩니다.
It can also be dangerously easy to introduce biases into machine learning, especially if multiple factors are in play. Suppose a lender uses an AI-enabled process to assess the credit risk of loan applicants, considering their income level, employment history, demographic characteristics, and so forth. If the training data for the algorithm discriminates against a certain group—say, people of color—the feedback loop will perpetuate or even accentuate that bias, making it increasingly likely that applicants of color are rejected. Feedback is almost impossible to incorporate safely into an algorithm without carefully defined parameters and reliable, unbiased sources.
특히, 여러 요인들이 작용할 경우에 머신 러닝에 편향성이 쉽게 생성됩니다. 금융기관이 대출 신청자의 신용도를 평가하기 위해 AI가 적용된 프로세스를 사용한다고 가정해 봅시다. AI는 소득 수준, 고용 기록, 인구 통계학적 특성 등등을 고려할 것입니다. 알고리즘을 위한 훈련 데이터가 유색 인종과 같은 특정 그룹을 차별하는 경우, 피드백 루프는 그러한 편향성을 제거하지 못하고 더욱 강화할 것입니다. 결국, 유색 인종 대출 신청은 거부될 확률이 높아질 것입니다. 신중하게 정의된 파라미터들과 신뢰성이 높고 편향성이 없는 데이터 소스 없이는 피드백이 알고리즘에 안정적으로 통합하기가 불가능합니다.
지난 10년간 인공지능과 머신러닝 분야는 눈부신 발전을 하였습니다. 아마존, 애플, 페이스북, 구글 등과 같은 거대 IT 기업들은 데이터를 수집하고 분석하여 예측하기 위해 AI와 ML을 활용합니다. 그들은 자사의 제품이나 서비스를 획기적으로 개선합니다. 스타트업 기업도 예외는 아닙니다. 벤치사이는 신약 개발 프로세스를 획기적으로 개선하였습니다.
벤치사이는 제약회사 내부 데이터베이스와 방대한 논문을 읽고 분석하여 과학자들이 원하는 시약을 빠르게 찾아 줍니다. 즉, 벤치시아는 신약 개발 분야에서 구글입니다. 구글이 인터넷 검색 서비스 분야에서 머신러닝을 활용하는 것과 같이 벤치시아는 신약 개발을 위한 검색 서비스 분야에서 머신러닝을 활용합니다.
생각해보면, 벤치시아의 서비스는 경쟁기업이 쉽게 모방할 수 있는 검색 서비스일 뿐입니다. 검색에 뛰어난 능력을 가진 구글이 신약 개발 분야에 들어올지도 모릅니다. 앞으로도 벤치시아가 신약 개발 검색 서비스 분야에서 선두를 차지할 수 있는 방법이 있을까요?
기업이 머신러닝을 활용하는 것은 예측을 하기 위해서입니다. 예측은 어떤 현상의 패턴을 인식하는 것입니다. 기술적으로 예측이란 특정 알고리즘에 데이터를 입력하여 알고리즘을 실행한 출력 정보입니다.
예측의 핵심 과제는 알고리즘을 훈련시킬 수 있는 훈련용 데이터를 생성하는 것입니다. 훈련용 데이터를 수집하는 것은 여러 가지 방법이 있습니다. 전문가를 고용하여 직접 분류하거나 이미 잘 분류되어 있는 의료 정보와 같은 데이터를 활용하는 것입니다. 그리고, 두 번째는 예측과 실제 결과의 차이를 보정하는 피드백 루프를 만드는 것입니다. 스마트폰의 얼굴인식 기능은 피드백 루프를 통해 꾸준히 알고리즘을 업데이트합니다. 피드백 루프가 잘못되면 쉽게 알고리즘이 편향성을 가질 수 있습니다. 금융기관이 훈련용 데이터를 잘 걸러내지 못한다면 유색 인종에게 대출이 거절될 확률이 높아지는 편향성이 생깁니다.