brunch

You can make anything
by writing

C.S.Lewis

by 이현아 Jun 10. 2022

9. 콘텐츠의 재탄생

말문을 트이게 만드는 IT지식

이번 글은 총 10개 중 9번째 챕터입니다. 원활한 이해를 위해 차례로 읽어보시는 것을 추천드려요. 글 하단에 모든 챕터를 확인하실 수 있습니다.



“네이버 기사를 크롤링해서 보여줄까요?”
“야놀자가 크롤링 문제로 소송했다던데?”




1. 파싱

파싱(Parsing)은 ‘구문 분석'이라는 뜻입니다. IT에서 파싱은 코드를 분석해 그 의미를 찾아내는 것을 말해요. 코드에는 주요 단어, 명령어뿐만 아니라 부가적인 텍스트도 섞여 있어요. 그 안에서 의미 있는 정보가 무엇인지 알아내는 작업을 파싱이라고 합니다. 예를 들면 ‘컴퓨터야, 내가 연도를 알려줄 건데, 현재는 2022년이야’라고 작성한 코드에서 ‘현재 연도=2022’이라는 정보를 찾기 위한 분석을 하는 것이죠.





2. 크롤링

크롤링은 다른 서비스의 콘텐츠 데이터를 파싱 해서 내 서비스에 사용하는 것입니다. 쉽게 말해 A 서비스의 정보를 B 서비스에서 모양만 바꿔서 제공하는 거예요. B 서비스의 스타일이 다를 테니 옷을 바꿔 입히는 거죠.

다른 서비스의 데이터를 가져오는 크롤링 이해하기



근데 이게 지금 뜨거운 감자입니다! 잡코리아, 네이버, 야놀자 등 대형 플랫폼들이 크롤링 문제로 소송 문제가 있거든요. 어떤 내용이고 판결은 어떻게 났는지 같이 알아볼까요?



2–1. 잡코리아(승!) VS 사람인


2008년 사람인이 잡코리아의 채용 공고를 크롤링해서 제공했어요. 잡코리아가 중단 요청을 해보고, 가처분 신청도 내봤지만 사람인은 크롤링을 멈추지 않았어요. 화가 난 잡코리아는 사람인을 대상으로 소송을 걸었고, 법원은 잡코리아의 손을 들어줬어요. 그 이유는 잡코리아가 데이터 확보를 위해 상당한 노력을 했고 사람인이 그것을 침해하여 경제적으로 손해를 입혔다는 것이었어요. 실제로 사람인은 크롤링 이후 마케팅 비용이 감소하고 이익은 상승했지만, 잡코리아는 마케팅 비용이 상승하고 이익이 감소했거든요. 결국 사람인은 잡코리아에게 손해배상을 했고 크롤링한 정보도 모두 폐기했습니다.


*출처 : 신지민 기자, [판결] ‘웹사이트 무단 크롤링’ 소송… 잡코리아, 사람인에 승소, 법률신문 뉴스, 2016–03–03



2–2. 야놀자 VS 여기어때(승!)


여기어때가 야놀자 서버에 무려 1594만여 번이나 접근해 숙박정보를 가져갔어요. 야놀자가 크롤러 소프트웨어를 감지했고 바로 소송을 걸었습니다. 1심에서는 야놀자가 이겼어요. 여기 어때는 대표는 물론 크롤링에 가담한 직원들도 처벌을 받게 됐죠. 타인의 정보통신망을 무단 침입하는 것은 불법 행위라는 이유입니다. 하지만 여기어때 임직원들은 항소심에서 판결을 뒤집었어요. 결국 여기어때는 ‘무죄'로 끝이 났습니다. 무죄의 이유는 여기어때가 크롤링한 정보가 공개된 정보이라는 것이었는데요. 야놀자의 숙박정보가 크롤링 프로그램으로 서버에 접근하지 않더라도, 앱을 통해서 누구나 볼 수 있는 정보이기에 접근 권한이 없는 정보가 아니라는 거예요. 이번 소송으로 ‘공개된 정보의 크롤링은 합법'이라는 판결이 났습니다.


*출처 : 김진성 기자, 야놀자 서버에 1594만 회 접근, 정보 가져간 여기어때…무죄 이유 보니 [김진성의 판례 읽기], 매거진한경, 2022–05–31



2–3. 네이버 VS 다윈중개 (진행 중)


다윈중개는 네이버 부동산에 게시된 매물정보를 크롤링하여 제공했어요. 다윈중개 사이트에서 매물 기본 정보와 ‘외부 매물도 다윈중개 중개사에게 의뢰하면 저렴한 수수료로 중개받을 수 있습니다’라는 문구를 제공하고, 네이버 부동산 매물과 연결하는 링크를 걸어두었죠. 네이버는 이에 가처분 소송을 냈고, 법원은 본안 판결 전까지 해당 문구를 삭제하라고 지시했어요. 네이버는 이 건과 별개로 크롤링 관련 본안 소송을 추가로 낸 상황입니다. 아직은 판결이 어떻게 내려질지 지켜봐야 해요.  


*출처 : 박민제 기자, [팩플] 네이버, 스타트업과 크롤링 분쟁 끝까지 간다 “본안소송 낼 것”, 중앙일보, 2022–04–25



크롤링 소송 정리





네이버와 다윈중개 소송 판결이 나면 크롤링의 합법과 불법의 구분이 더 뚜렷해질 거예요. 이 글을 읽고 있는 당신은 크롤링을 어디까지 허용해야 한다고 생각하시나요? 지금은 데이터가 곧 돈이 되는 시대이기에 이 문제는 앞으로도 큰 화제가 될 것 같네요.


잘못된 표현이나 추가적으로 덧붙이고 싶은 내용이 있다면 언제든 댓글 달아주세요 :)





글쓴이: 이현아


오늘이 모여 인생을 만든다. 오늘도 성장하고 있는 2년 차 UX 디자이너 이현아입니다. 자라온 날보다 성장할 오늘이 더 많은, 그렇기에 다양한 경험으로 인생을 다채롭게 채워가고 싶은 주니어 이현아입니다.





다른 시리즈 보러가기

말문을 트이게 만드는 IT 지식


1. 운영체제(OS)와 웹, 네이티브, 하이브리드


2. 개발자라고 다 같지 않다 : 프론트엔드, 백엔드와 사용되는 개발 언어


3. 밤샘 개발을 줄여주는 도구들 (라이브러리, 프레임워크, SDK) 


4. 한 번 보면 더 볼 일 없는 네트워크 관련 용어들 (프로토콜, 도메인, VPN)


5. 막상 뭐냐고 물어보면 말문이 막히는 서버, 클라이언트, DB


6. 서버와 클라이언트, 그 사이의 용어들 (API, 파라미터, JSON, 쿼리, 토큰)


7. 화면 크기에 반응하는 웹 UI (반응형웹, dp, dpi, em, rem)


8. 모두를 위한 서비스 (웹 접근성, 대체텍스트)


9. 콘텐츠의 재탄생 (파싱, 크롤링) --> 현재글


10. 데이터 바꿔치기 (SPA)






※참고 자료

https://www.lawtimes.co.kr/Legal-News/Legal-News-View?serial=98844

https://www.joongang.co.kr/article/25066140

https://www.joongang.co.kr/article/25066140

매거진의 이전글 8. 모두를 위한 서비스
브런치는 최신 브라우저에 최적화 되어있습니다. IE chrome safari