흔해빠진 크롤러로 누구나 피해자, 피의자가 될 수 있다 !!

지금 시대는 누구나 저작권의 피해자, 혹은 피의자(범죄자)가 되기 너무도 좋은 환경이다. 인터넷/유튜브/서점에는 "10분만에 크롤러를 만들 수 있다"는 정보가 넘쳐 난다. 크롤러를 만드는 것이 불법은 아니지만, 잘못 사용하게 될 경우 인생은 실전이라는 것을 깨닫게 될 수 있다. 제2, 제3의 피해자/범죄자가 발생하는 것을 막고, 이미 피해를 당했다면 해결에 내 사례가 도움되기를 바라는 마음에 직접 겪은 사건의 전 과정을 상세하게 공개하려고 한다.

 

[소셜러스] 유튜브 빅데이터 분석 및 데이터 제공 플랫폼

나는 국내 최초로 (아시아 최초로 추정) 유튜브 빅데이터를 수집해 자료를 분석하고 정보를 제공하는 소셜러스(https://www.socialerus.com)를 런칭했다.(최초 이름은 RankQ, 몇 달후 소셜러스로 브랜드 변경) 2017년 7월 8일이었다. 전세계적으로도 서너개 밖에 없는 참신한 아이템이었고 유튜브의 성장세를 감안하면 탁월한 선택이었다. 매년 정부/중견기업들을 대상으로 다양한 웹 플랫폼 프로젝트를 진행하던 나는 외주 용역을 줄이고 이 사업에 올인을 하게 된다. (지옥의 입구를 스스로 열어 체쳤으니 누굴 탓하리오...)

2017년 당시 이미 유튜브 채널도 충분히 많지만, 유튜브 하나의 채널에는 다수의 영상이 포함되어 있다. 즉 매일 채널의 구독자/조회수 등도 조회를 해야 하지만, 하나의 채널에는 다수의 영상이 있기 때문에 해당 모든 영상을 추적해야만 좋아요/싫어요/댓글 수를 알 수 있다. 그래야 해당 채널의 퍼포먼스나 성장률을 정확하게 분석 할 수 있기 때문이다. 결론만 말하자면 2017년 테스트 당시부터 매일 2,000여개의 채널 및 100만개에 육박하는 영상의 데이터를 매일 수집해야만 했다. (이럴줄 알았다면 처음부터 비즈니스 모델을 조금 다르게 잡았을 수도 있다. 진정 미쳤던거다. 현재는 5000여개 채널, 400만개가 넘는 영상을...) 

수집 및 분석해야 할 양이 무척 많았고, 더 큰 문제는 24시간 이내 수집/분석의 한 사이클을 마쳐야 매일 매일 데이터를 축적할 수가 있다는 점이었다. 그래서 수집/분석 시스템은 분산되어 병렬로 구성되었고 이로인해 오픈도 하기 전부터 수십대의 서버와 데이터베이스가 구성되었다. 이는 결국 "비용(돈)"으로 귀결된다. 오픈후 매월 약 400~500만원 정도의 Microsoft Azure 비용이 발생하였다. 매월 !!!  .2020년 현재 Azure에 쓴 시스템 비용은 1억2천만원 정도 되고 (세금계산서와 영수증 모두 있음.) 법인 결산 및 국세청 신고 자료에 따르면 2018년~2019년 인건비/판매비는 6억이 넘는다. (2017년 급여 및 판매비 총액 : 229,567,740원 + 2018년 급여 및 판매비 총액 : 374,655,154원) 소셜러스 서비스를 개발하고 운영하는데 지금까지 약 10억에 가까운 비용과 노력, 고생을 들인 것이다. 

 

[저작권 확보] 노아가 방주를 지은건 "비 오기 전"임을 잊지 말자.

당시만해도 Nox같은건 존재도 안 했고, 대부분 유튜브 채널 정보를 확인하기 위해서는 미국의 소셜블레이드라는 서비스를 주로 이용했다. 유튜브가 성장할수록 많은 기업/개인들이 소셜러스에서 데이터를 확인할거라는 믿음이 있었고, 나는 유튜브 API를 이용하고 있었기 때문에 초반부터 저작권에 관심을 가지기 시작했다. 내가 데이터를 확보하는 과정에 문제가 없어야 했고, 내가 분석/가공하여 제공하는 데이터는 보호받아야 한다고 생각했기 때문이다. 

우연히 알게 되어 우선 "저작권보호원"에서 운영하는 "저작권OK" 인증서를 신청했다. 저작권OK를 보유한 대부분의 업체가 영화 유통사거나 출판사 등이었으므로 유튜브 데이터를 수집하고 분석해서 서비스 하는 소셜러스의 저작권 OK 신청은 담당자를 적잖이 당황시켰으리라 생각된다. 담당자 분께서는 직접 우리 사무실로 방문하셔서 긴 설명을 들으셨고 나는 유튜브 API 약관, 개발자 API Terms 를 번역하고 발췌하는 등 긴 노력을 통해 자료를 성실히 제공하였고, 저작권보호원 내부의 저작권 관련 전문가 회의를 거쳐 2018년 12월 13일 "저작권 오케이" 인증서를 받게 된다. [인증서 보기]

이 글을 보는 당신의 일/사업에 저작권이 중요하다면 저작권OK는 반드시 획득해 놓기를 추천한다. 우선 공신력을 확보 할 수 있다는 점은 매우 크게 작용하고, 둘째 해당 기관에서 제공하는 저작권 관련 교육과 지원을 받을 수 있다. 이 교육을 받을 때, 변호사님께 쉬는 시간에 이것 저것 물어본 것이 뒤에 나올 고소에 큰 도움이 됐다. 

여기서 그치지 않고 2018년부터 크롤링 방지를 위해 적극적으로 푸터에 [법적고지]를 해 놓았다. 쉽게 말해 "퍼가지 마! 니 IP는 확보됨. 사용하고 싶으면 우리랑 협의해!" 라고 상세하게 써 놓았다는 것이다. 

상세한 법적 고지를 해 놨어도 매일 짖어대는 옆집 개마냥 무시함. 그러나 이 부분을 경찰에선 좀 중요하게 봄. 

 

[크롤러 등장] 어쭈? 이거봐라??

사실 그간 크롤러가 없었던건 아니다. 플랫폼을 3년 넘게 운영하다보니 이제 패턴이 보인다. 요약하면
1) 대부분 크롤러는 한두번 크롤링을 하고 사라진다.
2) 대부분 IP를 하나 사용한다. < 이로 인해 작은 업체 혹은 개인이라고 추정하며, 간단하게 IP를 차단해 버린다.
3) [중요] 대부분의 크롤러는 테스트 단계를 거친다. 이 단계에서는 보통 IP를 하나 사용하고, 서버 로그에서 확인해 보면 유저 에이전트(User Agent) 정보가 몇 번 바뀐다. (이것저것 테스트 해보는 중이리라..) 아래 이미지는 서버 로그에 접속한 IP와 해당 IP의 유저 에이전트 정보를 보여준다. 정상적인 IP는 보통 이 유저 에이전트가  조금씩 다르다. (물론 동일한 경우도 있다.) 그런데 접속 시간이 초 단위까지 같고, IP는 다른데 이 유저 에이전트가 같다면 하나의 크롤러가 여러 개의 IP 를 사용할 확률이 매우 높다. 

2019년 12월 중후반부터 종종 트래픽이 폭주를 하기 시작했다. 정해진 시간은 아니지만 치솟는 웹서버 Requests와 DB 사용률을 보곤 "또 크롤러가 등장했군." 정도로 생각했다. 나중에 서버 로그를 확인해 IP를 차단해야지 정도로 가볍게 생각했는데, 큰 착각이었고, 전쟁의 서막이었다. 

 

[자료 확보] 모니터링 & IP 추적 일대기

2020년 1월 10일 오전. 소셜러스 사이트에 접속했는데, 사이트가 열리지 않는 것을 발견했다. 이상한 점은 아예 웹서버 다운으로 인해 404, 500 같은 에러가 아니라 브라우져 좌측 하단에 "서버가 응답을 기다리는 중입니다" 라는 상태로 계속 빈 화면이 빙글빙글.... 헐. 이게 뭐지? 그 때서야 부랴부랴 Azure에 접속해 이런 저런 내용을 살펴보다 경악을 했다. 이미 나흘전인 1월 6일부터 오전마다 이랬던거다. 소셜러스 사이트를 이용하는 많은 유저가 MCN, 광고기획사 쪽이다 보니 출근해서 유튜브 채널들을 살펴보는지 오전과 오후 1~3시에 이용률이 높은편인데 이미 며칠 째 오전마다 사이트가 안 열리고 있었던거였다. 미치고 팔짝 뛰며 서버 로그와 IP 체크, 서버 사용률 등을 체크해 보니 가관이었다. 

IP는 이렇게 제 각각이었고, 아주 1 페이지부터 아주 차근차근 긁어감. 시간도 초단위였는데 이 로그는 중간 내용을 편집해서 시차가 있음. 
그렇다. 저 치솟은게 매일 오전 9시 30분 경이었다. 참으로 꾸준히 성실하게 크롤링을 하네.
당연히 크롤링 동안 웹서버, Database 사용률은 100%로 치솟고 서버 응답 시간이 5초까지 걸린다. 정상적인 서비스가 될리가 없다.

이 정도면 엄청난 시간을 들여 서버 로그를 분석하고, 크롤링으로 추정되는 IP를 추려내고 그걸 정리하는 건 온전히 내 몫이다. 또 IP마다 WHOIS 조회를 통해 KT/SK/Uplus 등 어디에서 제공한 IP인지 확인하는 것도 내 몫이다. (제기랄 내 시간... 일을 해도 시원찮을 판에 이쯤되면 거의 매일 몇 시간은 이걸 해야 할 정도다.) 

엄청난 양의 IP가 사용되었고 서버 로그를 매일 뒤져 저걸 찾고 정리했다. 
모든 IP는 KT였고 그로인해 범인을 찾을 수도 있겠다라는 생각을 하게됨

이 정도면 너무 조직적이고 체계적이고 악랄하다 할 수 있다. 확인한 IP만 100개가 넘고, 로그 중간 중간에는 정상적인 유저도 섞여 있을 수 있기 때문에 무작정 IP를 차단할 수도 없었다. 매일 아침 내 사이트가 죽어나가는걸 보며 내일은 크롤링이 없기를 바라는 것 말고 내가 할 수 있는건 없었고, 그걸 매일 바라보며 내 안의 분노도 커져나갔다. 저작권보호원의 담당자분과 통화도 해보고, 몇몇 변호사와도 상담을 했다. 모두 걱정해주며 조언들을 해 줬지만, 사실 이 시점에서 큰 도움을 받은건 없다. 저작권법을 통째로 읽고, 관련 기사를 검색해 보며 엄청난 조사를 한게 큰 도움이 됐다. 

 

[저작권법] 핵심만 알려주마 

다른 모든 법들이 그러하듯 저작권법도 매우 어려운 법이다. 저작권, 저작인접권, 2차 저작, 저작인격권 등등등. 그러므로 열심히 공부하고 법령 전체를 한번 읽어보는걸 추천한다. 몇가지 원 포인트 레슨을 해주자면,
(1) 저작권은 친고죄이므로 침해를 당한 사람이 고소를 해야만 수사가 진행된다.
(2) 저작권은 형사법이므로 5천만원 이하의 벌금 혹은 5년 이하의 징역에 처해질 수 있다....고 하나 저작권법 위반으로 감옥에 갔다는 사람은 저작권 전문 변호사도 못 봤다고 했다.
(3) 저작권법은 영업방해, 부당경쟁방지법 등과 세트로 움직이는 경우가 종종 있으니 이 부분도 잘 파악해야 한다.
(4) [중요] 몇 년전 저작권법이 개정되며 데이터베이스제작자의 보호가 생겼다. 즉 데이터베이스가 요건을 갖추면 저작권으로 보호 된다는 것이다.(제4장) 매우 중요하다. 세 번 읽기 바란다. 

마지막으로 아래 기사는 매우 매우 유용하니 잘 챙겨두길 바란다. 난 저 기사를 프린트해서 검찰, 경찰에도 내는 등 매우 잘 써 먹었다. 클릭해서 10번 읽어보자. 

- 잡코리아 vs 사람인 사건 (대법원 판결) "경쟁사 웹사이트 무단 크롤링은 데이터베이스권 침해"
- 여기어때, 무단크롤링에 대하여 정보통신망법위반죄 및 업무방해죄로 기소돼
- “크롤링 남의 자산 훔치는 범죄행위, 인식 변화 갖자

 

[검찰 고소] 고소도 전략이 필요하다.  

이미 돌이킬 수 없는 강을 건넜고, 반드시 정의를 구현하겠다면 고소 외에는 답이 없다. IP를 확보하고 추적까지 것까지는 어렵지 않지만 문제는 개인/일반기업이 이 IP의 소유주를 합법적으로 확인 할 방법은 없다. IP는 개인 정보에 해당하기 때문에 법원 혹은 수사 기관의 요청으로만 확인이 가능하다. 

당신이 저작권 침해를 당한 피해자라면 크게 두 가지 트랙이 있다.
(A) 형법의 저작권 위반으로 고소를 하거나,
(B) 민법으로 손해배상을 청구를 할 수 있다.
IP 소유자를 몰라도 손해배상이나 고소를 하는데 문제 없다. "성명불상"으로 일단 걸면 고소의 경우는 수사기관이, 민사의 경우는 법원의 명령으로 소유자를 알아 낼 수 있다. 가장 좋은 방법은 우선 형법의 저작권 침해로 고소를 하는 방법인데 이 경우 (1) 검찰에 고소, (2)경찰에 고소가 있다. 잘 기억해라. 무조건 검찰에 고소를 하는 것이 중요하다. 지금은 수사권 조정이니 어쩌니 해서 조금 달라졌을 수도 있는데 우리 나라는 오래 동안 검찰이 경찰의 수사를 지휘해 왔기 때문에 검찰에 고소를 하는 것이 좋다. 경찰에 고소를 했는데 경찰이 보고 어? 별거 아닌데? 하고 기각 하면 끝. 하지만 검찰에 고소를 한 경우 검찰이 웬만하면 경찰로 수사 지휘를 내려 보낸다.(물론 검찰도 기각 할 수 있으니, 그만큼 준비를 잘해서 고소를 접수해야 한다) 그럼 경찰은 수사를 해야하고 최종적으로 기소 혹은 불기소 의견으로 검찰에 수사 결과를 송부한다. (많이들 들어봤지? 기소 의견, 불기소 의견 등. 이게 이렇게 되는거다)

[2020.01.15 고소장 접수] 나는 고소장을 직접 쓰고, IP를 정리한 내용, 서버 로그 프린트한거 일부, 법인 등기부등본, 저작권OK인증서, 심지어 상표 등록증까지 엄청난 서류를 준비했다. 위에 있는 화면 캡처들도 모두 제출했던 자료의 일부다. 그리고 고소장에는 어떤 범죄를 고소하는 건지 적는 란이 있는데, 내 경우
# 저작권 침해 # 부정경쟁방지법 # 영업 방해 등을 적었다. 

서류 준비가 다 되면 잘 챙겨서 2호선 서초역에서 내려 터벅터벅 서울지방검찰청으로 걸어가 민원실에서 고소장을 접수하러 왔다고 하면 2층의 접수처를 알려준다. 2층으로 가면 버스정류장 껌 파는 가판대 크기만한 방에 접수받는 분이 혼자 앉아 있고, 그 분한테 서류를 주면 고소 접수증을 준다. 그럼 접수가 끝난 것이다. 5분도 채 걸리지 않는다. 

하루 이틀 지나 서울지방검찰청 사이트에 접속해 고소인 이름과 몇가지 정보를 입력하면 사건 담당 검사와 진행 사항을 확인할 수 있다. (물론 내 사건은 7개월째 진행 사항 변경이 없다. )

사건 조회를 하면 담당 검사실을 알려준다. 필요시 전화로 문의를 해도 된다.

이제 맘편히 관전만 하면 금방 범인이 잡힐 것으로 생각했으나... 엄청난 복병이 숨어 있을 줄이야.... 

 

[경찰 수사] 현실과 영화는 다르다. 

며칠 후 검찰청 사이트에서 조회를 해보니 "강남경찰서"로 수사 지휘가 내려갔다는 사실을 알게 되었고, 범인을 잡았다는 연락이 올거라 생각하며 목이 빠지도록 기다렸으나 아무 연락이 없었다. 01/15 검찰청 접수, 약 일주일 뒤 강남경찰서로 수사 지휘, 그렇게 1월이 다 지나고 2월의 어느 날이 되도 연락이 없자 직접 강남 경찰서 민원실로 전화를 걸어 검찰사건번호를 말해주자 담당 부서와 수사관을 알려줬다.

저작권 위반으로 대량의 IP를 잡아 고소했으니 곧 사이버수사대지능범죄수사대가 수사를 할 것이라고 생각되나? 택도 없는 소리 마시길. (솔직히 나도 그럴줄 알았다.) 사이버수사대/지능범죄수사대는 아주 특수한 사건이나 정치적으로 파장이 큰 사건 등만 담당한다. 여러분이 저작권 위반으로 고소를 할 경우 십중팔구 "경제팀"으로 배당이 될 것이다. 

이제 이 사건의 꽃, 담당 수사관이 등장한다. 우선 담당자에게 전화를 걸어 사건을 확인했다. [2월 중반] 담당 수사관은 "저작권 위반은 보통 고소인 조사는 안한다. 앞에 다른 사건들을 아직 처리 중이니 조금 기다려 달라" 이때까지만 해도 "고소인 조사를 보통 안한다"의 의미를 몰랐다. 나중에서야 안 사실이지만, 경제팀에서 처리하는 많은 사건들이 돈 빌리고 안갚는 사기, 중x나x 판매 사기 등이었고, 저작권 위반 사건도 대부분 파일 다운로드 사이트에 누가 불법으로 영화 올리는 수준이었다. 그거야 ID가 다 나오니 해당 사이트에 공문 한장만 보내도 누군지 바로 드러나니 어렵진 않았을거다. 이렇게 어려운 사건을 ... 최소한 내 사건을 담당했던 수사관은 매우 힘들어했다. 6개월간...

2월의 말 무렵 강남경찰서에서 한번 방문해 줄 수 있냐는 연락이 왔고 나는 2020.03.02 난생 처음 기쁜 마음으로 강남경찰서를 찾았다. 어떤 난관이 있는지도 모른채.... 다음은 향후 6개월간 담당 수사관이 진짜로 나한테 한 말들이다. 

"유튜브 구독을 하면 돈을 내나요?"
"고소를 하려면 상대방을 특정해야 하는데 ... 이건 IP네..."
"아니 내가 KT에 공문을 보냈는데, 그 쪽에서 안준다고 하네요" 
"아, 팩스에 문제가 있어서 공문이 안 갔더라구요. 내가 다시 보내볼게요." 

ㅡ,.ㅡ 나이도 좀 있는 분이셨고, 유튜브를 몇 번 보긴 했지만 자주 보는 분도 아니었으며 특히 Tech에 대한 지식이 거의 전무한 상황이었다. 3/2일부터 시작해서 7/21일까지 5번 정도 방문을 했고, 갈 때마다 1시간씩 유튜브 구독/조회수가 뭔지, 내가 왜 저작권을 가지고 있는지, 이게 왜 저작권 위반인지, 대법원 사례(잡코리아 vs 사람인 사건) 등을 설명해 드렸다. 팩스는 에러가 나서 안 간적이 한번 있었고, KT가 자료를 안 준 이유는 .... "KT에 해당 IP의 한달치 로그를 요청"해서 였다. ㅠㅠ 그럼 수십만 줄이 될텐데.. 당연 KT가 못 주지... 내가 "해당 날짜의 IP 소유주만 확인하시면 된다. 그럼 이 수 많은 IP들의 소유자가 분명 겹칠 것이다. 그럼 그 사람/회사가 무단 크롤링을 한 범인이다"고 10번쯤 말했으나 이해 부족... 

검찰에서 경찰서로 수사 지휘가 내려가면 통상 3개월, 길면 6개월 이내에는 기소/불기소 의견으로 사건을 검찰로 다시 보내게 된다. 그런데 이 사건이 이제 6개월을 넘어가고 있어 나도 더 이상 참을 수가 없었다. 이럴 때 사용할 수 있는 방법 중의 하나는 경찰서마다 있는 "청문감찰관"을 만나보길 추천한다. 자세한건 직접 검색해 보라. 아무튼 급이 좀 높고 인성이 좋은 분이 청문감찰관으로 경찰서마다 있어서 민원인의 고충 해결(혹은 듣기만...)을 도와준다. 나는 빡친 상태로 청문감찰관을 만났고, 그 분은 나에게 "그럼 수사관을 변경해 줄까요?" 라고 물었으나 지나간 6개월이 아까워 내가 다시 한번 만나서 빨리 진행해 달라고 얘기하는 선에서 마무리를 했다. 

자료를 정리해서 고소를 하는 것도 힘들었지만, 유튜브, 기술, 저작권을 잘 모르는 수사관에게 수 많은 설명을 하고도 6개월간 기약 없이 기다리는 시간은 너무 힘이 들었다.  

 

[범인 특정] 범인을 잡고 보니, 헉!!!!  

아... 상상도 못했다. 이렇게 큰 업체가 튀어 나올줄은... 2017년에는 유튜브 데이터를 제공하는 곳이 나 하나였지만, 요즘에는 미디어/인플루언서 어쩌구 하는 업체가 자고 나면 하나씩 튀어나오니 그런 경쟁 업체들 중 하나일거라 생각했었다.

2020.07.초. 청문감찰관을 만나고 담당 수사관을 만나 6개월이 지났다고 한번 징징대고 며칠이 지나 2020.07.13. 담당 수사관에게 전화가 왔다. "잡았다고"  그리고 업체 이름을 듣는 순간... 내 귀를 의심했다. 

xx소x트. 2000년 설립. 직원 160여명. 모 포털의 기술사업부서 사내 인큐베이팅으로 시작. 수 많은 프로젝트 수행.  그리고 2020년 하반기 코스닥 기술 상장 예정....  나를 가장 분노케한 것은 그들의 사업 분야가 빅데이터, 머신러닝 같은 데이터 기반이라는  것이고 소셜 트렌드 분석 서비스를 유료로 제공중이라는 것이었다. 당연히 난 크롤링 된 내 데이터가 갈려 그들의 사업 밑거름이 됐다고 생각하지 않을 수가 없었다. 저 큰 회사가, 데이터를 전문으로 하는 회사가 왜 그랬을까? 유튜브 API를 이용하면 될 것이고, 우리쪽에 업무 협력을 제안하면 됐을텐데... 작은 스타트업이라 자기네 멋대로 해도 꿈틀거리지도 못할거라 생각했나? 아님 애초에 법이나 윤리 따위는 개한테 줘 버린 것인가? 수 백억 건의 데이터 분석을 통해 트렌드를 분석하고 AI가 어쩌구하는 ... 이쁘게 잘 만들어진 그 회사의 사이트를 볼 때마다 가슴 깊은 곳에서 치밀어 오르는 분노를 억제 할 수가 없었다. 

경찰이 xx소x트 담당자랑 통화를 해 보라며 연락처를 줬고 2020.07.13. 나는 떨리는 마음으로 전화를 했다. 전화를 받은 사람은 전산팀 팀장정도 되는 사람이었고 내 전화를 상당히 시큰둥하게 받았다. "직원이 많아서 잘 모르겠다, 어느 부서에선가 했겠죠, IP가 우리거라고 나왔으니 우리이긴 할 텐데 저는 잘 모르겠네요" 등등 죽빵을 날리고 싶은 말투였다. 어쨌든 본인이 한건 아니라서 잘 모르니, 그럼 이게 무슨 건인지 알려줄테니 이메일 주소를 달라고 했고 그날 오후 바로 이메일을 보냈다. 아래는 이메일 전문 

더보기

안녕하세요. 
소셜러스 서비스를 운영하고 있는 (주)zzzz 대표 zzz입니다. 

저작권 위반 고소 관련해서 자료 일부를 보내드리니 검토하시고 내일(7/14)까지 의견 바랍니다. 

작년 말에서 올해 1월 경 간헐적으로 대량의 크롤링이 있었습니다. 
이때까지는 크롤링 양도 적었고, IP도 몇 개 사용하지 않았으며 크롤러의 정보가 변경되던 것으로 보아 크롤러를 개발하고 있었던 것으로 추정하고 있습니다. 

그러나 1월부터 매일 오전 9시 30분경 소셜러스 전 페이지의 데이터를 수집해 가는 크롤러가 본격적으로 운영되었습니다. 

당사는 2016년부터 그간 큰 인건비와 서버비를 지출하며 본 서비스를 개발하고 운영해 왔으며, 
2018년 외부 투자사로부터 본 서비스를 위해 투자도 받은 상황이므로, 법인은 물론 외부 투자사 등 모두에게 피해가 발생하였습니다. 

크롤링으로 인해 서버의 반응 속도는 느려졌고, 대량의 트래픽이 발생했으며, 사업 및 영업에 대한 침해도 발생하였습니다. 

무엇보다 피해 규모를 떠나 이는 저작권 위반으로 형사건입니다. 
크롤링으로 인한 저작권 위반건은 이미 대법원 판례까지 있으며, 
소셜러스는 이미 2018년 "저작권보호원"의 전문가들의 검토를 거쳐, "저작권OK" 인증서를 받았고, 
하단 푸터의 법적고지를 통해 이를 명백히 금지하고 있었습니다. 

현재 사건은 1월 서울지방검찰청에 직고소가 되어 있는 상황입니다. 

이 사건에 대한 의견을 내일 (7/14)까지 이메일로 보내주시기 바랍니다. 

2020년 7월 13일. 
(주)zzzz 대표 zzz  

P.S. 첨부파일 : 
# 크롤링에 사용된 IP 일부 
# 특정일 서버 로그 
# 사례 및 서버 모니터링 일부 

 이제 그들의 태도와 양심을 기다려 볼 때다. 

 

[합의 제안] 법무법인 광장의 합의 제한

7/13일에 이메일을 보내고 이틀 후 2020.07.15. 한 통의 전화를 받았다. 반갑게 인사를 한 상대방은 법무법인 광장의 xxx 변호사라고 자신을 소개하며 xx소x트 건으로 합의를 하고 싶다고 했다. 내가 "경찰에 제출한 모든 자료를 보았는지? 정확하게 내가 어떤 피해를 받았는지 알고 있는지"를 물었고 상대 변호사는 자세하게는 모른다고 했다. 그래서 나는 "합의 이야기를 하려면 우선 진행 상황과 피해 사실을 정확하게 아는 것이 좋겠다"고 이야기를 하고 아래 이메일을 보냈다. (아... 광장이라니.... 뉴스에서만 보던... 법무법인 광장이라니.... 큰 업체가 돈도 많으니 비싼 로펌도 쓰는구나. 2019년 국내 로펌 종합순위 4위 법무법인 광장 (기사링크) ). 

더보기

안녕하세요. 
국내 최초 유튜브 빅데이터 플랫폼 소셜러스를 운영하는 (주)zzzz 대표 zzz입니다. 
(이하 zzzz, 소셜러스, xx소x트로 표기) 

 * 2020년1월27일 서울지방검찰청에 저작권위반/영업행위방해 등으로 고소한 건에 대하여 (주)xx소x트의 법무대리 "법무법인 광장의 xxx 변호사"님께서는 2020년 7월15일 합의 의사를 전달해 오셨습니다. 

 * 양 사가 합리적인 합의에 이르기 위해서는 우선 피해 사실에 대해 명확하게 인지하고 공감할 필요가 있다고 판단되어 우선 본 메일을 통해 그간의 상황과 피해 사실을 (주)xx소x트 및 법률 대리인에게 전달함을 목적으로 합니다.  


#1. 국내 최초 유튜브 빅데이터 플랫폼 소셜러스
zzzz는 2016년부터 소셜러스 플랫폼을 개발하여 2017년 7월 서비스를 정식 런칭하였습니다. 수 많은 시행 착오를 거쳤고, 독자적인 서비스와 브랜드, 그리고 국내 최초라는 타이틀로 많은 이들에게 호응을 받아 왔습니다. [ 첨부 - 01.기사리스트] 2018년에는 중소기업청에 등록된 엑셀러레이터 및 개인투자조합으로부터 투자도 유치하여 이해 관계자가 다수이며, 이들 모두가 본 사건으로 피해를 보았다고 할 수 있습니다.


#2. 의도적인 저작권 위반 및 영업 방해 
소셜러스는 저작권보호원의 전문가들 검토를 거쳐 "저작권OK" 인증서를 보유하고 있습니다. [ 첨부 - 02.저작권OK ] 또한 소셜러스 웹사이트 내 "법적고지(최종업데이트 2020.01.16)" 페이지를 통해 명확하게 크롤링 및 데이터 수집 거부 의사를 밝혀 놓은 상태입니다. ( kr.socialerus.com/guide/legal-notice.html )

그럼에도 불구하고 xx소x트는 데이터를 수집할 목적으로 크롤러를 개발하고, 매일 오전 9시 30분경 100개 이상의 IP를 사용하여 매우 고의적이고 체계적으로 크롤링을 진행하였습니다. 이는 이후 서술할 다른 모든 피해들에 앞서 가장 저희를 분노케한 부분입니다. 우발적이거나 한 두번으로 그친 것이 아니라 의도적으로 크롤러 프로그램을 개발하였다는 점입니다. 

1월 10일의 서버 로그를 일부 정리한 내용 [ 첨부 - 03.서버로그일부 ] 의 page= 부분을 보면 모든 페이지를 체계적으로 수집하였고, IP가 계속 바뀌는 것을 확인할 수 있습니다. 이를 심지어 매일 지정된 시간에 진행하였으며 [ 첨부 - 03.정기적인크롤링 ] , 100개 이상의 IP를 사용한 것은 IP 차단을 우회하려는 매우 고의적이고 적극적인 의지로 보입니다. 경찰에 제출한 [ 첨부 - 05.피해사실진술서_20200414 ] 를 보시면 얼마나 조직적으로 IP를 사용했는지 확인하실 수 있습니다. 

야놀자와 사람인 사례처럼 [ 첨부 - 04.저작권침해관련기사 ] 명백한 사례와 판결이 있어 관련 업계 사람이라면 누구나 알 수 있음직한, 심지어 빅데이터 사업을 진행하는 xx소x트라면 분명 알아야 하는 저작권법을 이처럼 무시한 행위를 이해할 수 없습니다. 

#3. 피해자들
가장 큰 피해자는 저희 서비스를 사용하는 회원과 이용자들입니다. 크롤링이 진행되는 시간 동안 서버가 폭주하고, 데이터베이스 사용률은 100%에 육박하여 정상적인 서비스를 제공할 수 없었습니다. [첨부 - 06.서버모니터링 ] 파일을 보면 웹서버(상단)는 폭주하고, 데이터베이스(하단)은 사용률이 100%에 육박해 해당 시간에 접속한 이용자들은 페이지 로드에 최소 5초, 길게는 1~2분이 걸렸기 때문에 정상적으로 서비스를 이용 할 수 없었습니다. 이는 저희 서비스 퀄리티 저하로 이어지고 이로인해 사용자들의 이탈도 있었다고 저희는 생각하고 있습니다. 

두번 째 피해자들은 수 많은 이해관계자들입니다. 그간 고생하며 이를 개발한 내부 직원과 이 사업을 믿고 투자를 진행한 투자사 및 개인조합의 수 많은 개인투자자들 역시 모두 이 사건으로 피해를 입었습니다. 

그리고 마지막으로 저 개인입니다. 저는 꿈을 가지고 이 사업을 성공시키기 위해 3년 이상의 인생과 시간, 개인적으로 대출을 받아가면서까지 개발하고 운영한 서비스를 강탈당했다고 생각합니다. 


#4. 서버 비용 
30여대가 넘는 서버/디비 등 시스템을 운영하여 초기에는 월 300~400만원의 서버비가 발생하였고, 저와 여러 직원들의 고생으로 최적화를 진행하였지만 현재도 월 100~200만원의 서버비가 발생하고 있습니다. 이렇게 3년에 걸쳐 큰 비용을 지불하며 만들어온 데이터를 xx소x트는 무단으로 수집해 간 것입니다. 


#5. 개발 인건비 및 운영비 
국세청에 신고된 제무재표 기준 중 가장 많은 직원이 소셜러스 시스템 개발/운영에 투입됐던 2017/2018년 내역을 보면,
  2017년 급여 및 판매비 총액 : 229,567,740원  
  2018년 급여 및 판매비 총액 : 374,655,154원  
입니다. 2019 이후를 포함하지 않았음에도 604,222,894원의 급여와 운영비를 써 가며 소셜러스를 개발하고 운영, 업데이트 해 왔습니다. xx소x트는 이러한 노력과 비용을 무시하고 데이터를 무단으로 수집해 간 것입니다.


#6. 잠재적인 사업 기회 손실과 명백한 xx소x트의 이득 
위 모든 내용을 통해 저희는 사업 기회의 손실을 입었고, 반대적으로 xx소x트는 명백한 사업 이득을 얻었다고 강력하게 추정하고 있습니다. 
 1) 우선 필요하지 않은 내용을 크롤러를 개발해가며 100개 이상의 IP를 사용해 수집해 갔다고는 누구도 믿지 않을 것입니다. xx소x트는 제 데이터가 필요했을 것입니다. 
 2) 그 이유는 xx소x트가 운영하는 서비스에서 찾아 볼 수 있습니다. xxxxxx, xxxxxx 등 트렌드 분석하기 위해 소셜러스의 유튜브 데이터는 매우 도움이 됐을 것입니다.  
 3) 즉 소셜러스에서 수집한 데이터가 xx소x트의 유료/무료 서비스에 기초 자료로 사용되었거나 xx소x트의 고객사 중 한 곳의 요청으로 사용되었다고 저희는 추정하고 있습니다.
올해 기술상장이 예정되어 있던데 3년이 넘는 저희 노력은 한 줌 가루가 되어 그 거름이 되어야 하는지 묻고 싶습니다.


#7. 제가 허비한 시간
저는 경영학과 정보보안관리(디지털 포렌식)을 복수전공했습니다. 소프트웨어산업협회 기준 특급이고 월 비용은 1200만원이 넘습니다. 이 사건으로 인해 서버 로그를 분석하고, IP를 정리하고, 고소장 작성, 검찰 방문, 강남경찰서 4회 이상 방문, 그리고 지금 이 메일을 쓰는 시간까지 모두, 생산적인 일을 해야 할 시간에 하지 않아도 될 일들을 6개월 넘게 해 오고 있습니다.


서두에 언급했듯이, 우선은 이렇게 정확한 피해 사실을 전달하고자 합니다.
이 내용들이 xx소x트의 경영진에게 명확히 전달되어 특정 직원의 한 순간 실수가 아니라는 사실을 우선 인지해 주시기를 바라기에 길고 자세한 내용을 작성하였습니다.

xx소x트에서 이런 피해 사실들을 명확히 인지하신다면, 그 이후에 보상과 합의에 대한 이야기를 나누고 싶습니다.
6개월 넘게 이 사안을 진행하며 저도 나름대로 가지고 있는 합의안들이 있지만,
우선 합의를 희망한 곳은 제가 아니라 xx소x트이므로 합의에 대한 의견도 먼저 제시해 주시기 바랍니다.

이 사안을 길게 끌 생각은 없으므로 신속한 연락 기다리겠습니다.

감사합니다.

zzz 드림 

 

[합의 시도] 드디어 한 자리에 앉게 되다.

2020.07.24 변호사에게 다시 연락이 와서 나는 드디어 범인을 직접 대면하게 된다. 검찰에 고소를 한지 6개월 하고도 10일 만이었다. 2020.07.27. 오후 3시 법무법인 광장의 회의실에서 변호사 2명과 xx소x트 이사와 합의를 위해 한 테이블에 앉았다. 

법무법인 광장의 회의실. 최상급 로펌답게 어찌나 고급스러운지...

양쪽 모두 정중하고 예의 바르게 대화를 나눠고 그 대화를 요약하면, 
변호사) 적어주신 이메일의 피해 내용들이 재판에서는 거의 인정이 안된다. 피해를 증명하기가 쉽지 않기 때문이다. 하지만 우리 고객사에서 죄송하게 생각하는 부분이 있으니 보상을 제시하고 합의를 하고자 한다. 
) 이미 충분히 알고 있다. 변호사니까 당연히 그런 부분들이 중요하겠지만, 만약 이 건이 계속 진행된다면 그런 법리 부분은 내가 아닌 검찰이랑 싸우면 된다. 내가 손해배상 민사를 제기한게 아니므로 피해가 인정되니 마니 하는 소리는 지금 큰 의미가 없다. 
이사) 우선 죄송하다. 우리도 유튜브 채널 만몇천개를 모니터링 하고 있는데, 우리가 가진 데이터를 검증하기 위해 소셜러스의 데이터로 비교를 해봤다. 절대 다른 고객에게 판매하거나 하는 목적은 아니었고 "연구" 목적이었다. 우리가 나쁜 의도를 가지고 있었다면 "투명 IP" 등을 사용했을 것이다. 
) 무슨 데이터를 얼만큼 가지고 있는지는 나와 상관 없다. 그리고 연구 목적이라 하셨는데, 인류 발전을 위해 연구하시는건 아니지 않나? 기업은 이윤 창출을 하는 곳이고 연구의 목적은 더 나은 서비스를 개발해서 돈을 벌려는 것이 아닌가? 연구 목적이라고 하지만 결국은 내 데이터로 당신들의 더 나은 서비스를 개발하려했던 것이라 난 생각한다. 

위 대화에서 중요한 포인트 하나 짚어주자면, 변호사는 "넌 어차피 법원으로 가도 피해 이거 인정 못받아. 그러니 우리가 제시하는 금액을 그냥 받어" 라고 말하고 싶었을거다. 하지만 난 민사를 제기한 것이 아니다. 이 사건이 계속 진행된다면 그들이 싸워야 할 상대는 검찰이다. 저작권은 친고죄고 그에 따라 내가 고소를 했지만, 죄의 유무, 기소여부 등은 검찰이 결정한다. 단순하게 말하면 검찰로 넘어간뒤 나는 똑같은 조서를 한번 더 쓰겠지만 그 이후 나는 일절 관련이 없다. 민사였다면 피해를 증명하고 나도 변호사를 사야 하고 매우 복잡하고 힘들었을거다. 어쨌든 서로 정중하게 20분 이상 이야기를 나눴으나 별다른 의미가 있는 것이 아니라 합의금을 제시하기 위한 밑작업인거다.  

밥을 한 솥을 해도 될 만큼 뜸을 들인뒤 이제 변호사가 합의금을 말할 시간이 됐다. 이쯤에서 다시 위에 쓴 내용들을 복기해 보자. 난 소셜러스 사이트를 만들기 위해 엄청난 인건비, 서버비를 사용했고, 그들의 "연.구.목.적." 크롤링으로 인해 사이트가 안 열리는 직접적인 피해를 입었으며 그들은 그렇게 "연.구."한 내용으로 더 나은 서비스를 개발해 상장도 하고 돈도 벌고 그러겠지. 그럼 이 글을 읽은 당신이 생각하는 적정 합의금은 얼만인가?  내가 평소 활동하는 스타트업 커뮤니티들과 페북 지인들을 통해서 의견을 수렴해보고자 한다. 

그 뒤 변호사가 제시한 합의금과 내가 생각하는 금액, 이후의 협상 과정을 공개하도록 하겠다. 

긴 글 읽어주신 여러분께 진심으로 감사의 마음을 전하며, 나와 같은 피해자가 다신 나오지 않기를 바랍니다. 

마지막 업데이트 2020.07.30

 

  1. teddy 2020.07.31 16:18

    ㅋㅋㅋㅋ 멋있는 일대기네요.. 크롤러 제작도 엄청 많이 했었고 회사에서도 데이터 수집을 작업했었는데 이렇게 이야기 들으니 더욱 더 조심하고, 알아보고 진행해야겠네요.
    사건 잘 해결하시고 복많이받으세요 멋있으십니다.

  2. 다음X프X 2020.07.31 16:43

    큰일 당하셧네요 ㅠㅠ

+ Recent posts