소비자피해·기업분쟁 '데이터 스크래핑'…에버스핀 "2년간 4000만건 탐지"
상태바
소비자피해·기업분쟁 '데이터 스크래핑'…에버스핀 "2년간 4000만건 탐지"
  • 박주범
  • 승인 2024.05.17 08:33
  • 댓글 0
이 기사를 공유합니다

지난 1일 서울 강남구 코엑스에서 열린국제인공지능 대전이 관람객으로 북적이고 있다. 연합뉴스

AI 보안기업 에버스핀이 최근 대두되고 있는 데이터 스크래핑에 대한 해법과 그 방지 성과를 발표했다.

스크래핑(Scraping)은 해킹에도 이용되는 기술로, 목표 웹에서 데이터를 자동으로 추출하는 행위를 말한다. 최근의 스크래핑은 일부 스타트업이 기성 사업자의 데이터를 임의로 추출해 자신들의 신규 서비스에 활용하는 방식으로 많이 알려졌다. 

스크래핑을 이용한 서비스는 여러 곳에 흩어진 정보를 한데 모아주는 등 이용자 편의성을 높여주기도 하지만, 대상 기업의 데이터를 동의 없이 무단으로 추출한다는 점이 논란이다. 그 과정에서 과도한 트래픽을 유발해 서비스를 지연시키는 등이 부작용이 존재하지만, 이와 관련한 법적, 제도적 장치는 존재하지 않는다.

최근 국세청에서는 세무 플랫폼들의 과도한 스크래핑으로 인하여 홈택스 서비스가 지연되어 수많은 사용자들이 불편을 호소하는 일이 발생했다. 국세청은 정상적으로 접속하는 사용자들의 원활한 접속을 위해 과도한 트래픽(스크래핑 등)을 발생시키는 세무 플랫폼들의 접속을 제한한 일이 있었다. 상호 합의되지 않은 스크래핑 피해는 당하는 곳과 정상적으로 이용하는 사용자에게 고스란히 돌아가고 있다.

에버스핀
에버스핀

에버스핀은 지난 2년간 에버세이프 웹을 통해 탐지된 전체 스크래핑 건이 무려 4000만 건에 달했다고 전했다. 스크래핑 대다수는 무단 스크래핑이거나, 자동화 봇(Bot)을 통한 것으로 각별한 주의가 필요하다.

에버스핀 관계자는 "신설 기업들이 기성 사업자가 축적한 데이터를 무단으로 수집하고 그 서버 인프라에 과도한 부하를 유발하면서까지 서비스를 이어가고 있다”라며 ”원치 않은 스크래핑으로 피해를 받는 기업과 그 사용자들의 권익 보호를 위해 R&D를 지속할 것”이라고 밝혔다.

박주범 기자 kdf@kdfnews.com


관련기사
더보기+

주요기사
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.