공부하자/알면 유용한정보

웹 크롤링(Web Scraping) 이란?

YoBot 2017. 5. 19. 16:16

웹 크롤링(Web Scraping) 이란?

"Web scraping is a computer software technique of extracting information from websites의 약자로 컴퓨터 소프트웨어 기술로 웹 사이트들에서 원하는 정보를 추출하는 것을 의미합니다.


간단하게 해당 정보가 HTML 형태로 어떻게 보여지는지도 '페이지 소스 보기' 또는 '개발자 검사' 로 볼 수 있습니다. 이런 소스들은 보통 개발자들이 어떤 정형화된 형태로 관리하기 때문에 규칙이 생기며, 이런 규칙을 분석해서 우리가 원하는 정보들만 뽑아오는 것을 '웹 크롤링' 작업입니다.



웹 크롤러란? 

인터넷에 있는 웹페이지를 방문해서 자료를 수집하는 일을 하는 프로그램을 말합니다. 

이때 한 페이지만 방문하는 것이 아니라 그 페이지에 링크되어 있는 또 다른 페이지를 차례대로 방문하고 이처럼 링크를 따라 웹을 돌아다니는 모습이 마치 거미와 비슷하다고 해서 스파이더라고 부르기도 합니다. 엄청난 분량의 웹문서를 사람이 일일 구별해서 모으는 일은 불가능하기 때문에 웹 문서 검색에서는 사람이 일일이 하는 대신 이를 자동으로 수행해 줍니다. 









'공부하자 > 알면 유용한정보' 카테고리의 다른 글

노드제이에스(Node.js) 란?  (0) 2017.05.19
서버 환경 확인 방법  (0) 2017.05.19
컴파일러 정리  (0) 2017.05.17
곰플레이어 건너뛰기 설정  (0) 2017.05.17
NFC란  (0) 2017.05.12