웹 크롤링(Web Scraping) 이란?
"Web scraping is a computer software technique of extracting information from websites의 약자로 컴퓨터 소프트웨어 기술로 웹 사이트들에서 원하는 정보를 추출하는 것을 의미합니다.
간단하게 해당 정보가 HTML 형태로 어떻게 보여지는지도 '페이지 소스 보기' 또는 '개발자 검사' 로 볼 수 있습니다. 이런 소스들은 보통 개발자들이 어떤 정형화된 형태로 관리하기 때문에 규칙이 생기며, 이런 규칙을 분석해서 우리가 원하는 정보들만 뽑아오는 것을 '웹 크롤링' 작업입니다.
웹 크롤러란?
인터넷에 있는 웹페이지를 방문해서 자료를 수집하는 일을 하는 프로그램을 말합니다.
이때 한 페이지만 방문하는 것이 아니라 그 페이지에 링크되어 있는 또 다른 페이지를 차례대로 방문하고 이처럼 링크를 따라 웹을 돌아다니는 모습이 마치 거미와 비슷하다고 해서 스파이더라고 부르기도 합니다. 엄청난 분량의 웹문서를 사람이 일일 구별해서 모으는 일은 불가능하기 때문에 웹 문서 검색에서는 사람이 일일이 하는 대신 이를 자동으로 수행해 줍니다.
'공부하자 > 알면 유용한정보' 카테고리의 다른 글
노드제이에스(Node.js) 란? (0) | 2017.05.19 |
---|---|
서버 환경 확인 방법 (0) | 2017.05.19 |
컴파일러 정리 (0) | 2017.05.17 |
곰플레이어 건너뛰기 설정 (0) | 2017.05.17 |
NFC란 (0) | 2017.05.12 |