반응형
다나와 가격 크롤러 만들기 - 크롤링 로직 정리
프로젝트/다나와 가격 크롤러 만들기2024. 4. 28. 14:10다나와 가격 크롤러 만들기 - 크롤링 로직 정리

크롤링 로직1. 크롤링할 페이지를 사용자로부터 미리 받아둡니다.데이터는 카테고리, url, 페이지 수 를 입력 받을 수 있습니다.csv 파일의 형태로 저장되어있습니다.이런 형태로 말이죠사용자가 크롤링 원하는 페이지를 쉽게 추가하기 위해서는 db에 위 내용을 저장하는것 보다는 csv의 형태로 존재하는것이 좋다고 생각했습니다. 2. 크롤링 대상 페이지에서 제조사 : 삼성전자로 선택카테고리 페이지에서 삼성전자 선택이 어떤식으로 가능한지 확인이 필요했습니다.확인 해 보니 일부 카테고리를 제외하면 대부분 메이저 제조회사라서 업체명 및 체크박스가 고정입니다.그래서 페이지 진입하면 항상 해당 체크박스를 체크하도록 처리해두었습니다.3. 페이지 수 만큼 데이터를 크롤링 해서 저장합니다. 아래 처리들이 필요합니다.1. 1..

반응형
image