오늘은 리스틀리를 사용하면서 겪는 가장 보편적인 추출 실패 사례를 다뤄보려고 합니다. 방금 한 페이지를 추출하는 것에는 성공했는데, 왜!! 설정을 붙인 후 재추출을 하거나 그룹추출을 걸어두거나, 스케쥴로 걸어두면 실패라는 맘 아픈 글자를 만나게 되는지, 가장 보편적인 이유와 진단&해결 방법을 알아보아요 :)
📌 1. 그 URL로는 접근 할 수 없습니다...😥
방금 추출에 성공했는데 왜 접근을 할 수가 없어? 라고 생각하실 수도 있습니다.
하지만 확장 아이콘을 클릭하여 페이지를 추출할 때와, 설정 후 재추출 or 그룹추출을 진행하는 경우에는 데이터를 수집하는 주체가 다릅니다. 오잉? 이게 무슨 말일까요?
위는 데이터의 재추출(그룹추출 포함) 과정을 간단하게 보여주는 예시입니다. 이러한 케이스는 로그인 기록, 접속국가 등 페이지에 접근하기 위해 특정 권한이 필요한 사이트에서 많이 겪게 됩니다.
확인해보세요📌 크롬 브라우저의 시크릿 모드를 켜고 방금 추출한 URL을 주소창에 입력하여 접속해보세요. 시크릿모드는 크롬에서 키보드 Ctrl+Shift+N을 누르면 활성화됩니다. 이 방법으로 해당 페이지에 바로 접근할 수 없다면 아래의 방법을 따라주세요.😉