💚 리스틀리 뉴스레터 구독자님의 코멘트! 💚
Q. 혹시 Listly에서 크롤링된 정보의 정확성을 확인하는 기능은 없나요?
⤷ 예를들어 추출 결과에서 OOO업체의 전화번호가 000)123-4567로 추출되었는데,
이 정보 자체의 진위여부를 확인할 수 있냐는 질문이신가요?
리스틀리는 웹페이지가 가진 데이터를 그대로 스크래핑 하는 프로그램이기 때문에,
데이터의 진위 여부를 검증하는 기능은 제공하지 않습니다. 😢
(웹페이지 자체에 오타가 있다면, 리스틀리도 오타가 난 결과를 그대로 추출합니다.)
하지만 만약 데이터의 배열이 틀어지지 않고 정확하게 추출되었는지를 묻는 질문이시라면,
이 부분은 걱정하지 않으셔도 됩니다. 한 행(가로줄)에 있는 정보는 특정 구조 속에 함께 묶여 있는 데이터이므로, 이 '행'이 틀어져서 추출되는 경우는 극히 드뭅니다.(ex.웹사이트 개발자가 고의로 코드를 꼬아둔 경우)
다만, 지난 뉴스레터에서와 같이 간혹 특정 위치의 데이터가 있고, 없고의 변칙적인 요소로 인해
열(세로줄)이 어긋나는 경우는 종종 발생할 수 있습니다.
하지만 이 또한 특정한 패턴으로 정렬되어 추출되므로 각 행에 위치한 데이터의 매칭은
걱정하지 않으셔도 되며, Parts로 패턴 데이터를 각각 선택하여 추출하면
대부분의 케이스 해결이 가능합니다.😉 |