안녕하세요. 리스틀리입니다.😉
오늘은 라이트 플랜부터 사용할 수 있는 핵심 기능 중 하나인 탭스를 주제로 가지고 왔습니다.
알고 보면 굉장히 유용한 기능, 탭스!
썸네일과 같이 하나의 창 안에 여러 개의 탭을 열어둔 상태일 때, 이 모든 탭들을 한 번에 추출할 수 있는 기능이 바로 ‘탭스’입니다.
혹시 탭스 사용법을 더 알아보고 싶으시다면 아래 동영상 링크를 참고해 주세요.
🎥 튜토리얼: [TABS] 열려있는 탭을 한 번에 추출하세요
여러 페이지를 추출할 때,
탭스 vs 그룹추출
여러 업무로 인해 데이터 수집이 필요하신 일상이신 분들이라면, 사실 단일 페이지보다 수십, 수백 개의 웹페이지를 한 번에 추출해야 하는 상황을 한 번쯤 마주하셨을 거에요.
리스틀리에는 이렇게 많은 양의 웹페이지를 추출할 수 있는 기능으로 ‘탭스’와 ‘그룹추출’ 두 가지 기능이 있습니다. 두 기능 사이의 차이는 아래의 표를 참고해 주세요.
위의 상황이라면 탭스를 사용하여 데이터를 추출할 때 훨씬 빠르게 추출하실 수 있습니다.
그래서, 탭스로는
한 번에 최대 몇 페이지까지 추출할 수 있을까? 🧐
위의 표와 리스틀리의 탭스 도움말 문서에서는 탭스를 통한 1회 권장 추출량은 약 30페이지 내외로 소개하고 있습니다. 그런데 이 '권장’이라는 표현에서 갑자기 생겨난 궁금증!
현실적으로 일반 사용자의 PC에서 50~100개 이상의 탭을 열어두는 행위 자체가 시스템 성능을 저하시킬 가능성이 크기 때문에 권장 사용량을 제시해 두었습니다...만!
사실 탭스 기능 자체는 열려있는 모든 탭에서 일치하는 구조와 데이터 패턴을 기반으로 추출을 진행하기 때문에 탭이 정상적으로 열려있고, 모든 페이지의 정보가 로드되어 있는 상태라면 작동이 됩니다.
그렇다면, 나의 컴퓨터는 몇 개까지 버텨낼 수 있을까? 몇 개의 창부터 버벅댈까?
뉴스레터 담당자인 제가 직접 실험을 해보았습니다.
(이 과정은 여러 창을 한 번에 띄우는 과정 자체가 사용자의 시스템 성능에 따라 좌우될 수 있으므로 이 사람의 컴퓨터에서는 이랬구나! 정도로 결과를 살펴봐주세요.)
실험을 시작합니다🤖
예상했던바와 같이 탭 30개까지는 별다른 특이점을 발견하지 못했으며, 문제 없이 추출이 잘 진행되었습니다.🤗
+) 참고로 위 GIF는 시간보정없는 녹화본입니다. 리스틀리 탭스! 참 빠르죠ㅎㅎ
30개를 넘어 50개부터 탭스 추출 화면에서 약간의 대기시간이 생기기 시작했습니다. 하지만 화면 전환 후 결과페이지에서 추출된 성공 결과를 확인할 수 있었어요! 50개까지는 성공!
그럼 오늘의 레터도 유용하셨길 바라며!
리스틀리였습니다.😍
완료시 엔터프라이즈 플랜부터 적용될 예정입니다.
현재로서는 목록페이지를 추출한 다음 -> 목록페이지 추출 결과 속 상세페이지 URL을 활용해
탭스 혹은 그룹추출을 진행하는, 두 번의 추출과정이 필요합니다.😊
리스틀리팀이 전하는 웹스크래핑 이야기