안녕하세요. 리스틀리입니다.😉
리스틀리와 gpt로 데이터를 분석해보는 과정을 많은 분들이 흥미롭게 읽어주셔서 이번엔 판매중인 상품 데이터를 기반으로 판매할 제품의 가격과 구성을 도출해 보려고 합니다.
어떤 판매자가 되어볼까 고민을 하다가, 최근에 선물받았던 킹스베리가 참 맛있었던 기억에 저를 ‘킹스베리 판매자'로 가정하고, 등록된 상품 정보들을 스크랩한 후 엑셀파일의 편집부터 간단한 분석까지, gpt와 함께 진행해보도록 하겠습니다.(지극히 개인적인 취향이 반영되었습니다.ㅎㅎ)
그럼 시작해볼까요?
* 본 콘텐츠는 수집된 상품 데이터만을 바탕으로 작성한 것입니다. 실제 상품의 원가나 품질, 프로모션, 기타 세일즈 컨디션 등 다양한 이유에 따라 판매자별 적정 판매가는 달라질 수 있으므로 참고용으로 읽어주세요. 🙂
* 이번 레터에서도 파일 첨부가 가능한 gpt 4.0(유료) 버전의 Data analyst 플러그인을 사용했습니다.)
|
|
|
우선 리스틀리로 오픈마켓에서 “킹스베리 딸기" 를 검색하여 나온 결과를 추출했습니다. 추천순으로 약 30페이지 분량을 스크랩 하여 약 1116개의 상품 데이터가 추출되었는데요. |
|
|
흠… 그런데 오픈마켓의 특성 탓일까요? 킹스베리 딸기가 아닌 상품도 연관검색으로 같이 검색되었던 것 같습니다. 데이터를 살펴보니 다른 품종만 판매하거나, 냉동딸기 등 킹스베리가 아닌 제품정보들이 보이네요. 일단 오차를 줄이기 위해 킹스베리를 포함하지 않는 상품정보는 일단 제외하는 것이 좋겠습니다. |
|
|
GPT에 파일을 업로드 한 후 킹스베리가 상품명에 언급된 결과만 남기고 나머지 데이터를 삭제해 달라고 요청해보겠습니다. 이와함께, 분석이 용이하도록 셀에 수집된 숫자정보 정제까지 같이 요청해볼게요.
Prompt 지금부터 너는 온라인 셀러로서 시장조사를 위해 이 파일을 분석할거야. 분석에 앞서 몇가지 수정이 필요해.
1. 상품명 열에서 킹스베리가 포함되지 않은 셀은 해당 행의 데이터를 제거해줘.
2. 원가, 할인율, 할인가, 평점, 리뷰수, 100g당 단가, 배송비 등 숫자 정보를 계산하기 쉽도록 숫자 형태로 정제해줘.
3. 원가 열에 데이터가 없는 셀은 각 행의 할인가 열의 정보와 동일하게 기입하고, 할인율을 0으로 처리해줘.
4. 평점, 리뷰수, 100g당 단가 열의 빈 칸은 NaN으로 처리하고 이후 계산에서는 제외해줘.
단계별로 모든 정제 과정이 끝나면 결과 데이터를 받을 수 있는 링크를 생성해줘.
엑셀파일 자체를 수정해달라는 요청입니다. GPT의 답변과 결과는 어땠을까요? |
|
|
1차 정제가 끝났습니다. 생성해준 링크에서 엑셀파일을 다운로드하여 확인해봤더니 1116개의 데이터에서 킹스베리가 포함된 정보 499개만 남기고 요청한 내용대로 엑셀파일이 편집되었습니다.
가격의 빈칸이 자동으로 채워지고 할인율 뒤에 붙어있던 '원', '%' 등 단위표시도 정리되었습니다. 배송비 란에 '무료'로 적혀있던 문구들도 0으로 변환되었네요.
그런데 아직 아쉬운점이 있습니다. 농산물이라는 제품의 특성상 800g 2개, 400g 1팩, 1kg 1박스 등 제품마다 중량도 다르고 개수단위로 묶어 파는 상품이 많아 평균값을 도출하기에는 기준이 다 다른상태입니다. 이것을 조정하기 위해 다시 요청을 해보도록 하겠습니다. |
|
|
Prompt 1. 시트의 상품명에서 800g, 1.6kg등 중량정보는 별도의 열을 생성하여 g(그램) 단위로 추가해줘. 단 100g 미만의 중량은 제외해줘.
2. 상품명에서 1개, 1팩, 1박스 등 개수를 나타내는 정보도 별도의 열을 생성해서 숫자 형식으로 추가해줘.
3. 중량정보와 개수를 곱하여 총중량을 계산하고 새로운 열에 추가해줘. |
|
|
상품명 열에서 중량과, 개수를 추출하고, 총 중량에 대해서도 열이 생성되었습니다.(노란색 영역이 GPT가 추가해준 영역입니다.)
Prompt 총중량 열을 참고하여 몇그램짜리 제품이 제일 많이 등록되어있는지, 그리고 리뷰 개수가 평균치 이상인 상품에서는 몇그램짜리가 제일 인기가 있는지 순위별로 도출하고 비교해줘. |
|
|
총 중량 800g 인 제품들의 인기가 높은것으로 보입니다. 그럼 킹스베리 800g을 판매한다고 가정했을 때, 적절한 판매가는 얼마일까요?
Prompt 총중량 800g 제품의 할인가를 기준으로 가격분포도 그래프를 보여줘. 그리고 이 데이터를 기반으로 적절한 판매가를 제시해줘.
|
|
|
언어지원 문제로 그래프 속의 한글은 깨졌지만 그래프로 제품들의 가격대가 어떻게 구성되어있는지 확인할 수 있었습니다. 킹스베리 800g의 적정 판매가로는 32,900원에서 39,043원 사이를 제시하고 있네요. 물론 이 가격은 킹스베리의 등급까지 고려한 것이 아니며, 오픈마켓 1곳의 데이터로만 추산한 내용이니, 참고용으로 봐주시길 바랍니다.
그럼 인기있는 상품들의 상품명에는 어떤 특징이 있었을까요?
Prompt 평점 4.5 이상, 리뷰수 평균치 이상 제품의 상품명에서 많이 언급되는 키워드가 무엇이 있는지 빈도순으로 알려줘. “킹스베리”, “딸기”는 결과에서 제외해줘.
|
|
|
킹스베리와 함께 인기가 높은 딸기 품종이 설향이다보니 상품명에서도 같이 언급된 사례가 많았던 것으로 보입니다. 또한 논산은 유명 딸기 산지이니 원산지를 강조한 제품들도 많은 것으로 보이네요. 그 외에는 “생” “고당도" “산지직송" 등 신선도와 맛을 강조하는 단어들이 많이 사용되고 있었습니다.
Prompt 네가 최종적으로 생성한 시트와 지금까지의 대화내용을 바탕으로, 오픈마켓의 온라인 셀러로서 경쟁력있는 킹스베리 상품을 등록하기 위한 전략을 수립해봐.
|
|
|
인기 중량을 고려한 상품 구성, 해당 중량의 적정 판매 가격, 상품명에서 강조할 내용 등 판매 목록 데이터 하나만으로 위의 내용을 도출해낼 수 있었습니다. 물론 타품종, 원산지 표시, 산지직송 등 유통과정의 강점 등을 언급할때는 실제 판매 상품이 강조할 키워드들과 직접적인 연관성이 있어야겠죠? |
|
|
오늘의 레터는 여기까지!
이렇게 오늘은 GPT와 같이 엑셀 파일 자체를 편집해보는 과정부터, 정제된 데이터를 기반으로 간단한 계산과 분석까지 해보았는데요. 사실 예시로 든 킹스베리의 경우 농산물의 특성상 수급시기나 과일의 등급과 품질, 유통상황들을 모두 고려하여 가격이 책정되는 품목이니 위에서 도출된 여러 결론은 1차원적인 데이터 분석에 따른 참고 자료로서 가볍게 읽어주세요.
더 많은 것을 발견하고, 더 나은 결정을 내릴 수 있도록하는 데이터 수집! 언제나 리스틀리가 서포트 하겠습니다. 😀 |
|
|
💌
오늘의 뉴스레터, 어떻게 보셨나요?
뉴스레터에서 다뤄줬으면 하는 내용이 있으시다면
아래 버튼을 클릭해 소중한 의견을 남겨주세요. |
|
|
💚 지난 주 리스틀리 뉴스레터 구독자님의 코멘트! 💚
"간단한 데이터베이스 만들기"
⤷ 비개발자의 시선으로👀 최대한 쉽게 접근할 수 있는 방법을 찾아보겠습니다.
기다려주세요 :) |
|
|
본 메일은 리스틀리 마케팅 정보 수신에 동의하신 회원님을 대상으로 발송되었습니다.
|
|
|
|
|