쿠팡리뷰크롤링 하기 ㅣ 판다랭크

쿠팡리뷰크롤링 하기

브라우저에서 바로 실행되는 크롬 확장프로그램으로 쿠팡 리뷰를 수집·저장하는 과정을 실습 형태로 정리했습니다. 확장은 커서 AI 기반으로 패널 UI를 띄우고, 현재 탭의 리뷰 영역을 자동 탐지해 JSON으로 내려받을 수 있게 구성했습니다. 약관 범위를 우선하며, 과도한 요청을 피하는 설정을 기본값으로 두었습니다.

쿠팡리뷰 준비물과 동작 원리

준비물은 Chrome, 커서 AI, 간단한 확장 매니페스트/스크립트 파일입니다. 리뷰 페이지에서 확장 버튼을 누르면 패널이 열리고, DOM의 리뷰 카드(article.twc-pt 등)와 별점, 날짜, 이미지 썸네일을 CSS 선택자로 추출합니다. 페이지네이션은 “다음 페이지” 버튼을 가상 클릭하며 진행하고, 수집된 객체는 메모리에 누적한 뒤 JSON/CSV로 다운로드합니다. 최초 설치는 개발자 모드에서 폴더를 로드하는 방식으로 끝나며, 아이콘과 권한은 activeTab, scripting 정도만 사용했습니다.

쿠팡리뷰 수집 중 경험 포인트

첫째, 동적 로딩 대기. 스크롤/더보기 이후 요소가 렌더링될 때까지 MutationObserver와 setInterval을 조합해 가시 요소 수가 안정될 때 파싱하니 누락이 줄었습니다. 둘째, 예외 처리. 제목 누락·이미지 없음·별점 파싱 실패를 대비해 필드를 기본값(빈 문자열/하이픈/0)으로 채우고, 실패 로그는 패널 하단에 표시했습니다. 셋째, 속도와 차단 이슈. 페이지당 지연 800~1500ms의 랜덤 대기, 사용자 스크롤 시에만 다음 페이지 이동, 최대 페이지 상한 설정으로 서버 부담을 낮췄습니다. 이미지 URL은 alt·원본 링크를 함께 저장해 후기 사진만 별도 분석하기 쉽게 했습니다.

크롤링 결과 활용과 유의할 점

확장 패널에서 진행률, 페이지 수, 누적 리뷰 건수를 실시간 표시하고, 끝나면 JSON 다운로드 버튼이 활성화됩니다. 수집 데이터 스키마는 index, author, rating(0~5), date(YYYY.MM.DD), title, content, productName, images[], helpfulCount, timestamp로 통일했습니다. 분석 단계에서는 워드클라우드와 별점 구간 필터링을 바로 돌릴 수 있게 불용어/이모지 제거 함수와 날짜 정규화 옵션을 포함했습니다. 서비스 약관을 준수하고, 상업적 재배포는 피하며, 테스트 범위를 작게 시작해 성능과 안정성을 먼저 확인하는 것을 권장합니다.

아래는 확장 UI 시연 화면입니다. 페이지마다 리뷰 수와 진행률이 보이고, 중간 실패 시 마지막 성공 페이지부터 이어받기(Resume) 기능을 제공합니다. “리뷰 크롤링 시작”을 누르면 현재 페이지의 리뷰를 먼저 수집하고, 이후 페이지네이션을 따라가며 누적 데이터를 모읍니다. 수집이 끝나면 JSON 저장과 클립보드 복사를 지원해 초보자도 결과를 즉시 확인할 수 있습니다.

크롬 확장 기반의 쿠팡 리뷰 수집은 설치가 간단하고, 브라우저 내에서 동작해 실습·검증이 빠릅니다. 작은 범위부터 시작해 대기/예외 처리만 꼼꼼히 잡으면 성공률이 높아집니다. 브라우저 자동화로 흐름을 익힌 뒤 정적 파싱을 적절히 섞고, 수집-정제-해석을 한 번에 이어가면 효율이 크게 올라갑니다.

#쿠팡리뷰 #쿠팡리뷰크롤링하기 #쿠팡리뷰크롤링 #쿠팡리뷰수집방법 #쿠팡리뷰분석 #리뷰크롤링가이드 #쿠팡크롤링도구 #리뷰데이터정제 #크롤링실전팁 #리뷰수집자동화