파이썬/크롤링

python(vscode)/네이버 쇼핑 가격가져오기#1/BeautifulSoup/select

gongdol 2023. 3. 6. 21:18
300x250

네이버 쇼핑에서 청바지를 검색하고 가격들을 가져와보자. 

 

1. 코드작성

1
2
3
4
5
6
7
8
9
10
11
12
13
import requests
from bs4 import BeautifulSoup
 
URL = 'https://search.shopping.naver.com/search/all?query='
 
search_item = ['청바지'# 검색어 입력하기 
res = requests.get(URL + str(search_item[0])) #검색어 입력한후 html 가져오기
page_soup = BeautifulSoup(res.text, 'lxml')
price = page_soup.select('span[class="price_price__LEGN7"]')[0# 가격이있는 태그 가져오기
print(price)  # 한번더 태그를 가져오도록 해보았다.
 
prices = page_soup.select('span[data-testid="SEARCH_PRODUCT_PRICE"]')  #한번더 태그를 가져온다. 
print([pr.string for pr in prices])  #모든 가격을 출력한다. 
cs

 

 

2. 결과

  1) 첫번째 출력은 첫번째 가격의 태그 값을 가져온다.

  2) 두번째 출력은 가격을 가져온다.

     그런데, 5개의 데이터만 출력이 된다. 그 이유는 웹사이트가 동적으로 동작해서 그렇다고 한다.

     동적 크롤링은  selenium 을 사용한다고 한다는데 다음에 알아보자.

 

300x250