300x250
네이버 쇼핑에서 청바지를 검색하고 가격들을 가져와보자.
1. 코드작성
1
2
3
4
5
6
7
8
9
10
11
12
13
|
import requests
from bs4 import BeautifulSoup
URL = 'https://search.shopping.naver.com/search/all?query='
search_item = ['청바지'] # 검색어 입력하기
res = requests.get(URL + str(search_item[0])) #검색어 입력한후 html 가져오기
page_soup = BeautifulSoup(res.text, 'lxml')
price = page_soup.select('span[class="price_price__LEGN7"]')[0] # 가격이있는 태그 가져오기
print(price) # 한번더 태그를 가져오도록 해보았다.
prices = page_soup.select('span[data-testid="SEARCH_PRODUCT_PRICE"]') #한번더 태그를 가져온다.
print([pr.string for pr in prices]) #모든 가격을 출력한다.
|
cs |
2. 결과
1) 첫번째 출력은 첫번째 가격의 태그 값을 가져온다.
2) 두번째 출력은 가격을 가져온다.
그런데, 5개의 데이터만 출력이 된다. 그 이유는 웹사이트가 동적으로 동작해서 그렇다고 한다.
동적 크롤링은 selenium 을 사용한다고 한다는데 다음에 알아보자.
300x250
'파이썬 > 크롤링' 카테고리의 다른 글
python(vscode)/뉴스 기사 제목 날짜 크롤링하기/beautifulsoup/find (0) | 2023.03.01 |
---|---|
파이썬 - selenium/ 크롬 드라이버 설치 (0) | 2022.03.29 |