300x250
크롤링해서 기사 제목 가져오기 해보자
1. 우선 기사를 고른다. 아래 기사를 이용해보자.
https://newsis.com/view/?id=NISX20230228_0002208506&cID=13001&pID=13000
2. 코드작성
1) 기사의 날짜찾기는 두번에 걸쳐 찾아봤다.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
import requests
from bs4 import BeautifulSoup
base_url = 'https://newsis.com/view/?id=NISX20230228_0002208506&cID=13001&pID=13000'
resp = requests.get(base_url) # url에서 데이터 가져오기
print("\n기사 제목 찾기 : ")
soup = BeautifulSoup(resp.text,'lxml')
title = soup.find('p',class_='tit title_area')
print(title)
print(title.string) # 찐 제목만 가져오기
print("\n기사 날짜찾기 : ")
date = soup.find('p',class_='txt') #날짜 찾기는 두번에 걸쳐 해보자.
date = date.find('span')
print(date.string)
|
cs |
3. 결과
300x250
'파이썬 > 크롤링' 카테고리의 다른 글
python(vscode)/네이버 쇼핑 가격가져오기#1/BeautifulSoup/select (0) | 2023.03.06 |
---|---|
파이썬 - selenium/ 크롬 드라이버 설치 (0) | 2022.03.29 |