파이썬/크롤링

python(vscode)/뉴스 기사 제목 날짜 크롤링하기/beautifulsoup/find

gongdol 2023. 3. 1. 11:55
300x250

크롤링해서 기사 제목 가져오기 해보자

 

1. 우선 기사를 고른다. 아래 기사를 이용해보자.

https://newsis.com/view/?id=NISX20230228_0002208506&cID=13001&pID=13000 

 

bhc치킨, 가맹점주 대상 레시피 공모전 열어

[서울=뉴시스]주동일 기자 = bhc치킨은 가맹점과 함께 신메뉴 아이디어를 공모하는 '제 1회 가맹점주와 함께하는 대국민 치킨 메뉴 콘테스트'를 진행한다고 28일 밝혔다

www.newsis.com

 

 

2. 코드작성

 1) 기사의 날짜찾기는 두번에 걸쳐 찾아봤다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
import requests
from bs4 import BeautifulSoup
 
base_url = 'https://newsis.com/view/?id=NISX20230228_0002208506&cID=13001&pID=13000'
 
resp = requests.get(base_url) # url에서 데이터 가져오기
 
 
print("\n기사 제목 찾기 : ")
soup = BeautifulSoup(resp.text,'lxml')
title = soup.find('p',class_='tit title_area')
print(title)
print(title.string) # 찐 제목만 가져오기
 
 
 
print("\n기사 날짜찾기 : ")
date = soup.find('p',class_='txt'#날짜 찾기는 두번에 걸쳐 해보자.
date = date.find('span')
print(date.string)
cs

 

3. 결과

 

300x250