requests와 bs4를 설치한 상태.
크롤링 기본코드는 아래와 같다. 아래 코드를 복사,붙여넣기로 가져다 쓰면 됨.
(사용법들은 다큐먼트에 써둠)
import requests
from bs4 import BeautifulSoup
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query=삼성전자',headers=headers)
soup = BeautifulSoup(data.text, 'html.parser')
requests로 정보를 가져와서, BeautifulSoup으로 분석하기 좋게 만드는 것이다.
------------
'개발일지_파이썬for금융인' 카테고리의 다른 글
실전 - 뉴스 크롤링하기_다수의 검색어 (0) | 2023.03.17 |
---|---|
실전 - 뉴스 크롤링하기_특정 검색어 (0) | 2023.03.17 |
라이브러리 설치 (0) | 2023.03.13 |
반복문 for <a> in <list>: (0) | 2023.03.13 |
조건문if: else: (0) | 2023.03.13 |