본문 바로가기

개발일지_파이썬for금융인

크롤링 기본 코드

requests와 bs4를 설치한 상태.

크롤링 기본코드는 아래와 같다. 아래 코드를 복사,붙여넣기로 가져다 쓰면 됨.

(사용법들은 다큐먼트에 써둠)

import requests
from bs4 import BeautifulSoup

headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
data = requests.get('https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query=삼성전자',headers=headers)

soup = BeautifulSoup(data.text, 'html.parser')

requests로 정보를 가져와서, BeautifulSoup으로 분석하기 좋게 만드는 것이다.

 

------------