본문 바로가기
● 크롤링, 자동화/BeautifulSoup

[잔재미코딩] [오류/해결] ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end

by 0ver-grow 2021. 2. 1.
반응형
import requests
from bs4 import BeautifulSoup

headers = {'UserAgent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}
url = 'https://news.naver.com/main/main.nhn?mode=LSD&mid=shm&sid1=105'

까지는 정상적으로 실행되지만

하단 코드 실행시 오류 발생.

res = requests.get(url, headers=headers)

 

ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))

 

이유?

  • 무분별한 크롤링을 막기위해 네이버에서 자신들이 허용하지 않는 방식으로 접근하는 호출을 걸러내기 때문

 

수정전

'UserAgent': 'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'

 

수정후 (수정된 부분 표시)

"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"

 

User-Agent를 수정하니 정상적으로 실행된다.

 

 

전체 코드

import requests
from bs4 import BeautifulSoup
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36"}
url = 'https://news.naver.com/main/main.nhn?mode=LSD&mid=shm&sid1=105'

res = requests.get(url, headers=headers)
print(res) # 200값 반환되면 정상실행

butnotforme.tistory.com/39

 

파이썬으로 업무 자동화까지 <7> requests 2

코딩 초보의 정리글입니다. 0편부터 보세요. import requests url = "https://news.naver.com" r = requests.get(url) print(r) 네이버 뉴스 메인페이지 호출 스크립트다. 한줄씩 보면, import requests requests..

butnotforme.tistory.com

 

반응형