본문 바로가기
● 크롤링, 자동화/BeautifulSoup

[BeautifulSoup] Dummy 지정(soup.select)할 때, 추출대상을 모두 포함하는 부모태그를 지정해야한다.

by 0ver-grow 2021. 5. 19.
반응형

추출할 대상은 다음 하늘색 밑줄 친 제목들!

참고로 하늘색 텍스트들은 .list_txt  > li > a 태그에 속해있다.

이를 select로 지정하기 위해 한 묶음으로 dummy를 지정해보았다.

dummy = soup.select(".list_txt")

하지만 이렇게 지정하면 원하는 기사 제목들이 나오지 않는다.

구체적으로 지정해야만 한다.

 

추출 대상(타이틀제목, 링크)이 모두 포함된 부모 태그를 dummy로 지정해야만 한다.

즉, dummy = soup.select('.list_txt > li')

이렇게 해야만 정상적으로 나온다.

반응형