Selenium

[bs4/selenium] 페이지 정보 가져오기

thxxyj 2022. 7. 25. 17:36
728x90

 

  beautifulsoup selenium
텍스트 추출 x.get_text() x.text
이미지 추출 x.get('src')  또는  x['src'] x.get_attribute('src')
링크 추출 x.get('href')  또는  x['href'] x.get_attribute('href')
기타 속성 추출   x.get_attribute('style')

 

ex) beautifulsoup 이용하여 이미지 추출

<img class="rh-image-embed-img" src="https://static.redhat.com/libs/redhat/brand-assets/2/products/red-hat-3scale-api-management--stacked.svg" alt="Red Hat 3scale API Management" loading="lazy">
rh_images = soup.select('img.rh-image-embed-img')
for img in rh_images:
	img_link = img['src']	# 방법1
	img_link = img.get('src')	# 방법2

 

728x90