728x90
beautifulsoup | selenium | |
텍스트 추출 | x.get_text() | x.text |
이미지 추출 | x.get('src') 또는 x['src'] | x.get_attribute('src') |
링크 추출 | x.get('href') 또는 x['href'] | x.get_attribute('href') |
기타 속성 추출 | x.get_attribute('style') |
ex) beautifulsoup 이용하여 이미지 추출
<img class="rh-image-embed-img" src="https://static.redhat.com/libs/redhat/brand-assets/2/products/red-hat-3scale-api-management--stacked.svg" alt="Red Hat 3scale API Management" loading="lazy">
rh_images = soup.select('img.rh-image-embed-img')
for img in rh_images:
img_link = img['src'] # 방법1
img_link = img.get('src') # 방법2
728x90
'Selenium' 카테고리의 다른 글
[selenium] Headless Chrome에서 user-agent 설정 (0) | 2022.07.26 |
---|---|
[selenium] return document.body.scrollHeight이 0일때 (0) | 2022.07.24 |