使用Python和Selenium库编写的自动化脚本,用于打开百度新闻并提取当日新闻摘要
Fate 发布于 阅读:216
首先,确保已经安装了Selenium库。可以使用以下命令进行安装:
pip install selenium
然后,使用以下代码编写脚本:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()
# 打开百度新闻网页
driver.get("https://news.baidu.com/")
# 等待新闻列表加载完成
news_list = WebDriverWait(driver, 10).until(
EC.presence_of_element_located((By.CLASS_NAME, "ulist-focus-news"))
)
# 获取当日新闻摘要
news_items = news_list.find_elements(By.TAG_NAME, "li")
for item in news_items:
title = item.find_element(By.TAG_NAME, "a").text
summary = item.find_element(By.CLASS_NAME, "c-summary").text
print("标题:", title)
print("摘要:", summary)
print("")
# 关闭浏览器
driver.quit()
这个脚本首先创建了一个Chrome浏览器实例,然后使用get()方法打开了百度新闻网页。接下来,使用WebDriverWait等待新闻列表加载完成,并使用find_elements()方法获取新闻列表中的所有新闻项。然后,遍历每个新闻项,使用find_element()方法获取标题和摘要,并打印输出。
最后,使用quit()方法关闭浏览器。
请注意,这个脚本需要安装Chrome浏览器以及对应版本的ChromeDriver驱动程序。可以从ChromeDriver官方网站(https://sites.google.com/a/chromium.org/chromedriver/)下载适合自己Chrome浏览器版本的驱动程序,并将驱动程序所在路径添加到系统的环境变量中。
推荐阅读: