«

使用Python和Selenium库编写的自动化脚本,用于打开百度新闻并提取当日新闻摘要

IT中华 发布于 阅读:168


首先,确保已经安装了Selenium库。可以使用以下命令进行安装:

pip install selenium

然后,使用以下代码编写脚本:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

# 创建一个Chrome浏览器实例
driver = webdriver.Chrome()

# 打开百度新闻网页
driver.get("https://news.baidu.com/")

# 等待新闻列表加载完成
news_list = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.CLASS_NAME, "ulist-focus-news"))
)

# 获取当日新闻摘要
news_items = news_list.find_elements(By.TAG_NAME, "li")
for item in news_items:
    title = item.find_element(By.TAG_NAME, "a").text
    summary = item.find_element(By.CLASS_NAME, "c-summary").text
    print("标题:", title)
    print("摘要:", summary)
    print("")

# 关闭浏览器
driver.quit()

这个脚本首先创建了一个Chrome浏览器实例,然后使用get()方法打开了百度新闻网页。接下来,使用WebDriverWait等待新闻列表加载完成,并使用find_elements()方法获取新闻列表中的所有新闻项。然后,遍历每个新闻项,使用find_element()方法获取标题和摘要,并打印输出。

最后,使用quit()方法关闭浏览器。

请注意,这个脚本需要安装Chrome浏览器以及对应版本的ChromeDriver驱动程序。可以从ChromeDriver官方网站(https://sites.google.com/a/chromium.org/chromedriver/)下载适合自己Chrome浏览器版本的驱动程序,并将驱动程序所在路径添加到系统的环境变量中

推荐阅读:


扫描二维码,在手机上阅读