Playwright文件下载全攻略：从基础配置到高级并发处理-Seo优化-塔城地区网站建设公司

1. 项目概述：为什么我们需要一个“保姆级”的文件下载教程？

如果你正在用 Playwright 做自动化测试或者数据采集，迟早会遇到一个绕不开的需求：下载文件。这听起来简单，不就是点个按钮等文件下来吗？但实际干过就知道，这里面的坑多到能让你怀疑人生。文件保存路径乱码、下载弹窗拦截不了、大文件下载超时、甚至浏览器直接给你弹个“另存为”对话框让你脚本当场卡死……这些问题，官方文档往往一笔带过，或者散落在各个角落，新手第一次上手绝对会懵。

我自己在多个爬虫和自动化项目中，被文件下载折磨了不下十几次。从最初的page.on(‘download’)事件监听搞不明白，到后来能稳定处理各种刁钻的下载场景，踩过的坑足够写一本避坑指南。所以，这个“保姆级”教程，就是把我这些年趟过的雷、总结的经验，掰开了揉碎了讲给你听。我们不止讲“怎么做”，更要讲清楚“为什么这么做”，以及“遇到问题怎么办”。无论你是想批量下载图片、导出报表，还是处理需要登录才能下载的资源，这篇教程都能给你一套从环境搭建到实战落地的完整解决方案。

教程基于 Python 3.8+ 和 Playwright 的最新稳定版，确保你学到的不是过时的技巧。我们会从最基础的浏览器上下文配置讲起，一步步深入到高级的下载管理、错误处理和性能优化。目标只有一个：让你看完就能写出稳定、高效的 Playwright 文件下载脚本。

2. 环境配置与核心概念澄清

在开始写下载代码之前，一个干净、可控的环境是成功的基石。很多人环境没配好，后面各种稀奇古怪的问题就都来了。

2.1 Python 环境与 Playwright 安装

首先，确保你的 Python 版本是 3.8 或更高。我推荐使用虚拟环境来隔离项目依赖，这是 Python 开发的好习惯，能避免包版本冲突。

# 创建并激活虚拟环境（以 venv 为例） python -m venv playwright-env # Windows playwright-env\Scripts\activate # macOS/Linux source playwright-env/bin/activate # 安装 Playwright pip install playwright # 安装 Playwright 所需的浏览器内核（Chromium, Firefox, WebKit） playwright install

这里有个关键点：playwright install这个命令。它不仅仅是个安装，更是一个“浏览器二进制文件部署”的过程。它会下载对应操作系统的、经过 Playwright 团队测试和适配的浏览器版本。这意味着你获得的浏览器环境是确定且一致的，避免了因本地浏览器版本差异导致脚本行为不一致的问题。我强烈建议在 CI/CD 流水线中也执行这一步，确保测试环境的一致性。

2.2 理解“浏览器上下文”与“页面”

这是 Playwright 架构中最重要的两个概念，理解它们对文件下载至关重要。

浏览器（Browser）：对应一个真实的浏览器进程实例，比如你启动了 Chrome。
浏览器上下文（Browser Context）：这是 Playwright 的核心抽象。你可以把它想象成是一个独立的浏览器会话。每个上下文都拥有独立的缓存、Cookie、本地存储，并且可以配置独立的下载行为、权限（如地理位置）和网络代理。一个浏览器进程可以创建多个互不干扰的上下文。这对于需要多账号隔离或者并行执行不同任务的场景非常有用。
页面（Page）：对应一个浏览器标签页。一个上下文可以包含多个页面。

为什么强调这个？因为文件的下载行为是绑定在浏览器上下文（Browser Context）级别的，而不是页面（Page）级别。这意味着，你需要在一个上下文中设置好“允许自动下载”以及“指定下载路径”，那么这个上下文中所有页面触发的下载，都会遵循这个规则。如果你在页面级别去设置，是无效的。

2.3 配置允许自动下载的浏览器上下文

这是实现无人值守下载的关键一步。默认情况下，浏览器遇到下载链接会弹出“另存为”对话框，这会阻塞自动化脚本。

import asyncio from playwright.async_api import async_playwright async def main(): async with async_playwright() as p: # 启动浏览器，headless=False 便于调试 browser = await p.chromium.launch(headless=False) # 创建浏览器上下文，并启用自动下载 context = await browser.new_context( accept_downloads=True # 关键参数：允许自动下载 ) # 在上下文中创建页面 page = await context.new_page() # ... 后续的页面导航、点击操作 ... await browser.close() asyncio.run(main())

accept_downloads=True这个参数告诉 Playwright：“在这个上下文里，所有下载都不要弹窗，直接后台进行”。这是后续所有下载监听和处理的前提。

3. 核心下载流程与事件监听实战

环境配好了，现在进入核心环节：如何捕获并处理一个下载事件。

3.1 等待下载开始：`page.wait_for_download`

最常用、最可靠的方式是使用page.wait_for_download方法。它会等待当前页面触发下一个下载，并返回一个Download对象。

async def download_file(page, download_selector): """ 一个典型的下载函数 :param page: Playwright 页面对象 :param download_selector: 触发下载的按钮或链接的选择器 """ # 在点击下载按钮前，先启动“等待下载”的承诺 # 这行代码不会阻塞，它创建了一个未来的事件监听器 download_promise = page.wait_for_download() # 执行触发下载的操作（如点击按钮） await page.click(download_selector) # 等待下载真正开始，并获取下载对象 download = await download_promise # 打印下载信息 print(f"开始下载: {download.url}") print(f"建议文件名: {download.suggested_filename}") # 等待下载过程完成（网络传输结束） # 此时文件已下载到临时目录 await download.path() # 这个方法会阻塞，直到下载完成或失败 # 将文件保存到指定路径 # 这里使用 suggested_filename 作为文件名 save_path = f"./downloads/{download.suggested_filename}" await download.save_as(save_path) print(f"文件已保存至: {save_path}") return save_path

关键点解析：

顺序很重要：必须先调用page.wait_for_download()创建监听承诺，然后再执行触发下载的操作（如click）。如果顺序反了，脚本可能在监听器建立之前就触发了下载，导致wait_for_download永远等不到事件而超时。
download.path()：这个方法返回一个临时文件的路径（在 Playwright 管理的临时目录中）。调用await download.path()会阻塞当前协程，直到下载完成（成功或失败）。这是确保文件完整下载的关键。
download.save_as()：将已下载到临时位置的文件移动到你指定的最终路径。注意是“移动”而非“复制”，所以更高效。

3.2 使用事件监听器：`page.on(‘download’)`

另一种方式是使用事件监听模式，适合处理一个页面内可能发生多次、且时机不确定的下载。

async def handle_downloads_with_listener(page): # 创建一个列表来收集下载对象 downloads = [] def on_download(download): # 这个回调函数在下载开始时立即触发，不会阻塞主流程 print(f"检测到下载开始: {download.suggested_filename}") downloads.append(download) # 注册下载事件监听器 page.on('download', on_download) # 然后进行你的页面操作，可能会触发多次下载 await page.goto('https://example.com/downloads') await page.click('#batch-download-btn') # 等待一段时间，让所有下载都有机会触发 await page.wait_for_timeout(5000) # 等待5秒 # 处理所有收集到的下载 for download in downloads: try: # 等待单个下载完成 await download.path() save_path = f"./batch_downloads/{download.suggested_filename}" await download.save_as(save_path) print(f"已保存: {save_path}") except Exception as e: print(f"下载 {download.suggested_filename} 失败: {e}") # 最后，记得移除监听器（避免内存泄漏或重复监听） page.remove_listener('download', on_download)

注意事项：

page.on(‘download’)的回调是异步触发的，主流程不会等待。所以你需要自己管理下载对象的集合和后续的等待逻辑。
这种方式在需要并发处理多个下载，或者下载触发时机比较分散时更有用。
务必记得在不需要时移除监听器，尤其是在长时间运行或创建多个页面的脚本中，避免内存泄漏。

4. 高级配置与实战避坑指南

掌握了基础流程，我们来看看如何应对更复杂的情况和那些常见的“坑”。

4.1 自定义下载保存目录

默认情况下，下载的文件会保存在一个临时的、随机的系统目录。我们通常希望文件能归类保存。

import os from pathlib import Path async def set_custom_download_path(context, base_path="./my_downloads"): # 确保基础目录存在 Path(base_path).mkdir(parents=True, exist_ok=True) # 方法1：在创建上下文时指定（推荐，最清晰） context = await browser.new_context( accept_downloads=True, # 使用 `downloads_path` 参数 downloads_path=os.path.abspath(base_path) # 建议使用绝对路径 ) # 方法2：后续通过 `page._impl_obj._downloads_path` 查看，但无法动态修改 # 所以最好在创建时就定好。

注意：downloads_path设置的是 Playwright 内部用于存储下载中临时文件的目录。当你调用download.save_as(“new/path/file.pdf”)时，文件会从这个临时目录移动到new/path/file.pdf。因此，即使设置了downloads_path，你仍然需要通过save_as来最终决定文件的存放位置和名称。downloads_path更像是一个“暂存区”。

4.2 处理下载弹窗与权限请求

有些网站为了“安全”，会先弹出一个确认对话框，或者请求额外的权限（如“是否允许下载多个文件”）。Playwright 可以自动处理这些。

context = await browser.new_context( accept_downloads=True, # 自动接受权限请求，如下载、地理位置、通知等 permissions=['downloads'], # 明确授予下载权限 # 视情况还可以添加其他权限，如 'geolocation' # 绕过某些网站的下载确认对话框（如果它是JavaScript alert/confirm） # 但注意，这不是万能的，对于复杂的自定义模态框可能无效 # 更通用的方法是使用 page.on('dialog') 监听并处理 ) # 处理JavaScript对话框的例子 page.on('dialog', lambda dialog: dialog.accept()) # 自动接受所有对话框

避坑点：不是所有的弹窗都是浏览器的标准alert/confirm。很多网站使用自定义的 DIV 模态框。对于这种，page.on(‘dialog’)是无效的。你需要用 Playwright 的选择器去定位并点击那个自定义弹窗里的“确定”按钮。这需要你具体分析目标网站的 DOM 结构。

4.3 下载超时、失败与重试机制

网络不稳定或服务器慢，可能导致下载超时。Playwright 的默认超时时间可能不够。

async def robust_download(page, selector, retries=3, timeout=120000): """一个带重试机制的下载函数""" for attempt in range(retries): try: # 设置更长的等待超时 download_promise = page.wait_for_download(timeout=timeout) await page.click(selector) download = await download_promise # 等待下载完成，同样可以设置超时 # download.path() 内部使用 page 的默认超时，可以通过设置 page.set_default_timeout 全局调整 # 或者，我们通过 asyncio.wait_for 来包装 try: # 等待下载完成，最多2分钟 await asyncio.wait_for(download.path(), timeout=120.0) except asyncio.TimeoutError: print(f"第{attempt+1}次尝试：下载 {download.suggested_filename} 超时，取消并重试...") await download.cancel() # 取消当前下载 continue # 进入下一次重试循环 # 下载成功，保存文件 save_path = f"./downloads/{download.suggested_filename}" await download.save_as(save_path) print(f"下载成功: {save_path}") return save_path except Exception as e: print(f"第{attempt+1}次尝试失败，错误: {e}") if attempt == retries - 1: print(f"下载 {selector} 失败，已重试{retries}次。") raise # 重试次数用尽，抛出异常 await asyncio.sleep(2 ** attempt) # 指数退避等待 return None

关键技巧：

设置超时：为wait_for_download()和download.path()设置合理的超时。大文件需要更长的时间。
指数退避：重试时等待时间逐渐增加（如 1秒，2秒，4秒…），避免对服务器造成压力。
取消下载：在重试前，调用download.cancel()清理未完成的下载，释放资源。

4.4 文件命名冲突与路径安全

直接使用suggested_filename可能会遇到重名文件被覆盖，或者文件名包含非法字符的问题。

import re from datetime import datetime def safe_filename(download, custom_prefix=None): """ 生成一个安全的文件名。 :param download: Download 对象 :param custom_prefix: 可选的自定义前缀 :return: 安全的文件名字符串 """ # 1. 获取建议的文件名 original_name = download.suggested_filename # 2. 清理非法字符（Windows/Linux/Unix 的非法字符略有不同，这里取一个并集） # 移除或替换文件名中的非法字符 illegal_chars = r'[<>:"/\\|?*\x00-\x1f]' # 包含控制字符 safe_name = re.sub(illegal_chars, '_', original_name) # 3. 避免文件名过长（某些系统有路径长度限制） if len(safe_name) > 200: name, ext = os.path.splitext(safe_name) safe_name = name[:200-len(ext)] + ext # 4. 添加时间戳或UUID防止冲突（可选） if custom_prefix: timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") # 例如: myreport_20231026_143022_report.pdf safe_name = f"{custom_prefix}_{timestamp}_{safe_name}" return safe_name # 使用示例 async def download_with_safe_name(page, selector): download_promise = page.wait_for_download() await page.click(selector) download = await download_promise await download.path() final_filename = safe_filename(download, custom_prefix="report") save_path = f"./downloads/{final_filename}" # 确保目标目录存在 os.makedirs(os.path.dirname(save_path), exist_ok=True) # 检查文件是否已存在，若存在则追加序号 counter = 1 base, ext = os.path.splitext(save_path) while os.path.exists(save_path): save_path = f"{base}_{counter}{ext}" counter += 1 await download.save_as(save_path) return save_path

这个safe_filename函数处理了非法字符、长度限制，并通过添加时间戳和冲突检查，极大地增强了文件保存的鲁棒性。

5. 复杂场景实战：登录态、动态内容与并发下载

5.1 携带登录态进行下载

很多文件下载需要先登录。Playwright 的上下文（Context）完美支持这一点。

async def download_with_login(site_url, login_selector, download_selector): async with async_playwright() as p: browser = await p.chromium.launch(headless=True) # 生产环境可以用 headless # 创建第一个上下文用于登录 login_context = await browser.new_context() login_page = await login_context.new_page() await login_page.goto(f"{site_url}/login") # 假设是表单登录 await login_page.fill('#username', 'your_username') await login_page.fill('#password', 'your_password') await login_page.click('#submit-btn') # 等待登录成功，例如跳转到首页或出现用户菜单 await login_page.wait_for_selector('#user-menu', state='visible') print("登录成功！") # **关键步骤：保存登录状态（Cookie、Storage）** # 将登录上下文的状态存储下来 storage_state = await login_context.storage_state() # 关闭登录上下文（可选，节省资源） await login_context.close() # 创建一个新的、配置了下载的上下文，并注入之前保存的登录状态 download_context = await browser.new_context( accept_downloads=True, downloads_path='./secure_downloads', storage_state=storage_state # 注入状态，恢复登录会话 ) download_page = await download_context.new_page() await download_page.goto(f"{site_url}/files") # 现在页面已经处于登录状态，可以直接触发下载 download_promise = download_page.wait_for_download() await download_page.click(download_selector) download = await download_promise # ... 后续的等待和保存操作 ... await download_context.close() await browser.close()

原理：storage_state保存了当前上下文的 Cookie、LocalStorage 和 SessionStorage。将其传递给新的上下文，相当于让新浏览器“继承”了所有的登录凭证，无需重复登录。这对于需要保持会话的下载任务非常高效。

5.2 处理动态生成下载链接

有些文件的下载链接不是静态的，而是由 JavaScript 动态生成，甚至需要先提交一个表单。

async def handle_dynamic_download(page): # 场景1：点击按钮后，JS生成一个临时下载链接并触发 # 方法：正常使用 wait_for_download 即可，Playwright 能捕获到最终发起的网络请求 download_promise = page.wait_for_download() await page.click('#generate-and-download-btn') # 即使按钮点击后JS才生成链接，wait_for_download也能正常工作 download = await download_promise # 场景2：需要先填写表单（如日期范围），提交后服务器生成文件供下载 await page.fill('#start-date', '2023-01-01') await page.fill('#end-date', '2023-12-31') # 提交表单，通常会触发页面跳转或新窗口下载 async with page.expect_download() as download_info: # 这是 wait_for_download 的上下文管理器写法 await page.click('#export-submit-btn') download = await download_info.value # ... 处理下载 ... # 场景3：下载链接在 iframe 里 # 先定位到 iframe 元素 frame = page.frame_locator('iframe[name="download-frame"]') # 然后在 frame 的上下文中操作和等待下载 download_promise = page.wait_for_download() # 注意：下载事件仍在主页面对象上监听 await frame.locator('#download-link').click() download = await download_promise

核心：无论链接如何动态生成，只要最终浏览器发起了对文件资源的网络请求，page.wait_for_download()就能捕获到。你需要确保在请求发生之前就启动监听。

5.3 有限并发下载控制

同时发起太多下载可能会压垮服务器或本地网络，我们需要控制并发数。

import asyncio from asyncio import Semaphore async def download_worker(page, url, selector, semaphore): """一个下载工作协程""" async with semaphore: # 信号量控制并发 print(f"开始处理: {url}") download_promise = page.wait_for_download() await page.goto(url) # 假设每个页面结构相同，用同一个选择器触发下载 await page.click(selector) download = await download_promise await download.path() filename = download.suggested_filename await download.save_as(f"./concurrent_downloads/{filename}") print(f"完成: {filename}") return filename async def batch_download_concurrently(url_list, selector, max_concurrent=3): """批量并发下载控制器""" async with async_playwright() as p: browser = await p.chromium.launch(headless=True) # 为所有任务创建一个共享的上下文（注意会话隔离） context = await browser.new_context(accept_downloads=True) semaphore = Semaphore(max_concurrent) # 控制最大并发数 tasks = [] for url in url_list: # 每个任务使用独立的页面，但共享同一个上下文（因此共享下载设置和Cookie等） page = await context.new_page() # 创建下载任务 task = download_worker(page, url, selector, semaphore) tasks.append(task) # 等待所有下载任务完成 results = await asyncio.gather(*tasks, return_exceptions=True) # 处理结果 for url, result in zip(url_list, results): if isinstance(result, Exception): print(f"URL {url} 下载失败: {result}") else: print(f"URL {url} 下载成功: {result}") await context.close() await browser.close() # 使用示例 urls = ['https://site.com/file1', 'https://site.com/file2', ...] # 多个下载页面的URL await batch_download_concurrently(urls, selector='#downloadButton', max_concurrent=2)

这个模式使用了asyncio.Semaphore来限制同时进行的下载任务数量。每个任务在独立的 Page 中运行，但共享同一个 Browser Context，这样既做到了基本的任务隔离，又避免了为每个任务都创建全新浏览器实例的开销。

6. 常见问题排查与调试技巧

即使按照教程操作，你可能还是会遇到问题。这里是一些常见问题的排查清单。

6.1 下载完全不触发

检查accept_downloads=True：确认是在browser.new_context()时设置的，而不是browser.new_page()。
检查监听顺序：确保page.wait_for_download()的调用在触发下载的操作（如click()）之前。
检查选择器：触发下载的元素真的点到了吗？用page.click(selector, timeout=5000)并捕获异常，或者先用page.screenshot()看看页面状态。
检查网络请求：打开开发者工具（在启动浏览器时设置devtools=True），查看点击后是否有文件资源的网络请求发出。可能下载是通过新窗口或表单提交触发的，需要调整监听方式。
等待页面稳定：在点击下载按钮前，确保动态内容已加载。可以加page.wait_for_load_state(‘networkidle’)或等待特定元素出现。

6.2 下载卡住或超时

增加超时时间：page.wait_for_download(timeout=60000)和page.set_default_timeout(120000)。
检查文件大小：如果是超大文件，网络传输本身就需要很长时间。考虑在服务器端打包压缩，或者实现分块下载与断点续传（这需要更复杂的自定义逻辑）。
检查磁盘空间：目标磁盘是否已满？
查看下载对象状态：在等待download.path()时，可以定期打印download.url和download.suggested_filename，或者用page.on(‘download’, …)监听下载进度（Playwright API 不直接暴露进度，但你可以通过下载开始和完成事件来估算）。

6.3 文件名乱码或保存失败

使用安全的文件名函数：参考前面safe_filename的例子，清理非法字符。
指定完整路径：使用os.path.abspath()确保保存路径是绝对路径，避免相对路径引起的歧义。
检查目录权限：确保程序有权限在目标目录创建和写入文件。
手动指定文件名：如果suggested_filename是乱码，可以尝试从响应头Content-Disposition中解析（通过download.url和网络拦截等方式，较复杂），或者根据内容自己生成文件名。

6.4 调试与日志记录

在关键节点添加日志，能快速定位问题。

import logging logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') async def debug_download(page, selector): logging.info(f"准备点击下载选择器: {selector}") # 监听所有页面请求和响应（谨慎使用，日志量会很大） # page.on('request', lambda request: logging.debug(f">> {request.method} {request.url}")) # page.on('response', lambda response: logging.debug(f"<< {response.status} {response.url}")) # 专门监听可能下载的响应 def log_response(response): content_type = response.headers.get('content-type', '') if 'application/octet-stream' in content_type or 'attachment' in response.headers.get('content-disposition', ''): logging.info(f"检测到可能的下载响应: {response.url} (Type: {content_type})") page.on('response', log_response) download_promise = page.wait_for_download() await page.click(selector) try: download = await asyncio.wait_for(download_promise, timeout=30) logging.info(f"下载已开始: {download.suggested_filename} from {download.url}") file_path = await asyncio.wait_for(download.path(), timeout=120) logging.info(f"下载完成，临时文件: {file_path}") # ... 保存操作 ... except asyncio.TimeoutError: logging.error("等待下载超时") # 可以在这里截图当前页面状态 await page.screenshot(path='timeout_state.png') raise finally: # 记得移除监听器 page.remove_listener('response', log_response)

最后，也是最实用的技巧：当你遇到无法理解的下载行为时，尝试用headless=False模式运行脚本，亲眼看看浏览器里发生了什么。很多时候，问题就出在一个意想不到的确认对话框、一个页面跳转或者一个动态加载的组件上。眼见为实，这是调试 Playwright 脚本的黄金法则。

Playwright文件下载全攻略：从基础配置到高级并发处理

1. 项目概述：为什么我们需要一个“保姆级”的文件下载教程？

2. 环境配置与核心概念澄清

2.1 Python 环境与 Playwright 安装

2.2 理解“浏览器上下文”与“页面”

2.3 配置允许自动下载的浏览器上下文

3. 核心下载流程与事件监听实战

3.1 等待下载开始：`page.wait_for_download`

3.2 使用事件监听器：`page.on(‘download’)`

4. 高级配置与实战避坑指南

4.1 自定义下载保存目录

4.2 处理下载弹窗与权限请求

4.3 下载超时、失败与重试机制

4.4 文件命名冲突与路径安全

5. 复杂场景实战：登录态、动态内容与并发下载

5.1 携带登录态进行下载

5.2 处理动态生成下载链接

5.3 有限并发下载控制

6. 常见问题排查与调试技巧

6.1 下载完全不触发

6.2 下载卡住或超时

6.3 文件名乱码或保存失败

6.4 调试与日志记录

Faster RCNN目标检测算法解析与优化实践

工科生如何用好拓竹A1C 3D打印机：从开箱到项目实战全流程指南

OpenCV 4.8 同态滤波详解：1个算法解决光照不均与细节增强

OpenCV阈值处理原理与五种模式源码解析

Wazuh漏洞扫描Feed配置指南：从原理到实战优化

量子位置验证协议原理与工程实践

1. 项目概述：为什么我们需要一个“保姆级”的文件下载教程？

2. 环境配置与核心概念澄清

2.1 Python 环境与 Playwright 安装

2.2 理解“浏览器上下文”与“页面”

2.3 配置允许自动下载的浏览器上下文

3. 核心下载流程与事件监听实战

3.1 等待下载开始：page.wait_for_download

3.2 使用事件监听器：page.on(‘download’)

4. 高级配置与实战避坑指南

4.1 自定义下载保存目录

4.2 处理下载弹窗与权限请求

4.3 下载超时、失败与重试机制

4.4 文件命名冲突与路径安全

5. 复杂场景实战：登录态、动态内容与并发下载

5.1 携带登录态进行下载

5.2 处理动态生成下载链接

5.3 有限并发下载控制

6. 常见问题排查与调试技巧

6.1 下载完全不触发

6.2 下载卡住或超时

6.3 文件名乱码或保存失败

6.4 调试与日志记录

Faster RCNN目标检测算法解析与优化实践

工科生如何用好拓竹A1C 3D打印机：从开箱到项目实战全流程指南

OpenCV 4.8 同态滤波详解：1个算法解决光照不均与细节增强

OpenCV阈值处理原理与五种模式源码解析

Wazuh漏洞扫描Feed配置指南：从原理到实战优化

量子位置验证协议原理与工程实践

3.1 等待下载开始：`page.wait_for_download`

3.2 使用事件监听器：`page.on(‘download’)`