一个前端,爱跑步、爱吉他、爱做饭、爱生活、爱编程、爱南芳姑娘,爱我所爱。世间最温暖又无价的是阳光、空气与爱,愿它们能带你去更远的地方。

  • 文章
  • 心情
  • 照片墙
  • 留言板
  • 工具
  • 友链
  • biaoblog

    专注web开发技术分享

    Linux下如何安装使用puppeteer

    技术 194 2021-03-18 10:03

    前提:

    我需要用puppeteer实现抓取并下载百度图片中指定关键词的前100张图片,

    程序在本地(Windows)下可以正常运行,

    但是部署到服务器(Linux)上 就总是报错:cannot find module 'puppeteer'或是'failed to launch the browser porcess!' 。

    诸如此类的报错,虽然知道是和puppeteer的安装有关,

    但是一直没找到如何在Linux下正确的安装(Windows下如果使用npm安装不成功,可以使用cnpm安装),

    以下是在掘金上找到的一个方法,亲测有效,记录一下。


    1、先将项目上传到Linux下,然后先npm install安装项目所需依赖,会报错cannot find module 'puppeteer',接下来开始安装puppeteer

    2、忽略Chromium安装puppeteer

    npm install puppeteer --ignore-scripts --save

    3、下载一个Chromium放到指定位置

    3.1 在node_modules/puppeteer/package.json中puppeteer.chromium_revision获得具体版本编号

    像我的编号就是722234

    3.2 下载对应编号的Chromium。各平台的下载地址如下,需要将%d替换成你查找到的编号,比如我的下载地址为:https://storage.googleapis.com/chromium-browser-snapshots/Linux_x64/722234/chrome-linux.zip


    linux: 'https://storage.googleapis.com/chromium-browser-snapshots/Linux_x64/%d/chrome-linux.zip',

    mac: 'https://storage.googleapis.com/chromium-browser-snapshots/Mac/%d/chrome-mac.zip',

    win32: 'https://storage.googleapis.com/chromium-browser-snapshots/Win/%d/chrome-win32.zip',

    win64: 'https://storage.googleapis.com/chromium-browser-snapshots/Win_x64/%d/chrome-win32.zip'


    3.3 下载后将压缩包上传到服务器,存储位置为node_modules/puppeteer/.local-chromium/linux-%d,然后解压即可

    ps: .local-chromium/linux-%d文件夹需要自己创建,同样将%d替换为具体编号

    4、安装相关依赖(测试的时候不安装也正常运行了……)

    #依赖库

    yum install pango.x86_64 libXcomposite.x86_64 libXcursor.x86_64 libXdamage.x86_64 libXext.x86_64 libXi.x86_64 libXtst.x86_64 cups-libs.x86_64 libXScrnSaver.x86_64 libXrandr.x86_64 GConf2.x86_64 alsa-lib.x86_64 atk.x86_64 gtk3.x86_64 nss.x86_64 -y

    #字体

    yum install ipa-gothic-fonts xorg-x11-fonts-100dpi xorg-x11-fonts-75dpi xorg-x11-utils xorg-x11-fonts-cyrillic xorg-x11-fonts-Type1 xorg-x11-fonts-misc -y

    用yum安装,不要用npm,因为我用npm报错了……

    5、修改代码

    以下三处红框框出来的代码必须要添加,headless必须设为true(无头模式),pathToExtension处的地址修改为自己前面安装的Chromium地址就行

    6、都弄好后,再在xshell里测试就发现测试成功了

    【补充】在最新一次安装puppeteer运行程序后报错,我在2020-4-23安装的puppeteer时版本已经是3以上了,安装的Chromium版本是737027,在网上查了很多资料都没有找到解决办法,最后决定回退到puppeteer@2.1.1,因为此时的Chromium版本是722234

    1)删除puppeteer

    npm uninstall puppeteer

    2)重新安装2.1.1版本的puppeteer

    npm install puppeteer@2.1.1 --ignore-scripts --save

    3)后面的步骤再像前面记录的那样走就行了

    最后在运行就没有报这个错误了


    参考地址:https://juejin.im/post/5db69d8b6fb9a020462c61bf

    文章评论

    评论列表(0