Python3网络爬虫开发实战
  • Introduction
  • 0-目录
  • 0.0-前言
  • 0.1-序一
  • 0.3-序二
  • 1-开发环境配置
  • 1.1-Python3的安装
  • 1.2-请求库的安装
  • 1.3-解析库的安装
  • 1.4-数据库的安装
  • 1.5-存储库的安装
  • 1.6-Web库的安装
  • 1.7-App爬取相关库的安装
  • 1.8-爬虫框架的安装
  • 1.9-部署相关库的安装
  • 2-爬虫基础
  • 2.1-HTTP基本原理
  • 2.2-Web网页基础
  • 2.3-爬虫基本原理
  • 2.4-会话和Cookies
  • 2.5-代理基本原理
  • 3-基本库的使用
  • 3.1-使用urllib
  • 3.2-使用requests
  • 3.3-正则表达式
  • 3.4-爬取猫眼电影排行
  • 4-解析库的使用
  • 4.1-XPath的使用
  • 4.2-BeautifulSoup的使用
  • 4.3-pyquery的使用
  • 5-数据存储
  • 5.1-文件存储
  • 5.2-关系型数据库存储
  • 5.3-非关系型数据库存储
  • 6-Ajax数据爬取
  • 6.1-什么是Ajax
  • 6.2-Ajax分析方法
  • 6.3-Ajax结果提取
  • 6.4-分析Ajax爬取今日头条街拍美图
  • 7-动态渲染页面抓取
  • 7.1-Selenium的使用
  • 7.2-Splash的使用
  • 7.3-Splash负载均衡配置
  • 7.4-使用Selenium爬取淘宝商品
  • 8-验证码的识别
  • 8.1-图形验证码的识别
  • 8.2-极验滑动验证码识别
  • 8.3-点触验证码识别
  • 8.4-微博宫格验证码识别
  • 9-代理的使用
  • 9.1-代理的设置
  • 9.2-代理池的维护
  • 9.3-付费代理的使用
  • 9.4-ADSL代理的使用
  • 9.5-使用代理爬取微信公众号文章
  • 10-模拟登录
  • 10.1-模拟登录并爬取GitHub
  • 10.2-Cookies池的搭建
  • 11-APP的爬取
  • 11.1-Charles的使用
  • 11.2-mitmproxy的使用
  • 11.3-mitmdump爬取“得到”App电子书信息
  • 11.4-Appium的使用
  • 11.5-Appium爬取微信朋友圈
  • 11.6-Appium+mitmdump爬取京东商品评论
  • 12-pyspider框架的使用
  • 12.1-pyspider框架介绍
  • 12.2-pyspider基本使用
  • 12.3-pyspider用法详解
  • 13-Scrapy框架的使用
  • 13.1-Scrapy框架介绍
  • 13.2-Scrapy入门
  • 13.3-Selector的用法
  • 13.4-Spider的用法
  • 13.5-Downloader Middleware的用法
  • 13.6-Spider Middleware的用法
  • 13.7-Item Pipeline的用法
  • 13.8-Scrapy对接Selenium
  • 13.9-Scrapy对接Splash
  • 13.10-Scrapy通用爬虫
  • 13.11-Scrapyrt的使用
  • 13.12-Scrapy对接Docker
  • 13.13-Scrapy爬取新浪微博
  • 14-分布式爬虫
  • 14.1-分布式爬虫理念
  • 14.2-Scrapy-Redis源码解析
  • 14.3-Scrapy分布式实现
  • 14.4-Bloom Filter的对接
  • 15-分布式爬虫的部署
  • 15.1-Scrapyd分布式部署
  • 15.2-Scrapyd-Client的使用
  • 15.3-Scrapyd对接Docker
  • 15.4-Scrapyd批量部署
  • 15.5-Gerapy分布式管理
Powered by GitBook
On this page
  • 1.5.1 PyMySQL 的安装
  • 1. 相关链接
  • 2. pip 安装
  • 3. 验证安装
  • 1.5.2 PyMongo 的安装
  • 1. 相关链接
  • 2. pip 安装
  • 3. 验证安装
  • 1.5.3 redis-py 的安装
  • 1. 相关链接
  • 2. pip 安装
  • 3. 验证安装
  • 1.5.4 RedisDump 的安装
  • 1. 相关链接
  • 2. 安装 Ruby
  • 3. gem 安装
  • 4. 验证安装

Was this helpful?

1.5-存储库的安装

Previous1.4-数据库的安装Next1.6-Web库的安装

Last updated 5 years ago

Was this helpful?

1.4 节中,我们介绍了几个数据库的安装方式,但这仅仅是用来存储数据的数据库,它们提供了存储服务,但如果想要和 Python 交互的话,还需要安装一些 Python 存储库,如 MySQL 需要安装 PyMySQL,MongoDB 需要安装 PyMongo 等。本节中,我们来说明一下这些存储库的安装方式。

1.5.1 PyMySQL 的安装

在 Python 3 中,如果想要将数据存储到 MySQL 中,就需要借助 PyMySQL 来操作,本节中我们介绍一下它的安装方式。

1. 相关链接

  • GitHub:

  • 官方文档:

  • PyPI:

2. pip 安装

这里推荐使用 pip 安装,命令如下:

pip3 install pymysql

执行完命令后即可完成安装。

3. 验证安装

为了验证库是否已经安装成功,可以在命令行下测试一下。这里首先输入 python3,进入命令行模式,接着输入如下内容:

$ python3
>>> import pymysql
>>> pymysql.VERSION
(0, 7, 11, None)
>>>

如果成功输出了其版本内容,那么证明 PyMySQL 成功安装。

1.5.2 PyMongo 的安装

在 Python 中,如果想要和 MongoDB 进行交互,就需要借助于 PyMongo 库,这里就来了解一下它的安装方法。

1. 相关链接

2. pip 安装

这里推荐使用 pip 安装,命令如下:

pip3 install pymongo

运行完毕之后,即可完成 PyMongo 的安装。

3. 验证安装

为了验证 PyMongo 库是否已经安装成功,可以在命令行下测试一下:

$ python3
>>> import pymongo
>>> pymongo.version
'3.4.0'
>>>

如果成功输出了其版本内容,那么证明成功安装。

1.5.3 redis-py 的安装

对于 Redis 来说,我们要使用 redis-py 库来与其交互,这里就来介绍一下它的安装方法。

1. 相关链接

2. pip 安装

这里推荐使用 pip 安装,命令如下:

pip3 install redis

运行完毕之后,即可完成 redis-py 的安装。

3. 验证安装

为了验证 redis-py 库是否已经安装成功,可以在命令行下测试一下:

$ python3
>>> import redis
>>> redis.VERSION
(2, 10, 5)
>>>

如果成功输出了其版本内容,那么证明成功安装了 redis-py。

1.5.4 RedisDump 的安装

RedisDump 是一个用于 Redis 数据导入 / 导出的工具,是基于 Ruby 实现的,所以要安装 RedisDump,需要先安装 Ruby。

1. 相关链接

2. 安装 Ruby

3. gem 安装

安装完成之后,就可以执行 gem 命令了,它类似于 Python 中的 pip 命令。利用 gem 命令,我们可以安装 RedisDump,具体如下:

gem install redis-dump

执行完毕之后,即可完成 RedisDump 的安装。

4. 验证安装

安装成功后,就可以执行如下两个命令:

redis-dump  
redis-load

如果可以成功调用,则证明安装成功。

GitHub:

官方文档:

PyPI:

GitHub:

官方文档:

GitHub:

官方文档:

有关 Ruby 的安装方式可以参考 ,这里列出了所有平台的所有安装方式,可以根据对应的平台选用合适的安装方式。

https://github.com/PyMySQL/PyMySQL
http://pymysql.readthedocs.io/
https://pypi.python.org/pypi/PyMySQL
https://github.com/mongodb/mongo-python-driver
https://api.mongodb.com/python/current/
https://pypi.python.org/pypi/pymongo
https://github.com/andymccurdy/redis-py
https://redis-py.readthedocs.io/
https://github.com/delano/redis-dump
http://delanotes.com/redis-dump
http://www.ruby-lang.org/zh_cn/documentation/installation