牛骨文教育服务平台(让学习变的简单)
博文笔记

Python爬虫实战入门四:使用Cookie模拟登录—获取电子书下载链接

创建时间:2018-08-30 投稿人: 浏览次数:354

在实际情况中,很多网站的内容都是需要登录之后才能看到,如此我们就需要进行模拟登录,使用登录后的状态进行爬取。这里就需要使用到Cookie。

现在大多数的网站都是使用Cookie跟踪用户的登录状态,一旦网站验证了登录信息,就会将登录信息保存在浏览器的cookie中。网站会把这个cookie作为验证的凭据,在浏览网站的页面是返回给服务器。

因为cookie是保存在本地的,自然cookie就可以进行篡改和伪造,暂且不表,我们先来看看Cookie长什么样子。

打开网页调试工具,随便打开一个网页,在“network”选项卡,打开一个链接,在headers里面:

Python爬虫实战入门四:使用Cookie模拟登录—获取电子书下载链接

Cookie

声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。