Python模拟百度登录实例

创建时间：2016-07-10 投稿人：浏览次数：1854

原文：http://www.jb51.net/article/78406.htm

记录下来，慢慢学习：

要先获取token，然后再登录

#
 -*- coding: utf8 -*-

import


urllib2

import


urllib

import


cookielib

import

re

import

bs4

URL_BAIDU_INDEX

=

"http://www.baidu.com/";

#https://passport.baidu.com/v2/api/?getapi&class=login&tpl=mn&tangram=true
 也可以用这个

URL_BAIDU_TOKEN

=


"https://passport.baidu.com/v2/api/?getapi&tpl=pp&apiver=v3&class=login"

;

URL_BAIDU_LOGIN

=


"https://passport.baidu.com/v2/api/?login"

; #设置用户名、密码

username

=

"";

password

=

"";

#设置cookie，这里cookiejar可自动管理，无需手动指定

cj

=


cookielib.CookieJar();

opener

=


urllib2.build_opener(urllib2.HTTPCookieProcessor(cj));

urllib2.install_opener(opener);

reqReturn

=


urllib2.urlopen(URL_BAIDU_INDEX);

#获取token,

tokenReturn

=


urllib2.urlopen(URL_BAIDU_TOKEN);

matchVal

=


re.search(u

""token"
 : "(?P<tokenVal>.*?)""

,tokenReturn.read());

tokenVal

=


matchVal.group(

"tokenVal"); #构造登录请求参数，该请求数据是通过抓包获得，对应https://passport.baidu.com/v2/api/?login请求

postData

=

"username"


: username,

"password"


: password,

"u"

"https://passport.baidu.com/", "tpl"

"pp", "token"


: tokenVal,

"staticpage"

"https://passport.baidu.com/static/passpc-account/html/v3Jump.html", "isPhone"

"false", "charset"

"UTF-8", "callback"

"parent.bd__pcbs__ra48vi" };

postData

=


urllib.urlencode(postData);

#发送登录请求

loginRequest

=


urllib2.Request(URL_BAIDU_LOGIN,postData);

loginRequest.add_header("Accept","text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8"); loginRequest.add_header("Accept-Encoding","gzip,deflate,sdch"); loginRequest.add_header("Accept-Language","zh-CN,zh;q=0.8"); loginRequest.add_header("User-Agent",

"Mozilla/5.0
 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.72 Safari/537.36"

); loginRequest.add_header("Content-Type","application/x-www-form-urlencoded");

sendPost

=


urllib2.urlopen(loginRequest);

#查看贴吧个人主页
 ，测试是否登陆成功，由于cookie自动管理，这里处理起来方便很多

#http://tieba.baidu.com/home/main?un=XXXX&fr=index
 这个是贴吧个人主页，各项信息都可以在此找到链接

teibaUrl

=


"http://tieba.baidu.com/f/like/mylike?v=1387441831248"

content

=


urllib2.urlopen(teibaUrl).read();

content

=


content.decode(

"gbk").encode("utf8"); print


content;

#解析数据，用的BeautifulSoup4，感觉没有jsoup用的爽

soup

=


bs4.BeautifulSoup(content);

list


soup.findAll(

"tr"); list


list

[1:len


            
                            
            声明：该文观点仅代表作者本人，牛骨文系教育信息发布平台，牛骨文仅提供信息存储空间服务。
            
                
                    上一篇：
			
				百度URL参数解析			
                    下一篇：
			
				php导出CSV时，超长数字精度丢失问题与前导0的字符串丢失0的问题解决


        
            
                                    
                                
                
                
            

                        
                热门文章
                                
			
				CTF writeup 2_南邮网络攻防训...
                                
			
				SSM框架——详细整合教程（...
                                
			
				Linux Shell脚本编程－－curl命...
                                
			
				HttpClient使用详解			
                                
			
				Java面试题全集（上）			
                                
			
				JAVA设计模式之单例模式			
                                
			
				java.lang.OutOfMemoryError: PermGen ...
                                
			
				TCP协议中的三次握手和四次...
                                
			
				form表单的两种提交方式，su...
                                
			
				String,StringBuffer与StringBuilder...
                            
            
                        
                最新文章 
                                Java之品优购课程讲义_day20（7）
                                剑指 Offer - 8：跳台阶
                                Netty权威指南_札记02_NIO编程
                                mysql时间属性之时间戳和datetime之...
                                虚拟现实或许可以拯救古埃及的“...
                                spring cloud服务注册中心eureka---集群...
                                Java SE 第六章
                                HTTP请求+数据库
                                HIDL学习笔记之HIDL C++（第二天）
                                ubuntu系统下指定tomcat运行时为JDK1.8...



    
        
            
                网站首页
                tags
            
            
                学习手册
                html5
                css3
                THINKPHP 5.0 手册
            
            
                在线课程
                牛骨文前端
                网站建设
                SEO名词解释
            
        
        
            
                
                    服务热线
                    电话：175-0840-8227
                    上班时间：9:00-18:00
                
            
            
                
                关注微信公众号
            
        
     

copyright © 2008-2026 亿联网络 版权所有 备案号：粤ICP备14031511号-2