博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python 查找关键词在百度的排名
阅读量:6900 次
发布时间:2019-06-27

本文共 1317 字,大约阅读时间需要 4 分钟。

 前段时间为了查找自己的老王python的关键词排名怎么样,特意用写了一个查找网页关键词排名的程序,感觉效果还不错。特别是查找关键词排名靠后的网页来说非常的方便,不用自己手动的去一个个的翻页,废话不说了,赶快上代码。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
#@author:wl
#@qq:280026798@qq.com
#@description:检测给定的关键字在百度上的排名
import sys
import urllib ,urllib2
import re
def baidu(w,pn):
    '''返回当前页的内容'''
    url= "http://www.baidu.com/s?"
    values = {
    "w":w.encode( 'gbk', 'ignore'),
    "pn":pn
    }
    data = urllib.urlencode(values)
    newurl = url + data
    response = urllib2.urlopen(newurl)
    the_page = response.read()
    return the_page
def ana(data,mysite,pn):
    '''检测关键字的位置'''
    o = re.compile( r'href="(.+?)"')
    f = o.findall(data)
    line = pn
    for ff in f:
        ff = ff.strip() 
        if not re.search( "^s\?",ff) and re.search( "^http:\/\/",ff) and not re.search( 'baidu.com',ff):
            if re.search(mysite,ff):
                print "* " ,line ,ff
                return True
            else:
                print line,ff
                line = line + 1
                continue
        
   
if __name__ == "__main__":
    mysite = sys.argv[ 2]
    pn = 1
    while True:
        keyword = sys.argv[ 1].decode( 'gbk')
        data = baidu(keyword,pn)
        checkflag = ana(data,mysite,pn)
        if not checkflag:
            pn = pn + 10
            print "page %s " % str(int(pn)/ 10)
        else:
            print 'found: %s ' % (mysite)
            break
    else:
        print 'not found: %s ' % (mysite)
 
用法:
 
先保存成python文件,然后要运行的话,可以按照下面的步骤。
 
python xxx.py 关键词 网址
 
就可以查出关键词在百度搜索列表的具体位置了。
 

文章链接: 转载请保留,谢谢!

转载于:https://www.cnblogs.com/wanpython/archive/2012/11/29/2794320.html

你可能感兴趣的文章
HA机制下的hadoop配置
查看>>
MySQL 5.5 新增SIGNAL异常处理
查看>>
回档|忠诚2|zkw线段树
查看>>
Away3D引擎学习笔记(二)CameraController相机控制的应用
查看>>
jq获取元素到底部的距离
查看>>
工作总结
查看>>
一个恶心的需求
查看>>
分类精度评价指标
查看>>
文件操作
查看>>
openssl编译时!遇见的问题
查看>>
Linux安全加固--精简启动项
查看>>
软件需求分析模板
查看>>
HDU - 5457 Hold Your Hand (Trie + 最小割)
查看>>
MySql 到 SQL Server(MSSQL)
查看>>
静态链表
查看>>
解决VS2005 VS2008 vs2010断点无效-源代码与原始版本不同
查看>>
NFS
查看>>
静电引发的悲剧
查看>>
在Angularjs中使用directive自定义指令实现attribute的继承
查看>>
新手学习编程的最佳方式是什么
查看>>