导
INTRODUCION
语
做渗出 的时间 碰到 一个体系 可以到网上搜刮 下这个体系 的相干 弊端 ,众所周知的缘故起因 ,wooyun关闭了好久 ,以是 我们最好本身 搭建一个乌云镜像 。
由于 如今 乌云打不开了 ,不好 直接爬,我们可以爬那些已经搭建好的乌云镜像。
由于 应用是搭建在SAE上的,为了节省 money,以是 采取 mysql数据库。
1
乌云爬虫
由于 如今 乌云打不开了 ,不好 直接爬,我们可以爬那些已经搭建好的乌云镜像 。
这个爬虫是好久 之前写的,不但 爬取了每个页面 ,将全部 的弊端 信息 、厂商列表、批评 都存储了
爬完乌云镜像,只有3w多点数据
爬虫是之前写的,好了好久 也没有找到
爬虫写起来还是 很轻易 ,用beautifulsoup分析 网页就都可以出来这个爬虫不是我们的重点 ,我们只必要 这个数据就行了导出SQL就有靠近 200多M了
数据库下载地点 :链接: https://pan.baidu.com/s/1hrKYy8W 暗码 : yrrr
2
pyhton flask代码编写
由于 我们要用到MySQL数据库,以是 我们先安装下MySqldb
pip MySqldb
由于 我们利用 的是PYTHON2.7,为了一些不须要 的错误,我们先在段首写上
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
防止编码错误
我们必要 展示两个界面 ,一个是搜刮 关键词得到的数据界面,一个是弊端 界面,通过MySql的like语句搜刮 标题中的关键字 ,然后通过id查询获取具体 信息,具体 看代码
3
必要 留意 的转义题目
为了防止sql语句出现注入的征象 ,利用 MySQLdb.escape_string函数举行 转义
4
上线新浪SAE
新浪SAE自带mysqldb,以是 不必要 额外的打包上传 ,起首 要创建Mysql:
导入数据库,
通过查询API
段首修改下
5
上线测试
6
总结
乌云弊端 如今 最全的好像 有8w多,本文只是抛砖引玉下 ,整个项目源码 https://github.com/boy-hack/pythonwebhack
文章作者:w8ay
文章泉源 :https://bbs.ichunqiu.com/thread-15744-1-1.html
敬请连续 关注……