您现在的位置是:首页 > 网站优化网站优化
Python编程——爬小说《星辰变》
胜于蓝2020-01-29【网站优化】人已围观
简介看的第一本小说 怀旧一下 hhhhh 代码如下 ( 使用正则表达式进行匹配 ) #小说爬虫 《星辰变》 import re import requests url="http://www.xbiquge.la/5/5623/" #小说
看的第一本小说 怀旧一下 hhhhh
代码如下 ( 使用正则表达式进行匹配 )
#小说爬虫 《星辰变》
import re
import requests
url="http://www.xbiquge.la/5/5623/" #小说目录
txt=requests.get(url).content.decode("utf-8")
j=re.compile(r"<dd><a href='/5/5623/(.+?)' >(.+?)</a></dd>") #匹配正则
ml=j.findall(txt)
mlist=[(i[1],url+i[0]) for i in ml] #将章节和网址保存成列表mlist ,
#print(mlist)
with open("11.txt","w",encoding="utf-8") as f:
for i in mlist:
print("开始下载--->",i[0])
t1=requests.get(i[1]).content.decode("utf-8",errors="ignore") #忽略错误
zw1=re.compile(r'tent">(.+?)<p>') #正则匹配正文部分
zw=zw1.findall(t1)[0]
zw=zw.replace(" ","") #因为解码格式不同 将乱码替换掉
zw=zw.replace("<br />","")
zw=zw.replace("<script></script>","")
zw=zw.replace("readx();","")
f.write(i[0]+"\n\n\n")
f.write(zw+"\n\n\n")
print("下载完毕")
Tags:
很赞哦! ()
上一篇:影响网站关键词相关性的四要素
下一篇:网站内容作弊方法
相关文章
随机图文
网站alt标签你用对了吗?
网站优化中alt标签的使用也是非常重要的细节,但是alt标签的视觉效果不明显,常常容易被忽略,这样也会影响搜索引擎对网站的整体评价。那么,优化网站的过程中如何使用alt标签?接下网站死链的查找、危害、形成及处理方法
网站优化的工作中,难免会产生死链,这些死链不仅破坏了访客的用户体验,还影响搜索引擎对网站的友好和信任度,因此及时发现和处理死链是一项必不可少的工作。然而对于很多不懂SE网站内容作弊方法
SEO网站内容作弊方法 1、门户网页 很多网页被单独设计来得到高的搜索排名,但是另一方面它们对站点的访客没什么价值,这就是门户网页。搜索登陆页面不是门户网页。个人博客网站怎么选择模板程序?
个人博客模板的选择,其实就是根据自己的爱好或模板的功能来选择。1、博客模板首页功能选择首页包含:banner大图、推荐文章、自动更新日期的文章列表、还可以推荐一个文章大图