实例介绍
【实例简介】
访问国外网站耗时太长,一些固定内容的网站可以保存到本地方便浏览。这是本例子的出发点。
【实例截图】
原网站
复制后
【核心代码】
def saveHtml(self, data):
idx1 = data.find('<div class="main')
idx2 = data.find('<aside style="margin-top:1rem">')
print("===================", idx1, idx2)
中间页面 = data[idx1:idx2]
前一检索位置 = 0
当前检索位置 = 0
最终页面 = self.页面头
while 当前检索位置 >=0:
图片位置1 = 中间页面.find('<img ', 当前检索位置)
print(中间页面[图片位置1:图片位置1 100])
if (图片位置1 == -1):
break
图片位置2 = 中间页面.find('width=', 图片位置1)
脚本位置 = 中间页面.rfind('<a href="javascript', 0, 图片位置1)
图片URL1 = 中间页面.find('src="', 图片位置1, 图片位置2)
图片URL2 = 中间页面.find(' ', 图片URL1, 图片位置2)
图片URL = 'https:' 中间页面[图片URL1 5:图片URL2-1]
图片名 = 图片URL[图片URL.rfind('/') 1:]
替换内容 = '<img alt="" src="img/' 图片名 '" '
print(图片位置1, 图片位置2, 脚本位置, 图片URL1, 图片URL2, 图片URL, 图片名)
try:
self.存放图片(图片URL, 图片名)
except ConnectionError:
self.wininfo.setText('图片:' 图片名 '连接失败!')
if 脚本位置 == -1:
脚本位置 = 图片位置1
最终页面 = 中间页面[前一检索位置:脚本位置] 替换内容
前一检索位置 = 图片位置2
当前检索位置 = 前一检索位置
最终页面 = 中间页面[前一检索位置:] "</div></body></html>"
页面名 = self.pageUrl[self.pageUrl.rfind('/') 1:]
self.wininfo.setText('保存页面:' 页面名 '.html')
页面文件 = open('wiki\\' 页面名 '.html','w',encoding='utf-8')
页面文件.write(最终页面)
页面文件.close()
self.winbtn.setEnabled(True)
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论