网页代码过滤 轻松获取专辑目录

yumo66610个月前 (04-22)技术文章92

通过过滤网页代码,可以将网页上显示不全的长文件名列表完整地提取出来。

我有一个含有75个视频文件的《中医诊断学》课件,文件名是以01.RMVB、02.RMVB……75.RMVB这种格式命名的。我希望能找到代表各集文件的标题替换掉以数字命名的视频文件名,这样便于在学习时按文件名点播。我在网上搜索和发帖求助,都没能找到该视频序列的现成文本名列表,但在一个视频网站上发现有该视频专辑的播放页面,却因播放页面上显示的文件名不全而无法以直接复制的办法取得完整的文件名序列(图1)。如果用点击每个链接,查看链接属性,复制完整链接名的办法,倒是可以获得完整的文件名称,但那样一个接一个地操作效率太低了。有没有效率更高的办法呢?

借助网页代码过滤是个解决问题的办法。既然用右键单击链接可以看到完整的视频文件名称,那说明在网页代码中肯定存在完全的视频文件名的记录。获得了网页代码,这些完整文件名也就在其中了。

但是,在网页代码中,完整的文件名是混杂在非常复杂的网页代码中的(图2),如何快速从这密密麻麻的网页中提取出我们所需要的完整视频文件名?这倒成了一个大问题。

最后,我在网页代码的基础上,利用文本编辑器软件的过滤替换技术,在很短的时间内过滤出自己需要的完整文件名序列。具体方法如下。

获取网页代码

右键单击网页,选择快捷菜单命令“查看源文件”,系统会自动用记事本打开网页的源文件代码。

借用EmEditor处理

由于记事本本身对源代码的过滤编辑作用有限,所以我们可以借助于功能强大的文字编辑软件EmEditor来解决问题。

打开EmEditor编辑软件,将以上由记事本获得的网页源码全部复制过来。

过滤网页源代码

经过对源代码的简单分析得知,在每个视频文件名的前面都有一个固定的字符串

用快捷键Ctrl+H启动替换窗口,在“查找”框中输入

最后,再用类似的替换方法成批将其他无关代码段或文字统统替换为空(“替换为”框中不填任何内容),再点一下EmEditor插件工具栏上的一次性删除空白行和重复行命令钮,一次性成批删除多余的空白行和重复行。剩下就是我们要的完全版文件目录列表了。

相关文章

在移动端轻松查看网页源代码:View Source 2.0

如果你是一名站长或 Web 开发者,在浏览器中查看网页源代码(HTML、CSS 与 JavaScript)是每天必不可少的操作,这个在桌面端轻而易举的操作到了移动端却变成了一件麻烦事。如今有了 Vie...

亚马逊大卖都在用的那些链接 -- 权威链接

最近不少人在问类似几个问题:“测评时,关键词找不到自己?站外投放什么链接?”所以小编今天好好的说说你可能知道的或者不知道的那些链接:原始链接、重中之重的权威链接、神乎其神的超链接、后来居上的二次链接等...

网站链接地址抓取助手

想要轻松获取网站的内链,那就赶紧来使用网页链接提取工具,软件是一款功能强大实用的网站内链获取软件,功能给出强大的网站内链获取工具,使用后即可网站内链全部获取,大大提高了工作效率,并且操作简单,使用方便...

宝塔实测-PHP网页版在线客服系统源码

大家好啊,我是测评君,欢迎来到web测评。本期给大家带来一套PHP网页版在线客服系统源码。运行环境服务器宝塔面板PHP 7.2Mysql 5.6Linux Centos7以上文字安装教程下载源码,宝塔...

微软网站源码抢先曝光10月6日发布会新品

Yesky天极新闻2015-09-16 13:50:29【Yesky新闻频道消息】日前,微软已经放出了新品发布会邀请函,发布会时间定在10月6日。按照之前曝光的消息,微软有望在本次发布会中发布大量Wi...

响应式粉色婚礼网站模板源码

FOXEWEDDING是一个漂亮的HTML5婚礼网站模板,易于使用的婚礼网页模板建立在Bootstrap框架上。它可以用作婚礼邀请、新人结婚表白。模板是响应式的设计,所以你也可以把它在手机/平板电脑设...