跟高兴又跟大家见面了。从这节课开始,我将找寻各种各样的实战案例,跟大家讲解,希望大家通过实战案例的分析,能够快速的综合运用我们前面15课学习的基础知识,让自己的正则水平和实战水平更上一层楼!
项目介绍
从这节课开始我们终于进入了实战练习的部分。我也十分鸡冻能够跟大家走到这里。在这里,我会在网上寻找许多不错的项目,不管是网络采集还是本地采集等,都会找一些真实的案例来跟大家进行正则的讲解。
帮助大家快速的在实例中综合运用和掌握我们前面学到的基础知识。让我们今后碰到正则的东西都能游刃有余。
本期的案例是股票历史数据的采集。
所采集的网站是:
http://www.aigaogao.com/tools/history.html
这应该是一个个人站点,不过里面却可以查到许多股票数据,非常的有用,而且获取数据也十分方便,推荐给大家。
让我们先打开看一下。请看视频讲解。
项目分析
有的大型网站采集数据较为复杂,可能需要登录或者抓包等操作。
我选择这个案例也是因为它简单易懂,不需要复杂的操作,所有的数据都会列举在网页源码中,很容易获取到。
因此,总结起来,教会大家一点技巧,那就是做网页的采集,首先第一步就是右键查看源码,看在源码中是否能找到我们要的信息。
如果源码中有,分析源码即可。更高级的技巧我们今后的案例再讲解。
在本例中,源码中即可直接找到我们的数据,如果源码很多很复杂,我们可以考虑使用网页的搜索功能与HTML格式化功能确定我们要什么,怎么做。
请看我们的视频演示。
课后作业
课后作业:
请大家自行访问我们的数据获取网站:
http://www.aigaogao.com/tools/history.html
该网站还有许多其他的数据可以获取,历史数据只是其中的一部分,你看有你想获取的数据吗?
请务必完成作业之后再看下一课!
下节课我们将完成我们可以匹配的正则表达式。
以下是我们的视频教程:
在线观看:
高清源文件下载:
内容已经隐藏,请注册为本站会员后查看
感谢大家的收看,我们下期再见!
评论