正则表达式SoEasy 17 股票数据采集之正则撰写

avatar
avatar
雪山凌狐
489
文章
28
评论
2017年7月1日11:30:55 评论 7,983 496字阅读1分39秒

这节课我们正式开始编写我们的正则表达式。


正则撰写

还记得做正则的大致步骤么?

1.获取要匹配的源文本。

2.在源文本中找出要匹配内容的重复部分,有规律部分。

3.将需要或者不需要的部分进行(.*?)[\s\S]*?等万能公式的改写,将需要确切匹配的特殊字符使用转义符号转义。

4.如果表达式比较长,可以考虑在测试匹配前先保存一下目前的表达式到记事本,避免工具崩溃。然后进行测试。

5.根据测试的结果考虑是否需要修改正则表达式,然后重复第3步第4步直到满意。

6.根据编程语言使用匹配好的正则表达式。

记住:正则实战,就是多练就熟练了!


课后作业

课后作业:

请大家不看教程,自己完成正则表达式的撰写,并保证能够匹配沪深两市的股票的网页源码。


请务必完成作业之后再看下一课!

下节课我们将开始新的案例。

 

 

以下是我们的视频教程:

在线观看:

 

 

 

高清源文件下载:

内容已经隐藏,请注册为本站会员后查看

 

 

 

 

感谢大家的收看,我们下期再见!

如果你觉得内容不错的话,欢迎点赞,评论和分享哟~
avatar
电影排行爬虫 5 正则解析页面 专题课程

电影排行爬虫 5 正则解析页面

本节课我们主要将上一节课分析出来的正则表达式应用到python代码当中,实现了页面的解析。 解析完成后我们使用yield命令一个个推出给写出的函数中供写出。这时候我们就不得不讲一下yield的用法。y...
电影排行爬虫 4 正则分析 专题课程

电影排行爬虫 4 正则分析

本节课我们着重进行了获取解析我们要的内容的正则表达式的编写,通过一番分析,我们成功编写了对应的正则表达式并成功进行了测试,可以使用啦。   以下是我们的视频教程: 在线观看: 该教程目前暂为...

发表评论