python正则表达式面试题解答

所属分类: 脚本专栏 / python 阅读数: 1001
收藏 0 赞 0 分享

三道python正则表达式面试题,具体如下

1.去除以下html文件中的标签,只显示文本信息。

<div>
<p>岗位职责:</p>
<p>完成推荐算法、数据统计、接口、后台等服务器端相关工作</p>
<p><br></p>
<p>必备要求:</p>
<p>良好的自我驱动力和职业素养,工作积极主动、结果导向</p>
<p>&nbsp;<br></p>
<p>技术要求:</p>
<p>1、一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式</p>
<p>2、掌握HTTP协议,熟悉MVC、MVVM等概念以及相关WEB开发框架</p>
<p>3、掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种<br></p>
<p>4、掌握NoSQL、MQ,熟练使用对应技术解决方案</p>
<p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p>
<p>&nbsp;<br></p>
<p>加分项:</p>
<p>大数据,数理统计,机器学习,sklearn,高性能,大并发。</p>
</div> 

利用python正则表达式re模块中的sub方法,将标签替换为空字符串,代码如下:

#-*- coding:utf-8 -*-
import re

#去除标签

s = "<div>\
<p>岗位职责:</p>\
<p>完成推荐算法、数据统计、接口、后台等服务器端相关工作</p>\
<p><br></p>\
<p>必备要求:</p>\
<p>良好的自我驱动力和职业素养,工作积极主动、结果导向</p>\
<p>&nbsp;<br></p>\
<p>技术要求:</p>\
<p>1、一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式</p>\
<p>2、掌握HTTP协议,熟悉MVC、MVVM等概念以及相关WEB开发框架</p>\
<p>3、掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种<br></p>\
<p>4、掌握NoSQL、MQ,熟练使用对应技术解决方案</p>\
<p>5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js</p>\
<p>&nbsp;<br></p>\
<p>加分项:</p>\
<p>大数据,数理统计,机器学习,sklearn,高性能,大并发。</p>\
</div> "

p = r"</?\w+>|&nbsp;"
print(re.sub(p, " ", s))

2.将以下网址提取出域名:

http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415

利用sub方法,将整个字符串替换为只含域名的字符串。代码如下:

#-*- coding:utf-8 -*-
import re

#提取出域名
s2 = """http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415"""

p = r"(http://.+?/).+"

print(re.sub(p, lambda x : x.group(1), s2))

3.提取出如下字符串中的单词:

hello world ha ha

利用split方法分割空格或者用findall方法寻找到所有的单词,代码如下:

#-*- coding:utf-8 -*-
import re

#提取出单词
s3 = "hello world ha ha"
print(re.split(r" +", s3))
print(re.findall(r"\b\w+\b", s3))

三道题运行结果如下:

第一题:

岗位职责:  完成推荐算法、数据统计、接口、后台等服务器端相关工作     必备要求:  良好的自我驱动力和职业素养,工作积极主动、结果导向      技术要求:  1、一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式  2、掌握HTTP协议,熟悉MVC、MVVM等概念以及相关WEB开发框架  3、掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种   4、掌握NoSQL、MQ,熟练使用对应技术解决方案  5、熟悉 Javascript/CSS/HTML5,JQuery、React、Vue.js      加分项:  大数据,数理统计,机器学习,sklearn,高性能,大并发。  

第二题:

http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/

第三题:

['hello', 'world', 'ha', 'ha']
['hello', 'world', 'ha', 'ha']

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

更多精彩内容其他人还在看

Python 3中的yield from语法详解

在python 3.3里,generator新增了一个语法 yield from,这个yield from的作用是什么?语法是什么呢?下面通过这篇文章主要给大家详细介绍了Python 3中yield from语法的相关资料,需要的朋友可以参考借鉴,下面来一起看看吧。
收藏 0 赞 0 分享

python 开发的三种运行模式详细介绍

这篇文章主要介绍了python 开发的三种运行模式详细介绍的相关资料,需要的朋友可以参考下
收藏 0 赞 0 分享

一步步教你用Python实现2048小游戏

相信2048这个游戏对大家来说一定不陌生,下面这篇文章就主要给大家介绍了怎么用Python实现2048小游戏,文中通过注释与示例代码介绍的很详细,相信对大家的理解和学习具有一定的参考借鉴价值,有需要的朋友们一起来看看吧。
收藏 0 赞 0 分享

Python爬取网易云音乐上评论火爆的歌曲

最近跟着网上教程学着用python爬取问题,于是就想试着扒一扒Python爬取网易云音乐上评论火爆的歌曲,下面这篇文章就主要介绍了利用Python如何爬取网易云音乐上那些评论火爆的歌曲,需要的朋友可以参考借鉴,一起来看看吧。
收藏 0 赞 0 分享

Python 3.x 连接数据库示例(pymysql 方式)

这篇文章主要介绍了Python 3.x 连接数据库示例(pymysql 方式),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
收藏 0 赞 0 分享

python解决汉字编码问题:Unicode Decode Error

最近在利用python读取一个含有汉字的文档时导致出现了乱码,并报出了两个错误,无奈只能上网找寻答案,后通过网友的帮助解决了这个问题,想着总结一下,下面这篇文章就主要介绍了python如何解决汉字编码问题,有需要的朋友们可以参考借鉴。
收藏 0 赞 0 分享

Python中二维列表如何获取子区域元素的组成

这篇文章主要给大家介绍了Python中二维列表是如何获取子区域元素的组成,文中给出了详细的介绍和示例代码,相信对大家的理解和学习具有一定的参考借鉴价值,有需要的朋友们下面来一起看看吧。
收藏 0 赞 0 分享

Python正则替换字符串函数re.sub用法示例

这篇文章主要介绍了Python正则替换字符串函数re.sub用法,结合实例形式分析了正则替换字符串函数re.sub的功能及简单使用方法,具有一定参考借鉴价值,需要的朋友可以参考下
收藏 0 赞 0 分享

python中实现迭代器(iterator)的方法示例

我们经常需要遍历一个对象中的元素,在Python中这种功能是通过迭代器来实现的。下面这篇文章主要给大家介绍了python中实现迭代器(iterator)的方法示例,需要的朋友可以参考借鉴,下面来一起看看吧。
收藏 0 赞 0 分享

深入理解python对json的操作总结

Json最广泛的应用是作为AJAX中web服务器和客户端的通讯的数据格式,本篇文章主要介绍了python对json的操作总结,具有一定的参考价值,有兴趣的可以了解一下。
收藏 0 赞 0 分享
查看更多