20个常用的正则表达式:
1、匹配邮箱地址:^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$。
2、匹配手机号码:^1[3-9]\d{9}$。
3、匹配整数:^-?\d+$。
4、匹配非负整数:^\d+$。
5、匹配非正整数:^-?\d+$。
6、匹配正整数:^[1-9]\d*$。
7、匹配非正整数:^-[1-9]\d*|0$。
8、匹配中文:^[\u4e00-\u9fa5]+$。
9、匹配密码(包含大小写字母和数字,长度8-10):^(?=.\d)(?=.[a-z])(?=.*[A-Z]).{8,10}$。
10、匹配E-Mail地址:[\w!#%&'+/=?^`{|}~-]+)@((?:[\w]+.\w+)).([a-z][a-z])?(.[a-z]{2,3})+$。
11、匹配URL:((ht|f)tp(s)?://)?([\w]+)(.[\w]+)+(/?[\w.-]+=[^&?])?(?[\w.,])+。
12、匹配中文数字:^[一-九]\d*$。
13、匹配中文数字零开头:^[零一二三四五六七八九十]+$。
14、匹配中文数字零开头和整数:^[零一二三四五六七八九十]+\d+$。
15、匹配日期的年份(4位):^\d{4}$。
16、匹配日期的月份(2位):^\d{2}$。
17、匹配日期的日份(2位):^\d{2}$。
18、匹配IP地址(IPv4):^\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}$。
19、匹配MAC地址:^([0-9A-Fa-f]{2}[:-]){5}([0-9A-Fa-f]{2})$。
20、匹配十六进制颜色代码:^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$。
正则表达式的应用领域:
1、模式匹配:正则表达式最基本的应用就是模式匹配,可以用来查找、替换、拆分符合特定模式的文本。例如,在文本编辑器中查找某个特定的单词或短语,或者在日志文件中查找符合特定格式的行。
2、数据清洗:在处理大量数据时,常常需要去除不必要的空格、标点符号、换行符等无关紧要的内容。正则表达式可以通过匹配这些特定字符,实现数据的清洗和预处理。
3、验证输入:正则表达式可以用来验证用户输入的数据是否符合特定的格式。例如,密码需要满足一定的复杂性要求,正则表达式可以用来判断密码中是否包含数字、字母、特殊字符等。
4、文本挖掘:在文本挖掘领域,正则表达式可以用来提取文本中的特定模式。例如,从新闻报道中提取出事件的时间、地点、人物等信息。
5、自动化脚本:在自动化脚本中,正则表达式可以用来解析和处理文本数据。例如,在网页爬虫中,可以通过正则表达式提取出网页中的特定信息。
6、搜索引擎:搜索引擎需要处理海量的文本数据,正则表达式可以用来实现高效的搜索和匹配。例如,匹配关键词、排除无关的内容等。
7、文件处理:在文件处理领域,正则表达式可以用来实现文件的批量重命名、移动、删除等操作。