优秀的编程知识分享平台

网站首页 > 技术文章 正文

这几种正则表达式的“字符集合”,想要入门regexp函数,必须了解

nanyue 2025-03-20 17:12:41 技术文章 4 ℃

前言回顾:

大家好,今天我们来分几篇文章讲讲REGEXP正则表达式函数中的正则表达式字符,因为只有掌握了这些字符之后,我们才能结合具体实际需求,编写REGEXP函数的第二参数,将各类符号进行连接组合使用,实现对复杂文本进行匹配、提取和替换的目的。


REGEXP函数是基于正则表达式,对复杂文本进行匹配、提取和替换的函数。


基本语法结构

REGEXP(原始字符串,正则表达式,[匹配模式],[替换内容])


匹配模式是可选项,0或忽略表示提取,1表示判断是否包含,2表示替换。

替换内容是可选项,仅在匹配模式为2时有效,用来替换匹配的内容。


常用的正则表达式核心符号主要大体分为六大类


1.基础元字符



2.量词符



3.定位符



4.字符集合



5.分组与引用



6.特殊符号




今天我们主要讲讲第四大类字符集合这个大类的符号还比较好理解


我们再来结合几个具体的小例子,并运用REGEXP函数代入,感受一下字符集合的含义与作用。




[abc]表示匹配 a、b、c 中的任意一个字符


输入函数公式

=REGEXP(A2,"[ac]")


可以将A2单元格字符串中包含a与c的字母提取,显示出来。


当然了,也可以判断a与c是否存在于A2单元格中,还可以查找a与c,替换为指定的其他值(替换为空即删除)。



[^abc]表示匹配除a、b、c以外的其他字符


输入函数公式

=REGEXP(A2,"[^ac]")


可以将A2单元格字符串中除a与c以外的其他字符提取出来。



[a-z]表示匹配小写字母a到z,即匹配到所有的小写字母


输入函数公式

=REGEXP(A2,"[a-z]")


可以提取到A2单元格字符串中所有的小写字母。



[A-Z0-9]表示匹配大写字母和数字的组合


输入函数公式:

=REGEXP(A2,"[A-Z0-9]")


可以提取到A2单元格字符串中所有的大写字母和数字。



[特殊符号]表示匹配特定符号(需转义或直接写入)


比如说[\+\-*/]表示匹配加减乘除符号,因为加减乘除符号在正则表达式中可能存在特殊的含义与作用,要与加减乘除符号本身相区分的话,必须要在各个符号前面加上符号“\”,符号“\”就是我们常说的转义符。


输入函数公式

=REGEXP(A2,"[\+\-\*\/]")


就可以将A2单元格字符串中包含+-*/(加减乘除)的符号提取出来显示。

当然了,也可以判断+-*/是否存在于A2单元格中,还可以查找+-*/,替换为指定的其他值(替换为空即删除)。



下面我们继续用几个简单的职场实际案例,继续深入理解集合符的具体作用!


案例1

例如我们想要将A列各个单元格中的手机号码提取出来。手机号码有几种格式,一种是包含空格间隔的手机号码,一些是用符号“-”间隔的手机号码,剩余的为正常的手机号码。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[0-9\-\s+]{11,}")

或=REGEXP(A2,"[0-9\-\ ]{11,}")


正则表达式符号含义

[0-9\-\s+]:表示匹配数字、横线-(须加转义符\)或空格

其中\s+:表示1个或多个空格。 红色底色处代表敲击一个空格键产生的,也表示空格。

{11,}:表示至少11位,以适应数量不等的分隔符。




案例2

例如我们想要判断A列各个单元格的产品编号是否含有规则为:"3位大写字母+3位数字+1位大写字母" 的这种信息部分。


我们可以这样输入正则表达式函数

=REGEXP(A2,"[A-Z]{3}-[0-9]{3}-[A-Z]",1)


正则表达式符号含义

[A-Z]{3}:代表3位大写字母。

[0-9]{3}:代表3位数字。

[A-Z]:代表1位大写字母


这样“编号XQD-456-F国产”符合规则,返回TRUE;“编号abc-123-x进口”不符合规则,返回FALSE。




案例3

A列数据是用户账号信息,平台允许只能由字母、数字、下划线组成。我们想要删除文本中的非字母、数字、下划线的字符(如@、#等)。即清理非法字符。


我们可以这样输入正则表达式

=REGEXP.REPLACE(A1, "[^A-Za-z0-9_]", "")


正则表达式符号含义:

[^A-Za-z0-9_]:匹配非字母、数字、下划线的字符


替换为空字符串,实现清理删除目的。




案例4

我们想要提取A列各单元格中的日期数据。日期数据包含两种格式,提取格式为 YYYY/MM/DD 或 YYYY-MM-DD 的日期。


我们可以这样输入函数公式

=REGEXP(A2,"\d{4}[-/]\d{1,2}[-/]\d{1,2}")


正则表达式符号解析

\d{4}:4位年份

[-/]:匹配横线 - 或斜杠 /

\d{1,2}:匹配1位数或2位数的月份或日。


Tags:

最近发表
标签列表