在本教程中,您将学习如何使用MySQL REGEXP
运算符执行基于正则表达式的复杂搜索。
正则表达式简介
正则表达式是描述搜索模式的特殊字符串。 它是一个强大的工具,为您提供一种简洁灵活的方法来识别基于模式的文本字符,例如字符,单词等。
例如,可以使用正则表达式来搜索电子邮件,IP地址,电话号码,社会安全号码或具有特定模式的任何内容。
正则表达式使用其可以由正则表达式处理器解释的自己的语法。 正则表达式广泛应用于从编程语言到数据库(包括MySQL)大部分平台。
使用正则表达式的优点是,不限于在LIKE 运算符中基于具有百分号(%
)和下划线(_
)的固定模式搜索字符串。 使用正则表达式,有更多的元字符来构造灵活的模式。
正则表达式的缩写是regex
或regexp
。
MySQL REGEXP运算符
MySQL适应了Henry Spencer 实现的正则表达式。MySQL允许使用REGEXP
运算符在SQL语句中匹配模式。
下面说明了WHERE子句 中REGEXP
运算符的语法:
Copy SELECT
column_list
FROM
table_name
WHERE
string_column REGEXP pattern;
此语句执行string_column
与模式pattern
匹配。
如果string_column
中的值与模式pattern
匹配,则WHERE
子句中的表达式将返回1
,否则返回0
。
如果string_column
或pattern
为NULL
,则结果为NULL
。
除了REGEXP
运算符之外,可以使用RLIKE
运算符,这是REGEXP
运算符的同义词。
REGEXP
运算符的否定形式是NOT REGEXP
。
MySQL REGEXP示例
假设想找出名字以字母A
,B
或C
开头的产品。可以使用SELECT语句 中的正则表达式如下:
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP '^(A|B|C)'
ORDER BY productname;
执行上面查询语句,得到以下结果 -
Copy + --------------------------------+
| productname |
+ --------------------------------+
| America West Airlines B757 - 200 |
| American Airlines: B767 - 300 |
| American Airlines: MD - 11S |
| ATA: B757 - 300 |
| Boeing X - 32A JSF |
| Collectable Wooden Train |
| Corsair F4U ( Bird Cage) |
+ --------------------------------+
7 rows in set
该模式允许查询名称以A
,B
或C
开头的产品。
下表说明了正则表达式中一些常用的元字符和构造。
要查找名称以a
开头的产品,您可以在名称开头使用“^
”进行匹配,如下查询语句:
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP '^a' ;
执行上面查询语句,得到以下结果 -
Copy + --------------------------------+
| productname |
+ --------------------------------+
| American Airlines: B767 - 300 |
| America West Airlines B757 - 200 |
| ATA: B757 - 300 |
| American Airlines: MD - 11S |
+ --------------------------------+
4 rows in set
如果要使REGEXP
运算符以区分大小写的方式比较字符串,可以使用BINARY
运算符将字符串转换为二进制字符串。
因为MySQL比较二进制字节逐字节而不是逐字符。 这允许字符串比较区分大小写。
例如,以下语句只匹配开头为大写“C
”的产品名称。
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP BINARY '^C' ;
执行上面查询语句,得到以下结果 -
Copy + --------------------------+
| productname |
+ --------------------------+
| Collectable Wooden Train |
| Corsair F4U ( Bird Cage) |
+ --------------------------+
2 rows in set
要找到以f
结尾的产品,您可以使用’$f
‘来匹配字符串的末尾。
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP 'f$' ;
执行上面查询语句,得到以下结果 -
Copy + ------------------+
| productname |
+ ------------------+
| Boeing X - 32A JSF |
+ ------------------+
1 row in set
要查找其名称包含“ford
”的产品,请使用以下查询:
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP 'ford' ;
执行上面查询语句,得到以下结果 -
Copy + ----------------------------------+
| productname |
+ ----------------------------------+
| 1968 Ford Mustang |
| 1969 Ford Falcon |
| 1940 Ford Pickup Truck |
| 1911 Ford Town Car |
| 1932 Model A Ford J - Coupe |
| 1926 Ford Fire Engine |
| 1913 Ford Model T Speedster |
| 1934 Ford V8 Coupe |
| 1903 Ford Model A |
| 1976 Ford Gran Torino |
| 1940s Ford truck |
| 1957 Ford Thunderbird |
| 1912 Ford Model T Delivery Wagon |
| 1940 Ford Delivery Sedan |
| 1928 Ford Phaeton Deluxe |
+ ----------------------------------+
15 rows in set
要查找名称只包含10
个字符的产品,可以使用’^
‘和’$
‘来匹配产品名称的开头和结尾,并重复{10}
次任何字符.
,作为以下查询:
Copy SELECT
productname
FROM
products
WHERE
productname REGEXP '^.{10}$' ;
执行上面查询语句,得到以下结果 -
Copy + -------------+
| productname |
+ -------------+
| HMS Bounty |
| Pont Yacht |
+ -------------+
2 rows in set
在本教程中,您已学习如何使用具有正则表达式的MySQL REGEXP
运算符查询数据。