java正则表达式

中关村国际软件人才教育联
盟
第二十五讲
正则表达式
中关村国际软件人才教育联盟
这些是什么？
 “[0-9A-Za-z]+@([0-9a-zA-
Z]+.){1,2}(com|net|cn|
com.cn)”
 “[\u4e00-\u9fa5]”
 “http://([\w-]+\.)+[\w-]+(/[\w-
./?%&=]*)?”
 “1\\d{2}”
2
目标
 正则表达式的概念
 正则表达式的基本语法
 在 Java 中使用正则表达式
 常用正则表达式
3
正则表达式的概念
 正则表达式 (regular expression) 是由
普通字符（例如字符 a 到 z ）以及特
殊字符（称为元字符）组成的文字模式。
正则表达式作为一个模板，将某个字符模
式与所搜索的字符串进行匹配
4
正则表达式的组成部分
11-1
 普通字符
– 由所有那些未显式指定为元字符的打印和非打印字符
组成。这包括所有的大写和小写字母字符、所有数字
、所有标点符号以及一些符号
 非打印字符
– \f 匹配一个换页符
– \n 匹配一个换行符
– \r 匹配一个回车符
– \s 匹配任何空白字符，包括空格、制表符、换页
符等等
– \S 匹配任何非空白字符
– \t 匹配一个制表符
– \v 匹配一个垂直制表符
5
11-2
 特殊字符
– 所谓特殊字符，就是一些有特殊含义的字符
– 特殊字符说明
– $ 匹配输入字符串的结尾位置
– () 标记一个子表达式的开始和结束位置。子表达
式可以获取供以后使用
– * 匹配前面的子表达式 0 次或多次
– + 匹配前面的子表达式 1 次或多次
– . 匹配除换行符 \n 之外的任何单字符
– [ 标记一个中括号表达式的开始
– ? 匹配前面的子表达式 0 次或 1 次
6
11-3
– 特殊字符说明
– \ 将下一个字符标记为或特殊字符、或原义
字符、或向后引用、或八进制转义符。例如， ‘
n’ 匹配字符 ‘ n‘ ，而 '\n' 匹配换行符。序列
'\\' 匹配 "\" ，而 '\(' 则匹配 "("
– ^ 匹配输入字符串的开始位置，除非在方括
号表达式中使用，此时它表示不接受该字符集合
– { 标记限定符表达式的开始
– | 指明两项之间的一个选择
7
11-4
 限定符
– 限定符用来指定正则表达式的一个给定组件必须要
出现多少次才能满足匹配。共 6 种：
– 限定符说明
– * 匹配前面的子表达式 0 次或多次
– + 匹配前面的子表达式 1 次或多次
– ? 匹配前面的子表达式 0 次或 1 次
– {n} n 是一个非负整数。匹配确定的 n 次
– {n,} n 是一个非负整数。至少匹配 n 次
– {n,m} m 和 n 均为非负整数，其中 n <=
m 。最少匹配 n 次且最多匹配 m 次。注意在逗
号和两个数之间不能有空格
8
11-5
 定位符
– 用来描述字符串或单词的边界， ^ 和 $ 分别指
字符串的开始字符与结束字符
– 不能对定位符使用限定符
 选择
– 用圆括号 () 将所有选择项括起来，相邻的选择
项之间用 | 分隔
9
11-6
 其它
– (pattern) 匹配 pattern 并获取这一匹配。
所获取的匹配可以从产生的 Matches 集合得到
– (?:pattern) 匹配 pattern 但不获取匹配结果
，也就是说这是一个非获取匹配，不进行存储供
以后使用。这在使用 " 或 " 字符 (|) 来组合一
个模式的各个部分是很有用。例如，
'industr(?:y|ies) 就是一个比 'industry|
industries' 更简略的表达式
10
11-7
– (?=pattern) 正向预查，在任何匹
配 pattern 的字符串开始处匹配查找字
符串。这是一个非获取匹配，也就是说，
该匹配不需要获取供以后使用。例
如， 'Windows (?=95|98|NT|2000)'
能匹配 "Windows 2000" 中的
"Windows" ，但不能匹配 "Windows
3.1" 中的 "Windows" 。当找到一个匹
配后，从 Windows 后面开始进行下一次
的检索匹配
11
11-8
– (?!pattern) 负向预查，在任何不
匹配 pattern 的字符串开始处匹配查找
字符串。这是一个非获取匹配，也就是说
，该匹配不需要获取供以后使用。例如‘
Windows (?!95|98|NT|2000)’ 能匹配
“ Windows 3.1” 中的
“ Windows” ，但不能匹配
“ Windows 2000” 中的
“ Windows” 。当找到一个匹配后，从
Windows 后面开始进行下一次的检索匹
配 12
11-9
– \xn 匹配 n ，其中 n 为十六进制转义值。
十六进制转义值必须为确定的两个数字长。例
如， '\x41' 匹配 "A" 。 '\x041' 则等价于
'\x04' & "1" 。正则表达式中可以使用 ASCII
编码
– \num 匹配 num ，其中 num 是一个正整数。
对所获取的匹配的引用。例如，‘ (.)\1’ 匹配两
个连续的相同字符
– \un 匹配 n ，其中 n 是一个用四个十六进
制数字表示的 Unicode 字符。例如， \u00A9
匹配版权符号 (?)
13
11-10
 JavaScript 中的正则表达式
– 格式： /pattern/flags
– 参数说明：
 pattern -- 一个正则表达式文本
 flags -- 如果存在，将是以下值：
g: 全局匹配
i: 忽略大小写进行匹配
gi: 以上组合
– 例如：
– /perl/ 找到含有 perl 的字符串
– /abc/i 找寻符合 abc 的字符串而且不考虑这
些字符串的大小写
– /[^\u4E00-\u9FA5]/g 只能是中文字符
14
11-11
 各种操作符的运算优先级
– 相同优先级的从左到右进行运算，不同优先级的运算
先高后低。各种操作符的优先级从高到低如下：
– 操作符描述
– \ 转义符
– (), (?:), (?=), [] 圆括号和方括号
– *, +, ?, {n}, {n,}, {n,m} 限定符
– ^, $ 位置和顺序
– | “ 或”操作
15
正则表达式匹配规则 15-

1
 基本模式匹配
– ^once 表示该模式只匹配那些以 once 开
头的字符串。例如该模式与字符串“ once
upon a time” 匹配，与“ There once
was a man from NewYork” 不匹配
– bucket$ 表示该模式只匹配那些以
bucket 结尾的字符串。例如这个模式
与 "Who kept all of this cash in a
bucket" 匹配，与 "buckets" 不匹配
16

2
– 字符 ^ 和 $ 同时使用时，表示精确匹配（字符
串与模式一样）。例如： ^bucket$ 只
匹配字符串 "bucket“
– 如果一个模式不包括 ^ 和 $ ，那么它与任何包
含该模式的字符串匹配。例如：模式 once
与字符串 There once was a man from
NewYork Who kept all of his cash in a
bucket. 是匹配的。在该模式中的字母 (o-n-
c-e) 是字面的字符，也就是说，他们表示该字
母本身，数字也是一样的
17

3
– 其他一些稍微复杂的字符，如标点符号和空
格、制表符等，要用到转义序列。所有的转
义序列都用反斜杠 (\) 打头。制表符的转义序
列是： \t 。所以如果我们要检测一个字符串
是否以制表符开头，可以用这个模式：
^\t 。类似的，用 \n 表示“新行”， \r 表示
回车。其它的特殊符号，可以在前面加上反
斜杠，如反斜杠本身用 \\ 表示，句号 . 用 \.
表示，以此类推
18

4
 句点符号 .
– 匹配除换行符 \n 之外的任何单字符
19

5
 方括号符号
– 为了解决句点符号匹配范围过于广泛这一问题，
你可以在方括号（“ []” ）里面指定字符。此时
，只有方括号里面指定的字符才参与匹配。也就
是说，正则表达式“ t[aeio]n” 只匹配“ tan” 、
“ Ten” 、“ tin” 和“ ton” ，但“ Toon” 不匹
配，因为在方括号之内你只能匹配单个字符
20

6
 “ 或”符号
– 如果除了上面匹配的所有单词之外，你还想要匹
配“ toon” ，那么，你可以使用“ |” 操作符。“
|” 操作符的基本意义就是“或”运算。要匹配“
toon” ，使用“ t(a|e|i|o|oo)n” 正则表达式。这
里不能使用方括号，因为方括号只允许匹配单个
字符；这里必须使用圆括号“ ()”
21

7
 表示匹配次数的符号
– 表一显示了表示匹配次数的符号，这些符号用来确
定紧靠该符号左边的内容出现的次数：
22

8
– 假设我们要在文本文件中搜索美国的社会安全号码。
这个号码的格式是 999-99-9999 。用来匹配它的
正则表达式如图一所示。在正则表达式中，连字符
（“ -” ）有着特殊的意义，它表示一个范围，比如
从 0 到 9 。因此，匹配社会安全号码中的连字符号
时，它的前面要加上一个转义字符“ \”
23

9
– 假设进行搜索的时候，你希望连字符号出现
，也可以不出现——即， 999-99-9999 和
999999999 都属于正确的格式。这时，你
可以在连字符号后面加上“？”数量限定符
号，如图二所示：
24

10
– 下面我们再来看另外一个例子。美国汽车牌
照的一种格式是四个数字加上二个字母。它
的正则表达式前面是数字部分“ [0-
9]{4}” ，再加上字母部分“ [A-Z]{2}” 。
图三显示了完整的正则表达式
25

11
 “ 否”符号
– “^” 符号称为“否”符号。如果用在方括号
内，“ ^” 表示不想要匹配的字符。例如，图
四的正则表达式匹配所有单词，但以“ X” 字
母开头的单词除外
26

12
 圆括号和空白符号
– 假设要从格式为“ June 26, 1951” 的生日
日期中提取出月份部分，用来匹配该日期的
正则表达式可以如图五所示：
27

13
– 新出现的“ \s” 符号是空白符号，匹配所有的
空白字符，包括 Tab 字符。如果字符串正确
匹配，如何提取出月份部分呢？只需在月份
周围加上圆括号创建一个组，然后用正则 API
提取出它的值。修改后的正则表达式六所示
：
28

14
 其它符号
– 为简便起见，你可以使用一些为常见正则
表达式创建的快捷符号。如表二所示：
29

15
– 例如，在前面社会安全号码的例子中，所有
出现“ [0-9]” 的地方我们都可以使
用“ \d” 。修改后的正则表达式如图七所示
：
30
Java 正则表达式 API 18-

1
 java.util.regex 是一个用正则表达
式所订制的模式来对字符串进行匹
配工作的类库包。它包括两个类：
Pattern 和 Matcher
– Pattern 一个 Pattern 是一个正则
表达式经编译后的表现模式
– Matcher 一个 Matcher 对象把
Pattern 对象做为匹配模式对给定的字
符串进行匹配检查
31

2
 Pattern 类
– Pattern 的方法如下：
– static Pattern compile(String regex)
将给定的正则表达式编译到模式中
– static Pattern compile(String regex, int
flags)
同上，但增加 flag 参数的指定，可选的 flag 参数包括
： CASE INSENSITIVE,MULTILINE,DOTALL,UNICODE
CASE ， CANON EQ
– int flags()
返回当前 Pattern 的匹配 flag 参数
– Matcher matcher(CharSequence input)
创建匹配给定输入与此模式的匹配器
32

3
– static boolean matches(String regex,
CharSequence input)
编译给定的正则表达式并且对输入的字串以该正则表达
式为模式进行匹配 , 该方法适合于该正则表达式只会使
用一次的情况，也就是只进行一次匹配工作，因为这种
情况下并不需要生成一个 Matcher 实例
– String pattern()
返回该 Pattern 对象所编译的正则表达式
– String[] split(CharSequence input)
将目标字符串按照 Pattern 里所包含的正则表达式为
模式进行分割
– String[] split(CharSequence input, int limit)
作用同上，增加参数 limit 目的在于要指定分割的段数
，如将 limi 设为 2 ，那么目标字符串将根据正则表达
式分为割为两段
33

4
 示例：
– import java.util.regex.*;
– public class Replacement{
– public static void main(String[] args) throws
Exception {
– // 生成一个 Pattern, 同时编译一个正则表达式
– Pattern p = Pattern.compile("[/]+");
– // 用 Pattern 的 split() 方法把字符串按“ /” 分割
– String[] result = p.split( "Kevin has
seen 《 LEON 》 seveal times,because it is a good
film." +"/ 凯文已经看过《这个杀手不太冷》几次了，因为它
是一部 " +" 好电影。 / 名词 : 凯文。 ");
– for (int i=0; i<result.length; i++)
– System.out.println(result[i]);
– }
– }
34

5
– 输出结果为：
 Kevin has seen 《 LEON 》 seveal times,because
it is a good film.
 凯文已经看过《这个杀手不太冷》几次了，因为它是一部
好电影。
 名词 : 凯文。
– 将程序改动为：
 tring[] result = p.split("Kevin has
seen 《 LEON 》 seveal times,because it is a
good film./ 凯文已经看过《这个杀手不太冷》几次了
，因为它是一部好电影。 / 名词 : 凯文。 " ， 2);
 这里面的参数 "2" 表明将目标语句分为两段
– 输出结果则为：
 Kevin has seen 《 LEON 》 seveal times,because
it is a good film.
 凯文已经看过《这个杀手不太冷》几次了，因为它是一部
好电影。 / 名词 : 凯文。
35

6
 Matcher 类
– Matcher 方法如下：
– Matcher appendReplacement(StringBuffer sb,
String replacement)
将当前匹配子串替换为指定字符串，并且将替换后的子串以
及其之前到上次匹配子串之后的字符串段添加到一个
StringBuffer 对象里
– StringBuffer appendTail(StringBuffer sb)
将最后一次匹配工作后剩余的字符串添加到一个
StringBuffer 对象里
– int end()
返回当前匹配的子串的最后一个字符在原目标字符串中的索
引位置
– int end(int group)
返回与匹配模式里指定的组相匹配的子串最后一个字符的位
置
– boolean find()
尝试在目标字符串里查找下一个匹配子串
36

7
– Pattern pattern()
返回该 Matcher 对象的现有匹配模式，也就是对应的
Pattern 对象
– String replaceAll(String replacement)
将目标字符串里与既有模式相匹配的子串全部替换为指定的
字符串
– String replaceFirst(String replacement)
将目标字符串里第一个与既有模式相匹配的子串替换为指定
的字符串
– Matcher reset()
重设该 Matcher 对象
– Matcher reset(CharSequence input)
重设该 Matcher 对象并且指定一个新的目标字符串
– int start()
返回当前查找所获子串的开始字符在原目标字符串中的位置
– int start(int group)
返回当前查找所获得的和指定组匹配的子串的第一个字符在
原目标字符串中的位置
37

8
 一个 Matcher 实例是被用来对目标
字符串进行基于既有模式（也就是
一个给定的 Pattern 所编译的正则
表达式）进行匹配查找的，所有往
Matcher 的输入都是通过
CharSequence 接口提供的
38

9
 matches()/lookingAt ()/find() ：
– 一个 Matcher 对象是由一个 Pattern 对象
调用其 matcher() 方法而生成的，一旦该
Matcher 对象生成 , 它就可以进行三种不同
的匹配查找操作：
– matches() 方法尝试对整个目标字符展开匹
配检测，也就是只有整个目标字符串完全匹配
时才返回 true
– lookingAt () 方法将检测目标字符串是否以
匹配的子串起始
– find() 方法尝试在目标字符串里查找下一个
匹配子串
– 以上三个方法都将返回一个布尔值来表明成功
与否
39

10
 replaceAll ()
/appendReplacement()/appen
dTail() ：
– Matcher 类同时提供了四个将匹配子
串替换成指定字符串的方法：
– replaceAll()
– replaceFirst()
– appendReplacement()
– appendTail()
40

11
– boolean find(int start)
重设 Matcher 对象，并且尝试在目标字符串里从指定
的位置开始查找下一个匹配的子串
– String group()
返回当前查找而获得的与组匹配的所有子串内容
– String group(int group)
返回当前查找而获得的与指定的组匹配的子串内容
– int groupCount()
返回当前查找所获得的匹配组的数量
– boolean lookingAt()
检测目标字符串是否以匹配的子串起始
– boolean matches()
尝试对整个目标字符展开匹配检测，也就是只有整个目
标字符串完全匹配时才返回真值
41

12
 appendReplacement(StringBuffer
sb, String replacement)
– 将当前匹配子串替换为指定字符串，并且将替换后的子
串以及其之前到上次匹配子串之后的字符串段添加到一
个 StringBuffer 对象里，而
appendTail(StringBuffer sb) 方法则将最后一次
匹配工作后剩余的字符串添加到一个 StringBuffer 对
象里。
– 例如，有字符串 fatcatfatcatfat, 假设既有正则表达
式模式为 "cat" ，第一次匹配后调用
appendReplacement(sb,"dog"), 那么这时
StringBuffer sb 的内容为 fatdog ，也就是 fatcat
中的 cat 被替换为 dog 并且与匹配子串前的内容加到
sb 里，而第二次匹配后调用
appendReplacement(sb,"dog") ，那么 sb 的内容
就变为 fatdogfatdog ，如果最后再调用一次 42

13
 // 该例将把句子里的 "Kelvin" 改为 "Kevin“
 import java.util.regex.*;
 public class MatcherTest{
Exception {
– // 生成 Pattern 对象并且编译一个简单的正则表达
式 "Kelvin“
– Pattern p = Pattern.compile("Kevin");
– // 用 Pattern 类的 matcher() 方法生成一个
Matcher 对象
– Matcher m = p.matcher("Kelvin Li and Kelvin
Chan are both working in Kelvin Chen's
KelvinSoftShop company");
– StringBuffer sb = new StringBuffer();
– int i=0;
– // 使用 find() 方法查找第一个匹配的对象
43

14
– // 使用循环将句子里所有的 kelvin 找出并替换再将内容加到
sb 里
– while(result) {
– i++;
– m.appendReplacement(sb, "Kevin");
– System.out.println(" 第 "+i+" 次匹配后 sb 的内容
是： "+sb);
– // 继续查找下一个匹配对象
– result = m.find();
– }
– // 最后调用 appendTail() 方法将最后一次匹配后的剩余字
符串加到 sb 里；
– m.appendTail(sb);
– System.out.println(" 调用 m.appendTail(sb) 后 sb
的最终内容是 :"+ sb.toString());
– }
 }
44

15
 最终输出结果为：
– 第 1 次匹配后 sb 的内容是： Kevin
– 第 2 次匹配后 sb 的内容是： Kevin Li and
Kevin
Kevin Chan are both working in Kevin
Kevin Chan are both working in Kevin
Chen's Kevin
– 调用 m.appendTail(sb) 后 sb 的最终内容
是： Kevin Li and Kevin Chan are both
working in Kevin Chen's
KevinSoftShop company.
45

16
 group()/group(int
group)/groupCount() ：
– 这些方法都是要返回与组匹配的子串内
容，下面代码将很好解释其用法：
46

17
 public class GroupTest{
Exception {
– Pattern p = Pattern.compile("(ca)(t)");
– Matcher m = p.matcher("one cat,two cats in the
yard");
– boolean result = m.find();
– System.out.println(" 该次查找获得匹配组的数量
为： "+m.groupCount());
– for(int i=1;i<=m.groupCount();i++){
– System.out.println(" 第 "+i+" 组的子串内容为：
"+m.group(i));
– }
– }
 }
47

18
 输出为：
– 该次查找获得匹配组的数量为： 2
– 第 1 组的子串内容为： ca
– 第 2 组的子串内容为： t
48
检验 Email 地址的小程序
4-1
 public class Email {
Exception {
– String input = args[0];
– // 检测输入的 EMAIL 地址是否以非法符号 “ .” 或“ @” 作为
起始字符
– Pattern p = Pattern.compile("^\\.|^\\@");
– Matcher m = p.matcher(input);
– if (m.find()){
– System.err.println("EMAIL 地址不能以 '.' 或 '@' 作为起
始字符 ");
– }
– // 检测是否以“ www.” 为起始
– p = Pattern.compile("^www\\.");
– m = p.matcher(input);
– if (m.find()) {
– System.out.println("EMAIL 地址不能以 'www.' 起始 "); 49
4-2
– // 检测是否包含非法字符
– p = Pattern.compile("[^A-Za-z0-9\\.\\@_\\-
~#]+");
– m = p.matcher(input);
– boolean result = m.find();
– boolean deletedIllegalChars = false;
– while(result) {
– // 如果找到了非法字符那么就设下标记
– deletedIllegalChars = true;
– // 如果里面包含非法字符如冒号双引号等，那么就
把他们消去，加到 SB 里面
– m.appendReplacement(sb, "");
– result = m.find();
– }
50
4-3
– m.appendTail(sb);
– input = sb.toString();
– if (deletedIllegalChars) {
– System.out.println(" 输入的 EMAIL 地
址里包含有冒号、逗号等非法字符，请修
改 ");
– System.out.println(" 您现在的输入为 :
"+args[0]); System.out.println(" 修改后
合法的地址应类似 : "+input);
– }
– }
 }
51
4-4
 例如，我们在命令行输入： java Email
www.kevin@163.net ，那么输出结果将会是：
– EMAIL 地址不能以 'www.' 起始
 如果输入的 EMAIL 为 @kevin@163.net ，则输
出为：
– EMAIL 地址不能以 '.' 或 '@' 作为起始字符
 当输入为： cgjmail#$%@163.net ，那么输出
是：
– 输入的 EMAIL 地址里包含有冒号、逗号等非法字符，请
修改
– 您现在的输入为 : cgjmail#$%@163.net 修改后合法
的地址应类似 : cgjmail@163.net
52
正则表达式应用 3-1
 检查邮政编码
 boolean checkPostcode(){
– Pattern p=Pattern.compile("[0-9]{6}");
– Matcher m=p.matcher(inputStr);
– if (!m.matches()){
– System.out.println("**** 邮政编码格式不符！
*****");
– return false;
– }
– return true;
 }
 “[0-9]{6}” 的意思：一个 [] 只能允许匹配单个字符。
0-9 表示 0 到 9 之间的任意数字， {} 大括号表示匹
配次数，这里就表示匹配 6 次，即必须有 6 个数字
53
 检查 EMAIL
 boolean checkEmail(){
– Pattern p=Pattern.compile("[0-9A-Za-
z]+@([0-9a-zA-Z]+.){1,2}(com|net|cn|
com.cn)");
– Matcher m=p.matcher(inputStr);
– if(!m.matches()){
– System.out.println("**** 电子邮件格式不符
！ *****");
– return false;
– }
– return true;
 } 54
 检查 IP 地址
 boolean ipValid(String s) {
– String regex0="(2[0-4]\\d)" + "|(25[0-5])";
– String regex1="1\\d{2}";
– String regex2="[1-9]\\d";
– String regex3="\\d";
– String regex= "("+regex0+")|("+regex1+")|
("+regex2+")|("+regex3+")";
regex="("+regex+").("+regex+").("+regex+").("+r
egex+")";
– Pattern p=Pattern.compile(regex);
– Matcher m=p.matcher(s);
– return m.matches();
 }
55
常用正则表达式 10-1
 验证日期格式为 YYYY-MM-DD 的正则表达
式为：
– (([0-9]{3}[1-9]|[0-9]{2}[1-9][0-9]{1}|[0-
9]{1}[1-9][0-9]{2}|[1-9][0-9]{3})-
(((0[13578]|1[02])-(0[1-9]|[12][0-9]|
3[01]))|((0[469]|11)-(0[1-9]|[12][0-9]|30))|
(02-(0[1-9]|[1][0-9]|2[0-8]))))|((([0-
9]{2})(0[48]|[2468][048]|[13579][26])|
((0[48]|[2468][048]|[3579][26])00))-02-29)
56
 验证日期格式为 DD/MM/YYYY 的正则表达
式为：
– (((0[1-9]|[12][0-9]|3[01])/((0[13578]|
1[02]))|((0[1-9]|[12][0-9]|30)/(0[469]|11))|
(0[1-9]|[1][0-9]|2[0-8])/(02))/([0-9]{3}[1-
9]|[0-9]{2}[1-9][0-9]{1}|[0-9]{1}[1-9][0-
9]{2}|[1-9][0-9]{3}))|(29/02/(([0-
9]{2})(0[48]|[2468][048]|[13579][26])|
((0[48]|[2468][048]|[3579][26])00)))
57
 匹配中文字符的正则表达式： [\u4e00-
\u9fa5]
 匹配双字节字符 ( 包括汉字在内 ) ： [^\x00-
\xff]
 应用：计算字符串的长度（一个双字节字符长
度计 2 ， ASCII 字符计 1 ）
– String.prototype.len=function(){return
this.replace([^\x00-\xff]/g,"aa").length;}
 匹配空行的正则表达式： \n[\s| ]*\r

 匹配 HTML 标记的正则表达式：
58
 匹配首尾空格的正则表达式： (^\s*)|(\s*$)
 应用： javascript 中没有像 vbscript 那样
的 trim 函数，我们就可以利用这个表达式来
实现，如下： String.prototype.trim =
function() { return this.replace(/(^\s*)|
(\s*$)/g, ""); }
 匹配 Email 地址的正则表达式： \w+([-

+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
 匹配网址 URL 的正则表达式： http://([\w-]
+\.)+[\w-]+(/[\w- ./?%&=]*)?
59
 利用正则表达式去除字串中重复的字符的算
法程序：
– var s="abacabefgeeii"
– var s1=s.replace(/(.).*\1/g,"$1")
– var re=new RegExp("["+s1+"]","g")
– var s2=s.replace(re,"")
– alert(s1+s2) // 结果为： abcefgi
– 思路是使用后向引用取出包括重复的字符，再以
重复的字符建立第二个表达式，取到不重复的字
符，两者串连。这个方法对于字符顺序有要求的
字符串可能不适用
60
 利用正则表达式从 URL 地址中提取文
件名的 javascript 程序如下，结果为
page1
– s=http://www.9499.net/page1.htm
–
s=s.replace(/(.*\/){0,}([^\.]+).*/ig,"$
2")
– alert(s)
61
 利用正则表达式限制网页表单里的文本
框输入内容：
 用正则表达式限制只能输入中文：
– onkeyup="value=value.replace(/[^\
u4E00-\u9FA5]/g,'')“
– onbeforepaste="clipboardData.setD
ata('text',clipboardData.getData('tex
t').replace(/[^\u4E00-\u9FA5]/g,''))"
62
 用正则表达式限制只能输入全角字符：
uFF00-\uFFFF]/g,'')“
t').replace(/[^\uFF00-\uFFFF]/g,''))"
63
 用正则表达式限制只能输入数字：
d]/g,'')“
t').replace(/[^\d]/g,''))"
64
 用正则表达式限制只能输入数字和英文
：
– onkeyup="value=value.replace(/[\W
]/g,'') “
t').replace(/[^\d]/g,''))"
65
小结
66

java正则表达式

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

java正则表达式

Uploaded by

Copyright:

Available Formats

中关 村国际 软件 人才 教育联

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

正则表 达式 匹配规 则 15-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

Java 正则 表达式 API 18-

 匹配空行的正则表达式： \n[\s| ]*\r

 匹配 Email 地址的正则表达式： \w+([-

You might also like

中关村国际软件人才教育联

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

正则表达式匹配规则 15-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-

Java 正则表达式 API 18-