脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Ruby - ruby 正则表达式 教程

ruby 正则表达式 教程

2019-11-23 17:54ruby教程网 Ruby

ruby 正则表达式 教程

我们再看一个更有趣的程序.这次我们来测试一个字符串是否和一个由简明模式(concise pattern)编码产生的描述相匹配. 

在这些模式(pattern)里,一些字符或字符组合都有独特的意义,包括:  

复制代码代码如下:


[]  范围描述符 (比如,[a - z] 表示在a 到 z 范围内的一个字母)    

\w  字母或数字;相当于 [0-9A-Za-z]   

\W  非字母,数字   

\s  [ \t\n\r\f]空字符;相当于 [ \t\n\r\f]   

\S  非空字符   

\d  [0-9]数字;相当于 [0-9]   

\D  非数字字符   

\b  退格符 (0x08) (仅在范围描述符内部时)   

\b  字边界(word boundary) (在范围描述符外部时)   

\B  非字边界   

*  前面元素出现0或多次   

+  前面元素出现1或多次   

{m,n}  前面元素最少出现m次,最多出现n次   

?  前面元素最多出现1次;相当于 {0,1}   

|  与前面或后面的表达式匹配   

()  群( grouping)   



那些模式中共同使用的古怪词汇叫做正则表达式.就象Perl一样,Ruby也用前斜杠(而不是双引号)将它们括起来.如果你以前从未使用过正则表达式,也许它们看起来除了规则(regular)什么都不是,但花上一点儿时间了解它们是明智的.当你需要对字符串进行模式匹配,查找或其它操作时,它的高效的表达能力能治好你的头痛(并节约很多行代码). 

举个例子,设想我们想要测试一个字符串是否符合这样的描述信息"由小写f开头,跟一个大写字母,并可能跟许多非小写字母在后面."如果你是一个老练的C程序员,大概你的头脑里已经装满几十行程序了,对不对?承认吧,你难以控制住自己.在Ruby里,你只需要将你的字符串用正则表达式/^f[A-Z](^[a-z])*$/检验一下就可以了. 

那"一个由<>括起来的16位数呢"?没问题. 

复制代码代码如下:


ruby> def chab(s)   # "contains hex in angle brackets"  
    |    (s =~ /<0(x|X)(\d|[a-f]|[A-F])+>/) != nil  
    | end  
  nil  
ruby> chab "Not this one."  
  false  
ruby> chab "Maybe this? {0x35}"    # wrong kind of brackets  
  false  
ruby> chab "Or this? <0x38z7e>"    # bogus hex digit  
  false  
ruby> chab "Okay, this: <0xfc0004>."  
  true   



虽然,初看起来正则表达式挺让人头痛的,但你很快会因能够如此高效地表达出你心中的意思而感到满足. 

下面是一个可以帮助你实验正则表达式的小程序,把它存为regx.rb,然后在命令行里输入'ruby regx.rb'运行. 

复制代码代码如下:


# Requires an ANSI terminal!  
st = "\033[7m"  
en = "\033[m"  
while TRUE    
    print "str> "    
    STDOUT.flush    
    str = gets    
    break if not str    
    str.chop!    
    print "pat> "    
    STDOUT.flush    
    re = gets    
    break if not re    
    re.chop!    
    str.gsub! re, "#{st}\\&#{en}"    
    print str, "\n"  
end  
print "\n"   



这个小程序要求输入两次,一次字符串,一次正则表达式.输入的字符串由正则表达式检验,然后用反视高亮度显示所有匹配部分.先别管细节,等会儿就有代码分析. 

复制代码代码如下:


str> foobar  
pat> ^fo+  
foobar  
~~~   


上面红色部分将在程序输入中以反视表示出.下面的"~~~"行是为了方便那些使用基于字符浏览器的人. 

我们再试几个输入: 

str> abc012dbcd555 
pat> \d 
abc012dbcd555  


如果让你感到惊讶,看看本页开头部分的那个表格: \d与字母d无关,而是对应于单个数字. 

如果有不止一种方法能匹配模式会怎样呢? 

str> foozboozer 
pat> f.*z 
foozboozer 
~~~~~~~~   


之所以foozbooz被匹配而不只是fooz,是因为一个正则表达符尽可能匹配最长的子串. 

下面是一个将冒号分隔的数字时间段从字符串中隔离出来的模式匹配. 

str> Wed Feb  7 08:58:04 JST 1996 
pat> [0-9]+:[0-9]+(:[0-9]+)? 
Wed Feb  7 08:58:04 JST 1996  


"=~"是一个用于匹配正则表达式的匹配(matching)运算符;它会返回在字符串里找到的匹配的位置,或者返回 nil 表示模式无法匹配. 

ruby> "abcdef" =~ /d/ 
   3 
ruby> "aaaaaa" =~ /d/ 
   nil   

延伸 · 阅读

精彩推荐
  • RubyRuby简洁学习笔记(一):字符串、数字、类和对象

    Ruby简洁学习笔记(一):字符串、数字、类和对象

    这篇文章主要介绍了Ruby简洁学习笔记(一):字符串、数字、类和对象,本文是学习笔记第一篇,需要的朋友可以参考下 ...

    脚本之家2472020-04-20
  • RubyRuby设计模式编程中使用Builder建造者模式的实例

    Ruby设计模式编程中使用Builder建造者模式的实例

    这篇文章主要介绍了Ruby设计模式编程中使用Builder建造者模式的实例,建造者模式将一个复杂对象的构造与它的表示分离,使同样的构建过程可以创建不同的表...

    范孝鹏2192020-05-07
  • Ruby简要说明Ruby中的迭代器

    简要说明Ruby中的迭代器

    这篇文章主要介绍了Ruby中的迭代器,迭代器的概念在动态语言的编程中十分重要,文章中介绍了Ruby中的each迭代器和collect迭代器,需要的朋友可以参考下 ...

    goldensun2772020-04-25
  • RubyRuby进行文件信息输出实例代码

    Ruby进行文件信息输出实例代码

    Ruby进行文件信息输出实例代码,数据是随机的,所以每次的记录都会不同。 ...

    ruby教程网2962020-04-10
  • RubyCentOS中配置Ruby on Rails环境

    CentOS中配置Ruby on Rails环境

    经过一个上午的折腾,终于把ROR环境在CentOS中搞定,绕了很多弯路,把文章写下来总结一下 ...

    可乐加糖4762020-04-12
  • RubyRuby迭代器的7种技巧分享

    Ruby迭代器的7种技巧分享

    这篇文章主要介绍了Ruby迭代器的7种技巧分享,Ruby中的迭代器非常人性化,本文既是讲解了7个技巧也是讲解了7种迭代器,需要的朋友可以参考下 ...

    脚本之家4782020-04-20
  • RubyRuby环境下安装使用bundler来管理多版本的gem

    Ruby环境下安装使用bundler来管理多版本的gem

    这篇文章主要介绍了Ruby环境下安装使用bundler来管理多版本的gem的方法,举了Ruby On Rails中的应用实例来进行演示,需要的朋友可以参考下 ...

    日拱一卒4332020-05-10
  • Ruby剖析 Ruby 访问控制

    剖析 Ruby 访问控制

    前面,我们说 Ruby 没有函数,只有方法.而且实际上有不止一种方法.这一节我们介绍 访问控制 (accesscontrols). 想想当我们在最高层而不是在一个类的定义里定义...

    ruby教程网3572020-04-08