脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - pampy超强的模式匹配工具的实现

pampy超强的模式匹配工具的实现

2021-12-11 11:15Python测试开发 Python

在自然语言处理界,模式匹配可以说是最常用的技术。甚至可以说,将NLP技术作为真实生产力的项目都少不了模式匹配。本文就介绍了pampy超强的模式匹配工具的实现,感兴趣的可以了解一下

何为模式匹配

模式匹配即给定某种模式,用这种模式去检查序列或字符串是否符合这种模式,这种技术在自然语言处理中经常使用。

下载pampy

?
1
pip install pampy

栗子

单个字符匹配

以下代码可以完成单个字符在对象中的匹配,使用_表示匹配结果。

?
1
2
3
4
5
6
7
8
9
from pampy import _,match
 
a=['a',1,'b',2,'c',3,'d',4]
 
patter = ['a',1,'b',2,'c',3,'d',_]
 
action=lambda x: f'result is: {x}'
 
print(match(a,patter,action))

执行结果:

>>> python test.py
>>> result is: 4

匹配开头和结尾

对于开头或者结尾连续的对象,我们可以使用这种方式实现快速匹配。

?
1
2
3
4
5
6
7
8
9
from pampy import _,match,HEAD,TAIL
 
a=['a',1,'b',2,'c',3,'d',4]
 
patter = [HEAD,_,'b',2,'c',3,TAIL]
 
action=lambda h,b,t: ({'head':h,'body':b,'tail':t})
 
print(match(a,patter,action))

执行结果:

>>> python test.py
>>> {'head': 'a', 'body': 1, 'tail': ['d', 4]}

以上,我们使用HEAD匹配了开头的若干字符,中间使用_匹配了某个数字,结尾我们使用TAIL配了若干字符。

匹配字典的key

当我们只知道某个字典的部分内容,却想要得到某个value的key时,用这种方式事半功倍。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
from pampy import _,match,HEAD,TAIL
 
my_dic={
    'phone':{'huawei':'ok','iphone':'good','chuizi':'bad'},
    'language':{
        'chinese':['xian','beijing'],
        'english':['usa','canada']
    }
}
patter = {_:{_:'ok'}}
 
action=lambda a,b: {'key1':a,'key2':b}
 
print(match(my_dic,patter,action))

运行结果:

>>> python test.py
>>> {'key1': 'phone', 'key2': 'huawei'}

如上,我们已经匹配到了字典的第一层和第二层的Key值。

如上面的例子,我们的模式一定要保持字典结构的完整。

使用

特性1: HEAD 和 TAIL

HEAD和TAIL能代表某个模式的前面部分或后面部分。

比如将特定模式后的元素都变成元组:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
from pampy import match, HEAD, TAIL, _
 
x = [-1, -2, -3, 0, 1, 2, 3]
 
print(match(x, [-1, TAIL], lambda t: [-1, tuple(t)]))
# => [-1, (-2, -3, 0, 1, 2, 3)]
 
将特定模式前的元素设为集合,后面的元素设为元组:
 
from pampy import match, HEAD, TAIL, _
 
x = [-1, -2, -3, 0, 1, 2, 3]
 
print(match(x, [HEAD, _, _, 0, TAIL], lambda h, a, b, t: (set([h, a, b]), tuple(t))))
# => ({-3, -1, -2}, (1, 2, 3))

特性2:甚至能匹配字典中的键

在你不知道哪个键下有某个值的时候,这招非常好用:

?
1
2
3
4
5
6
7
8
9
10
11
from pampy import match, HEAD, TAIL, _
my_dict = {
    'global_setting': [1, 3, 3],
    'user_setting': {
        'face': ['beautiful', 'ugly'],
        'mind': ['smart', 'stupid']
    }
}
result = match(my_dict, { _: {'face': _}}, lambda key, son_value: (key, son_value))
print(result)
# => ('user_setting', ['beautiful', 'ugly'])

特性3: 搭配正则

不仅如此,它还能搭配正则一起使用哦:

?
1
2
3
4
5
6
7
8
import re
from pampy import match, HEAD, TAIL, _
def what_is(pet):
    return match(pet,
        re.compile('(\\w+),(\\w)\\w+鳕鱼$'),     lambda mygod, you: you + "像鳕鱼",
    )
 
print(what_is('我的天,你长得真像鳕鱼'))     # => '你像鳕鱼'

到此这篇关于pampy超强的模式匹配工具的实现的文章就介绍到这了,更多相关pampy 模式匹配工具内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://juejin.cn/post/6981735556690477063

延伸 · 阅读

精彩推荐