```pythonimport re
html = ExampleHello, world!
pattern = rmatches = re.findall
print```
``````
这里使用的是一个非常简单的正则表达式 ``,它匹配任何以 `` 结束的字符序列。这只是一个基本的例子,实际上,处理HTML的正则表达式可能会更复杂,因为HTML的语法允许嵌套和属性。
二、正则表达式基础
字符集:使用方括号[]定义字符集,如[0-9]表示匹配任意数字。
量词:用于指定匹配的次数,如表示匹配0次或多次。
分组:使用括号()将多个字符组合成一个整体,如(a|b)表示匹配a或b。
反向引用:使用\\1、\\2等引用分组中的内容,如(a)\\2表示匹配第二个分组中的内容。
正则表达式:/]>/
正则表达式://
正则表达式:/] )>/