收录了 python正则 频道下的 50 篇内容
本文介绍Python语言的正则表达式
正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配
正则表达式在程序开发中会经常用到,比如数据(格式)验证、替换字符内容以及提取字符串内容等等情况都会用到,但是目前许多开发人员对于正则表达式只是处于了解或者是基本会用的阶段。一旦遇到大批量使用正则表达式的情况(例如网络爬虫)可以说基本上就抓瞎
上篇文章我们讲解了Python re模块的简单使用,本篇文章我们将讲解re模块更高级的用法。
Copilot可能对样板代码较多且元编程功能有限的语言(例如Go)更有用。
字符串的处理在数据清洗中占比很大。也就是说,很多不规则的数据处理都是在对字符串进行处理。Excel提供了拆分、提取、查找和替换等对字符串处理的技术。在Pandas中同样提供了这些功能,并且在Pandas中还有正则表达式技术的加持,让其字符串处理能力更加强大。
当接触一个新知识点或者技术时,只要问完哲学中的三大问题,基本就对这个知识点或者技术有大致的了解,这也是我学习一个新技术常用的方法,那到底是哪三大问题呢?
JSON JSON 是用于存储和交换数据的语法,是一种轻量级的数据交换格式。 使用场景接口数据传输序列化配置文件
本系列文章出自于作者自身在学习正则表达式的过程中所经历过的真切体会和真实痛点。出于更偏向于实践运用的目的,本系列文章不会花费过多的笔墨在DFA、NFA等过于深入的正则表达式幕后技术细节的讲解上。本系列文章后续将会涉及到的内容:首先会大致简单介绍一下正则表达式语法基础,接下来对元字符、元转义序列、特殊构造(特殊结构)等正则表达式的语法元素进行逐个详解;之后,再讲解一下匹配模式、POSIX字符组方括号表达式以及字符组运算;最后是正则表达式各语法元素优先级介绍。