【AICon】探索八个行业创新案例,教你在教育、金融、医疗、法律等领域实践大模型技术! >>> 了解详情
写点什么

python匹配中文

收录了 python匹配中文 频道下的 50 篇内容

正则表达式(二):Unicode 诸问题(上)

关于正则表达式的文档很多,但大部分都是英文的,即便有中文的文档,也翻译或改编自英文文档。在介绍功能时,这样做没有大问题,但真要处理文本,就可能会遇到一些英文开发或应用环境中难得见到的问题。比如中文之类多字节字符的匹配,就是如此。所以,这篇文章专门谈谈正则表达式如何处理多字节字符,更准确地说,是如何处理Unicode编码的文本(为什么只提到Unicode编码,而没有提到其它编码,理由在后面详述)。

R和Python可以兼得吗?
R 和 Python 可以兼得吗?

R和Python有很多相似之处,也有很多不同之处。

Vim 7.4 发布,带来了更快的正则表达式引擎及 1000 多项修复和小改进

经过一个多月的测试后,Vim 7.4于近日发布。该版本更健壮,并且带来了一个更快的新正则表达式引擎。

PyCon 大会首次登陆中国

PyCon作为全球Python爱好者的盛会已在世界各地多个城市举办过活动,本月3号、4号,PyCon首次登陆中国,多位重量级嘉宾一同为国内的Python爱好者带来了一场饕餮盛宴。

刨根究底正则表达式之二:正则表达式基础

计算机世界中有一些非常基础、重要、应用广泛而又特别容易让人困惑的主题,比如字符编码、字节序(即大小端表示)浮点数实现、日期时间处理以及正则表达式等等,而正则表达式是其中的典型代表。然而正则表达式作为那种没用过的话,不觉得对自己有什么影响,一旦用过并且用熟练了,就再也回不去了的神器,要熟练掌握并能灵活运用,实非易事。 那到底应该怎样才能最高性价比地掌握正则表达式这个神器呢?这正是我写这个系列文章的目的。

Transcrypt:剖析 Python 转 JavaScript 编译器

在Web前端,开发千篇一律地使用了JavaScript。Transcrypt的Python转JavaScript编译器是一个相对较新的开源项目,意在使用大小近似的文件以JavaScript的速度执行Python 3.6。本文中,Jacques de Hooge介绍了构建源码到源码的编译器(transpiler)中的需求,以及Transcrypt是如何构建满足这些需求的。

正则表达式(三):Unicode 诸问题(下)

上一篇文章我们介绍了和Unicode有关的匹配问题,这篇文章我们主要讲述一下Unicode编码本身的特性,以便更好地运用正则表达式解决与Unicode相关的问题。

正则表达式(五):浅谈两种匹配操作

在正则表达式中,匹配是最最基本的操作。使用正则表达式,换种说法就是“用正则表达式去匹配文本”。但这只是广义的“匹配”,细说起来,广义的“匹配”又可以分为两类:提取和验证。所以,本篇文章就来专门讲讲提取和验证。

刨根究底正则表达式之三:定界符与转义符

计算机世界中有一些非常基础、重要、应用广泛而又特别容易让人困惑的主题,比如字符编码、字节序(即大小端表示)浮点数实现、日期时间处理以及正则表达式等等,而正则表达式是其中的典型代表。然而正则表达式作为那种没用过的话,不觉得对自己有什么影响,一旦用过并且用熟练了,就再也回不去了的神器,要熟练掌握并能灵活运用,实非易事。 那到底应该怎样才能最高性价比地掌握正则表达式这个神器呢?这正是我写这个系列文章的目的。

刨根究底正则表达式之一:正则表达式概述

本系列文章出自于作者自身在学习正则表达式的过程中所经历过的真切体会和真实痛点。出于更偏向于实践运用的目的,本系列文章不会花费过多的笔墨在DFA、NFA等过于深入的正则表达式幕后技术细节的讲解上。本系列文章后续将会涉及到的内容:首先会大致简单介绍一下正则表达式语法基础,接下来对元字符、元转义序列、特殊构造(特殊结构)等正则表达式的语法元素进行逐个详解;之后,再讲解一下匹配模式、POSIX字符组方括号表达式以及字符组运算;最后是正则表达式各语法元素优先级介绍。

针对Python开发人员的10个“疯狂”的项目构想
针对 Python 开发人员的 10 个“疯狂”的项目构想

你可以通过这些有趣但也具有挑战性的项目来增强 Python 编程技能。

正则表达式(一):纠结的转义

正则表达式一直是开发者工具箱中趁手的利器,但很多人对此仍是一知半解。这次InfoQ中文站有幸邀请到来自盛大创新院的余晟,开辟《正则表达式》的专栏,为读者讲解正则表达式的一些技巧和概念。本文为开篇——纠结的转义。

如何通过几行 Python 代码,使用BERT进行词嵌入?
如何通过几行 Python 代码,使用 BERT 进行词嵌入?

词嵌入这么简单?

使用 Intel Analytics Zoo 在客户服务平台中引入 AI
使用 Intel Analytics Zoo 在客户服务平台中引入 AI

本文分享了微软Azure中国团队在Azure客户支持平台上使用Intel Analytics Zoo构建QA排名模块的实践经验。

架构的百年大计
架构的百年大计

本文讲述了关于知识共享、师徒制和构建(及改造)系统的方方面面。

LLVM:Swift、Rust、Clang 等语言的强大后盾

在软件开发领域,我们看到一些新的开发语言和改进如雨后春笋般涌现。它们为开发人员在开发速度、安全性、便利性、可移植性和功能上提供了多种选择。这可部分归因于我们具备了构建语言尤其是编译器的新工具,其中首屈一指的就是LLVM。LLVM不仅简化了新语言的创建工作,而且提升了现有语言的发展。本文介绍了LLVM的功能和使用机制,并未来发展做了展望。

InfoQ 中文站投稿须知

InfoQ中文站诚挚欢迎大家投递原创的稿件和新闻!如果您有意为InfoQ中文站撰稿,下面的一些指南性内容对您可能会有帮助,在提交您的文章之前请仔细阅读。

动态语言企业应用优缺点浅析

动态语言的兴起已经有些年头了。现在,人们早已不再去争论动态语言是否能够取代静态语言,越来越多的开发者开始在动态语言更为擅长的领域应用它们。本文简要分析了动态语言的优势和不足。

怒肝半月!Python 学习路线 + 资源大汇总

Python 学习路线 by 鱼皮。

Python
人工智能
大数据
算法
数据分析
python匹配中文专题_资料-InfoQ中文网