最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

中文的正则表达式

互联网 admin 1浏览 0评论

中文的正则表达式

中文的正则表达式

可用于爬取txt文件中的中文字符
编码方式:UTF-8
正则表达式:[\u4e00-\u9fa5]
原理:像[a-z]一样,包括了由utf-8编码的所有中文字符
例:
`# coding:utf-8

import re

string = ‘我是个好人。’
pattern =’[\u4e00-\u9fa5]+’
pat = re.compile(pattern)

print(pat.findall(string)[0])`

中文的正则表达式

中文的正则表达式

可用于爬取txt文件中的中文字符
编码方式:UTF-8
正则表达式:[\u4e00-\u9fa5]
原理:像[a-z]一样,包括了由utf-8编码的所有中文字符
例:
`# coding:utf-8

import re

string = ‘我是个好人。’
pattern =’[\u4e00-\u9fa5]+’
pat = re.compile(pattern)

print(pat.findall(string)[0])`

发布评论

评论列表 (0)

  1. 暂无评论