#coding=utf-8 import re s = 'hi新手oh'.decode('utf-8') #举个栗子是字符串s,为了匹配下文的unicode形式,所以需要解码 p = re.compile(ur'[u4e00-u9fa5]') #这里是精髓,[u4e00-u9fa5]是匹配所有中文的正则,因为是unicode形式,所以也要转为ur print p.split(s) #使用re库的split切割
Copyright © 2019- igat.cn 版权所有 赣ICP备2024042791号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务