python剔除空格\u3000 - 知乎专栏

文章推薦指數: 80 %
投票人數:10人

python剔除空格\u3000. 1 年前· 来自专栏Python日常使用 ... \u3000. 这个是全角的空格符号. [hex(ord(s)) for s in '中国'] ... 首发于Python日常使用无障碍写文章登录/注册有些文本中,或者是爬虫爬下来的数据,会有一些特殊的符号,就空格就会有很多种类型通常的空格是0x20[hex(ord(s))forsin'中国']\xa0爬取网页的时候,经常会遇到\xa0,表示不间断空白符对HTML了解的话, 是表示空格的,\u3000这个是全角的空格符号[hex(ord(s))forsin'中 国']剔除这些空格的方式使用正则表达式msg=' 奥奥奥奥奥奥  奥奥 '2.split函数''.join(msg.split())3.unicodedata这个库里有一个normalize函数,可以将其他特殊的空格转换为标准的空格,然后使用replace替换就行importunicodedataasucd ucd.normalize('NFKC',msg).replace('','')发布于2021-02-0113:55Python​赞同5​​添加评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录Python日常使用Python相关的各种内容



請為這篇文章評分?