html - 这个 " "叫什么?

标签 html utf-8 ansi

<分区>

我正在尝试解析一个网站,并且我正在尝试替换字符串中所有出现的“”。这似乎不是空格或制表符,这是什么?

一个更一般的问题:如何搜索一些您不知道的字符的名称?我试过 ansiutf-8没有结果的页面。

最佳答案

它是字符代码 12288,a/k/a 用于许多亚洲语言等的表意空间。您可以使用以下代码进行检查:

alert( " ".charCodeAt(0) );

More info here.

编辑:您可以将其与正则表达式 \s 匹配。例如,这会将所有这些字符转换为单个常规空格(字符 32):

"foo bar baz".replace(/\s/g, ' '); // produces foo bar baz

要替换此字符但保留“正常”空格(字符 32、制表符、换行符、回车符),您可以尝试这样做:

"foo bar baz\tblah\tblah\nblah".replace(/(?![ \t\r\n])\s/g, ' ')

关于html - 这个 " "叫什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/24816826/

相关文章:

mysql - 使用 Mysql 和 Hibernate 时表情符号的字符集编码问题

html - 在浏览器中呈现终端输出

c - 取消初始化整数指针的赋值

html - 如何将图像宽度和高度继承到视频标签

python - 网页抓取空白返回 - 错误的元素

javascript - 如何在 Canvas 上绘制两段 div

c++ - C 结构元素对齐 (ansi)

html - 表格元素左右边框重叠

java - java中utf8转gb2312

c++ - Tesseract OCR 德语特殊字符