Sublime如何一键删除所有HTML标签？Sublime正则提取纯文本

　　发布于2026-04-28　阅读（0）

扫一扫，手机访问

Sublime如何一键删除所有HTML标签？Sublime正则提取纯文本

为什么`<[^>]>`比`<.?>`更安全

很多朋友一上手就习惯用<.*?>这种模式，觉得“非贪婪”就能解决所有问题。但实际在Sublime Text里，这个表达式相当脆弱：一旦遇到换行就会中断匹配，如果标签属性里包含引号（比如alt="A > B"），它也会提前收尾。更麻烦的是，它会不分青红皂白地删除和块里的所有内容，这显然不是我们想要的结果。

相比之下，<[^>]*>这个表达式的设计就巧妙得多。它利用了一个HTML标签的本质约束：一个完整的标签内部，绝对不能出现另一个“>”符号。通过否定字符集[^>]来匹配“尖括号内不含>的所有字符”，它完美避开了跨行匹配的问题，也不会误伤属性值或脚本、注释里的特殊符号，兼容性和可靠性自然高出一个层级。

怎么避免删掉`<`这类实体或破坏结构

这里需要明确一点：正则表达式删除标签，本身并不处理HTML实体。所以，像<这样的字符会被当作普通文本保留下来，但开头的&符号并不会自动转换回&。如果你需要完整的HTML实体解码，那得额外走一步，比如在Python里调用html.unescape()，或者在浏览器环境使用DOMParser。

更关键的问题在于结构破坏。如果原始HTML里包含

Sublime如何一键删除所有HTML标签？Sublime正则提取纯文本