您的位置: 翼速应用 > 业内知识 > Java > 正文

如何在Java中删除HTML标签

    Java删除了html标签的各种姿势。


    一、背景

    在业务开发中可能有必要删除所有html标签。本文集成了各种方法供您参考。


    二、方法

    2.1 纯正则方法

如何在Java中删除HTML标签1.png

    2.2 使用 javax.swing.text.html.HTMLEditorKit

如何在Java中删除HTML标签2.png

    2.3 使用Jsoup框架

如何在Java中删除HTML标签3.png

    2.4 使用Apache Tika

如何在Java中删除HTML标签4.png

    注意这里经过本人实验有个小坑,WriteOutContentHandler参数是限制的字符数,这个如果不设置默认是1万,超过会报异常。


    具体的jar包请自行到中央仓库里搜索依赖配置


    三、提供一个工具类

    可以将资源路径的文本类型文件(如json/html)读取成字符串

如何在Java中删除HTML标签5.png

    四、摘要


    有多种删除html标签的方法。建议在实际使用它们之前进行测试。  

 

    第3节中提供的工具可用于在测试期间读取资源文件。  

 

    如果正则表达式不能满足您的需求,则可以自己进一步对其进行优化。  

 

    如果仍然存在其他情况未考虑的特殊情况,则可以使用常规规则删除此特殊情况。  

 

    简而言之,这只是参考,并提供了多种解决方案。

我来说两句

0 条评论

推荐阅读

  • 响应式布局CSS媒体查询设备像素比介绍

    构建响应式网站布局最常见的是流体网格,灵活调整大小的站点布局技术,确保用户在使用的幕上获得完整的体验。响应式设计如何展示富媒体图像,可以通过以下几种方法。

    admin
  • 提升网站的性能快速加载的实用技巧

    网站速度很重要,快速加载的网站会带来更好的用户体验、更高的转化率、更多的参与度,而且在搜索引擎排名中也扮演重要角色,做SEO,网站硬件是起跑线,如果输在了起跑线,又怎么跟同行竞争。有许多方法可提升网站的性能,有一些技巧可以避免踩坑。

    admin
  • 织梦CMS TAG页找不到标签和实现彩色标签解决方法

    织梦cms是我们常见的网站程序系统的一款,在TAG标签中常常遇到的问题也很多。当我们点击 tags.php 页的某个标签的时候,有时会提示:“系统无此标签,可 能已经移除!” 但是我们检查程序后台,以及前台显示页面。这个标签确实存在,如果解决这个问题那?

    admin
  • HTML关于fieldset标签主要的作用

    在前端开发html页面中常用的标签很多,今天为大家带来的是关于HTML中fieldset标签主要的作用说明,根据技术分析HTML

    admin

精选专题