java解析html

 /**

     * 替换掉的形式的字符串为空字符串〈简述〉 〈详细描述〉

     * 

     * @author gongsf

     * @param html html源文件

     * @return

     */

    public static String dealImage(String html) {

        // html = "

        // src='ff' width='44' height='444' />

";

        // 要被过滤的字符串

        String str = html.replaceAll(".*", "[图片]").replaceAll(

            "", "[图片]");

        return str;

    }

 

    /**

     * html去除格式,只剩纯文字〈简述〉 〈详细描述〉

     * 

     * @author gongsf

     * @param html html源文件

     * @return

     */

    public static String dealHtml(String html) {

        return html.replaceAll("]+>", "");

    }

你可能感兴趣的:(Java)