前言:此本版是中文教程,在英文的教程的基础上翻译过来的
中文版下载:http://pan.baidu.com/s/1i3knK81
英文原版参考:http://jsoup.org/cookbook/
一、入门
- 解析和遍历一个html文档
二、输入
- 解析一个html字符串
- 解析一个body片断
- 根据一个url加载Document对象
- 根据一个文件加载Document对象
三、数据抽取
- 使用dom方法来遍历一个Document对象
- 使用选择器语法来查找元素
- 从元素集合抽取属性、文本和html内容
- URL处理
- 程序示例:获取所有链接
四、数据修改
- 设置属性值
- 设置元素的html内容
- 设置元素的文本内容
五、html清理
- 消除不受信任的html (来防止xss攻击)