webmagic高级:(四)

          本篇呢,本来打算写一下,pipeline里面的ResultItems对象,但是呢,简单看了一下,里面东西不是很多。所以呢,我这次说,这个selectable 对象,也就是节点对象,就想jsoup里面element对象.不过呢,这个对象内容较多所以,我们就只看一下他的接口,而不去看他的很多个实现类了!


selectable

前面呢,我们说过webmagic呢,是一个集成了jquery选择器,css选择器,跟正则选择器,xpath,正则选择器,等诸多选择器于一身的爬虫框架,而我们在这里的时候呢,就蛀牙看看他们的使用方法!

public Selectable xpath(String xpath);//xpath选择器

public Selectable $(String selector);//jquery选择器

public Selectable $(String selector, String attrName);//jquery选择器

public Selectable css(String selector);//css选择器器

public Selectable  css(String selector, String attrName);//css选择器

public Selectable smartContent();//智能内容

public Selectable  links();//获取整个页面的所有的连接

public Selectable regex(String regex);//正则表达式获取数据

public Selectable regex(String regex, int group);//正则表达式获取数据

public Selectable replace(String regex, String replacement);//正则表达式字符串你替换

public String toString();//转成string

public String get();//获取字符串

public boolean match();//判断是否正确,一般跟正则表达式混用

public List all();// 获取字符串类型 的list

public Selectable jsonPath(String jsonPath);//使用jsonPath 来获取数据

public Selectable select(Selector selector);//查询某个节点  没用过

public Selectable selectList(Selector selector);//查询每个节点 没用过

public List nodes();//获取内部是节点的List

以上呢,就是SelectTable 的一些方法,已经我所知道的某些方法,关于那些我没有使用过的方法,欢迎哥哥大佬,为我指点一下,告诉我这些方法还怎么使用! 

你可能感兴趣的:(webmagic高级:(四))