Scrapy-Xpath
标签[1]与extract_first()
//div[@class=title]/a[1] #所有div标签中的第一个a
//div[@class=title]/a.extract_first() #所有的div标签下的a标签构成的列表的第一个元素 as=response.xpath(//*/div[@class="guide"])
[<Selector xpath='descendant-or-self::title' data='<title>Quotes to Scrape</title>'>] 利用for循环,对上述符合条件的节点进行筛选
# 在使用extract之前才可以继续筛选
as=response.xpath('//*/div[@class="guide"]')
for a in as:
a.xpath("p/text()") re模块的替换
xpath选择某标签的属性值
打开json文件必须在同一目录
选取属于 bookstore 子元素的最后一个 book 元素
选取带有属性的div节点
分层次过滤节点
元素的兄弟节点
Last updated