1.1、设置变量set@变量名=值1.3、replace()函数和length()函数组合化一个etree对象,且需要将解析的页面源码数据加载到该数据中。
创新互联公司主营邢台县网站建设的网络公司,主营网站建设方案,重庆APP开发公司,邢台县h5重庆小程序开发搭建,邢台县网站营销推广欢迎邢台县等地区企业咨询
楼主可以用BeautifulSoup
from bs4 import BeautifulSoup
s= BeautifulSoup("html")
liTag = s.find('li')
把采集过来的数据进行list列表切割,删掉列表里的第0个元素?
解决你的问题了么
二营长SEO
在if 里只需要yield "" + item_url.attrs['href']
然后Lsit(最好改可名,在python规范里,函数命名是全小写,而list又是保留字,比如改为display_hrefs)只需要循环输出getUrl的结果就好:
def getUrl(url: str):
....html = urlopen(url)
....for item_url in BeautifulSoup((html.read()).find ('div' , class_='AAA').findAll ("a"):
........if 'href' in item_url.attrs:
............yield "" + item_url.attrs['href']
def display_hrefs(url: str):
....for href in getUrl(url):
........print(href)
if __name__ == '__main__':
....display_hrefs("")