Python爬虫程序设计KC24课件

PPT

阅读 67 次
下载 0 次
页数 13 页
大小 60.746 KB
2022-11-24 上传

下载文档10.00 元 加入VIP免费下载

此文档由【小橙橙】提供上传，收益归文档提供者，本网站只提供存储服务。若此文档侵犯了您的版权，欢迎进行违规举报或版权认领

可在后台配置第一页与第二页中间广告代码

可在后台配置第二页与第三页中间广告代码

可在后台配置第三页与第四页中间广告代码

还剩5页未读，继续阅读

【这是免费文档，您可以免费阅读】

/ 13

下载文档10.00 元 加入VIP免费下载

TA最新上传

文本内容

【文档说明】Python爬虫程序设计KC24课件.pptx，共(13)页，60.746 KB，由小橙橙上传

转载请保留链接：https://www.ichengzhen.cn/view-44424.html

以下为本文档部分文字说明：

2.4.1获取元素节点的父节点2.4.1获取元素节点的父节点BeautifulSoup通过：tag.parent获取tag节点的父节点，其中根节点<html>的父节点是名称为[document]的节点，这个[document]节点的父节点是None。例2-4-1

：找出文档中<pclass="title">TheDormouse'sstory的元素节点的所有父节点的名称。frombs4importBeautifulSoupdoc='''<html><head><

title>TheDormouse'sstory</title></head><body><pclass="title">TheDormouse'sstory<pclass="story">Onceuponat

imetherewerethreelittlesisters;andtheirnameswere<ahref="http://example.com/elsie"class="sister"id="link1">Elsie</a>,<ahref

="http://example.com/lacie"class="sister"id="link2">Lacie</a>and<ahref="http://example.com/tillie"class="sister"id="link3">Tillie

</a>;andtheylivedatthebottomofawell.<pclass="story">...</body></html>'''soup=BeautifulSoup(doc,"lxml")print(soup.name)tag=soup.find("b")w

hiletag:print(tag.name)tag=tag.parent程序结果：[document]bpbodyhtml[document]由此可见节点的父节点依次为、<body>、<html>2.4.2获取元素节点的直接子元素节点2.4.2获取元素节点的直

接子元素节点BesutifulSoup通过：tag.children获取tag节点的所有直接子节点，包括element、text等类型的节点。例2-4-2：获取元素的所有直接子元素节点frombs4impor

tBeautifulSoupdoc='''<html><head><title>TheDormouse'sstory</title></head><body><pclass="title">TheDormouse'sstory

Onceuponatime...</body></html>'''soup=BeautifulSoup(doc,"lxml")tag=soup.find("p")forxintag.children:print(x)程序结果：TheDormouse's<

/i>storyOnceuponatime...节点下面有2个直接子节点元素，一个是element类型的节点TheDormouse'sstory，另外一个是text类型的节点Onceuponatime...2.4.

3获取元素节点的所有子孙元素节点2.4.3获取元素节点的所有子孙元素节点BesutifulSoup通过：tag.desendants获取tag节点的所有子孙节点元素，包括element、text等类型的节点。例2-4-3：获取元素的所有子孙元素节点frombs4importBeautif

ulSoupdoc='''<html><head><title>TheDormouse'sstory</title></head><body><pclass="title">TheDormouse'sstoryOnceuponatime...</p

></body></html>'''soup=BeautifulSoup(doc,"lxml")tag=soup.find("p")forxintag.descendants:print(x)程序结果：TheDormous

e'sstoryTheDormouse'sDormouse'sstoryOnceuponatime...由此可见元素节点下面有下面几个子孙节点：The:这是一个text孙子节点，它是的子节点；<i

>Dormouse's:这是下面的一个element孙子节点，是的子节点；Dormouse's:这是下面的孙子text节点，即Dormouse's的子节点；story：这是下面的孙子text节点，它是<b

>的子节点；Onceuponatime...：它是下面的text子节点；2.4.4获取元素节点的兄弟节点BesutifulSoup通过：tag.next_siblingtag.previous_sibling来获取下一个和前一个兄弟节

点，其中tag.next_sibling是tag的临近的下一个兄弟节点，tag.previous_sibling是tag的临近的前一个兄弟节点。例2-4-4：查找前后兄弟节点frombs4importBeautifulSoupdoc='''<html><head

><title>TheDormouse'sstory</title></head><body><pclass="title">TheDormouse'sstoryOnceuponatime...</body></html>'''soup=B

eautifulSoup(doc,"lxml")tag=soup.find("b")print(tag.previous_sibling)print(tag.next_sibling)tag=soup.f

ind("i")print(tag.previous_sibling)print(tag.next_sibling)程序结果：NoneOnceuponatime...Thestory由此可见节点的前面兄

弟节点为None，下一个兄弟节点是text节点"Onceuponatime.."，节点的前一个兄弟节点是text节点"The"，下一个是text节点"story"。

小橙橙

文档分享，欢迎浏览！

文档 6209
被下载 8
被收藏 0

TA的店铺

Python爬虫程序设计KC24课件

乡镇药具干部培训课件-

消化道疾病常用药物治疗进展正式课件

消毒药械及一次性医疗卫生用品课件

小儿癫痫用药原则课件

小儿临床用药培训课件

乡镇卫生院药学人员培训临床药理学培训课件

消化系统消化系统疾病的临床用药培训课件

消化系统常见疾病的药物治疗课件

消毒防腐药医学宣教培训课件

消化系常见病的药物治疗原则课件