urllib_百度的百度一下


#获取网页源码
#解析服务器响应文件
#打印
import urllib.request
url='https://www.baidu.com'
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299'
}
request=urllib.request.Request(url=url,headers=headers)
response=urllib.request.urlopen(request)
content=response.read().decode('utf-8')
#print(content)
from lxml import etree
html=etree.HTML(content)
#xpath返回值是一个列表
result=html.xpath('//input[@id="su"]/@value')[0]
print(result)

CodeWorld

#Project,Python,Spider

urllib_百度的百度一下

https://ianwusb.blog/2024/07/26/urllib_百度的百度一下/

作者

Ianwusb

发布于

2024年7月26日

许可协议

urllib_代理的基本使用上一篇

urllib_站长素材下一篇