python之解析html 作者:马育民 • 2019-01-15 16:07 • 阅读:10101 # 概述 模拟浏览器向web服务器发请求,得到服务器返回的html数据后,要对html进行分析,得到真正有价值的数据 HTML代码比较复杂,内嵌js、css,而且代码不严谨,有时代码有错误,强大的浏览器仍然能够智能纠错,正常显示,但是,给我们解析html带来巨大负担 # 解析html库 在python中,有很多解析html的库,本课程主要介绍: 1. HTMLParser 内置的 **HTMLParser** 库,可以解析html,使用起来有些小复杂 2. BeautifulSoup python中解析html的第三方库层出不穷,目前使用较广泛的是BeautifulSoup库 原文出处:http://www.malaoshi.top/show_1EF2cH88ZhmA.html