[原]Python爬虫编程思想(49):Beautiful Soup环境搭建
2021-10-10 22:09:25 Author: blog.csdn.net(查看原文) 阅读量:24 收藏

目录

1. Beautiful Soup简介

2. 安装Beautiful Soup

1. Beautiful Soup简介

        Beautiful Soup是一个强大的基于Python语言的XML和HTML解析库,可以用它来方便地从网页中提取数据,那么Beautiful Soup到底有什么功能呢?先看一段对Beautiful Soup的标准解释。

        Beautiful Soup提供了一些简单的函数来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,由于Beautiful Soup非常简单,所以可以用非常少的代码写出一个完整的HTML分析程序,再加上requests库,可以写出非常简洁且强大的爬虫应用。

        Beautiful Soup自动将输入的文档转换为Unicode编码,输出文档转换为UTF-8编码,所以在使用Beautiful Soup的过程中并不需要考虑编码问题,除非文档没有指定编码方式,这时只需要指出输入文档的编码方式即可。


文章来源: https://blog.csdn.net/nokiaguy/article/details/120692121
如有侵权请联系:admin#unsafe.sh