江开江苏开放大学数据采集与预处理第一次形考作业最新答案

爬取证券之星数据

一、实验目的

掌握使用urllib库访问目标网址，BeautifulSoup库解析网页，获得网页静态加载的数据信息的方法。

二、实验内容

创建一个爬虫项目StockStar，用于爬取证券之星的部分信息，主要包括代码、简称、流通市值(万元)、总市值(万元)、流通股本(万元)、总股本(万元)，其网址为：http://quote.stockstar.com/stock/ranklist_a.shtml，具体要求如下：

1. 使用urllib库、requests库访问网站，使用bs4库、lxml库解析网页。

2. 获取数据后，用NumPy库、Pandas库将其格式化为DataFrame

3. 用Python3自带的sqlite3库，将数据本地存储在数据库中。

4. 从数据库中读取数据并创建为DataFrame，再打印数据作为展示。

三、作业提交要求

完成实验报告（见附件模板），将源代码和实验报告一起压缩打包提交至学习平台。

社交账号快速登录