爬取证券之星数据
一、实验目的
掌握使用urllib库访问目标网址,BeautifulSoup库解析网页,获得网页静态加载的数据信息的方法。
二、实验内容
创建一个爬虫项目StockStar,用于爬取证券之星的部分信息,主要包括代码、简称、流通市值(万元)、总市值(万元)、流通股本(万元)、总股本(万元),其网址为:http://quote.stockstar.com/stock/ranklist_a.shtml,具体要求如下:
1. 使用urllib库、requests库访问网站,使用bs4库、lxml库解析网页。
2. 获取数据后,用NumPy库、Pandas库将其格式化为DataFrame
3. 用Python3自带的sqlite3库,将数据本地存储在数据库中。
4. 从数据库中读取数据并创建为DataFrame,再打印数据作为展示。
三、作业提交要求
完成实验报告(见附件模板),将源代码和实验报告一起压缩打包提交至学习平台。
评论0