python_Roar Boil的博客-CSDN博客

python

关注

关注数：文章数：6 文章阅读量：8515 文章收藏量：26

作者: Roar Boil

这个作者很懒，什么都没留下…

展开

专栏收录文章

python爬虫练习1:计算评分平均值

练习要求：抽取某本书的前50条短评内容并计算评分的平均值。提示：有的评论中并不包含评分。代码： # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import requests from bs4 import BeautifulSoup import re import time to...

原创 2019-08-25 19:12:39 · 3421 阅读 · 1 评论
BeautifulSoup简单Python爬取

数据抓取利用request库 import requests r = requests.get("https://movie.douban.com/subject/3541415/comments") 文本解析利用BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup(r.text, 'lxml') pattern =...

原创 2019-08-22 15:10:54 · 167 阅读 · 0 评论
正则表达式简单python爬取

python中正则表达式的一些基本点例如要在一篇文档中寻找字符串he，则可以使用正则表达式he，它可以匹配出字符串he，如果忽略大小写的话还可以匹配出He、HE这样的字符串，这是最简单的正则表达式。但这种方式除了匹配出单独的he外还会匹配例如“hello”中的he。如果只想找出字符串he，可以使用元字符“\b”，它匹配单词的开始或结尾，即单词边界，因此可用“\bhe\b”匹配字符串he。再例如正...

原创 2019-08-22 17:09:26 · 372 阅读 · 0 评论
python爬虫练习2:取道指成分股数据

练习要求：在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。代码： # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import requests import re r = r...

原创 2019-08-26 16:18:10 · 2812 阅读 · 0 评论
简单平台用户信息管理系统

要求：用字典创建一个平台的用户信息（包含用户名和密码）管理系统，新用户可以用与现有系统帐号不冲突的用户名创建帐号，已存在的老用户则可以用用户名和密码登陆重返系统。实现代码： # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ lib = {"admin":"123456"} def ne...

原创 2019-08-28 16:51:07 · 902 阅读 · 0 评论
DataFrame小练习

练习要求：已知有一个列表中存放了一组音乐数据： music_data = [(“the rolling stones”,“Satisfaction”),(“Beatles”,“Let It Be”),(“Guns N’ Roses”,“Don’t Cry”),(“Metallica”,“Nothing Else Matters”)] 请根据这组数据创建一个如下的DataFrame： ...

原创 2019-08-29 11:16:49 · 841 阅读 · 0 评论

python

作者: Roar Boil

python爬虫练习1:计算评分平均值

BeautifulSoup简单Python爬取

正则表达式简单python爬取

python爬虫练习2:取道指成分股数据

简单平台用户信息管理系统

DataFrame小练习