
python
Roar Boil
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python爬虫练习1:计算评分平均值
练习要求: 抽取某本书的前50条短评内容并计算评分的平均值。提示:有的评论中并不包含评分。 代码: # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import requests from bs4 import BeautifulSoup import re import time to...原创 2019-08-25 19:12:39 · 3421 阅读 · 1 评论 -
BeautifulSoup简单Python爬取
数据抓取 利用request库 import requests r = requests.get("https://movie.douban.com/subject/3541415/comments") 文本解析 利用BeautifulSoup from bs4 import BeautifulSoup soup = BeautifulSoup(r.text, 'lxml') pattern =...原创 2019-08-22 15:10:54 · 167 阅读 · 0 评论 -
正则表达式简单python爬取
python中正则表达式的一些基本点 例如要在一篇文档中寻找字符串he,则可以使用正则表达式he,它可以匹配出字符串he,如果忽略大小写的话还可以匹配出He、HE这样的字符串,这是最简单的正则表达式。但这种方式除了匹配出单独的he外还会匹配例如“hello”中的he。如果只想找出字符串he,可以使用元字符“\b”,它匹配单词的开始或结尾,即单词边界,因此可用“\bhe\b”匹配字符串he。再例如正...原创 2019-08-22 17:09:26 · 372 阅读 · 0 评论 -
python爬虫练习2:取道指成分股数据
练习要求: 在“http://money.cnn.com/data/dow30/”上抓取道指成分股数据并将30家公司的代码、公司名称和最近一次成交价放到一个列表中输出。 代码: # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import requests import re r = r...原创 2019-08-26 16:18:10 · 2812 阅读 · 0 评论 -
简单平台用户信息管理系统
要求: 用字典创建一个平台的用户信息(包含用户名和密码)管理系统,新用户可以用与现有系统帐号不冲突的用户名创建帐号,已存在的老用户则可以用用户名和密码登陆重返系统。 实现代码: # -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ lib = {"admin":"123456"} def ne...原创 2019-08-28 16:51:07 · 902 阅读 · 0 评论 -
DataFrame小练习
练习要求: 已知有一个列表中存放了一组音乐数据: music_data = [(“the rolling stones”,“Satisfaction”),(“Beatles”,“Let It Be”),(“Guns N’ Roses”,“Don’t Cry”),(“Metallica”,“Nothing Else Matters”)] 请根据这组数据创建一个如下的DataFrame: ...原创 2019-08-29 11:16:49 · 841 阅读 · 0 评论