Skip to content

gexiao37/datascience2018

 
 

Repository files navigation

《数据科学Python编程基础》

2018课程

课程描述(Course Description)

本课程注重编程训练、数学建模、可计算思维。本课程致力于介绍python编程和数据科学基础知识。

  • 时间:周三 第5-6节 逸夫楼C-405 1-17周
  • 教师:王成军

王成军,南京大学新闻传播学院副教授,奥美数据科学实验室主任,南京大学计算传播学实验中心副主任。

课程内容

序号 日期 时间 内容 课时数量
1 9月5日 14:00-16:00 引言:数据科学简介/课程简介 2学时
2 9月12日 14:00-16:00 Python基础: IntroductionHow to Run Python CodeBasic Python Syntax 2学时
3 9月19日 14:00-16:00 Python基础: Variables & Operators 2学时
4 9月26日 14:00-16:00 Python基础: Built-In Scalar Types & Data Structures 2学时
5 10月3日 14:00-16:00 国庆节放假(不补课) 0学时
6 10月10日 14:00-16:00 Python基础: Control Flow StatementsDefining FunctionsErrors and Exceptions 2学时
7 10月17日 14:00-16:00 Python基础: Iterators & List Comprehensions 2学时
8 10月24日 14:00-16:00 Python基础: Generators and Generator ExpressionsModules and PackagesStrings and Regular Expressions 2学时
9 10月31日 14:00-16:00 统计基础:描述数据概率 2学时
10 11月7日 14:00-16:00 统计基础:假设检验梯度递减 0学时
11 11月14日 14:00-16:00 统计基础:回归分析 2学时
12 11月21日 14:00-16:00 数据科学: Introduction to NumPy 2学时
13 11月28日 14:00-16:00 数据科学:Data Manipulation with Pandas 2学时
14 12月5日 14:00-16:00 数据科学: Visualization with Matplotlib 2学时
15 12月12日 14:00-16:00 数据科学:Machine Learning 2学时
16 12月19日 14:00-16:00 数据科学:Machine Learning 2学时
17 12月26日 14:00-16:00 数据科学:Machine Learning 2学时

Mybinder

Mybinder.org turns a GitHub repo into a collection of interactive notebooks. Have a repository full of Jupyter notebooks? With Binder, open those notebooks in an executable environment, making your code immediately reproducible by anyone, anywhere.

https://hub.mybinder.org/user/computational-c-datascience2018-x6d61dtj/tree

可选研究项目

本课程鼓励采用公开的竞赛数据作为研究项目。现有数据竞赛平台很多,包括KaggleDataFoundation阿里云天池大赛DC竞赛BienData等。

曾使用过的题目

  1. 分析《权力的游戏》中的核心人物及其演变

A Network analysis of Game of Thrones: Analyze the network of characters in Game of Thrones and how it changes over the course of the books. https://www.datacamp.com/projects/76

Get the Data

  • Winter is Coming. Let's load the dataset ASAP
  • Time for some Network of Thrones
  • Populate the network with the DataFrame
  • Finding the most important character in Game of Thrones
  • Evolution of importance of characters over the books
  • What's up with Stannis Baratheon?
  • What does the Google PageRank algorithm tell us about Game of Thrones?
  • Correlation between different measures
  • Conclusion
  1. Kaggle比赛数据分析 《众包模式下的数据科学编程比赛》
  1. IMDB电影数据 《让电影成功的元素:基于IMDB数据的分析》

案例分析

参考书(Recommended Textbooks)

相关课程

About

Introduction to Python Programming for Data Science

Resources

License

MIT, Unknown licenses found

Licenses found

MIT
LICENSE-CODE
Unknown
LICENSE-TEXT

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 98.6%
  • Other 1.4%