- 博客(4)
- 收藏
- 关注
原创 美团电话面试总结
1.数据库优化 MySQL数据库优化的八种方式(经典必看) http://www.cnblogs.com/zhyunfe/p/6209074.html 2.hashtable与hashmap区别 3、spring MVC流程 4、mongodb与oracle区别 5、常用数据结构,arraylist与linkedlist区别 6、分布式锁,乐观锁 7、事务管理,sess
2017-09-12 09:36:47
2365
原创 初学Spark的一些笔记
1、为什么推荐用scala ①性能开销小 ②最新版本和最好性能 ③有助于更了解spark scala可以在同一个环境中完成所有数据处理和分析,不用考虑数据本身在何处存放和在何处处理。 2、spark编程模型 在输入数据集上定义一组转换 调用action(存储) 运行本地计算(执行) 3、记录关联问题
2016-12-08 13:38:32
341
原创 数据挖掘导论 笔记
引论 1.1为什么进行数据挖掘? 信息时代的来临不贴切,我们的时代其实是数据时代,还没有真正步入信息时代,现在数据爆炸增长,需要将数据转化为知识。 1.2什么是数据挖掘? 即KDD,数据中的数据发现 知识发现的迭代步骤为:1)数据清理2)数据集成3)数据选择4)数据变换5)数据挖掘6)模式评估7)知识表示 广义的数据挖掘可表述为:从大量数据中挖掘有趣模式和知识的过程。 1.3可以挖掘
2016-11-30 22:15:30
1247
原创 第三届全国高校云计算应用创新大赛---KDDCUP1999数据集
今年报名参加了第三届全国高校云计算应用创新大赛,报名了技能组,下载了技能组的第一题《基于Spark的大数据聚类算法》,其中使用的数据集为KDDCUP1999,根据自己在网上搜集的一些信息,总结如下。 1.数据来源: 1998 年林肯实验室建立了模拟美国空军局域网的一个网络环境,收集了9 周时间的网络链接和系统审计数据,仿真各种用户类型、各种不同的网络流量和攻击手段,使它就像一个真实的网络环境。
2016-11-30 20:46:34
2649
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人