- 博客(10)
- 资源 (1)
- 收藏
- 关注
原创 阿里云天池cv入门赛记录(5)——TASK5 模型集成
这次赛题学习的最后一个任务,是学校如何使用集成学习提高预测精度。知识点包括:集成学习方法,深度学习中的集成学习和结果后处理思路。(虽然我跑一次要一天,还不一定成功,但要坚持学习) 1、集成学习方法 常见的集成学习方法有堆叠,装袋和提升,同时这些集成学习方法与具体验证集划分联系紧密。 下面假设建造了10折交叉验证,训练得到10个CNN模型。 那么在10个CNN模型可以使用如下方式进行集成: 对预测的结果的概率值进行平均,然后解码为特定字符 对预测的字符进行投票,得到最终字符。 2、深度学习中的集成学习
2020-06-02 22:21:25
309
原创 阿里云天池cv入门赛记录(4)——TASK4 模型训练与验证
在学习这章内容之前,作为小白一直对“训练集”“验证集”的概念和作用非常模糊,“过拟合”具体是什么意思也没有深入的了解。本次任务就是对这些在训练和验证模型的过程中遇到的问题进行的讲解。 1、学习目标 理解验证集的作用,并使用训练集和验证集完成训练 学会使用Pytorch环境下的模型读取和加载,并了解调参流程 2、如何构造验证集? 在具体回答“如何构造验证集”这个问题之前,作为小白,需要搞清楚几个概念。(训练集、验证集、测试集、过拟合、欠拟合……) 首先,先来明确几个“集”的作用: 训练集(Train S
2020-05-30 23:14:59
498
原创 阿里云天池cv入门赛记录(3)——TASK3 字符识别模型
前面进行了赛题的理解和赛题数据的读取,这次的任务是学习从头搭建一个字符识别模型。 1、CNN介绍 卷积神经网络(简称CNN)是一类特殊的人工神经网络,是深度学习中重要的一个分支。CNN在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。 CNN每一层由众多的卷积核组成,每个卷积核对输入的像素进行卷积操作,得到下一次的输入。随着网络层的增加卷积核会逐渐扩大感受野,并缩减图像的尺寸。 CNN是一种层次模型,输入的是原始
2020-05-26 19:08:23
342
原创 力扣数据库178题——分数排名
最近在学习SQL语句,主要使用MySQL,在力扣上打卡解题,记录一下大神们的解法。 题目 编写一个SQL查询来实现分数排名。 如果两个分数相同,则两个分数排名(Rank)相同,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。 例如,根据上述给定的Scores表,你的查询应该返回(按分数从高到低排列): **题解(总结了大神们的)**以下 总结来自“猴子”:《经典排名问题》 以班级种学生的成绩为例,查询学生的排名问题。 “班级表”中的内容如下,记录了每个学生所在的班级和对应
2020-05-25 17:10:23
963
原创 阿里云天池cv入门赛记录(2)——TASK2 数据读取与数据扩增
经过前几天的pytorch安装、anaconda重装等一系列问题,cv小白终于把baseline跑通了!!但是,对于代码仍然有很多地方不理解,好在从TASK2开始,就是对问题的详细讲解了。 任务二的主要内容是数据读取、数据扩增方法和Pytorch读取赛题数据三个部分。 一、常用的图像读取方法 对于图像数据的处理,首先需要完成对图像数据的读取操作,在Pytorch中有很多库可以完成,比较常见的有Pillow和OpenCV。(之前只用过openCV做图像变换,没有了解过Pillow) 1、Pillow 首先放上
2020-05-22 21:23:30
587
原创 Windows10 + anaconda+pytorch(含anaconda卸载重装)
为了参加天池入门级的cv竞赛,重新安装了pytorch 和anaconda 之前做过简单的cv项目,但是pytorch版本较低,不适用这次的竞赛(小白不懂) 于是决定升级pytorch的版本,但是引发了一系列的问题,一整天都在装包了。。。。。 问题一:新创建虚拟环境失败 应该是网络超时的原因,忘记截图了,可能是当时家里网络极差,但是我以为是镜像的原因(当时使用的是清华源)。所以恢复了默认源。 问题二:conda更新失败 恢复默认源后,创建虚拟环境提示要升级conda,但是update以后很快就结束了,更新失
2020-05-19 21:47:23
3704
1
原创 阿里云天池cv入门赛记录(1)——TASK1 赛题理解、beseline跑通
赛题名称:零基础入门CV之街道字符识别 赛题任务:以计算机视觉中字符识别为背景,要求选手预测街道字符编码,是一个典型的字符识别问题。为了简化难度,赛题数据采用公开数据集SVHN。 一、赛题数据 赛题以街道字符为赛题数据,来自收集的SVHN街道字符,并进行了匿名采样处理。 训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置:为了比赛公平性,测试集A包括4W张照片,测试集B包括4W张照片。 为了降低难度,提供了训练集、验证集和测试集中所有字符的位置框。 二、数据
2020-05-19 21:19:57
2183
1
转载 阿里云天池cv入门赛记录(0)—— 开块地立个flag
cv小白和师妹一起组队学习,参加天池“零基础入门CV赛事- 街景字符编码识别”竞赛。赛题以计算机视觉中字符识别为背景,要求选手预测真实场景下的字符识别,是一个典型的字符识别问题。 一、赛题数据 赛题来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。 数据集报名后可见并可下载,该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和
2020-05-18 17:45:27
349
原创 使用Python制作疫情数据分析可视化图表(三)
python小白,在“一心学”公众号学习了一点疫情数据分析可视化的课程,记录下来,供小白参考。 目录 一、基本数据的查看和初步处理 二、时间序列与区域划分 三、快速查看不同省市疫情现状 四、累计确诊病例走势 五、不同省市确诊新增情况 六、全国疫情动态可视化 七、制作数据地图 八、如何用气泡图制作数据地图 第一、二章内容发布在(使用Python制作疫情数据分析可视化图表(一),https://blo...
2020-03-09 20:59:01
6633
原创 使用Python制作疫情数据分析可视化图表(二)
python小白,在“一心学”公众号学习了一点疫情数据分析可视化的课程,记录下来,供小白参考。 目录 一、基本数据的查看和初步处理 二、时间序列与区域划分 三、快速查看不同省市疫情现状 四、累计确诊病例走势 五、不同省市确诊新增情况 六、全国疫情动态可视化 七、制作数据地图 八、如何用气泡图制作数据地图 第一章内容发布在(使用Python制作疫情数据分析可视化图表(一))https://blog....
2020-03-01 10:57:58
6526
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人