- 博客(43)
- 资源 (46)
- 收藏
- 关注
原创 AI 深度学习面试题学习
首先冻结除了顶部改动层以外的所有层参数,对顶层进行训练,这个过程可以理解为顶层的域适应训练,主要用来训练适应模型的现有特征空间,防止顶层糟糕的初始化,对已经具备一定表达能力的层的干扰和破坏,影响最终的性能。中更靠近底部的层(定义模型时先添加到模型中的层)编码的是更加通用的可复用特征,而更靠近顶部的层(最后添加到模型中的层)编码的是更专业化的特征。存在一定技巧),随机初始化模型通常不具有任何预测能力,通常需要大量的数据或者特定域的数据进行从零开始的训练,这样需要训练到优秀的模型通常是稍困难的。
2025-07-02 11:37:01
946
原创 SVM原理、公式与参数说明
对于样本量N>10,000的数据集,优先考虑LinearSVC(线性专用)或SGDClassifier(loss='hinge'),它们的时间复杂度为O(N)而非O(N²)注:图中展示了参数变化对决策边界的影响,实际调参应结合交叉验证。支持向量机(SVM)是一种基于。
2025-06-30 12:35:29
644
原创 机器学习,支持向量机svm和决策树xgboost介绍
XGBoost 代表了梯度提升集成方法的巅峰,凭借其卓越的预测性能、高效的工程实现、强大的正则化能力和对实际数据问题(如缺失值、特征缩放)的友好处理,使其成为当前结构化数据建模(尤其是中大型数据集)的。在实践中,XGBoost (及其同类如 LightGBM, CatBoost) 的应用范围通常比 SVM 更广泛,尤其在追求预测精度的竞赛和工业界场景中。支持向量机 (SVM) 和 XGBoost 都是非常强大且应用广泛的机器学习算法,但它们基于不同的原理,各有其优势和劣势,适用于不同的场景。
2025-06-30 12:16:46
769
原创 LSTM、GRU 与 Transformer网络模型参数计算
LSTM 单元包含 4 个门控结构(输入门、遗忘门、候选单元、输出门)GRU 单元包含 3 个门控结构(更新门、重置门、候选门)
2025-06-23 23:08:33
500
原创 ELMo 说明解析及用法
与传统静态词嵌入(如 Word2Vec、GloVe)不同,ELMo 生成的词向量会随上下文动态变化,解决了多义词和复杂语境下的语义表示问题。(Embeddings from Language Models)是由 AllenNLP 在 2018 年提出的。计算句子对的语义相似度(如问答匹配、 paraphrase 检测)。利用 ELMo 捕捉上下文敏感的实体边界(如人名、地名)分类、命名实体识别(NER)和语义相似度计算等任务。根据上下文动态区分多义词的不同含义。
2025-06-22 20:09:45
289
原创 LSTM网络模式介绍
LSTM:长短期记忆网络(LSTM,Long Short-Term Memory)是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的RNN都具有一种重复神经网络模块的链式形式。RNN梯度消失是因为激活函数tanh函数的倒数在0到1之间,反向传播时更新前面时刻的参数时,当参数W初始化为小于1的数,则多个(tanh函数’ * W)相乘,将导致求得的偏导极小(小于1的数连乘),从而导致梯度消失。最终的输出结果是上面两步的结果的一个函数。
2025-06-22 18:03:33
559
原创 Tensor的常用计算方法(torch示例说明)
Tensor(张量)是多维数组的泛化概念,在深度学习和科学计算中被广泛使用。以下是Tensor的常用计算方法,涵盖基础操作和高级应用。
2025-06-21 13:17:20
327
原创 Word2Vec介绍
0.123, -0.456, 0.789, ... ] # 'cat' 的词向量 [('milk', 0.85), ('sits', 0.79), ...] # 与 'cat' 相似的词。Word2Vec的实现说明及代码示例,涵盖原理概述、使用Gensim的实践示例,以及关键步骤的底层实现思路。:通过训练使语义相似的词在向量空间中距离更近。
2025-06-19 19:38:30
381
原创 One-Hot、BOW、TF-IDF、N-Gram区别
特性One-HotBOW (词袋模型)TF-IDFN-Gram基本单元单个词单个词单个词连续的 N 个词序列核心信息词是否存在 (0/1)词在当前文档中的频率词在当前文档中的重要性(TF * IDF)局部词序(上下文片段)频率信息❌ (只有存在性)✅ (词频)✅ (加权词频)✅ (N-Gram 频次或加权频次)词序信息❌❌❌✅ (在 N 窗口内)语义信息❌❌❌⚠️ (有限,仅局部共现)维度/稀疏性极高维 / 极稀疏高维 / 稀疏高维 / 稀疏极高维V^N) /极稀疏。
2025-06-18 15:02:08
665
原创 GRU神经网络
决定了上一时刻的隐藏状态有多少信息需要被更新为当前时刻的候选隐藏状态同样接收当前输入和上一时刻的隐藏状态,通过 Sigmoid 函数计算出一个介于 0 到 1 之间的值。越接近 1,说明上一时刻的隐藏状态被更新的越多。结构复杂度:GRU 的结构相对 LSTM 更简单,它只有两个门控机制和一个隐藏状态,而 LSTM 有三个门控机制(输入门、遗忘门、输出门)和一个细胞状态,因此 GRU 的计算量相对较小,训练速度更快。这意味着当前隐藏状态是上一时刻隐藏状态和候选隐藏状态的加权组合,权重由更新门决定。
2025-06-05 16:21:59
387
转载 zookeeper源码分析-服务器的各个角色及其细节分析
Zookeeper的服务器角色一、前言 前一篇已经详细的讲解了Zookeeper的Leader选举过程,下面接着学习Zookeeper中服务器的各个角色及其细节。二、服务器角色 2.1 Leader Leader服务器是Zookeeper集群工作的核心,其主要工作如下 (1) 事务请求的唯一调度和处理者,保证集群事务处理的顺序性。 (2) 集群内部各服务器的调度者。 1. 请求处理链 使用责任链来处理每个客户端的请求时Zookeeper的特色,Leader服
2021-01-02 12:53:30
211
转载 zookeeper源码分析-Processor保证数据一致性
zookeeper源码分析,Processor保证数据一致性入口书接上篇博客中的ZK集群启动后完成数据的统一性恢复后,来到启动ZkServer的逻辑,接下来的重点工作就是启动不同角色的对应的不同的处理器Processor如上图查看ZooKeeperServer的继承图,三种不同的角色有不同的ZooKeeperServer的实现逻辑类三者启动时,都将会来到ZooKeeperServer.java中的startUp()方法中,源码如下,但是,不同的角色针对setupRequestPro...
2021-01-02 12:11:09
354
转载 ZooKeeper分析-Leader选举
Zookeeper的整体分析,了解了基本的运作原理和整体架构,即分布式系统中协调之力的重要性。本篇我们就来深入分析这个协调服务的服务器启动和Leader选举,带你更深入解读什么叫迷之自信的“自荐式”选举逻辑。服务器启动注:ZooKeeper分为单机启动和集群启动两种方式。本文仅分析集群启动这种方式。DatadirCleanupManager历史文件清理器。从3.4.0版本开始,ZooKeeper增加了自动清理历史数据文件的机制,包括对事务日志和快照数据文件进行定时清理...
2021-01-02 12:06:32
387
原创 AWK学习
使用方法 1 awk'{pattern + action}'{filenames} 尽管操作可能会很复杂,但语法总是这样,其中 pattern 表示 AWK 在数据中查找的内容,而 action 是在找到匹配内容时所执行的一系列命令。花括号({})不需要在程序中始终出现,但它们用于根据特定的模式...
2020-01-08 23:14:22
185
转载 分布式事务-TCC服务设计和实现
一、TCC简介TCC是一种比较成熟的分布式事务解决方案,可用于解决跨库操作的数据一致性问题;TCC是服务化的两阶段编程模型,其Try、Confirm、Cancel 3个方法均由业务编码实现;其中Try操作作为一阶段,负责资源的检查和预留,Confirm操作作为二阶段提交操作,执行真正的业务,Cancel是预留资源的取消;如下图所示,业务实现TCC服务之后,该TCC服务将作为分布式事...
2019-08-24 00:04:36
344
转载 TCC 分布式事务
|0业务场景介绍咱们先来看看业务场景,假设你现在有一个电商系统,里面有一个支付订单的场景。那对一个订单支付之后,我们需要做下面的步骤:更改订单的状态为“已支付” 扣减商品库存 给会员增加积分 创建销售出库单通知仓库发货这是一系列比较真实的步骤,无论大家有没有做过电商系统,应该都能理解。2|0进一步思考好,业务场景有了,现在我们要更进一步,实现一个 TCC...
2019-08-23 23:58:33
239
原创 RocketMQ 源码合集
消息队列中间件 RocketMQ 源码分析 —— Message 发送与接收 消息队列中间件 RocketMQ 源码分析 —— Message 存储 分布式消息队列 RocketMQ 源码分析 —— Message 拉取与消费(上) 分布式消息队列 RocketMQ 源码分析 —— Message 拉取与消费(下) 分布式消息队列 RocketMQ 源码...
2019-08-18 15:47:27
279
转载 限流算法
限流算法:计数器、滑动窗口、漏桶、令牌桶。限流方案:Guava的RateLimiter、Alibaba Sentinel大家都知道,对于高并发的业务场景,我们为了保障服务的稳定,经常会祭出三大利器:缓存、熔断降级和服务限流。服务限流作为一个核心的自保护机制,能够在非常高并发的情况下,其他机制都无法保障降级的情况下,保护系统不崩溃,以免产生雪崩效应。...
2019-08-11 19:39:10
214
转载 分布式系统数据分片
分布式系统,尤其是分布式存储系统,需要解决的两个最主要的问题即数据分片和数据冗余,下图形象生动地解释了其概念和区别:图片来源于:http://book.mixu.net/distsys/intro.html其中数据A、B即属于数据分片,原始数据被拆分成两个正交子集分布在两个节点上。而数据集C属于数据冗余,同一份完整的数据在两个节点都有存储。当然,在实际的分布式系统中,数据分...
2019-08-10 17:08:03
856
原创 分布式事务
分布式一致性事务为了解决分布式一致性问题,产生了不少经典的分布式一致性算法,本文将介绍其中的2PC和3PC。2PC即Two-Phase Commit,译为二阶段提交协议。3PC即Three-Phase Commit,译为三阶段提交协议。分布式系统和分布式一致性问题 分布式系统,即运行在多台不同的网络计算机上的软硬件系统,并且仅通过消息传递来进行通信和协调。 分布式一致性问题,...
2019-08-10 12:58:16
141
原创 持续集成环境搭建
1. Maven3安装1.1下载maven 版本:3.0.3 下载地址:http://maven.apache.org/download.html1.2安装maven JDK:jdk1.6 [1] 解压缩apache-maven-3.0.3-bin.zip 到你想安装的位置,如D:/maven3。 [2]设置Maven系统环境变量,M2_
2016-06-09 11:19:23
8898
转载 sql优化,in与exist , not in与not exist 的区别
in和exists in 是把外表和内表作hash 连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询。一直以来认为exists比in效率高的说法是不准确的。 如果查询的两个表大小相当,那么用in和exists差别不大。 如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in: 例如:表A(小表),表B(大表)1:sel
2015-04-22 13:18:36
1062
转载 Hadoop1.0.4集群安装
一 安装计划 虚拟机:VMware9.0 http://www.linuxidc.com/Linux/2012-11/73743.htm 操作系统:CentOS5.8 http://www.linuxidc.com/Linux/2012-03/56303.htm Hadoop:Hadoop1.0.4 网段为:192.168.201.1 三个节点分别
2015-01-11 21:53:18
782
转载 Centos linux NFS服务器的安装、配置
NFS服务器的安装、配置 一、NFS服务简介 NFS 是Network File System的缩写,即网络文件系统。一种使用于分散式文件系统的协定,由Sun公司开发,于1984年向外公布。功能是通过网络让不同的机器、不同的操作系统能够彼此分享个别的数据,让应用程序在客户端通过网络访问位于服务器磁盘中的数据,是在类Unix系统间实现磁盘文件共享的一种方法。 NFS 的基
2015-01-11 21:37:56
644
原创 dbcp源码解读与对象池原理剖析
apache common-pool工具库是对池化技术原理和具体实现. 对象池(ObjectPool接口): 可以把它认为是一种容器, 它是用来装池对象的, 并且包含了用来创建池对象的工厂对象 池对象:就是要放到池容器中的对象, 理论上可以是任何对象. 对象池工厂(ObjectPoolFactory接口):用来创建对象池的工厂, 这个没什么好说的. 池对象工厂(Poolab
2014-12-05 23:41:01
8046
原创 Centos linux安装MySQL-5.6.4
CentOS6.3安装MySQL5.6.41.下载MySQL我下载的版本:mysql-5.5.22.tar.gz 2.安装之前先卸载CentOS自带的MySQL[root@localhost ~]# yum remove mysql 3.编译安装Cmake下载cmake源码包:http://www.cmake.org/files/v2.8/cmake-2.8.4
2014-03-08 16:01:35
22158
转载 Spring事务配置
Spring事务配置的五种方式 前段时间对Spring的事务配置做了比较深入的研究,在此之间对Spring的事务配置虽说也配置过,但是一直没有一个清楚的认识。通过这次的学习发觉Spring的事务配置只要把思路理清,还是比较好掌握的。 总结如下: Spring配置文件中关于事务配置总是由三个组成部分,分别是DataSource、TransactionManager和
2013-05-22 21:01:00
624
原创 CentOS5.4 安装过程(图解)
CentOS5.4 安装过程(图解) 一:虚拟机配置:网络连接选择桥接模式 二:开始安装CentOS5.4进入CentOS安装界面,直接回车。注意:如果你实际机器的内存是512或者是更低,将会提示你内存不足以支持图形界面安装,一般玩技术最好是安装2G内存或者更高 三:输入回车键以后将进入光驱检查界面:如果你存在光驱的话依旧选择OK,如果
2012-12-23 12:22:26
4644
原创 DB2代码 错误信息描述
DB2错误信息(按sqlcode排序) sqlcode sqlstate 说明00000000SQL语句成功完成01xxxSQL语句成功完成,但是有警告+01201545未限定的列名被解释为一个有相互关系的引用+098015
2012-08-30 10:17:14
3077
原创 解读JVM中的对象生命周期
<br />详细解读JVM中的对象生命周期<br /> <br />在JVM运行空间中,对象的整个生命周期大致可以分为7个阶段:创建阶段(Creation)、应用阶段(Using)、不可视阶段(Invisible)、不可到达阶段(Unreachable)、可收集阶段(Collected)、终结阶段(Finalized)与释放阶段(Free)。上面的这7个阶段,构成了 JVM中对象的完整的生命周期。下面分别介绍对象在处于这7个阶段时的不同情形。<br /> <br />1.1 创建阶段<br /> 在
2011-01-22 19:38:00
750
原创 数据库连接池技术
介绍一种充分发挥该特色的实用技术,即数据库连接池。一、实现连接池的意义动态Web站点往往用数据库存储的信息生成Web页面,每一个页面请求导致一次数据库访问。连接数据库不仅要开销一定的通讯和内存资源,还必须完成用户验证、安全上下文配置这类任务,因而往往成为最为耗时的操作。当然,实际的连接时间开销千变万化,但1到2秒延迟并非不常见。如果某个基于数据库的Web应用只需建立一次初始连接,不同页面请求能够共享同一连接,就能获得显著的性能改善。Servlet是一个Java类。Servlet引擎(它可能是Web服务软件的
2011-01-10 23:38:00
3412
原创 XML 学习
dom4j读写xml:1.dom4j读xml的方法.读xml String String content = xmlStr; Document document = DocumentHelper.parseText(content); Element root = document.getRootElement(); Element element = root.element("node");.读xml 文件 SAXReader xmlReader = new SAXRe
2011-01-03 18:58:00
706
原创 Java 面试集锦大全
Java面试一. Java基础部分..................................................................................................................... 7 1、一个".java"源文件中是否可以包括多个类(不是内部类)?有什么限制? ...... 7 2、Java有没有goto? .......................................................
2011-01-03 17:18:00
1401
原创 Spring 学习日记
<br /><br />什么是Spring?<br /> 开源、轻量级<br />Spring 特征:<br /> 1.B/S 和 C/S,使用资源小<br /> 2.对象间的关系松,高内聚,低耦合<br /> IOC --- Inverse of control <br /> 使得业务组件都处在框架的管理之下<br /> 框架可以管理组件的创建和依赖关系<br /> 框架可以提供可以配置的服务<br /> 3.通过AOP技术
2010-12-30 13:18:00
1839
原创 Struts1 优点与缺点
<br /> <br /> Struts开放源码框架的创建是为了使开发者在构建基于Java Servlet和JavaServer Pages(JSP)技术的Web应用时更加容易。Struts框架为开放者提供了一个统一的标准框架,通过使用Struts作为基础,开发者能够更专注于应用程序的商业逻辑。Struts框架本身是使用Java Servlet和JavaServer Pages技术的一种Model-View-Controller(MVC)实现. <br />具体来讲,Struts的优点有: <br
2010-12-30 13:07:00
3931
原创 IBM MQ 学习、应用
<br /> <br /> <br />MQ应用程序的开发,简单的实现一下关键的发送消息和接收消息的操作.首先做简单的准备工作,建队列管理器QM1,在QM1中建队列Q1,然后在高级中建立通道BICASHY,类型为服务器连接通道,端口号1414,这里做最简单的配置,死信、传输队列及远程队列都暂时不建。。。 <br />注:如果建另一个队列管理器QM2,其侦听端口一定不能和1414重复。package com.wondertek.flow.test; import java.io.IOExcep
2010-12-20 22:44:00
6461
转载 Java 类加载器
Java 类加载器 探讨 类加载器(class loader)是 Java™ 中的一个很重要的概念。类加载器负责加载 Java 类的字节代码到 Java 虚拟机中。本文首先详细介绍了 Java 类加载器的基本概念,包括代理模式、加载类的具体过程和线程上下文类加载器等,接着介绍如何开发自己的类加载器,最后介绍了类加载器在 Web 容器和 OSGi™ 中的应用。类加载器是 Java 语言的一个创新,也是 Java 语言流行的重要原因之一。它使得 Java 类可以被动态加载到 Java 虚拟机中并执行。类加载
2010-12-18 16:03:00
2516
1
原创 HTMLParser 学习与运用
<br />HtmlParser 简介<br /> 当今的 Internet 上面有数亿记的网页,越来越多应用程序将这些网页作为分析和处理的数据对象。这些网页多为半结构化的文本,有着大量的标签和嵌套的结构。当我们自己开发一 些处理网页的应用程序时,会想到要开发一个单独的网页解析器,这一部分的工作必定需要付出相当的精力和时间。事实上,做为 JAVA 应用程序开发者, HtmlParser 为其提供了强大而灵活易用的开源类库,大大节省了写一个网页解析器的开销。 HtmlParser 是 http://sou
2010-12-06 00:59:00
959
原创 FreeMarker 学习
<br />FreeMarker概述<br /> <br /> <br /> FreeMarker是一个模板引擎,一个基于模板生成文本输出的通用工具,使用纯Java编写 <br /> FreeMarker被设计用来生成HTML Web页面,特别是基于MVC模式的应用程序 <br /> 虽然FreeMarker具有一些编程的能力,但通常由Java程序准备要显示的数据,由FreeMarker生成页面,通过模板显示准备的数据(如下图)<br /><br />
2010-12-05 00:03:00
2798
Java+sql 超市购物进销存系统(源代码)
2008-12-06
软件破解入门教程和解密手册
2008-12-06
W3school.chm
2009-05-06
【自然语言处理】基于LangChain的高可复用、可扩展LLM应用程序开发指南:构建智能问答系统与自动化客服
2025-07-17
Websphere MQ入门教程
2009-12-12
WebService开发指南
2014-12-22
Socket编程
2014-12-22
DB2经验积累
2014-12-22
java 类加载调试
2014-12-22
经典SQL语句大全
2015-01-17
Linux 指令大全
2015-01-17
JDK1.6 32位
2015-01-08
[网络支付与结算].徐勇
2015-01-17
企业应用架构模式
2015-01-17
WebSphere快速入门
2015-01-17
Ext 3.0 API
2014-12-22
java多线程设计模式
2015-01-17
JAVA优化编程
2014-12-22
struts2.0中文教程
2015-01-17
网上支付安全
2015-01-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人