Stars
Sutskever 30 implementations inspired by https://papercode.vercel.app/
一个持续更新的中文敏感词库,帮助开发者和内容审核者快速识别并过滤不当文本,即将迎来重大更新。
Jupyter notebooks and other materials developed for the Columbia course APMA 4300
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、…
微信文章爬虫,批量获取微信文章的内容,包括点赞量、阅读量、评论等内容。纯Python项目,欢迎一起学习讨论。
这是一个基于Selenium的Boss直聘网站爬虫项目,用于抓取深圳地区的职位信息。该爬虫采用了多种反爬虫策略,支持代理IP配置,并能够稳定地获取职位数据。
python爬虫教程系列、从0到1学习python爬虫,包括浏览器抓包,手机APP抓包,如 fiddler、mitmproxy,各种爬虫涉及的模块的使用,如:requests、beautifulSoup、selenium、appium、scrapy等,以及IP代理,验证码识别,Mysql,MongoDB数据库的python使用,多线程多进程爬虫的使用,css 爬虫加密逆向破解,JS爬虫逆向,…
Code Repository for MS20190155
使用 Stata 绘制中国省级地图!比例尺、指北针、秦岭-淮河线、胡焕庸线、海岸线、未定国界都有!
一款基于各大企业信息API的工具,解决在遇到的各种针对国内企业信息收集难题。一键收集控股公司ICP备案、APP、小程序、微信公众号等信息聚合导出。支持MCP接入
👾 Fast and simple video download library and CLI tool written in Go
Datasets that cover the road and rail transportation networks in China
一款在线的 微信公众号文章批量下载 工具,支持导出阅读量与评论数据,无需搭建任何环境,可通过 在线网站 使用,支持 docker 私有化部署和 Cloudflare 部署。 支持下载各种文件格式,其中 HTML 格式可100%还原文章排版与样式。
2018-2019 Quantitative Macroeconomics, UAB
中文分词 词性标注 命名实体识别 依存句法分析 成分句法分析 语义依存分析 语义角色标注 指代消解 风格转换 语义相似度 新词发现 关键词短语提取 自动摘要 文本分类聚类 拼音简繁转换 自然语言处理
Gramm is a complete data visualization toolbox for Matlab. It provides an easy to use and high-level interface to produce publication-quality plots of complex data with varied statistical visualiza…
This folder constains the latest version of the QE Master Code developed by Ozkan and Salgado
[🔥updating ...] AI 自动量化交易机器人(完全本地部署) AI-powered Quantitative Investment Research Platform. 📃 online docs: https://ufund-me.github.io/Qbot ✨ :news: qbot-mini: https://github.com/Charmve/iQuant