当前位置:首页 » 机器学习 - 第1页

04月16日

《百面机器学习》电子书下载

发布 : xiaohuanglv | 分类 : 机器学习电子书 | 评论 : 0 | 浏览 : 1479次
《百面机器学习》电子书下载

《百面机器学习》资源CSDN下载《百面机器学习》kindle电子书下载《百面机器学习》百度网盘下载(提取码:y0sh)目  录版权信息内容提要推荐序前言机器学习算法工程师的自我修养第1章特征工程01特征归一化02类别型特征03高维组合特征的处理04组合特征05文本表示模型06Word2Vec07图像数据不足时的处理方法第2章模型评估01评估指标的局限性02ROC曲线03余弦距离的应用04A/B测试的陷阱05模型评估的方法06超参数调优07过拟合与欠拟合第3章经典算法01支持向量机02逻辑回归03决策树第4章降维01PCA最大方差理论02PCA最小平方误差理论03线性判别分析04线性判别分析与主成分分析第5章非监督学习01K均值聚类02

04月14日

领域知识库构建及信息检索系统

发布 : xiaohuanglv | 分类 : 机器学习精品文章 | 评论 : 0 | 浏览 : 902次
领域知识库构建及信息检索系统

系统源码及原文免费下载地址请访问:www.54manong.com一、 系统简介通过对网络爬虫工具的设置并扩展,自动抓取行业领域资料,或通过语料管理模块上传领域相关资料,形成语料库。调用信息抽取模块和信息去噪模块,提取语料库中pdf、doc、ppt、html、excel、txt及专利等文件中的内容信息,并将抽取的信息进行去噪处理,去除标签、乱码、页眉和页脚等无用信息,同时确保有用信息被完整保留。在完成语料预处理后进行知识挖掘,首先基于领域词典,对去噪处理后的信息进行分词、词汇统计分析,最终找出领域单词概念和组合概念,同时记录语料中包含领域概念的语句,并基于规则抽取核心语句中领域概念间的关系,通过本体的推理,形成此文档的概念知识关系网,并保存为xml语法格式,存入数据库。在此基础上通

03月01日

数据清洗方法

发布 : xiaohuanglv | 分类 : 机器学习精品文章 | 评论 : 0 | 浏览 : 1391次

1.数据错误脏数据或错误数据比如,温度=-2003,数据不正确‘0’代表真实的0还是代表缺失,数据不一致2.删除重复值删除重复数据或对重复数据进行标记3.离散值检测单变量离群值处理:1)绘图: