博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[读书笔记]机器学习:实用案例解析(2)
阅读量:5755 次
发布时间:2019-06-18

本文共 1806 字,大约阅读时间需要 6 分钟。

第2章  数据分析

#machine learing for heckers

#chapter 2

library(ggplot2)heights.weights <- read.csv("ML_for_Hackers/02-Exploration/data/01_heights_weights_genders.csv",                             header = TRUE, sep = ",")

  

#不同区间宽度的直方图

ggplot(heights.weights, aes(x = Height)) + geom_histogram(binwidth = 1)ggplot(heights.weights, aes(x = Height)) + geom_histogram(binwidth = 5)ggplot(heights.weights, aes(x = Height)) + geom_histogram(binwidth = 0.001)

  

      

#密度曲线图

ggplot(heights.weights, aes(x = Height)) + geom_density()

  

 

#峰值处平坦,考虑图像有结构缺失,根据性别分别绘制密度曲线图

ggplot(heights.weights, aes(x = Height, fill = Gender)) + geom_density()ggplot(heights.weights, aes(x = Weight, fill = Gender)) + geom_density()ggplot(heights.weights, aes(x = Weight, fill = Gender)) + geom_density() + facet_grid(Gender ~ .)

  

           

 

#正态分布:钟形的窄尾分布,单峰对称

#柯西分布:钟形的重尾分布,单峰对称

set.seed(1)normal.values <- rnorm(250, 0, 1)cauchy.values <- rcauchy(250, 0, 1)ggplot(data.frame(X = normal.values), aes(x = X)) + geom_density()ggplot(data.frame(X = cauchy.values), aes(x = X)) + geom_density()

  

        

 

#gamma分布

#gamma分布只有正值

gamma.values <- rgamma(100000, 1, 0.001)ggplot(data.frame(X = gamma.values), aes(x = X)) + geom_density()

  

 

#从身高体重预测性别(分类器)

#书中代码画图命令有"stat_abline"完成添加直线操作,而package: ggplot2(version 2.1.0)中"stat"族函数已经没有"abline",只能用"geom"族完成

heights.weights <- transform(heights.weights, Male = ifelse(Gender == 'Male', 1, 0))logit.model <- glm(Male ~ Weight + Height, data = heights.weights,                    family = binomial(link = 'logit'))ggplot(heights.weights, aes(x = Height, y = Weight, color = Gender)) + geom_point() +   geom_abline(intercept = -coef(logit.model)[1]/coef(logit.model)[2],               slope = -coef(logit.model)[3]/coef(logit.model)[2],               color = 'black')

  

转载于:https://www.cnblogs.com/gyjerry/p/5562095.html

你可能感兴趣的文章
jQuery|元素遍历
查看>>
用 ThreadLocal 管理用户session
查看>>
setprecision后是要四舍五入吗?
查看>>
上云就是这么简单——阿里云10分钟快速入门
查看>>
MFC多线程的创建,包括工作线程和用户界面线程
查看>>
我的友情链接
查看>>
FreeNAS8 ISCSI target & initiator for linux/windows
查看>>
PostgreSQL数据库集群初始化
查看>>
++重载
查看>>
Rainbond 5.0.4版本发布-做最好用的云应用操作系统
查看>>
nodejs 完成mqtt服务端
查看>>
sql server 触发器
查看>>
[工具]前端自动化工具grunt+bower+yoman
查看>>
关于完成生鲜电商项目后的一点总结
查看>>
noip2012 普及组
查看>>
第二阶段 铁大Facebook——十天冲刺(10)
查看>>
Java判断是否为垃圾_Java GC如何判断对象是否为垃圾
查看>>
多项式前k项和java_多项式朴素贝叶斯softmax改变
查看>>
java数组只能交换0下标和n_编程练习-只用0交换排序数组
查看>>
centos7安装mysql视频教程_centos7安装mysql(完整)
查看>>