R 里的随机数种子 set.seed()

这一篇只写一点很简单的小东西,R 里用 set.seed() 设置随机数种子。 以前呢,只知道 set.seed(1234) 是设置随机数种子保证数据分析再现性的,但是其实具体用法没有了解过。现在

R 中因子型变量的有序与无序

有序和无序因子变量 例子 解读 模型评价和比较 结语 今天涉及到的这个就很有意思了。很早开始我就对这个问题有点疑惑,但是一直没有抽出时间(好吧,其实主

科学上网笔记:Shadowsocks 和 v2ray

搭梯简单记录,我知道网上教程一 Google 一大把。我写下来主要是这是我一直在用的流程,以免都要一边操作一边到处查,所以干脆就写下来算了。以后就可以咔咔

ggplot2 学习 第三部分:The Master List (上)

翻译整理自:Top 50 ggplot2 Visualizations - The Master List,有删改。 这是整个 ggplot2 系列的第三部分也是最后一部分。当然从标题知道这是上部,当然不是因为是最后一部分估计

ggplot2 学习 第二部分:外观自定义

ggplot2 学习 第二部分:外观自定义 翻译整理自:The Complete ggplot2 Tutorial - Part 2 | How To Customize ggplot2 (Full R code) 。 这一篇将会介绍如何自定义一个 ggplot 图的 6 个主要部分,是一份涵盖了大部分

ggplot2 学习 第一部分:介绍

今天 Bing 差点 被 GFW,纪念一下用必应壁纸做封面吧 翻译整理自:The Complete ggplot2 Tutorial - Part1 | Introduction To ggplot2 (Full R code) 。 r-statistics.co 在我的浏览器书签里应该躺了起码大半年了,特别是其

Logistic 回归中 AIC 和 BIC 用于变量筛选

All models are wrong, but some are useful. – George Box 最近处理数据发现统计学知识太不够用了,以前上的统计学基本只知道 t 检验、方差分析、卡方检验加上简单的回归和相关、生存分析

记一次 Debian sid 爆炸后的修复

前几天有点东西要写,Debian-cn 群里有人说 sid 更新 systemd-240-2 后炸了,我当时看到了以为个例没有特别去关注。然后过了一天看到置顶消息说 sid 和 Testing 用户不要

Netlify 的第一篇博客

这虽然可能显示出来并非是第一篇博文,但是确实是 Netlify 上的第一篇。没有显示为第一篇是因为我把其他平台的博文迁移到这里之后保留原始的发文日期。 Blogdown + Hugo

R 中缺失值的简单处理—— MICE 和 Amelia 篇

参考资料: Tutorial on 5 Powerful R Packages used for imputing missing values Amelia 包文档说明 Amelia II: A Package for Missing Data Imputing Missing Data with R; MICE package Handling missing data with MICE package; a simple approach 因为最近一直在学数据库和处理病例数据的相关的东西,

从芯片数据提取 lncRNA 探针

1 又是一篇放了好久好久,没有好好整理的东西。 1. 准备数据 需要数据有:芯片序列信息、基因组 lncRNA 参考基因组: 所用软件:SeqMap、R 芯片是 Affymetrix 的 Human Genome

RNA-Seq 数据处理记录

1 本来是 6 月份的东西,一直没有好好整理拖到年底了,唉 .... 毕业答辩过了,最大的坎儿迈过去了。准备开始处理手头拿到的 RNA-Seq 数据。当作是我的第一次实战。

回归分析中的共线性问题

主要参考博文 : Dealing with The Problem of Multicollinearity in R Multicollinearity in R 引子 如果现在我们预测一个国家,比如说中国,2018 年全年的旅游收入 (美元)。因变量是中国 2018 年度的旅游收入

Python 里 NumPy 的 axis 参数的理解

最近学学 Python 做数据分析,主要就是 Python 基本语法 + NumPy + pandas 咯。 发现很好的一些教程: python_for_data_analysis_2nd_chinese_version Numpy & Pandas (莫烦 Python 数据处理教程) Data analysis in Python with pandas 果然人生苦短,大家都在用 P