由R生成的随机数实际上伪随机数,也就是说,随机数是由某种算法而不是真正的随机过程产生的,随机数生成器需要一个初始值来生成数字,该初始值叫做种子.通过把种子设置为特定的值,可以保证每次运行同一段代码时都能生成相同的随机数. R使用set.seed(n)函数来设置种子值,n是一个正整数,不同的种子会生成不同的随机数: ) 通常使用sample()函数来生成随机数,R也支持从分布中获取随机数. 一,随机抽样 从大的数据集中抽样,获取两份随机样本,一份用于构建预测模型,一份用于验证模型的有效性. sam…