BioStaInfer/exam02_p1.Rmd

170 lines
8.4 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

## 问题1蜘蛛的命运
### 研究问题
研究问题是:雌性红背蜘蛛是否更有可能接受被她吃掉的雄性的精子,而不是逃跑的雄性的精子?
### 假设
- 零假设(H0):雌性红背蜘蛛接受第二任伴侣的概率与第一任伴侣的命运(被吃或逃脱)无关。
- 备择假设(H1):雌性红背蜘蛛接受第二任伴侣的概率与第一任伴侣的命运(被吃或逃脱)有关。
数据分析:
```{r}
spider_data <- read.csv("../redback_spider.csv", stringsAsFactors = TRUE)
str(spider_data)
head(spider_data)
spider_table <- table(spider_data$fate_first_mate, spider_data$second_mate)
spider_table
prop.table(spider_table, margin = 1)
```
###Visualization
```{r}
# 创建马赛克图
mosaicplot(spider_table,
main = "雌性红背蜘蛛对第二任伴侣的接受情况",
xlab = "第一任伴侣的命运",
ylab = "第二任伴侣的命运",
col = c("lightblue", "salmon"))
```
###Statistical Analysis
```{r}
# 卡方检验
chisq_test <- chisq.test(spider_table)
chisq_test
# Fisher精确检验
fisher_test <- fisher.test(spider_table)
fisher_test
```
###Statistical Explanation
```{r}
# 检查卡方检验的期望频数
chisq_test$expected
```
两种统计检验并不同样适合这些数据。卡方检验通常要求每个单元格的期望频数大于5而从上面的输出可以看到有些单元格的期望频数小于5。因此Fisher精确检验更适合这种小样本量的情况它不依赖于大样本近似。
### Conclusion and Discussion
研究问题是探究雌性红背蜘蛛是否更有可能接受被她吃掉的雄性的精子,而不是逃脱的雄性的精子。我的分析流程如下:
首先我将数据整理成列联表以便观察第一任伴侣命运被吃或逃脱与雌性对第二任伴侣反应接受或拒绝之间的关系。通过计算条件概率prop.table函数我可以直观地看到这两个变量之间可能存在的关联。
在选择统计检验方法时,我考虑了数据的特性:
1. 数据是分类数据(类别变量)- 两个二分类变量形成2×2列联表
2. 我们关心的是两个分类变量之间是否存在关联
3. 样本量相对较小n=32
基于这些特点我选择了两种适用于分类数据的检验方法卡方检验和Fisher精确检验。
卡方检验的关键假设包括:
1. 观测值之间的独立性(每个观测是独立的)
2. 每个单元格的期望频数应大于5或至少80%的单元格期望频数大于5且所有单元格期望频数大于1
3. 数据是随机抽样得到的
Fisher精确检验的假设相对较少
1. 观测值之间的独立性
2. 数据是随机抽样得到的
3. 边际总和是固定的(非随机的)
通过检查`chisq_test$expected`我发现部分单元格的期望频数小于5这违反了卡方检验的假设。因此Fisher精确检验是更合适的选择因为它不依赖于大样本近似特别适用于小样本量的2×2列联表。Fisher精确检验直接计算在边际总和固定的情况下观察到当前或更极端结果的概率。
Fisher精确检验的p值为`r fisher_test$p.value`卡方检验的p值为`r chisq_test$p.value`。两者都小于0.05的显著性水平,因此我们拒绝零假设,认为第一任伴侣的命运与雌性对第二任伴侣的接受程度有关。
从数据分析和可视化结果来看,当第一任伴侣被吃掉时,雌性更倾向于拒绝第二任伴侣;而当第一任伴侣逃脱时,雌性更倾向于接受第二任伴侣。这一发现与最初的假设相反,表明雄性被食肉可能并不会增加其精子被接受的机会,反而可能降低后续雄性的交配成功率。这可能暗示了一种复杂的交配策略或生理机制,值得进一步研究。
这一结果对于理解红背蜘蛛的交配行为和性选择具有重要意义,它挑战了我们对雄性被食肉可能带来间接优势的初始假设。
## 问题2潜水时进食
### 研究问题
研究问题是:对于钟乳石海豚来说,捕食潜水是否比非捕食潜水消耗更多的氧气(能量)?
### 假设
- 零假设(H0):钟乳石海豚在捕食潜水和非捕食潜水时的氧气消耗量没有显著差异。
- 备择假设(H1):钟乳石海豚在捕食潜水时的氧气消耗量显著高于非捕食潜水。
数据分析:
```{r}
# 读取数据
dolphins <- read.csv("../dolphin_oxygen.csv", stringsAsFactors = TRUE)
# 查看数据结构
str(dolphins)
head(dolphins)
# 计算平均氧气消耗量
mean_nonfeeding <- mean(dolphins$oxygenUseNonfeeding)
mean_feeding <- mean(dolphins$oxygenUseFeeding)
cat("非捕食潜水的平均氧气消耗量:", mean_nonfeeding, "ml O2/kg\n")
cat("捕食潜水的平均氧气消耗量:", mean_feeding, "ml O2/kg\n")
```
###Visualization
```{r}
library(reshape2)
dolphins_long <- melt(dolphins, id.vars = "individual",
variable.name = "dive_type",
value.name = "oxygen_use")
boxplot(oxygen_use ~ dive_type, data = dolphins_long,
main = "钟乳石海豚在不同潜水类型下的氧气消耗量",
xlab = "潜水类型",
ylab = "氧气消耗量 (ml O2/kg)",
col = c("lightblue", "salmon"),
names = c("非捕食潜水", "捕食潜水"))
plot(dolphins$oxygenUseNonfeeding, dolphins$oxygenUseFeeding,
main = "钟乳石海豚的氧气消耗量比较",
xlab = "非捕食潜水氧气消耗量 (ml O2/kg)",
ylab = "捕食潜水氧气消耗量 (ml O2/kg)",
pch = 19, col = "blue")
abline(0, 1, lty = 2) # 添加对角线,表示相等的情况
```
###检查配对t检验的假设
```{r}
diff <- dolphins$oxygenUseFeeding - dolphins$oxygenUseNonfeeding
shapiro.test(diff)
qqnorm(diff)
qqline(diff)
hist(diff, breaks = 5, main = "差异的直方图", xlab = "氧气消耗量差异")
```
###统计检验:
```{r}
t_test <- t.test(dolphins$oxygenUseFeeding, dolphins$oxygenUseNonfeeding,
paired = TRUE, alternative = "greater")
t_test
```
###结论和讨论:
### 结果讨论与结论
研究问题是探究钟乳石海豚在捕食潜水时是否比非捕食潜水消耗更多的氧气(能量)。我的分析流程如下:
首先,我计算了两种潜水类型的平均氧气消耗量,为数据提供了初步的描述性统计。然后,我通过箱线图和配对点图进行可视化,这些图表清晰地展示了两种潜水类型之间的差异模式。
在选择统计检验方法时,我考虑了数据的特性:
1. 数据是配对的 - 每只海豚都进行了两种类型的潜水
2. 我们关心的是两种潜水类型之间的差异
3. 我们有明确的方向性假设(捕食潜水消耗更多氧气)
基于这些特点配对t检验是最合适的选择。配对t检验的关键假设是
1. 观测值之间的独立性(每对观测来自不同的个体)
2. 差异值(捕食潜水与非捕食潜水的氧气消耗差)应近似服从正态分布
为了验证第二个假设我进行了Shapiro-Wilk正态性检验并绘制了Q-Q图和直方图。Shapiro-Wilk检验的p值为`r shapiro.test(diff)$p.value`大于0.05的显著性水平表明我们没有足够证据拒绝差异值服从正态分布的假设。Q-Q图显示数据点大致沿着理论正态分布线分布直方图也显示了近似的钟形分布。这些结果支持使用配对t检验的合理性。
配对t检验的p值为`r t_test$p.value`显著小于0.05,因此我们拒绝零假设,认为捕食潜水确实比非捕食潜水消耗更多的氧气。
具体来看,捕食潜水的平均氧气消耗量为`r mean_feeding` ml O2/kg而非捕食潜水为`r mean_nonfeeding` ml O2/kg平均差异约为`r mean_feeding - mean_nonfeeding` ml O2/kg。这表明捕食行为本身确实会增加额外的能量消耗超出了常规潜水的努力。
这一发现对于理解海洋哺乳动物的能量预算和捕食策略具有重要意义。它表明钟乳石海豚在捕食时需要权衡额外的能量投入与获取食物的收益。这种能量权衡可能影响它们的捕食决策、潜水模式和整体生态适应性。未来的研究可以进一步探索不同捕食策略的能量效率,以及环境变化如何影响这些海洋哺乳动物的能量平衡。