R-Kendall的tau-b和tau-c的关联度量

是否有任何R包用于计算肯德尔的tau-b和tau-c及其相关的标准误差?我在Google和Rseek上的搜索没有什么变化,但肯定有人在R中实现了这些.
有三种Kendal tau统计(tau-a,tau-b和tau-c).

它们是不可互换的,迄今为止发布的答案都不是与最后两个答案相对应的,这是OP问题的主题.

在R标准库(stat et al.)或CRAN或其他存储库中可用的任何包中,无法找到计算tau-b或tau-c的功能.我使用优秀的R Package sos进行搜索,所以我认为返回的结果是相当彻底的.

所以这是OP的问题的简短答案:没有内置或包装功能的tau-b或tau-c.

但是很容易自己滚动.

编写Kendall统计数据的R函数只是一个问题
将这些方程转换成代码:

Kendall_tau_a = (P - Q) / (n*(n-1)/2)

Kendall_tau_b = (P - Q) / ( (P + Q + Y0)*(P + Q + X0) )^0.5 

Kendall_tau_c = (P-Q)*( (2*m)/n^2*(m-1) )

tau-a:等于一致的减去不一致的对,除以一个因子来计算总对数(样本量).

tau-b:明确的关系关系 – 即数据对的两个成员具有相同的值;该值等于一致的减去不一致对除以表示在x(X0)之间未绑定的对数与不与y(Y0)相关的数字之间的几何平均值的项.

tau-c:较大表变体也针对非方形表优化;等于一致的减去不一致的对乘以调整表大小的因子).

# number of concordant pairs 
P = function(t) {   
  r_ndx = row(t)
  c_ndx = col(t)
  sum(t * mapply(function(r, c){sum(t[(r_ndx > r) & (c_ndx > c)])},
    r = r_ndx, c = c_ndx))}

# number of discordant pairs
Q = function(t) {
  r_ndx = row(t)
  c_ndx = col(t)
  sum(t * mapply( function(r, c){
      sum(t[(r_ndx > r) & (c_ndx < c)])
  },
    r = r_ndx, c = c_ndx) )
}

# sample size (total number of pairs)
n = n = sum(t)

# the lesser of number of rows or columns
m = min(dim(t))

所以这四个参数是您需要计算tau-a,tau-b和tau-c的所有参数:

> P
> Q
> m
> n

(加上tau-b的XO& Y0)

例如,tau-c的代码是:

kendall_tau_c = function(t){
    t = as.matrix(t) 
    m = min(dim(t))
    n = sum(t)
    ks_tauc = (m*2 * (P(t)-Q(t))) / ((n^2)*(m-1))
}

那么Kendall的tau统计与分类数据分析中使用的其他统计测试有何关系呢?

所有三个肯德尔的统计数据,以及古德曼和克鲁斯卡尔的伽玛都是有序和二进制数据的相关性. (Kendall tau统计数据是伽马统计的更复杂的替代品(只是P-Q))

所以肯德尔的tau tau and and the gamma gamma gamma gamma…………………………

例:

cpa_group = c(4, 2, 4, 3, 2, 2, 3, 2, 1, 5, 5, 1)
revenue_per_customer_group = c(3, 3, 1, 3, 4, 4, 4, 3, 5, 3, 2, 2)
weight = c(1, 3, 3, 2, 2, 4, 0, 4, 3, 0, 1, 1)

dfx = data.frame(CPA=cpa_group, LCV=revenue_per_customer_group, freq=weight)

# reshape data frame so 1 row for each event 
# (prediate step to create contingency table)
dfx2 = data.frame( lapply(dfx, function(x){rep(x, dfx$freq)}))

t = xtabs(~ revenue + cpa, dfx)

kc = kendall_tau_c(t)

# returns -.35
翻译自:https://stackoverflow.com/questions/2557863/measures-of-association-in-r-kendalls-tau-b-and-tau-c

转载注明原文:R-Kendall的tau-b和tau-c的关联度量