En R, ¿cuál es la diferencia entre dt (), pt () y qt (), en referencia a la distribución t de Student?


Respuesta 1:

Esto a veces es confuso, decidí pintar una pequeña imagen para ilustrar mejor mi respuesta. Las funciones similares son para distribuciones de probabilidad mayores implementadas en R, y todas funcionan igual, dependiendo del prefijo:

d - densidad, produce el valor de la función de densidad en un punto dado

p - probabilidad, produce CDF, es decir, probabilidad de devolver un número menor que un argumento para esta función

q - cuantil, CDF inverso, es decir, qué valor tiene un cuantil dado.

Déjame explicarte con más detalle. Consideremos la distribución t con 30 grados de libertad, que estará cerca de la distribución normal.

qt (.95,30) devolverá 1.69, que es el valor del percentil 95 de esta distribución. Esto significa que el 95% de todos los números en nuestra distribución es menor que 1.69, y solo el 5% es mayor. Esto es CDF inverso.

Del mismo modo, si usa pt (1.69,30) obtendrá un resultado cercano al 95%. Esta función devuelve el CDF, que es la probabilidad de obtener un número menor o igual al argumento. Dado que 1.69 es nuestro percentil 95, el valor de CDF es de hecho 95%.

dt (x, 30) producirá el valor de la función de densidad de probabilidad en x. Para 1.69 es 0.096, que es bastante bajo, mientras que para 0 es 50%.

Tenga en cuenta que esto no es una probabilidad de obtener este número. Para obtener la probabilidad, necesita integrar la función de densidad en un rango de valores. Es por eso que la función CDF es útil, ya que al calcular una diferencia para dos valores, puede obtener una probabilidad de obtener un número que se encuentra entre esos dos números.


Respuesta 2:

Supongo que estas son funciones de la distribución t de Student y responderé sobre esa base.

dt () devuelve la densidad de probabilidad de la distribución t para un determinado grado de libertad. Puedo dibujar la distribución t con 9 grados de libertad y mostrarla de la siguiente manera:

Esto da:

pt () da las probabilidades de cola. Suponga que está haciendo una prueba de cola inferior y su estadística de prueba es igual a -2.75 con los mismos grados de libertad. Entonces puede calcular la probabilidad de cola inferior de la siguiente manera:

pt (-2.75, df = 9, lower.tail = TRUE)

Y tu respuesta es:

0,0112

Entonces rechazas tu nulo al 5% pero no al 1% pero estás cerca.

qt () es la función inversa de t le das una probabilidad y obtienes un cuantil de la distribución t. Supongamos que desea un intervalo de confianza del 99%. Eso dejaría 0.005 en ambas colas (1 - 0,99) / 2. Como había usado tablas que iban de menos infinito a t, calcularía este cuantil como:

qt (0.995, df = 9, cola inferior = VERDADERO)

[1] 3.249836

>