Asymptotic distribution theory for contamination models
Resumen
En muchas situaciones se tiene interés en identificar las observaciones que provienen de fuentes de variación distintas de la normal de base o de la fuente de referencia. Un modelo simple para tales situaciones es un modelo de mezcla de dos puntos, donde uno de los componentes en la mezcla corresponde al modelo de línea de base y la segunda a los de otras fuentes (el componente de la contaminación). Aquí el objetivo es doble: (i) detectar la presencia global de la Contaminación y (ii) identificar las observaciones que puedan estar contaminados. Una prueba localmente más poderosa se presenta la cual da algunas ideas sobre cómo lograr el objetivo. Sorprendentemente, la estadística de prueba puede tener una distribución asintótica que se basa en una ley estable que no es la distribución normal. Ejemplos y simulaciones se dan para ilustrar el enfoque.
Citas
EFRON, B. (2007). Size, power and false discovery rates. Annals of Statistics 35 (4), 1351-1377.
FERGUSON, T. S. (1967). Mathematical Statistics: A Decision Theoretical Approach. Academic Press, NY.
GELUK, J. L. AND L. DE HAAN (2000). Stable probability distributions and their domains of attraction: a direct approach. Probability and Mathematical Statistics 20 (1), 169-188.
GREGO, J., H.-L. HSI, AND J. D. LYNCH (1990). A strategy for analyzing mixed and pooled exponentials. Applied Stochastic Models and Data Analysis 6 (1), 59-70.
HUANG, K. (1963). Statistical mechanics. Wiley, NY.
LEHMANN, E. L. (1983). Theory of Point Estimation. Probability and mathematical statistics. Wiley, NY.
LINDSAY, B. G. (1983a). The geometry of mixture likelihoods: A general theory. Annals of Statistics 11 (1), 86-4.
LINDSAY, B. G. (1983b). The geometry of mixture likelihoods, part ii: The exponential family. Annals of Statistics 11 (3), 783-792.
SINGH, D., P. G. FEBBO, K. ROSS, D. G. JACKSON, J. MANOLA, C. LADD, P. TAMAYO, A. A. RENSHAW, A. V. D'AMICO, J. P. RICHIE, E. S. LANDER, M. LODA, P. W. KANTOFF, T. R. GOLUB, AND W. R. SELLERS (2002). Gene expression correlates of clinical prostate cancer behavior. Cancer Cell 1, 203-209.
WALD, A. (1949). Note on the consistency of the maximum likelihood estimate. The Annals of Mathematical Statistics 20 (4), 595-6