https://doi.org/10.29312/remexca.v15i1.3618

elocation-id: e3618

Otero-Prevost, Villanueva-Jiménez, Ramírez-Valverde, Vargas-Mendoza, Becerril-Pérez, and Soto-Rojas: Propuesta para obtener el tamaño de muestra óptimo de plagas con exceso de ceros

Journal Metadata

Journal Identifier: remexca [journal-id-type=publisher-id]

Journal Title Group

Journal Title (Full): Revista mexicana de ciencias agrícolas

Abbreviated Journal Title: Rev. Mex. Cienc. Agríc [abbrev-type=publisher]

ISSN: 2007-0934 [pub-type=ppub]

Publisher

Publisher’s Name: Instituto Nacional de Investigaciones Forestales, Agrícolas y Pecuarias

Article Metadata

Article Identifier: 10.29312/remexca.v15i1.3618 [pub-id-type=doi]

Article Grouping Data

Subject Group [subj-group-type=heading]

Subject Grouping Name: Artículo

Title Group

Article Title: Propuesta para obtener el tamaño de muestra óptimo de plagas con exceso de ceros

Contributor Group

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Otero-Prevost

Given (First) Names: Luis Gabriel

X (cross) Reference [ref-type=aff; rid=aff1]

Superscript: 1

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Villanueva-Jiménez

Given (First) Names: Juan A.

X (cross) Reference [ref-type=aff; rid=aff1]

Superscript: 1

X (cross) Reference [ref-type=corresp; rid=c1]

Superscript: §

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Ramírez-Valverde

Given (First) Names: Gustavo

X (cross) Reference [ref-type=aff; rid=aff2]

Superscript: 2

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Vargas-Mendoza

Given (First) Names: Mónica C.

X (cross) Reference [ref-type=aff; rid=aff1]

Superscript: 1

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Becerril-Pérez

Given (First) Names: Carlos M.

Contributor [contrib-type=author]

Name of Person [name-style=western]

Surname: Soto-Rojas

Given (First) Names: Lauro

X (cross) Reference [ref-type=aff; rid=aff2]

Superscript: 2

Affiliation [id=aff1]

Label (of an Equation, Figure, Reference, etc.): 1

Institution Name: in an Address: Colegio de Postgraduados-Campus Veracruz. Carretera Xalapa-Veracruz km 88.5, Manlio F. Altamirano, Veracruz, México. CP. 91963. [content-type=original]

Institution Name: in an Address: Colegio de Postgraduados [content-type=normalized]

Institution Name: in an Address: Colegio de Postgraduados [content-type=orgname]

Institution Name: in an Address: Campus Veracruz [content-type=orgdiv1]

Address Line

State or Province: Veracruz

Postal Code: 91963

Country: in an Address: Mexico [country=MX]

Affiliation [id=aff2]

Label (of an Equation, Figure, Reference, etc.): 2

Institution Name: in an Address: Colegio de Postgraduados-Campus Montecillo. Carretera México-Texcoco km 36.5, Montecillo, Texcoco, México. CP. 56230. [content-type=original]

Institution Name: in an Address: Colegio de Postgraduados [content-type=normalized]

Institution Name: in an Address: Colegio de Postgraduados [content-type=orgname]

Institution Name: in an Address: Campus Montecillo [content-type=orgdiv1]

Address Line

City: Texcoco

Postal Code: 56230

Country: in an Address: Mexico [country=MX]

Author Note Group

Correspondence Information: [§] Autor para correspondencia: javj@colpos.mx. [id=c1]

Publication Date [date-type=pub; publication-format=electronic]

Day: 07

Month: 02

Year: 2024

Publication Date [date-type=collection; publication-format=electronic]

Month: 01

Year: 2024

Volume Number: 15

Issue Number: 1

Electronic Location Identifier: e3618

History: Document History

Date [date-type=received]

Day: 01

Month: 11

Year: 2023

Date [date-type=accepted]

Day: 01

Month: 01

Year: 2024

Permissions

License Information [license-type=open-access; xlink:href=https://creativecommons.org/licenses/by-nc/4.0/; xml:lang=es]

Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons

Abstract

Title: Resumen

En muestreos de plagas con densidades bajas es común obtener gran cantidad de ceros, lo que es difícil de manejar, ya que las distribuciones de probabilidad Poisson y binomial negativa no son adecuadas para su modelación y no se dispone de ecuaciones para estimar el tamaño de muestra óptimo. En este estudio se modelo el exceso de ceros mediante la estimación de parámetros a través de los métodos de momentos y de máxima verosimilitud de las distribuciones Poisson cero inflado y binomial negativa cero inflado, y derivar ecuaciones para calcular el tamaño de muestra óptima. Se utilizó muestreo sistemático para seleccionar 100 árboles por huerto de toronja (Citrus paradisi Macfad) Río Red, en la Finca Sayula, Veracruz, México (latitud 19.20722, longitud -96.35194), de junio a julio 2021 y enero 2022. Se contó el número de minadores (Phyllocnistis citrella Stainton) y pulgones (Toxoptera citricida Kirkaldy) presentes en tres hojas por brote por árbol, consideradas como unidad muestral. Se realizaron simulaciones en RStudio con diferentes proporciones de cero (0.1, 0.4 y 0.6) para comparar los parámetros obtenidos en campo, mediante el método de los momentos y máxima verosimilitud. Se derivaron ecuaciones para estimar el tamaño de muestra óptimo en estudios de plagas con densidades bajas, a partir de las distribuciones de probabilidad Poisson cero inflado y binomial negativa cero inflado. El método de los momentos arroja tamaños de muestra óptimos menores a aquellos obtenidos mediante máxima verosimilitud, debido a que distinguen el origen del cero, por lo que se recomienda su uso.

Keyword Group [xml:lang=es]

Title: Palabras claves:

Keyword: binomial negativa cero inflado

Keyword: muestreo

Keyword: Poisson cero inflado

Counts

Figure Count [count=0]

Table Count [count=4]

Equation Count [count=29]

Reference Count [count=22]

Page Count [count=0]

Resumen

En muestreos de plagas con densidades bajas es común obtener gran cantidad de ceros, lo que es difícil de manejar, ya que las distribuciones de probabilidad Poisson y binomial negativa no son adecuadas para su modelación y no se dispone de ecuaciones para estimar el tamaño de muestra óptimo. En este estudio se modelo el exceso de ceros mediante la estimación de parámetros a través de los métodos de momentos y de máxima verosimilitud de las distribuciones Poisson cero inflado y binomial negativa cero inflado, y derivar ecuaciones para calcular el tamaño de muestra óptima. Se utilizó muestreo sistemático para seleccionar 100 árboles por huerto de toronja (Citrus paradisi Macfad) Río Red, en la Finca Sayula, Veracruz, México (latitud 19.20722, longitud -96.35194), de junio a julio 2021 y enero 2022. Se contó el número de minadores (Phyllocnistis citrella Stainton) y pulgones (Toxoptera citricida Kirkaldy) presentes en tres hojas por brote por árbol, consideradas como unidad muestral. Se realizaron simulaciones en RStudio con diferentes proporciones de cero (0.1, 0.4 y 0.6) para comparar los parámetros obtenidos en campo, mediante el método de los momentos y máxima verosimilitud. Se derivaron ecuaciones para estimar el tamaño de muestra óptimo en estudios de plagas con densidades bajas, a partir de las distribuciones de probabilidad Poisson cero inflado y binomial negativa cero inflado. El método de los momentos arroja tamaños de muestra óptimos menores a aquellos obtenidos mediante máxima verosimilitud, debido a que distinguen el origen del cero, por lo que se recomienda su uso.

Palabras claves:

binomial negativa cero inflado, muestreo, Poisson cero inflado.

Introducción

En la dinámica poblacional de organismos plaga, los datos de conteos reflejan la presencia y abundancia de las especies en un periodo fijo de tiempo (Hashim et al., 2021). Debido a las complejas interacciones entre los componentes bióticos y abióticos, a las características inherentes de las especies plaga, a dependencias espacio-temporales, a la heterogeneidad ambiental no explicada (Zou et al., 2021) y a las técnicas agroecológicas de control (Villanueva-Jiménez et al., 2017; García-González et al., 2018) es común que en los muestreos de poblaciones plaga se presenten valores de cero en exceso.

El estudio y el monitoreo de los periodos en que los organismos plaga presentan exceso de ceros puede ser de gran utilidad, ya que permiten realizar el manejo preventivo de sus poblaciones y reconocer etapas tempranas de invasión de plagas para la aplicación de métodos preventivos de manejo, tales como los que oferta la agricultura de precisión (Jankielsohn, 2017; Clay et al., 2018), así como el uso de las tácticas de combate antes de que las plagas causen daño en los cultivos, lo que evitaría el uso abusivo del plaguicidas organosintéticos, con lo que también se reduciría el daño al ambiente (Shannon et al., 2018; Talaviya et al., 2020).

El exceso de ceros es un problema teórico y práctico que se presenta cuando la elevada frecuencia de ceros, altera las probabilidades esperadas por las distribuciones de variables discretas Poisson y binomial negativa (Yesilova et al., 2010; Hashim et al., 2021; Haslett et al., 2022) y no se ha puesto atención en los mecanismos que explican el origen del cero, a pesar de sus repercusiones en la estimación de los parámetros poblacionales en especies de organismos plaga (Haslett et al., 2022).

Para el estudio de poblaciones de plagas en agroecosistemas, se propone analizar el exceso de cero a partir de las propuestas de (Mullahy, 1986; Lambert 1992); es decir, reconocer dos posibles orígenes del cero distinguiendo entre cero estructural (plantas sin brotes susceptibles para el establecimiento de una plaga) y cero no estructural (plantas con brotes susceptibles libres de la plaga y brotes susceptibles plagados), modelar el cero por su origen con distribuciones binomiales (Lambert, 1992; Zou et al., 2021: Haslett et al., 2022) y dependiendo del valor observado de los conteos mayores que cero, estudiar el efecto de la sobredispersión (Hall, 2000; Cheung, 2002; Doyle, 2009).

En conteos de plagas se emplean de manera recurrente las ecuaciones de tamaño óptimo de muestra para la distribución Poisson o binomial negativa, pero debido al exceso de ceros, los tamaños de muestra óptimos estimados son tan grandes que resultan imprácticos (Southwood y Henderson, 2000); sin embargo, en el manejo integrado de plagas no se dispone de ecuaciones que estimen el tamaño de muestra óptimo de distribuciones cero infladas, ni propuestas que consideren el origen del cero.

Aquí se proponen ecuaciones que estiman el tamaño de muestra óptimo (Karandinos, 1976), ajustadas a las distribuciones cero infladas. Los objetivos de la presente investigación fueron: modelar el exceso de ceros, estimar los parámetros mediante los métodos de los momentos y máxima verosimilitud de las distribuciones Poisson cero inflado y binomial negativa cero inflado, y derivar ecuaciones para calcular el tamaño de muestra óptimo.

Materiales y métodos

Para la estimación del tamaño de muestra óptimo, se modeló el exceso de ceros; se determinaron los parámetros mediante los métodos de momentos y máxima verosimilitud de las distribuciones Poisson cero inflado y binomial negativa cero inflado y se derivaron las ecuaciones de cálculo del tamaño de muestra.

Modelado del exceso de ceros

Para modelar el exceso de ceros, se realizaron las siguientes etapas: i) se incluyó como causa de extra-ceros, la ausencia de tejido vegetal que permite alojar a la plaga. De esta manera, se tuvieron dos orígenes: el ‘cero estructural’, cuando no existe en la planta tejido susceptible que pueda ser ocupado la plaga y el cero ‘no estructural’, cuando si existe en la planta tejido adecuado, pero no está habitado por una plaga.

Con esta definición, se modeló la frecuencia del cero estructural mediante una distribución binomial (Mullahy, 1986). Donde: X es el número de ceros estructurales presentes en una muestra tamaño n, por tanto: X ~ B(n,p_e ). Donde: Pe es la proporción de ceros estructurales y qe = 1- pe es la proporción de tejido vegetal susceptible libre de la presencia de la plaga (cero no estructural), más el tejido vegetal habitado por la especie blanco (valores enteros positivos).

De esta manera, la función de probabilidad de la variable aleatoria X o el número de ceros estructurales en la muestra de tamaño n, está dada por:

P X= x = n x p e x (1-p e ) n-x

1). Si p e es muy grande significa que los hospederos presentan poco tejido susceptible de ser dañado; ii) se estimó la probabilidad de presencia-ausencia de la plaga, como una variable condicionada de una distribución binomial. Si Y es el número de ceros no estructurales (tejido susceptible sin la presencia de plaga) en una muestra de tamaño n, entonces:

Y|X ~ B n-x,p ne

P Y= y|X= x = n-x y p ne y (1-p ne ) n-x-y

2). Donde: pne es la probabilidad de ocurrencia de un cero no estructural; entonces, en una muestra de tamaño n, X = x es el número de ceros estructurales en la muestra, Y = y es el número de ceros no estructurales, mientras que n-x-y es el número de unidades de tejido vegetal con la presencia de una plaga; de esta forma, qne = 1- pne representa la proporción de la población del tejido susceptible, habitado por el organismo de interés; iii) para modelar la abundancia de una plaga que excluya los ceros estructurales, se emplearon las distribuciones de conteos Poisson cuando la media sea igual que la varianza (equidispersión) y binomial negativa cuando la varianza sea mayor que la media (Hilbe, 2011).

La distribución Poisson se utiliza en una muestra n- x cuando Y es el número de insectos en una unidad muestral que no es un cero estructural, por lo que se puede utilizar:

P Y=y|es cero no estructural = e λ y y! para y=0, 1, 2, n

3). Donde: ( es la media del número de insectos en la población excluyendo los ceros estructurales (es decir, no se toman en cuenta las unidades muestrales sin tejido susceptible).

Con sobredispersión se emplea la binomial negativa, donde sea Y el número de insectos en una unidad que no es un cero estructural:

P Y= y| es cero no estructural = Γ y+ 1 k y Γ(y+1)Γ 1 k (1+kλ) y+ 1 k para y=0, 1, 2, 3, n

4). Donde: ( es la media del número de insectos en la población, excluyendo los ceros estructurales; k es un parámetro de sobre dispersión y ((y) es la función matemática gamma. De esta manera, las estimaciones no se ven afectadas por el exceso de ceros (ceros estructurales).

Puede notarse que, bajo este esquema, la probabilidad de un cero no estructural está dado por

e

si es Poisson y (1+kλ)^(-1/k) si es binomial negativa. La probabilidad de un cero estructural en ambos casos es pe; iv) para modelar la abundancia de la plaga considerando la mezcla los ceros estructurales y no estructurales (los dos orígenes del cero) se tienen dos casos. Si la media y varianza es igual (equidispersión), se modeló la población con la distribución Poisson cero inflada (Lambert, 1992; Zou et al., 2021) de la siguiente manera:

P Y= y = p e + 1-p e e si y= 0 (1-p e )e λ y /y!si y>0

5). La media de esta distribución es (1- pe)λ ; además, la varianza es (1- pe)λ(1+λpe) En el segundo caso, cuando se encontró sobredispersión, se utilizó la distribución binomial negativa cero inflada (BNCI) (Fang et al., 2016). Donde:

P Y= y = p e + 1-p e 1+kλ - 1 k si y= 0 1-p e Γ y+ 1 k x Γ(y+1)Γ 1 k (1+kλ) y+ 1 k si y>0

6). La media de esta distribución es (1- pe)λ; además, la varianza es (1- pe)λ(1+λ(pe+k)).

Estimación de los parámetros

Para obtener los parámetros de las distribuciones i) Poisson cero inflada; y ii) binomial negativa cero inflada, se emplearon los métodos de los momentos y máxima verosimilitud. a) para la distribución Poisson cero inflada se utilizan los estimadores de momentos para pe y λ, dados respectivamente por (Banik y Kibria, 2009):

λ ^ m = y ¯ 1- ¯ y 2 +s 2 - ¯ y ; p e ^ = s 2 - y ¯ y ¯ 2 +s 2 - ¯ y , con s 2 = 1 n i= 1 n y i - ¯ y 2

7). Con λ ^ m el estimador de momentos de la media, ¯ y la media muestral, s2 la varianza muestral y p e ^ el estimador de momentos de ocurrencia de cero estructural.

El estimador de máxima verosimilitud para p e y λ se obtienen maximizando la función de log-verosimilitud dada por:

logL k, λ = i=1 n I (y i = 0) log p e + 1-p e e + i= 1 n I (y i >0) log (1-p e )e λ y /y!

8); b) para la distribución binomial negativa cero inflada no existen los estimadores de momentos para p e , k y λ (Banik y Kibria, 2009; Hilbe, 2011). Dado que el exceso de ceros es estructural (sin tejido susceptible), con X = x ceros estructurales en una muestra de tamaño n y que X~B(n,p e ), entonces el estimador de momentos de p e está dado por p e ^ =   x n 9). Si se excluyen los ceros estructurales, los n- x elementos de la muestra presentan una distribución binomial negativa, con estimadores de momentos de k y ( dados por:

λ ^ m = ¯ y n-x ; ^ k = s n-x 2 - ¯ y n-x ¯ y n-x 2 -1, con: ¯ y n-x = 1 n-x i= 1 n-x y i , y: s n-x 2 = 1 n-x i= 1 n-x y i - ¯ y n-x 2

10). Donde: λ ^ m es el parámetro de la media estimado por el método de los momentos, y ¯ n-x la media muestral, s n-x 2 la varianza muestral; y k ^ el estimador de momentos del parámetro de dispersión.

El estimador de máxima verosimilitud para pe, k y λ se obtienen maximizando la función de log-verosimilitud dada por:

logL k, λ = i= 1 n I y i = 0 log p e + 1-p e 1+kλ - 1 k +

i= 1 n I (y i >0) log 1-p e Γ x+ 1 k x Γ(x+1)Γ 1 k (1+kλ) x+ 1 k

11). Con base en lo anterior, se propone usar los estimadores de momentos de la binomial negativa (Banik y Kibria, 2009), pero excluyendo de la ecuación los ceros estructurales, como una aproximación a los momentos de la binomial negativa cero inflada.

Derivación de las ecuaciones

Para derivar las ecuaciones de tamaño de muestra óptimo, se sustituyeron los parámetros obtenidos de los modelos iii y iv en las ecuaciones de Karandinos (1976), relacionadas con el coeficiente de variación (CV), la proporción fija de la media ( D ¯ x ) y la mitad de un intervalo de confianza (h) (Cuadro 1). Los valores de CV, D y h son arbitrarios, por lo que el valor empleado en cada caso depende de la precisión que se defina en cada investigación (Ramírez et al., 2013; Taherdoost, 2016). Se utilizó el coeficiente de variación de 25% (0.25), propuesto por Southwood y Henderson (2000), nivel adecuado para estudios ecológicos.

Cuadro 1

Cuadro 1. Ecuaciones propuestas para la estimación del tamaño de muestra óptimo de plagas con densidades bajas.

Distribución Tamaño de muestra óptimo*, con base en:
Coeficiente de variación Proporción de la media D Intervalo de confianza h
General
n =   σ μC 2
n = Z α / 2 D 2 σ 2 μ 2
n = Z α / 2 h 2 σ 2
Poisson
n = 1 λC 2
n = Z α / 2 D 2 1 λ
n = Z α / 2 h 2 λ
Binomial negativa
n = 1 λ + 1 k CV 2
n = Z α / 2 2 1 λ + 1 k D 2
n = Z α / 2 h 2 k ¯ x + ¯ x 2 k
Poisson cero inflado
n = 1 + p e λ 1 p e CV 2
n = Z α / 2 2 1 + p e λ 1 p e λD 2
n = Z α / 2 h 2 1 p e   1 + p e
Binomial negativa cero inflado
n = 1 + λ p e + k 1 p e CV 2
n = Z α / 2 2 1 + λ p e + k 1 p e λD 2
n = Z α / 2 h 2 1 p e   1 + p e + k

[i] *= para obtener el tamaño de muestra óptimo, se sustituyen los valores de λ, pe y k por sus estimadores.

Muestreos en campo vs simulaciones

Se realizaron seis muestreos sistemáticos (n= 100) en tres huertos de toronja (Citrus paradisi Macfad) Río Red en la Finca Sayula, SPR de RL de CV, Veracruz, México (latitud 19.20722, longitud -96.35194). Los datos de los muestreos fueron conteos directos en unidades pequeñas (tres hojas por brote por árbol), realizados durante los meses de junio y julio de 2021 y enero de 2022.

Tres de los muestreos se efectuaron para detectar la presencia del minador de la hoja de los cítricos Phyllocnistis citrella Stainton y tres más para detectar la presencia del pulgón vector del virus de la tristeza de los cítricos Toxoptera citricida Kirkaldy. Además, se simularon tres muestreos con Poisson cero inflado y tres muestreos con binomial negativa cero inflado; ambos con n= 100, números generados al azar. Las simulaciones se realizaron con RStudio, mediante los programas rbinom (100, size = 1, prob = 0.1, 0.4, 0.6), rpois (100-x, 1.5), rnbinom (100, 1.5) y zeroinfl (x∼1 | 1, dist = ‘poisson’, ‘negbin’) de las librerías vgam y pscl.

Para los seis muestreos de campo, tres de P. citrella (Cuadro 2) y tres de T. citricida (Cuadro 3) y para las seis simulaciones (Cuadro 4), se estimó la proporción simulada y observada de ceros estructurales, los ceros no estructurales, el parámetro k de sobredispersión, la probabilidad de cero estructural y el tamaño de muestra óptimo mediante las ecuaciones de coeficiente de variación, proporción de la media y mitad de intervalo de confianza (Cuadro 1).

Cuadro 2

Cuadro 2. Estimaciones de tamaño de muestra óptimo mediante el método de los momentos y log-verosimilitud, con Poisson cero inflado y binomial negativa cero inflada en poblaciones de Phyllocnistis citrella Stainton con exceso de ceros en el Estado de Veracruz.

Muestreo Método Distribución de probabilidad Prce / Prcne k pe CV D x ¯ h
1 log-ver mom PCI BNCI PCI BNCI 0.33/0.43 1.4e-5 1.29 0.67 0.67 0.629 0.33 81 69 70 75 81 69 70 75 51 51 - 351
2 log-ver mom PCI BNCI PCI BNCI 0.27/0.45 1.9e-5 2.69 0.537 0.537 0.465 0.27 53 55 43 102 53 55 43 102 41 41 - 472
3 log-ver mom PCI BNCI PCI BNCI 0.13/0.46 8.1e-6 1.35 0.543 0.543 0.499 0.13 54 34 47 42 54 34 47 42 148 148 50 1151

[i] log-ver= log-verosimilitud; mom= momentos; Prce= proporción de cero estructural; Prcne= proporción de cero no estructural; k= parámetro de sobredispersión; pe= probabilidad estimada de cero estructural; tamaño de muestra óptimo por: CV= coeficiente de variación; D ¯ x = proporción de la media; h= mitad de amplitud de intervalo de confianza.

Cuadro 3

Cuadro 3. Estimaciones de tamaño de muestra óptimo mediante el método de los momentos y log-verosimilitud, con Poisson cero inflado y binomial negativa cero inflada en poblaciones de Toxoptera citricida Kirkaldy con exceso de ceros en el Estado de Veracruz.

Muestreo Método Distribución de probabilidad Prce/ Prcne k pe CV D x ¯ h
1 log-ver mom PCI BNCI PCI BNCI 0.33/0.64 181.8 0.02 0.97 0.97 0.987 0.33 1061 2994 2447 18 1061 2994 2447 18 - 24686 - 1207
2 log-ver mom PCI BNCI PCI BNCI 0.27/0.68 0.426 0.056 0.95 0.949 0.96 0.27 623 450 801 17 623 450 801 17 2266 3945 - 983
3 log-ver mom PCI BNCI PCI BNCI 0.13/0.84 0.474 0.025 0.97 0.969 0.978 0.13 1050 779 1475 12.55 1050 779 1475 12.55 5738 8486 - 854

[i] log-ver= log-verosimilitud; mom= momentos; Prce= proporción de cero estructural; Prcne= proporción de cero no estructural; k= parámetro de sobredispersión; pe= probabilidad estimada de cero estructural; tamaño de muestra óptimo por CV= coeficiente de variación; D ¯ x = proporción de la media; h= mitad de amplitud de intervalo de confianza.

Cuadro 4

Cuadro 4. Estimaciones de tamaño de muestra óptimo en simulaciones Poisson cero inflada y binomial negativa cero infladas generadas en RStudio.

Muestreo Método Distribución de probabilidad Prce k pe CV D x ¯ h
SPCI1 log-ver PCI 0.1 4.8e-5 0.089 19 19 29
SPCI2 log-ver PCI 0.4 0.107 0.479 45 45 31
SPCI3 log-ver PCI 0.6 1e-5 0.476 45 45 22
SBNCI1 log-ver BNCI 0.1 2.221 0.005 39 39 664
SBNCI2 log-ver BNCI 0.4 0.623 0.429 32 32 1268
SBNCI3 log-ver BNCI 0.6 0.656 0.651 62 62 1935

[i] SPCI= simulaciones Poisson cero inflado (1-3); SBNCI= simulaciones binomiales negativa cero inflado (1-3); log-ver= log-verosimilitud; Prce= proporción de cero estructural; k= parámetro de sobredispersión; pe= probabilidad estimada de cero estructural; tamaño de muestra óptimo por: CV= coeficiente de variación; D ¯ x = proporción de la media; h= mitad de amplitud de intervalo de confianza.

Resultados y discusión

Ecuaciones propuestas para estimar el tamaño de muestra óptimo de plagas con exceso de ceros

Las ecuaciones propuestas para estimar el tamaño de muestra óptimo de plagas con exceso de ceros se detallan en la metodología (Cuadro 1).

Tamaño de muestra óptimo

Se encontró que el tamaño de muestra óptimo calculado por la proporción de la media ( D ¯ x = 0.5) es equivalente al coeficiente de variación (CV) propuesto por Southwood y Henderson (2000). Para la estimación de tamaño de muestra óptimo por la mitad del intervalo de confianza (h), no se encontró un sistema que permitiera la equivalencia con el coeficiente de variación o proporción de la media.

El tamaño de muestra óptimo de la mitad del intervalo de confianza (h) incrementó conforme aumentó el parámetro de sobredispersión (k), y resultó en tamaños de muestra óptimo muy grandes o difíciles de estimar, cuando las poblaciones de plagas presentan exceso de ceros (Cuadros 2, 3 y 4).

La estimación del tamaño de muestra óptimo por log-verosimilitud del parámetro k de las muestras de P. citrella (Cuadro 2) indicó que los muestreos tienen distribución Poisson cero inflado. La k estimada por el método de momentos de la distribución binomial negativa cero inflado, al excluir los ceros estructurales, mostró que los ceros no estructurales y los valores enteros positivos presentaban sobredispersión.

Este resultado concuerda con lo reportado por Banik y Kibria (2009), quienes indicaron que al condicionar o eliminar los ceros estructurales de una población modelada con una distribución Poisson cero inflado, también se puede modelar con una distribución binomial negativa, siempre que los datos del componente no estructural presenten sobredispersión.

Los valores de pe para los métodos de momentos y de log-verosimilitud para Poisson cero inflado fueron similares, por tanto, ambos métodos son eficientes para la estimación de los parámetros. Los tamaños de muestra estimados para P. citrella son menores cuando se estiman por momentos que por log-versomilitud, incluso cuando el número de ceros estructurales (Prce) es mayor; sin embargo, la diferencia entre ambas estimaciones no es muy grande (< 20 unidades).

El efecto de la sobredispersión afectó de manera importante el tamaño de muestra estimado por h; para P. citrella los resultados indican que es preferible la estimación por CV o por D ¯ x

, ya que aunque el intervalo oscila entre 47 y 70, el tamaño de muestra es menor al obtenido por Poisson y binomial negativa, debido a que los métodos aquí propuestos consideran el número de ceros estructurales y no estructurales.

En los muestreos de T. citricida (Cuadro 3), insecto con alta tendencia a la agregación, los valores de k estimados por log-verosimilitud indican poblaciones con distribución binomial negativa cero inflado. El valor de k por el método de los momentos resultó en valores bajos, lo que indica que, al excluir el componente estructural, las pocas unidades muestrales encontradas con plaga presentaron baja variación.

El resultado es interesante, ya que las poblaciones con distribución binomial negativa cero inflado presentan distribución al azar al nivel de predio, pero los pocos árboles ocupados tuvieron un elevado número de individuos, lo que indica agregación, en concordancia con la biología del insecto. La exclusión del cero estructural, la frecuencia de los ceros no estructurales y la reducción de la variación en los conteos con valores enteros positivos dieron por resultado tamaños de muestra muy pequeños para el CV y D ¯ x

estimados con el método de los momentos.

El tamaño de muestra óptimo de la distribución binomial negativa cero inflada, calculada por momentos, es menor porque distingue los diferentes orígenes del cero. Al tomar en cuenta para la estimación del tamaño de muestra solo los ceros no estructurales y los valores enteros positivos, se estableció una diferencia con los parámetros estimados por log-verosimilitud que no distingue el origen del cero. Por tanto, el método de los momentos para Poisson cero inflado y binomial negativa cero inflada permite estimar tamaños de muestra óptimos similares o menores que los estimados por máxima verosimilitud.

En las simulaciones (Cuadro 4) se observó que, conforme incrementaba el número de ceros estructurales, incrementaba el tamaño de muestra en ambas distribuciones, ya que como sólo se estimó el tamaño de muestra por el método de log-verosimilitud, al simular no se distingue el origen del cero. Además, el valor estimado del parámetro de sobredispersión k es congruente con los valores obtenidos en campo.

Para Poisson cero inflado se obtuvieron valores de k muy pequeños, debido a la cercanía de los valores de media y varianza, mientras que para las simulaciones de la binomial negativa cero inflada, el parámetro de sobredispersión fue mayor que cero, lo que indica sobredispersión, similar a lo reportado por Zou et al. (2021); Haslett et al. (2022).

Conclusiones

Las distribuciones de probabilidad Poisson cero inflado y binomial negativa cero inflada permiten modelar poblaciones de organismos plaga con densidades bajas y exceso de ceros. Los parámetros obtenidos por el método de los momentos distinguen el origen del cero y estiman tamaños de muestra óptimos equivalentes o menores a los estimados por log-verosimilitud, la cual no distingue el origen del cero. Una población Poisson cero inflada puede modelarse también con una distribución binomial negativa, siempre que el componente no estructural presente sobredispersión.

La estimación del tamaño de muestra óptimo en poblaciones de plagas con exceso de ceros se puede realizar de manera equivalente con la ecuación del coeficiente de variación (CV) y la ecuación de la proporción de la media ( D ¯ x

). Por otro lado, la estimación del tamaño de muestra óptimo con la ecuación de la mitad del intervalo de confianza (h) depende del valor del parámetro de sobredispersión (k), ya que no tiene un valor fijo que permita establecer una equivalencia.

Bibliografía

1 

Banik, S. and Kibria, B. M. G. 2009. On some discrete distributions and their applications with real life data. USA. JMASM. 8(2):423-447. https://doi.org/10.22237/jmasm/1257034020 .

2 

Cheung, Y. B. 2002. Zero inflated models for regression analysis of count data: a study of growth and development. USA. Statist. Med. 21(10):1461-1469. https://doi.org/10.1002/sim.1088.

3 

Clay, S. A.; French, B. W. and Mathew, F. M. 2018. Pest measurement and management. In: precision agriculture basics. Shanon, D. K.; Clay, D.E. and Kitchen N. R. (eds.). Ed. ASA, CSSA, and SSSA Books. USA. 93-102 pp. https://doi.org/10.2134/precisionagbasics.2016.0090 .

4 

Doyle, S. R. 2009. Examples of computing power for zero-inflated and over dispersed count data. USA. JMASM. 8(2):360-376. https://doi.org/10.22237/jmasm/1257033720 .

5 

Fang, R.; Wagner, B. D.; Harris, J. K. and Fillon, S. A. 2016. Zero inflated negative binomial mixed models: and important application to two microbial organisms important in oesophagitis. UK. Epidemiol. Infect. 144(1):2447-2455. http://doi.org/10.1017/S0950268816000662.

6 

García-González, J. C.; López-Collado, J.; García-García, C. G.; Villanueva-Jiménez, J. A. y Nava-Tablada, M. E. 2018. Factores bióticos, abióticos y agronómicos que afectan las poblaciones de adultos de mosca pinta (Hemiptera: Cercopidae) en cultivos de caña de azúcar en Veracruz, México. México. Acta Zool. Mex. 33(3):508-517. https://doi.org/10.21829/azm.2017.3331152.

7 

Hall, D. B. 2000. Zero inflated Poisson and binomial regression with random effects: a case study. USA. Biometrics. 56(1):1030-1039. https://doi.org/10.1111/j.0006-341x.2000.01030.x.

8 

Hashim, L. H.; Hashim, K. H. and Shiker, M. A. K. 2021. An application comparison of two Poisson models on zero count data. UK. journal of physics: conference series, 1818(012165):1-12. http://doi:10.1088/1742-6596/1818/1/012165.

9 

Haslett, J.; Parnel, A. C.; Hinde, J. and de Andrade, M. R., 2022. Modelling excess of zeros in count data: a new perspective on modelling approaches. USA. International statistical review. 90(2):216-236. https://doi.org/10.1111/insr.12479.

10 

Hilbe, J. M. 2011. Negative binomial regression. Cambridge University Press. 2a Ed. UK. 346-399 pp.

11 

Jankielsohn, A. 2017. The redesign of suitable agricultural crop ecosystems by increasing natural ecosystem services provided by insects. Hong Kong SAR China. Advances in ecological and environmental research. 1(1):365-381. http://www.ss-pub.org/wp-content/uploads/2017/09/AEER2017040501-1.pdf.

12 

Karandinos, M. G. 1976. Optimum sample size and comments on one published formula. USA. Bull. Entomol. Soc. Amer. 22(4):417-421. https://doi.org/10.1093/besa/22.4.417 .

13 

Lambert, D. 1992. Zero inflated Poisson regression, with an application to defects manufacturing. USA. Technometrics. 34(1):1-14. https://doi.org/10.2307/1269547.

14 

Mullahy, J. 1986. Specification and testing of some modified count data models. Netherlands. J. Econ. 33(1):341-365. https://doi.org/10.1016/0304-4076(86)90002-3 .

15 

Ramírez, I. C.; Barrera, C. J. y Correa, J. C. 2013. Efecto del tamaño de muestra y el número de réplicas bootstrap. Colombia. Inycompe. 15(1):93-101. https://www.redalyc.org/articulo.oa?id=291329165008.

16 

Shannon, D. K.; Clay, D. E. and Sudduth, K. A. 2018. And introduction to precision agriculture. In: precision agriculture basics . Shanon, D. K.; Clay, D.E. and Kitchen N. R. (eds.). Ed. ASA, CSSA, and SSSA Books. USA. 1-12 pp. https://doi.org/10.2134/precisionagbasics.2016.0084.

17 

Southwood, T. R. E. and Henderson, P. A. 2000. Ecological methods. Blackwell science. 3rd Ed. Oxford, UK. 7-66 pp. https://www.researchgate.net/publication/260051655-Ecological-Methods-3rd-edition.

18 

Taherdoost, H. 2016. Sampling methods in research methodology, how to choose a sampling technique for research. Brazil. IJARM. 5(2):18-27. http://dx.doi.org/10.2139/ssrn.3205035 .

19 

Talaviya, T.; Shah, D.; Patel, N.; Yagnik, H. and Shah, M. 2020. Implementation of artificial intelligence in agriculture for optimization of irrigation and application of pesticides and herbicides. China. Artificial Intelligence in Agric. 4(1):58-73. https://doi.org/10.1016/j.aiia.2020.04.002.

20 

Villanueva-Jiménez, J. A.; Reyes-Pérez, N. y Abato-Zárate, M. 2017. Manejo integrado de plagas y sostenibilidad. In: agricultura sostenible como base para los agronegocios. Jarquín, G. R. y Huerta, P. A. (coords.). 1a Ed. Universidad Autónoma de San Luis Potosí. México. 32-42 pp. https://www.researchgate.net/publication/320779257-Manejo-Integrado-de-Plagas-y-Sostenibilidad .

21 

Yesilova, A.; Kaydan, M. B. and Kaya, Y. 2010. Modeling insect-egg data with excess zero using zero-inflated regression models. Hacettepe J. Math. Stat. 39(2):273-282. http://www.hjms.hacettepe.edu.tr/uploads/c879f14e-8c0d-4f30-8bfa-e28658 a8fe0b.pdf.

22 

Zou, Y.; Hanning, J. and Young, D. S. 2021. Generalized fiducial inference on the mean of zero inflated Poisson and Poisson hurdle models. Germany. J Statistical Distributions and Applications. 8(5):1-15. https://doi.org/10.1186/s40488-021-00117-0.