RESUMO
ABSTRACT Random Forest approaches have been used in phenotyping at both morphological and metabolic levels and in genomics studies, but direct applications in practical situations of plant genetics and breeding are scarce. Random Forest was compared with Discriminant Analysis for its ability in classifying tomato individuals belonging to different breeding populations, exclusively based on phenotypic fruit quality traits. In order to take into account different steps in breeding programs, two populations were assayed. One was composed by a set of RILs derived from an interspecific tomato cross, and the other was composed by two of these RILs and the corresponding F1, F2 and backcross generations. Being tomato an autogamous species, the first population was considered a final step in breeding programs because promising genotypes are being evaluated for putative commercial release as new cultivars. Meanwhile, the second one, in which new variation is being generated, was considered as an initial step. Both Random Forest and Discriminant Analysis were able to classify populations with the aim of evaluating general variability and identifying the traits that most contribute to this variability. However, overall errors in classification were lower for Random Forest. When comparing the adequacy of classification between populations, errors of both statistical analyses were greater in the second population than in the first one, though Random Forest was more precise than Discriminant Analysis even in this initial step of plant breeding programs. Random Forest allowed breeders to get a reliable classification of tomato individuals belonging to different breeding populations.
RESUMEN Los enfoques de Random Forest se han utilizado en la fenotipificación, tanto a nivel morfológico como metabólico, y en estudios de genómica, pero las aplicaciones directas en situaciones prácticas de fitomejoramiento y genética son escasas. Random Forest se comparó con el Análisis Discriminante por su capacidad en la clasificación de individuos de tomate pertenecientes a diferentes poblaciones de mejoramiento, exclusivamente en función de los rasgos fenotípicos de calidad de la fruta. Para tener en cuenta los diferentes pasos en los programas de mejoramiento, se ensayaron dos poblaciones. Una estaba compuesta por un conjunto de RILs derivadas de un cruce interespecífico de tomate, y la otra estaba compuesta por dos de estas RILs y las correspondientes generaciones F1, F2 y retrocruzas. Siendo el tomate una especie autógama, la primera población se consideró un paso final en los programas de mejoramiento porque se están evaluando genotipos prometedores para su lanzamiento comercial putativo como nuevos cultivares. Mientras tanto, la segunda, en la que se está generando nueva variación, se consideró como un paso inicial. Tanto Random Forest como Análisis Discriminante pudieron clasificar poblaciones con el objetivo de evaluar la variabilidad general e identificar los rasgos que más contribuyen a esta variabilidad. Sin embargo, los errores generales en la clasificación fueron menores para Random Forest. Al comparar la adecuación de la clasificación entre poblaciones, los errores de ambos análisis estadísticos fueron mayores en la segunda población que en la primera, aunque Random Forest fue más preciso que el Análisis Discriminante incluso en este paso inicial de los programas de fitomejoramiento. Random Forest permitió a los criadores obtener una clasificación fiable de individuos de tomate pertenecientes a diferentes poblaciones de cría.
RESUMO
RESUMEN En el mejoramiento del tomate (Solanum lycopersicum L.) se ha logrado un incremento significativo para el rendimiento y otras características productivas en un período corto de tiempo. Como consecuencia se redujo notablemente la diversidad genética. Si bien el germoplasma silvestre se ha utilizado principalmente como fuente de genes de resistencia para enfermedades y plagas, nuestro grupo inició en la década de 1990, un programa de mejoramiento genético en tomate para mejorar la calidad del fruto con especial énfasis en incrementar la vida poscosecha y también ampliar la variabilidad genética con la incorporación de estos genes al gran cultivo. Hemos desarrollado diferentes poblaciones a partir del cruzamiento interespecífico entre el cultivar argentino Caimanta de S. lycopersicum y la accesión LA0722 de S. pimpinellifolium L. Mediante la generación de cruzamientos entre estos padres selectos y el posterior avance generacional de la selección se ha tratado de dilucidar las bases genéticas que definen la calidad del fruto. Para ello se integraron al programa de mejoramiento información obtenida de datos genómicos, posgenómicos y bioinformáticos. Al mismo tiempo hemos desarrollado cuatro nuevos cultivares con características de calidad de fruto superiores al ser comparados con híbridos comerciales. Para conservar y estudiar la diversidad del cultivo también estamos desarrollado una colección de germoplasma que en la actualidad cuenta con 162 genotipos de tomate de diferentes especies y orígenes. Además, se ha iniciado la transferencia directa de plantines a huertas urbanas y periurbanas para favorecer el acceso a semillas de estos cultivares desarrollados en instituciones públicas.
ABSTRACT The genetic improvement of tomato (Solanum lycopersicum L.) has achieved an increase for yield and other agronomic traits in a short period of time. As a consequence, genetic diversity has been notably reduced. Wild germplasm has been mostly used as a source of resistance genes for diseases and pests. Our group started in the 1990' a breeding program in tomato for improving fruit quality, with special emphasis on increasing fruit shelf life and broadening the genetic variability with the incorporation of wild genes. We have developed different populations from the interspecific cross between the Argentine cultivar Caimanta of S. lycopersicum and the accession LA0722 of S. pimpinellifolium L. Through crosses between these selected parents and the subsequent generational selection advance, we attempted to elucidate the genetic bases that underlie tomato fruit quality. To do that, we use state-of-the-art technology available in the field of genetics and breeding programs, including genomic, post-genomic and bioinformatic data. At the same time, we have developed four new cultivars with improved fruit quality traits compared to commercial hybrids. To conserve and study the tomato diversity, we have developed a germplasm collection that currently contains 162 tomato genotypes from different species and origins. In addition, we have started a direct transfer of our cultivars to urban and peri-urban community orchards to facilitate them the access to genotypes that were developed in Argentine public institutions.
RESUMO
The effects of wild germplasm on tomato fruit shelf life have not yet been completely evaluated. Three different genotypes of Lycopersicon esculentum (a cultivated variety, a homozygote for nor and a homozygote for rin), LA1385 of L. esculentum var. cerasiforme, LA722 of L. pimpinellifolium, and 10 diallel hybrids were assayed. Mean values of fruit shelf life, weight, shape, and mean number of flowers per cluster were analyzed after Griffing (1956, Aust. J. Biology 9: 463-493), method 2, model 1. Both general and specific combining abilities (GCA and SCA) were significant for the four traits. Negative unidirectional dominance was detected for fruit weight and shelf life, while bidirectional dominance was detected for fruit shape and mean number of flowers per cluster. SCA was greater than GCA for shelf life, so nonadditive effects predominantly accounted for this trait. In the heterozygous state, rin had smaller mean effects than nor. Wild accessions were able to prolong shelf life per se, and in crosses to the cultivated variety. The cross between the homozygote for nor and LA722 yielded the longest shelf life among hybrids