Conferencias


Conferencia 1.  Ciencia de los Datos: ¿Frankestein o Colcha de Retazos?

  • Juan David Ospina Arango, PhD., Grupo Bancolombia, Universidad Nacional de Colombia, Medellín, Colombia

Recientemente, las grandes empresas vienen mostrando un creciente gran afán por atraer "científicos de datos". Difíciles de definir, es con estos personajes que las organizaciones están creando sus ventajas competitivas.

Estos personajes son expertos en obtener de los datos revelaciones fascinantes, en darle una nueva mirada a lo que parecía obvio y en sembrar las semillas de la innovación empresarial. Sin embargo, si consideramos que sus herramientas de trabajo incluyen el análisis descriptivo tradicional y que en la mayoría de sus desarrollos los modelos lineales siguen jugando un papel preponderante, podemos cuestionar si en realidad estos científicos de datos son algo realmente nuevo.

En esta charla se exploran algunos cambios culturales en las organizaciones, tendencias como el aprendizaje de máquina y el big data y su relación con las leyes de los grandes números para tratar de entender si esta ciencia de los datos es un nuevo Frankeistein o más bien una colcha de retazos.

Conferencia 2.  Pruebas de Normalidad. Algunas Consideraciones y Propuestas

  • Pere Grima Cintas, PhD., Universitat Politècnica de Catalunya,  Barcelona, España
  • Roberto Behar Gutiérrez,  PhD., Universidad del Valle, Cali,Colombia

En el contexto de las pruebas estadísticas, las de normalidad presentan algunas peculiaridades, como que hay muchas y que su número sigue creciendo, o que –a diferencia del planteamiento general de los contrastes de hipótesis– se supone cierto lo que interesa y la carga de la prueba la tiene el que afirma otra cosa. En la conferencia se comentarán estos aspectos en el marco de las pruebas estadísticas en general y de la forma de enseñarlas. También se presentará un procedimiento para comparar la potencia de las pruebas normalidad y se propondrá un nuevo planteamiento (que no un nuevo test) para realizar estas pruebas.

Conferencia 3. Statistical  Demonstration  Tests  of  Survival  with Censored Data

(Se dictará en español)
  • Luis Alberto Escobar Restrepo, PhD., Lousiana State University, Estados Unidos

It is often necessary to specify the procedure, the sample size, and test length for a test with censored data that is to be used to demonstrate , with some level of confidence, that survival times exceed a given standard. For example, a customer purchasing a product may require demonstration, by the vendor, that the reliability of a component for five years is 0.99. Generally this is done by testing a sample of units simultaneously for a specified amount of time. If the number of failure in the test is small enough, the demonstration is successful. Up to recently, this type of tests have used binary data and required zero failures, in sample of size n, during a specified length of time. We propose the generalization of the methodology relaxing the request of zero failures and the type of data to be used. We also advance the use of Bayesian methods with meaningful informative priors to decrease the large sample sizes and the long demonstration tests

Conferencia 4. Statistical modeling of spatial big data: an approach from a functional data analysis perspective (Modelación estadística de datos espaciales masivos: una aproximación desde la perspectiva del análisis de datos funcionales)

  • Ramón Giraldo Henao, PhD., Universidad Nacional de Colombia, Bogotá, Colombia

Conferencia 5. Spherical Factor Analysis for Binary Data: A Look at the Conservative Revolt in the US House of Representatives

(Se dictará en español)
  • Abel Rodriguez, PhD.,   University of California, Santa Cruz, Estados Unidos

Factors models for binary data are extremely common in many social science disciplines. For example, in political science binary factor models are often used to explain voting patterns in deliberative bodies such as the US Congress, leading to an “ideological” ranking of legislators. Binary factor models can be motivated through so-call “spatial” voting models, which posit that legislators have a most preferred policy – their ideal point –, which can be represented as a point in some Euclidean “policy space”. Legislators then vote for/against motions in accordance with the distance between their (latent) preferences and the position of the bill in the same policy space.

In this talk we introduce a novel class of binary factor models derived from spatial voting models in which the policy space corresponds to a non-Euclidean manifold. In particular, we consider embedding legislator’s preferences in the surface of a n-dimensional sphere. The resulting model contains the standard binary Euclidean factor model as a limiting case, and provides a mechanism to operationalize (and extend) the so-called “horseshoe theory” in political science, which postulates that the far-left and far-right are more similar to each other in essentials than either are to the political center. The performance of the model is illustrated using voting data from recent US Congresses. In particular, we show that voting patterns for the 113th US House of Representatives are better explained by a circular factor model than by either a one- or a two-dimensional Euclidean model, and that the circular model yields a ranking of legislators more in accord with expert’s expectations.

Conferencia 6. El Valor de los Datos Masivos

  • Claudia Jiménez Ramírez, PhD., Universidad Nacional de Colombia, Medellín, Colombia

Los datos abiertos son aquellos que se originan, en su mayoría, de las actividades financiadas con recursos públicos aunque también provienen de otras fuentes pero que son publicados en portales del gobierno. Esta información se encuentra abierta y disponible a cualquier persona sin importar grupo o condición social. Los datos ofrecidos se llaman abiertos porque pueden ser usados libremente, modificados y compartidos por cualquier grupo de personas u organización, incluido el mismo gobierno.

El propósito de la charla es dar a conocer los principios que subyacen sobre los datos abiertos para que puedan generar valor por la creación de nuevos servicios o productos, por la determinación del impacto de las políticas públicas, entre otras cosas. Para mostrar la importancia de los datos abiertos, se presentarán variados ejemplos del uso de los mismos, tanto por el ciudadano común, como por estadísticos y científicos de datos. Adicionalmente, se dará a conocer cuál es el posicionamiento de nuestro país en el ámbito mundial, de acuerdo con varios índices propuestos para determinar el grado de madurez de los países con respecto a los datos abiertos. Por último, se presentarán los retos que se deben enfrentar para aprovechar al máximo este recurso.

Conferencia 7. Some big data and big issues in neonatal care.

(Se dictará en español)
  • Nicholas Tibor Longford, PhD., Imperial College London, Inglaterra 

Conferencia 8. Pendiente de definir

Conferencia 9. Pendiente de definir

Conferencia 10. Pendiente de definir

Conferencia 11. Pendiente de definir

Conferencia 12. Pendiente de definir

Conferencia 13. Pendiente de definir

Conferencia 14. Pendiente de definir

Organiza