Los 10 mitos más populares sobre el aprendizaje automático

Las compañías de tecnología multinacionales como Google, Facebook y Amazon utilizaron el aprendizaje automático en secreto antes de que el aprendizaje automático fuera aceptable a nivel mundial. Google se encargó de la colocación de anuncios con la ayuda del aprendizaje automático, mientras que Facebook mostró los feeds de publicación de aprendizaje automático según su conveniencia. Amazon mostró recomendaciones de sitios web de comercio electrónico que afectaron los clics de los usuarios. Por ejemplo, si el usuario compró recientemente un zapato, Amazon usó esta información para mostrar recomendaciones para otros zapatos de la misma forma y estructura para una mayor exploración.

Aunque el aprendizaje automático ha sufrido modificaciones desde hace muy poco, ahora también es el centro de un tema esencial de discusión: ¿es el aprendizaje automático el fin de la privacidad para la raza humana? ¿Qué más puede hacer el aprendizaje automático, excepto conducir automóviles y comunicarse automáticamente? ¿El aprendizaje automático es dañino? Este artículo proporcionará una vista rápida de varios conceptos erróneos a lo largo del tiempo.

El aprendizaje automático solo resume los datos.

De hecho, el objetivo principal del aprendizaje automático es predecir el futuro. Conocer las películas que viste en el pasado es solo una forma de ver cuáles quieres ver a continuación. Su registro de crédito es una guía para pagar sus facturas a tiempo. Los algoritmos de aprendizaje, como los robots científicos, formulan hipótesis y las refinan, y las creen solo cuando sus predicciones se hacen realidad. Los algoritmos de aprendizaje aún no son tan inteligentes como los científicos, pero son millones de veces más rápidos.

Los algoritmos de aprendizaje solo revelan correlaciones entre pares de eventos.

Esta es la impresión que obtienes de la mayoría de los medios. Un aumento en las búsquedas de Google de "gripe" es una señal temprana en un caso famoso de que se propaga. Eso es bueno y bueno, pero la mayoría de los algoritmos de aprendizaje descubren formas de conocimiento mucho más ricas, como la regla Si un lunar tiene una forma y color irregulares.

El aprendizaje automático solo puede descubrir correlaciones, no causas.

De hecho, uno de los tipos más populares de aprendizaje automático implica la prueba y observación de diferentes acciones, la esencia del descubrimiento causal. Un sitio de comercio electrónico, por ejemplo, puede probar varios métodos para presentar un producto y seleccionar el que lleve a la mayoría de las compras. Probablemente participó sin saberlo en miles de estos experimentos. E incluso en situaciones donde los experimentos están fuera de discusión, y todo lo que las computadoras pueden hacer es mirar la información pasada, se pueden descubrir relaciones causales.

Los eventos no vistos, como los cisnes negros, no se pueden predecir en el aprendizaje automático.

Si algo nunca ha sucedido antes, se espera que sea 0. El aprendizaje automático, por otro lado, es el arte de predecir con precisión eventos raros. Si A es una de las causas de B y B es una de las razones de C, A puede conducir a C, aunque nunca antes. Los filtros de spam marcan los correos electrónicos de spam correctamente todos los días. De hecho, los cisnes Schwarze fueron ampliamente anticipados, al igual que la caída de la vivienda de 2008 no fue utilizada por la mayoría de los bancos en ese momento por modelos de riesgo defectuoso.

Cuantos más datos tenga, es probable que haya patrones alucinantes.

Mientras más informes telefónicos mire la NSA, más probabilidades hay de señalar a un hombre inocente como un posible terrorista, ya que accidentalmente se alineó con una regla de detección de terroristas. Los profesionales del aprendizaje automático pueden aumentar el riesgo de alucinaciones extrayendo más atributos de las mismas entidades, pero mantenerlo al mínimo es excelente. Por otro lado, extraer más objetos con el mismo conjunto de atributos reduce el riesgo, ya que admiten las reglas. Y hay algunos algoritmos de aprendizaje que pueden ayudar a encontrar patrones de múltiples entidades y hacerlos aún más robustos. Cualquiera que grabe en video el Ayuntamiento de Nueva York puede ser impensable, y puede que no haya ninguna otra persona que compre grandes cantidades de nitrato de amonio.

El aprendizaje automático no tiene en cuenta los conocimientos preexistentes.

El enfoque de "pizarra en blanco" de los algoritmos de aprendizaje que conocen ha sido impregnado por expertos que buscan con recelo. El conocimiento real es el resultado de un largo proceso de razonamiento y experimentación que no puede imitarse utilizando un algoritmo genérico de base de datos. Sin embargo, no todos los algoritmos de aprendizaje comienzan en una pizarra blanca; algunos datos de usuario para refinar el conocimiento preexistente, que es muy elaborado si está encriptado en forma de computadora.

Aprender modelos informáticos es incomprensible para las personas.

Esto es motivo de preocupación, por supuesto. ¿Cómo podemos confiar en sus recomendaciones si un algoritmo de aprendizaje es una caja negra? Algunos tipos de modelos son difíciles de entender, como las redes neuronales profundas que son responsables de algunos de los éxitos más notables en el aprendizaje automático (como el reconocimiento de gatos en los videos de YouTube). Pero otros son bastante comprensibles, como la regla que vimos anteriormente para diagnosticar el cáncer de piel.

Los modelos más simples son más precisos.

A veces, esta creencia se equipara con la maquinilla de afeitar de Occam, pero la maquinilla de afeitar solo dice que es preferible tener explicaciones más directas, no por qué. Debido a que son más fáciles de entender, recordar y razonar, son superiores. A veces, la hipótesis más simple de coherencia de datos es menos precisa que una más complicada para la predicción. Algunos de los algoritmos de aprendizaje más potentes generan modelos que parecen ser gratuitos, a veces incluso agregándolos después de que encajan perfectamente con los datos, pero así es como superan a los menos poderosos.

Es posible tomar los patrones que las computadoras descubren al pie de la letra.

Si un algoritmo de aprendizaje produce la regla para el diagnóstico de cáncer de piel que hemos visto antes y la regla es muy precisa (en el sentido de que casi todos los lunares que coinciden son tumores), eso no significa necesariamente que debas creer eso. Un ligero cambio en los datos podría llevar a que el algoritmo induzca una regla muy diferente pero igualmente precisa. Solo se puede confiar en que las reglas que se inducen de manera confiable a pesar de las variaciones aleatorias en los datos significan lo que dicen, en lugar de ser solo herramientas predictivas útiles.

El aprendizaje automático producirá inteligencia sobrehumana en el futuro cercano.

Según las noticias diarias, es fácil tener la impresión de que las computadoras están a punto de ver, hablar y razonar tan bien como nosotros, después de lo cual nos dejarán en el polvo rápidamente. Ciertamente hemos recorrido un largo camino en los primeros 50 años de inteligencia artificial, y la razón principal de sus logros recientes es el aprendizaje automático, pero hay mucho más por hacer. Las computadoras pueden hacer muchas tareas pequeñas muy bien, pero todavía no hay sentido común y nadie sabe cómo enseñarlo.


Leave a Comment!