60 preguntas comunes de entrevistas de trabajo de Machine Learning

 

Según Indeed.com, el ingeniero de aprendizaje automático se está convirtiendo en uno de los trabajos más solicitados del mundo, debido a la creciente demanda y los altos salarios. Ofrece un potencial casi infinito, ya que existe una gran necesidad de talento, y la demanda de solicitantes de empleo calificados ya está superando la de los científicos de datos.

Gartner predice que con la expansión de productos y servicios relacionados con el aprendizaje automático, la industria se expandirá de $ 1.4 mil millones en 2017 a $ 8.8 mil millones en 2020, creando 2.3 millones de nuevos empleos.

Con los listados de trabajo de Machine Learning en aumento en áreas como el procesamiento del lenguaje natural y el aprendizaje profundo, hay un lugar para cualquier persona, independientemente de la especialidad en la que esté interesado.

Este artículo es un repositorio de 60 preguntas frecuentes durante las entrevistas de aprendizaje automático. Viene en un formato de pregunta / respuesta. Le hemos dado las respuestas más cortas posibles para que pueda memorizarlas fácilmente. ¡Empecemos!

1. ¿Cuáles son las diferentes técnicas en el aprendizaje automático?

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje semi-supervisado
  • Aprendizaje reforzado
  • Transducción
  • Aprendiendo a aprender

2. ¿Cuáles son los diversos enfoques del aprendizaje automático?

  • Concepto vs. Aprendizaje de clasificación
  • Simbólico vs. Aprendizaje estadístico
  • Inductivo vs. Aprendizaje Analitico

3. ¿Cuál es la diferencia entre el aprendizaje automático supervisado y no supervisado?

Supervisado Aprendiendo de datos etiquetados usando modelos de clasificación y regresión.
Sin supervisión: Aprendizaje de datos sin etiquetar utilizando modelos de análisis de factores y grupos.

4. Explicar las funciones del aprendizaje supervisado.

  • Clasificaciones
  • Reconocimiento de voz
  • Regresión
  • Predecir series de tiempo
  • Anotar cadenas

5. ¿Cuáles son los algoritmos utilizados para el aprendizaje supervisado?

  • Regresión lineal
  • Regresión logística
  • Árbol de decisión
  • Bosque al azar
  • KNN
  • Bayes ingenuos

6. ¿Cuáles son los dos métodos utilizados para la calibración en el aprendizaje supervisado?

  • Calibración Platt
  • Regresión isotónica

7. Explicar las funciones del aprendizaje no supervisado.

  • Encuentra grupos de datos
  • Encuentra representaciones de baja dimensión de los datos
  • Encuentra direcciones interesantes en los datos
  • Coordenadas y correlaciones interesantes.
  • Encuentra nuevas observaciones / limpieza de bases de datos.

8. ¿Cuáles son los algoritmos utilizados para el aprendizaje no supervisado?

  • K-significa
  • Agrupación jerárquica
  • Agrupación de t-SNE
  • Agrupación DBSCAN
  • Análisis de componentes principales (PCA)
  • Detección de anomalías

9. ¿Cuál es el enfoque estándar para el aprendizaje supervisado?

Divida el conjunto de ejemplos en el conjunto de entrenamiento y la prueba.

10. Explique la diferencia entre Vecinos K-Nearest y Agrupación K-Means

K-Nearest Neighbours es un algoritmo de aprendizaje automático supervisado que clasifica los puntos en datos etiquetados, en función de la distancia del punto desde los puntos más cercanos. La agrupación de K-Means es un algoritmo de aprendizaje automático no supervisado, que clasifica los puntos dentro de datos no etiquetados en grupos basados ​​en la media de las distancias entre diferentes puntos.

11. ¿Cuáles son los cinco algoritmos populares en Machine Learning?

  • Árboles de decisión
  • Redes neuronales (retropropagación)
  • Redes probabilísticas
  • Vecino más cercano
  • Soporte de máquinas vectoriales

12. ¿Cuáles son las tres etapas de la construcción de un modelo?

  • Construcción del modelo
  • Prueba de modelo
  • Aplicando el modelo

13. ¿Cuál es la diferencia entre clasificación y regresión?

La clasificación se utiliza para clasificar datos en algunas categorías específicas y producir resultados discretos. La regresión se utiliza para tratar datos continuos en un determinado momento.

14. Explique «Conjunto de entrenamiento» y «Conjunto de prueba».

El conjunto de entrenamiento representa el conjunto de datos utilizado para entrenar el modelo. El conjunto de prueba representa el conjunto de datos utilizado para probar el modelo entrenado.

15. ¿Qué son los modelos paramétricos?

Los modelos paramétricos son aquellos con un número finito de parámetros, mientras que los modelos no paramétricos son aquellos con un número ilimitado de parámetros.

16. ¿Por qué sucede el sobreajuste?

El sobreajuste ocurre debido a la complejidad de los parámetros en un modelo. El modelo describe error aleatorio o ruido en lugar de la relación subyacente.

17. ¿Cómo evitar el sobreajuste?

  • Mantenga el modelo simple.
  • Elija menos variables y parámetros para reducir el ruido.
  • Utilice técnicas de validación cruzada como la validación cruzada de K-folds para mantener el sobreajuste bajo control.
  • Siga las técnicas de regularización como LASSO.

18. ¿Cuál es el método utilizado con frecuencia para evitar el sobreajuste?

  • Regresión isotónica

19. ¿Cuáles son las ventajas y desventajas de los árboles de decisión?

Los árboles de decisión son fáciles de interpretar y hay relativamente pocos parámetros para ajustar. Son propensos a sobreajustar.

20. ¿Cuál es la diferencia entre el descenso de gradiente estocástico (SGD) y el descenso de gradiente (GD)?

El descenso de gradiente estándar es un método para evaluar todas las muestras de entrenamiento para cada conjunto de parámetros para minimizar una función de pérdida y realizar ajustes, mientras que, en el descenso de gradiente estocástico, evalúa solo una muestra de entrenamiento para el conjunto de parámetros.

21. ¿Qué es el clasificador?

Un clasificador utiliza algunos datos de entrenamiento para comprender cómo las variables de entrada dadas se relacionan con la clase.

22. ¿Cuál es la ventaja clave de Navie Bayes?

A diferencia de los modelos discriminativos como la regresión logística, un ingenuo clasificador de Bayes converge más rápido, por lo que necesita menos datos de entrenamiento.

23. ¿Qué está aprendiendo Ensemble?

El aprendizaje conjunto significa combinar muchos modelos básicos como clasificadores y regresores, para obtener mejores resultados. Se utiliza al construir un clasificador de componentes preciso e independiente.

24. Explique la reducción de dimensiones.

La reducción de dimensiones es el proceso de reducir el tamaño de la matriz de características (como el número de columnas, ya sea combinando columnas o eliminando variables adicionales), para obtener un mejor conjunto de características.

25. ¿Cuáles son los mejores algoritmos de reducción de dimensionalidad?

  • Relación de valor perdido
  • Filtro de baja varianza
  • Filtro de alta correlación
  • Bosque al azar
  • Eliminación de funciones hacia atrás
  • Selección de funciones hacia adelante
  • Análisis factorial
  • Análisis de componentes principales
  • Análisis de componentes independientes
  • Incrustación de vecinos estocásticos distribuidos en t (t-SNE)
  • UMAP

26. ¿Qué es el aprendizaje conjunto?

El aprendizaje conjunto es un proceso de generación y combinación estratégica de múltiples modelos, como clasificadores o expertos, para resolver un programa computacional particular.

27. ¿Por qué se usa el aprendizaje conjunto?

Para mejorar la clasificación, predicción y aproximación de funciones de un modelo.

28. ¿Cuándo usar el aprendizaje conjunto?

Para construir clasificadores de componentes que sean más precisos e independientes entre sí.

29. ¿Cuáles son los dos paradigmas de los métodos de conjunto?

  • Métodos de conjunto secuencial
  • Métodos de conjunto paralelo

30. ¿Cuál es el principio general de un método de conjunto?

Combine las predicciones de varios modelos y mejore la robustez en un solo modelo.

31. ¿Qué son las técnicas de conjunto?

Básico: votación máxima, promedios, promedios ponderados
Avanzado: apilamiento, mezcla, embolsado, refuerzo

32. ¿Qué es embolsar y aumentar?

El ensacado es un método en conjunto para mejorar la estimación inestable o los esquemas de clasificación. El refuerzo es un método utilizado secuencialmente para reducir el sesgo del modelo combinado. El refuerzo y el embolsado reducen los errores al reducir el término de varianza.

33. ¿Cuáles son los mejores algoritmos de ensacado?

  • Metaestimulador de ensacado
  • Bosque al azar

34. ¿Cuáles son los mejores algoritmos de refuerzo?

  • Adaboost
  • Algoritmo de refuerzo de gradiente (GBM)
  • Incremento de gradiente extremo (XBM)
  • GBM ligero
  • Catboost

35. ¿Qué harías si tu modelo adolece de un sesgo bajo y una varianza alta?

Utilice algoritmos de ensacado como regresor forestal aleatorio.

36. ¿Cuál es la diferencia entre un bosque aleatorio y un algoritmo de aumento de gradiente?

El bosque aleatorio usa técnicas de embolsado para reducir la varianza, mientras que el aumento de gradiente usa técnicas de aumento para reducir el sesgo y la varianza.

37. ¿Cuáles son las áreas de reconocimiento de patrones más utilizadas?

  • Visión por computador
  • Reconocimiento de voz
  • Procesamiento de datos
  • Estadísticas
  • Recuperación Informal
  • Bioinformática

38. ¿Qué es la programación genética?

La programación genética es una técnica para probar varios modelos y seleccionar el mejor en función de mejores resultados.

39. ¿Qué es la programación lógica inductiva (ILP)

ILP es un subcampo en el aprendizaje automático que utiliza programación lógica para representar el conocimiento y los ejemplos.

40. ¿Cuál es la diferencia entre la heurística para el aprendizaje de reglas y la heurística para los árboles de decisión?

La heurística para los árboles de decisión evalúa la calidad promedio de varios conjuntos desarticulados. Los aprendices de reglas solo evalúan la calidad del conjunto de instancias que están cubiertas con la regla candidata.

41. ¿Qué es el perceptrón?

Perceptron es un algoritmo para la clasificación supervisada de la entrada en una de varias posibles salidas no binarias.

42. Explique los dos componentes del programa lógico bayesiano.

Un componente lógico, que consiste en un conjunto de cláusulas bayesianas, que captura la estructura cualitativa del dominio.
Un componente cuantitativo que codifica la información cuantitativa sobre el dominio.

43. ¿Qué es la red bayesiana?

La Red Bayesiana representa el modelo gráfico para la relación de probabilidad entre un conjunto de variables.

44. ¿Por qué los algoritmos de aprendizaje basados ​​en instancias se denominan algoritmos de aprendizaje diferidos?

Retrasan el proceso de inducción o generalización hasta que se realiza la clasificación.

45. ¿Cuáles son los dos métodos de clasificación que SVM (Support Vector Machine) puede manejar?

  • Combinando clasificadores binarios
  • Modificar binario para incorporar aprendizaje multiclase

46. ​​¿Qué es un algoritmo de aprendizaje incremental?

El aprendizaje incremental es la capacidad de un algoritmo para aprender de los nuevos datos disponibles después de que un conjunto de datos disponible haya generado un clasificador.

47. ¿Para qué se utilizan PCA, KPCA e ICA?

PCA (análisis de componentes principales), KPCA (análisis de componentes principales basado en el núcleo) e ICA (análisis de componentes independientes) son técnicas de extracción utilizadas para
reducción de dimensionalidad.

48. ¿Qué es la reducción de dimensiones?

Es el proceso de reducir el número de variables aleatorias bajo consideración.

49. ¿Qué son las máquinas de vectores de soporte?

Las máquinas de vectores de soporte son algoritmos de aprendizaje supervisado utilizados para el análisis de clasificación y regresión.

50. ¿Cuáles son los componentes de las técnicas de evaluación relacional?

  • Adquisición de datos
  • Adquisición de la verdad del terreno
  • Técnica de validación cruzada
  • Tipo de consulta
  • Métrica de puntuación
  • Prueba de significancia

51. ¿Cuáles son los diferentes métodos en el aprendizaje secuencial supervisado?

  • Métodos de ventana deslizante
  • Ventanas corredizas recurrentes
  • Modelos ocultos de Markow
  • Modelos de Markow de entropía máxima
  • Campos aleatorios condicionales
  • Redes de transformadores gráficos

52. ¿Qué es el aprendizaje PAC?

El aprendizaje PAC (probablemente aproximadamente correcto) es un marco de aprendizaje introducido para analizar algoritmos de aprendizaje y su eficiencia estadística.

53. ¿Cuáles son las diferentes categorías en el proceso de aprendizaje secuencial?

  • Predicción de secuencia
  • Generación de secuencia
  • Reconocimiento de secuencia
  • Decisión secuencial

54. ¿Qué es el aprendizaje secuencial?

El aprendizaje secuencial es un método de enseñanza y aprendizaje de manera lógica.

55. ¿Cuáles son las tres técnicas de preprocesamiento de datos para manejar los valores atípicos?

  • Winsorize
  • Transformar para reducir la inclinación
  • Elimine los valores atípicos si está seguro de que son anomalías o errores de medición.

56. ¿Cuáles son las tres formas de reducir la dimensionalidad?

  • Eliminar características colineales.
  • Realización de PCA, ICA u otras formas de reducción de dimensionalidad algorítmica.
  • Combinando características con ingeniería de características.

57. ¿Cuáles son las ventajas y desventajas de las redes neuronales?

Las redes neuronales son increíblemente flexibles para aprender patrones de conjuntos de datos no estructurados como imágenes, audio y video. Pero requieren una gran cantidad de datos de entrenamiento para converger y son difíciles de elegir la arquitectura correcta.

58. ¿Cuáles son las mejores técnicas para el sistema de recomendación?

  • Filtrado basado en contenido.
  • Filtración colaborativa

59. ¿Cuáles son los diferentes tipos de algoritmos de la serie Times?

  • Enfoque ingenuo
  • Promedio simple
  • Media móvil
  • Suavizado exponencial único
  • Método de tendencia lineal de Holt Método
  • Método de temporada de invierno de Holt Método
  • ARIMA (media autorregresiva y móvil)

60. ¿Cuáles son las diferentes aplicaciones del aprendizaje automático?

  • Bioinformática
  • Interfaces cerebro-máquina
  • Red de computadoras
  • Visión por computador
  • Detección de fraude con tarjeta de crédito
  • Análisis del mercado financiero.
  • Reconocimiento de escritura a mano
  • Recuperación de información
  • Seguro
  • Detección de fraude en internet
  • Diagnostico medico
  • Mejoramiento
  • Sistemas de recomendación
  • Los motores de búsqueda
  • Análisis de los sentimientos
  • Minería de secuencia
  • Reconocimiento de voz
  • Predicción de series de tiempo
  • Análisis de comportamiento del usuario

Leave a Comment!