14. Etapas de un proyecto de Machine Learning: Los datos
Big Data e Inteligencia Artificial - En podcast av Marta Arroyo

Kategorier:
đ PodĂ©is encontrar las notas del programa completas en https://datos.ninja/podcast/14-etapas-proyecto-machine-learning-parte-2/ En el episodio de hoy de Un Podcast Ninja sobre Big Data seguimos con la saga de episodios dedicados a las etapas de un proyecto de Machine Learning. Vamos a tratar la parte mĂĄs importante: los datos. La disponibilidad de los datos suele ser la parte mĂĄs limitante cuando queremos resolver un problema mediante Machine Learning. Por eso, una de las averiguaciones mĂĄs importantes que tenemos que hacer es saber quĂ© datos tendremos disponibles tanto para entrenar nuestro modelo de Machine Learning como para utilizarlo. Tiene que ser datos representativos. Es decir, reflejan con exactitud el entorno que estamos modelando. Los datos tienen que ser consistentes. DeberĂan proceder de fuentes fiables y estar disponibles. Los datos deberĂan ser abundantes. Cuantos mĂĄs ejemplos mostremos a nuestro modelo de Machine Learning mejor. El siguiente paso en el camino para construir un dataset serĂa etiquetar los datos. Dependiendo del caso de uso y los recursos de los que dispongamos tendremos las siguientes opciones: Etiquetarlos nosotros mismos. Contratar a alguien para que lo haga por nosotros. Existen empresas que se dedican exclusivamente al etiquetado de datos. Utilizar Mechanical Turk, una plataforma de Amazon que pone en contacto a gente que quiere etiquetar datos con gente dispuesta a hacerlo por un mĂłdico precio. Una vez recogidos y etiquetados, una buena prĂĄctica es familiarizarnos con ellos antes de comenzar  con  el entrenamiento del modelo de Machine Learning. Esto nos ayudarĂĄ a reconocer errores que puedan surgir en nuestros resultados. Y recordad que si disponĂ©is de tiempo extra para vuestro proyecto de Machine Learning tal vez sea mĂĄs efectivo dedicarlas a recoger mĂĄs datos que a tunear el modelo que habĂ©is entrenado. Espero que el episodio os sea de provecho đ Si es asĂ, no olvidĂ©is dejar un «Me gusta» y algĂșn comentario al episodio en Ivoox o una valoraciĂłn de 5 estrellas del podcast en Apple podcasts, en Spotify, en Google podcasts o donde quiera que escuchĂ©is el podcast. Recordad que si tenĂ©is cualquier duda o pregunta podĂ©is contactar conmigo a travĂ©s del formulario de contacto o podemos seguir la conversaciĂłn en Twitter. Muchas gracias por estar ahĂ y os espero en el prĂłximo episodio de Un Podcast Ninja sobre Big Data.