Licenciado en Ingeniería de Telecomunicación por la Universidad de Sevilla(Escuela Técnica Superior de Ingeniería) en 2014.Estoy familiarizado con un amplia gama de problemas relacionados con la ciencia de dato:Extracción de datos:- Web scrapping (BeautifulSoup)- Extracción desde diversas fuentes y tipos de ficheros: excel, csv, sql, mat, nosqlLimpieza y adecuación de los datos:- Ordenar el dataset de forma que las columnas sean variables y las filas observaciones- EDA (Exploratory Data Analysis). En búsqueda de datos duplicados, incompletos y formatos erroneos.- Posible transformación de alguna de las variables (aumentar el grado, ingeniería de características)Para aprendizaje supervisado:- Clasificadores (regresor logístico, Support Vector Machine, NN, K-NN, RF, gradient boosting tree, gaussianNB)-Regresores (ridge, lasso, así como las versiones para regresores de los algoritmos anteriores).Para aprendizaje no supervisado:- Clustering (K-mean)- Reducción de la dimensionalidad (PCA)Para la selección de modelos:- Hiperparámetros con validación cruzada.
Listed skills include Matlab, Python, Microsoft Office, Microsoft Excel, and 8 others.