LI Junxing

李俊星 Jasen

العربية · EN · Español · فارسی · Français · हिन्दी · 日本語 · 한국어 · Русский · 中文

¡Bienvenido a este sitio! Esta página contiene más detalles sobre mí.\

🙋 Perfil

Ingeniero de investigación con formación en matemáticas y estadística, enfocado en la ingeniería de investigación cuantitativa, la infraestructura de datos financieros, el postprocesamiento de visión por computador y la entrega de agentes de IA para empresas. Puedo llevar un problema desde su definición y validación experimental hasta workflows reproducibles de datos y modelos, la entrega de ingeniería y la documentación para usuarios.

Mi práctica actual combina plataformas de datos cuantitativos e investigación de señales con ingeniería de investigación alrededor de RankSEG para segmentación de imágenes y diseño práctico de workflows con agentes de IA. Me interesan los sistemas que se puedan probar, repetir y utilizar en entornos reales.

Enfoque actual: ingeniería de investigación cuantitativa, infraestructura de datos financieros, plataformas de investigación, servicios de datos de trading y soluciones de IA / automatización con agentes.

🌈 Equilibrio de colores

Color     Porción  Barra            Significado
--------  -------  ---------------  ---------------------------------------------
Negro     40,6 %   ████████░░░░     Autonomía, logros, ejecución estratégica
Azul      26,9 %   █████░░░░░░░     Comprensión, dominio, profundidad analítica
Rojo      14,4 %   ███░░░░░░░░░     Intensidad, franqueza, tolerancia a la presión
Blanco    12,7 %   ███░░░░░░░░░     Estructura, orden, estabilidad
Verde      5,4 %   █░░░░░░░░░░░     Conexión, sensibilidad emocional, armonía

Mi perfil es principalmente negro-azul: acción acompañada de análisis.

El negro aparece como iniciativa, autonomía y orientación a conseguir resultados.
El azul aporta precisión, curiosidad y preferencia por entender cómo funcionan realmente los sistemas.
El rojo refleja cierta disposición a trabajar bajo presión, franqueza e intensidad.
El blanco está presente, aunque en segundo plano: valoro la estructura cuando mejora la ejecución.
El verde es el menos destacado: no tiendo de forma tan natural a centrarme en la atmósfera emocional o la búsqueda de consenso.

Patrón central

Doy lo mejor de mí cuando hay un problema difícil, una restricción real y suficiente espacio para pensar con claridad.

Me atraen los entornos donde importa el rigor, no se evita la complejidad y los resultados se juzgan por su funcionamiento en la práctica. Confío en métodos que se pueden probar, repetir y fundamentar en la realidad. Prefiero construir un sistema que funcione antes que producir una descripción convincente de uno.

En los equipos, suelo contribuir resolviendo problemas, aportando estructura y ejecutando. No siempre empiezo con calidez o visibilidad, pero demuestro cuidado haciendo que el trabajo funcione, reduciendo la ambigüedad y llevando las tareas difíciles hasta el final.

Referencia

Resultado de SoulTrace: https://soultrace.app/en/results/48093f7c-7980-4f83-97a2-e5b8df3a103f

🎓 Educación

City University of Hong Kong (Sep 2025 – Oct 2026)
Máster en Ciencias en Estadística
Qingdao University of Technology (Sep 2020 – Jun 2024)
Licenciatura en Ciencias en Matemáticas y Matemáticas Aplicadas

💼 Experiencia en Prácticas & Investigación

Sika China

Pasante de Agentes de IA | Abr 2026 – Jul 2026

Trabajé en soporte de productos de IA, soluciones internas, automatización de datos y operaciones para workflows repetitivos y dependientes de la experiencia.
Convertí necesidades de negocio poco definidas en entradas estructuradas, reglas, diseños de agentes y skills, MVP, ciclos de feedback y criterios de aceptación.
Apoyé el despliegue de agentes, la adopción por parte de usuarios, la formación, la documentación SOP y la creación de recursos de workflow reutilizables, manteniendo límites adecuados para la información de negocio.
Construí y adapté automatizaciones prácticas para procesamiento de datos, recuperación de conocimiento, reporting y presentaciones, equilibrando calidad visual, editabilidad y reutilización.

The Chinese University of Hong Kong (CUHK)

Asistente de investigación a tiempo parcial | Feb 2026 – Presente

Impulsé la ingeniería de investigación y el despliegue del algoritmo de postprocesamiento de segmentación de imágenes RankSEG, desde la lectura del código y la reproducción de experimentos hasta la adaptación de frameworks, la integración de inferencia y evaluación, y el empaquetado de entornos de clúster.
Desarrollé la integración de RankSEG en workflows de segmentación semántica, incluyendo mmsegmentation, PaddleSeg, Hugging Face Transformers y vías de adaptación a la familia SAM. Diseñé interfaces para pasar tensores de scores de los modelos al postprocesamiento orientado a Dice/IoU sin reentrenamiento.
Construí workflows reproducibles de evaluación, logging y seguimiento de resultados para mejorar la comparabilidad experimental, la depuración y la estabilidad de reproducción.
Empaqueté entornos Singularity + Slurm en el HPC de CUHK y preparé plantillas reutilizables para experimentos multi-GPU.
Contribuí públicamente al ecosistema RankSEG mediante los PR #19 para Transformers, PR #20 de integración SAM y PR #22 de documentación de integración, además del PR #2 para MONAI.

Zhejiang Mingce Asset Management Co., Ltd.

Pasante de Arquitectura Cuantitativa | Sep 2025 – Abr 2026
Ingeniería de investigación cuantitativa e infraestructura de datos financieros

Construí una plataforma de datos de investigación que cubre unos 8 años de historia y los 40 activos digitales con mayor liquidez, integrando datos OHLCV por minuto y diarios, indicadores on-chain y factores derivados.
Gestioné aproximadamente 170 millones de registros de mercado por minuto, 3.000 features candidatas y unos 20 GB de datos Parquet. Reorienté la arquitectura hacia Parquet + almacenamiento de objetos compatible con S3 + DuckDB/Polars, con MySQL para metadatos, estado de tareas y señales actuales.
Particioné los datos por activo, frecuencia, año y fecha; añadí recopilación incremental, escrituras por partición, validación y copias de seguridad en almacenamiento de objetos. Las consultas de investigación típicas pasaron de 1–3 minutos a 5–15 segundos, mientras que la actualización y la copia de seguridad diarias se mantenían dentro de 10 minutos.
Convertí R Markdown y scripts dispersos de Python/R en un pipeline configurable Python–R–SQL para entrenamiento, inferencia, validación rolling, backtesting y experimentos reproducibles multi-activo.
Utilicé LightGBM, XGBoost, MAVE y VAE para predicción direccional a 7/14/28 días y aprendizaje de representaciones. Un resultado rolling fuera de muestra, específico de una etapa, alcanzó aproximadamente un 65 % de precisión direccional; no es una afirmación de rendimiento universal.
Construí capas estandarizadas de entrega de señales y gestión de modelos que devuelven predicciones, exposiciones factoriales y pesos de estrategia mediante interfaces API/JSON.

🔬 Experiencia en Proyectos

Modelado Estadístico de Cuotas y Comportamiento de Apuestas del Hong Kong Jockey Club

Iniciador del proyecto | Oct 2025 – Dic 2025
Proyecto de curso de CityU

Recopilé y limpié datos históricos de carreras, cuotas y tipos de apuestas, y apliqué inferencia y aprendizaje estadísticos a los escenarios place y place Q.
Fue un proyecto de investigación de pequeña escala para un curso de CityU; sus resultados no deben interpretarse como una capacidad estable para apostar ni como retornos en vivo.

Estudio Experimental sobre la Resistencia al Corte de Suelos No Saturados

Miembro principal | Subvención de la Fundación Nacional de Ciencias Naturales de China
📄 Artículo (Rock and Soil Mechanics)

Implementé el ajuste en MATLAB con una precisión superior al 98 % y reescribí las funciones principales en C, procesando más de 200.000 puntos y mejorando la eficiencia aproximadamente un 300 %.
Utilicé Python / Origin para análisis y visualización, y contribuí a dos resultados de patentes relacionados con equipos.

Estudio sobre la Generación de Fractales Multi-regla

Tesis de graduación distinguida

Construí un modelo de generación de fractales multi-regla basado en sistemas dinámicos complejos, con renderizado en tiempo real y visualización interactiva.
Utilicé Taichi / Python para aceleración GPU, logrando una mejora aproximada de 100× frente a la implementación original.

Modelado Epidemiológico del COVID-19

Proyecto de modelado matemático | Mar 2022

Construí un modelo SIERR-T que incorpora la dinámica de medios y rumores, y realicé análisis de sentimientos e identificación de rumores en comentarios de Weibo.
Analicé los efectos de las políticas mediante los datos OxCGRT.

📚 Publicaciones & Patentes

[J.1] NIU Geng, ZHU Xiao-feng, LI Jun-xing, LÜ Meng-yuan, AN Li-qi, CHEN Zi-han. (2022). Experimental study on shear strength of unsaturated soil over a wide suction range and its prediction. Rock and Soil Mechanics, 44(12), 3349–3359. DOI: 10.16285/j.rsm.2022.2005. (IF=3.721, EI, CA, JST, CSCD, Peking University Core Journal)
[P.1] NIU Geng, LI Jun-xing, ZHU Xiao-feng, TAN Yong-ming, MIAO Yu-song, ZHAO Shi-jun, WU Di. (2024). Triaxial Apparatus for Unsaturated Soil Based on Dialysis Method Suction Control. Chinese Patent, CN117368002A. Application No. CN202311298912.7, Application Date: 2023-10-09, Publication Date: 2024-01-09.
[P.2] NIU Geng, KONG Liang, ZHU Xiao-feng, LI Jun-xing, AN Li-qi, LÜ Meng-yuan, CHEN Zi-han. (2022). Direct Shear Apparatus for Unsaturated Soil with Erosion Monitoring and Control System. Chinese Patent, publication CN115452613A; grant CN115452613B. Application No. CN202211220042.7, Application Date: 2022-10-08, Publication Date: 2022-12-09.

🏅 Honores & Premios

🥈 Competencia China de Matemáticas (CMC), Segundo Premio Nacional (ene 2023)
🥈 Concurso de Modelado Matemático CUMCM, Segundo Premio de Shandong (nov 2022)
🥈 Competencia Provincial de Matemáticas de Shandong, Segundo Premio de Shandong (nov 2022)
🥉 Desafío de Modelado Matemático MathorCup, Tercer Premio Nacional (may 2022)
🥈 Competencia Provincial de Física de Shandong, Segundo Premio de Shandong (nov 2021)

🛠 Habilidades

Aspectos destacados de la stack

Investigación cuantitativa: Pandas, NumPy, Polars, DuckDB, LightGBM, XGBoost, MAVE, VAE, validación cruzada de series temporales, validación walk-forward y backtesting.
Infraestructura de datos: Apache Parquet, almacenamiento de objetos compatible con S3, MySQL, Redis, entrega JSON/API y pipelines de datos particionados e incrementales.
Ingeniería de investigación: PyTorch, Hugging Face Transformers, MMSegmentation, PaddleSeg, MONAI, TorchGeo, nnU-Net y TotalSegmentator.
Sistemas y entrega: Linux/Unix, Git/GitHub, Slurm, Singularity, Docker, GitHub Actions, configuración YAML, workflows CLI, logging y seguimiento de experimentos.
Workflows con agentes de IA: Claude Code, Codex, Cursor, GitHub Copilot, Dify, MCP y diseño de automatizaciones orientadas al negocio.

🌏 Idiomas

Mandarín (Nativo)
Inglés (B2)

🎯 Intereses

🏞 Senderismo · 🏋️‍♂️ Fitness · 🏍 Motocicleta · 📷 Fotografía · 💻 Programación

Última actualización: Jul 2026