关于我// About Me
作为华中科技大学人工智能硕士 (Rank 1/148),我在大模型、NLP 及多模态领域拥有深厚的研究背景。我不仅热衷于 Transformer 架构的理论创新,更注重技术在实际业务中的落地。
我曾获得国家奖学金,熟悉 PyTorch、DeepSpeed 等框架,具备从数据构建、模型微调 (LoRA/QLoRA) 到高性能部署 (TensorRT/vLLM) 的全栈能力。
国家奖学金 / 校级三好学生 / 感恩近现代中国科学家奖学金
CET-6 (535) / CET-4 (547)
Tech Stack
LLM & AlgorithmsTransformer, RAG, RLHF
FrameworksPyTorch, DeepSpeed, HuggingFace
Deployment & OpsDocker, TensorRT, Linux, Git
LanguagesPython, C++
精选项目
学术研究与工程落地的结合。
大模型架构设计
MonkeyOCR / 多模态文档解析
基于SRR范式的多模态大模型。在OmniDocBench评测中超越GPT-4o,GitHub获6.4k Star,解决复杂排版语义割裂问题。
View Case Study
LLM微调 & 强化学习
Lyric Flow / 垂直领域歌词大模型
基于Qwen3系列的微调与优化。通过CPT和SFT全流程,解决韵脚与格式痛点,打造具备专业级创作能力的垂直模型。
View Case Study
AIGC & 计算机视觉
Signature Diffusion / 生成式鉴别
基于Diffusion Model的离线手写签名生成系统。构建400k高难度负样本数据集,有效提升鉴别模型鲁棒性。
View Case Study
Life Outside Code
生活影像
代码之外,我通过镜头观察世界。这里记录了一些碎片。

Travel



Lifestyle
