廖溢俊

18岁AI研究员，专注于LLM架构优化、强化学习、测试时扩展和CUDA计算优化。在AAAI 2027受邀成为Program Committee Member、AAAI 2026担任Reviewer，积极参与前沿AI研究。

核心技术栈

精选论文 Preprint

Overcoming State Inertia: Minimally Invasive Temporal Alignment for Evolving Contexts

Yijun Liao (Independent Researcher)

ACL ARR 2026 Meta-OA：2.5 Alignment RLHF/DPO

We propose DZ-TiDPO, a framework that resolves state inertia in long-context LLMs by synergizing semantic-aware optimization with a structural temporal attention bias.

Semantic Scholar Code

学术成就

🏆

AAAI 2027

受邀担任Program Committee成员

参与顶级AI会议评审工作

AAAI 2026

担任Reviewer

参与顶级AI会议评审工作

🎯

ARC Prize 2025

竞赛参与者

挑战抽象推理能力测试

📊

学术经历

AAAI 2026 OA：5

《DTTC: An Extended Framework for Dynamic Test Time Computing with Lightweight Mathematical Reasoning》

ARR January 2026 Meta-OA：2.5

《Overcoming State Inertia: Minimally Invasive Temporal Alignment for Evolving Contexts》

重点项目

YingHub V3

稀疏混合专家语言模型

基于Triton实现Flash Attention，支持异构专家和动态Top-k路由的先进语言模型架构。

LLM MoE Triton

查看项目 →

强化学习项目集

算法实现与优化

包含DQN、PPO、GRPO、TD3等主流强化学习算法和ICM、RENT、RaR、INTUITOR等前沿强化学习算法的完整实现，支持多种环境训练。

RL Meta-RL SSL-RL U-RL

查看项目 →

Triton FlashAttention

CUDA计算优化

使用Triton重写Flash Attention内核，实现高效的注意力机制计算优化。

CUDA Triton Attention

查看项目 →

查看所有项目

3073936251@qq.com

点击发送邮件或复制邮箱地址

GitHub

廖溢俊

核心技术栈

最新动态 News

精选论文 Preprint

Overcoming State Inertia: Minimally Invasive Temporal Alignment for Evolving Contexts

学术成就

AAAI 2027

AAAI 2026

ARC Prize 2025

学术经历

重点项目

YingHub V3

强化学习项目集

Triton FlashAttention