Ye Zhiling's picture

3 4 17

Ye Zhiling

yzlnew

·

https://yzlnew.com

yzlnew

AI & ML interests

Data → Pre-train → Post-train

Recent Activity

liked a Space 19 days ago

lvwerra/distill-blog-template

authored a paper about 1 month ago

Self-Rewarding Rubric-Based Reinforcement Learning for Open-Ended Reasoning

upvoted a paper about 1 month ago

Self-Rewarding Rubric-Based Reinforcement Learning for Open-Ended Reasoning

View all activity

Organizations

None yet

Papers 3

arxiv:2509.25534

arxiv:2508.14880

arxiv:2508.07750

models 0

None public yet

datasets 0

None public yet