9 16 13

Luozheng Qin

Fr0zencr4nE

AI & ML interests

None yet

Recent Activity

upvoted an article 12 days ago

Diffusers welcomes FLUX-2

upvoted a paper about 1 month ago

ROVER: Benchmarking Reciprocal Cross-Modal Reasoning for Omnimodal Generation

liked a dataset about 1 month ago

cheryyunl/ROVER

View all activity

Organizations

None yet

upvoted an article 12 days ago

Article

Diffusers welcomes FLUX-2

13 days ago

•

158

upvoted a paper about 1 month ago

ROVER: Benchmarking Reciprocal Cross-Modal Reasoning for Omnimodal Generation

Paper • 2511.01163 • Published Nov 3 • 31

upvoted a paper about 2 months ago

BLIP3o-NEXT: Next Frontier of Native Image Generation

Paper • 2510.15857 • Published Oct 17 • 24

upvoted 2 papers 2 months ago

Rolling Forcing: Autoregressive Long Video Diffusion in Real Time

Paper • 2509.25161 • Published Sep 29 • 24

Seedream 4.0: Toward Next-generation Multimodal Image Generation

Paper • 2509.20427 • Published Sep 24 • 80

upvoted 2 papers 4 months ago

DINOv3

Paper • 2508.10104 • Published Aug 13 • 285

Qwen-Image Technical Report

Paper • 2508.02324 • Published Aug 4 • 263

upvoted a paper 5 months ago

Kwai Keye-VL Technical Report

Paper • 2507.01949 • Published Jul 2 • 131

upvoted a paper 6 months ago

Marrying Autoregressive Transformer and Diffusion with Multi-Reference Autoregression

Paper • 2506.09482 • Published Jun 11 • 45

upvoted 4 papers 7 months ago

BLIP3-o: A Family of Fully Open Unified Multimodal Models-Architecture, Training and Dataset

Paper • 2505.09568 • Published May 14 • 97

Seed1.5-VL Technical Report

Paper • 2505.07062 • Published May 11 • 153

T2I-R1: Reinforcing Image Generation with Collaborative Semantic-level and Token-level CoT

Paper • 2505.00703 • Published May 1 • 44

Towards Understanding Camera Motions in Any Video

Paper • 2504.15376 • Published Apr 21 • 157

upvoted 3 papers 9 months ago

Cockatiel: Ensembling Synthetic and Human Preferenced Training for Detailed Video Caption

Paper • 2503.09279 • Published Mar 12 • 5

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 122

LiFT: Leveraging Human Feedback for Text-to-Video Model Alignment

Paper • 2412.04814 • Published Dec 6, 2024 • 47

Luozheng Qin

AI & ML interests

Recent Activity

Organizations

Fr0zencr4nE's activity

Diffusers welcomes FLUX-2