1 21 1

Tianxin Wei

tianxinwei

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

upvoted a paper 12 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

upvoted a paper 14 days ago

Code as Agent Harness

View all activity

Organizations

upvoted a paper about 15 hours ago

Harness Updating Is Not Harness Benefit: Disentangling Evolution Capabilities in Self-Evolving LLM Agents

Paper • 2605.30621 • Published 6 days ago • 16

upvoted a paper 12 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 14 days ago • 49

upvoted a paper 14 days ago

Code as Agent Harness

Paper • 2605.18747 • Published 16 days ago • 211

upvoted a paper about 1 month ago

Heterogeneous Scientific Foundation Model Collaboration

Paper • 2604.27351 • Published Apr 30 • 217

upvoted a paper about 2 months ago

The Blind Spot of Agent Safety: How Benign User Instructions Expose Critical Vulnerabilities in Computer-Use Agents

Paper • 2604.10577 • Published Apr 12 • 25

liked a dataset about 2 months ago

YennNing/MC-Search

Viewer • Updated Feb 22 • 3.33k • 793 • 28

upvoted 2 papers 3 months ago

ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning

Paper • 2603.10160 • Published Mar 10 • 26

Video-Based Reward Modeling for Computer-Use Agents

Paper • 2603.10178 • Published Mar 10 • 43

authored a paper 3 months ago

ReMix: Reinforcement routing for mixtures of LoRAs in LLM finetuning

Paper • 2603.10160 • Published Mar 10 • 26

upvoted 3 papers 3 months ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 197

dLLM: Simple Diffusion Language Modeling

Paper • 2602.22661 • Published Feb 26 • 153

Mem-Gallery: Benchmarking Multimodal Long-Term Conversational Memory for MLLM Agents

Paper • 2601.03515 • Published Jan 7 • 5

upvoted 2 papers 4 months ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published Feb 9 • 290

Position: Agentic Evolution is the Path to Evolving LLMs

Paper • 2602.00359 • Published Jan 30 • 7

authored a paper 4 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204

commented a paper 4 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204 •

upvoted a paper 4 months ago

Agentic Reasoning for Large Language Models

Paper • 2601.12538 • Published Jan 18 • 204

upvoted a paper 5 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted a paper 6 months ago

Latent Collaboration in Multi-Agent Systems

Paper • 2511.20639 • Published Nov 25, 2025 • 128

upvoted a paper 7 months ago

Generalizing Test-time Compute-optimal Scaling as an Optimizable Graph

Paper • 2511.00086 • Published Oct 29, 2025 • 42

Tianxin Wei

AI & ML interests

Recent Activity

Organizations

tianxinwei's activity