38 18 8

Hamish Ivison

hamishivi

https://ivison.id.au

AI & ML interests

NLP :)

Recent Activity

upvoted a paper 3 days ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

updated a model 7 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite__1__1764018132_step_2450

published a model 7 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite__1__1764018132_step_2450

View all activity

Organizations

upvoted a paper 3 days ago

ToolOrchestra: Elevating Intelligence via Efficient Model and Tool Orchestration

Paper • 2511.21689 • Published 9 days ago • 94

updated a model 7 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11764018132_step_2450

8B • Updated 7 days ago • 30

published a model 7 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11764018132_step_2450

8B • Updated 7 days ago • 30

updated a model 9 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step_1300

8B • Updated 9 days ago • 26

published a model 9 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step_1300

8B • Updated 9 days ago • 26

updated a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_3160511762886037_checkpoints_step_1300

8B • Updated 10 days ago • 22

published a model 10 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_3160511762886037_checkpoints_step_1300

8B • Updated 10 days ago • 22

authored 2 papers 11 days ago

RLVE: Scaling Up Reinforcement Learning for Language Models with Adaptive Verifiable Environments

Paper • 2511.07317 • Published 26 days ago • 13

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 11 days ago • 54

updated 2 datasets 11 days ago

rl-research/dr-tulu-rl-data

Viewer • Updated 11 days ago • 4.88k • 426 • 11

rl-research/dr-tulu-sft-data

Viewer • Updated 11 days ago • 13.1k • 711 • 24

updated 2 models 11 days ago

rl-research/DR-Tulu-SFT-8B

Text Generation • 8B • Updated 7 days ago • 308 • 5

rl-research/DR-Tulu-8B

Text Generation • 8B • Updated 4 days ago • 1.38k • 68

upvoted a paper 11 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 11 days ago • 54

updated a collection 11 days ago

DR Tulu

Collection

Models and data associated with DR Tulu, http://allenai-web/papers/drtulu • 5 items • Updated 11 days ago • 30

commented a paper 11 days ago

DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research

Paper • 2511.19399 • Published 11 days ago • 54 •

updated a model 12 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step1900

8B • Updated 12 days ago • 31

published a model 12 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_step1900

8B • Updated 12 days ago • 31

updated a model 15 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_checkpoints_step_1700

8B • Updated 15 days ago • 121

published a model 15 days ago

hamishivi/2010_rl_rag_NAR8_testing64_gpt5_sft_31605_no_cite11762677729_checkpoints_step_1700

8B • Updated 15 days ago • 121

Hamish Ivison

AI & ML interests

Recent Activity

Organizations

hamishivi's activity