15 561 239

Taufiq Dwi Purnomo

taufiqdp

https://taufiqdp.com

AI & ML interests

SLM, VLM

Recent Activity

upvoted a paper about 9 hours ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

upvoted a paper about 17 hours ago

Matryoshka Quantization

upvoted a paper 5 days ago

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

View all activity

Organizations

taufiqdp's activity

upvoted a paper about 9 hours ago

Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Paper • 2502.06703 • Published 1 day ago • 61

upvoted a paper about 17 hours ago

Matryoshka Quantization

Paper • 2502.06786 • Published 1 day ago • 11

upvoted a paper 5 days ago

Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2

Paper • 2502.03544 • Published 6 days ago • 37

upvoted a paper 6 days ago

SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Paper • 2502.02737 • Published 7 days ago • 153

updated a model 6 days ago

taufiqdp/convnext-arutala-v2

Image Classification • Updated 6 days ago • 70

published a model 6 days ago

taufiqdp/convnext-arutala-v2

Image Classification • Updated 6 days ago • 70

upvoted an article 7 days ago

Article

Open-source DeepResearch – Freeing our search agents

8 days ago

• 916

upvoted a paper 7 days ago

OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

Paper • 2502.01061 • Published 9 days ago • 168

updated a model 7 days ago

taufiqdp/convnext_tiny-arutala

Image Classification • Updated 7 days ago • 128

upvoted a paper 9 days ago

s1: Simple test-time scaling

Paper • 2501.19393 • Published 11 days ago • 98

upvoted an article 9 days ago

Article

Open-R1: Update #1

and 7 others •

10 days ago

• 268

upvoted a paper 12 days ago

Streaming DiLoCo with overlapping communication: Towards a Distributed Free Lunch

Paper • 2501.18512 • Published 12 days ago • 25

liked a model 12 days ago

mistralai/Mistral-Small-24B-Base-2501

Text Generation • Updated 12 days ago • 9.83k • 208

published a model 14 days ago

taufiqdp/convnext_tiny-arutala

Image Classification • Updated 7 days ago • 128

upvoted a paper 14 days ago

Baichuan-Omni-1.5 Technical Report

Paper • 2501.15368 • Published 17 days ago • 54

upvoted an article 14 days ago

Article

Welcome to Inference Providers on the Hub 🔥

15 days ago

• 322

upvoted a paper 15 days ago

Qwen2.5-1M Technical Report

Paper • 2501.15383 • Published 17 days ago • 54

upvoted a collection 15 days ago

Qwen2.5-VL

Collection

Vision-language model series based on Qwen2.5 • 3 items • Updated 16 days ago • 337

liked a model 15 days ago

deepseek-ai/Janus-Pro-7B

Any-to-Any • Updated 11 days ago • 381k • 2.86k

upvoted an article 16 days ago

Article

We now support VLMs in smolagents!

19 days ago

• 77