Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

RelaxingSnorlax updated a dataset about 17 hours ago

inference-optimization/Qwen3.5-0.8B-responses

RelaxingSnorlax published a dataset about 17 hours ago

inference-optimization/Qwen3.5-0.8B-responses

RelaxingSnorlax updated a dataset about 17 hours ago

inference-optimization/Qwen3.5-9B-responses

View all activity

inference-optimization 's models 369

inference-optimization/Llama-3.2-3B-Instruct-5.5-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-5.5-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6.5-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6.5-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6.5-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-6-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-5.5-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-1B-Instruct-5.5-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-5.5-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-5-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-5-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-5-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-gptq

2B • Updated Apr 22 • 2

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-w4a16-qmod

2B • Updated Apr 22 • 5

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-qmod

5B • Updated Apr 22 • 1

inference-optimization/Meta-Llama-3-8B-Instruct-spinquantR1R2R4-nvfp4-gptq

5B • Updated Apr 22 • 1

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-gptq

2B • Updated Apr 22 • 1

inference-optimization/Llama-3.1-8B-Instruct-quip-w4a16-qmod

2B • Updated Apr 22 • 1

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-qmod

5B • Updated Apr 22 • 1

inference-optimization/Llama-3.1-8B-Instruct-quip-nvfp4-gptq

5B • Updated Apr 22 • 1

inference-optimization/Meta-Llama-3-8B-Instruct-W4A16_actorder_group

2B • Updated Apr 20 • 1

inference-optimization/llama3-8b-sharegpt-5k-gen