Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model about 14 hours ago

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

ChibuUkachi published a model about 14 hours ago

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

ChibuUkachi published a dataset about 24 hours ago

inference-optimization/Qwen_3.6B_Regenerated

View all activity

inference-optimization 's models 360

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 22

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 19

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 21

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 21

inference-optimization/Llama-3.1-8B-Instruct-6-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 21

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 18

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Llama-3.1-8B-Instruct-5.5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-noise-per-tensor

5B • Updated Apr 22 • 17

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-hybrid-per-tensor

5B • Updated Apr 22 • 21

inference-optimization/Llama-3.1-8B-Instruct-5-bits-mode-heuristic-per-tensor

5B • Updated Apr 22 • 20

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-7-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-6.5-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 3

inference-optimization/Llama-3.2-3B-Instruct-6.5-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-6.5-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-6-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-6-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-6-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-5.5-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-3B-Instruct-5.5-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-5.5-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-noise-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-hybrid-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-3B-Instruct-5-bits-mode-heuristic-per-tensor

3B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-hybrid-per-tensor

1B • Updated Apr 22 • 1

inference-optimization/Llama-3.2-1B-Instruct-7-bits-mode-heuristic-per-tensor

1B • Updated Apr 22 • 2

inference-optimization/Llama-3.2-1B-Instruct-6.5-bits-mode-noise-per-tensor

1B • Updated Apr 22 • 1