Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model 1 day ago

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

ChibuUkachi published a model 1 day ago

inference-optimization/ctest-Qwen3.6-27B-speculator-regen.dflash

ChibuUkachi published a dataset 2 days ago

inference-optimization/Qwen_3.6B_Regenerated

View all activity

inference-optimization 's models 360

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-hybrid-per-tensor

25B • Updated Apr 22 • 3

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-heuristic-per-tensor

25B • Updated Apr 22 • 3

inference-optimization/Qwen3-30B-A3B-6-bits-mode-noise-per-tensor

23B • Updated Apr 22 • 3

inference-optimization/Qwen3-30B-A3B-6-bits-mode-hybrid-per-tensor

23B • Updated Apr 22 • 5

inference-optimization/Qwen3-30B-A3B-6-bits-mode-heuristic-per-tensor

23B • Updated Apr 22 • 3

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-noise-per-tensor

21B • Updated Apr 22 • 2

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-hybrid-per-tensor

21B • Updated Apr 22 • 2

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-heuristic-per-tensor

21B • Updated Apr 22 • 2

inference-optimization/Qwen3-30B-A3B-5-bits-mode-noise-per-tensor

19B • Updated Apr 22 • 2

inference-optimization/Qwen3-30B-A3B-5-bits-mode-hybrid-per-tensor

19B • Updated Apr 22 • 2

inference-optimization/Qwen3-30B-A3B-5-bits-mode-heuristic-per-tensor

19B • Updated Apr 22 • 3

inference-optimization/Qwen3-8B-7-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-7-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-7-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 27

inference-optimization/Qwen3-8B-6.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-6.5-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 18

inference-optimization/Qwen3-8B-6.5-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-6-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-6-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-6-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Qwen3-8B-5.5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 19

inference-optimization/Qwen3-8B-5.5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Qwen3-8B-5.5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 22

inference-optimization/Qwen3-8B-5-bits-mode-noise-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Qwen3-8B-5-bits-mode-hybrid-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Qwen3-8B-5-bits-mode-heuristic-per-tensor

6B • Updated Apr 22 • 20

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-noise-per-tensor

7B • Updated Apr 22 • 24

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-hybrid-per-tensor

7B • Updated Apr 22 • 23

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-heuristic-per-tensor

7B • Updated Apr 22 • 20

inference-optimization/Llama-3.1-8B-Instruct-6.5-bits-mode-noise-per-tensor

7B • Updated Apr 22 • 21