neuralmagic
/

Qwen2-0.5B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Qwen2-0.5B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

b62c6a3
verified

mgoin commited on Oct 9, 2024

Update README.md

3b3a605
verified

alexmarques commited on Jul 18, 2024

Update README.md

a2590bd
verified

alexmarques commited on Jul 18, 2024

Create README.md

e53e755
verified

alexmarques commited on Jul 18, 2024

Delete results_2024-07-11T03-36-57.827775.json

fcfe7e4
verified

alexmarques commited on Jul 12, 2024

Upload folder using huggingface_hub

c343ccb
verified

alexmarques commited on Jul 12, 2024

initial commit

3fae966
verified

alexmarques commited on Jul 12, 2024