duyntnet/Llama-2-7b-chat-hf-imatrix-GGUF

Go to file

ModelHub XC 02dcd49140 初始化项目，由ModelHub XC社区提供模型

Model: duyntnet/Llama-2-7b-chat-hf-imatrix-GGUF
Source: Original Platform

2026-06-17 16:17:16 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ1_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ1_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ2_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ2_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ2_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ2_XXS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ3_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ3_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ3_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ3_XXS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ4_NL.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-IQ4_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q2_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q2_K.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q3_K_L.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q3_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q3_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q4_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q4_1.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q4_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q4_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q5_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q5_1.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q5_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q5_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q6_K.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

Llama-2-7b-chat-hf-Q8_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:17:16 +08:00

README.md

license, language, pipeline_tag, inference, tags

license

language

pipeline_tag

inference

From original readme

Intended Use

Intended Use Cases Llama 2 is intended for commercial and research use in English. Tuned models are intended for assistant-like chat, whereas pretrained models can be adapted for a variety of natural language generation tasks.

To get the expected features and performance for the chat versions, a specific formatting needs to be followed, including the INST and <<SYS>> tags, BOS and EOS tokens, and the whitespaces and breaklines in between (we recommend calling strip() on inputs to avoid double-spaces). See our reference code in github for details: chat_completion.