duyntnet/Yarn-Llama-2-7b-128k-imatrix-GGUF

Go to file

ModelHub XC 403379031d 初始化项目，由ModelHub XC社区提供模型

Model: duyntnet/Yarn-Llama-2-7b-128k-imatrix-GGUF
Source: Original Platform

2026-06-17 16:32:17 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ1_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ1_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ2_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ2_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ2_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ2_XXS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ3_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ3_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ3_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ3_XXS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ4_NL.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-IQ4_XS.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q2_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q2_K.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q3_K_L.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q3_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q3_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q4_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q4_1.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q4_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q4_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q5_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q5_1.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q5_K_M.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q5_K_S.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q6_K.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

Yarn-Llama-2-7b-128k-Q8_0.gguf

初始化项目，由ModelHub XC社区提供模型

2026-06-17 16:32:17 +08:00

README.md

license, language, pipeline_tag, inference, tags

license

language

pipeline_tag

inference

From original readme

Usage and Prompt Format

Install FA2 and Rotary Extensions:

pip install flash-attn --no-build-isolation
pip install git+https://github.com/HazyResearch/flash-attention.git#subdirectory=csrc/rotary

There are no specific prompt formats as this is a pretrained base model.