cococoomo/Exaone3.5-7.8B_ReST_V0_Quantized

Go to file

ModelHub XC d6c1cacf88 初始化项目，由ModelHub XC社区提供模型

Model: cococoomo/Exaone3.5-7.8B_ReST_V0_Quantized
Source: Original Platform

2026-06-05 15:32:04 +08:00

.gitattributes

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

configuration_exaone.py

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

generation_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

merges.txt

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

model-00001-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

model-00002-of-00002.safetensors

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

model.safetensors.index.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

README.md

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

special_tokens_map.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

tokenizer_config.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

tokenizer.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

vocab.json

初始化项目，由ModelHub XC社区提供模型

2026-06-05 15:32:04 +08:00

README.md

language, base_model, pipeline_tag, tags

language

base_model

pipeline_tag

Exaone3.5-7.8B_ReST_V0_Quantized

This model is a fine-tuned and AWQ-quantized version of EXAONE 3.5 7.8B (Instruct), optimized for efficient inference and structured text generation.

Overview

Base Model: EXAONE 3.5 7.8B (Instruct)
Fine-tuning: Supervised fine-tuning on domain-specific data
Quantization: 4-bit AWQ
Inference: Optimized for vLLM
Context Length: up to 32K tokens

Model Details

Architecture: ExaoneForCausalLM
Hidden Size: 4096
Layers: 32
Attention Heads: 32
Max Position Embeddings: 32768
Quantization: 4-bit AWQ
Torch dtype: float16

Intended Use

Instruction-based text generation
Structured output generation (JSON)
LLM-based data pipelines
RAG systems
Efficient inference

Example Usage

from vllm import LLM, SamplingParams

llm = LLM(
    model="cococoomo/Exaone3.5-7.8B_ReST_V0_Quantized",
    quantization="AWQ",
)

sampling_params = SamplingParams(
    temperature=0.2,
    top_p=0.8,
    max_tokens=1024,
)

outputs = llm.generate(["Your prompt here"], sampling_params)
print(outputs[0].outputs[0].text)

Training

Fine-tuned using supervised learning on domain-specific data.
Dataset is not included due to privacy constraints.

Limitations

May produce incorrect outputs
Sensitive to prompt quality
Domain bias may exist

Safety

Not intended for critical decision-making without human validation.

Evaluation

BLEU
ROUGE

Deployment

Optimized for vLLM and GPU-efficient inference.