初始化项目，由ModelHub XC社区提供模型

Model: ayaxrojo/scjn-tesis_v1 Source: Original Platform
2026-06-17 22:03:20 +08:00
commit b0e73eae3f
11 changed files with 706 additions and 0 deletions
--- a/.gitattributes
+++ b/.gitattributes
@@ -0,0 +1,40 @@
+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+scjn-tesis_v1-q4_k_m.gguf filter=lfs diff=lfs merge=lfs -text
+modelo_7b_q2_k.gguf filter=lfs diff=lfs merge=lfs -text
+modelo_7b_q3_k_m.gguf filter=lfs diff=lfs merge=lfs -text
+modelo_7b_q4_k_m.gguf filter=lfs diff=lfs merge=lfs -text
+modelo_7b-F16.gguf filter=lfs diff=lfs merge=lfs -text
--- a/CHECKSUMS.txt
+++ b/CHECKSUMS.txt
@@ -0,0 +1,4 @@
+d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0  modelo_7b-F16.gguf
+285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2  modelo_7b_q4_k_m.gguf
+cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b  modelo_7b_q3_k_m.gguf
+780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3  modelo_7b_q2_k.gguf
--- a/44
+++ b/44
@@ -0,0 +1,44 @@
+MIT License
+
+Copyright (c) 2025 Asistente Jurídico MX Team
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in all
+copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
+SOFTWARE.
+
+---
+
+## 📝 Nota Adicional
+
+Este modelo es un fine-tune basado en **Qwen 2.5 7B Instruct**. El uso de este modelo está sujeto a:
+
+1. **Licencia MIT** (este archivo) - para el fine-tune y adaptaciones
+2. **Qwen License** - para el modelo base (consultar: https://huggingface.co/Qwen/Qwen2.5-7B-Instruct)
+
+### ✅ Uso Permitido
+
+- Uso personal y educativo
+- Investigación académica
+- Proyectos sin fines de lucro
+- Uso comercial (sujeto a términos de Qwen)
+
+### ❌ Uso Restringido
+
+- Actividades militares o de defensa
+- Vigilancia masiva o monitoreo de individuos
+- Generación de contenido malicioso o engañoso
+- Cualquier uso que viole leyes mexicanas o internacionales
--- a/MODELCARD.md
+++ b/MODELCARD.md
@@ -0,0 +1,262 @@
+---
+license: mit
+language:
+  - es
+tags:
+  - gguf
+  - quantized
+  - llama-cpp
+  - ollama
+  - spanish
+  - legal
+  - mexico
+pipeline_tag: text-generation
+library_name: transformers
+base_model: unsloth/qwen2.5-7b-instruct-unsloth-bnb-4bit
+model_name: modelo_7b
+region:
+  - mx
+---
+
+# 📋 Model Card: Asistente Jurídico MX
+
+## ℹ️ Información General
+
+| Campo | Valor |
+|---|---|
+| **Nombre del Modelo** | Asistente Jurídico MX |
+| **Versión** | 1.0.0 |
+| **Modelo Base** | Qwen/Qwen2.5-7B-Instruct |
+| **Formato** | GGUF (cuantizado) |
+| **Idioma** | Español (México) |
+| **Licencia** | MIT |
+| **Autor** | Asistente Jurídico MX Team |
+| **Fecha** | Marzo 2025 |
+
+## 🎯 Descripción
+
+Modelo de lenguaje especializado en **derecho mexicano**, ajustado fino sobre Qwen 2.5 7B Instruct. Entrenado con tesis y jurisprudencias de la Suprema Corte de Justicia de la Nación (SCJN) de México.
+
+El objetivo es democratizar el acceso a la información jurídica en México, ofreciendo versiones optimizadas para distintos tipos de hardware.
+
+## 🏗️ Arquitectura
+
+- **Arquitectura Base**: Qwen2.5 (Transformer Decoder-only)
+- **Parámetros**: ~7 mil millones
+- **Ventana de Contexto**: 8192 tokens
+- **Vocabulario**: ~151,936 tokens
+- **Capas**: 32 capas Transformer
+- **Atención**: Multi-head attention con RoPE
+
+## 📊 Versiones Disponibles
+
+| Versión | Archivo | Tamaño | Cuantización | Calidad |
+|---|---|---|---|---|
+| F16 | `modelo_7b-F16.gguf` | 15 GB | FP16 | ⭐⭐⭐⭐⭐ |
+| Q4_K_M | `modelo_7b_q4_k_m.gguf` | 4.4 GB | 4-bit | ⭐⭐⭐⭐ |
+| Q3_K_M | `modelo_7b_q3_k_m.gguf` | 3.6 GB | 3-bit | ⭐⭐⭐ |
+| Q2_K | `modelo_7b_q2_k.gguf` | 2.9 GB | 2-bit | ⭐⭐ |
+
+### Detalles de Cuantización
+
+- **Q4_K_M**: Método K-quants de llama.cpp, equilibrio óptimo calidad/tamaño
+- **Q3_K_M**: Cuantización media para hardware limitado
+- **Q2_K**: Cuantización mínima viable, prioriza accesibilidad
+
+## 📚 Datos de Entrenamiento
+
+### Dataset
+
+| Campo | Valor |
+|---|---|
+| **Fuente** | Suprema Corte de Justicia de la Nación (SCJN) |
+| **Tipo** | Tesis y jurisprudencias mexicanas |
+| **Versión** | v5 |
+| **Muestras** | 4,500 documentos |
+| **Idioma** | Español mexicano |
+| **Dominio** | Legal/Jurídico |
+
+### Contenido del Dataset
+
+- Tesis jurisprudenciales de la SCJN
+- Tesis aisladas
+- Jurisprudencias por contradicción
+- Acuerdos y sentencias relevantes
+- Interpretaciones constitucionales
+
+### Preprocesamiento
+
+- Limpieza de texto legal
+- Estandarización de formatos
+- Eliminación de datos sensibles
+- Validación de integridad jurídica
+
+## 🏋️ Detalles del Fine-tuning
+
+| Parámetro | Valor |
+|---|---|
+| **Framework** | Unsloth + TRL (Supervised Fine-Tuning) |
+| **Método** | LoRA (Low-Rank Adaptation) |
+| **LoRA Rank** | 8 |
+| **Épocas** | 2 |
+| **Batch Size** | 8 (efectivo, con grad_accum=8) |
+| **Learning Rate** | 2e-4 |
+| **Secuencia Máx** | 1024 tokens |
+| **GPU** | Tesla T4 (16 GB VRAM) |
+
+### Software Utilizado
+
+| Package | Versión |
+|---|---|
+| TRL | 0.12.0 |
+| Transformers | 4.46.0 |
+| PyTorch | 2.5.0+cu121 |
+| Datasets | 3.1.0 |
+| Tokenizers | 0.20.3 |
+| Unsloth | 2024.11 |
+
+## 📈 Casos de Uso
+
+### ✅ Usos Recomendados
+
+- **Orientación jurídica general** para ciudadanos mexicanos
+- **Consulta de conceptos legales** básicos del derecho mexicano
+- **Apoyo educativo** en estudios de derecho
+- **Investigación jurídica** preliminar
+- **Democratización del acceso** a información legal
+
+### ❌ Usos No Recomendados
+
+- **Asesoría legal profesional** (no sustituye abogado)
+- **Toma de decisiones legales** críticas sin supervisión
+- **Representación legal** en procedimientos judiciales
+- **Interpretación vinculante** de leyes o sentencias
+- **Uso comercial** sin verificación humana
+
+## ⚠️ Limitaciones
+
+### Conocimiento
+
+- El conocimiento está limitado a la fecha de corte del entrenamiento
+- Puede no incluir reformas legales recientes
+- No tiene acceso a información en tiempo real
+
+### Precisión
+
+- Puede cometer errores en interpretaciones complejas
+- No garantiza exhaustividad en citas legales
+- Las versiones cuantizadas (Q3, Q2) tienen menor precisión
+
+### Éticas
+
+- **No es un abogado certificado**
+- No debe usarse como único recurso en asuntos legales importantes
+- Siempre consultar con profesionales del derecho
+
+## 🎚️ Parámetros de Inferencia
+
+### Configuración Recomendada (llama.cpp)
+
+```yaml
+temperature: 0.3      # Respuestas deterministas (legal)
+repeat_penalty: 1.15  # Reduce repeticiones
+top_p: 0.85          # Nucleus sampling
+top_k: 40            # Top-K sampling
+num_ctx: 8192        # Contexto máximo
+num_predict: 2048    # Tokens máximos por respuesta
+```
+
+## 💻 Requisitos de Hardware
+
+| Versión | RAM Mínima | GPU VRAM | CPU | Solo CPU |
+|---|---|---|---|---|
+| F16 | 32 GB | 16 GB | 8 núcleos | ❌ |
+| Q4_K_M | 8 GB | 6 GB | 4 núcleos | ✅ |
+| Q3_K_M | 6 GB | 4 GB | 4 núcleos | ✅ |
+| Q2_K | 4 GB | N/A | 2 núcleos | ✅ |
+
+## 📊 Evaluación
+
+### Métricas Internas
+
+| Métrica | Valor |
+|---|---|
+| Precisión en conceptos básicos | ~92% |
+| Precisión en citas legales | ~87% |
+| Coherencia en respuestas | ~90% |
+| Utilidad percibida (usuarios) | ~4.2/5 |
+
+> **Nota**: Las métricas pueden variar según la versión cuantizada utilizada.
+
+## 🔗 Enlaces Relacionados
+
+- **Modelo Base**: [Qwen 2.5 7B Instruct](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct)
+- **Unsloth**: [GitHub](https://github.com/unslothai/unsloth)
+- **llama.cpp**: [GitHub](https://github.com/ggerganov/llama.cpp)
+- **Ollama**: [Sitio Web](https://ollama.com/)
+- **SCJN**: [Sitio Oficial](https://www.scjn.gob.mx/)
+
+## 📜 Licencia
+
+| Tipo | Detalle |
+|---|---|
+| **Fine-tune** | MIT License |
+| **Modelo Base** | Qwen License |
+| **Costo** | Gratuito para uso personal |
+
+### ✅ Uso Permitido
+
+- **Uso personal**: Totalmente gratuito
+- **Educativo**: Escuelas, universidades, cursos
+- **Investigación**: Académica y científica
+- **Sin fines de lucro**: Proyectos comunitarios
+- **Comercial**: Sujeto a términos de Qwen License
+
+### ❌ Uso Restringido
+
+- Actividades militares o de defensa
+- Vigilancia masiva o monitoreo de individuos
+- Generación de contenido malicioso o engañoso
+- Cualquier uso que viole leyes mexicanas o internacionales
+
+> **Nota**: Este fine-tune está sujeto tanto a la licencia MIT como a la licencia del modelo base Qwen 2.5.
+
+## ⚖️ Aviso Legal
+
+Este modelo es una herramienta de orientación jurídica general. **No sustituye la consulta con un abogado certificado.** Las respuestas no constituyen asesoría legal profesional. Para situaciones legales específicas, siempre consulta con un profesional del derecho.
+
+## 📚 Citas
+
+### Para citar este modelo:
+
+```bibtex
+@misc{asistente-juridico-mx-2025,
+    title        = {{Asistente Jurídico MX: Modelo de Lenguaje para Derecho Mexicano}},
+    author       = {Asistente Jurídico MX Team},
+    year         = 2025,
+    publisher    = {Hugging Face},
+    url          = {https://huggingface.co/ayaxrojo/scjn-tesis_v1},
+    howpublished = {\url{https://huggingface.co/ayaxrojo/scjn-tesis_v1}}
+}
+```
+
+### Frameworks:
+
+```bibtex
+@misc{vonwerra2022trl,
+    title        = {{TRL: Transformer Reinforcement Learning}},
+    author       = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching
+                    and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul
+                    and Quentin Gallouédec},
+    year         = 2020,
+    journal      = {GitHub repository},
+    publisher    = {GitHub},
+    howpublished = {\url{https://github.com/huggingface/trl}}
+}
+```
+
+---
+
+**Repositorio**: https://huggingface.co/ayaxrojo/scjn-tesis_v1
+
+**Última actualización**: Marzo 2025
--- a/31
+++ b/31
@@ -0,0 +1,31 @@
+FROM modelo_7b_q4_k_m.gguf
+
+# Metadata del modelo
+LICENSE MIT
+AUTHOR Asistente Juridico MX Team
+
+# Parámetros del modelo
+PARAMETER temperature 0.3
+PARAMETER repeat_penalty 1.15
+PARAMETER top_p 0.85
+PARAMETER top_k 40
+PARAMETER num_ctx 8192
+PARAMETER num_predict 2048
+
+# System prompt para el asistente jurídico
+SYSTEM """Eres un asistente jurídico especializado en derecho mexicano. Tu objetivo es democratizar el acceso a la información jurídica en México.
+
+Proporciona información clara, precisa y fundamentada sobre:
+- Constitución Política de los Estados Unidos Mexicanos
+- Leyes federales y estatales
+- Jurisprudencias y tesis de la SCJN
+- Procedimientos judiciales (amparo, civil, penal, administrativo, laboral)
+- Derechos humanos y garantías individuales
+
+IMPORTANTE:
+- Cita artículos y leyes cuando sea relevante
+- Mantén un tono profesional pero accesible
+- Aclara que tu información es orientativa y no sustituye asesoría legal profesional
+- Si no estás seguro de algo, indícalo honestamente
+
+Responde siempre en español mexicano."""
--- a/README.md
+++ b/README.md
@@ -0,0 +1,310 @@
+---
+base_model: unsloth/qwen2.5-7b-instruct-unsloth-bnb-4bit
+library_name: transformers
+model_name: modelo_7b
+tags:
+  - generated_from_trainer
+  - unsloth
+  - trl
+  - sft
+  - legal
+  - mexico
+  - spanish
+license: mit
+language:
+  - es
+pipeline_tag: text-generation
+---
+
+# ⚖️ Asistente Jurídico MX — Qwen 2.5 7B (Fine-tuned)
+
+[![License: MIT](https://img.shields.io/badge/License-MIT-yellow.svg)](https://opensource.org/licenses/MIT)
+[![Spanish](https://img.shields.io/badge/Language-Spanish-red.svg)](https://es.wikipedia.org/wiki/Espa%C3%B1ol)
+[![GGUF](https://img.shields.io/badge/Format-GGUF-blue.svg)](https://github.com/ggerganov/llama.cpp)
+[![Ollama](https://img.shields.io/badge/Ollama-Compatible-brightgreen.svg)](https://ollama.com/)
+[![Uso Personal](https://img.shields.io/badge/Uso-Personal%20y%20Gratuito-green.svg)]()
+
+Modelo de lenguaje ajustado fino sobre **Qwen 2.5 7B Instruct**, especializado en **derecho mexicano**. Entrenado con tesis y jurisprudencias de la Suprema Corte de Justicia de la Nación (SCJN).
+
+El objetivo principal es democratizar el acceso a la información jurídica en México, ofreciendo versiones optimizadas para distintos tipos de hardware — desde servidores con GPU hasta computadoras modestas sin acelerador gráfico.
+
+> 💰 **Uso Gratuito**: Este modelo es **completamente gratuito** para uso personal, educativo y de investigación. Consulta el archivo [LICENSE](LICENSE) para más detalles.
+
+> 📄 **Model Card**: Consulta [MODELCARD.md](MODELCARD.md) para información detallada sobre el modelo, entrenamiento, y consideraciones éticas.
+
+---
+
+## 📋 Versiones Disponibles del Modelo
+
+| Versión | Archivo `.gguf` | Tamaño | Descripción |
+|---|---|---|---|
+| **F16** (base completo) | `modelo_7b-F16.gguf` | ~15 GB | Precisión completa, máxima calidad |
+| **Q4_K_M** ⭐ (recomendado) | `modelo_7b_q4_k_m.gguf` | ~4.4 GB | Mejor equilibrio calidad/tamaño |
+| **Q3_K_M** | `modelo_7b_q3_k_m.gguf` | ~3.6 GB | Para máquinas con recursos limitados |
+| **Q2_K** | `modelo_7b_q2_k.gguf` | ~2.9 GB | Mínimo viable, recursos muy limitados |
+
+---
+
+## 🖥️ Requisitos de Hardware por Versión
+
+### 🔴 F16 — Precisión Completa (15 GB)
+
+> Uso recomendado: servidores de producción, investigación académica, benchmarks.
+
+| Componente | Mínimo | Recomendado |
+|---|---|---|
+| **GPU VRAM** | 16 GB | 24 GB (RTX 3090 / A10G / A100) |
+| **RAM del sistema** | 32 GB | 64 GB |
+| **Almacenamiento** | 20 GB libres | SSD NVMe |
+| **CPU** | 8 núcleos | 16 núcleos |
+| **CUDA** | 11.8+ | 12.x |
+
+```bash
+# Ejecutar con Ollama (F16)
+ollama run qwen2.5:7b-instruct-fp16
+```
+
+---
+
+### 🟡 Q4_K_M — Cuantización 4-bit (4.4 GB) ⭐ Recomendado
+
+> El mejor punto de equilibrio entre calidad y rendimiento. **Versión recomendada para la mayoría de usuarios.**
+
+| Componente | Mínimo | Recomendado |
+|---|---|---|
+| **GPU VRAM** | 6 GB | 8 GB (RTX 3060 / RTX 4060 / GTX 1080 Ti) |
+| **RAM del sistema** | 8 GB | 16 GB |
+| **Almacenamiento** | 6 GB libres | SSD |
+| **CPU** | 4 núcleos | 8 núcleos |
+| **SO** | Windows 10/11, Ubuntu 20.04+, macOS 12+ | — |
+
+> **Sin GPU:** Puede ejecutarse solo en CPU con ≥16 GB de RAM, aunque más lento (~2–5 tokens/seg).
+
+```bash
+# Ejecutar con Ollama (Q4_K_M) — más rápido si solo tienes CPU
+ollama run modelo-juridico-mx
+```
+
+```bash
+# Ejecutar directamente con llama.cpp
+./llama-cli -m modelo_7b_q4_k_m.gguf \
+  -ngl 35 \
+  -c 8192 \
+  --temp 0.3 \
+  -p "<|im_start|>system\nEres un asistente jurídico especializado en derecho mexicano.<|im_end|>\n<|im_start|>user\n¿Qué es el amparo?<|im_end|>\n<|im_start|>assistant\n"
+```
+
+---
+
+### 🟠 Q3_K_M — Cuantización 3-bit (3.6 GB)
+
+> Para laptops o PCs con recursos limitados. Calidad ligeramente reducida pero funcional.
+
+| Componente | Mínimo | Recomendado |
+|---|---|---|
+| **GPU VRAM** | 4 GB | 6 GB (GTX 1650 / RTX 3050) |
+| **RAM del sistema** | 6 GB | 12 GB |
+| **Almacenamiento** | 5 GB libres | HDD o SSD |
+| **CPU** | 4 núcleos | 6 núcleos |
+| **SO** | Windows 10/11, Ubuntu 18.04+, macOS 11+ | — |
+
+> **Sin GPU:** Funciona en CPU con ≥8 GB RAM. Velocidad estimada: ~1–3 tokens/seg.
+
+```bash
+# Ejecutar con llama.cpp (Q3_K_M, solo CPU)
+./llama-cli -m modelo_7b_q3_k_m.gguf \
+  -ngl 0 \
+  -c 4096 \
+  --temp 0.3 \
+  --threads 6
+```
+
+---
+
+### 🔵 Q2_K — Cuantización 2-bit (2.9 GB)
+
+> Para máquinas muy limitadas. Es el mínimo aceptable; la calidad de respuestas puede verse afectada en consultas complejas.
+
+| Componente | Mínimo | Recomendado |
+|---|---|---|
+| **GPU VRAM** | Sin GPU requerida | 4 GB si disponible |
+| **RAM del sistema** | 4 GB | 8 GB |
+| **Almacenamiento** | 4 GB libres | HDD o SSD |
+| **CPU** | 2 núcleos | 4 núcleos |
+| **SO** | Windows 10/11, Ubuntu 18.04+, macOS 10.15+ | — |
+
+> ⚠️ **Advertencia:** Esta versión prioriza la accesibilidad sobre la precisión. Puede omitir matices jurídicos o generar respuestas menos detalladas.
+
+```bash
+# Ejecutar con llama.cpp (Q2_K, solo CPU)
+./llama-cli -m modelo_7b_q2_k.gguf \
+  -ngl 0 \
+  -c 2048 \
+  --temp 0.3 \
+  --threads 4
+```
+
+---
+
+## 📊 Tabla Comparativa Rápida
+
+| Versión | Tamaño | RAM mín. | GPU mín. | CPU solo | Velocidad aprox. | Calidad |
+|---|---|---|---|---|---|---|
+| F16 | 15 GB | 32 GB | 16 GB VRAM | ❌ No práctico | ~30–50 tok/s (GPU) | ⭐⭐⭐⭐⭐ |
+| **Q4_K_M** ⭐ | 4.4 GB | 8 GB | 6 GB VRAM | ✅ (≥16 GB RAM) | ~15–30 tok/s (GPU) / ~2–5 tok/s (CPU) | ⭐⭐⭐⭐ |
+| Q3_K_M | 3.6 GB | 6 GB | 4 GB VRAM | ✅ (≥8 GB RAM) | ~10–20 tok/s (GPU) / ~1–3 tok/s (CPU) | ⭐⭐⭐ |
+| Q2_K | 2.9 GB | 4 GB | Sin GPU | ✅ (≥4 GB RAM) | ~1–2 tok/s (CPU) | ⭐⭐ |
+
+---
+
+## 🔒 Verificación de Integridad
+
+Antes de usar los modelos, verifica la integridad de los archivos descargados:
+
+```bash
+# Verificar checksums SHA256
+sha256sum -c CHECKSUMS.txt
+```
+
+### Checksums SHA256
+
+| Archivo | SHA256 |
+|---|---|
+| `modelo_7b-F16.gguf` | `d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0` |
+| `modelo_7b_q4_k_m.gguf` | `285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2` |
+| `modelo_7b_q3_k_m.gguf` | `cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b` |
+| `modelo_7b_q2_k.gguf` | `780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3` |
+
+---
+
+## 🚀 Inicio Rápido con Ollama
+
+```bash
+# 1. Asegúrate de tener Ollama instalado
+# https://ollama.com/download
+
+# 2. Crear el modelo desde el Modelfile
+ollama create modelo-juridico-mx -f Modelfile
+
+# 3. Ejecutar
+ollama run modelo-juridico-mx
+```
+
+```python
+# Uso via API de Ollama (Python)
+import requests
+
+response = requests.post(
+    "http://localhost:11434/api/generate",
+    json={
+        "model": "modelo-juridico-mx",
+        "prompt": "¿Qué es el juicio de amparo en México?",
+        "stream": False
+    }
+)
+print(response.json()["response"])
+```
+
+---
+
+## 🏋️ Configuración de Inferencia (llama.cpp)
+
+| Parámetro | Valor | Descripción |
+|---|---|---|
+| `temperature` | 0.3 | Respuestas más deterministas (legal) |
+| `repeat_penalty` | 1.15 | Reduce repeticiones |
+| `context_length` | 8192 | Ventana de contexto máxima |
+| `num_predict` | 2048 | Tokens máximos por respuesta |
+| `top_p` | 0.85 | Nucleus sampling |
+| `top_k` | 40 | Top-K sampling |
+
+---
+
+## 🎓 Entrenamiento
+
+| Parámetro | Valor |
+|---|---|
+| **Modelo base** | Qwen/Qwen2.5-7B-Instruct |
+| **GPU de entrenamiento** | Tesla T4 (16 GB VRAM) |
+| **VRAM utilizada** | ~15.6 GB |
+| **Épocas** | 2 |
+| **Batch size efectivo** | 8 (1 × grad_accum 8) |
+| **Learning rate** | 2e-4 |
+| **LoRA rank** | 8 |
+| **Secuencia máx.** | 1024 tokens |
+| **Muestras de entrenamiento** | 4,500 |
+| **Dataset** | Tesis y jurisprudencias SCJN (v5) |
+| **Framework** | Unsloth + TRL (SFT) |
+
+### Versiones de frameworks
+
+- **TRL:** 0.12.0
+- **Transformers:** 4.46.0
+- **PyTorch:** 2.5.0+cu121
+- **Datasets:** 3.1.0
+- **Tokenizers:** 0.20.3
+- **Unsloth:** 2024.11
+
+---
+
+## 💡 ¿Qué versión debo elegir?
+
+```
+¿Tienes GPU con 8+ GB VRAM?
+  ├── SÍ → Usa Q4_K_M ⭐ (máximo rendimiento)
+  └── NO → ¿Tienes GPU con 4–6 GB VRAM?
+              ├── SÍ → Q3_K_M (funcionará bien)
+              └── NO → ¿Tienes 8+ GB RAM?
+                          ├── SÍ → Q4_K_M en CPU (lento pero correcto)
+                          └── NO → Q2_K (mínimo viable)
+```
+
+---
+
+## 🔗 Enlaces Útiles
+
+- **Repositorio llama.cpp:** https://github.com/ggerganov/llama.cpp
+- **Ollama:** https://ollama.com/
+- **Documentación Unsloth:** https://github.com/unslothai/unsloth
+- **SCJN México:** https://www.scjn.gob.mx/
+---
+
+## Contacto:
+- **Correo electrónico:** alvaro.ramos.soltero@protonmail.com
+---
+
+## ⚠️ Aviso Legal
+
+Este asistente es una herramienta de orientación jurídica general basada en información disponible hasta la fecha de entrenamiento. **No sustituye la consulta con un abogado certificado.** Las respuestas no constituyen asesoría legal profesional. Para situaciones legales específicas, siempre consulta con un profesional del derecho.
+
+---
+
+## 📜 Citas
+
+### Para citar este modelo:
+
+```bibtex
+@misc{asistente-juridico-mx-2025,
+    title        = {{Asistente Jurídico MX: Modelo de Lenguaje para Derecho Mexicano}},
+    author       = {Asistente Jurídico MX Team},
+    year         = 2025,
+    publisher    = {Hugging Face},
+    url          = {https://huggingface.co/tu-usuario/asistente-juridico-mx},
+    howpublished = {\url{https://huggingface.co/tu-usuario/asistente-juridico-mx}}
+}
+```
+
+### Frameworks utilizados:
+
+```bibtex
+@misc{vonwerra2022trl,
+    title        = {{TRL: Transformer Reinforcement Learning}},
+    author       = {Leandro von Werra and Younes Belkada and Lewis Tunstall and Edward Beeching
+                    and Tristan Thrush and Nathan Lambert and Shengyi Huang and Kashif Rasul
+                    and Quentin Gallouédec},
+    year         = 2020,
+    journal      = {GitHub repository},
+    publisher    = {GitHub},
+    howpublished = {\url{https://github.com/huggingface/trl}}
+}
+```
--- a/modelo_7b-F16.gguf
+++ b/modelo_7b-F16.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:d61fec6a9263172872626c959f20d7b23540201d791433710e819be234c36cb0
+size 15237852960
--- a/modelo_7b_q2_k.gguf
+++ b/modelo_7b_q2_k.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:780fd1150be3637e967c99b0bee007216ac03fa512f4412d312a33776069f1f3
+size 3015939872
--- a/modelo_7b_q3_k_m.gguf
+++ b/modelo_7b_q3_k_m.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:cde75c846845ad3a4cca5f9247458caf2d0f18e3505567252080a55caf81b08b
+size 3808390944
--- a/modelo_7b_q4_k_m.gguf
+++ b/modelo_7b_q4_k_m.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:285bb2cb73626186dea5f1ad3ac310446615ae645cc4b001074ac5a11e236ce2
+size 4683073312
--- a/scjn-tesis_v1-q4_k_m.gguf
+++ b/scjn-tesis_v1-q4_k_m.gguf
@@ -0,0 +1,3 @@
+version https://git-lfs.github.com/spec/v1
+oid sha256:8f9fe00424760dfd610ea7431e2a5d398ec37e197de8193ceb49d739d85881e4
+size 4920733792