初始化项目,由ModelHub XC社区提供模型

Model: Mattimax/DAC5-0.5B
Source: Original Platform
This commit is contained in:
ModelHub XC
2026-05-22 16:13:20 +08:00
commit d2547bde60
15 changed files with 151903 additions and 0 deletions

37
.gitattributes vendored Normal file
View File

@@ -0,0 +1,37 @@
*.7z filter=lfs diff=lfs merge=lfs -text
*.arrow filter=lfs diff=lfs merge=lfs -text
*.bin filter=lfs diff=lfs merge=lfs -text
*.bz2 filter=lfs diff=lfs merge=lfs -text
*.ckpt filter=lfs diff=lfs merge=lfs -text
*.ftz filter=lfs diff=lfs merge=lfs -text
*.gz filter=lfs diff=lfs merge=lfs -text
*.h5 filter=lfs diff=lfs merge=lfs -text
*.joblib filter=lfs diff=lfs merge=lfs -text
*.lfs.* filter=lfs diff=lfs merge=lfs -text
*.mlmodel filter=lfs diff=lfs merge=lfs -text
*.model filter=lfs diff=lfs merge=lfs -text
*.msgpack filter=lfs diff=lfs merge=lfs -text
*.npy filter=lfs diff=lfs merge=lfs -text
*.npz filter=lfs diff=lfs merge=lfs -text
*.onnx filter=lfs diff=lfs merge=lfs -text
*.ot filter=lfs diff=lfs merge=lfs -text
*.parquet filter=lfs diff=lfs merge=lfs -text
*.pb filter=lfs diff=lfs merge=lfs -text
*.pickle filter=lfs diff=lfs merge=lfs -text
*.pkl filter=lfs diff=lfs merge=lfs -text
*.pt filter=lfs diff=lfs merge=lfs -text
*.pth filter=lfs diff=lfs merge=lfs -text
*.rar filter=lfs diff=lfs merge=lfs -text
*.safetensors filter=lfs diff=lfs merge=lfs -text
saved_model/**/* filter=lfs diff=lfs merge=lfs -text
*.tar.* filter=lfs diff=lfs merge=lfs -text
*.tar filter=lfs diff=lfs merge=lfs -text
*.tflite filter=lfs diff=lfs merge=lfs -text
*.tgz filter=lfs diff=lfs merge=lfs -text
*.wasm filter=lfs diff=lfs merge=lfs -text
*.xz filter=lfs diff=lfs merge=lfs -text
*.zip filter=lfs diff=lfs merge=lfs -text
*.zst filter=lfs diff=lfs merge=lfs -text
*tfevents* filter=lfs diff=lfs merge=lfs -text
tokenizer.json filter=lfs diff=lfs merge=lfs -text
Logos/DAC5.png filter=lfs diff=lfs merge=lfs -text

3
Logos/DAC5.png Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:08ac3f37eff96fcc81034d2bfc699ca00c1d8266ec1754d3aace7f8a6a20d3a8
size 296416

BIN
Logos/MResearch.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 87 KiB

84
README.md Normal file
View File

@@ -0,0 +1,84 @@
---
license: mit
language:
- it
- en
base_model:
- Qwen/Qwen2.5-0.5B-Instruct
pipeline_tag: text-generation
library_name: transformers
tags:
- DAC
- DATA-AI
- M.INC.
- conversational
- tool
- tools
- mobile-action
- android
new_version: Mattimax/DAC5.1-0.5B
---
## ☕ Support my research
[![Buy Me a Coffee](https://img.shields.io/badge/Support-Buy%20Me%20a%20Coffee-FFDD00?style=for-the-badge&logo=buymeacoffee&logoColor=black)](https://www.buymeacoffee.com/marzomattye)
# Model Card: DAC5-0.5B (M.INC. Research)
<p align="center">
<img src="Logos/DAC5.png" alt="DAC5 Logo" width="450px"/>
</p>
<h1 align="center">DAC5-0.5B (M.INC. Research)</h1>
**DAC5-0.5B** è un Large Language Model (LLM) di piccole dimensioni ottimizzato per l'inferenza locale e l'automazione di sistema. Il modello rappresenta l'evoluzione del lavoro di ricerca condotto da **M.INC. Research** sulla massimizzazione dell'efficienza dei parametri (Parameter Efficiency), utilizzando come architettura di base **Qwen2.5-0.5B-Instruct**.
## Descrizione del Modello
Il progetto DAC5 nasce dalla necessità di fornire un'intelligenza on-device capace di operare in scenari con risorse computazionali estremamente limitate, garantendo al contempo una precisione elevata nell'esecuzione di task specifici. Nonostante l'architettura di partenza non sia l'ultima release sul mercato, la scelta di Qwen2.5-0.5B è stata dettata dalla sua eccezionale densità informativa e dalla velocità di processamento dei token, rendendolo il candidato ideale per l'integrazione in sistemi operativi mobili.
### Caratteristiche Principali
* **Architettura:** Transformer Causal Decoder-only (basato su Qwen2.5).
* **Specializzazione Italiana:** Il dataset di fine-tuning è stato pesantemente bilanciato per correggere le debolezze sintattiche e semantiche del modello base nella lingua italiana.
* **Agentic Capabilities:** Ottimizzato per il Function Calling deterministico su ambiente Android.
* **Efficienza:** Progettato per l'esecuzione su CPU e NPU di smartphone di fascia media e bassa.
---
## Integrazione Tool Calling (Android OS)
M.INC. Research ha implementato un protocollo di istruzioni specifico per permettere al modello di interfacciarsi con le API di sistema Android. Il modello è in grado di mappare il linguaggio naturale in chiamate funzionali per i seguenti tool:
**Sistema e Connettività:**
`enable_wifi`, `disable_wifi`, `open_wifi_settings`, `enable_bluetooth`, `disable_bluetooth`, `open_bluetooth_settings`, `enable_gps`, `disable_gps`, `enable_hotspot`, `disable_hotspot`, `enable_nfc`, `disable_nfc`, `enable_airplane_mode`, `disable_airplane_mode`, `enable_battery_saver`, `disable_battery_saver`, `open_settings`, `open_network_settings`, `open_display_settings`, `open_sound_settings`, `open_security_settings`, `open_privacy_settings`, `open_account_settings`, `open_language_settings`, `open_notification_settings`.
**Media e Interfaccia:**
`set_brightness`, `increase_brightness`, `decrease_brightness`, `set_volume`, `increase_volume`, `decrease_volume`, `set_silent_mode`, `disable_silent_mode`, `set_vibration_mode`, `enable_auto_rotate`, `disable_auto_rotate`, `enable_dark_mode`, `disable_dark_mode`, `lock_screen`, `take_screenshot`, `play_music`, `pause_music`, `stop_music`, `next_track`, `previous_track`, `enable_shuffle`, `enable_repeat`.
**Applicazioni e Produttività:**
`open_app`, `open_browser`, `open_url`, `web_search`, `make_call`, `redial_last_number`, `send_sms`, `send_email`, `open_email_app`, `create_contact`, `search_contact`, `open_contacts`, `create_note`, `open_notes_app`, `create_calendar_event`, `get_calendar_events`, `open_calendar`, `set_alarm`, `delete_alarm`, `set_timer`, `stop_timer`, `pause_timer`, `navigate_to`, `open_maps`, `get_current_location`, `get_weather`, `open_calculator`.
**Camera e Registrazione:**
`open_camera`, `take_photo`, `take_selfie`, `start_video_recording`, `stop_video_recording`, `start_screen_recording`, `stop_screen_recording`, `turn_on_flashlight`, `turn_off_flashlight`.
---
## Dati di Training e Metodologia
Il fine-tuning è stato condotto attraverso una pipeline di **Supervised Fine-Tuning (SFT)** proprietaria di M.INC. Research. L'attenzione è stata focalizzata sulla compressione della logica di ragionamento per evitare la degradazione delle capacità conversazionali durante l'apprendimento dei task esecutivi. Il risultato è un modello capace di mantenere un dialogo fluido e naturale in lingua italiana, pur essendo pronti a eseguire comandi complessi su richiesta.
### Limitazioni
Data la dimensione di 0.5B parametri, il modello potrebbe presentare limiti nel ragionamento matematico astratto o nella generazione di testi creativi estremamente lunghi. È ottimizzato per compiti di assistenza e automazione.
---
## Termini di Utilizzo e Citazione
Il modello DAC5-0.5B è rilasciato per scopi di ricerca e sviluppo. M.INC. Research ne incoraggia l'integrazione in progetti open-source e commerciali volti a migliorare l'accessibilità dei dispositivi mobili.
Se desiderate utilizzare questo modello o i risultati della nostra ricerca nei vostri progetti, vi preghiamo di includere la seguente citazione:
> **M.INC. Research, DAC5-0.5B: Optimized Small Language Model for Android Automation (2026). Sviluppato da Mattimax.**
Per collaborazioni, integrazioni personalizzate o report sull'utilizzo del modello, si prega di contattare il team di ricerca tramite il profilo Hugging Face ufficiale.

24
added_tokens.json Normal file
View File

@@ -0,0 +1,24 @@
{
"</tool_call>": 151658,
"<tool_call>": 151657,
"<|box_end|>": 151649,
"<|box_start|>": 151648,
"<|endoftext|>": 151643,
"<|file_sep|>": 151664,
"<|fim_middle|>": 151660,
"<|fim_pad|>": 151662,
"<|fim_prefix|>": 151659,
"<|fim_suffix|>": 151661,
"<|im_end|>": 151645,
"<|im_start|>": 151644,
"<|image_pad|>": 151655,
"<|object_ref_end|>": 151647,
"<|object_ref_start|>": 151646,
"<|quad_end|>": 151651,
"<|quad_start|>": 151650,
"<|repo_name|>": 151663,
"<|video_pad|>": 151656,
"<|vision_end|>": 151653,
"<|vision_pad|>": 151654,
"<|vision_start|>": 151652
}

54
chat_template.jinja Normal file
View File

@@ -0,0 +1,54 @@
{%- if tools %}
{{- '<|im_start|>system\n' }}
{%- if messages[0]['role'] == 'system' %}
{{- messages[0]['content'] }}
{%- else %}
{{- 'You are Qwen, created by Alibaba Cloud. You are a helpful assistant.' }}
{%- endif %}
{{- "\n\n# Tools\n\nYou may call one or more functions to assist with the user query.\n\nYou are provided with function signatures within <tools></tools> XML tags:\n<tools>" }}
{%- for tool in tools %}
{{- "\n" }}
{{- tool | tojson }}
{%- endfor %}
{{- "\n</tools>\n\nFor each function call, return a json object with function name and arguments within <tool_call></tool_call> XML tags:\n<tool_call>\n{\"name\": <function-name>, \"arguments\": <args-json-object>}\n</tool_call><|im_end|>\n" }}
{%- else %}
{%- if messages[0]['role'] == 'system' %}
{{- '<|im_start|>system\n' + messages[0]['content'] + '<|im_end|>\n' }}
{%- else %}
{{- '<|im_start|>system\nYou are Qwen, created by Alibaba Cloud. You are a helpful assistant.<|im_end|>\n' }}
{%- endif %}
{%- endif %}
{%- for message in messages %}
{%- if (message.role == "user") or (message.role == "system" and not loop.first) or (message.role == "assistant" and not message.tool_calls) %}
{{- '<|im_start|>' + message.role + '\n' + message.content + '<|im_end|>' + '\n' }}
{%- elif message.role == "assistant" %}
{{- '<|im_start|>' + message.role }}
{%- if message.content %}
{{- '\n' + message.content }}
{%- endif %}
{%- for tool_call in message.tool_calls %}
{%- if tool_call.function is defined %}
{%- set tool_call = tool_call.function %}
{%- endif %}
{{- '\n<tool_call>\n{"name": "' }}
{{- tool_call.name }}
{{- '", "arguments": ' }}
{{- tool_call.arguments | tojson }}
{{- '}\n</tool_call>' }}
{%- endfor %}
{{- '<|im_end|>\n' }}
{%- elif message.role == "tool" %}
{%- if (loop.index0 == 0) or (messages[loop.index0 - 1].role != "tool") %}
{{- '<|im_start|>user' }}
{%- endif %}
{{- '\n<tool_response>\n' }}
{{- message.content }}
{{- '\n</tool_response>' }}
{%- if loop.last or (messages[loop.index0 + 1].role != "tool") %}
{{- '<|im_end|>\n' }}
{%- endif %}
{%- endif %}
{%- endfor %}
{%- if add_generation_prompt %}
{{- '<|im_start|>assistant\n' }}
{%- endif %}

54
config.json Normal file
View File

@@ -0,0 +1,54 @@
{
"architectures": [
"Qwen2ForCausalLM"
],
"attention_dropout": 0.0,
"dtype": "bfloat16",
"eos_token_id": 151645,
"hidden_act": "silu",
"hidden_size": 896,
"initializer_range": 0.02,
"intermediate_size": 4864,
"layer_types": [
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention",
"full_attention"
],
"max_position_embeddings": 32768,
"max_window_layers": 21,
"model_type": "qwen2",
"num_attention_heads": 14,
"num_hidden_layers": 24,
"num_key_value_heads": 2,
"pad_token_id": 151645,
"rms_norm_eps": 1e-06,
"rope_scaling": null,
"rope_theta": 1000000.0,
"sliding_window": null,
"tie_word_embeddings": true,
"transformers_version": "4.57.6",
"use_cache": false,
"use_sliding_window": false,
"vocab_size": 151936
}

13
generation_config.json Normal file
View File

@@ -0,0 +1,13 @@
{
"do_sample": true,
"eos_token_id": [
151645,
151643
],
"pad_token_id": 151645,
"repetition_penalty": 1.1,
"temperature": 0.7,
"top_k": 20,
"top_p": 0.8,
"transformers_version": "4.57.6"
}

151388
merges.txt Normal file

File diff suppressed because it is too large Load Diff

3
model.safetensors Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:42f648d229ac3ecfc528ff5af6c142387d4e6cf024fdc4ee26537302479c002a
size 988097824

25
special_tokens_map.json Normal file
View File

@@ -0,0 +1,25 @@
{
"additional_special_tokens": [
"<|im_start|>",
"<|im_end|>",
"<|object_ref_start|>",
"<|object_ref_end|>",
"<|box_start|>",
"<|box_end|>",
"<|quad_start|>",
"<|quad_end|>",
"<|vision_start|>",
"<|vision_end|>",
"<|vision_pad|>",
"<|image_pad|>",
"<|video_pad|>"
],
"eos_token": {
"content": "<|im_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false
},
"pad_token": "<|im_end|>"
}

3
tokenizer.json Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:fdb9874a926d0a4673d061c6c2c0847af6f05f93e52a0f259a206956c6002eb5
size 11421994

211
tokenizer_config.json Normal file
View File

@@ -0,0 +1,211 @@
{
"add_bos_token": false,
"add_prefix_space": false,
"added_tokens_decoder": {
"151643": {
"content": "<|endoftext|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151644": {
"content": "<|im_start|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151645": {
"content": "<|im_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151646": {
"content": "<|object_ref_start|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151647": {
"content": "<|object_ref_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151648": {
"content": "<|box_start|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151649": {
"content": "<|box_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151650": {
"content": "<|quad_start|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151651": {
"content": "<|quad_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151652": {
"content": "<|vision_start|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151653": {
"content": "<|vision_end|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151654": {
"content": "<|vision_pad|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151655": {
"content": "<|image_pad|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151656": {
"content": "<|video_pad|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": true
},
"151657": {
"content": "<tool_call>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151658": {
"content": "</tool_call>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151659": {
"content": "<|fim_prefix|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151660": {
"content": "<|fim_middle|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151661": {
"content": "<|fim_suffix|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151662": {
"content": "<|fim_pad|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151663": {
"content": "<|repo_name|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
},
"151664": {
"content": "<|file_sep|>",
"lstrip": false,
"normalized": false,
"rstrip": false,
"single_word": false,
"special": false
}
},
"additional_special_tokens": [
"<|im_start|>",
"<|im_end|>",
"<|object_ref_start|>",
"<|object_ref_end|>",
"<|box_start|>",
"<|box_end|>",
"<|quad_start|>",
"<|quad_end|>",
"<|vision_start|>",
"<|vision_end|>",
"<|vision_pad|>",
"<|image_pad|>",
"<|video_pad|>"
],
"bos_token": null,
"clean_up_tokenization_spaces": false,
"eos_token": "<|im_end|>",
"errors": "replace",
"extra_special_tokens": {},
"max_length": 512,
"model_max_length": 131072,
"pad_token": "<|im_end|>",
"split_special_tokens": false,
"stride": 0,
"tokenizer_class": "Qwen2Tokenizer",
"truncation_side": "right",
"truncation_strategy": "longest_first",
"unk_token": null
}

3
training_args.bin Normal file
View File

@@ -0,0 +1,3 @@
version https://git-lfs.github.com/spec/v1
oid sha256:5b97a64a16b48bca948652f7a8d7535d6ffdf0f4fae7891f749f5b2534687424
size 5777

1
vocab.json Normal file

File diff suppressed because one or more lines are too long