* kv-cache : simplify the interface ggml-ci * context : revert llama_batch_allocr position change ggml-ci
llama_vocab