enginex-ascend-910-llama.cpp

template-instances

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

acc.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

acc.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

arange.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

arange.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

argsort.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

argsort.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

binbcast.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

binbcast.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

clamp.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

clamp.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

common.cuh

Define and optimize RDNA1 (#8085 )

2024-07-04 01:02:58 +02:00

concat.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

concat.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

convert.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

convert.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

cpy.cu

Removes multiple newlines at the end of files that is breaking the editorconfig step of CI. (#8258 )

2024-07-02 12:18:10 -04:00

cpy.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

dequantize.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

diagmask.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

diagmask.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

dmmv.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

dmmv.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-common.cuh

CUDA: refactor and optimize IQ MMVQ (#8215 )

2024-07-01 20:39:06 +02:00

fattn-tile-f16.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-tile-f16.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-tile-f32.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-tile-f32.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-vec-f16.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-vec-f32.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn-wmma-f16.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

fattn.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

getrows.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

getrows.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

im2col.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

im2col.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

mma.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

mmq.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

mmq.cuh

CUDA: revert part of the RDNA1 optimizations (#8309 )

2024-07-05 09:06:09 +02:00

mmvq.cu

CUDA: refactor and optimize IQ MMVQ (#8215 )

2024-07-01 20:39:06 +02:00

mmvq.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

norm.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

norm.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

pad.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

pad.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

pool2d.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

pool2d.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

quantize.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

quantize.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

rope.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

rope.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

scale.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

scale.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

softmax.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

softmax.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

sumrows.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

sumrows.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

tsembd.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

tsembd.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

unary.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

unary.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

upscale.cu

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

upscale.cuh

llama : reorganize source code + improve CMake (#8006 )

2024-06-26 18:33:02 +03:00

vecdotq.cuh

CUDA: refactor and optimize IQ MMVQ (#8215 )

2024-07-01 20:39:06 +02:00