fix: specify dtype with begin_forward aka plan (#2404)
This commit is contained in:
@@ -678,6 +678,7 @@ class FlashInferIndicesUpdaterPrefill:
|
|||||||
self.num_qo_heads,
|
self.num_qo_heads,
|
||||||
self.num_kv_heads,
|
self.num_kv_heads,
|
||||||
self.head_dim,
|
self.head_dim,
|
||||||
|
q_data_type=self.q_data_type,
|
||||||
)
|
)
|
||||||
|
|
||||||
# cached part
|
# cached part
|
||||||
@@ -691,6 +692,7 @@ class FlashInferIndicesUpdaterPrefill:
|
|||||||
self.num_kv_heads,
|
self.num_kv_heads,
|
||||||
self.head_dim,
|
self.head_dim,
|
||||||
1,
|
1,
|
||||||
|
q_data_type=self.q_data_type,
|
||||||
)
|
)
|
||||||
|
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user