fix: specify dtype with begin_forward aka plan (#2404)
This commit is contained in:
@@ -678,6 +678,7 @@ class FlashInferIndicesUpdaterPrefill:
|
||||
self.num_qo_heads,
|
||||
self.num_kv_heads,
|
||||
self.head_dim,
|
||||
q_data_type=self.q_data_type,
|
||||
)
|
||||
|
||||
# cached part
|
||||
@@ -691,6 +692,7 @@ class FlashInferIndicesUpdaterPrefill:
|
||||
self.num_kv_heads,
|
||||
self.head_dim,
|
||||
1,
|
||||
q_data_type=self.q_data_type,
|
||||
)
|
||||
|
||||
|
||||
|
||||
Reference in New Issue
Block a user