Updated example [skip ci]

ankane · ankane · commit 4a95ca0d250a · 2025-02-09T02:05:16.000-08:00
diff --git a/examples/hybrid_search/Cargo.toml b/examples/hybrid_search/Cargo.toml
@@ -5,11 +5,11 @@ edition = "2021"
 publish = false
 
 [dependencies]
-candle-core = "0.6"
-candle-nn = "0.6"
-candle-transformers = "0.6"
-hf-hub = "0.3"
+candle-core = "0.8"
+candle-nn = "0.8"
+candle-transformers = "0.8"
+hf-hub = "0.4"
 pgvector = { path = "../..", features = ["postgres"] }
 postgres = "0.19"
 serde_json = "1"
-tokenizers = "0.19"
+tokenizers = "0.21"
diff --git a/examples/hybrid_search/src/main.rs b/examples/hybrid_search/src/main.rs
@@ -113,13 +113,12 @@ impl EmbeddingModel {
         Ok(Self { tokenizer, model })
     }
 
-    // embed one at a time since BertModel does not support attention mask
-    // https://github.com/huggingface/candle/issues/1798
+    // TODO support multiple texts
     fn embed(&self, text: &str) -> Result<Vec<f32>, Box<dyn Error + Send + Sync>> {
         let tokens = self.tokenizer.encode(text, true)?;
         let token_ids = Tensor::new(vec![tokens.get_ids().to_vec()], &self.model.device)?;
         let token_type_ids = token_ids.zeros_like()?;
-        let embeddings = self.model.forward(&token_ids, &token_type_ids)?;
+        let embeddings = self.model.forward(&token_ids, &token_type_ids, None)?;
         let embeddings = (embeddings.sum(1)? / (embeddings.dim(1)? as f64))?;
         let embeddings = embeddings.broadcast_div(&embeddings.sqr()?.sum_keepdim(1)?.sqrt()?)?;
         Ok(embeddings.squeeze(0)?.to_vec1::<f32>()?)