Move ML recap analysis to heavy-processing Celery worker

patrick91 · patrick91 · commit 9b811550651d · 2026-02-09T15:43:56.000+01:00
Offload compute_similar_talks and compute_topic_clusters to the
heavy_processing Celery queue to prevent OOM in Gunicorn web workers.
The admin view now checks cache first, dispatches a Celery task on miss,
and returns {"status": "processing"} for the frontend to poll.
diff --git a/backend/reviews/admin.py b/backend/reviews/admin.py
@@ -448,49 +448,33 @@ def review_recap_compute_analysis_view(self, request, review_session_id):
             raise PermissionDenied()
 
         conference = review_session.conference
-        accepted_submissions = self._get_accepted_submissions(conference)
+        accepted_submissions = list(self._get_accepted_submissions(conference))
         force_recompute = request.GET.get("recompute") == "1"
 
-        from reviews.similar_talks import compute_similar_talks, compute_topic_clusters
+        from django.core.cache import cache
 
-        similar_talks = compute_similar_talks(
-            accepted_submissions,
-            top_n=5,
-            conference_id=conference.id,
-            force_recompute=force_recompute,
-        )
+        from pycon.tasks import check_pending_heavy_processing_work
+        from reviews.similar_talks import _get_cache_key
+        from reviews.tasks import compute_recap_analysis
 
-        topic_clusters = compute_topic_clusters(
-            accepted_submissions,
-            min_topic_size=3,
-            conference_id=conference.id,
-            force_recompute=force_recompute,
+        combined_cache_key = _get_cache_key(
+            "recap_analysis", conference.id, accepted_submissions
         )
 
-        # Build submissions list with similar talks, sorted by highest similarity
-        submissions_list = sorted(
-            [
-                {
-                    "id": s.id,
-                    "title": str(s.title),
-                    "type": s.type.name,
-                    "speaker": s.speaker.display_name if s.speaker else "Unknown",
-                    "similar": similar_talks.get(s.id, []),
-                }
-                for s in accepted_submissions
-            ],
-            key=lambda x: max(
-                (item["similarity"] for item in x["similar"]), default=0
-            ),
-            reverse=True,
-        )
+        if not force_recompute:
+            cached_result = cache.get(combined_cache_key)
+            if cached_result is not None:
+                return JsonResponse(cached_result)
 
-        return JsonResponse(
-            {
-                "submissions_list": submissions_list,
-                "topic_clusters": topic_clusters,
-            }
+        # Dispatch the Celery task to the heavy_processing queue
+        compute_recap_analysis.apply_async(
+            args=[conference.id],
+            kwargs={"force_recompute": force_recompute},
+            queue="heavy_processing",
         )
+        check_pending_heavy_processing_work.delay()
+
+        return JsonResponse({"status": "processing"})
 
     def review_view(self, request, review_session_id, review_item_id):
         review_session = ReviewSession.objects.get(id=review_session_id)
diff --git a/backend/reviews/tasks.py b/backend/reviews/tasks.py
@@ -0,0 +1,72 @@
+import logging
+
+from pycon.celery import app
+
+logger = logging.getLogger(__name__)
+
+
+@app.task
+def compute_recap_analysis(conference_id, force_recompute=False):
+    from django.core.cache import cache
+    from django.db.models import Q
+
+    from reviews.similar_talks import (
+        _get_cache_key,
+        compute_similar_talks,
+        compute_topic_clusters,
+    )
+    from submissions.models import Submission
+
+    accepted_submissions = list(
+        Submission.objects.filter(conference_id=conference_id)
+        .filter(
+            Q(pending_status=Submission.STATUS.accepted)
+            | Q(pending_status__isnull=True, status=Submission.STATUS.accepted)
+            | Q(pending_status="", status=Submission.STATUS.accepted)
+        )
+        .select_related("speaker", "type", "audience_level")
+        .prefetch_related("languages")
+    )
+
+    similar_talks = compute_similar_talks(
+        accepted_submissions,
+        top_n=5,
+        conference_id=conference_id,
+        force_recompute=force_recompute,
+    )
+
+    topic_clusters = compute_topic_clusters(
+        accepted_submissions,
+        min_topic_size=3,
+        conference_id=conference_id,
+        force_recompute=force_recompute,
+    )
+
+    submissions_list = sorted(
+        [
+            {
+                "id": s.id,
+                "title": str(s.title),
+                "type": s.type.name,
+                "speaker": s.speaker.display_name if s.speaker else "Unknown",
+                "similar": similar_talks.get(s.id, []),
+            }
+            for s in accepted_submissions
+        ],
+        key=lambda x: max(
+            (item["similarity"] for item in x["similar"]), default=0
+        ),
+        reverse=True,
+    )
+
+    result = {
+        "submissions_list": submissions_list,
+        "topic_clusters": topic_clusters,
+    }
+
+    combined_cache_key = _get_cache_key(
+        "recap_analysis", conference_id, accepted_submissions
+    )
+    cache.set(combined_cache_key, result, 60 * 60 * 24)
+
+    return result
diff --git a/backend/reviews/templates/reviews-recap.html b/backend/reviews/templates/reviews-recap.html
@@ -570,6 +570,70 @@ <h2 class="recap-section-title">🔗 Similar Talks</h2>
     section.style.display = '';
   }
 
+  var pollTimer = null;
+  var pollStartTime = null;
+  var POLL_INTERVAL = 3000;
+  var POLL_TIMEOUT = 120000;
+
+  function stopPolling() {
+    if (pollTimer) {
+      clearTimeout(pollTimer);
+      pollTimer = null;
+    }
+    pollStartTime = null;
+  }
+
+  function handleResult(data, recompute) {
+    loading.style.display = 'none';
+    btn.style.display = 'none';
+    recomputeBtn.style.display = '';
+    recomputeBtn.disabled = false;
+    recomputeBtn.textContent = 'Recompute (ignore cache)';
+
+    renderTopicClusters(data.topic_clusters);
+    renderSimilarTalks(data.submissions_list);
+  }
+
+  function pollForResults(recompute) {
+    if (pollStartTime && (Date.now() - pollStartTime) > POLL_TIMEOUT) {
+      stopPolling();
+      loading.style.display = 'none';
+      var activeBtn = recompute ? recomputeBtn : btn;
+      activeBtn.disabled = false;
+      activeBtn.textContent = recompute ? 'Recompute (ignore cache)' : 'Compute Topic Clusters & Similar Talks';
+      errorDiv.textContent = 'Analysis is taking longer than expected. Please try again later.';
+      errorDiv.style.display = '';
+      return;
+    }
+
+    var url = recompute ? computeUrl + '?recompute=1' : computeUrl;
+
+    fetch(url, {
+      headers: { 'X-Requested-With': 'XMLHttpRequest' }
+    })
+    .then(function(response) {
+      if (!response.ok) throw new Error('Server error: ' + response.status);
+      return response.json();
+    })
+    .then(function(data) {
+      if (data.status === 'processing') {
+        pollTimer = setTimeout(function() { pollForResults(false); }, POLL_INTERVAL);
+        return;
+      }
+      stopPolling();
+      handleResult(data, recompute);
+    })
+    .catch(function(err) {
+      stopPolling();
+      loading.style.display = 'none';
+      var activeBtn = recompute ? recomputeBtn : btn;
+      activeBtn.disabled = false;
+      activeBtn.textContent = recompute ? 'Recompute (ignore cache)' : 'Compute Topic Clusters & Similar Talks';
+      errorDiv.textContent = 'Failed to compute analysis: ' + err.message;
+      errorDiv.style.display = '';
+    });
+  }
+
   function fetchAnalysis(recompute) {
     var url = recompute ? computeUrl + '?recompute=1' : computeUrl;
     var activeBtn = recompute ? recomputeBtn : btn;
@@ -587,14 +651,12 @@ <h2 class="recap-section-title">🔗 Similar Talks</h2>
       return response.json();
     })
     .then(function(data) {
-      loading.style.display = 'none';
-      btn.style.display = 'none';
-      recomputeBtn.style.display = '';
-      recomputeBtn.disabled = false;
-      recomputeBtn.textContent = 'Recompute (ignore cache)';
-
-      renderTopicClusters(data.topic_clusters);
-      renderSimilarTalks(data.submissions_list);
+      if (data.status === 'processing') {
+        pollStartTime = Date.now();
+        pollTimer = setTimeout(function() { pollForResults(false); }, POLL_INTERVAL);
+        return;
+      }
+      handleResult(data, recompute);
     })
     .catch(function(err) {
       loading.style.display = 'none';
diff --git a/backend/reviews/tests/test_recap.py b/backend/reviews/tests/test_recap.py